Типы LLM и их особенности

Ты уже знаешь, что все языковые модели работают по схожим принципам: токены, контекст, последовательная генерация. Но на практике модели сильно различаются. В этом уроке разберём основные типы LLM и поймём, как их особенности влияют на написание промптов.

По назначению: универсальные и специализированные

Универсальные модели — это «швейцарские ножи». Они обучены на огромных массивах текстов из разных областей и могут отвечать на вопросы, писать код, переводить, сочинять, анализировать. Большинство моделей, доступных через веб-интерфейсы — универсальные.

Специализированные модели обучены или дообучены под конкретную задачу. Например:

Модели для программирования — лучше понимают код и генерируют меньше синтаксических ошибок.
Медицинские модели — точнее работают с клинической терминологией.
Юридические модели — лучше ориентируются в правовых документах.

Как это влияет на промпты: универсальной модели нужно явно задавать контекст предметной области. Специализированная модель уже «в теме» и может требовать меньше пояснений.

Вход (универсальная модель):

Напиши функцию на Python, которая принимает список чисел и возвращает
только чётные. Используй list comprehension.

Вход (специализированная кодовая модель):

Python: filter even numbers from list using list comprehension.

Специализированной модели достаточно короткой технической формулировки — она «понимает» с полуслова.

По доступности: открытые и коммерческие

Открытые модели можно скачать и запустить на своём компьютере или сервере. Их преимущества: полный контроль, приватность данных, возможность дообучить под свою задачу. Недостаток: требуют мощного оборудования.

Коммерческие модели доступны через API или веб-интерфейс. Не нужно настраивать инфраструктуру — открыл вкладку браузера и работаешь. Недостаток: данные уходят на внешний сервер.

Как это влияет на промпты: для открытых моделей можно создавать специальные системные промпты под конкретную задачу и дообучать модель. Для коммерческих — вся настройка происходит через текст промпта.

По размеру: большие и маленькие

Размер модели измеряется в миллиардах параметров — числовых коэффициентов, которые модель настраивает при обучении. Грубо: чем больше параметров, тем «умнее» модель, но тем больше ресурсов она требует.

Тип	Параметры	Где запускается	Качество
Маленькие	1–7 млрд	Ноутбук, телефон	Базовые задачи
Средние	7–30 млрд	Мощный ПК, сервер	Большинство задач
Большие	70–200+ млрд	Сервер, облако	Сложные рассуждения

Как это влияет на промпты: маленькие модели требуют более детальных инструкций. Большие модели лучше справляются с неявными указаниями и сложными рассуждениями. Один и тот же промпт может дать отличный результат на большой модели и посредственный — на маленькой.

По модальности: текстовые и мультимодальные

Текстовые модели работают только с текстом. Ты можешь отправить им описание картинки, но не саму картинку.

Мультимодальные модели принимают на вход не только текст, но и изображения, а некоторые — аудио и видео. Ты можешь загрузить скриншот и попросить модель описать, что на нём происходит, или найти ошибку в интерфейсе.

Вход (мультимодальная модель):

[скриншот с ошибкой в консоли браузера]

Посмотри на этот скриншот. Что за ошибка в консоли? Объясни,
в чём проблема и как её исправить. Ответь на русском.

Выход:

На скриншоте ошибка "Uncaught TypeError: Cannot read properties
of undefined (reading 'map')". Это означает, что код пытается
вызвать метод .map() на переменной, которая равна undefined.
Скорее всего, данные с сервера ещё не загрузились, а компонент
уже пытается их отрендерить. Решение: добавить проверку
if (data) перед вызовом .map() или использовать optional chaining.

По способности к рассуждению: базовые и reasoning-модели

Базовые модели генерируют ответ сразу, токен за токеном, без промежуточных размышлений. Они хорошо справляются с задачами, где ответ очевиден: перевод, суммаризация, ответ на фактологический вопрос.

Reasoning-модели (модели с рассуждением) перед ответом выполняют внутреннюю цепочку размышлений — проверяют разные варианты, ищут логические противоречия и только потом выдают итоговый ответ. Они показывают лучшие результаты на математических задачах, программировании и сложном анализе.

Промпт для базовой модели:

Реши задачу: в комнате 5 человек. Каждый пожал руку каждому по
одному разу. Сколько всего рукопожатий произошло? Напиши только ответ.

Промпт для reasoning-модели (та же задача, но можно проще):

Сколько рукопожатий в комнате из 5 человек? Ответь числом.

Reasoning-модели справляются с этой задачей даже с минимальным промптом, потому что «думают» внутри. Для базовой модели лучше явно попросить рассуждение.

Практический вывод

Независимо от типа модели, хороший промпт следует одним и тем же принципам. Но ты должен учитывать «личность» модели:

Универсальная модель: явно задавай контекст и предметную область.
Маленькая модель: пиши более детальные инструкции, избегай неоднозначности.
Мультимодальная модель: используй возможность прикреплять изображения для задач, где визуальный контекст важен.
Коммерческая модель через API/веб: вся настройка — в тексте промпта.

Проверь себя

У тебя есть задача: классифицировать 10 000 отзывов клиентов по тональности. Какую модель логичнее выбрать — большую коммерческую или маленькую открытую — и почему?

Ответ: маленькую открытую, если она справляется с задачей классификации. Для 10 000 запросов стоимость API большой модели будет высокой, а качество классификации не требует «интеллекта» флагманской модели. Маленькую можно запустить локально и не платить за каждый запрос.

Итог

Модели различаются по назначению, размеру, доступности и модальности.
Универсальным моделям нужен явный контекст предметной области; специализированные «в теме» по умолчанию.
Маленькие модели требуют более детальных инструкций; большие лучше справляются с неявными указаниями.
Мультимодальные модели позволяют работать с изображениями и скриншотами — используй это.
Тип модели влияет на детали промпта, но не на базовые принципы его построения.

Что дальше

Теперь, зная теорию, пора попрактиковаться. В следующем уроке напишем твой первый промпт по всем правилам и разберём базовые принципы, которые работают всегда — независимо от модели и задачи.

Типы LLM и их особенности