Типы LLM и их особенности
Типы LLM и их особенности
Ты уже знаешь, что все языковые модели работают по схожим принципам: токены, контекст, последовательная генерация. Но на практике модели сильно различаются. В этом уроке разберём основные типы LLM и поймём, как их особенности влияют на написание промптов.
По назначению: универсальные и специализированные
Универсальные модели — это «швейцарские ножи». Они обучены на огромных массивах текстов из разных областей и могут отвечать на вопросы, писать код, переводить, сочинять, анализировать. Большинство моделей, доступных через веб-интерфейсы — универсальные.
Специализированные модели обучены или дообучены под конкретную задачу. Например:
- Модели для программирования — лучше понимают код и генерируют меньше синтаксических ошибок.
- Медицинские модели — точнее работают с клинической терминологией.
- Юридические модели — лучше ориентируются в правовых документах.
Как это влияет на промпты: универсальной модели нужно явно задавать контекст предметной области. Специализированная модель уже «в теме» и может требовать меньше пояснений.
Вход (универсальная модель):
Напиши функцию на Python, которая принимает список чисел и возвращает
только чётные. Используй list comprehension.
Вход (специализированная кодовая модель):
Python: filter even numbers from list using list comprehension.
Специализированной модели достаточно короткой технической формулировки — она «понимает» с полуслова.
По доступности: открытые и коммерческие
Открытые модели можно скачать и запустить на своём компьютере или сервере. Их преимущества: полный контроль, приватность данных, возможность дообучить под свою задачу. Недостаток: требуют мощного оборудования.
Коммерческие модели доступны через API или веб-интерфейс. Не нужно настраивать инфраструктуру — открыл вкладку браузера и работаешь. Недостаток: данные уходят на внешний сервер.
Как это влияет на промпты: для открытых моделей можно создавать специальные системные промпты под конкретную задачу и дообучать модель. Для коммерческих — вся настройка происходит через текст промпта.
По размеру: большие и маленькие
Размер модели измеряется в миллиардах параметров — числовых коэффициентов, которые модель настраивает при обучении. Грубо: чем больше параметров, тем «умнее» модель, но тем больше ресурсов она требует.
| Тип | Параметры | Где запускается | Качество |
|---|---|---|---|
| Маленькие | 1–7 млрд | Ноутбук, телефон | Базовые задачи |
| Средние | 7–30 млрд | Мощный ПК, сервер | Большинство задач |
| Большие | 70–200+ млрд | Сервер, облако | Сложные рассуждения |
Как это влияет на промпты: маленькие модели требуют более детальных инструкций. Большие модели лучше справляются с неявными указаниями и сложными рассуждениями. Один и тот же промпт может дать отличный результат на большой модели и посредственный — на маленькой.
По модальности: текстовые и мультимодальные
Текстовые модели работают только с текстом. Ты можешь отправить им описание картинки, но не саму картинку.
Мультимодальные модели принимают на вход не только текст, но и изображения, а некоторые — аудио и видео. Ты можешь загрузить скриншот и попросить модель описать, что на нём происходит, или найти ошибку в интерфейсе.
Вход (мультимодальная модель):
[скриншот с ошибкой в консоли браузера]
Посмотри на этот скриншот. Что за ошибка в консоли? Объясни,
в чём проблема и как её исправить. Ответь на русском.
Выход:
На скриншоте ошибка "Uncaught TypeError: Cannot read properties
of undefined (reading 'map')". Это означает, что код пытается
вызвать метод .map() на переменной, которая равна undefined.
Скорее всего, данные с сервера ещё не загрузились, а компонент
уже пытается их отрендерить. Решение: добавить проверку
if (data) перед вызовом .map() или использовать optional chaining.
По способности к рассуждению: базовые и reasoning-модели
Базовые модели генерируют ответ сразу, токен за токеном, без промежуточных размышлений. Они хорошо справляются с задачами, где ответ очевиден: перевод, суммаризация, ответ на фактологический вопрос.
Reasoning-модели (модели с рассуждением) перед ответом выполняют внутреннюю цепочку размышлений — проверяют разные варианты, ищут логические противоречия и только потом выдают итоговый ответ. Они показывают лучшие результаты на математических задачах, программировании и сложном анализе.
Промпт для базовой модели:
Реши задачу: в комнате 5 человек. Каждый пожал руку каждому по
одному разу. Сколько всего рукопожатий произошло? Напиши только ответ.
Промпт для reasoning-модели (та же задача, но можно проще):
Сколько рукопожатий в комнате из 5 человек? Ответь числом.
Reasoning-модели справляются с этой задачей даже с минимальным промптом, потому что «думают» внутри. Для базовой модели лучше явно попросить рассуждение.
Практический вывод
Независимо от типа модели, хороший промпт следует одним и тем же принципам. Но ты должен учитывать «личность» модели:
- Универсальная модель: явно задавай контекст и предметную область.
- Маленькая модель: пиши более детальные инструкции, избегай неоднозначности.
- Мультимодальная модель: используй возможность прикреплять изображения для задач, где визуальный контекст важен.
- Коммерческая модель через API/веб: вся настройка — в тексте промпта.
Проверь себя
У тебя есть задача: классифицировать 10 000 отзывов клиентов по тональности. Какую модель логичнее выбрать — большую коммерческую или маленькую открытую — и почему?
Ответ: маленькую открытую, если она справляется с задачей классификации. Для 10 000 запросов стоимость API большой модели будет высокой, а качество классификации не требует «интеллекта» флагманской модели. Маленькую можно запустить локально и не платить за каждый запрос.
Итог
- Модели различаются по назначению, размеру, доступности и модальности.
- Универсальным моделям нужен явный контекст предметной области; специализированные «в теме» по умолчанию.
- Маленькие модели требуют более детальных инструкций; большие лучше справляются с неявными указаниями.
- Мультимодальные модели позволяют работать с изображениями и скриншотами — используй это.
- Тип модели влияет на детали промпта, но не на базовые принципы его построения.
Что дальше
Теперь, зная теорию, пора попрактиковаться. В следующем уроке напишем твой первый промпт по всем правилам и разберём базовые принципы, которые работают всегда — независимо от модели и задачи.