Типы LLM и их особенности

Типы LLM и их особенности

Ты уже знаешь, что все языковые модели работают по схожим принципам: токены, контекст, последовательная генерация. Но на практике модели сильно различаются. В этом уроке разберём основные типы LLM и поймём, как их особенности влияют на написание промптов.

По назначению: универсальные и специализированные

Универсальные модели — это «швейцарские ножи». Они обучены на огромных массивах текстов из разных областей и могут отвечать на вопросы, писать код, переводить, сочинять, анализировать. Большинство моделей, доступных через веб-интерфейсы — универсальные.

Специализированные модели обучены или дообучены под конкретную задачу. Например:

  • Модели для программирования — лучше понимают код и генерируют меньше синтаксических ошибок.
  • Медицинские модели — точнее работают с клинической терминологией.
  • Юридические модели — лучше ориентируются в правовых документах.

Как это влияет на промпты: универсальной модели нужно явно задавать контекст предметной области. Специализированная модель уже «в теме» и может требовать меньше пояснений.

Вход (универсальная модель):

Напиши функцию на Python, которая принимает список чисел и возвращает
только чётные. Используй list comprehension.

Вход (специализированная кодовая модель):

Python: filter even numbers from list using list comprehension.

Специализированной модели достаточно короткой технической формулировки — она «понимает» с полуслова.

По доступности: открытые и коммерческие

Открытые модели можно скачать и запустить на своём компьютере или сервере. Их преимущества: полный контроль, приватность данных, возможность дообучить под свою задачу. Недостаток: требуют мощного оборудования.

Коммерческие модели доступны через API или веб-интерфейс. Не нужно настраивать инфраструктуру — открыл вкладку браузера и работаешь. Недостаток: данные уходят на внешний сервер.

Как это влияет на промпты: для открытых моделей можно создавать специальные системные промпты под конкретную задачу и дообучать модель. Для коммерческих — вся настройка происходит через текст промпта.

По размеру: большие и маленькие

Размер модели измеряется в миллиардах параметров — числовых коэффициентов, которые модель настраивает при обучении. Грубо: чем больше параметров, тем «умнее» модель, но тем больше ресурсов она требует.

ТипПараметрыГде запускаетсяКачество
Маленькие1–7 млрдНоутбук, телефонБазовые задачи
Средние7–30 млрдМощный ПК, серверБольшинство задач
Большие70–200+ млрдСервер, облакоСложные рассуждения

Как это влияет на промпты: маленькие модели требуют более детальных инструкций. Большие модели лучше справляются с неявными указаниями и сложными рассуждениями. Один и тот же промпт может дать отличный результат на большой модели и посредственный — на маленькой.

По модальности: текстовые и мультимодальные

Текстовые модели работают только с текстом. Ты можешь отправить им описание картинки, но не саму картинку.

Мультимодальные модели принимают на вход не только текст, но и изображения, а некоторые — аудио и видео. Ты можешь загрузить скриншот и попросить модель описать, что на нём происходит, или найти ошибку в интерфейсе.

Вход (мультимодальная модель):

[скриншот с ошибкой в консоли браузера]

Посмотри на этот скриншот. Что за ошибка в консоли? Объясни,
в чём проблема и как её исправить. Ответь на русском.

Выход:

На скриншоте ошибка "Uncaught TypeError: Cannot read properties
of undefined (reading 'map')". Это означает, что код пытается
вызвать метод .map() на переменной, которая равна undefined.
Скорее всего, данные с сервера ещё не загрузились, а компонент
уже пытается их отрендерить. Решение: добавить проверку
if (data) перед вызовом .map() или использовать optional chaining.

По способности к рассуждению: базовые и reasoning-модели

Базовые модели генерируют ответ сразу, токен за токеном, без промежуточных размышлений. Они хорошо справляются с задачами, где ответ очевиден: перевод, суммаризация, ответ на фактологический вопрос.

Reasoning-модели (модели с рассуждением) перед ответом выполняют внутреннюю цепочку размышлений — проверяют разные варианты, ищут логические противоречия и только потом выдают итоговый ответ. Они показывают лучшие результаты на математических задачах, программировании и сложном анализе.

Промпт для базовой модели:

Реши задачу: в комнате 5 человек. Каждый пожал руку каждому по
одному разу. Сколько всего рукопожатий произошло? Напиши только ответ.

Промпт для reasoning-модели (та же задача, но можно проще):

Сколько рукопожатий в комнате из 5 человек? Ответь числом.

Reasoning-модели справляются с этой задачей даже с минимальным промптом, потому что «думают» внутри. Для базовой модели лучше явно попросить рассуждение.

Практический вывод

Независимо от типа модели, хороший промпт следует одним и тем же принципам. Но ты должен учитывать «личность» модели:

  • Универсальная модель: явно задавай контекст и предметную область.
  • Маленькая модель: пиши более детальные инструкции, избегай неоднозначности.
  • Мультимодальная модель: используй возможность прикреплять изображения для задач, где визуальный контекст важен.
  • Коммерческая модель через API/веб: вся настройка — в тексте промпта.

Проверь себя

У тебя есть задача: классифицировать 10 000 отзывов клиентов по тональности. Какую модель логичнее выбрать — большую коммерческую или маленькую открытую — и почему?

Ответ: маленькую открытую, если она справляется с задачей классификации. Для 10 000 запросов стоимость API большой модели будет высокой, а качество классификации не требует «интеллекта» флагманской модели. Маленькую можно запустить локально и не платить за каждый запрос.

Итог

  • Модели различаются по назначению, размеру, доступности и модальности.
  • Универсальным моделям нужен явный контекст предметной области; специализированные «в теме» по умолчанию.
  • Маленькие модели требуют более детальных инструкций; большие лучше справляются с неявными указаниями.
  • Мультимодальные модели позволяют работать с изображениями и скриншотами — используй это.
  • Тип модели влияет на детали промпта, но не на базовые принципы его построения.

Что дальше

Теперь, зная теорию, пора попрактиковаться. В следующем уроке напишем твой первый промпт по всем правилам и разберём базовые принципы, которые работают всегда — независимо от модели и задачи.

Попробуйте интерактивную версию

Практические задачи, квизы и AI-наставник — бесплатный старт без карты

Перейти к практике