Few-shot CoT: примеры с рассуждениями
Few-shot CoT: примеры с рассуждениями
Zero-shot CoT — это быстро: добавил фразу и получил рассуждение. Но что, если модель рассуждает неправильно? Например, пропускает шаги, путает порядок или использует неверную логику? Тогда на помощь приходит few-shot CoT — ты показываешь модели 2–3 примера ПРАВИЛЬНЫХ рассуждений, и она следует тому же паттерну.
Отличие от обычного few-shot
Обычный few-shot (модуль 3) показывает примеры «вход → выход». Few-shot CoT показывает «вход → рассуждение → выход».
Обычный few-shot:
Пример: "Сколько будет 15 × 14 / 2?" → "105"
Модель запоминает ответ, но не учится РАССУЖДАТЬ.
Few-shot CoT:
Пример:
Вопрос: "Сколько будет 15 × 14 / 2?"
Рассуждение: 15 × 14 = 210. 210 / 2 = 105.
Ответ: 105
Модель запоминает ПАТТЕРН РАССУЖДЕНИЯ: вычислить произведение → разделить → записать ответ.
Пример: математическая задача
Few-shot CoT промпт:
Решай задачи, следуя паттерну из примеров: сначала рассуждение шаг
за шагом, затем ответ на отдельной строке "Ответ: ...".
Пример 1:
Задача: Поезд едет 3 часа со скоростью 80 км/ч, потом 2 часа
со скоростью 60 км/ч. Какое расстояние он проехал?
Рассуждение:
- За первые 3 часа: 3 × 80 = 240 км.
- За следующие 2 часа: 2 × 60 = 120 км.
- Общее расстояние: 240 + 120 = 360 км.
Ответ: 360 км.
Пример 2:
Задача: В магазине скидка 20% на товар за 1500 ₽. Сколько он
будет стоить?
Рассуждение:
- 20% от 1500: 1500 × 0.20 = 300 ₽.
- Цена со скидкой: 1500 - 300 = 1200 ₽.
Ответ: 1200 ₽.
Теперь твоя задача:
В магазине акция: купи 2 товара по 800 ₽, третий за полцены.
Плюс скидка 10% на весь чек. Сколько будут стоить 3 товара?
Выход:
Рассуждение:
- Цена двух товаров по полной: 2 × 800 = 1600 ₽.
- Третий товар за полцены: 800 / 2 = 400 ₽.
- Сумма до скидки на чек: 1600 + 400 = 2000 ₽.
- Скидка 10% на чек: 2000 × 0.10 = 200 ₽.
- Итоговая цена: 2000 - 200 = 1800 ₽.
Ответ: 1800 ₽.
Модель воспроизвела паттерн из примеров: разбить на шаги → вычислить каждый → дать ответ.
Как писать примеры для few-shot CoT
1. Показывай ВСЕ шаги
Не пропускай промежуточные вычисления. Если в примере написано «2 × 800 = 1600» — модель поймёт, что каждый шаг должен быть расписан.
2. Используй консистентный формат
Все примеры должны следовать одной структуре:
Задача: ...
Рассуждение:
- Шаг 1...
- Шаг 2...
Ответ: ...
3. Демонстрируй сложные моменты
Включи в примеры потенциально трудные места:
Пример:
Задача: Студент получил оценки 4, 5, 3, 4, 5. Какой средний балл?
Рассуждение:
- Сумма оценок: 4 + 5 + 3 + 4 + 5 = 21.
- Количество оценок: 5.
- Среднее: 21 / 5 = 4.2.
- Округляем до десятых: 4.2 (уже одна цифра после запятой).
Ответ: 4.2
Шаг «количество оценок» кажется очевидным, но новички часто его пропускают. Включи его в пример, чтобы модель не пропускала.
Few-shot CoT для не-математических задач
CoT работает не только с числами. Вот пример для анализа текста:
Анализируй отзывы по паттерну из примеров.
Пример 1:
Отзыв: "Купил телефон, через неделю перестал включаться. Сервисный
центр отказал в ремонте. Деньги не вернули."
Рассуждение:
- В отзыве описан негативный опыт: товар сломался через неделю.
- Есть указание на отказ сервисного центра — это усугубляет негатив.
- Присутствует финансовая потеря — деньги не вернули.
- Тональность явно негативная. Причина: брак товара + плохой сервис.
Ответ:
Тональность: негативная
Причина: бракованный товар, отказ в гарантийном обслуживании
Пример 2:
Отзыв: "Хороший телефон, всё работает. Экран яркий, камера отличная.
Но цена высоковата."
Рассуждение:
- В целом отзыв позитивный: «хороший», «всё работает», «отличная».
- Есть негативный нюанс: «цена высоковата».
- Но этот нюанс не перевешивает общий позитив — это смешанный отзыв.
Ответ:
Тональность: смешанная
Причина: товар нравится, но покупатель считает цену завышенной
Когда few-shot CoT лучше zero-shot
| Ситуация | Zero-shot CoT | Few-shot CoT |
|---|---|---|
| Простая математика | Достаточно | Избыточно |
| Сложная логика | Может ошибаться в паттерне рассуждения | Задаёт правильный паттерн |
| Специфический формат рассуждения | Модель придумывает сама | Модель копирует твой формат |
| Анализ текста по критериям | Критерии могут быть пропущены | Каждый критерий показан в примере |
Проверь себя
Создай two-shot CoT промпт для задачи: «Определи, является ли текст спамом». Напиши 2 примера (спам и не спам) с рассуждениями.
Итог
- Few-shot CoT показывает модели не только ответы, но и ПРОЦЕСС рассуждения.
- Модель копирует паттерн: «разбей на шаги → вычисли каждый → запиши ответ».
- Примеры должны быть консистентными по формату и показывать все шаги, даже очевидные.
- Few-shot CoT работает не только для математики — для анализа текста, логических задач, проверки условий.
- Если zero-shot CoT даёт неверную логику — добавь 2–3 few-shot примера.
Что дальше
Теория CoT освоена. В следующем уроке — практика: возьмём сложную задачу и применим обе техники (zero-shot и few-shot), сравнив результаты. Ты увидишь, в каких случаях few-shot критически необходим.