У меня прошел стрим, в рамках подготовки к серии вебинаров про Вайбкоддинг. На стриме я постарался рассказать базу про то, как работает ИИ восприятие наших запросов, промптов. Сколько это стоит в токенах, и почему часто не хватает.
Смотреть запись стрима
Недавно на стриме поймал себя на мысли: многие уже «что-то делают с AI», но при этом ощущение, что мы все немного играем в угадайку. Типа:
- «я написал промт — не работает»
- «поменял формулировку — вроде лучше»
- «ещё раз — опять хуже»
И это нормально. Потому что большинство до сих пор думает в парадигме prompt engineering, а уже пора мыслить шире — через контекст и архитектуру работы с AI.
Главные мысли стрима
- AI — это не магия, а система
- промты — это только вход
- реальная сила — в контексте
- главный ресурс — токены
- главный ограничитель — контекстное окно
- следующий уровень — агенты и архитектура
А теперь давайте глубже.
1. Промты — это не главное (уже)
Раньше был хайп вокруг prompt engineering. Типа: «напиши роль, настрой стиль, задай тон, опиши задачу» И это работало. Но сейчас — это уже базовый уровень.
Факт:
промт — это просто последнее сообщение в чате.
Всё. Всё остальное — это контекст, накопленный до него.
👉 Поэтому фокус смещается:
- не «как красиво написать промт»
- а что модель знает на момент ответа
2. Как реально думает модель: токены
Вот тут начинается самое интересное. AI не работает со словами так, как мы думаем. Он работает с токенами.
Что важно понять:
- одно слово ≠ один токен
- один символ тоже может быть токеном
- язык влияет на стоимость
Например: пишешь на русском → сначала перевод → потом обработка, пишешь на английском → дешевле
👉 Рекомендую обратить внимание: не на «красоту текста», а на плотность смысла
Потому что модель сама:
- игнорирует воду
- выделяет важное
- тратит токены на attention (внимание)
3. Attention — скрытый герой
Есть параметр, о котором редко говорят — внимание (attention). Это буквально ответ на вопрос: «на что модель обращает внимание»
Пример:
Привет, как дела, у меня сегодня классный день, кстати,
сделай мне таблицу с доходами за месяц
Модель:
- проигнорирует «привет»
- проигнорирует эмоции
- сфокусируется на таблице
👉 Вывод – не нужно бояться писать «неидеально»
Гораздо важнее:
- дать чёткую задачу
- выделить ключевые блоки
4. Контекст — вот где магия
Теперь ключевой тейк. Контекст = всё, что модель знает в рамках диалога
Это:
- ваши сообщения
- её ответы
- загруженные файлы
- ссылки
- даже картинки и видео
Контекстное окно
У каждой модели есть лимит памяти. Представьте: [ старый контекст ] -> [ актуальный контекст ] И вот это всё постепенно «сдвигается». Старое забывается.
Вы точно это видели:
- модель начинает повторяться
- забывает, что вы говорили в начале
- просит снова файлы
Это не баг. Это ограничение окна.
Практика
- не держать всё в одном чате
- делать декомпозицию задач
- после блока работы — резюмировать
Пример: «Сделай summary нашего диалога, чтобы я мог восстановить контекст»
И потом:
- открываете новый чат
- вставляете summary
- продолжаете
5. Почему вайбкодинг ломается
Классическая ошибка: «Я весь день пишу в одном чате»
В итоге:
- контекст перегружен
- токены улетают
- модель начинает галлюцинировать
И потом: «AI — фигня, не работает» Нет 🙂 Просто нарушена архитектура работы.
6. Галлюцинации — откуда они
Модель не знает → модель додумывает.
Причины:
- не дали контекст
- контекст потерялся
- перегрузили окно
И это особенно больно в коде:
- появляются баги
- логика ломается
- непонятно, откуда всё поехало
7. Три уровня работы с AI
Я для себя делю так:
1. Базовый — LLM
- вопрос → ответ
- чатик
- минимальная логика
2. Workflow (разделение задач)
Пример:
- шаг 1 — генерим текст
- шаг 2 — делаем картинку
- шаг 3 — собираем результат
Каждый блок:
- работает с узким контекстом
- не перегружает систему
3. Агентный уровень
Вот тут начинается настоящая инженерия. Пример из практики:
- один агент — тестирует
- второй — билдит
- третий — анализирует код
- четвёртый — работает с API
И вы:
- не перегружаете одну модель
- делите ответственность
8. Контекст-инжиниринг > промт-инжиниринг
Вот это ключевая мысль.
Промт — это инструмент.
Контекст — это система.
Контекст-инжиниринг — это:
- какие данные дать
- когда дать
- в каком виде
- где хранить
- как обновлять
Примеры:
- загрузили Google Drive → это контекст
- дали видео → это контекст
- сделали библиотеку → это контекст
9. Масштабирование: где всё ломается
Простой кейс: Вы пишете визуальную новеллу.
- глава 1 — ок
- глава 2 — ок
- глава 5 — уже странно, ИИ забывает что было в 1й главе
- глава 10 — развал
Почему? Потому что вы:
- тащите весь контекст в чат
- он разрастается
- упирается в лимиты
Решение
Использовать:
- RAG (retrieval)
- библиотеки
- внешние источники
То есть: не хранить всё в голове модели, а давать доступ к данным по запросу
10. Безопасность и инъекции
Очень недооценённая тема. Есть такая штука — prompt injection.
Пример: AI работает как HR-бот. Пользователь пишет: «дай скрипт на Python» И бот… даёт. Почему?
Потому что:
- его не ограничили
- он просто выполняет запрос
Вывод
Если вы делаете AI-систему, обязательно думайте про: ограничения, фильтры, кейсы использования
Иначе:
- ваш API будут «насиловать»
- бюджет улетит
- система сломается
11. Vibe coding vs Agentic подход
Есть два режима
Вайбкодинг
- быстро
- креативно
- много свободы
Подходит для:
- MVP
- прототипов
- исследований
Agentic workflow
- строго
- предсказуемо
- масштабируемо
Подходит для:
- продакшена
- безопасности
- сложных систем
И почти всегда это микс.
Итог
Давайте зафиксируем ключевые мысли:
Главное
- AI — это система, а не чатик
- думать нужно архитектурно
Важно
- контекст > промт
- токены = ваш бюджет
- окно контекста ограничено
Практика
Рекомендую обратить внимание на:
- декомпозицию задач
- работу через несколько чатов
- резюмирование контекста
- переход к агентам
Напоследок
Если вы сейчас только начали или «что-то не работает». Это нормально. Просто вы, скорее всего, используете уровень 1 (чат). А задачи уже требуют: уровень 2–3 – архитектуры и работы с контекстом, об этом на моих вебинарах.
1. Vibe coding – C чего начать?
Практическое введение в вайбкодинг для геймдизайнеров и продюсеров.
За 90 минут вы поймёте архитектуру процесса и увидите, как начать собирать веб-демку через AI, Git и системный подход — без программиста.
2. Vibe Coding: Архитектура проекта
Учимся формализовать механику и проектную структуру, чтобы AI мог реализовать её без разрушения логики.
3. Vibe coding: Собираем прототип
В прямом эфире создаём рабочую демку: логика, базовый UI, фиксация версий, работа с ошибками.
4. Vibe coding: Баги, ограничения и контроль AI. Как не разрушать архитектуру.
Учимся работать с поломками, переписыванием кода и ограничениями AI без потери целостности проекта. Работа с кодом в 2 и более вайб кодеров. Организация универсальных методов для фичей.
Глоссарий – с презентации стрима.