Что нужно знать про AI перед тем, как идти в вайбкодинг

У меня прошел стрим, в рамках подготовки к серии вебинаров про Вайбкоддинг. На стриме я постарался рассказать базу про то, как работает ИИ восприятие наших запросов, промптов. Сколько это стоит в токенах, и почему часто не хватает.

Смотреть запись стрима

Недавно на стриме поймал себя на мысли: многие уже «что-то делают с AI», но при этом ощущение, что мы все немного играем в угадайку. Типа:

  • «я написал промт — не работает»
  • «поменял формулировку — вроде лучше»
  • «ещё раз — опять хуже»

И это нормально. Потому что большинство до сих пор думает в парадигме prompt engineering, а уже пора мыслить шире — через контекст и архитектуру работы с AI.

Главные мысли стрима

  1. AI — это не магия, а система
  2. промты — это только вход
  3. реальная сила — в контексте
  4. главный ресурс — токены
  5. главный ограничитель — контекстное окно
  6. следующий уровень — агенты и архитектура

А теперь давайте глубже.

1. Промты — это не главное (уже)

Раньше был хайп вокруг prompt engineering. Типа: «напиши роль, настрой стиль, задай тон, опиши задачу» И это работало. Но сейчас — это уже базовый уровень.

Факт:
промт — это просто последнее сообщение в чате.

Всё. Всё остальное — это контекст, накопленный до него.

👉 Поэтому фокус смещается:

  • не «как красиво написать промт»
  • а что модель знает на момент ответа

2. Как реально думает модель: токены

Вот тут начинается самое интересное. AI не работает со словами так, как мы думаем. Он работает с токенами.

Что важно понять:

  • одно слово ≠ один токен
  • один символ тоже может быть токеном
  • язык влияет на стоимость

Например: пишешь на русском → сначала перевод → потом обработка, пишешь на английском → дешевле

👉 Рекомендую обратить внимание: не на «красоту текста», а на плотность смысла

Потому что модель сама:

  • игнорирует воду
  • выделяет важное
  • тратит токены на attention (внимание)

3. Attention — скрытый герой

Есть параметр, о котором редко говорят — внимание (attention). Это буквально ответ на вопрос: «на что модель обращает внимание»

Пример:

Привет, как дела, у меня сегодня классный день, кстати,
сделай мне таблицу с доходами за месяц

Модель:

  • проигнорирует «привет»
  • проигнорирует эмоции
  • сфокусируется на таблице

👉 Вывод – не нужно бояться писать «неидеально»

Гораздо важнее:

  • дать чёткую задачу
  • выделить ключевые блоки

4. Контекст — вот где магия

Теперь ключевой тейк. Контекст = всё, что модель знает в рамках диалога

Это:

  • ваши сообщения
  • её ответы
  • загруженные файлы
  • ссылки
  • даже картинки и видео

Контекстное окно

У каждой модели есть лимит памяти. Представьте: [ старый контекст ] -> [ актуальный контекст ] И вот это всё постепенно «сдвигается». Старое забывается.


Вы точно это видели:

  • модель начинает повторяться
  • забывает, что вы говорили в начале
  • просит снова файлы

Это не баг. Это ограничение окна.


Практика

  • не держать всё в одном чате
  • делать декомпозицию задач
  • после блока работы — резюмировать

Пример: «Сделай summary нашего диалога, чтобы я мог восстановить контекст»

И потом:

  • открываете новый чат
  • вставляете summary
  • продолжаете

5. Почему вайбкодинг ломается

Классическая ошибка: «Я весь день пишу в одном чате»

В итоге:

  • контекст перегружен
  • токены улетают
  • модель начинает галлюцинировать

И потом: «AI — фигня, не работает» Нет 🙂 Просто нарушена архитектура работы.


6. Галлюцинации — откуда они

Модель не знает → модель додумывает.

Причины:

  • не дали контекст
  • контекст потерялся
  • перегрузили окно

И это особенно больно в коде:

  • появляются баги
  • логика ломается
  • непонятно, откуда всё поехало

7. Три уровня работы с AI

Я для себя делю так:

1. Базовый — LLM

  • вопрос → ответ
  • чатик
  • минимальная логика

2. Workflow (разделение задач)

Пример:

  • шаг 1 — генерим текст
  • шаг 2 — делаем картинку
  • шаг 3 — собираем результат

Каждый блок:

  • работает с узким контекстом
  • не перегружает систему

3. Агентный уровень

Вот тут начинается настоящая инженерия. Пример из практики:

  • один агент — тестирует
  • второй — билдит
  • третий — анализирует код
  • четвёртый — работает с API

И вы:

  • не перегружаете одну модель
  • делите ответственность

8. Контекст-инжиниринг > промт-инжиниринг

Вот это ключевая мысль.

Промт — это инструмент.
Контекст — это система.

Контекст-инжиниринг — это:

  • какие данные дать
  • когда дать
  • в каком виде
  • где хранить
  • как обновлять

Примеры:

  • загрузили Google Drive → это контекст
  • дали видео → это контекст
  • сделали библиотеку → это контекст

9. Масштабирование: где всё ломается

Простой кейс: Вы пишете визуальную новеллу.

  • глава 1 — ок
  • глава 2 — ок
  • глава 5 — уже странно, ИИ забывает что было в 1й главе
  • глава 10 — развал

Почему? Потому что вы:

  • тащите весь контекст в чат
  • он разрастается
  • упирается в лимиты

Решение

Использовать:

  • RAG (retrieval)
  • библиотеки
  • внешние источники

То есть: не хранить всё в голове модели, а давать доступ к данным по запросу

10. Безопасность и инъекции

Очень недооценённая тема. Есть такая штука — prompt injection.
Пример: AI работает как HR-бот. Пользователь пишет: «дай скрипт на Python» И бот… даёт. Почему?

Потому что:

  • его не ограничили
  • он просто выполняет запрос

Вывод

Если вы делаете AI-систему, обязательно думайте про: ограничения, фильтры, кейсы использования

Иначе: 

  • ваш API будут «насиловать»
  • бюджет улетит
  • система сломается

11. Vibe coding vs Agentic подход

Есть два режима

Вайбкодинг

  • быстро
  • креативно
  • много свободы

Подходит для:

  • MVP
  • прототипов
  • исследований

Agentic workflow

  • строго
  • предсказуемо
  • масштабируемо

Подходит для:

  • продакшена
  • безопасности
  • сложных систем

И почти всегда это микс.


Итог

Давайте зафиксируем ключевые мысли:

Главное

  • AI — это система, а не чатик
  • думать нужно архитектурно

Важно

  • контекст > промт
  • токены = ваш бюджет
  • окно контекста ограничено

Практика

Рекомендую обратить внимание на:

  • декомпозицию задач
  • работу через несколько чатов
  • резюмирование контекста
  • переход к агентам

Напоследок

Если вы сейчас только начали или «что-то не работает». Это нормально. Просто вы, скорее всего, используете уровень 1 (чат). А задачи уже требуют: уровень 2–3 – архитектуры и работы с контекстом, об этом на моих вебинарах.


1. Vibe coding – C чего начать?

Практическое введение в вайбкодинг для геймдизайнеров и продюсеров.

За 90 минут вы поймёте архитектуру процесса и увидите, как начать собирать веб-демку через AI, Git и системный подход — без программиста.

 

2. Vibe Coding: Архитектура проекта

Учимся формализовать механику и проектную структуру, чтобы AI мог реализовать её без разрушения логики. 

3. Vibe coding: Собираем прототип

В прямом эфире создаём рабочую демку: логика, базовый UI, фиксация версий, работа с ошибками.

4. Vibe coding: Баги, ограничения и контроль AI. Как не разрушать архитектуру.

Учимся работать с поломками, переписыванием кода и ограничениями AI без потери целостности проекта. Работа с кодом в 2 и более вайб кодеров. Организация универсальных методов для фичей.

Глоссарий – с презентации стрима.

Поделись с коллегами: