Журнал сеньора вайбкодера уроки из опыта, заметки и инсайты

Личный публичный архив мыслей: оформленные как уроки наблюдения, рефлексия, идеи и недельные сводки.

RSS
← Назад к ленте

Claude Code как операционная система агентной разработки

Агентная фабрика Claude Code

Claude Opus 4.8 принёс dynamic workflows и режим ultracode в Claude Code. Можно писать новости — модель стала лучше, подагенты, оркестрация. Но завтра выйдет Opus 4.9, потом Codex обновится, потом Gemini кого-нибудь обойдёт. Пересказывать гонку выпусков бессмысленно.

Мне интересно другое: следующий скачок в ИИ-разработке случится не в моделях. Он случится в том, как модели организуют в рабочий процесс.

От помощника к среде выполнения

Первая волна вайбкодинга была простой. Человек пишет: «сделай форму входа», «почини ошибку», «добавь экспорт». Модель лезет в файлы и что-то меняет. Скорость выросла — это было приятно.

Но у одного агента есть потолок. Он зажат в одном контексте и одной линии рассуждений. Может забыть сделанный вывод, переоценить гипотезу, упустить связь или слишком уверенно пойти по плохому плану. Чем больше задача, тем сильнее это чувствуется.

Dynamic workflows всё меняют. Claude может разбить задачу на подзадачи, запустить десятки подагентов: одни ищут решения, другие проверяют и опровергают, потом всё собирается в единый результат. В ultracode Claude Code получает повышенный effort и сам решает, когда нужна такая оркестрация.

Модель получила среду выполнения для управления другими моделями.

Конкуренция переходит на уровень систем

Мы привыкли сравнивать модели как двигатели: у этой больше тяга, у той меньше расход. Но в реальной разработке выигрывает не только мотор — выигрывает машина целиком.

Поверх модели нужны: память о контексте, правила доступа, планирование, проверка гипотез, параллельные исследования, независимая проверка кода, запуск тестов, контроль бюджета, понятные отчёты. Без этого даже сильная модель работает хаотично. С этим модель средней силы выдаёт полезный результат, потому что её работа подчинена дисциплине.

Следующий этап гонки — не Opus против Codex против Gemini. Это Claude Code против Codex CLI против Cursor против внутренних платформ компаний. Побеждает тот, кто научился превращать неопределённую задачу в управляемый процесс.

Почему «операционная система» — не красивое слово

Операционная система делает несколько вещей: распределяет ресурсы, запускает и изолирует процессы, разграничивает доступ, собирает результаты, даёт интерфейс управления.

Агентная разработка делает то же самое. Задача приходит как запрос. Claude Code решает — один агент справится или нужен workflow. Workflow раскладывает задачу на подагенты: одни анализируют репозиторий, другие проверяют выводы, третьи запускают тесты. В основную сессию возвращается уже сжатый результат.

Это операционная система, только вместо системных процессов — смысловые: «исследуй», «реализуй», «проверь», «опровергни», «собери».

Кнопка «сделай хорошо» перестаёт быть главным интерфейсом. Нужен интерфейс намерений и ограничений: что можно менять, какие проверки обязательны, каков лимит бюджета, кто принимает решение.

Вайбкодинг взрослеет

«Вайбкодинг» часто воспринимают как легкомыслие: сел, набросал код, поправил ошибки, поехали. Но в этом была его сила — снял страх перед чистым листом.

Проблема вайбкодинга: быстро сделать кое-как — не достижение. Быстро сделать так, чтобы код можно было тестировать, поддерживать и развивать — вот это уровень.

Dynamic workflows двигают вайбкодинг от хаотичной генерации к управляемой практике. Агент выстраивает вокруг задачи структуру: параллельные исследования, независимые проверки, прогоны тестов, консолидация выводов.

Взросление — это не отказ от интуиции и скорости. Это добавление к ним системного процесса.

Самая ценная роль — не исполнитель

Мы слишком долго смотрели на ИИ-агентов как на исполнителей: «напиши код», «создай компонент», «исправь ошибку». Полезно, но это далеко не предел.

Самая ценная роль — организатор. Не написать модуль, а понять, какие части системы нужно изучить. Не предложить решение, а запустить несколько независимых попыток. Не сказать «готово», а поручить другой роли найти слабые места. Не держать план в контексте диалога, а вынести в исполняемую структуру.

Это ближе к работе сильного руководителя разработки, чем младшего разработчика. Хороший лидер не пишет каждую строку сам — он разбивает неопределённость, распределяет задачи, сталкивает гипотезы, принимает решения. Если агентные среды научатся делать хотя бы часть этого, их ценность окажется выше, чем от очередного автодополнения.

Автономность без ограничений — дорогая игрушка

Чем выше автономность, тем дороже ошибка. Когда Claude Code запускает сотни подагентов, стоимость растёт не линейно. Можно сжечь бюджет, растиражировать неверное решение, получить красивый отчёт от агента, который проверял сам себя.

Агентная система должна контролировать: изолированные ветки, ограничения на запись, запрет на отправку без подтверждения человека, обязательный прогон тестов, журнал действий, лимиты по стоимости, критерии готовности, независимая проверка.

Без этого ultracode — не инженерный инструмент, а дорогая турбина на магазинной тележке.

Что это значит на практике

Фокус смещается с «какую модель выбрать» на «как выстроить систему работы с моделями». Можно спорить, насколько хорош Opus 4.8, сравнивать с Codex или Gemini. Эти споры устареют через месяц. Не устареет вопрос: как превратить ИИ в управляемую инженерную среду?

Перед разработчиками и архитекторами конкретные задачи: как формулировать задачи так, чтобы агент мог их разбивать; как передавать контекст между подагентами; как проверять выводы независимыми ролями; как не давать агентам бесконечно спорить и сливать бюджет; как сочетать решения человека и машинную параллельность; как выстраивать свои процессы поверх внешних моделей.

Код пишет не модель. Код пишет система: человек, контекст, ограничения, тесты, архитектура и ансамбль агентов, собранных вокруг задачи.

Opus 4.8 — очередной сильный выпуск. Dynamic workflows и ultracode — симптом: агентная разработка переходит от одиночного помощника к операционной системе, собирающей временные команды под задачу. Если это действительно шаг в том направлении, перед нами ранний набросок того, как будет выглядеть разработка через пару лет. Не бесконечный чат с умным помощником, а инженерная среда, где человек задаёт вектор, а агентная система сама собирает команду.