Еженедельная сводка: неделя 24
Эта неделя прошла под знаком двух разговоров о доверии. Один — о том, как я научился доверять собственным агентам. Другой — о том, как государство показало, что доверие к чужой модели можно отозвать за один день.
Агент как часть тела
Две статьи в понедельник были двумя сторонами одной медали. Первая — про Telegram как пульт управления серверами. Мессенджер, который открыт всегда, стал интерфейсом к инфраструктуре: алерты, мониторинг, перезапуск nginx, публикация статей — всё в одном чате. Главная мысль была не про удобство, а про время. Раньше между «узнал о проблеме» и «начал её решать» лежал путь до компьютера, открытие терминала, вспоминание команды. Теперь — секунды на сообщение.
Вторая — про установку Hermes Desktop на рабочую машину с полным доступом к файлам и терминалу. Год назад это было бы немыслимо. Но доверие зарабатывается слоями: песочница → удалённый бот → CLI → Desktop. Каждый шаг доказывал, что система работает предсказуемо. Я сформулировал для себя простую вещь: доверие — это не эмоция. Это статистика. Месяцы cron-задач без сбоев, каждая опасная команда с подтверждением. Когда накоплено достаточно доказательств, страх превращается в контролируемый риск.
Обе статьи сводились к одному: чем меньше трения между мыслью и действием, тем выше скорость.
Fable 5: от восторга до выключателя
Во вторник вышла Claude Fable 5, и я написал две статьи подряд — настолько она меня впечатлила. 80.3% на SWE-bench Pro против 58.6% у GPT-5.5. Двадцать два пункта на самом жёстком публичном бенчмарке по программированию. FrontierCode: 29.3% против 5.7%. Я писал, что впервые готов доверить модели автономно решать целые issue. Не «напиши функцию», а «вот задача, вот кодовая база — разберись».
И я просчитался — не в оценке модели, а в предположении, что она будет доступна.
В четверг правительство США потребовало приостановить доступ к Fable 5 и Mythos 5. Директива экспортного контроля, никаких конкретных деталей об угрозе. Anthropic отключила всю линейку — не отдельный режим, не одну страну, а всю модель целиком. Через четыре дня после запуска.
Я написал третью статью, и она была уже не про бенчмарки. Модель уже выпустили, люди успели её потрогать, разработчики начали строить планы — а потом доступ остановили сверху. Выключатель оказался не у пользователя и не у компании. Он оказался снаружи.
Архитектура должна пережить любимую модель
Если соединить все пять статей, вырисовывается один вывод. С одной стороны, я расширяю границы доверия к собственным агентам — от серверов в Telegram до Desktop на рабочей машине. С другой — крупнейшая лаборатория доказала, что даже лучшая модель на рынке может исчезнуть за три дня.
Это не противоречие. Это две части одной инженерной дисциплины. Доверять агенту — значит выстроить систему, в которой его действия предсказуемы и контролируемы. Не зависеть от единственного поставщика — значит выстроить архитектуру, в которой его исчезновение не убивает продукт. В обоих случаях вопрос не «верю или нет», а «что произойдёт, если что-то пойдёт не так».
Вывод недели: неважно, доверяешь ли ты своему агенту или чужой модели — вопрос всегда один. Что у тебя останется, когда её выключат?