Еженедельная сводка: неделя 25
Неделя, когда рынок моделей перестал быть одной лестницей «кто умнее»: GLM 5.2 показала, что открытость, цена и выносливость важнее места в рейтинге, а день на 125 миллионов токенов подтвердил теорию на практике.
Личный публичный архив мыслей: оформленные как уроки наблюдения, рефлексия, идеи и недельные сводки.
RSSНеделя, когда рынок моделей перестал быть одной лестницей «кто умнее»: GLM 5.2 показала, что открытость, цена и выносливость важнее места в рейтинге, а день на 125 миллионов токенов подтвердил теорию на практике.
DeepSeek занимает 13 е место по тестам интеллекта, но 1 е по реальному потреблению на OpenRouter. Разбор того, почему лаборатория хедж фонда выигрывает не там, где смотрят.
Почему рынок ИИ всё больше похож не на свободную гонку моделей, а на захват инфраструктуры: деньги, железо, экспортные правила и контроль доступа.
Дневник теста ZCode с GLM 5.2 на реальном проекте: 125 млн токенов, большой слой фактов в save session и ощущение, что агентный кодинг наконец становится рабочим процессом.
Почему вайбкодеру нужна dev версия рядом с prod: чтобы быстро пробовать идеи, проверять работу агента и не ломать готовый продукт.
Почему часть обзоров GLM 5.2 кажется мне кривой: модель сравнивают с текущим лидером, но забывают цену, открытые веса и скорость рынка.
Artificial Analysis прогнал GLM 5.2 в независимых тестах. Самое интересное там не место в рейтинге, а цена длинной работы агента.
Z.AI выпустила открытую GLM 5.2 с контекстом 1M токенов. Важнее цифры другое: модели учатся выдерживать многочасовую работу агента.
Неделя доверия и контроля: от установки Hermes Desktop с полным доступом до того, как правительство США выключило Claude Fable 5 за четыре дня после запуска. Архитектура должна пережить любимую модель.
12 июня Anthropic приостановила доступ к Claude Fable 5 и Mythos 5 из за экспортного контроля США. Это меняет разговор о фронтирных ИИ моделях.
Anthropic выпустила Claude Fable 5 с разрывом в 22 пункта на SWE bench Pro над GPT 5.5. FrontierCode: 29.3% против 5.7%. Разбираюсь, почему OpenAI обязана ответить — и быстро.
Anthropic выпустила Claude Fable 5 — модель, которая по SWE bench Pro обходит GPT 5.5 на 22 пункта. Разбираюсь, что это значит для повседневной работы разработчика и какие подводные камни стоит знать.
Путь от страха перед AI агентом с полным доступом к системе до установки десктоп клиента на рабочую машину: как доверие строится через ограниченный доступ, миграцию с OpenClaw и постепенное расширение границ.
Как мессенджер превратился в пульт управления серверной инфраструктурой: алерты, публикации, мониторинг и управление процессами — всё в одном чате с AI агентом.
Эта неделя крутилась вокруг одного: кто кем управляет? Мы инструментами или они нами? Три статьи из шести — об экономике ИИ. Они сложились в чёткий вы…
DeepSeek V4 вышел скучно, уронил цены в 4 раза — и за два месяца тихо занял первое место на OpenRouter. Революция — не всегда взрыв, иногда это оползень.
Я пересчитал свои подписки на ИИ: пять платных, три бесплатных и $320 в месяц. Почему я не сокращаю этот зоопарк инструментов и что на самом деле покупаю.
Почему вайбкодинг стал инвестицией: вместо бесконечных подписок на SaaS можно собирать свои инструменты под реальные процессы.
Hermes выходит за пределы Telegram: один агент должен жить в мессенджере, терминале и на рабочем столе, не теряя контекст.
Запуск продукта нельзя свести к дате: нужна система готовности, где видно критерии, риски и реальное состояние команды.
Claude Code с Opus 4.8 как операционная система агентной разработки: важны уже не отдельные ответы, а рабочие потоки.
Итоги 22 недели: память между сессиями и переход от одноразовых разговоров с агентом к накоплению рабочего контекста.
Как память между сессиями помогает ИИ агенту не начинать с нуля: решения, контекст и ошибки должны переживать один диалог.
Итоги 21 недели: лимиты задач, API как интерфейс и плагины Mivra — одна линия про системы, которые выдерживают рост.
Почему Mivra должна расти через плагины: ядро не обязано знать всё, если расширения могут добавлять возможности без хаоса.
API становится новым интерфейсом: для ИИ агентов важны не кнопки на экране, а понятные действия, параметры и ответы системы.
Почему четыре задачи в день честнее подсчёта часов: главный расход в работе — не время, а переключения между контекстами.
Итоги 20 недели: Кодекс, TaskFlow и взросление инструментов, которые начинают спорить с человеком, а не просто выполнять команды.
Почему TaskFlow должен говорить «стоп»: планирование дня начинается не со списка задач, а с честного бюджета времени.
Один день с Кодексом на реальном проекте 7Lamp ERP: где ИИ для кода уже взрослеет, а где человеку всё ещё нужен контроль.
Итоги 19 недели: запуск журнала, голосовой ввод, SEO, API и первые выводы о том, как личный опыт превращается в систему.
Почему навыки для агентов улучшают код: модель важна, но стабильный процесс, проверки и инструкции влияют не меньше.
Как простой помодоро таймер превратился в игру: маленькая задача раскрыла, что продуктивность держится на ощущении прогресса.
Почему ИИ агенту нужна не просто память, а карта проекта: связи между файлами важнее огромного окна контекста.
Миллион токенов не заменяет память: большой контекст помогает думать, но не спасает от хаоса без структуры и гигиены проекта.
Правило двух минут против мелких хвостов: если действие быстрое, его дешевле сделать сразу, чем хранить в голове.
Почему метод Помодоро до сих пор работает: таймер режет день на понятные отрезки и помогает не расползаться вниманием.
Полгода вайбкодинга: путь от первых экспериментов с GPT 3.5 до собственной ERP и нового способа создавать рабочие системы.
Журнал научился принимать изображения через API: теперь агент может публиковать статьи с обложками и иллюстрациями без ручной возни.
Что я понял после двух лет найма без HR: подбор людей — это отдельный процесс, который нельзя тащить на себе между делом.
Заметка об обновлении Hermes Agent: почему сложные технические правки лучше поручать агенту, а человеку оставить контроль и проверку.
Почему Markdown остаётся самым живучим форматом для заметок, документации и личного архива: его читают и люди, и машины.
Философия малого изменения: ежедневные небольшие эксперименты накапливаются в опыт, инструменты и настоящую экспертизу.
Почему сайту журнала нужен API: агентам важен не красивый экран, а понятный способ публиковать, искать и связывать знания.
Hermes Agent как рабочий слой между мыслью и действием: не чат ради ответов, а посредник, который умеет выполнять задачи.
Короткая инструкция по подключению сайта к Google Search Console: подтвердить права, отправить карту сайта и увидеть индексацию.
Как добавить сайт в Яндекс.Вебмастер, подтвердить владение и помочь Яндексу быстрее найти страницы журнала.
Что нужно личному сайту для индексации: нормальные адреса, карта сайта, метаданные и страницы, которые видит поисковик.
Почему клавиатура стала узким местом между мыслью и машиной, и как диктовка меняет скорость работы с идеями.
Как голосовой ввод через Gemini снял барьер между мыслью и планом: задача фиксируется быстрее, чем успевает потеряться.
Правило трёх повторений: если задача повторилась три раза, её пора автоматизировать, документировать или вынести в процесс.
Как Журнал Знаний превращает хаотичные заметки из Telegram в публичные уроки, архив решений и основу для работы агентов.
Первый запуск Журнала Знаний: простой Markdown блог вместо большой системы, чтобы быстрее начать сохранять мысли и уроки.
Почему я выбрал Markdown вместо мини CMS для личного журнала: меньше магии, больше контроля и проще долгоживущий архив.