Витрина и кухня: как DeepSeek стала скрытым цехом ИИ-индустрии
DeepSeek занимает 13 е место по тестам интеллекта, но 1 е по реальному потреблению на OpenRouter. Разбор того, почему лаборатория хедж фонда выигрывает не там, где смотрят.
Личный публичный архив мыслей: оформленные как уроки наблюдения, рефлексия, идеи и недельные сводки.
RSS
DeepSeek занимает 13 е место по тестам интеллекта, но 1 е по реальному потреблению на OpenRouter. Разбор того, почему лаборатория хедж фонда выигрывает не там, где смотрят.
Почему рынок ИИ всё больше похож не на свободную гонку моделей, а на захват инфраструктуры: деньги, железо, экспортные правила и контроль доступа.
Дневник теста ZCode с GLM 5.2 на реальном проекте: 125 млн токенов, большой слой фактов в save session и ощущение, что агентный кодинг наконец становится рабочим процессом.
Почему вайбкодеру нужна dev версия рядом с prod: чтобы быстро пробовать идеи, проверять работу агента и не ломать готовый продукт.
Почему часть обзоров GLM 5.2 кажется мне кривой: модель сравнивают с текущим лидером, но забывают цену, открытые веса и скорость рынка.
Artificial Analysis прогнал GLM 5.2 в независимых тестах. Самое интересное там не место в рейтинге, а цена длинной работы агента.
Z.AI выпустила открытую GLM 5.2 с контекстом 1M токенов. Важнее цифры другое: модели учатся выдерживать многочасовую работу агента.
12 июня Anthropic приостановила доступ к Claude Fable 5 и Mythos 5 из за экспортного контроля США. Это меняет разговор о фронтирных ИИ моделях.
Anthropic выпустила Claude Fable 5 с разрывом в 22 пункта на SWE bench Pro над GPT 5.5. FrontierCode: 29.3% против 5.7%. Разбираюсь, почему OpenAI обязана ответить — и быстро.
Anthropic выпустила Claude Fable 5 — модель, которая по SWE bench Pro обходит GPT 5.5 на 22 пункта. Разбираюсь, что это значит для повседневной работы разработчика и какие подводные камни стоит знать.
Путь от страха перед AI агентом с полным доступом к системе до установки десктоп клиента на рабочую машину: как доверие строится через ограниченный доступ, миграцию с OpenClaw и постепенное расширение границ.
Как мессенджер превратился в пульт управления серверной инфраструктурой: алерты, публикации, мониторинг и управление процессами — всё в одном чате с AI агентом.
DeepSeek V4 вышел скучно, уронил цены в 4 раза — и за два месяца тихо занял первое место на OpenRouter. Революция — не всегда взрыв, иногда это оползень.
Я пересчитал свои подписки на ИИ: пять платных, три бесплатных и $320 в месяц. Почему я не сокращаю этот зоопарк инструментов и что на самом деле покупаю.
Почему вайбкодинг стал инвестицией: вместо бесконечных подписок на SaaS можно собирать свои инструменты под реальные процессы.
Hermes выходит за пределы Telegram: один агент должен жить в мессенджере, терминале и на рабочем столе, не теряя контекст.
Запуск продукта нельзя свести к дате: нужна система готовности, где видно критерии, риски и реальное состояние команды.
Claude Code с Opus 4.8 как операционная система агентной разработки: важны уже не отдельные ответы, а рабочие потоки.
Как память между сессиями помогает ИИ агенту не начинать с нуля: решения, контекст и ошибки должны переживать один диалог.
Почему Mivra должна расти через плагины: ядро не обязано знать всё, если расширения могут добавлять возможности без хаоса.
API становится новым интерфейсом: для ИИ агентов важны не кнопки на экране, а понятные действия, параметры и ответы системы.
Почему четыре задачи в день честнее подсчёта часов: главный расход в работе — не время, а переключения между контекстами.
Почему TaskFlow должен говорить «стоп»: планирование дня начинается не со списка задач, а с честного бюджета времени.
Один день с Кодексом на реальном проекте 7Lamp ERP: где ИИ для кода уже взрослеет, а где человеку всё ещё нужен контроль.
Почему навыки для агентов улучшают код: модель важна, но стабильный процесс, проверки и инструкции влияют не меньше.
Почему ИИ агенту нужна не просто память, а карта проекта: связи между файлами важнее огромного окна контекста.
Миллион токенов не заменяет память: большой контекст помогает думать, но не спасает от хаоса без структуры и гигиены проекта.
Правило двух минут против мелких хвостов: если действие быстрое, его дешевле сделать сразу, чем хранить в голове.
Полгода вайбкодинга: путь от первых экспериментов с GPT 3.5 до собственной ERP и нового способа создавать рабочие системы.
Что я понял после двух лет найма без HR: подбор людей — это отдельный процесс, который нельзя тащить на себе между делом.
Заметка об обновлении Hermes Agent: почему сложные технические правки лучше поручать агенту, а человеку оставить контроль и проверку.
Почему Markdown остаётся самым живучим форматом для заметок, документации и личного архива: его читают и люди, и машины.
Философия малого изменения: ежедневные небольшие эксперименты накапливаются в опыт, инструменты и настоящую экспертизу.
Почему сайту журнала нужен API: агентам важен не красивый экран, а понятный способ публиковать, искать и связывать знания.
Hermes Agent как рабочий слой между мыслью и действием: не чат ради ответов, а посредник, который умеет выполнять задачи.
Что нужно личному сайту для индексации: нормальные адреса, карта сайта, метаданные и страницы, которые видит поисковик.
Почему клавиатура стала узким местом между мыслью и машиной, и как диктовка меняет скорость работы с идеями.
Как голосовой ввод через Gemini снял барьер между мыслью и планом: задача фиксируется быстрее, чем успевает потеряться.
Правило трёх повторений: если задача повторилась три раза, её пора автоматизировать, документировать или вынести в процесс.
Как Журнал Знаний превращает хаотичные заметки из Telegram в публичные уроки, архив решений и основу для работы агентов.
Почему я выбрал Markdown вместо мини CMS для личного журнала: меньше магии, больше контроля и проще долгоживущий архив.