2026-06-06 insight

Тихая революция DeepSeek: как V4 переписал правила игры без фейерверков

#deepseek #ai-модели #openrouter #китай #рефлексия

Обложка: тихая революция DeepSeek

Взрыв января 2025

Год назад мир услышал гром. DeepSeek — китайская лаборатория, о которой большинство западных разработчиков знали постольку-поскольку — выпустила сразу две модели, и обе стали откровением.

DeepSeek V3: 671 миллиард параметров, 37 миллиардов активированных на каждый токен. Архитектура Mixture-of-Experts, открытые веса и качество, которое смотрело в глаза GPT-4o — при цене в десятки раз ниже. А потом был R1: первая reasoning-модель, обученная через чистое reinforcement learning без supervised fine-tuning. Chain-of-thought возникал сам — модель училась думать.

Эффект был как от землетрясения. NVIDIA потеряла $600 миллиардов капитализации за один торговый день. Вся индустрия вдруг осознала: китайские модели не просто «подтягиваются» — они наравне с лучшими американскими, открытые и стоят копейки. Хайп был невероятный. Каждый второй твит в AI-Твиттере — про DeepSeek. Каждый третий — про то, что «OpenAI и Anthropic в беде».

Год китайских попыток

Потом хайп ушёл, а реальность осталась. И реальность была такой: да, DeepSeek показал, что можно. Но за целый год ни один другой китайский игрок не смог повторить этот эффект.

Alibaba выпустила Qwen 3, потом 3.5, потом 3.6 — модель за моделью, каждая чуть лучше предыдущей. Zhipu делала GLM-4, GLM-4.5, GLM-5. Xiaomi — MiMo. MiniMax — целую линейку от M1 до M3. Tencent — Hunyuan и Hy3. Все открытые. Все дешевле американских альтернатив. Все «почти на уровне».

Но — и это ключевое «но» — подавляющее большинство разработчиков осталось на американских моделях. Claude для кода. GPT для агентов. Gemini для всего остального. Китайские модели попробовали, кивнули и вернулись к привычному. Почему? Инерция. Экосистемы. Харнесы заточены под американские API. Документация на китайском. Токены с кириллицей работают хуже. Тысячи мелких причин, каждая из которых по отдельности ерунда, а вместе — бетонная стена.

Революция, о которой все говорили, не состоялась. Точнее, она была — но только в умах. На практике люди продолжали платить $3–15 за миллион токенов Sonnet, когда могли платить $0.10 за Flash. Привычка — страшная штука.

Самый скучный релиз весны

DeepSeek V4 Pro вышел в апреле 2026 года. И прошёл… незаметно.

Технически — монстр. 1.6 триллиона параметров, 49 миллиардов активированных. Контекст — миллион токенов. Новая гибридная архитектура внимания: Compressed Sparse Attention + Heavily Compressed Attention. При 1M контексте модель требует всего 27% FLOPs и 10% KV-кеша по сравнению с V3.2. Manifold-Constrained Hyper-Connections для стабильности обучения. Muon-оптимизатор. Обучено на 32 триллионах токенов.

Но бенчмарки — и тут началось разочарование. Gemini 3.1 Pro берёт GPQA Diamond на 94.3% против 90.1% у V4 Pro Max. MMLU-Pro: 91.0 vs 87.5. SimpleQA: 75.6 vs 57.9. По чистому знанию — Google впереди. По агентским задачам — GPT-5.4 лидирует в TerminalBench (75.1 vs 67.9) и Toolathlon (54.6 vs 51.8). Где-то DeepSeek побеждает — LiveCodeBench 93.5, Codeforces rating 3206 — но это не «разрыв шаблона».

А сверху — харнесы не были готовы. Новая архитектура, новый chat template (не Jinja, а свой Python encoding), новый формат — всё это означало, что в первые недели после релиза интеграции сыпались. OpenRouter, Cursor, Continue — все ловили баги. Люди попробовали, пожали плечами и ушли.

Релиз прошёл скучно. Твиттер не взорвался. NVIDIA не упала. Мир повернулся и пошёл дальше.

Ход конём: ×4 дешевле навсегда

И тут DeepSeek сделал то, чего от него не ожидали. Не стал ждать, пока мир оценит бенчмарки. Не стал доказывать, что модель лучше конкурентов. Вместо этого — уронил цены. В четыре раза.

DeepSeek V4 Flash: $0.10 за миллион входных токенов, $0.20 за миллион выходных. V4 Pro: $0.43/$0.87. Для сравнения — Claude Sonnet 4.6 берёт $3/$15. Claude Opus 4.8 — $5/$25. GPT-5.4 — $2.50/$15. DeepSeek V4 Flash в 30 раз дешевле Sonnet на входе и в 76 раз — на выходе. И это не промо-цена. DeepSeek сказал: такие цены будут навсегда.

Подумайте об этом секунду. Модель, которая входит в топ-5 на LiveCodeBench, пишет код на уровне Codeforces rating 3206, держит миллион токенов контекста — и стоит практически бесплатно. Не «дешевле конкурентов». Бесплатно по ощущениям. $0.10 за миллион токенов — это когда вы можете прогнать всю «Войну и мир» через модель за цент.

Оползень

И вот тут началось самое интересное. Не сразу. Не с взрыва. Медленно, как оползень.

Сначала подтянулись харнесы. OpenRouter починил интеграции. Cursor добавил поддержку. Комьюнити написало библиотеки для нового encoding. Потом — первые смельчаки начали переводить продакшн-нагрузку. Почему бы нет? Если модель «достаточно хороша» — а V4 Flash объективно достаточно хороша для 80% задач — зачем платить в 30 раз больше?

А потом пришла статистика. OpenRouter за текущий месяц:

DeepSeek V4 Flash — 3.12 триллиона токенов. Первое место.
Hy3 от Tencent — 2.73T. Второе место.
MiMo-V2.5 от Xiaomi — 2.29T. Третье.
Owl Alpha — 1.92T. Четвёртое.
Claude Sonnet 4.6 — 1.77T. Пятое.
MiniMax M3 — 1.66T.
DeepSeek V4 Pro — 1.46T.
DeepSeek V3.2 — 1.11T.

Три из четырёх верхних строчек — китайские модели. Первая американская модель — на пятом месте и почти в два раза отстаёт от лидера. DeepSeek V4 Flash прокачал больше токенов, чем Claude Sonnet 4.6 и Claude Opus 4.7 вместе взятые.

Это не хайп. Это не твиты. Это реальные токены, реальные задачи, реальные деньги. Рынок проголосовал кошельком.

Что это значит

Мы привыкли думать о революциях как о моментах. Вот был день X — и всё изменилось. Так было с V3/R1 в январе 2025. Так было с ChatGPT в ноябре 2022. Взрыв, хайп, мир никогда не будет прежним.

Но V4 — другая история. V4 — это оползень. Медленный, тихий, необратимый. День за днём. Интеграция за интеграцией. Доллар за долларом.

DeepSeek не побил Gemini на бенчмарках. Не превзошёл Claude в агентских задачах. Не переписал GPT-5 в рассуждениях. Но он и не должен был. Он сделал кое-что гораздо более мощное: показал, что «достаточно хорошая» модель при цене в 30 раз ниже — это не нишевый продукт для экономных. Это новый стандарт.

Когда модель стоит $0.10 за миллион токенов и пишет код лучше большинства конкурентов — вопрос «а стоит ли переключаться?» превращается в «а почему я ещё не переключился?». Рынок отвечает сам. 3.12 триллиона токенов в месяц — это ответ.

Революция — не всегда взрыв. Иногда это оползень. Тихо, медленно, и когда вы оглядываетесь — гора уже сдвинулась.

Тихая революция DeepSeek: как V4 переписал правила игры без фейерверков

Взрыв января 2025

Год китайских попыток

Самый скучный релиз весны

Ход конём: ×4 дешевле навсегда

Оползень

Что это значит

Похожие записи

Витрина и кухня: как DeepSeek стала скрытым цехом ИИ-индустрии

Еженедельная сводка: неделя 25

Еженедельная сводка: неделя 24

Еженедельная сводка: неделя 23