2026-06-18 insight

Витрина и кухня: как DeepSeek стала скрытым цехом ИИ-индустрии

hero

13-е место по тестам — 1-е по делу. Парадокс китайской лаборатории, которая выигрывает не там, где смотрят.

Если открыть сегодня сводный рейтинг интеллекта от Artificial Analysis, картина привычная: наверху — Claude Fable 5 и Opus 4.8 от Anthropic, за ними GPT-5.5, где-то поодаль Gemini и GLM. DeepSeek V4 Pro — на 13-м месте. Середняк фронтир-пака. Отставание от лидера — 27%.

Теперь откройте рейтинг реального потребления на OpenRouter — крупнейшей бирже ИИ-моделей. DeepSeek держит три модели в топ-12. По сумме токенов это самый используемый провайдер на платформе. Ближайший конкурент — MiniMax — обгоняет лишь за счёт одной модели.

13-е место по уму. 1-е — по делу.

Эта статья — о том, почему так получилось. И почему это не случайность, а результат устройства, принципиально иного от всего, что делают OpenAI, Anthropic и Google.

Хедж-фонд как инкубатор

Начнём с частой путаницы. DeepSeek часто называют «лабораторией, созданной квантовым хедж-фондом». В русском это звучит как научная фантастика — квантовые вычисления, кубиты, суперпозиции. На самом деле quant — это quantitative, количественный. Никаких квантовых компьютеров. Только статистика, математика и видеокарты.

Фонд-родитель называется High-Flyer (幻方), основан в 2016 году в Ханчжоу математиком Ляном Вэньфэном. Его суть — алгоритмический трейдинг: решения о сделках принимает не человек, а модель глубокого обучения, которая анализирует миллионы рыночных данных и совершает тысячи операций в секунду.

К 2021 году High-Flyer торговал исключительно на ИИ и успел закупить около 10 000 Nvidia A100 — до того, как США ввели экспортные ограничения на чипы для Китая. Эти видеокарты, купленные для биржевого трейдинга, и стали тем самым «бесплатным» железом, на котором позже обучалась DeepSeek. Кластер Fire-Flyer 2 (бюджет ¥1 млрд) был построен, настроен и окуплен ещё до того, как существовала сама лаборатория.

В апреле 2023 года High-Flyer объявил о создании AGI-исследовательской лаборатории. В июле она выделилась в отдельную компанию — DeepSeek. Венчурные фонды отказались вкладываться: не видели быстрого «экзита». Лян лично удержал 84% и принял все решения сам.

Почему нет подписки

У OpenAI, Anthropic и Google есть общая черта: им нужно зарабатывать. Подписка ChatGPT Plus, корпоративные контракты Claude, интеграции Gemini в Google Cloud — это не прихоть, а условие выживания. За спиной у них инвесторы с оценками в сотни миллиардов, которым нужно показать рост выручки.

У DeepSeek этого давления нет. Её единственный «инвестор» — прибыльный хедж-фонд, который уже оплатил железо. Лян Вэньфэн неоднократно формулировал цель как AGI-исследования, а не коммерциализацию. Financial Times (Zijing Wu, март 2025) выразила это дословно в заголовке: «DeepSeek focuses on research over revenue in contrast to Silicon Valley».

Без продуктового давления нет нужды в продуктовых командах, UX-циклах, саппорте, энтерпрайз-продажах, контент-модерации под регулятора. DeepSeek официально заявляла: коммерциализация не в приоритете. Это позволяет обойти ряд положений китайского регулирования ИИ, нацеленных именно на потребительские продукты.

Монетизация всё-таки есть — но не подписочная, а инфраструктурная: доступ к API по демпинговым ценам. DeepSeek продаёт не продукт конечному пользователю, а вычислительную мощность разработчикам. Это модели Together или Fireworks, а не ChatGPT.

Как санкции создали гения

Парадокс всей истории: американские ограничения на экспорт чипов стали лучшим, что случилось с DeepSeek.

Когда у OpenAI и Google есть условно бесконечный парк H100, соблазн очевиден — «залей больше вычислений». Когда у тебя 10 000 урезанных H800 вместо пятидесяти тысяч H100, ты вынужден оптимизировать каждый байт памяти и каждую операцию. Из этого ограничения выросли главные технические инновации DeepSeek:

MLA (Multi-head Latent Attention) — сжатие ключевого кэша через латентные векторы. V2 стал вчетверо дешевле в эксплуатации.
DeepSeekMoE — Mixture-of-Experts с микро-экспертами и «общими» экспертами. На каждый токен активируется лишь ~3% параметров.
FP8 mixed-precision training — обучение в 8-битном формате на масштабе фронтирной модели. Все думали, что нельзя. DeepSeek доказала, что можно.
DualPipe — двусторонний pipeline parallelism, минимизирующий простой GPU.
GRPO — упрощённый метод reinforcement learning, ставший стандартом для reasoning-тюнинга.

Список не исчерпывающий, но показательный. Ни одна из этих идей не родилась бы, если бы у лаборатории был безлимитный вычислительный бюджет. Санкции задумывались, чтобы затормозить китайский ИИ. Они его ускорили — в эффективности.

К этому добавилась команда. DeepSeek нанимает не звёзд с десятилетним стажем в Big Tech, а таланты — свежих выпускников Цинхуа, Пекинского и Чжэцзянского университетов, олимпиадников, математиков и физиков. Команда из ~160 человек. Средняя зарплата — до ¥2 млн ($280K). Никаких продукт-менеджеров, диктующих компромиссы. Только исследовательский фокус.

Бенчмарки против реальности

Вернёмся к началу. Почему DeepSeek — 13-я по интеллекту, но 1-я по потреблению?

Потому что бенчмарки измеряют «насколько умная». Токен-трафик измеряет «насколько полезная по соотношению цена/качество». Это две разные оси.

Цены DeepSeek на свой собственный API (не через OpenRouter, а напрямую): V4 Flash — $0.14/1M входных токенов, $0.28/1M выходных. V4 Pro — $0.435 и $0.87 соответственно. Claude Opus 4.8 стоит в десятки раз дороже при отрыве в интеллекте, который в большинстве реальных задач не ощущается.

Результат закономерен. На OpenRouter за неделю DeepSeek пропускает через свои модели примерно 7,8 трлн токенов. Три модели в топ-12. Hermes Agent — крупнейший потребитель на платформе — почти полностью работает на DeepSeek V4 Flash и Pro.

Сколько это в деньгах

Прикидка по недельному трафику с учётом типичного для агентских нагрузок распределения (85% вход, 15% выход, половина входа попадает в кэш):

V4 Flash (4,53T): ~$465K
V4 Pro (2,19T): ~$695K
V3.2 (1,12T): ~$277K

Итого ~$1,4 млн в неделю, или $70–110 млн в год с одного OpenRouter.

Цифра звучит крупно, но в масштабах фронтир-ИИ — скромно. Выручка OpenAI за 2025 год — около $12–15 млрд. Разрыв в сто раз. Но OpenRouter для DeepSeek — не основной канал: прямой API, облачные партнёрства с Huawei и Cambricon, корпоративные контракты — всё это за кадром.

Главная ценность OpenRouter — видимость. Быть #1 по потреблению на крупнейшей бирже моделей — это сигнал для всей экосистемы: разработчиков, талантов, партнёров. Это и есть тот «маховик», который крутит всё остальное.

Что мы на самом деле видим

DeepSeek — не «лучшая модель в мире». По чистому интеллекту она давно не лидер. Западные лаборатории за полтора года существенно оторвались: Claude, GPT и Gemini ушли в reasoning и агентность, где DeepSeek пока догоняет.

Но DeepSeek — лучшая модель для экосистемы. Открытые веса, демпинговые цены, миллионный контекст, MIT-лицензия. Она стала водопроводом, по которому течёт большая часть реального ИИ-трафика. Никто не хвалит трубы, но без них ничего не работает.

Это и есть главный урок. ИИ-индустрия привыкла мериться одной осью — «умнее». DeepSeek показала, что есть вторая ось — «полезнее», и на ней можно доминировать, вообще не претендуя на корону. Витрина блестит, но кухня кормит.

Витрина и кухня: как DeepSeek стала скрытым цехом ИИ-индустрии

Хедж-фонд как инкубатор

Почему нет подписки

Как санкции создали гения

Бенчмарки против реальности

Сколько это в деньгах

Что мы на самом деле видим

Похожие записи

Тихая революция DeepSeek: как V4 переписал правила игры без фейерверков

Как я перестал бояться агентов и установил Hermes Desktop на рабочий компьютер

От мессенджера к рабочему столу и обратно

Claude Code как операционная система агентной разработки