Витрина и кухня: как DeepSeek стала скрытым цехом ИИ-индустрии
13-е место по тестам — 1-е по делу. Парадокс китайской лаборатории, которая выигрывает не там, где смотрят.
Если открыть сегодня сводный рейтинг интеллекта от Artificial Analysis, картина привычная: наверху — Claude Fable 5 и Opus 4.8 от Anthropic, за ними GPT-5.5, где-то поодаль Gemini и GLM. DeepSeek V4 Pro — на 13-м месте. Середняк фронтир-пака. Отставание от лидера — 27%.
Теперь откройте рейтинг реального потребления на OpenRouter — крупнейшей бирже ИИ-моделей. DeepSeek держит три модели в топ-12. По сумме токенов это самый используемый провайдер на платформе. Ближайший конкурент — MiniMax — обгоняет лишь за счёт одной модели.
13-е место по уму. 1-е — по делу.
Эта статья — о том, почему так получилось. И почему это не случайность, а результат устройства, принципиально иного от всего, что делают OpenAI, Anthropic и Google.
Хедж-фонд как инкубатор
Начнём с частой путаницы. DeepSeek часто называют «лабораторией, созданной квантовым хедж-фондом». В русском это звучит как научная фантастика — квантовые вычисления, кубиты, суперпозиции. На самом деле quant — это quantitative, количественный. Никаких квантовых компьютеров. Только статистика, математика и видеокарты.
Фонд-родитель называется High-Flyer (幻方), основан в 2016 году в Ханчжоу математиком Ляном Вэньфэном. Его суть — алгоритмический трейдинг: решения о сделках принимает не человек, а модель глубокого обучения, которая анализирует миллионы рыночных данных и совершает тысячи операций в секунду.
К 2021 году High-Flyer торговал исключительно на ИИ и успел закупить около 10 000 Nvidia A100 — до того, как США ввели экспортные ограничения на чипы для Китая. Эти видеокарты, купленные для биржевого трейдинга, и стали тем самым «бесплатным» железом, на котором позже обучалась DeepSeek. Кластер Fire-Flyer 2 (бюджет ¥1 млрд) был построен, настроен и окуплен ещё до того, как существовала сама лаборатория.
В апреле 2023 года High-Flyer объявил о создании AGI-исследовательской лаборатории. В июле она выделилась в отдельную компанию — DeepSeek. Венчурные фонды отказались вкладываться: не видели быстрого «экзита». Лян лично удержал 84% и принял все решения сам.
Почему нет подписки
У OpenAI, Anthropic и Google есть общая черта: им нужно зарабатывать. Подписка ChatGPT Plus, корпоративные контракты Claude, интеграции Gemini в Google Cloud — это не прихоть, а условие выживания. За спиной у них инвесторы с оценками в сотни миллиардов, которым нужно показать рост выручки.
У DeepSeek этого давления нет. Её единственный «инвестор» — прибыльный хедж-фонд, который уже оплатил железо. Лян Вэньфэн неоднократно формулировал цель как AGI-исследования, а не коммерциализацию. Financial Times (Zijing Wu, март 2025) выразила это дословно в заголовке: «DeepSeek focuses on research over revenue in contrast to Silicon Valley».
Без продуктового давления нет нужды в продуктовых командах, UX-циклах, саппорте, энтерпрайз-продажах, контент-модерации под регулятора. DeepSeek официально заявляла: коммерциализация не в приоритете. Это позволяет обойти ряд положений китайского регулирования ИИ, нацеленных именно на потребительские продукты.
Монетизация всё-таки есть — но не подписочная, а инфраструктурная: доступ к API по демпинговым ценам. DeepSeek продаёт не продукт конечному пользователю, а вычислительную мощность разработчикам. Это модели Together или Fireworks, а не ChatGPT.
Как санкции создали гения
Парадокс всей истории: американские ограничения на экспорт чипов стали лучшим, что случилось с DeepSeek.
Когда у OpenAI и Google есть условно бесконечный парк H100, соблазн очевиден — «залей больше вычислений». Когда у тебя 10 000 урезанных H800 вместо пятидесяти тысяч H100, ты вынужден оптимизировать каждый байт памяти и каждую операцию. Из этого ограничения выросли главные технические инновации DeepSeek:
- MLA (Multi-head Latent Attention) — сжатие ключевого кэша через латентные векторы. V2 стал вчетверо дешевле в эксплуатации.
- DeepSeekMoE — Mixture-of-Experts с микро-экспертами и «общими» экспертами. На каждый токен активируется лишь ~3% параметров.
- FP8 mixed-precision training — обучение в 8-битном формате на масштабе фронтирной модели. Все думали, что нельзя. DeepSeek доказала, что можно.
- DualPipe — двусторонний pipeline parallelism, минимизирующий простой GPU.
- GRPO — упрощённый метод reinforcement learning, ставший стандартом для reasoning-тюнинга.
Список не исчерпывающий, но показательный. Ни одна из этих идей не родилась бы, если бы у лаборатории был безлимитный вычислительный бюджет. Санкции задумывались, чтобы затормозить китайский ИИ. Они его ускорили — в эффективности.
К этому добавилась команда. DeepSeek нанимает не звёзд с десятилетним стажем в Big Tech, а таланты — свежих выпускников Цинхуа, Пекинского и Чжэцзянского университетов, олимпиадников, математиков и физиков. Команда из ~160 человек. Средняя зарплата — до ¥2 млн ($280K). Никаких продукт-менеджеров, диктующих компромиссы. Только исследовательский фокус.
Бенчмарки против реальности
Вернёмся к началу. Почему DeepSeek — 13-я по интеллекту, но 1-я по потреблению?
Потому что бенчмарки измеряют «насколько умная». Токен-трафик измеряет «насколько полезная по соотношению цена/качество». Это две разные оси.
Цены DeepSeek на свой собственный API (не через OpenRouter, а напрямую): V4 Flash — $0.14/1M входных токенов, $0.28/1M выходных. V4 Pro — $0.435 и $0.87 соответственно. Claude Opus 4.8 стоит в десятки раз дороже при отрыве в интеллекте, который в большинстве реальных задач не ощущается.
Результат закономерен. На OpenRouter за неделю DeepSeek пропускает через свои модели примерно 7,8 трлн токенов. Три модели в топ-12. Hermes Agent — крупнейший потребитель на платформе — почти полностью работает на DeepSeek V4 Flash и Pro.
Сколько это в деньгах
Прикидка по недельному трафику с учётом типичного для агентских нагрузок распределения (85% вход, 15% выход, половина входа попадает в кэш):
- V4 Flash (4,53T): ~$465K
- V4 Pro (2,19T): ~$695K
- V3.2 (1,12T): ~$277K
Итого ~$1,4 млн в неделю, или $70–110 млн в год с одного OpenRouter.
Цифра звучит крупно, но в масштабах фронтир-ИИ — скромно. Выручка OpenAI за 2025 год — около $12–15 млрд. Разрыв в сто раз. Но OpenRouter для DeepSeek — не основной канал: прямой API, облачные партнёрства с Huawei и Cambricon, корпоративные контракты — всё это за кадром.
Главная ценность OpenRouter — видимость. Быть #1 по потреблению на крупнейшей бирже моделей — это сигнал для всей экосистемы: разработчиков, талантов, партнёров. Это и есть тот «маховик», который крутит всё остальное.
Что мы на самом деле видим
DeepSeek — не «лучшая модель в мире». По чистому интеллекту она давно не лидер. Западные лаборатории за полтора года существенно оторвались: Claude, GPT и Gemini ушли в reasoning и агентность, где DeepSeek пока догоняет.
Но DeepSeek — лучшая модель для экосистемы. Открытые веса, демпинговые цены, миллионный контекст, MIT-лицензия. Она стала водопроводом, по которому течёт большая часть реального ИИ-трафика. Никто не хвалит трубы, но без них ничего не работает.
Это и есть главный урок. ИИ-индустрия привыкла мериться одной осью — «умнее». DeepSeek показала, что есть вторая ось — «полезнее», и на ней можно доминировать, вообще не претендуя на корону. Витрина блестит, но кухня кормит.