DeepSeek: китайский вызов OpenAI и новый этап в развитии ИИ
10.02.2025 | 12:45 |10–11 февраля в Париже проходит «AI Action Summit 2025», где одной из центральных тем стал стремительный взлет китайской компании DeepSeek. Основанный менее двух лет назад стартап совершил прорыв, представив «DeepSeek R1» — ИИ-модель, которая при значительно меньших затратах демонстрирует уровень рассуждений, сравнимый с «OpenAI O1».
Однако главное отличие DeepSeek — ставка на открытый исходный код, что позволяет пользователям бесплатно скачивать и развертывать модели на локальных устройствах. Этот шаг вызвал бурную реакцию в технологическом мире. Более того, анонс DeepSeek R1 сказался даже на фондовом рынке — акции NVIDIA резко пошли вниз. Это особенно примечательно, учитывая, что Китай сталкивается с экспортными ограничениями США, затрудняющими доступ к передовым ИИ-чипам.
В рамках специального цикла статей «Catalyst DeepSeek» обозреватель CGTN Ян Чжао анализирует, как компании удалось добиться столь впечатляющих результатов.
Максимальная эффективность при ограниченных ресурсах
DeepSeek разрабатывает модели в условиях, когда китайские компании лишены доступа к самым мощным чипам NVIDIA (например, H100). Однако стартап использует инновационные методы, позволяющие минимизировать потери вычислительных мощностей. Среди них:
MoE (Mixture of Experts) – метод, при котором задействуются только нужные части нейросети, снижая нагрузку.
DeepSeekMLA (Multi-head Latent Attention) – подход, экономящий память за счет фокусировки на ключевой информации.
FP8 вместо BF16 и FP32 – оптимизация точности, позволяющая снизить объем вычислений без значительных потерь.
Более того, DeepSeek отказалась от стандартного метода работы с GPU через CUDA и перешла на PTX (Parallel Thread Execution), что позволило компенсировать ограничения китайской версии чипов NVIDIA (H800).
Больше, чем просто технология
DeepSeek не просто создает передовые ИИ-модели — компания меняет сам подход к развитию технологий. Ее генеральный директор Лян Вэньфэн ранее возглавлял «High-Flyer», один из крупнейших квантитативных хедж-фондов Китая, где ИИ управлял инвестициями без участия трейдеров. Такой опыт сформировал философию DeepSeek: вместо закрытых экосистем — open-source, вместо монетизации на ранних этапах — развитие сообщества и привлечение лучших специалистов.
«Когда появляются революционные технологии, замкнутая модель дает лишь временное конкурентное преимущество. Настоящая сила — в росте команды и культуре постоянных инноваций», – подчеркивает Лян Вэньфэн. Этот подход выделяет DeepSeek на фоне таких компаний, как OpenAI, которая отказалась от открытых моделей в пользу закрытых решений. Именно поэтому успех DeepSeek стал не только инженерным прорывом, но и важным культурным сдвигом в AI-индустрии.
Что значит успех DeepSeek для будущего AI?
DeepSeek стала символом технологических перемен в Китае. Если раньше местные компании догоняли Запад в области ИИ-приложений, то теперь Китай начинает задавать тренды в базовых технологиях. Согласно анализу CGTN, это стало возможным благодаря системным реформам в Китае, направленным на инновации и интеграцию науки с бизнесом. Такой подход позволил DeepSeek конкурировать даже в условиях санкционного давления. В этом контексте успех DeepSeek может изменить глобальный рынок. Компания уже доказала, что технологический прорыв возможен даже без доступа к топовым чипам NVIDIA. Более того, открытая архитектура DeepSeek снижает зависимость от нескольких технологических гигантов и делает ИИ доступнее.
Исходя из анализа CGTN, можно сказать точно - резонанс вокруг DeepSeek подтверждает, что Китай становится не только потребителем, но и активным разработчиком передовых ИИ-решений. Это подчеркивает более масштабный тренд — государственная поддержка инноваций, создание технологической инфраструктуры и формирование экосистемы стартапов, способных конкурировать с мировыми лидерами.
При этом вопрос о глобальном влиянии DeepSeek на ИИ-индустрию остается открытым. Сможет ли компания сохранить свою открытость, когда столкнется с коммерческими вызовами? Будет ли ее модель действительно массово применяться за пределами Китая? Ясно одно: технологии DeepSeek становятся важной темой обсуждения, а ее стратегия open-source — серьезным вызовом традиционным бизнес-моделям в индустрии ИИ.