Китайская компания DeepSeek готовит к релизу новую модель V4 с улучшенными возможностями в программировании. По данным инсайдеров, она может превзойти конкурентов от OpenAI и Anthropic.
Китайская компания DeepSeek планирует выпустить модель V4 в середине февраля 2026 года, вероятно, около 17 февраля — на китайский Новый год. Об этом сообщает The Information со ссылкой на два источника, знакомых с планами компании. Новая модель сфокусирована на задачах программирования.
По результатам внутренних тестов DeepSeek, модель V4 превосходит Claude от Anthropic и серию GPT от OpenAI в задачах программирования, особенно при обработке очень длинных промптов с кодом. Однако публичных бенчмарков пока не опубликовано, и DeepSeek не подтвердила эту информацию официально.
Чтобы стать лидером, V4 должна превзойти Claude Opus 4.5, который в данный момент держит рекорд в SWE-bench Verified с результатом 80.9%. Секретным оружием DeepSeek может стать технология Manifold-Constrained Hyper-Connections (mHC), описанная в исследовательской работе от 1 января. Метод решает фундаментальную проблему масштабирования больших языковых моделей — как расширять модель без потери стабильности при обучении.
Вэй Сунь (Wei Sun), главный аналитик по ИИ в Counterpoint Research, назвала mHC «поразительным прорывом», который позволяет DeepSeek «обходить ограничения вычислительных мощностей и совершать скачки в интеллекте» даже с ограниченным доступом к передовым чипам из-за американских экспортных ограничений.
Предыдущая модель DeepSeek R1, выпущенная в январе 2025 года, обошла модель o1 от OpenAI по бенчмаркам математики и рассуждений, при этом обойдясь в разработке всего $6 миллионов — в 68 раз дешевле конкурентов. Модель V3, выпущенная в декабре 2024, показала 90.2% на бенчмарке MATH-500, превзойдя 78.3% у Claude.

