DeepSeek, китайская компания, занимающаяся искусственным интеллектом, объявила об обновлении своего ИИ-чатбота, заявив, что теперь он может предложить улучшенную общую логику, математику и программирование при сниженном уровне галлюцинаций.
По данным DeepSeek, обновленная модель — DeepSeek-R1-0528 — «значительно улучшила глубину рассуждений и возможности вывода». Стартап заявил, что общая производительность модели теперь «приближается к показателям ведущих моделей, таких как O3 и Gemini 2.5 Pro».
Сравнение производительности языковых моделей по шести бенчмаркам. Источник: DeepSeek.
Дебют чат-бота R1 от DeepSeek в январе вызвал шок в отрасли ИИ. Обучение первой модели ИИ обошлось компании в 6 миллионов долларов, а ее производительность была сопоставима с ведущими моделями ИИ, обученными на значительно больших суммах капитала.
По данным Business of Apps, DeepSeek был загружен 75 миллионов раз с момента запуска и имел 38 миллионов активных пользователей в месяц (MAU) по состоянию на апрель. В недавнем антимонопольном иске Google подсчитала, что Gemini достиг 350 миллионов активных пользователей в марте, в то время как ChatGPT от OpenAI заявил о 600 миллионах активных пользователей в том же месяце.
Китайско-американская гонка в сфере ИИ набирает обороты
Правительство США планирует ограничить продажу передового программного обеспечения для проектирования микросхем в Китай. Согласно отчету Bloomberg, этот шаг направлен на ограничение возможностей Китая развивать свои внутренние возможности по производству полупроводников.
Полупроводники имеют решающее значение для широкого спектра технологий, включая искусственный интеллект, где они служат аппаратной основой для обучения и запуска сложных моделей.
В первые месяцы 2025 года также появились новые китайские модели искусственного интеллекта, такие как T1 от Tencent и Qwen3 от Alibaba, что подстегнуло гонку за ИИ.