DeepSeek выпустила обновлённую версию модели R1 с серьёзными улучшениями
Ранее в этом году китайский стартап DeepSeek произвёл настоящий фурор среди инструментов для работы с искусственным интеллектом. Компания выпустила свободную и открытую модель R1, которая по возможностям рассуждения и кодирования не уступала решениям таких гигантов, как OpenAI, Anthropic и Google.
Помимо открытости и высокой производительности, модель DeepSeek отличалась уникальной эффективностью. Её обучение требовало гораздо меньше ресурсов благодаря использованию улучшенной архитектуры смеси экспертов (MoE), современных методов сжатия, технологии одновременного предсказания нескольких токенов и методики обучения, построенной на приоритетах обучения с подкреплением (RL-first).
DeepSeek-R1-0528: что нового?
28 мая DeepSeek представила первое крупное обновление модели — DeepSeek-R1-0528. Обновлённая модель и её веса уже доступны на платформе Hugging Face. Несмотря на отсутствие официальных тестов и бенчмарков от самой компании, результаты первых проверок, опубликованных энтузиастами и разработчиками, выглядят весьма впечатляюще.
Согласно LiveCodeBench, специализированному бенчмарку для оценки написания кода крупными языковыми моделями, DeepSeek-R1-0528 заняла 4-е место, обойдя такие популярные модели, как o4 Mini (Low), Grok-3-mini (High) и Gemini 2.5 Flash Preview.
«DeepSeek снова в деле…
Новая версия DeepSeek R1 невероятна в задачах программирования.
Я дал модели задание написать систему подсчёта очков для слов.
Модель кратко обдумала задачу и сразу выдала два файла: чистый код и рабочие тесты.
Всё сработало идеально с первой попытки…»
Haider. (@slow_developer)
Другой пользователь X, @chetaslua, отметил, что новая версия DeepSeek R1 способна вести глубокие и продолжительные рассуждения, по уровню напоминающие решения Google. Модель может «думать» над сложной задачей от 30 минут до часа, в зависимости от её сложности.
«R1-0528 словно стала осознающей
Главное в новом обновлении DeepSeek R1-0528:
Chetaslua (@chetaslua)
- Глубокое рассуждение на уровне моделей Google
- Улучшенные тексты – более естественные и качественно отформатированные
- Особый стиль рассуждений – не только быстрый, но и вдумчивый
- •Продолжительные размышления – до 60 минут…
Как протестировать новую модель?
Для тех, кто хочет самостоятельно испытать возможности новой версии DeepSeek R1-0528, модель доступна на платформах OpenRouter и LMArena.
Обновления программ, что нового
• Утечка: Snapdragon 8 Elite Gen 6 может получить систему охлаждения от Samsung Exynos
• Утечка: Honor 600 может получить аккумулятор емкостью 9000 мАч
• Стартовала бета-версия HyperOS 3.1 для 10 новых устройств: номера сборок для России и глобального рынка
• Покупатели Яндекс Маркета смогут создавать ИИ-подборки товаров под конкретные задачи
• Обновления безопасности Samsung за февраль 2026 года: список устройств с ежемесячными патчами
• OpenAI представляет новую модель для программирования GPT-5.3-Codex — на 25% быстрее предшественника
