DeepSeek R1
Открытая reasoning-модель DeepSeek уровня OpenAI o1 — но дешевле в десятки раз. MoE 671B (37B активных), лицензия MIT, обновление R1-0528 (май 2025) подтянуло качество к o3 и Gemini 2.5 Pro. Работает в России без VPN, есть 6 дистиллированных версий для слабого железа.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — DeepSeek
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Доступ к R1 в режиме DeepThink на сайте
- Видна цепочка рассуждений
- Работает в России без VPN
- Лимит запросов в свободном доступе
- deepseek-reasoner (R1) через api.deepseek.com
- Контекст 128K, вывод до 64K (режим мышления)
- Off-peak скидки до 50–75% ночью
- JSON Output, Tool Calls
- Облачный доступ через сторонних провайдеров
- OpenRouter принимает оплату криптовалютой (для РФ)
- Маршрутизация и резервирование между хостами
- OpenAI-совместимый API
- Веса на HuggingFace под лицензией MIT
- Полная 671B или дистилляции 1.5B–70B
- Дистилляции на базе Qwen2.5 и Llama 3
- Приватный reasoning без отправки данных
Плюсы и минусы
Подробный обзор
Что такое DeepSeek R1
DeepSeek R1 — открытая модель рассуждений (reasoning) от китайской компании DeepSeek, выпущенная 20 января 2025 года. Её релиз стал событием года: модель показала качество на уровне OpenAI o1 в математике, коде и логике, но при этом распространяется с открытыми весами под максимально свободной лицензией MIT и стоит в десятки раз дешевле. R1 — это MoE-модель на 671 миллиард параметров, из которых на токен активны только 37 миллиардов.
Чем reasoning отличается от обычной модели
В отличие от обычных чат-моделей, R1 перед ответом строит развёрнутую цепочку рассуждений (chain-of-thought) — пошагово разбирает задачу, проверяет себя, отбрасывает неверные ходы. Это резко поднимает качество в математике, логике и сложном коде. R1 показывает эту цепочку пользователю — видно, как модель пришла к ответу, что удобно для проверки. Цена за это — многословность: на сложную задачу модель тратит десятки тысяч токенов «размышлений».
Обновление R1-0528 (май 2025)
В мае 2025 вышло крупное обновление DeepSeek-R1-0528. За счёт большего объёма вычислений и улучшенного пост-тренинга качество подтянулось к ведущим моделям — OpenAI o3 и Gemini 2.5 Pro. Глубина рассуждений выросла: средний расход на задачу AIME почти удвоился (с 12K до 23K токенов). Важно для практики — галлюцинации сократились на 45–50% в задачах переписывания, суммаризации и понимания текста.
Бенчмарки и цена
- AIME 2024: 79.8% pass@1 — олимпиадная математика
- MATH-500: 97.3% — задачи продвинутого уровня
- Codeforces: 2029 Elo — соревновательное программирование
- GPQA Diamond: 71.5% — научные вопросы PhD-уровня
Главный козырь — цена. R1 даёт reasoning уровня o1 примерно за $2.19 за 1M токенов против ~$60 у OpenAI o1. Через DeepSeek API — около $0.55 вход / $2.19 выход за 1M (плюс ночные off-peak скидки), через OpenRouter и Together — около $0.70/$2.50. Контекст 128K токенов, вывод до 64K в режиме мышления.
Дистилляции для слабого железа
Полная 671B-модель требует серверной фермы, но DeepSeek выпустила 6 дистиллированных версий — 1.5B, 7B, 8B, 14B, 32B и 70B. Младшие (1.5B–32B) построены на базе Qwen2.5, версии 8B и 70B — на Llama 3. Это значит, что reasoning-модель можно запустить даже на потребительской видеокарте: например, 7B или 14B — на RTX 3060/4070, а 32B — на RTX 4090. Все под лицензией MIT.
Доступность в России
DeepSeek R1 работает в России без VPN — китайский сервис chat.deepseek.com не блокируется, веса свободно качаются с HuggingFace. Это выгодно отличает R1 от ChatGPT, Claude и Gemini. Модель хорошо понимает русский язык. Ограничение — оплата API: российские карты МИР напрямую не принимаются, нужна крипта (удобно через OpenRouter) либо зарубежная карта. Веб-версия на chat.deepseek.com бесплатна и оплаты не требует. Также стоит учитывать цензуру на политически чувствительные для Китая темы — модель уклоняется от ряда вопросов.