DeepSeek
Китайская AI-компания, разрабатывающая большие языковые модели (LLM) с открытыми весами для задач чата, программирования и рассуждений.
О компании
DeepSeek (полное название — Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.) — китайская компания в области искусственного интеллекта, основанная в июле 2023 года Лян Вэньфэном, сооснователем хедж-фонда High-Flyer. Компания базируется в Ханчжоу (провинция Чжэцзян) и полностью финансируется фондом High-Flyer, без привлечения венчурного капитала.
DeepSeek специализируется на разработке больших языковых моделей с открытыми весами. Первая модель — DeepSeek Coder — была выпущена в ноябре 2023 года. В январе 2025 года компания выпустила модель DeepSeek-R1 и одноимённое чат-приложение, которое стало самым скачиваемым бесплатным приложением в App Store США, обогнав ChatGPT, что вызвало волну обсуждений о «Спутниковом моменте» для американской AI-индустрии.
Ключевое преимущество DeepSeek — исключительная вычислительная эффективность: обучение модели V3 обошлось примерно в $5,6 млн против сотен миллионов у конкурентов. Компания придерживается исследовательской миссии — достижения искусственного общего интеллекта (AGI) — и не ставит коммерциализацию в приоритет. Продуктовая линейка включает модели для чата, программирования (DeepSeek Coder), математики и мультимодальные решения, доступные через веб-интерфейс, мобильное приложение и API.
Все модели DeepSeek (8)
💬ИИ-чат (6)
Гибридная модель с быстрым и медленным режимами мышления.
Рассуждающая модель с высокими показателями в математике и программировании. 671B параметров (37B активных).
Мощная открытая MoE модель с 671B параметров и низкой стоимостью обучения.
Экспериментальная модель рассуждений без supervised fine-tuning.
Открытая модель для математических задач и формального доказательства.
Полностью мультимодальная открытая модель для текста и изображений.
💻Генерация кода (2)
Открытая модель DeepSeek для кодирования и инференса с высокими бенчмарками.
Открытая модель для генерации и анализа кода с высокой производительностью.