SOLAR 10.7B
Открытая компактная LLM от корейской Upstage (декабрь 2023) с уникальной техникой depth up-scaling (DUS). При всего 10.7B параметров обошла модели вдвое крупнее и даже GPT-3.5 на Open LLM Leaderboard. Лицензия Apache 2.0 — полная свобода коммерции. Работает в РФ без VPN при self-host.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Upstage
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Веса на HuggingFace: upstage/SOLAR-10.7B-Instruct-v1.0
- Apache 2.0 — коммерция без ограничений
- Base и Instruct версии
- Запуск через Ollama, llama.cpp, vLLM, transformers
- Идеальна как основа для собственного fine-tune
- Облачный доступ без своей GPU
- OpenAI-совместимый API
- Подходит для разовых задач и тестов
Плюсы и минусы
Подробный обзор
Что такое SOLAR 10.7B
SOLAR 10.7B — открытая языковая модель от корейской компании Upstage, выпущенная 23 декабря 2023 года. SOLAR расшифровывается как «Specialized and Optimized LLM and Applications with Reliability». Модель предобучена более чем на 3 триллионах токенов. Её главная особенность — не размер, а метод обучения: при компактных 10.7 миллиардах параметров она на момент релиза заняла верхние строчки Open LLM Leaderboard, обойдя модели в несколько раз крупнее.
Depth Up-Scaling — главная инновация
Ключевой вклад SOLAR — техника Depth Up-Scaling (DUS). Вместо обучения модели с нуля Upstage взяла открытую 7B-модель (на базе Llama/Mistral), нарастила число слоёв (увеличив «глубину» сети), а затем продолжила предобучение увеличенной модели. Это простой, но эффективный способ масштабирования: он дал прирост качества без необходимости в гигантских вычислительных бюджетах. DUS показал, что грамотная архитектурная модификация компактной модели может конкурировать с обучением крупных моделей с нуля.
Производительность
На момент выхода (декабрь 2023) SOLAR 10.7B показала среднее 74.2 на Open LLM Leaderboard — лучший результат среди предобученных моделей того периода. При этом она была самой компактной в топ-10 и обошла:
- OpenAI GPT-3.5 Turbo (71.07)
- Meta Llama 2 70B (67.87) — в 6.5 раз крупнее
- Alibaba Qwen 72B (73)
Это сделало SOLAR одной из самых обсуждаемых open-source моделей начала 2024 года и популярной базой для дообучения — на ней строили множество кастомных файнтюнов.
Лицензия и доступ
SOLAR 10.7B доступна и в базовой, и в instruction-tuned версии под лицензией Apache 2.0 — это максимально свободная лицензия, разрешающая неограниченное коммерческое использование, модификацию и распространение без отчислений. Веса лежат на HuggingFace (upstage/SOLAR-10.7B-Instruct-v1.0). Компактные 10.7B запускаются на одной потребительской GPU через Ollama, llama.cpp или vLLM. Важно не путать SOLAR 10.7B (бесплатная open-source) с Solar Pro — это отдельная коммерческая модель Upstage с платными тарифами на их платформе Console.
Состояние на 2026 и доступность в России
SOLAR 10.7B устарела как рабочий инструмент — релиз декабрь 2023, контекст всего 4096 токенов, по качеству кратно уступает современным открытым моделям (Llama 4, Qwen 3, DeepSeek R1). Но как исторический и учебный объект она важна: метод Depth Up-Scaling повлиял на подходы к эффективному масштабированию. Веса не блокируются для России — свободно качаются с HuggingFace, запускаются локально. SOLAR — English language model, русский язык поддерживается слабо; для русскоязычных задач лучше Qwen, YandexGPT или GigaChat.