SOLAR 10.7B

SOLAR 10.7B

Открытая компактная LLM от корейской Upstage (декабрь 2023) с уникальной техникой depth up-scaling (DUS). При всего 10.7B параметров обошла модели вдвое крупнее и даже GPT-3.5 на Open LLM Leaderboard. Лицензия Apache 2.0 — полная свобода коммерции. Работает в РФ без VPN при self-host.

Бесплатно (open weights, Apache 2.0) / API через провайдеровРаботает в РФ
6.3/10📅 2023-12-23🏢 Upstage✓ Open Source

Рейтинг и бенчмарки

Общий рейтинг
6.3/10
Benchmark Score
6.3/10
Скорость
8.5/10
Open LLM Leaderboard
74.2 avg (топ на момент релиза)
Обошла
GPT-3.5 Turbo (71.07), Llama 2 (67.87), Qwen 72B (73)
Метод
Depth Up-Scaling (DUS)
Обучение
>3 триллионов токенов
Релиз
23 декабря 2023

Входные и выходные данные

Входные данные
текст
Выходные данные
текст

API и стоимость

Входные токены (Input)
Бесплатно (open weights, Apache 2.0) / API через провайдеров
цена за промпт
Выходные токены (Output)
Бесплатно при self-host; через провайдеров — по их тарифам
цена за ответ
API доступен

Способы доступа

Self-hosted (HuggingFaceOllamallama.cpp)OpenRouterоблачные провайдеры

Сценарии использования

чат-ассистентоснова для fine-tuneлокальный приватный LLMэксперименты с компактными моделямигенерация текста

Тарифы и подписки — Upstage

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный
Self-hosted (Open Weights)
Бесплатно (Apache 2.0)
  • Веса на HuggingFace: upstage/SOLAR-10.7B-Instruct-v1.0
  • Apache 2.0 — коммерция без ограничений
  • Base и Instruct версии
  • Запуск через Ollama, llama.cpp, vLLM, transformers
  • Идеальна как основа для собственного fine-tune
Через провайдеров / OpenRouter
По тарифам провайдера
  • Облачный доступ без своей GPU
  • OpenAI-совместимый API
  • Подходит для разовых задач и тестов
Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы
Полностью открытая под Apache 2.0 — самая свободная лицензия: коммерция, модификация, self-host без ограничений и отчислений
Уникальный метод Depth Up-Scaling (DUS) — наращивание слоёв базовой 7B-модели + дообучение, дало качество крупных моделей в компактном размере
При 10.7B обошла GPT-3.5 Turbo, Llama 2 70B и Qwen 72B на Open LLM Leaderboard (среднее 74.2) — рекорд эффективности на момент релиза
Компактность — 10.7B запускается на одной потребительской GPU, идеальна для локального self-host и fine-tune
Веса не блокируются для России — свободно качаются с HuggingFace, запуск локальный
Отличная база для дообучения — многие кастомные модели 2024 года строились на SOLAR благодаря удачному балансу размер/качество
✗ Минусы
Устарела — релиз декабрь 2023, по качеству кратно уступает современным открытым моделям (Llama 4, Qwen 3, DeepSeek R1)
Крошечный контекст — всего 4096 токенов против 128K–1M у современных моделей
Русский язык слабый — SOLAR это English language model, обучена в основном на английском
Только текст — нет мультимодальности, работы с изображениями или кодом-специализации
Не путать с Solar Pro — это отдельная коммерческая модель Upstage с платными тарифами; SOLAR 10.7B бесплатна и open-source
Нишевая известность — меньше готовых интеграций и комьюнити, чем у Llama или Qwen

Подробный обзор

Что такое SOLAR 10.7B

SOLAR 10.7B — открытая языковая модель от корейской компании Upstage, выпущенная 23 декабря 2023 года. SOLAR расшифровывается как «Specialized and Optimized LLM and Applications with Reliability». Модель предобучена более чем на 3 триллионах токенов. Её главная особенность — не размер, а метод обучения: при компактных 10.7 миллиардах параметров она на момент релиза заняла верхние строчки Open LLM Leaderboard, обойдя модели в несколько раз крупнее.

Depth Up-Scaling — главная инновация

Ключевой вклад SOLAR — техника Depth Up-Scaling (DUS). Вместо обучения модели с нуля Upstage взяла открытую 7B-модель (на базе Llama/Mistral), нарастила число слоёв (увеличив «глубину» сети), а затем продолжила предобучение увеличенной модели. Это простой, но эффективный способ масштабирования: он дал прирост качества без необходимости в гигантских вычислительных бюджетах. DUS показал, что грамотная архитектурная модификация компактной модели может конкурировать с обучением крупных моделей с нуля.

Производительность

На момент выхода (декабрь 2023) SOLAR 10.7B показала среднее 74.2 на Open LLM Leaderboard — лучший результат среди предобученных моделей того периода. При этом она была самой компактной в топ-10 и обошла:

  • OpenAI GPT-3.5 Turbo (71.07)
  • Meta Llama 2 70B (67.87) — в 6.5 раз крупнее
  • Alibaba Qwen 72B (73)

Это сделало SOLAR одной из самых обсуждаемых open-source моделей начала 2024 года и популярной базой для дообучения — на ней строили множество кастомных файнтюнов.

Лицензия и доступ

SOLAR 10.7B доступна и в базовой, и в instruction-tuned версии под лицензией Apache 2.0 — это максимально свободная лицензия, разрешающая неограниченное коммерческое использование, модификацию и распространение без отчислений. Веса лежат на HuggingFace (upstage/SOLAR-10.7B-Instruct-v1.0). Компактные 10.7B запускаются на одной потребительской GPU через Ollama, llama.cpp или vLLM. Важно не путать SOLAR 10.7B (бесплатная open-source) с Solar Pro — это отдельная коммерческая модель Upstage с платными тарифами на их платформе Console.

Состояние на 2026 и доступность в России

SOLAR 10.7B устарела как рабочий инструмент — релиз декабрь 2023, контекст всего 4096 токенов, по качеству кратно уступает современным открытым моделям (Llama 4, Qwen 3, DeepSeek R1). Но как исторический и учебный объект она важна: метод Depth Up-Scaling повлиял на подходы к эффективному масштабированию. Веса не блокируются для России — свободно качаются с HuggingFace, запускаются локально. SOLAR — English language model, русский язык поддерживается слабо; для русскоязычных задач лучше Qwen, YandexGPT или GigaChat.

Часто задаваемые вопросы

Что такое SOLAR 10.7B и кто его создал?
SOLAR 10.7B — открытая языковая модель от корейской компании Upstage, выпущенная 23 декабря 2023 года. SOLAR означает «Specialized and Optimized LLM and Applications with Reliability». Предобучена на 3+ триллионах токенов. Главная особенность — при компактных 10.7 млрд параметров модель на момент релиза заняла топ Open LLM Leaderboard, обойдя модели в несколько раз крупнее.
Что такое Depth Up-Scaling (DUS)?
DUS — фирменный метод Upstage для создания SOLAR. Вместо обучения с нуля берётся открытая 7B-модель, в ней наращивается число слоёв (увеличивается «глубина» сети), а затем продолжается предобучение увеличенной модели. Это простой и вычислительно дешёвый способ масштабирования, который дал качество крупных моделей в компактном размере. DUS показал, что грамотная модификация архитектуры может конкурировать с обучением больших моделей с нуля.
Какие модели обошла SOLAR 10.7B?
На Open LLM Leaderboard (декабрь 2023) SOLAR 10.7B набрала среднее 74.2 и обошла OpenAI GPT-3.5 Turbo (71.07), Meta Llama 2 70B (67.87, в 6.5 раз крупнее) и Alibaba Qwen 72B (73). При этом была самой компактной моделью в топ-10. Это рекорд эффективности «качество на параметр» для своего времени.
Можно ли использовать SOLAR 10.7B коммерчески?
Да, полностью. SOLAR 10.7B (и базовая, и Instruct версии) распространяется под Apache 2.0 — максимально свободной лицензией. Коммерческое использование, модификация, дообучение и распространение разрешены без ограничений и отчислений. Это удобнее, чем Llama-лицензии с ограничением на 700M MAU.
Чем SOLAR 10.7B отличается от Solar Pro?
Это разные продукты. SOLAR 10.7B — бесплатная open-source модель под Apache 2.0, веса на HuggingFace, self-host. Solar Pro — отдельная коммерческая модель Upstage с платными тарифами на их платформе Console (Explore $100+/мес и выше). Не путайте: если нужна бесплатная модель для self-host — это SOLAR 10.7B, платная облачная — Solar Pro.
Работает ли SOLAR в России и поддерживает ли русский?
Веса свободно качаются с HuggingFace и не блокируются — модель запускается локально из России. Однако SOLAR — English language model, русский язык поддерживается слабо (обучена в основном на английском). Для русскоязычных задач лучше Qwen, YandexGPT или GigaChat. SOLAR подходит для англоязычных задач и как основа для собственного fine-tune.
Актуальна ли SOLAR 10.7B в 2026 году?
Как рабочий инструмент — устарела. Релиз декабрь 2023, контекст всего 4096 токенов, по качеству кратно уступает современным открытым моделям (Llama 4, Qwen 3, DeepSeek R1, Mistral). Но как исторический и учебный объект важна — метод Depth Up-Scaling повлиял на подходы к эффективному масштабированию. Для новых проектов берите свежие открытые модели; SOLAR — для изучения DUS и лёгких локальных экспериментов.

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно