BLOOM

BLOOM

Историческая open-access многоязычная модель на 176B параметров от коллаборации BigScience (июль 2022). Первая прозрачно обученная LLM такого масштаба — 46 естественных + 13 языков программирования, лицензия RAIL. Веха открытого ИИ, но по меркам 2026 года устарела.

Бесплатно (open weights, self-host)Работает в РФ
5.5/10📅 2022-07-06🏢 Hugging FaceProprietary

Рейтинг и бенчмарки

Общий рейтинг
5.5/10
Benchmark Score
4.5/10
Скорость
7/10
Параметры
176B
Языков
46 естественных + 13 программирования
Контекст
2048 токенов
Обучена
март–июль 2022, ~366B токенов
Суперкомпьютер
Jean Zay (Франция)

Входные и выходные данные

Входные данные
текст
Выходные данные
текст

API и стоимость

Входные токены (Input)
Бесплатно (open weights, self-host)
цена за промпт
Выходные токены (Output)
Бесплатно при self-host; стоимость inference зависит от своего железа/провайдера
цена за ответ
API доступен

Способы доступа

Self-hosted (HuggingFace)HF Inferenceоблачные провайдеры

Сценарии использования

исследования и экспериментымногоязычная генерация текста (вкл. недопредставленные языки)дообучение под свою задачуизучение архитектуры открытых LLM

Тарифы и подписки — Hugging Face

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный
Self-hosted (Open Weights)
Бесплатно
  • Веса на HuggingFace: bigscience/bloom (176B) и младшие версии
  • Лицензия BigScience RAIL v1.0 — коммерция разрешена с ограничениями use-case
  • Версии 560M–7.1B для слабого железа
  • Полный self-host без отправки данных
  • Дообучение и LoRA под свою задачу
HF Inference / провайдеры
По тарифам провайдера
  • Запуск через Hugging Face Inference или облачные хостинги
  • Без своей GPU-инфраструктуры
  • Оплата за вычисления у провайдера
  • Подходит для разовых экспериментов
Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы
Полностью открытые веса — можно скачать, развернуть локально и дообучить бесплатно
Радикальная прозрачность: обучена 1000+ исследователями из 70+ стран в открытую, опубликованы данные, код и весь процесс — уникальный научный артефакт
46 естественных языков с упором на недопредставленные (многие африканские и индийские) + 13 языков программирования
Есть лёгкие версии (560M, 1.1B, 1.7B, 3B, 7.1B) — запускаются на потребительском железе для экспериментов
Веса не блокируются для России — свободно скачиваются с HuggingFace
Историческая ценность — первая прозрачная многоязычная LLM масштаба GPT-3, веха демократизации ИИ
✗ Минусы
Сильно устарела — релиз июль 2022, по качеству кратно уступает современным открытым моделям (Llama 4, Qwen 3, DeepSeek R1)
Русский язык НЕ входит в 46 поддерживаемых — BigScience намеренно фокусировался на недопредставленных языках, русского среди них нет
Крошечный контекст — всего 2048 токенов против 128K–1M у современных моделей
Лицензия RAIL (не Apache/MIT) — есть ограничения на use-cases (запрет вредоносного применения), это не полностью свободная лицензия
Тяжёлый self-host полной 176B-модели — нужна серверная многокарточная конфигурация
Не instruction-tuned из коробки — базовая модель завершения текста; для чата нужен вариант BLOOMZ или собственный fine-tune

Подробный обзор

Что такое BLOOM

BLOOM (BigScience Large Open-science Open-access Multilingual Language Model) — большая языковая модель на 176 миллиардов параметров, выпущенная 6 июля 2022 года. Это не продукт одной компании, а результат коллаборации BigScience — более 1000 исследователей из 70+ стран и 250 институтов, координируемых Hugging Face. Модель обучалась с марта по июль 2022 на французском государственном суперкомпьютере Jean Zay на ~366 миллиардах токенов. BLOOM создавалась как открытая прозрачная альтернатива закрытому GPT-3 — и стала вехой в демократизации ИИ.

Чем BLOOM был важен

Главная ценность BLOOM — радикальная прозрачность. Это была первая многоязычная модель масштаба GPT-3, обученная полностью в открытую: опубликованы обучающие данные (корпус ROOTS на 1.6 ТБ), код, методология и весь процесс. Модель поддерживает 46 естественных языков и 13 языков программирования, причём BigScience намеренно включил много недопредставленных языков — африканских и индийских, — которые игнорировались большинством моделей того времени. Это сделало BLOOM важным научным артефактом и точкой отсчёта для всего движения открытых LLM.

Важно: русского языка в BLOOM нет

Для русскоязычных пользователей ключевой момент: русский язык НЕ входит в 46 поддерживаемых языков BLOOM. Это была осознанная позиция BigScience — фокус на языках, недостаточно представленных в других моделях. В обучающий набор не вошли русский, немецкий, японский, корейский и итальянский. Поэтому для задач на русском BLOOM не подходит — лучше брать модели, обученные с поддержкой русского (Qwen, YandexGPT, GigaChat, современные Llama).

Состояние на 2026 год

BLOOM сильно устарел. Релиз 2022 года, контекст всего 2048 токенов (против 128K–1M у современных моделей), качество генерации кратно уступает свежим открытым моделям — Llama 4, Qwen 3, DeepSeek R1. Это базовая модель завершения текста, не instruction-tuned: для чат-сценариев нужен вариант BLOOMZ (дообученный на инструкциях) или собственный fine-tune. Сегодня BLOOM имеет смысл скорее как учебный и исследовательский объект — изучить архитектуру открытой LLM, прозрачный процесс обучения — чем как рабочий инструмент для продакшена.

Лицензия и доступ

BLOOM распространяется под BigScience RAIL License v1.0 (Responsible AI License) — это не Apache/MIT: веса открыты и бесплатны, коммерческое использование разрешено, но с ограничениями на вредоносные сценарии применения (запрет дезинформации, hate speech, биометрического вреда). Веса лежат на HuggingFace (bigscience/bloom для полной 176B плюс лёгкие версии 560M, 1.1B, 1.7B, 3B, 7.1B). Веса не блокируются для России — свободно скачиваются. Полная 176B-модель требует серверной многокарточной конфигурации; младшие версии запускаются на потребительском железе для экспериментов.

Часто задаваемые вопросы

Что такое BLOOM и кто его создал?
BLOOM — open-access многоязычная языковая модель на 176 млрд параметров, выпущенная 6 июля 2022 года. Создана коллаборацией BigScience — более 1000 исследователей из 70+ стран и 250 институтов под координацией Hugging Face. Обучалась на французском суперкомпьютере Jean Zay как прозрачная открытая альтернатива закрытому GPT-3. Стала вехой в демократизации ИИ.
Поддерживает ли BLOOM русский язык?
Нет. Русский язык НЕ входит в 46 поддерживаемых языков BLOOM. BigScience намеренно фокусировался на недопредставленных языках (африканских, индийских), а русский, немецкий, японский, корейский и итальянский в обучающий набор не попали. Для задач на русском BLOOM не подходит — лучше Qwen, YandexGPT, GigaChat или современные Llama.
Актуален ли BLOOM в 2026 году?
Как рабочий инструмент — нет, сильно устарел. Релиз 2022 года, контекст всего 2048 токенов (против 128K–1M у современных), качество кратно уступает Llama 4, Qwen 3, DeepSeek R1. Сегодня BLOOM ценен скорее как учебный и исследовательский объект — изучить архитектуру и прозрачный процесс обучения открытой LLM. Для продакшена берите современные открытые модели.
Сколько стоит BLOOM и какая у него лицензия?
Веса бесплатны для скачивания. Лицензия — BigScience RAIL License v1.0 (Responsible AI License): это НЕ Apache/MIT, коммерческое использование разрешено, но с ограничениями на вредоносные сценарии применения. При self-host вы платите только за своё железо или вычисления у провайдера.
Какие требования к железу для запуска BLOOM?
Полная 176B-модель требует серверной многокарточной GPU-конфигурации (несколько A100/H100). Но есть лёгкие версии: 560M, 1.1B, 1.7B, 3B и 7.1B параметров — они запускаются на потребительских видеокартах и подходят для экспериментов и изучения. Для полноценной работы с 176B проще использовать облачный inference, чем держать своё железо.
Чем BLOOM отличается от BLOOMZ и какие современные альтернативы?
BLOOM — базовая модель завершения текста (не instruction-tuned). BLOOMZ — её версия, дообученная следовать инструкциям, лучше подходит для чат-сценариев. Современные открытые альтернативы, превосходящие BLOOM по всем параметрам: Llama 4 (Meta), Qwen 3 (Alibaba, Apache 2.0), DeepSeek R1 (MIT), Mistral. Для русского — Qwen, YandexGPT, GigaChat. BLOOM сегодня выбирают в основном для исследований открытого ИИ.

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно