BLOOM

Name: BLOOM
Author: Hugging Face

Историческая open-access многоязычная модель на 176B параметров от коллаборации BigScience (июль 2022). Первая прозрачно обученная LLM такого масштаба — 46 естественных + 13 языков программирования, лицензия RAIL. Веха открытого ИИ, но по меркам 2026 года устарела.

Бесплатно (open weights, self-host)Работает в РФ

⭐ 5.5/10📅 2022-07-06🏢 Hugging FaceProprietary

Открыть сайт

Рейтинг и бенчмарки

Общий рейтинг

5.5/10

Benchmark Score

4.5/10

Скорость

7/10

Параметры

176B

Языков

46 естественных + 13 программирования

Контекст

2048 токенов

Обучена

март–июль 2022, ~366B токенов

Суперкомпьютер

Jean Zay (Франция)

Входные и выходные данные

Входные данные

текст

Выходные данные

текст

API и стоимость

Входные токены (Input)

Бесплатно (open weights, self-host)

цена за промпт

Выходные токены (Output)

Бесплатно при self-host; стоимость inference зависит от своего железа/провайдера

цена за ответ

✓API доступен

Документация API →

Способы доступа

Self-hosted (HuggingFace)HF Inferenceоблачные провайдеры

Сценарии использования

исследования и экспериментымногоязычная генерация текста (вкл. недопредставленные языки)дообучение под свою задачуизучение архитектуры открытых LLM

Тарифы и подписки — Hugging Face

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный

Self-hosted (Open Weights)

Бесплатно

Веса на HuggingFace: bigscience/bloom (176B) и младшие версии
Лицензия BigScience RAIL v1.0 — коммерция разрешена с ограничениями use-case
Версии 560M–7.1B для слабого железа
Полный self-host без отправки данных
Дообучение и LoRA под свою задачу

HF Inference / провайдеры

По тарифам провайдера

Запуск через Hugging Face Inference или облачные хостинги
Без своей GPU-инфраструктуры
Оплата за вычисления у провайдера
Подходит для разовых экспериментов

Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы

Полностью открытые веса — можно скачать, развернуть локально и дообучить бесплатно

Радикальная прозрачность: обучена 1000+ исследователями из 70+ стран в открытую, опубликованы данные, код и весь процесс — уникальный научный артефакт

46 естественных языков с упором на недопредставленные (многие африканские и индийские) + 13 языков программирования

Есть лёгкие версии (560M, 1.1B, 1.7B, 3B, 7.1B) — запускаются на потребительском железе для экспериментов

Веса не блокируются для России — свободно скачиваются с HuggingFace

Историческая ценность — первая прозрачная многоязычная LLM масштаба GPT-3, веха демократизации ИИ

✗ Минусы

Сильно устарела — релиз июль 2022, по качеству кратно уступает современным открытым моделям (Llama 4, Qwen 3, DeepSeek R1)

Русский язык НЕ входит в 46 поддерживаемых — BigScience намеренно фокусировался на недопредставленных языках, русского среди них нет

Крошечный контекст — всего 2048 токенов против 128K–1M у современных моделей

Лицензия RAIL (не Apache/MIT) — есть ограничения на use-cases (запрет вредоносного применения), это не полностью свободная лицензия

Тяжёлый self-host полной 176B-модели — нужна серверная многокарточная конфигурация

Не instruction-tuned из коробки — базовая модель завершения текста; для чата нужен вариант BLOOMZ или собственный fine-tune

Подробный обзор

Что такое BLOOM

BLOOM (BigScience Large Open-science Open-access Multilingual Language Model) — большая языковая модель на 176 миллиардов параметров, выпущенная 6 июля 2022 года. Это не продукт одной компании, а результат коллаборации BigScience — более 1000 исследователей из 70+ стран и 250 институтов, координируемых Hugging Face. Модель обучалась с марта по июль 2022 на французском государственном суперкомпьютере Jean Zay на ~366 миллиардах токенов. BLOOM создавалась как открытая прозрачная альтернатива закрытому GPT-3 — и стала вехой в демократизации ИИ.

Чем BLOOM был важен

Главная ценность BLOOM — радикальная прозрачность. Это была первая многоязычная модель масштаба GPT-3, обученная полностью в открытую: опубликованы обучающие данные (корпус ROOTS на 1.6 ТБ), код, методология и весь процесс. Модель поддерживает 46 естественных языков и 13 языков программирования, причём BigScience намеренно включил много недопредставленных языков — африканских и индийских, — которые игнорировались большинством моделей того времени. Это сделало BLOOM важным научным артефактом и точкой отсчёта для всего движения открытых LLM.

Важно: русского языка в BLOOM нет

Для русскоязычных пользователей ключевой момент: русский язык НЕ входит в 46 поддерживаемых языков BLOOM. Это была осознанная позиция BigScience — фокус на языках, недостаточно представленных в других моделях. В обучающий набор не вошли русский, немецкий, японский, корейский и итальянский. Поэтому для задач на русском BLOOM не подходит — лучше брать модели, обученные с поддержкой русского (Qwen, YandexGPT, GigaChat, современные Llama).

Состояние на 2026 год

BLOOM сильно устарел. Релиз 2022 года, контекст всего 2048 токенов (против 128K–1M у современных моделей), качество генерации кратно уступает свежим открытым моделям — Llama 4, Qwen 3, DeepSeek R1. Это базовая модель завершения текста, не instruction-tuned: для чат-сценариев нужен вариант BLOOMZ (дообученный на инструкциях) или собственный fine-tune. Сегодня BLOOM имеет смысл скорее как учебный и исследовательский объект — изучить архитектуру открытой LLM, прозрачный процесс обучения — чем как рабочий инструмент для продакшена.

Лицензия и доступ

BLOOM распространяется под BigScience RAIL License v1.0 (Responsible AI License) — это не Apache/MIT: веса открыты и бесплатны, коммерческое использование разрешено, но с ограничениями на вредоносные сценарии применения (запрет дезинформации, hate speech, биометрического вреда). Веса лежат на HuggingFace (bigscience/bloom для полной 176B плюс лёгкие версии 560M, 1.1B, 1.7B, 3B, 7.1B). Веса не блокируются для России — свободно скачиваются. Полная 176B-модель требует серверной многокарточной конфигурации; младшие версии запускаются на потребительском железе для экспериментов.

Часто задаваемые вопросы

Что такое BLOOM и кто его создал?

BLOOM — open-access многоязычная языковая модель на 176 млрд параметров, выпущенная 6 июля 2022 года. Создана коллаборацией BigScience — более 1000 исследователей из 70+ стран и 250 институтов под координацией Hugging Face. Обучалась на французском суперкомпьютере Jean Zay как прозрачная открытая альтернатива закрытому GPT-3. Стала вехой в демократизации ИИ.

Поддерживает ли BLOOM русский язык?

Нет. Русский язык НЕ входит в 46 поддерживаемых языков BLOOM. BigScience намеренно фокусировался на недопредставленных языках (африканских, индийских), а русский, немецкий, японский, корейский и итальянский в обучающий набор не попали. Для задач на русском BLOOM не подходит — лучше Qwen, YandexGPT, GigaChat или современные Llama.

Актуален ли BLOOM в 2026 году?

Как рабочий инструмент — нет, сильно устарел. Релиз 2022 года, контекст всего 2048 токенов (против 128K–1M у современных), качество кратно уступает Llama 4, Qwen 3, DeepSeek R1. Сегодня BLOOM ценен скорее как учебный и исследовательский объект — изучить архитектуру и прозрачный процесс обучения открытой LLM. Для продакшена берите современные открытые модели.

Сколько стоит BLOOM и какая у него лицензия?

Веса бесплатны для скачивания. Лицензия — BigScience RAIL License v1.0 (Responsible AI License): это НЕ Apache/MIT, коммерческое использование разрешено, но с ограничениями на вредоносные сценарии применения. При self-host вы платите только за своё железо или вычисления у провайдера.

Какие требования к железу для запуска BLOOM?

Полная 176B-модель требует серверной многокарточной GPU-конфигурации (несколько A100/H100). Но есть лёгкие версии: 560M, 1.1B, 1.7B, 3B и 7.1B параметров — они запускаются на потребительских видеокартах и подходят для экспериментов и изучения. Для полноценной работы с 176B проще использовать облачный inference, чем держать своё железо.

Чем BLOOM отличается от BLOOMZ и какие современные альтернативы?

BLOOM — базовая модель завершения текста (не instruction-tuned). BLOOMZ — её версия, дообученная следовать инструкциям, лучше подходит для чат-сценариев. Современные открытые альтернативы, превосходящие BLOOM по всем параметрам: Llama 4 (Meta), Qwen 3 (Alibaba, Apache 2.0), DeepSeek R1 (MIT), Mistral. Для русского — Qwen, YandexGPT, GigaChat. BLOOM сегодня выбирают в основном для исследований открытого ИИ.