BLOOM
Историческая open-access многоязычная модель на 176B параметров от коллаборации BigScience (июль 2022). Первая прозрачно обученная LLM такого масштаба — 46 естественных + 13 языков программирования, лицензия RAIL. Веха открытого ИИ, но по меркам 2026 года устарела.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Hugging Face
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Веса на HuggingFace: bigscience/bloom (176B) и младшие версии
- Лицензия BigScience RAIL v1.0 — коммерция разрешена с ограничениями use-case
- Версии 560M–7.1B для слабого железа
- Полный self-host без отправки данных
- Дообучение и LoRA под свою задачу
- Запуск через Hugging Face Inference или облачные хостинги
- Без своей GPU-инфраструктуры
- Оплата за вычисления у провайдера
- Подходит для разовых экспериментов
Плюсы и минусы
Подробный обзор
Что такое BLOOM
BLOOM (BigScience Large Open-science Open-access Multilingual Language Model) — большая языковая модель на 176 миллиардов параметров, выпущенная 6 июля 2022 года. Это не продукт одной компании, а результат коллаборации BigScience — более 1000 исследователей из 70+ стран и 250 институтов, координируемых Hugging Face. Модель обучалась с марта по июль 2022 на французском государственном суперкомпьютере Jean Zay на ~366 миллиардах токенов. BLOOM создавалась как открытая прозрачная альтернатива закрытому GPT-3 — и стала вехой в демократизации ИИ.
Чем BLOOM был важен
Главная ценность BLOOM — радикальная прозрачность. Это была первая многоязычная модель масштаба GPT-3, обученная полностью в открытую: опубликованы обучающие данные (корпус ROOTS на 1.6 ТБ), код, методология и весь процесс. Модель поддерживает 46 естественных языков и 13 языков программирования, причём BigScience намеренно включил много недопредставленных языков — африканских и индийских, — которые игнорировались большинством моделей того времени. Это сделало BLOOM важным научным артефактом и точкой отсчёта для всего движения открытых LLM.
Важно: русского языка в BLOOM нет
Для русскоязычных пользователей ключевой момент: русский язык НЕ входит в 46 поддерживаемых языков BLOOM. Это была осознанная позиция BigScience — фокус на языках, недостаточно представленных в других моделях. В обучающий набор не вошли русский, немецкий, японский, корейский и итальянский. Поэтому для задач на русском BLOOM не подходит — лучше брать модели, обученные с поддержкой русского (Qwen, YandexGPT, GigaChat, современные Llama).
Состояние на 2026 год
BLOOM сильно устарел. Релиз 2022 года, контекст всего 2048 токенов (против 128K–1M у современных моделей), качество генерации кратно уступает свежим открытым моделям — Llama 4, Qwen 3, DeepSeek R1. Это базовая модель завершения текста, не instruction-tuned: для чат-сценариев нужен вариант BLOOMZ (дообученный на инструкциях) или собственный fine-tune. Сегодня BLOOM имеет смысл скорее как учебный и исследовательский объект — изучить архитектуру открытой LLM, прозрачный процесс обучения — чем как рабочий инструмент для продакшена.
Лицензия и доступ
BLOOM распространяется под BigScience RAIL License v1.0 (Responsible AI License) — это не Apache/MIT: веса открыты и бесплатны, коммерческое использование разрешено, но с ограничениями на вредоносные сценарии применения (запрет дезинформации, hate speech, биометрического вреда). Веса лежат на HuggingFace (bigscience/bloom для полной 176B плюс лёгкие версии 560M, 1.1B, 1.7B, 3B, 7.1B). Веса не блокируются для России — свободно скачиваются. Полная 176B-модель требует серверной многокарточной конфигурации; младшие версии запускаются на потребительском железе для экспериментов.