Stable Diffusion 3.5
Семейство open-weight моделей Stability AI: Large (8.1B параметров, до 1 МП), Large Turbo (4 шага вместо 30) и Medium (2.5B, от 9.9 GB VRAM). Apache-подобная Community License — бесплатно для бизнеса с выручкой до $1M/год.
Рейтинг и бенчмарки
Входные и выходные данные
API и стоимость
Способы доступа
Сценарии использования
Тарифы и подписки — Stability AI
Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен
- Веса на HuggingFace: stabilityai/stable-diffusion-3.5-large / -large-turbo / -medium
- Запуск через ComfyUI, Diffusers, Automatic1111 (через расширения)
- Stability AI Community License — коммерция до $1M/год выручки
- Полная совместимость с LoRA, ControlNet и кастомными файн-тюнами
- GGUF и FP8 кванты для запуска на 8 GB VRAM (Medium)
- SD 3.5 Large через platform.stability.ai
- Разрешение до 1 мегапикселя
- 25 бесплатных кредитов при регистрации
- OpenAI-совместимый формат
- Ускоренная версия Large — 4 шага вместо 30
- В 1.6× дешевле полного Large
- Подходит для массовой генерации и черновиков
- Качество близко к Large на простых сценах
- SD 3.5 Medium через API
- Разрешение от 0.25 до 2 мегапикселей
- Самая дешёвая через API версия
- Чат-интерфейс на assistant.stability.ai
- Включает SD 3.5 + Stable Audio + Stable Fast 3D
- Бесплатный пробный период 3 дня
- Подходит для тех кто не хочет API/самохост
- Обязательно при выручке свыше $1M/год
- Self-hosted деплой без ограничений
- Кастомное обучение моделей
- SLA, приоритетная поддержка
Плюсы и минусы
Подробный обзор
Что такое Stable Diffusion 3.5
Stable Diffusion 3.5 — семейство open-weight моделей генерации изображений от британско-американской компании Stability AI, выпущенное 22 октября 2024 года. Это итерация поверх Stable Diffusion 3 (которая вышла в феврале 2024 и подверглась критике за качество людей и анатомию) — версия 3.5 закрыла главные провалы тройки, улучшила prompt adherence и стала лидером среди open-source моделей по точности следования инструкциям. Релиз состоит из трёх вариантов под разные задачи и железо.
Три модели в линейке
- Stable Diffusion 3.5 Large — флагман, 8.1 миллиарда параметров, генерирует изображения до 1 мегапикселя. Лучшее качество в линейке, лидер по prompt adherence среди open-source. Требует от 16 GB VRAM (рекомендуется 24 GB)
- Stable Diffusion 3.5 Large Turbo — дистиллированная версия Large на тех же 8.1B параметрах. Генерирует за 4 шага вместо обычных ~30 — в разы быстрее при сопоставимом качестве на простых сценах
- Stable Diffusion 3.5 Medium — компактная модель 2.5B параметров, разрешение от 0.25 до 2 МП, требует всего 9.9 GB VRAM (без текстовых энкодеров) — запускается на потребительских GPU вроде RTX 3060/4070
Под капотом — улучшенная архитектура MMDiT-X (Multimodal Diffusion Transformer) с Query-Key Normalization в трансформерных блоках. Это стабилизирует обучение и упрощает файн-тюнинг — что важно для тех кто хочет адаптировать модель под свой стиль или предметную область.
Лицензия и коммерческое использование
Все три модели распространяются под Stability AI Community License. Условия лояльные: коммерческое использование бесплатно для физических лиц и компаний с годовой выручкой до $1 миллиона. Это покрывает большинство индивидуальных авторов, стартапов и студий. Для бизнеса с выручкой выше $1M/год обязательна Enterprise License от Stability — её условия согласуются индивидуально. Веса можно скачать, обучить на них LoRA, файн-тюнинг и распространять полученные модели.
Где запускать: API, self-host и сервисы
Основные варианты использования:
- Self-host — скачать веса с HuggingFace и запустить через ComfyUI, Diffusers или Automatic1111 (с расширениями). Бесплатно, нужен GPU
- Stability API на platform.stability.ai — Large $0.065, Large Turbo $0.04, Medium $0.035 за изображение, 25 бесплатных кредитов при регистрации
- Сторонние хостинги — Replicate, Fal, WaveSpeed, Together AI. У всех свои цены и API-обёртки, часто дешевле официального
- Stable Assistant — собственный чат-интерфейс Stability от $9/мес, включает SD 3.5 + Stable Audio + Stable Fast 3D, без необходимости знать API
Для NVIDIA RTX-юзеров есть бонус: TensorRT-оптимизация даёт до 2.3× ускорения на Large и 1.7× на Medium, плюс снижает требования к VRAM на 40%.
Доступность и особенности использования в России
Веса SD 3.5 на HuggingFace не блокируются для российских пользователей — open-source модель можно скачать и запускать локально где угодно. Сайт stability.ai и platform.stability.ai открываются из России без VPN. Однако оплата API: российские карты МИР не принимаются — только зарубежная Visa/Mastercard через Stripe. Альтернатива — пользоваться сторонними хостингами (Replicate, Fal принимают зарубежные карты тоже, но иногда чуть проще зарегистрироваться). Интерфейс везде на английском, локализации нет. Промпты на русском модель технически принимает, но качество результата заметно ниже английского — стандартная рекомендация: писать промпты на английском, можно сначала перевести через ChatGPT/DeepL/Claude. Для запуска локально полностью офлайн SD 3.5 — оптимальный выбор когда нужна приватность и независимость от внешних сервисов.