Stable Diffusion 3.5

Stable Diffusion 3.5

Семейство open-weight моделей Stability AI: Large (8.1B параметров, до 1 МП), Large Turbo (4 шага вместо 30) и Medium (2.5B, от 9.9 GB VRAM). Apache-подобная Community License — бесплатно для бизнеса с выручкой до $1M/год.

Self-host бесплатно / API: $0.035–$0.065 за изображениеРаботает в РФ
6.8/10📅 2024-10-22🏢 Stability AIProprietary

Рейтинг и бенчмарки

Общий рейтинг
6.8/10
Benchmark Score
7/10
Скорость
8.5/10
Large
8.1B параметров, до 1 МП
Large Turbo
8.1B, 4 шага вместо ~30
Medium
2.5B, ~9.9 GB VRAM, 0.25–2 МП
Релиз
22 октября 2024
TensorRT ускорение
до 2.3× быстрее на NVIDIA RTX

Входные и выходные данные

Входные данные
текст
Выходные данные
изображение

API и стоимость

Входные токены (Input)
Self-host бесплатно / API: $0.035–$0.065 за изображение
цена за промпт
Выходные токены (Output)
Large $0.065 / Large Turbo $0.04 / Medium $0.035 за изображение через Stability API
цена за ответ
API доступен

Способы доступа

Self-hosted (HuggingFace)Stability APIComfyUIDiffusersReplicateFalWaveSpeed

Сценарии использования

генерация изображений и дизайниллюстрации и концепт-артлокальная on-premise генерация без отправки запросов в облакофайн-тюнинг под собственный стиль

Тарифы и подписки — Stability AI

Актуальные планы подписки провайдера. Цены могут меняться — уточняйте на странице цен

Популярный
Self-hosted (Open Source)
Бесплатно
  • Веса на HuggingFace: stabilityai/stable-diffusion-3.5-large / -large-turbo / -medium
  • Запуск через ComfyUI, Diffusers, Automatic1111 (через расширения)
  • Stability AI Community License — коммерция до $1M/год выручки
  • Полная совместимость с LoRA, ControlNet и кастомными файн-тюнами
  • GGUF и FP8 кванты для запуска на 8 GB VRAM (Medium)
Stability API: Large
$0.065 / изображение
  • SD 3.5 Large через platform.stability.ai
  • Разрешение до 1 мегапикселя
  • 25 бесплатных кредитов при регистрации
  • OpenAI-совместимый формат
Stability API: Large Turbo
$0.04 / изображение
  • Ускоренная версия Large — 4 шага вместо 30
  • В 1.6× дешевле полного Large
  • Подходит для массовой генерации и черновиков
  • Качество близко к Large на простых сценах
Stability API: Medium
$0.035 / изображение
  • SD 3.5 Medium через API
  • Разрешение от 0.25 до 2 мегапикселей
  • Самая дешёвая через API версия
Stable Assistant
от $9/мес
  • Чат-интерфейс на assistant.stability.ai
  • Включает SD 3.5 + Stable Audio + Stable Fast 3D
  • Бесплатный пробный период 3 дня
  • Подходит для тех кто не хочет API/самохост
Enterprise License
Индивидуально
  • Обязательно при выручке свыше $1M/год
  • Self-hosted деплой без ограничений
  • Кастомное обучение моделей
  • SLA, приоритетная поддержка
Российские карты не принимаются.Genova-ai — работает в РФ без VPN

Плюсы и минусы

✓ Плюсы
Полностью open-weight под Stability AI Community License — коммерческое использование бесплатно при выручке до $1M/год
Линейка из 3 моделей под разные задачи: Large для качества, Large Turbo для скорости (4 шага), Medium для слабого железа (9.9 GB VRAM)
Лидирует по prompt adherence (следованию инструкциям) среди open-source — обходит SDXL и многие закрытые модели
MMDiT-X архитектура с Query-Key Normalization — стабильное обучение и удобный файн-тюнинг под свой стиль
Огромная экосистема: ComfyUI, Diffusers, Replicate, Fal, WaveSpeed, ControlNet, LoRA — поддерживается везде
TensorRT-оптимизация на NVIDIA RTX даёт до 2.3× ускорение и снижает требования к VRAM на 40%
✗ Минусы
Появилась более новая Stable Diffusion 4 (2025) — для топового качества и фотореализма стоит смотреть на неё
Качество ниже чем у закрытых моделей FLUX 1.1 Pro, Midjourney v7, GPT Image 2 — особенно по фотореализму людей и плотному тексту
Промпты на русском работают значительно хуже английского — модель обучена в основном на англоязычных данных
Local-запуск Large требует от 16 GB VRAM (24 GB рекомендуется) — на 8 GB карте идёт только Medium
API оплата картами МИР не принимается — только зарубежная Visa/Mastercard, оплата через platform.stability.ai
Community License имеет порог: при выручке свыше $1M/год обязателен переход на Enterprise-лицензию

Подробный обзор

Что такое Stable Diffusion 3.5

Stable Diffusion 3.5 — семейство open-weight моделей генерации изображений от британско-американской компании Stability AI, выпущенное 22 октября 2024 года. Это итерация поверх Stable Diffusion 3 (которая вышла в феврале 2024 и подверглась критике за качество людей и анатомию) — версия 3.5 закрыла главные провалы тройки, улучшила prompt adherence и стала лидером среди open-source моделей по точности следования инструкциям. Релиз состоит из трёх вариантов под разные задачи и железо.

Три модели в линейке

  • Stable Diffusion 3.5 Large — флагман, 8.1 миллиарда параметров, генерирует изображения до 1 мегапикселя. Лучшее качество в линейке, лидер по prompt adherence среди open-source. Требует от 16 GB VRAM (рекомендуется 24 GB)
  • Stable Diffusion 3.5 Large Turbo — дистиллированная версия Large на тех же 8.1B параметрах. Генерирует за 4 шага вместо обычных ~30 — в разы быстрее при сопоставимом качестве на простых сценах
  • Stable Diffusion 3.5 Medium — компактная модель 2.5B параметров, разрешение от 0.25 до 2 МП, требует всего 9.9 GB VRAM (без текстовых энкодеров) — запускается на потребительских GPU вроде RTX 3060/4070

Под капотом — улучшенная архитектура MMDiT-X (Multimodal Diffusion Transformer) с Query-Key Normalization в трансформерных блоках. Это стабилизирует обучение и упрощает файн-тюнинг — что важно для тех кто хочет адаптировать модель под свой стиль или предметную область.

Лицензия и коммерческое использование

Все три модели распространяются под Stability AI Community License. Условия лояльные: коммерческое использование бесплатно для физических лиц и компаний с годовой выручкой до $1 миллиона. Это покрывает большинство индивидуальных авторов, стартапов и студий. Для бизнеса с выручкой выше $1M/год обязательна Enterprise License от Stability — её условия согласуются индивидуально. Веса можно скачать, обучить на них LoRA, файн-тюнинг и распространять полученные модели.

Где запускать: API, self-host и сервисы

Основные варианты использования:

  • Self-host — скачать веса с HuggingFace и запустить через ComfyUI, Diffusers или Automatic1111 (с расширениями). Бесплатно, нужен GPU
  • Stability API на platform.stability.ai — Large $0.065, Large Turbo $0.04, Medium $0.035 за изображение, 25 бесплатных кредитов при регистрации
  • Сторонние хостинги — Replicate, Fal, WaveSpeed, Together AI. У всех свои цены и API-обёртки, часто дешевле официального
  • Stable Assistant — собственный чат-интерфейс Stability от $9/мес, включает SD 3.5 + Stable Audio + Stable Fast 3D, без необходимости знать API

Для NVIDIA RTX-юзеров есть бонус: TensorRT-оптимизация даёт до 2.3× ускорения на Large и 1.7× на Medium, плюс снижает требования к VRAM на 40%.

Доступность и особенности использования в России

Веса SD 3.5 на HuggingFace не блокируются для российских пользователей — open-source модель можно скачать и запускать локально где угодно. Сайт stability.ai и platform.stability.ai открываются из России без VPN. Однако оплата API: российские карты МИР не принимаются — только зарубежная Visa/Mastercard через Stripe. Альтернатива — пользоваться сторонними хостингами (Replicate, Fal принимают зарубежные карты тоже, но иногда чуть проще зарегистрироваться). Интерфейс везде на английском, локализации нет. Промпты на русском модель технически принимает, но качество результата заметно ниже английского — стандартная рекомендация: писать промпты на английском, можно сначала перевести через ChatGPT/DeepL/Claude. Для запуска локально полностью офлайн SD 3.5 — оптимальный выбор когда нужна приватность и независимость от внешних сервисов.

Часто задаваемые вопросы

Что такое Stable Diffusion 3.5 и чем отличается от SD 3?
Stable Diffusion 3.5 — семейство open-weight моделей Stability AI, выпущенное 22 октября 2024 года. Это итерация поверх Stable Diffusion 3 (февраль 2024, которая была раскритикована за слабое качество людей и анатомию). Версия 3.5 закрыла главные провалы тройки, улучшила prompt adherence и стала лидером среди open-source моделей по точности следования инструкциям. В линейке три варианта: Large (8.1B параметров), Large Turbo (8.1B, 4 шага) и Medium (2.5B, для слабого железа).
Чем отличаются Large, Large Turbo и Medium?
Large — флагман на 8.1B параметров, лучшее качество и prompt adherence, требует от 16 GB VRAM, разрешение до 1 МП. Large Turbo — дистиллированная версия Large на тех же 8.1B, генерирует за 4 шага вместо ~30 — в разы быстрее при сопоставимом качестве на простых сценах. Medium — компактная модель 2.5B параметров, требует всего 9.9 GB VRAM, разрешение 0.25–2 МП, оптимальна для запуска на потребительских GPU (RTX 3060/4070).
Какая лицензия и можно ли использовать коммерчески?
Stability AI Community License. Коммерческое использование бесплатно для физических лиц и компаний с годовой выручкой до $1 миллиона — это покрывает большинство индивидуальных авторов, стартапов и студий. Можно скачать веса, обучить LoRA или файн-тюнинг и распространять. При выручке свыше $1M/год обязательна Enterprise License — условия согласуются с Stability AI индивидуально.
Какие требования к железу для локального запуска?
SD 3.5 Large — от 16 GB VRAM, рекомендуется 24 GB (RTX 3090/4090). SD 3.5 Medium — всего 9.9 GB VRAM (RTX 3060 12GB, RTX 4070 12GB). На NVIDIA RTX с TensorRT-оптимизацией Large даёт до 2.3× ускорения и снижает требования к VRAM на 40%. Если GPU слабее — есть GGUF и FP8 кванты от сообщества, на 8 GB VRAM запускается Medium и квантизованный Large.
Работает ли Stable Diffusion 3.5 в России?
Да. Open-source веса на HuggingFace не блокируются и доступны для скачивания из России без VPN. Сайт stability.ai и platform.stability.ai открываются из РФ напрямую — Stability AI не блокирует по геолокации. Для локального запуска вообще никаких внешних сервисов не нужно — всё работает офлайн на своём железе.
Можно ли оплатить Stability API российской картой?
Нет, российские карты системы МИР не принимаются. Оплата через Stripe идёт только по зарубежным Visa/Mastercard. Альтернатива — пользоваться сторонними хостингами SD 3.5 (Replicate, Fal, WaveSpeed, Together AI) — у них свои условия, но обычно та же история с зарубежными картами. Или вариант без оплаты вообще: скачать веса и запускать локально на своём железе.
Сколько стоит генерация через API?
Через официальный Stability API: Large — $0.065 за изображение, Large Turbo — $0.04, Medium — $0.035. При регистрации даётся 25 бесплатных кредитов (1 кредит = $0.01). Сторонние хостинги (Replicate, Fal, WaveSpeed) часто дешевле — там цена за изображение может быть $0.02–0.04 в зависимости от модели и провайдера.
Какие альтернативы Stable Diffusion 3.5 в open-source и в коммерческих моделях?
Open-source: FLUX.1 [dev] от Black Forest Labs (часто лучше качество, более liberal лицензия), Stable Diffusion XL (старее, но огромная экосистема LoRA), Qwen-Image от Alibaba (Apache 2.0). Закрытые модели: FLUX 1.1 Pro (топ по фотореализму), Midjourney v7 (топ по художественности), GPT Image 2 от OpenAI (лучший плотный текст на картинке), Google Imagen 4. Для большинства задач open-source SD 3.5 + FLUX закрывают потребности; закрытые модели нужны для топового фотореализма или специфики.

Все эти инструменты — уже на Genova-ai

Картинки, видео, музыка, голос и ИИ-чат в одном месте. Без VPN и зарубежных карт.

Картинки
Видео
Музыка
Голос
ИИ-чат
Попробовать бесплатно