PixArt
Открытый проект генерации изображений с диффузионной Transformer-моделью от Huawei Noah's Ark Lab.
О компании
PixArt — это семейство открытых моделей генерации изображений на основе Diffusion Transformer (DiT), разработанных исследовательской лабораторией Huawei Noah's Ark Lab совместно с академическими партнёрами.
Проект включает версии PixArt-α, PixArt-Σ и другие, ориентированные на высокое качество text-to-image генерации при минимальных вычислительных затратах по сравнению с коммерческими решениями. Модели распространяются как open-source и доступны на Hugging Face и GitHub.
Все модели PixArt (2)
🎨Картинки (2)
Финальная модель открытого семейства PixArt (апрель 2024): DiT на 0.6B параметров с прямой генерацией до 4K через KV-сжатие токенов. Обходила SDXL (2.6B) по качеству при размере в 4 раза меньше. Лучший выбор семейства для слабых GPU; дальше линия ушла в Sana (NVIDIA).
Открытая DiT-модель генерации изображений от Huawei Noah's Ark Lab (октябрь 2023, ICLR 2024 Spotlight): 0.6B параметров, обучение всего за ~10% стоимости Stable Diffusion 1.5. Одна из первых text-to-image на Diffusion Transformer — предтеча архитектуры SD3 и FLUX. Развитие остановлено в 2024 (преемники — PixArt-Sigma и Sana).