ru Stable Diffusion

Stable Diffusion
Stable Diffusion
Тип	модель преобразования текста в изображение[вд], модель латентной переменной[вд] и диффузионная модель[вд]
Написана на	Python
Операционные системы	Linux, macOS и Windows
Первый выпуск	22 августа 2022
Последняя версия	3.5 (23 октября 2024);
Репозиторий	github.com/Stability-AI/…
Лицензия	Stability AI Community License[вд]
Сайт	stability.ai/stab… (англ.)
	Медиафайлы на Викискладе

Stable Diffusion (дословно «стабильная диффузия») — модель глубокого обучения создающая изображения по текстовым описаниям^[англ.], с открытым исходным кодом^[2]. Выпущена в 2022 году и основанна на методах диффузии^[англ.]. В основном используется для создания детальных изображений на основе текстовых описаний, хотя ее также можно применять и для других задач, например дорисовывать наброски и редактировать исходные картинки^[3]. Разработана группой компаний CompVis в Мюнхенском университете. Кроме того, в разработке участвовали Runway, EleutherAI и LAION^[4]^[5]^[6]^[7].

Stable Diffusion — модель скрытой диффузии, своего рода глубокая генеративная нейронная сеть. Код и вес модели были открыты^[8]. Может работать на большинстве потребительских устройств, оснащенных графическим процессором с объемом видеопамяти не менее 4 ГБ. Её появление ознаменовало отход от предыдущих проприетарных моделей преобразования текста в изображение, таких как DALL-E и Midjourney, которые были доступны только через облачные сервисы^[9]^[10].

В настоящее время существует ряд наиболее распространенные модификации: Stable Diffusion v1.0, Stable Diffusion XL и Stable Diffusion 3. Последняя третья версия построена на архитектуре DiT трансформер^[11], в отличие от первых двух имеющих в своей основе U-Net ^[12].

См. также

Примечания

↑ https://stability.ai/news/introducing-stable-diffusion-3-5
↑ Stable Diffusion. — 2023-01-05. Архивировано 18 января 2023 года.
↑ Stable Diffusion: что за нейросеть, как работает, инструкция (рус.). РБК Тренды. Дата обращения: 10 марта 2024. Архивировано 10 марта 2024 года.
↑ Leaked deck raises questions over Stability AI's Series A pitch to investors (неопр.). sifted.eu. Дата обращения: 20 июня 2023. Архивировано 29 июня 2023 года.
↑ Revolutionizing image generation by AI: Turning text into images (неопр.). www.lmu.de. Дата обращения: 21 июня 2023. Архивировано 17 сентября 2022 года.
↑ Mostaque, Emad Stable Diffusion came from the Machine Vision & Learning research group (CompVis) @LMU_Muenchen (англ.). Twitter (2 ноября 2022). Дата обращения: 22 июня 2023. Архивировано 20 июля 2023 года.
↑ Stable Diffusion Launch Announcement (неопр.). Stability.Ai. Дата обращения: 6 сентября 2022. Архивировано 5 сентября 2022 года.
↑ Stable Diffusion Repository on GitHub (неопр.). CompVis - Machine Vision and Learning Research Group, LMU Munich (17 сентября 2022). Дата обращения: 17 сентября 2022. Архивировано 18 января 2023 года.
↑ The new killer app: Creating AI art will absolutely crush your PC (неопр.). PCWorld. Дата обращения: 31 августа 2022. Архивировано 31 августа 2022 года.
↑ Vincent, James AI art tools Stable Diffusion and Midjourney targeted with copyright lawsuit (неопр.). The Verge (16 января 2023). Дата обращения: 16 января 2023. Архивировано 9 марта 2023 года.
↑ Scaling Rectified Flow Transformers for High-Resolution Image Synthesis (англ.). arxiv.org. Дата обращения: 28 июня 2024. Архивировано 28 июля 2024 года.
↑ Архитектура Stable Diffusion: Face ID, Lighting (рус.). habr.ru. Дата обращения: 28 июня 2024. Архивировано 28 июля 2024 года.

[_97bb0f4885c65ec1-1] ttps://stability.ai/news/introducing-stable-diffusion-3-5

[2] Stable Diffusion. — 2023-01-05. Архивировано 18 января 2023 года.

[3] Stable Diffusion: что за нейросеть, как работает, инструкция (рус.). РБК Тренды. Дата обращения: 10 марта 2024. Архивировано 10 марта 2024 года.

[sifted_financialtimes-4] Leaked deck raises questions over Stability AI's Series A pitch to investors (неопр.). sifted.eu. Дата обращения: 20 июня 2023. Архивировано 29 июня 2023 года.

[lmu_lauch-5] Revolutionizing image generation by AI: Turning text into images (неопр.). www.lmu.de. Дата обращения: 21 июня 2023. Архивировано 17 сентября 2022 года.

[6] Mostaque, Emad Stable Diffusion came from the Machine Vision & Learning research group (CompVis) @LMU_Muenchen (англ.). Twitter (2 ноября 2022). Дата обращения: 22 июня 2023. Архивировано 20 июля 2023 года.

[stable-diffusion-launch-7] Stable Diffusion Launch Announcement (неопр.). Stability.Ai. Дата обращения: 6 сентября 2022. Архивировано 5 сентября 2022 года.

[stable-diffusion-github-8] Stable Diffusion Repository on GitHub (неопр.). CompVis - Machine Vision and Learning Research Group, LMU Munich (17 сентября 2022). Дата обращения: 17 сентября 2022. Архивировано 18 января 2023 года.

[pcworld-9] The new killer app: Creating AI art will absolutely crush your PC (неопр.). PCWorld. Дата обращения: 31 августа 2022. Архивировано 31 августа 2022 года.

[10] Vincent, James AI art tools Stable Diffusion and Midjourney targeted with copyright lawsuit (неопр.). The Verge (16 января 2023). Дата обращения: 16 января 2023. Архивировано 9 марта 2023 года.

[11] Scaling Rectified Flow Transformers for High-Resolution Image Synthesis (англ.). arxiv.org. Дата обращения: 28 июня 2024. Архивировано 28 июля 2024 года.

[12] Архитектура Stable Diffusion: Face ID, Lighting (рус.). habr.ru. Дата обращения: 28 июня 2024. Архивировано 28 июля 2024 года.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]