fr LAION

Cadre
Type	ONG à but non lucratif
Domaines d'activité	Intelligence artificielle, intelligence artificielle
Fondateur	Christoph Schuhmann, ; Jenia Jitsev, ; Richard Vencu, ; Robert Kaczmarczyk, ; Theo Coombes, ; Mehdi Cherti, ; Aarush Katta, ; Jan Ebert
Produit	Open Assistant (en)
Site web	(en) laion.ai

LAION (acronyme de Large-scale Artificial Intelligence Open Network) est une organisation à but non lucratif allemande qui crée et diffuse des modèles et des jeux de données d'intelligence artificielle en open source, pour entrainer des modèles d'apprentissage automatique capables notamment de générer des images numériques photoréalistes à partir de demandes exprimées en langage naturel^[1].

Historique

LAION s'est surtout et d'abord fait connaître pour avoir publié un certain nombre de grands jeux de données d'images et de légendes extraits du Web, lesquels ont été utilisés pour entraîner plusieurs « modèles de génération d'images à partir de texte» très médiatisés, comme Stable Diffusion et Imagen^[2]^,^[3].

Le 15 avril 2023, LAION et ses contributeurs ont rendu public un assistant personnel de type chatbot, basé sur l'intelligence artificielle en open source : OpenAssistant^[4].

Jeux de données d'images

LAION a mis à disposition de tous plusieurs grands jeux de données de type « paires image-légende », qui ont été largement utilisés par les chercheurs en intelligence artificielle.

Ces données sont dérivées du Common Crawl, un jeu de données de pages web extraites du Web.

Les développeurs ont recherché et trouvé dans le Web (html) des images avec des balises <img>, et ils ont traité leurs attributs alt comme des légendes. Et ils ont utilisé CLIP pour identifier et éliminer les images dont le contenu ne semblait pas correspondre à leurs légendes^[5].

LAION n'héberge pas le contenu des images en question, mais les jeux de données contiennent les URL pointant vers les images (images que les chercheurs intéressés doivent télécharger eux-mêmes)^[6].

Histoire

Le premier jeu de données de ce type, baptisé LAION-400M, a été publié en août 2021 ; il comprenait 400 millions de paires image-légende. Ces paires avaient été extraites d'un sous-ensemble aléatoire de pages web extraites par Common Crawl entre 2014 et 2021^[5]. Il s'agissait d'une tentative de reproduire le processus utilisé par OpenAI pour collecter les 400 millions de paires image-légende qu'ils ont utilisées pour entraîner le modèle CLIP — la société avait choisi d'ouvrir le code et les poids du modèle, mais pas son jeu de données d'entraînement^[7].

Imagen, un modèle de génération d'images à partir de texte, annoncé par Google Brain en 2022, a, lui, été entraîné sur LAION-400M en combinaison avec des jeux de données internes privés^[8].

Un successeur de plus de 5 milliards de paires, LAION-5B, a été publié en mars 2022. Au moment de sa publication, il s'agissait du plus grand jeu de données disponible gratuitement de paires image-légende existant^[9]. Sa création a été financée par Doodlebot.

Aspects juridiques

En février 2023, LAION a été citée dans le procès intenté par Getty Images contre Stable Diffusion en tant que tierce partie^[10].

En avril 2023, LAION a été directement poursuivie par un photographe allemand qui voulait faire retirer ses images du jeu de données d'entraînement^[11].

Notes et références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « LAION » (voir la liste des auteurs).

↑ (en) « about », sur laion.ai (consulté le 2 juin 2023).
↑ (en-US) Benj Edwards, « Have AI image generators assimilated your art? New tool lets you check », sur Ars Technica, 15 septembre 2022 (consulté le 2 juin 2023).
↑ (en) « The Future of AI Relies on a High School Teacher’s Free Database », sur Bloomberg.com, 24 avril 2023 (consulté le 2 juin 2023).
↑ « Open Assistant », sur open-assistant.io (consulté le 2 juin 2023).
↑ ^{a et b} (en) Stefan Larson, Navtej Singh, Saarthak Maheshwari et Shanti Stewart, « Exploring Out-of-Distribution Generalization in Text Classifiers Trained on Tobacco-3482 and RVL-CDIP », ICDAR 2021 Workshops (conférence),‎ 5 août 2021 (DOI 10.48550/arXiv.2108.02684, lire en ligne, consulté le 2 juin 2023).
↑ (en) Dataset Description and Download Instructions - LAION/LAION-400M: A Large-Scale Web Image Dataset with Textual Pairs for Text-to-Image Generation and Image Retrieval Tasks (github.com) ; https://github.com/LAION/LAION-400M#dataset-description-and-download-instructions ; consulté le 1^er juin 2023.
↑ (en) Tom Simonite, « OpenAI Shares the Magic—and the Risks—of Its Visionary AI », Wired, 19 janvier 2021 (consulté le 1^er juin 2023).
↑ (en) Chitwan Saharia, William Chan, Saurabh Saxena et Lala Li, « Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding », Neural Information Processing Systems (conférence),‎ 23 mai 2022 (DOI 10.48550/arXiv.2205.11487, lire en ligne, consulté le 2 juin 2023).
↑ (en) Kyle Wiggers, « Stability AI launches Stable Diffusion, a text-to-image model trained on a new open source dataset », VentureBeat, 15 mars 2022 (consulté le 1^er juin 2023).
↑ (en) James Vincent, « Getty Images sues Stability AI over text-to-image model that used its photos », The Verge, 10 février 2023 (consulté le 1^er juin 2023).
↑ (en) Kai Dambach, « German photographer sues LAION over image dataset », DW, 23 avril 2023 (consulté le 1^er juin 2023).

Voir aussi

Bibliographie

(en) Chloe Xiang, « A Photographer Tried to Get His Photos Removed from an AI Dataset. He Got an Invoice Instead. », Vice, 28 avril 2023.

Articles connexes

Liens externes

(en) Site officiel

[LAION-1-1] (en) « about », sur laion.ai (consulté le 2 juin 2023).

[LAION-Edwards-2] (en-US) Benj Edwards, « Have AI image generators assimilated your art? New tool lets you check », sur Ars Technica, 15 septembre 2022 (consulté le 2 juin 2023).

[3] (en) « The Future of AI Relies on a High School Teacher’s Free Database », sur Bloomberg.com, 24 avril 2023 (consulté le 2 juin 2023).

[4] « Open Assistant », sur open-assistant.io (consulté le 2 juin 2023).

[LAION-5-5] {a et b} (en) Stefan Larson, Navtej Singh, Saarthak Maheshwari et Shanti Stewart, « Exploring Out-of-Distribution Generalization in Text Classifiers Trained on Tobacco-3482 and RVL-CDIP », ICDAR 2021 Workshops (conférence),‎ 5 août 2021 (DOI 10.48550/arXiv.2108.02684, lire en ligne, consulté le 2 juin 2023).

[6] (en) Dataset Description and Download Instructions - LAION/LAION-400M: A Large-Scale Web Image Dataset with Textual Pairs for Text-to-Image Generation and Image Retrieval Tasks (github.com) ; https://github.com/LAION/LAION-400M#dataset-description-and-download-instructions ; consulté le 1^er juin 2023.

[LAION-7-7] (en) Tom Simonite, « OpenAI Shares the Magic—and the Risks—of Its Visionary AI », Wired, 19 janvier 2021 (consulté le 1^er juin 2023).

[8] (en) Chitwan Saharia, William Chan, Saurabh Saxena et Lala Li, « Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding », Neural Information Processing Systems (conférence),‎ 23 mai 2022 (DOI 10.48550/arXiv.2205.11487, lire en ligne, consulté le 2 juin 2023).

[LAION-10-9] (en) Kyle Wiggers, « Stability AI launches Stable Diffusion, a text-to-image model trained on a new open source dataset », VentureBeat, 15 mars 2022 (consulté le 1^er juin 2023).

[LAION-2-10] (en) James Vincent, « Getty Images sues Stability AI over text-to-image model that used its photos », The Verge, 10 février 2023 (consulté le 1^er juin 2023).

[LAION-3-11] (en) Kai Dambach, « German photographer sues LAION over image dataset », DW, 23 avril 2023 (consulté le 1^er juin 2023).

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

LAION