LAION (singkatan dari Large-scale Artificial Intelligence Open Network) adalah sebuah lembaga nirlaba Jerman yang membuat model dan kumpulan data kecerdasan buatan dengan sumber terbuka.[1] Lembaga ini dikenal karena merilis kumpulan data besar berisikan gambar dan deskripsi yang diambil dari web yang telah digunakan untuk melatih model teks-ke-gambar, seperti Stable Diffusion dan Imagen.[2][3]
Pada Februari 2023, LAION dicantumkan dalam gugatan Getty Images terhadap Stable Diffusion.[4] Pada April 2023, LAION digugat oleh seorang fotografer Jerman yang ingin gambarnya dicopot dari set latihan.[5]
Pada 15 April 2023, LAION dan kontributornya merilis ke publik sebuah asisten chatbot sumber terbuka OpenAssistant.
Kumpulan data gambar
LAION telah merilis sejumlah kumpulan data besar berupa pasangan gambar-deskripsi yang telah digunakan oleh para peneliti kecerdasan buatan. Datanya bersumber dari Common Crawl, sebuah kumpulan data yang diambil dari laman web. Pengembang menelusuri data untuk mencari tag <img> dan memperlakukan atribut alt sebagai deskripsi. Mereka menggunakan CLIP untuk mengidentifikasi dan membuang gambar yang isinya tidak sesuai dengan deskripsi.[6] LAION tidak menghost isi gambar yang diambil, kumpulan data berisikan banyak URL yang terjalin ke gambar, peneliti harus mengunduhnya sendiri.[7]
Kumpulan data terawal, LAION-400M, dirilis pada Agustus 2021 dan berisikan 400 juta pasangan gambar-deskripsi. Pasangan ini diekstrak dari laman web secara acak yang diambil oleh Common Crawl dari tahun 2014 sampai tahun 2021.[8] Hal ini adalah sebuah upaya untuk mereka ulang proses yang digunakan oleh OpenAI untuk mengumpulkan 400 juta pasangan gambar-deskripsi yang digunakan untuk melatih model CLIP - perusahaan ini memilih untuk membuka sumber kode dan bobotnya, tetapi membuka sumber untuk kumpulan data latihnya.[6] Imagen, sebuah model teks-ke-gambar yang diumumkan oleh Google Brain pada tahun 2022, dilatih pada LAION-400M dengan kombinasi berupa kumpulan data internal.[9]
Sebuah penerus dengan lebih dari 5 juta pasangan, LAION-5B, dirilis pada Maret 2022.[10] Saat dirilis, ini adalah kumpulan data berisikan pasangan gambar-deskripsi dengan sumber terbuka terbesar yang pernah ada.[6] Pembuatannya didanai oleh Doodlebot, Hugging Face, dan Stability AI, perusahaan dibalik model teks-ke-gambar Stable Diffusion, yang menggunakannya sebagai bahan latih.[11]
OpenAssistant adalah sebuah asisten chatbot berbasis kecerdasan buatan dengan sumber terbuka yang memahami tugas, bisa berinteraksi dengan sistem pihak ketiga dan mengambil informasi secara dinamis untuk bekerja. Proyek ini dikembangkan oleh sebuah kelompok sukarelawan yang berkolaborasi dengan LAION. Salah satu tujuan dari pengembangan adalah memberikan akses bebas terhadap model bahasa besar yang dapat berjalan pada perangkat keras tipe konsumen.[12] Proyek ini dibekingi oleh sebuah penggalangan dana yang berlangsung di seluruh dunia dengan melibatkan 13.500 sukarelawan yang telah membuat 600 ribu titik data.[13][14]
Referensi
^"About". LAION.ai. Diakses tanggal 26 September 2022.