Berita Utama

Berita tentang Indonesia

Sumber terbuka DALL-E “Difusi Terbuka” sekarang tersedia

Sumber terbuka DALL-E “Difusi Terbuka” sekarang tersedia

LogoModernisasi

Sumber Terbuka DALL-E

Gambar: spread stabil

Artikel hanya dapat dilihat dengan JavaScript diaktifkan. Harap aktifkan JavaScript di browser Anda dan muat ulang halaman.

Diperbarui 21 Agustus 2022:

Difusi Terbuka sekarang tersedia melalui antarmuka web. Setelah masuk, Anda dapat menggunakan perintah teks untuk membuat gambar, mirip dengan DALL-E 2, dan Anda memiliki sejumlah opsi penyetelan tambahan. tepat seperti DALL-E 2 memiliki batasan entri perintah Untuk gambar seksual atau kekerasan.

Model penerapan terbuka, yang dapat berjalan di tempat atau di cloud, tidak akan memiliki batasan ini. Formulir tersebut diharapkan akan dipublikasikan di Github dalam beberapa hari ke depan.

Anda dapat mencoba Web Open Diffusion secara gratis. Untuk setara dengan hanya di bawah 12 euro, Anda dapat membeli sekitar 1.000 pesanan gambar. Jumlah sebenarnya dari perintah gambar yang tersedia tergantung pada kerumitan perhitungan dan presisi yang terlibat dalam gambar Anda.

Di sini Anda dapat mengakses Dreamstudio, antarmuka web untuk Difusi Terbuka.

Artikel asli tertanggal 14 Agustus 2022:

Kontes DALL-E Sumber Terbuka Berjalan di Kartu Grafis Anda

DALL-E 2 OpenAI mendapat persaingan gratis dengan Difusi Stabil. Proyek ini didukung oleh gerakan AI open source dan AI Stabilitas startup.

Kecerdasan buatanyang dapat menghasilkan gambar dari deskripsi teks, telah mengalami kemajuan pesat sejak awal tahun 2021. Saat itu, OpenAI menunjukkan hasil yang mengesankan DALL-E 1 dan KLIP. Komunitas open source telah menggunakan CLIP untuk beberapa proyek alternatif sepanjang tahun. Kemudian, pada tahun 2022, OpenAI merilis versi yang mengesankan DALL-E 2Google menunjukkan Foto-foto Dan UpacaraDan penerbangan tengah Jangkau jutaan orang dan warna Media sosial membanjiri.

Startup Stabilitas AI telah mengumumkan peluncurannya sekarang penyebaran stabilsistem serupa DALL-E-2 lainnya yang awalnya akan tersedia secara bertahap untuk peneliti baru dan grup lain melalui server Discord.

Setelah fase pengujian, Difusi Stabil kemudian akan dirilis secara gratis – kode dan model yang sepenuhnya terlatih akan diterbitkan sebagai sumber terbuka. Juga akan ada versi host dengan antarmuka web yang dapat digunakan pengguna untuk menguji sistem.

Stabilitas AI mendanai pesaing DALL-E 2 secara gratis

Difusi Stabil dibuat dalam kolaborasi antara peneliti di Stability AI, RunwayML dan LMU Munich serta EleutherAI dan LAION. Kelompok riset kolektif EleutherAI dikenal, antara lain, untuk model bahasa sumber terbuka GPT-J-6B dan GPT-NeoX-20B Terkenal dan juga mencari model multimedia.

LAION nirlaba (Jaringan Terbuka untuk Kecerdasan Buatan Skala Besar) menyediakan data pelatihan dengan kumpulan data sumber terbuka LAION 5B, yang disaring melalui umpan balik manusia pada fase pengujian pertama, dan dengan demikian menghasilkan kumpulan data pelatihan LAION-Aesthetics akhir.

Patrick Esser dari landasan pacu dan Robin Rombach dari LMU Munich memimpin proyek tersebut, berdasarkan pekerjaan mereka di CompVis Group di University of Heidelberg. Di sinilah penggunaan yang sering berperan VQGAN Dan Difusi laten. Yang terakhir berfungsi sebagai dasar untuk publikasi yang stabil dengan pencarian dari OpenAI dan Google Brain.

Matematikawan dan ilmuwan komputer Imad Moustaq berada di belakang Stability AI, yang didirikan pada tahun 2020. Dia bekerja sebagai analis untuk beberapa hedge fund selama beberapa tahun sebelum beralih ke bisnis umum. Pada 2019, ia membantu mendirikan Symmitree, sebuah proyek yang berupaya mengurangi biaya ponsel cerdas dan akses internet untuk populasi rentan.

Dengan Stability AI dan kekayaannya sendiri, Mostaque ingin memperkuat komunitas open source untuk penelitian AI. Perusahaannya sebelumnya mendukung pembuatan kumpulan data “LAION 5B”, misalnya. Untuk melatih model penerapan yang stabil, Stability AI memperkenalkan server dengan 4.000 GPU Nvidia A100.

“Tidak ada yang memiliki hak suara kecuali 75 karyawan kami – bukan miliarder, dana besar, pemerintah, atau siapa pun yang mengontrol perusahaan atau komunitas yang kami dukung. Kami sepenuhnya independen,” kata Mostaque kepada TechCrunch. “Kami menggunakan kekuatan komputasi kami untuk mempercepat AI open source.”

Penerapan Stabil adalah pengajar sumber terbuka

Difusi Stabil saat ini sedang diuji, dan tambahan baru sedang didistribusikan dalam gelombang. Hasilnya, yang dapat dilihat di Twitter, misalnya, menunjukkan penampilan pesaing nyata DALL-E-2 di sini.

Difusi stabil lebih fleksibel daripada Midjourney, tetapi memiliki resolusi yang sedikit lebih rendah daripada DALL-E 2. | gambar: github

Tidak seperti DALL-E 2, difusi stabil Foto kepribadian terkemuka dan membangkitkan motif lain, Diblokir oleh OpenAI dengan DALL-E 2. Sistem lain seperti Midjourney atau Pixelz.ai dapat melakukan ini, tetapi tidak satupun dari mereka mencapai kualitas yang sama dengan berbagai macam terlihat di Difusi Stabil – dan tidak ada yang lain adalah open source.

Difusi Stabil dikatakan sudah berjalan pada satu kartu grafis dengan VRAM 5,1 GB – proyek ini membawa teknologi AI ke tepi yang sebelumnya hanya tersedia melalui layanan cloud.

Dengan demikian, Difusi Stabil memberi peneliti dan pihak yang berkepentingan tanpa akses ke server GPU kesempatan untuk bereksperimen dengan model AI generatif modern. Model ini juga harus bekerja pada MacBook dengan chip M1 Apple. Namun, pembuatan gambar membutuhkan waktu beberapa menit, bukan detik.

DALL-E 2 OpenAI mendapat kompetisi open source. Di belakangnya adalah komunitas open source dan startup Stability AI. | gambar: github

Stability AI sendiri juga ingin memungkinkan perusahaan untuk melatih varian penyebaran stabil mereka sendiri. Dengan demikian, model multimedia mengikuti jalur yang telah diambil oleh model bahasa besar: bergerak menjauh dari penyedia tunggal menuju ketersediaan banyak alternatif melalui open source.

Runway sudah mencari pengeditan teks-ke-video yang diaktifkan oleh penerapan yang stabil.

Spread Stabil: Kotak Pandora dan Bunga Bersih

Tentu saja, dengan akses terbuka dan kemampuan untuk menjalankan model pada GPU yang banyak digunakan, potensi penyalahgunaan meningkat secara signifikan.

“Persentase tertentu orang canggung dan aneh, tapi itulah manusia,” kata Mustak. “Kami yakin bahwa teknologi ini akan berkembang dan bahwa sikap yang agak paternalistik dan merendahkan dari banyak penggemar AI adalah kesalahan karena mereka tidak mempercayai masyarakat.”

Namun, Mostaque berpendapat bahwa ketersediaan gratis memungkinkan masyarakat untuk mengembangkan tindakan pencegahan.

“Kami mengambil langkah-langkah keamanan yang ekstensif, termasuk mengembangkan alat modern, untuk mengurangi potensi bahaya pada keterlibatan dan layanan kami. Dengan ratusan ribu yang mengerjakan model ini, kami yakin bahwa manfaat bersihnya akan sangat positif dan dengan miliaran orang yang menggunakan ini teknologi, bahaya akan memudar ke latar belakang.” “.

Informasi lebih lanjut tersedia di stable-spread-github. Beberapa contoh kemampuan pembuatan gambar Difusi Stabil dapat ditemukan di file Subreddit Penyebaran Stabil. di sini pergi ke Berlangganan Beta ke Difusi Stabil.