Modernisasi
Gambar: spread stabil
Artikel hanya dapat dilihat dengan JavaScript diaktifkan. Harap aktifkan JavaScript di browser Anda dan muat ulang halaman.
Diperbarui 21 Agustus 2022:
Difusi Terbuka sekarang tersedia melalui antarmuka web. Setelah masuk, Anda dapat menggunakan perintah teks untuk membuat gambar, mirip dengan DALL-E 2, dan Anda memiliki sejumlah opsi penyetelan tambahan. tepat seperti DALL-E 2 memiliki batasan entri perintah Untuk gambar seksual atau kekerasan.
Model penerapan terbuka, yang dapat berjalan di tempat atau di cloud, tidak akan memiliki batasan ini. Formulir tersebut diharapkan akan dipublikasikan di Github dalam beberapa hari ke depan.
Anda dapat mencoba Web Open Diffusion secara gratis. Untuk setara dengan hanya di bawah 12 euro, Anda dapat membeli sekitar 1.000 pesanan gambar. Jumlah sebenarnya dari perintah gambar yang tersedia tergantung pada kerumitan perhitungan dan presisi yang terlibat dalam gambar Anda.
Di sini Anda dapat mengakses Dreamstudio, antarmuka web untuk Difusi Terbuka.
Artikel asli tertanggal 14 Agustus 2022:
Kontes DALL-E Sumber Terbuka Berjalan di Kartu Grafis Anda
DALL-E 2 OpenAI mendapat persaingan gratis dengan Difusi Stabil. Proyek ini didukung oleh gerakan AI open source dan AI Stabilitas startup.
Kecerdasan buatanyang dapat menghasilkan gambar dari deskripsi teks, telah mengalami kemajuan pesat sejak awal tahun 2021. Saat itu, OpenAI menunjukkan hasil yang mengesankan DALL-E 1 dan KLIP. Komunitas open source telah menggunakan CLIP untuk beberapa proyek alternatif sepanjang tahun. Kemudian, pada tahun 2022, OpenAI merilis versi yang mengesankan DALL-E 2Google menunjukkan Foto-foto Dan UpacaraDan penerbangan tengah Jangkau jutaan orang dan warna Media sosial membanjiri.
Startup Stabilitas AI telah mengumumkan peluncurannya sekarang penyebaran stabilsistem serupa DALL-E-2 lainnya yang awalnya akan tersedia secara bertahap untuk peneliti baru dan grup lain melalui server Discord.
Setelah fase pengujian, Difusi Stabil kemudian akan dirilis secara gratis – kode dan model yang sepenuhnya terlatih akan diterbitkan sebagai sumber terbuka. Juga akan ada versi host dengan antarmuka web yang dapat digunakan pengguna untuk menguji sistem.
Stabilitas AI mendanai pesaing DALL-E 2 secara gratis
Difusi Stabil dibuat dalam kolaborasi antara peneliti di Stability AI, RunwayML dan LMU Munich serta EleutherAI dan LAION. Kelompok riset kolektif EleutherAI dikenal, antara lain, untuk model bahasa sumber terbuka GPT-J-6B dan GPT-NeoX-20B Terkenal dan juga mencari model multimedia.
LAION nirlaba (Jaringan Terbuka untuk Kecerdasan Buatan Skala Besar) menyediakan data pelatihan dengan kumpulan data sumber terbuka LAION 5B, yang disaring melalui umpan balik manusia pada fase pengujian pertama, dan dengan demikian menghasilkan kumpulan data pelatihan LAION-Aesthetics akhir.
Patrick Esser dari landasan pacu dan Robin Rombach dari LMU Munich memimpin proyek tersebut, berdasarkan pekerjaan mereka di CompVis Group di University of Heidelberg. Di sinilah penggunaan yang sering berperan VQGAN Dan Difusi laten. Yang terakhir berfungsi sebagai dasar untuk publikasi yang stabil dengan pencarian dari OpenAI dan Google Brain.
Robot Jazz. oleh TheRealBissy# penyebaran stabil #AIArt # sebuah pekerjaan penyematan tweet pic.twitter.com/V6hBWZUuM9
– Gambar difusi stabil (DiffusionPics) 14 Agustus 2022
Matematikawan dan ilmuwan komputer Imad Moustaq berada di belakang Stability AI, yang didirikan pada tahun 2020. Dia bekerja sebagai analis untuk beberapa hedge fund selama beberapa tahun sebelum beralih ke bisnis umum. Pada 2019, ia membantu mendirikan Symmitree, sebuah proyek yang berupaya mengurangi biaya ponsel cerdas dan akses internet untuk populasi rentan.
Dengan Stability AI dan kekayaannya sendiri, Mostaque ingin memperkuat komunitas open source untuk penelitian AI. Perusahaannya sebelumnya mendukung pembuatan kumpulan data “LAION 5B”, misalnya. Untuk melatih model penerapan yang stabil, Stability AI memperkenalkan server dengan 4.000 GPU Nvidia A100.
“Tidak ada yang memiliki hak suara kecuali 75 karyawan kami – bukan miliarder, dana besar, pemerintah, atau siapa pun yang mengontrol perusahaan atau komunitas yang kami dukung. Kami sepenuhnya independen,” kata Mostaque kepada TechCrunch. “Kami menggunakan kekuatan komputasi kami untuk mempercepat AI open source.”
Penerapan Stabil adalah pengajar sumber terbuka
Difusi Stabil saat ini sedang diuji, dan tambahan baru sedang didistribusikan dalam gelombang. Hasilnya, yang dapat dilihat di Twitter, misalnya, menunjukkan penampilan pesaing nyata DALL-E-2 di sini.
Tidak seperti DALL-E 2, difusi stabil Foto kepribadian terkemuka dan membangkitkan motif lain, Diblokir oleh OpenAI dengan DALL-E 2. Sistem lain seperti Midjourney atau Pixelz.ai dapat melakukan ini, tetapi tidak satupun dari mereka mencapai kualitas yang sama dengan berbagai macam terlihat di Difusi Stabil – dan tidak ada yang lain adalah open source.
muncul # sebaran Interpolasi yang sangat keren antara perintah teks dapat dilakukan jika Anda memperbaiki gangguan inisialisasi dan kesalahan antara vektor pengkondisian instan: pic.twitter.com/lWOoETYVZ3
– Xander Steenbrugge (@xsteenbrugge) 7 Agustus 2022
Difusi Stabil dikatakan sudah berjalan pada satu kartu grafis dengan VRAM 5,1 GB – proyek ini membawa teknologi AI ke tepi yang sebelumnya hanya tersedia melalui layanan cloud.
Dengan demikian, Difusi Stabil memberi peneliti dan pihak yang berkepentingan tanpa akses ke server GPU kesempatan untuk bereksperimen dengan model AI generatif modern. Model ini juga harus bekerja pada MacBook dengan chip M1 Apple. Namun, pembuatan gambar membutuhkan waktu beberapa menit, bukan detik.
Stability AI sendiri juga ingin memungkinkan perusahaan untuk melatih varian penyebaran stabil mereka sendiri. Dengan demikian, model multimedia mengikuti jalur yang telah diambil oleh model bahasa besar: bergerak menjauh dari penyedia tunggal menuju ketersediaan banyak alternatif melalui open source.
Runway sudah mencari pengeditan teks-ke-video yang diaktifkan oleh penerapan yang stabil.
# sebaran Titik pemeriksaan teks-ke-gambar sekarang tersedia untuk tujuan pencarian sesuai permintaan di https://t.co/7SFUVKoUdl
Bekerja pada pengeditan yang lebih lunak dan pos pemeriksaan di cat.
Segera hadir ™ akan datang ke penyematan tweet Edit teks ke video pic.twitter.com/7XVKydxTeD
– Patrick Esser (@pess_r) 11 Agustus 2022
Spread Stabil: Kotak Pandora dan Bunga Bersih
Tentu saja, dengan akses terbuka dan kemampuan untuk menjalankan model pada GPU yang banyak digunakan, potensi penyalahgunaan meningkat secara signifikan.
“Persentase tertentu orang canggung dan aneh, tapi itulah manusia,” kata Mustak. “Kami yakin bahwa teknologi ini akan berkembang dan bahwa sikap yang agak paternalistik dan merendahkan dari banyak penggemar AI adalah kesalahan karena mereka tidak mempercayai masyarakat.”
Namun, Mostaque berpendapat bahwa ketersediaan gratis memungkinkan masyarakat untuk mengembangkan tindakan pencegahan.
“Kami mengambil langkah-langkah keamanan yang ekstensif, termasuk mengembangkan alat modern, untuk mengurangi potensi bahaya pada keterlibatan dan layanan kami. Dengan ratusan ribu yang mengerjakan model ini, kami yakin bahwa manfaat bersihnya akan sangat positif dan dengan miliaran orang yang menggunakan ini teknologi, bahaya akan memudar ke latar belakang.” “.
Informasi lebih lanjut tersedia di stable-spread-github. Beberapa contoh kemampuan pembuatan gambar Difusi Stabil dapat ditemukan di file Subreddit Penyebaran Stabil. di sini pergi ke Berlangganan Beta ke Difusi Stabil.
Catatan: Tautan ke toko online dalam artikel bisa disebut tautan afiliasi. Jika Anda melakukan pembelian melalui tautan ini, MIXED.de akan menerima komisi dari penjual. Harga tidak berubah untuk Anda.
“Coffee pioneer. Social media ninja. Unrepentant web teacher. Friendly music fan. Alcohol fanatic.”
More Stories
Intel dilaporkan ingin menghadapi Strix Halo AMD dengan GPU raksasanya sendiri di prosesornya
Pembaruan BIOS: Penyerang dapat menonaktifkan Boot Aman pada laptop Alienware
Hari khusus perempuan di Oberhausen