Pada musim panas tahun 2021, OpenAI diam-diam menutup tim robotikanya, dengan alasan kemajuan yang terhambat oleh kurangnya data yang tepat. Data diperlukan untuk melatih robot cara bergerak dan berpikir menggunakan kecerdasan buatan (AI). Pada pertengahan Maret, tiga peneliti awal OpenAI mengumumkan bahwa startup mereka, Covariant, yang didirikan pada tahun 2017, telah memecahkan masalah ini dan menghadirkan sistem yang menggabungkan kemampuan penalaran model bahasa besar dengan ketangkasan fisik robot canggih.
iklan
Model baru, yang disebut RFM-1, dilatih menggunakan data bertahun-tahun yang dikumpulkan dari armada kecil robot Covariant yang digunakan oleh pelanggan seperti Crate & Barrel dan Bonprix di gudang di seluruh dunia, serta teks dan video dari Internet. Model ini akan dirilis ke pelanggan Covariant dalam beberapa bulan mendatang. Perusahaan berharap sistem ini akan menjadi lebih kuat dan efisien seiring berjalannya waktu ketika dipraktikkan.
“Aku tidak bisa melakukannya dengan benar”
Jadi apa yang bisa kamu lakukan? Dalam demo di awal bulan Maret, salah satu pendiri Covariant Peter Chen dan Peter Appel menunjukkan bagaimana pengguna dapat menstimulasi model dengan lima jenis masukan (perintah): teks, gambar, video, instruksi robot, dan metrik. Misalnya, mereka menunjukkan kepada robot tersebut foto sebuah wadah berisi peralatan olahraga dan memintanya untuk mengambil paket berisi bola tenis. Robot kemudian dapat mengambil benda tersebut, membuat gambar seperti apa wadahnya ketika bola tenisnya hilang, atau membuat video yang menunjukkan bagaimana robot akan menyelesaikan tugasnya, dari sudut pandang luas.
Jika model memperkirakan bahwa dia tidak dapat menangkap objek dengan benar, dia mungkin berkata, “Saya tidak dapat menangkap objek dengan benar. Apakah Anda punya tip?” Salah satu jawaban mungkin menyarankan dia untuk menggunakan sejumlah cangkir hisap di lengannya untuk meningkatkan cengkeramannya, misalnya delapan, bukan enam.
Ini adalah kemajuan besar bagi robot yang dapat beradaptasi dengan lingkungannya menggunakan data pelatihan, bukan kode kompleks dan spesifik tugas yang mendasari robot industri generasi sebelumnya, kata Chen. Ini juga merupakan langkah menuju tempat kerja di mana manajer dapat memberikan instruksi dalam bahasa manusia tanpa mengkhawatirkan keterbatasan tenaga kerja manusia: “Kemas 600 batch pasta cabai merah menggunakan resep berikut. Jangan istirahat!”
Meskipun peneliti robotika telah membuat robot multimoda sederhana dan menerapkannya di laboratorium sebelumnya, penerapan robot dalam skala besar yang mampu berkomunikasi dalam banyak mode merupakan pencapaian yang mengesankan bagi perusahaan.
Untuk mengalahkan pesaingnya, Covariant perlu mengumpulkan data yang cukup agar robot tersebut dapat digunakan di alam liar, kata Pinto. Ini akan diuji di gudang dan dermaga pemuatan, terus berinteraksi dengan instruksi, orang, objek, dan lingkungan baru. “Kelompok yang melatih model yang baik adalah mereka yang memiliki akses ke data robot dalam jumlah besar atau mampu menghasilkan data tersebut,” katanya.
Demonstrasi robot
Menurut Covariant, model tersebut memiliki kemampuan berpikir yang “mirip manusia”, namun juga memiliki keterbatasan. Selama demo, yang mencakup streaming langsung bot Covariant dan jendela obrolan untuk berkomunikasi dengannya, Chen mengundang saya untuk memberikan tugas kepada model tersebut. Namun, saat saya meminta robot tersebut untuk “memasukkan kembali pisang ke dalam tas belanja #2”, robot tersebut mengalami kesulitan untuk menelusuri kembali langkah-langkahnya, sehingga robot tersebut mengambil spons, lalu sebuah apel, lalu berbagai barang lainnya sebelum menyelesaikan tugasnya, yang akhirnya dipecahkan. Dengan pisang. “Ia tidak memahami konsep baru, namun ini adalah contoh yang baik — ini mungkin tidak akan berfungsi dengan baik jika Anda tidak memiliki data pelatihan yang baik,” jelas Chen.
Model baru perusahaan ini mewujudkan perubahan paradigma yang terjadi di dunia robotika. Alih-alih mengajarkan robot bagaimana dunia bekerja melalui instruksi seperti persamaan dan simbol fisika, para peneliti mengajarkannya dengan cara yang sama seperti yang dipelajari manusia: melalui jutaan observasi. Hasilnya, kata Chen, “dapat berfungsi sebagai otak yang efisien dan sangat fleksibel untuk menyelesaikan tugas robotik apa pun.”
Lapangan persaingan kemungkinan akan menjadi lebih ramai tahun ini bagi perusahaan-perusahaan yang menggunakan kecerdasan buatan untuk menggerakkan sistem robotik yang lebih cerdas. Awal bulan ini, startup robot humanoid Figure AI mengumumkan kemitraan dengan OpenAI, mengumpulkan $675 juta dari raksasa teknologi seperti Nvidia dan Microsoft. Marc Raibert, pendiri Boston Dynamics, baru-baru ini meluncurkan inisiatif untuk lebih mengintegrasikan kecerdasan buatan ke dalam robotika. Artinya, kemajuan dalam pembelajaran mesin kemungkinan besar juga akan mengarah pada kemajuan dalam bidang robotika.
Latih robot dengan video yang dibuat khusus
Namun, beberapa pertanyaan masih belum terselesaikan. Jika model bahasa besar terus dilatih tentang jutaan kata tanpa memberikan kompensasi kepada pembuat kata-kata tersebut, mungkin model robot juga akan dilatih dalam video tanpa membayar pembuatnya. Jika model linguistik berhalusinasi dan melanggengkan bias, masalah serupa apa yang mungkin muncul dalam robotika?
Kovarian akan mendorong pengembangan untuk saat ini, karena RFM-1 dirancang untuk pembelajaran dan peningkatan berkelanjutan. Pada akhirnya, para peneliti ingin melatih bot dengan video yang dihasilkan model itu sendiri, sejenis pembelajaran meta yang menyebabkan banyak sakit kepala dan juga menimbulkan pertanyaan tentang apa yang terjadi jika kesalahan yang dibuat oleh model menumpuk. Sayangnya, dengan keinginan saat ini untuk mendapatkan lebih banyak data pelatihan, para peneliti melihat hal ini hampir tidak bisa dihindari. “Pelatihan ini akan menjadi kenyataan,” kata Abel. “Ketika kita membicarakan hal ini lagi dalam enam bulan, kita akan membicarakan hal ini.”
(mayoritas)
“Coffee pioneer. Social media ninja. Unrepentant web teacher. Friendly music fan. Alcohol fanatic.”
More Stories
Intel dilaporkan ingin menghadapi Strix Halo AMD dengan GPU raksasanya sendiri di prosesornya
Pembaruan BIOS: Penyerang dapat menonaktifkan Boot Aman pada laptop Alienware
Hari khusus perempuan di Oberhausen