Apple Intelligence tidak dilatih pada database gratis The Pile, yang berisi subtitle untuk ribuan video YouTube tanpa permintaan dari pembuatnya. Perusahaan mengumumkan hal ini ke blog Apple 9to5Mac. Perusahaan telah menulis dalam makalah ilmiah tentang model efisiensi tinggi dalam seri OpenELM yang kumpulan datanya digunakan. Namun, OpenELM memang seperti itu Ini bukan bagian dari sistem kecerdasan buatan yang digunakan oleh perusahaantermasuk Apple Intelligence atau teknologi pembelajaran mesin lainnya.
iklan
Subtitle dari 170.000 video YouTube
Menurut situs web 9to5Mac Apple mengatakan pihaknya mengembangkan OpenELM sebagai kontribusi terhadap penelitian AI dan pengembangan model bahasa sumber terbuka. Pada saat itu, perusahaan menggambarkan teknologi tersebut sebagai “model bahasa terbuka yang canggih”. Namun, OpenELM dikembangkan semata-mata untuk tujuan penelitian, dan bukan untuk menjalankan fungsi intelijen apa pun untuk Apple. OpenELM masih ada Di situs penelitian AI Apple tersedia.
Ada kritik terhadap kumpulan data pelatihan “The Pile”, yang berasal dari organisasi nirlaba EleutherAI Dalam laporan dari The Proof Oleh karena itu, perusahaan besar lainnya seperti Nvidia, Anthropic, dan Salesforce juga menggunakan informasi tersebut. Ini seharusnya menjadi “tumpukan” antara lain Dengan subtitle untuk 170.000 video YouTube Saya sudah diberi makan. Dikatakan bahwa tidak ada persetujuan untuk hal ini.
Pertanyaan tentang data pelatihan
Masih belum jelas apa dan berapa banyak data pelatihan yang digunakan Apple untuk Apple Intelligence. Perusahaan hanya menyatakan bahwa mereka menggunakan “konten berlisensi, termasuk data yang meningkatkan fungsionalitas tertentu”. Namun ada juga data yang tampaknya diperoleh Apple sendiri dari internet publik menggunakan web crawler miliknya sendiri.
Untuk memilih tidak ikut serta, operator situs web harus menginstruksikan Applebot Extended pribadi untuk mengabaikan konten mereka. AppleBot menulis bahwa perayapan situs web oleh AppleBot (yang tidak digunakan untuk tujuan AI, tetapi untuk layanan lain) tetap ada bahkan setelah memilih untuk tidak ikut serta, jika tidak ditolak pada saat yang sama di file “robots.txt”. Perusahaan ini ada di Apple.com. Grup tersebut juga diketahui tidak memasukkan data pribadi pengguna atau “interaksi pengguna” dalam pelatihan. Ada juga filter untuk informasi kartu kredit atau “kecabulan” serta konten berkualitas rendah — meskipun tidak jelas bagaimana hal ini dikecualikan.
(Sarjana)
“Coffee pioneer. Social media ninja. Unrepentant web teacher. Friendly music fan. Alcohol fanatic.”
More Stories
Intel dilaporkan ingin menghadapi Strix Halo AMD dengan GPU raksasanya sendiri di prosesornya
Pembaruan BIOS: Penyerang dapat menonaktifkan Boot Aman pada laptop Alienware
Hari khusus perempuan di Oberhausen