Google dapat menerjemahkan lebih banyak bahasa secara otomatis. Google Terjemahan akan berlipat ganda dari 133 menjadi 243 bahasa, awalnya untuk bahasa sumber. Perusahaan data membuat pengumuman pada hari Kamis. Spektrumnya berkisar dari bahasa dengan jumlah penutur yang banyak, seperti bahasa Kanton atau Punjabi (dalam varian aksara Shamukhi) hingga dialek yang kurang umum seperti dialek Franconia Rendah Selatan atau dialek Rio Grande Hunsruk yang digunakan di Brasil bagian selatan.
iklan
“Kami sekarang menggunakan AI untuk memperluas jangkauan bahasa yang didukung,” tulis karyawan Google tersebut Isaac Caswell di blog perusahaan. “Dengan model bahasa besar PaLM2, kami memperkenalkan 110 bahasa baru ke Google Terjemahan, ekspansi terbesar kami hingga saat ini.” Baru tahun lalu, Google Terjemahan memperluas kosakatanya menjadi 33 bahasa, 131 bahasa pada saat itu, selain versi tulisan Mandarin tradisional dan sederhana. Kali ini bahasa Kanton ditambahkan secara terpisah. Melatih hal ini sangat sulit, kata Caswell, “karena tulisan Kanton sering kali tumpang tindih dengan bahasa Mandarin.” Hal ini tidak memudahkan pencarian teks Kanton secara otomatis dan mengintegrasikannya ke dalam Model Bahasa Besar (LLM).
Bahasa Rumania, yang juga telah digunakan di Jerman dan Austria selama berabad-abad, juga menghadirkan tantangan bagi para programmer, karena bahasa tersebut digunakan secara luas di seluruh Eropa dengan banyak dialek. Hasilnya adalah LLM yang menghasilkan campuran yang tidak dibicarakan seperti itu: didasarkan pada rami selatan, tetapi juga mengandung unsur cabang utara dan cabang Balkan.
Seperempat dari bahasa baru tersebut berasal dari Afrika. Kini terdapat varian bahasa Portugis terpisah yang hanya dituturkan oleh sebagian kecil penutur bahasa Portugis: versi bahasa umum Portugal. Beberapa bahasa Kreol juga disertakan, misalnya dari Jamaika, Mauritius, Papua Nugini, dan Seychelles. Pendatang baru yang meledak secara politik termasuk bahasa Tibet, Ossetia, dan Tatar Krimea. Google punya satu Daftar bahasa yang baru didukung diterbitkan.
Tantangan GUI
Tampilan baru belum dapat ditentukan di antarmuka pengguna. Ini berarti terjemahan Tidak pada tempatnya Mungkin dengan bahasa baru, tapi belum di dalam bahasa baru. Paket terjemahan offline belum dapat ditemukan di aplikasi. Masih harus dilihat bagaimana Google akan merancang antarmuka untuk banyak bahasa. Perusahaan telah menetapkan tujuan suatu hari untuk menerjemahkan 1.000 bahasa secara otomatis satu sama lain. Artinya, ini akan mendukung sekitar satu dari tujuh bahasa.
Meskipun bahasa-bahasa terus mengalami kepunahan, masih ada lebih dari 7.000 bahasa yang tersisa. Namun, perbedaan yang tepat antara bahasa dan dialek sulit dilakukan dan seringkali kontroversial (secara politis). Bahasa Yiddish, Frisian Utara, Gipsi, Satrland, Sorbia, dan Utic Selatan sangat terancam punah di Jerman.
Halusinasi: Ayo kunyah?
Google mengatakan akhirnya memenuhi permintaan dukungan Google Terjemahan yang sudah lama diajukan Kepulauan Faroe. Namun pengenalan bahasa belum berfungsi dalam praktiknya. Frasa Faroe “Mær gongst væl, takk, og tygum?” (“Saya baik-baik saja, terima kasih, dan Anda?”) Google Terjemahan saat ini salah menerjemahkannya ke dalam bahasa Islandia. Hasilnya adalah kejahatan para Dadais: “Bolehkah saya bersungut-sungut dan membiarkan kami mengunyahnya?”
Hal-hal aneh terjadi ketika Anda salah atau tidak sengaja memberi tahu Google Terjemahan bahasa sumber yang salah. Pasalnya, Google belum mengajarkan AI-nya keberanian untuk membuat celah, misalnya dalam bentuk pesan error “Saya tidak mengerti”. Haruskah “Mær gongst væl, takk, og tygum?” Diterjemahkan dari “Jerman” ke Bahasa Inggris, hasilnya berbunyi: “Kita menghitung, bukan, dan kita bertanya-tanya?” Sebaliknya, jika bahasa Inggris yang dipilih salah, sistem akan berhalusinasi kejutan bahasa Jerman ini: “Apa yang akan terjadi padamu, ayahmu, dan anakmu?”
(S)
More Stories
Intel dilaporkan ingin menghadapi Strix Halo AMD dengan GPU raksasanya sendiri di prosesornya
Pembaruan BIOS: Penyerang dapat menonaktifkan Boot Aman pada laptop Alienware
Hari khusus perempuan di Oberhausen