YouTube Perkenalkan Sulih Suara Bertenaga AI: Apa Itu dan Bagaimana Cara Kerjanya?
- u-report
Jakarta, Olret – YouTube telah mengintegrasikan fitur bertenaga AI baru yang akan membantu pengguna di seluruh dunia untuk mengatasi kendala bahasa. Dengan bantuan AI, platform berbagi video Google ingin memudahkan pengguna untuk melakukan dubbing video dalam bahasa lain.
Pada acara VidCon yang diadakan di AS, perusahaan mengumumkan bahwa tim Aloud akan mengerjakan proyek ini. Aloud adalah layanan sulih suara bertenaga AI dari inkubator Area 120 Google.
Dubbing AI YouTube
Dalam sebuah wawancara dengan The Verge, Amjad Hanif dari YouTube menyatakan bahwa YouTube sudah menguji alat tersebut dengan “ratusan” pembuat. Hanif juga menyebutkan bahwa Aloud saat ini mendukung “beberapa” bahasa. Alat ini diharapkan mendapatkan lebih banyak bahasa dalam beberapa hari mendatang. Saat ini, alat sulih suara dengan lantang hanya mendukung bahasa Inggris, Spanyol, dan Portugis.
Bagaimana cara kerjan Dubbing AI YouTube?
Situs web Aloud menjelaskan bahwa sebelum melakukan dubbing video ke bahasa lain, alat ini terlebih dahulu mentranskripsikan video tersebut. Alat tersebut kemudian menampilkan transkripsi kepada pengguna untuk ditinjau dan di edit.
Setelah itu, ia menerjemahkan dan menghasilkan sulih suara untuk video tersebut. Tim Google Aloud juga membagikan video untuk menjelaskan cara kerjanya.
Bagaimana itu akan membantu Youtuber
Aloud dapat menjadi alat yang penting bagi kreator bahkan dengan jumlah bahasa yang terbatas. Alat ini dapat berguna karena semakin banyak pembuat konten yang dapat menambahkan sulih suara multibahasa ke video mereka.
Dalam beberapa hari mendatang, YouTube "bekerja untuk membuat trek audio yang diterjemahkan terdengar seperti suara pencipta, dengan lebih banyak ekspresi, dan sinkronisasi bibir," tambah Hanif. Perusahaan dilaporkan berencana untuk menambahkan fitur-fitur ini pada tahun 2024.
Bulan lalu, perusahaan mulai menggunakan AI Google DeepMind untuk membuat deskripsi YouTube Shorts. Perusahaan menggunakan model bahasa visual, yang disebut Flamingo, untuk membuat deskripsi dengan menganalisis bingkai awal video.