diyetekno – Dunia teknologi kembali dikejutkan dengan perkembangan pesat AI (Artificial Intelligence), khususnya dalam bidang kloning suara. Bayangkan, hanya dengan sampel audio 30 detik, AI mampu mereplikasi suara seseorang nyaris sempurna, lengkap dengan intonasi, aksen, bahkan kepribadiannya. Dr. Alan Cowen, CEO dan ilmuwan utama Hume AI, mendemonstrasikan kemampuan ini dengan menirukan suara Ricky Gervais dan Audrey Hepburn.
Perusahaan Hume AI mengklaim diri sebagai pengembang "AI suara paling realistis di dunia." Cowen menjelaskan bahwa EVI 3, produk terbaru mereka, melampaui kemampuan model sebelumnya yang hanya meniru suara spesifik. EVI 3 mampu mereplikasi suara siapa pun, termasuk emosi dan kepribadian, berkat penggunaan data suara yang luas dan pembelajaran penguatan.

Namun, kemajuan ini memunculkan kekhawatiran etis. Cowen mengakui potensi penyalahgunaan teknologi ini untuk penipuan dan impersonasi. CEO OpenAI, Sam Altman, juga telah memperingatkan risiko serupa. Kombinasi kloning suara dengan teknologi video dan gambar dapat memperburuk masalah deepfake.
diyetekno – Hume AI menyadari risiko ini dan berupaya menerapkan langkah-langkah pengamanan. Mereka menganalisis setiap percakapan dan memberikan skor potensi penyalahgunaan. Akses akan diblokir jika pengguna melanggar pedoman etika yang ditetapkan dalam Hume Initiative.
Hume Initiative adalah proyek yang menekankan bahwa teknologi harus melayani kesejahteraan emosional manusia. Inisiatif ini memiliki enam prinsip untuk teknologi empatik, meskipun bersifat subjektif dan efektif hanya jika dipatuhi.
Cowen menekankan pentingnya kesadaran akan bahaya deepfake dan perlunya upaya lintas industri untuk mengatasinya. Meskipun demikian, ia percaya bahwa teknologi ini memiliki potensi positif, seperti terjemahan langsung, dubbing, aksesibilitas konten, dan bahkan membantu selebriti berinteraksi dengan penggemar.
diyetekno – Cowen, yang memiliki latar belakang psikologi, meyakini bahwa teknologi ini akan memberikan dampak positif yang lebih besar daripada negatif. Ia mencontohkan bagaimana orang-orang menikmati mengkloning suara mereka sendiri dan menggunakannya untuk tujuan yang menyenangkan.
Namun, tantangan tetap ada. Kemampuan untuk mereplikasi suara siapa pun secara akurat menimbulkan berbagai kekhawatiran. Cowen dan timnya berkomitmen pada aspek etika, tetapi perjalanan teknologi ini masih panjang dan penuh potensi risiko.
Sebagai jurnalis tekno, saya melihat perkembangan ini sebagai pedang bermata dua. Potensi manfaatnya sangat besar, tetapi risiko penyalahgunaannya juga nyata. Kita perlu terus memantau perkembangan teknologi ini dan memastikan bahwa etika dan keamanan menjadi prioritas utama.

