OpenAI telah memberi ChatGPT kemampuan untuk berbicara menggunakan suara yang disintesis, dan akan segera hadir di ponsel cerdas Anda.

ChatGPT diatur untuk menjadi pengalaman AI generatif yang interaktif. OpenAI mengungkapkan bahwa chatbot AI terkemuka di dunia akan dapat berbicara dan merespons pertanyaan pengguna menggunakan suara yang disintesis, yang mungkin dihasilkan oleh AI.

Seiring dengan suara barunya, ChatGPT juga akan dapat merespons dan mendiskusikan gambar tertentu yang diunggah atau diambil saat menggunakan aplikasi ChatGPT Android atau iOS. Fitur pengenalan gambar terdengar mirip dengan Google Lens dan aplikasi lain yang menggunakan jaringan saraf untuk mendeteksi data dan informasi secara akurat.

OpenAI Memberikan Suara pada ChatGPT

Pada tanggal 25 September 2023, pengembang ChatGPT OpenAI terungkap hal ini akan memberikan suara pada chatbot AI generatif yang terkemuka di dunia. Pengguna ChatGPT dapat berbicara langsung ke chatbot dan memintanya untuk membalas, sehingga secara efektif memungkinkan ChatGPT berkomunikasi langsung dengan suara untuk pertama kalinya.

instagram viewer

Contoh klip OpenAI menampilkan seorang wanita yang meminta ChatGPT untuk membuat cerita pengantar tidur yang unik, yang kemudian ditanggapi oleh ChatGPT dengan suara sintesis wanita.

Berdasarkan Kabel, model text-to-speech baru dikembangkan sendiri. Itu dapat menghasilkan audio "mirip manusia" dari teks dan beberapa detik contoh ucapan (menggunakan model Bisikan OpenAI) dan berbicara dalam berbagai nada dan gaya. Anda dapat menemukan berbagai sampel suara di blog OpenAI.

Beberapa perusahaan telah menggunakan model suara baru OpenAI. Misalnya, Spotify menggunakan model text-to-speech OpenAI untuk menerjemahkan podcast ke berbagai bahasa, menggabungkan kehebatan terjemahan bahasa ChatGPT dengan kemampuan berbicara barunya.

Model text-to-speech baru ChatGPT hanya tersedia untuk pelanggan Plus dan Enterprise yang menggunakan versi resminya Aplikasi Android dan iOS dan diperkirakan akan diluncurkan dalam dua minggu ke depan (mulai tanggal 25 September, 2023). Selain itu, fitur suara baru awalnya terbatas pada bahasa Inggris, meskipun kami memperkirakan hal ini akan berubah dengan cepat.

ChatGPT Dapat Mengenali dan Menganalisis Gambar dan Foto

Bagian kedua dari pembaruan ChatGPT OpenAI adalah kemampuan untuk menganalisis dan membicarakan gambar yang diunggah ke alat tersebut. Opsi analisis gambar visual ditampilkan dalam video pembaruan GPT-4 tetapi belum banyak dibahas sejak saat itu (Selain Penerjemah Kode ChatGPT).

Sekarang, ChatGPT mendapatkan fungsionalitas yang mirip dengan Google Lens. Anda dapat mengunggah gambar ke ChatGPT atau mengambil foto menggunakan kamera ponsel cerdas Anda di aplikasi ChatGPT, dan itu akan merinci gambar tersebut, menambahkan lebih banyak konteks jika diperlukan.

Menyebutnya "mirip dengan Google Lens" sebenarnya merupakan ketidakadilan. Kemampuan untuk mengobrol bolak-balik tentang gambar untuk mendapatkan lebih banyak informasi dan konteks membuatnya sangat berguna untuk berbagai pengaturan. Namun, penting untuk memperhatikan detailnya, karena OpenAI memperjelas bahwa mereka telah membatasi "kemampuan ChatGPT untuk menganalisis dan membuat pernyataan langsung tentang orang" demi alasan privasi dan akurasi. Namun, apakah alat "Who Is This" yang didukung OpenAI dapat digunakan di masa depan? (Semoga saja tidak!)

Seperti model text-to-speech yang baru, OpenAI akan meluncurkan pengenalan gambar dalam dua minggu ke depan, meskipun akan tersedia di semua platform, tidak hanya aplikasi ChatGPT.

Privasi, Keamanan, dan Masalah Lainnya

Implikasi dari ChatGPT yang didukung suara sangatlah nyata. Tentu, ini mengasyikkan. Namun, kemampuan untuk membuat suara yang disintesis secara unik hanya dengan menggunakan cuplikan singkat sebagai contoh memiliki masalah privasi dan keamanan yang cukup besar. Potensi pelaku jahat untuk mengeksploitasi alat-alat ini sangat besar, dan sama seperti alat AI generatif lainnya, begitu jin keluar dari botol, jin tersebut tidak akan masuk lagi. Peraturan AI dari pemerintah atau pemimpin pemikiran sebanyak apa pun tidak dapat membalikkan keadaan.

Bahkan peringatan OpenAI tentang topik ini tampaknya tidak sesuai dengan yang sudah jelas meskipun menyebutkan masalah tersebut:

Namun, kemampuan ini juga menimbulkan risiko baru, seperti potensi pelaku kejahatan menyamar sebagai tokoh masyarakat atau melakukan penipuan. Inilah sebabnya kami menggunakan teknologi ini untuk mendukung kasus penggunaan tertentu—obrolan suara.

Mengingat ini adalah puncak gunung es, kemungkinan besar akan ada penolakan terhadap suara baru ChatGPT, terutama sekali ada peningkatan yang dapat diprediksi dalam berita utama yang tidak menyenangkan yang mengklaim ChatGPT digunakan untuk melakukan penipuan dan sebagainya pada.

OpenAI Menjadikan ChatGPT sebagai Aplikasi AI Pilihan

Semakin banyak OpenAI menambahkan fitur ramah pengguna ke ChatGPT, semakin besar pula OpenAI menjadi aplikasi AI generatif yang disukai. Sebagai perusahaan pertama yang meraih popularitas luas pada awal booming AI generatif, ChatGPT masih memimpin dan menjadi yang terdepan hanya aplikasi yang digunakan beberapa orang, meskipun ada persaingan dari Google Bard (dan mungkin Google Gemini) dan Anthropic Claude.

Selama OpenAI dapat terus menambahkan fitur yang membuat ChatGPT lebih mudah digunakan, hal ini akan membuat orang tetap terhubung dan semakin dekat dengan tujuannya yaitu alat AI yang benar-benar multimodal.