Google telah merilis kode sumber beta codec audio Lyra di GitHub, membuat pemrosesan audio bitrate rendah kualitas luar biasa tersedia untuk semua pengembang. Codec paling berguna dalam situasi yang disematkan dan dibatasi bandwidth di mana sebanyak mungkin data perlu disimpan.
Lyra: Hampir Tidak Ada yang Kedengarannya Begitu Bagus
Codec audio bekerja dengan prinsip memberikan ucapan yang terdengar paling alami dengan kecepatan data serendah mungkin. Ini berhasil menciptakan tingkat reproduksi audio yang hampir menakutkan dengan bitrate serendah 3 kbps. Google menggunakan kompresi Lyra real-time yang sudah ada di aplikasi Duo-nya, meskipun Anda tidak akan disalahkan karena tidak menyadari perbedaan dari audio bandwidth biasa.
Untuk menunjukkan betapa Lyra jauh lebih baik daripada codec lain, Google memberikan contoh melalui a posting blog membandingkan codec kompresi yang digerakkan Machine Learning dengan alternatif 3 dan 6 kbps lainnya.
Ini adalah perbedaan malam hari, dan memberikan alat ini kepada pengembang di seluruh dunia akan menjadi pendorong yang signifikan dalam meningkatkan kualitas komunikasi di mana bandwidth langka. Ini juga merupakan motivator luar biasa bagi pengembang yang ingin membuat aplikasi baru di pasar negara berkembang, sesuatu yang pasti akan dibahas Google di tahun ini
konferensi online Google I / O virtual gratis.Kode sumber beta saat ini dirancang dengan perangkat Arm 64-bit, meskipun contohnya juga akan berjalan pada sistem Linux 64-bit x86. Kode sumber disediakan sepenuhnya didokumentasikan, meskipun dalam versi beta, dan halaman GitHub menyediakan petunjuk instalasi dan bagaimana membangun Lyra di Linux untuk target Arm 64-bit.
Untuk mendapatkan kode sumber Lyra beta, buka Halaman Lyra GitHub.
Bagaimana Lyra Bekerja?
Sementara proses sebenarnya yang digunakan Lyra adalah kombinasi yang sangat kompleks dari model pembelajaran mesin yang dilatihkan ribuan jam data ucapan dan pengoptimalan teknologi codec audio yang ada, teorinya cukup sederhana.
Setiap 40 md, fitur diambil dari ucapan dan dikompresi hingga 3kbps. Fitur-fitur ini mewakili titik energi ucapan di seluruh spektrum frekuensi yang paling dekat dengan respons suara auditori manusia - hal-hal yang perlu kita kenali dan pahami saat seseorang berbicara.
Bagian penting dari apa yang membuat Lyra istimewa adalah bagaimana ia menggunakan informasi ini:
Namun codec parametrik tradisional, yang hanya mengekstrak dari parameter kritis ucapan yang kemudian dapat digunakan untuk membuat ulang sinyal di ujung penerima, mencapai bitrate rendah, tetapi sering kali terdengar seperti robot dan tidak wajar. Kekurangan ini telah menyebabkan berkembangnya generasi baru yang memiliki model generatif audio berkualitas tinggi merevolusi bidang dengan mampu tidak hanya membedakan antara sinyal, tetapi juga menghasilkan yang benar-benar baru satu.
Setelah transmisi, Lyra membangun kembali bentuk gelombang dengan mengisi apa yang hilang menggunakan proses ini, meskipun secara komputasi tidak terlalu rumit.
Di satu sisi, ini adalah keajaiban teknologi yang akan berjalan hampir di mana saja. Di sisi lain, saya masih belum 100% yakin itu bukan sihir.
Google Duo adalah salah satu aplikasi panggilan video terbaik di luar sana. Ini memiliki banyak fitur, dan inilah yang menurut kami harus Anda gunakan.
Baca Selanjutnya
- Berita Teknologi
- Android
- Pembelajaran mesin
Ian Buckley adalah jurnalis lepas, musisi, artis, dan produser video yang tinggal di Berlin, Jerman. Ketika dia tidak sedang menulis atau di atas panggung, dia mengutak-atik elektronik atau kode DIY dengan harapan menjadi ilmuwan gila.
Berlangganan newsletter kami
Bergabunglah dengan buletin kami untuk mendapatkan tip teknologi, ulasan, ebook gratis, dan penawaran eksklusif!
Satu langkah lagi…!
Harap konfirmasi alamat email Anda di email yang baru saja kami kirimkan kepada Anda.