Temukan Terobosan Baru dalam Speech Emotion Recognition, Riset RevComm Terpilih untuk Konferensi ICASSP 2024

Tim Research and Development RevComm terpilih untuk mempresentasikan penelitiannya berjudul “Large Language Model-Based Emotional Speech Annotation Using Context and Acoustic Feature for Speech Emotion Recognition” dalam IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2024 di Seoul, Korea Selatan.

Jakarta, 1 April 2024 – RevComm dengan bangga mengumumkan bahwa tim Research and Development RevComm Inc, RevComm Research, terpilih untuk mempresentasikan penelitiannya dalam Konferensi Internasional Acoustics, Speech and Signal Processing, ICASSP 2024.

Konferensi ini digelar oleh IEEE Signal Processing Society, perhimpunan terkemuka di dunia untuk para ilmuwan dan profesional signal processing. Tahun ini akan menjadi gelaran konferensi ICASSP yang ke-49 dan akan diselenggarakan pada 14-19 April 2024 di Seoul, Korea Selatan.

RevComm Research: Mengidentifikasi Emosi melalui Transkripsi Suara dengan Large Language Model

Temuan riset terkait Speech Emotion Recognition oleh RevComm Research dilatarbelakangi oleh besarnya biaya yang dibutuhkan dalam proses untuk mengenali dan mengidentifikasi emosi pada suara. Secara konvensional, hal tersebut perlu dilakukan dengan mendengarkan suara secara manual, mengidentifikasi emosi, dan memberikan anotasi. Hal tersebut menjadikan pembuatan data suara dengan keterangan emosi dalam jumlah besar sulit untuk dilakukan.

Melihat hal tersebut, Senior Research Engineer RevComm Jennifer Santoso dan Kenkichi Ishizuka, serta Research Director Taiichi Hashimoto, mempublikasikan penelitian yang berjudul “Large Language Model-Based Emotional Speech Annotation Using Context and Acoustic Feature for Speech Emotion Recognition” ke ICASSP 2024 dan terpilih untuk mempresentasikan penelitiannya pada konferensi tersebut.

RevComm Research dalam penelitiannya membuat inovasi dengan mengusulkan untuk memberikan anotasi emosi secara otomatis menggunakan Large Language Model (LLM) berdasarkan transkripsi suara dan fitur acoustic. Hasil percobaan penelitian tersebut menunjukkan bahwa Large Language Model dapat mengestimasi emosi dengan akurasi yang hampir sama dengan manusia. Oleh karena itu, melalui hasil penelitian ini, diharapkan pembuatan data suara dengan informasi emosi yang besar menjadi lebih mudah dilakukan dan pengembangan pengenalan emosi suara dapat diwujudkan dengan lebih akurat.

RevComm Research bertujuan untuk menghadirkan inovasi pada bidang teknologi AI dan memperkaya komunikasi. Untuk mencapai tujuan ini, RevComm akan terus mendorong penelitian dan pengembangan di bidang suara, bahasa, dan gambar, serta secara aktif memberikan kontribusi akademis di dalam dan luar negeri dengan memanfaatkan teknologi AI untuk pengembangan produk dan layanan.

RevComm terus berupaya memberikan solusi komunikasi terdepan melalui produk unggulannya, MiiTel. MiiTel sebagai teknologi berbasis AI mampu menganalisis percakapan telepon serta meeting Anda secara otomatis. Klaim Free Demo MiiTel sekarang di miitel.id. Kuota terbatas!