Aplikasi-aplikasi Sistem Identifikasi Bahasa Lisan

Sistem identifikasi bahasa lisan adalah suatu sistem yang mampu mengenali bahasa dari suatu cuplikan suara secara otomatis berdasarkan sejumlah pilihan bahasa yang sudah ditentukan sebelumnya (Muthusamy, 1994). Mengingat bahwa interaksi di masa mendatang mengarah ke globalisasi, sistem identifikasi bahasa lisan merupakan komponen yang penting dalam suatu sistem multibahasa berbasis suara. Berikut ini adalah beberapa aplikasi dari sistem identifikasi bahasa lisan yang sudah dikembangkan.

 

1.      Operator Panggilan Telepon Multibahasa

Pada perusahaan maskapai penerbangan, agen perjalanan, kepolisian, kedutaan, atau lembaga umum lainnya, pelayanan dilakukan untuk siapa saja tanpa melihat kewarganegaraannya. Saat seseorang ingin mencari informasi mengenai sesuatu atau ingin melaporkan suatu kejadian atau keluhan, mereka bisa menghubungi call center di perusahaan atau lembaga tersebut dengan berbicara sesuai bahasa yang mereka inginkan. Komponen pengidentifikasi bahasa lisan akan mendeteksi bahasa ucapannya terlebih dahulu. Setelah diketahui bahasanya, sistem akan meneruskan sambungan telepon ke operator manusia yang fasih berbicara dalam bahasa tersebut. Untuk kasus di kepolisian, komponen ini krusial dipasang sebagai komponen depan dari sistem panggilan darurat (Zissman, 1996), misalnya 911 di Amerika Serikat.

 

2.      Sistem Pengenal Suara Multibahasa Otomatis

Sistem pengenal suara adalah suatu sistem yang mampu menghasilkan transkripsi berupa teks dari suatu cuplikan ucapan (Rabiner, 1993). Pada sistem pengenal suara multibahasa, bahasa dari cuplikan suara dideteksi terlebih dahulu sebelum dihasilkan transkripsinya. Umumnya, komponen pengidentifikasi bahasa lisan digunakan untuk kepentingan pengembangan sistem ini. Beberapa contoh bahasa yang sudah dikembangkan sistem identifikasinya adalah Inggris, Spanyol, Dari, Perancis, Pashto, Rusia, Urdu, dan Mandarin (Lopez-Moreno, 2014).

 

3.      Pusat Informasi Multibahasa

Di bandara internasional atau tempat-tempat umum lainnya yang sering dikunjungi wisatawan mancanegara, pusat informasi sering menjadi spot penting bagi para wisatawan untuk memperoleh informasi. Pusat informasi elektronik yang dilengkapi sistem identifikasi bahasa akan sangat berguna bagi mereka yang tidak bisa berbahasa Inggris. Jadi, sistem mendeteksi bahasa query yang diucapkan pengguna, kemudian informasi relevan disampaikan ke pengguna dalam bahasa tersebut. Informasi yang disampaikan dapat berupa teks atau berupa suara tiruan, di mana teknologi yang digunakan untuk menghasilkan suara tiruan dikenal dengan istilah speech synthesizer (Hunt, 1996).

 

4.      Multilingual Smart Devices

Smart devices diaktifkan dengan perintah suara. Salah satu contoh adalah smart house di mana perangkat-perangkat dalam rumah dapat diaktifkan dengan perintah suara, misalnya lampu dapat dinyalakan dengan mengucapkan perintah “Nyalakan lampu!” Di era globalisasi seperti sekarang ini, perkawinan campur sudah tidak asing lagi. Dengan demikian, penggunaan lebih dari satu bahasa di rumah menjadi lumrah. Untuk kondisi seperti ini, kemampuan perangkat untuk dapat mengenali perintah dalam berbagai bahasa akan menjadi nilai tambah tersendiri dari segi teknologi.

 

Dari keempat contoh aplikasi tersebut, masih banyak aplikasi lain yang dapat diintegrasikan dengan sistem pendeteksi bahasa lisan. Kesimpulannya, semua sistem berbasis suara dapat diintegrasikan dengan komponen pendeteksi bahasa untuk membentuk suatu sistem multibahasa. Sistem ini sesuai dengan perkembangan zaman sekarang di mana mobilitas manusia tidak lagi dibatasi oleh negara, ras, dan bahasa.

 

Referensi

Hunt, A. J., & Black, A. W. (1996, May). Unit selection in a concatenative speech synthesis system using a large speech database. In Acoustics, Speech, and Signal Processing, 1996. ICASSP-96. Conference Proceedings., 1996 IEEE International Conference on (Vol. 1, pp. 373-376). IEEE.

Lopez-Moreno, I., Gonzalez-Dominguez, J., Plchot, O., Martinez, D., Gonzalez-Rodriguez, J., & Moreno, P. (2014). Automatic language identification using deep neural networks. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (pp. 5337-5341).

Muthusamy, Y. K., et. al. (1994). Reviewing automatic language identification. IEEE Signal Processing Magazine11(4), 33-41.

Rabiner, L. R., & Juang, B. H. (1993). Fundamentals of speech recognition (Vol. 14). Englewood Cliffs: PTR Prentice Hall.

Zissman, M. A. (1996). Comparison of four approaches to automatic language identification of telephone speech. IEEE Transactions on speech and audio processing4(1), 31.

 

 

Amalia Zahra