Aplikasi-aplikasiTeknologi Bahasa Lisan

 

Teknologi bahasa lisan, atau dalam Bahasa Inggris dikenal dengan istilah speech technology, adalah suatu sistem teknologi yang melibatkan bahasa lisan dalam proses utamanya, baik diterima sebagai masukan sistem ataupun merupakan hasil keluaran sistem tersebut. Teknologi ini bermanfaat dalam mempermudah aksesibilitas dan penggunaan sistem. Kita dapat menggunakan atau mengaktifkan sistem dengan bahasa lisan kita sendiri tanpa harus mengetikkan suatu teks ke sistem.
Gambar 1 di bawah ini menunjukkan sejumlah aplikasi berbasis bahasa lisan. Setiap aplikasi akan dijelaskan secara ringkas pada pembahasan yang mengikutinya.


Gambar 1. Aplikasi-aplikasi Berbasis Bahasa Lisan

Speech Recognition System (Sistem Transkripsi Bahasa Lisan)
Speech Recognition System adalah suatu sistem yang dapat menghasilkan transkripsi berupa teks dari masukan bahasa lisan. Alurnya dimulai dari seorang pengguna yang mengucapkan suatu kalimat atau frasa tertentu di depan sistem, kemudian sistem tersebut akan menghasilkan transkripsi kalimat atau frasa yang diucapkan tersebut berupa teks. Dengan demikian, kita tidak perlu mengetikkan atau menuliskan kalimat-kalimat saat ingin menyusun suatu artikel atau buku (atau karya tulis yang lebih singkat), melainkan cukup mengucapkannya saja. Sistemlah yang akan menghasilkan transkripsinya. Perlu diketahui bahwa sistem ini tidak sempurna. Kesalahan transkripsi biasa terjadi (namun jumlahnya sangat kecil jika sistem memiliki akurasi tinggi). Jadi, jangan percaya sepenuhnya kepada hasil transkripsi otomatis ini. Proses pengecekan dan edit setelah transkripsi otomatis masih perlu dilakukan, walaupun mungkin tidak memakan waktu lama untuk sistem berakurasi tinggi.

Speech Synthesizer (Penutur Bahasa Lisan Buatan)
Speech Synthesizer memiliki alur kerja yang berlawanan dengan speech recognition. Jika pada speech recognition, masukannya berupa bahasa lisan dan keluarannya adalah transkripsi berupa teks, maka pada speech synthesizer, masukannya berupa teks dan keluarannya berupa bahasa lisan buatan. Sistem ini bermanfaat bagi penyandang tuna wicara. Hal-hal yang ingin mereka sampaikan dapat mereka ketik, yang kemudian akan diproses oleh sistem menjadi bahasa lisan buatan. Selain itu, sistem ini juga dapat dipasang pada robot, sehingga lebih interaktif dengan manusia. Tantangan pada pengembangan sistem ini adalah membuat bahasa lisan buatan yang terdengar cukup natural bagi persepsi manusia dan dilengkapi dengan ekspresi atau emosi yang sesuai dengan maksud kalimat atau frasa yang diucapkan.

Language Identification (Identifikasi Bahasa Lisan)
Language identification adalah suatu sistem yang dapat mendeteksi bahasa dari ucapan lisan seseorang. Sistem ini biasa dipasang pada sistem multilingual di mana pendeteksian bahasa diperlukan sebelum bahasa lisan tersebut diproses lebih jauh. Sebagai contoh pada multilingual speech recognition system yang dapat memproses 5 bahasa, sistem identifikasi bahasa lisan ini dipasang sebagai komponen depan yang mengidentifikasi bahasa dari ucapan pengguna terlebih dahulu sebelum sinyal bahasa lisan tersebut diproses lebih lanjut untuk menghasilkan teks transkripsinya.

Dictation System (Sistem Pendikte)
Sistem pendikte pada dasarnya adalah salah satu jenis speech recognition system, yang memiliki fungsi sama yaitu menghasilkan teks transkripsi dari bahasa lisan. Yang menjadi sifat khusus dari sistem ini terletak pada tipe bahasa lisan yang menjadi masukan. Pada sistem pendikte, bahasa lisan yang menjadi masukan sistem diucapkan secara teratur dengan pengucapan sejelas mungkin. Sebagai contoh, sistem pendikte bisa digunakan untuk mencatat notulen jalannya persidangan.

Smart House (Rumah Pintar)
Rumah pintar merupakan rumah di mana peralatan-peralatan di dalam rumah dikendalikan oleh perintah suara. Konsep ini sangat bermanfaat bagi warga senior atau penyandang disabilitas untuk memudahkan mereka dalam beraktifitas sehari-hari di rumah. Misalnya, pengguna cukup mengucapkan perintah “Matikan lampu!” untuk mematikan lampu kamar. Proses di dalamnya menerapkan teknologi speech recognition dengan tipe suara masukan berupa perintah lisan. Pada dasarnya, inti dari konsep rumah pintar ini terletak pada sistem perintah berbasis suara. Dengan demikian, sistem ini dapat diterapkan pada media lain, misalnya di telepon genggam, mobil (smart car), kantor (smart office), dan lain-lain.

Speaker Verification (Verifikasi Pembicara)
Speaker verification merupakan suatu sistem untuk memverifikasi pembicara dari bahasa lisan. Di sini, suara diperlakukan sebagai suatu identitas dari seseorang. Karena berkaitan dengan identitas personal, sistem ini umumnya digunakan untuk keamanan. Sebagai contoh, saat seseorang menelepon suatu bank melaporkan bahwa kartu ATM-nya hilang dan minta diblokir, penerima telepon tidak perlu lagi menanyakan sejumlah pertanyaan personal atau rahasia untuk memastikan bahwa si penelepon adalah benar pemilik rekening tersebut. Laporan tersebut dapat diproses oleh sistem dengan memverifikasi suara penelepon, apakah suara tersebut memang benar merupakan suara pemilik rekening atau bukan. Dengan adanya sistem ini, proses verifikasi dapat berlangsung lebih cepat.

Speech Translator (Sistem Penerjemah Bahasa Lisan)
Sistem penerjemah bahasa lisan merupakan suatu sistem yang menggabungkan dua atau lebih sistem lainnya, yakni speech recognition dan mesin penerjemah. Sistem menerima masukan berupa suara dalam suatu bahasa, misalnya bahasa Inggris, yang kemudian diproses oleh speech recognition untuk menghasilkan teks transkripsi dalam bahasa tersebut (Inggris). Teks tersebut kemudian diproses oleh mesin penerjemah untuk diterjemahkan ke bahasa target, misalnya Bahasa Indonesia. Teks hasil terjemahan bisa langsung ditampilkan ke pengguna, atau bisa juga diproses lebih lanjut untuk menghasilkan bahasa lisan buatan dengan menggunakan teknologi speech synthesizer. Sistem ini sangat berguna di bidang pariwisata bagi para turis atau digunakan oleh pelaku bisnis global untuk berkomunikasi secara internasional.

Selain ketujuh sistem di atas, masih ada sejumlah sistem aplikasi berbasis suara lainnya, misalnya spoken language understanding di mana bahasa lisan tidak sekedar ditranskripsikan, tetapi juga diobservasi maknanya dengan tujuan untuk memberikan respon yang sesuai. Pada dasarnya, seluruh sistem yang melibatkan suara dalam pemrosesannya dapat dikategorikan sebagai teknologi bahasa lisan.

Amalia Zahra