Speech
recognition adalah proses konversi sebuah sinyal akustik, yang ditangkap oleh
microphone atau telepon, untuk merangkai kata kata. Kata–kata yang dikenali
merupakan hasil akhir untuk sebuah aplikasi seperti command & control,
penginputan data, dan persiapan dokumen. Kita hanya perlu mengatakan perintah
dengan bahasa inggris lalu komputer akan menjalankan perintah kita. Hal ini
juga bisa dilakukan untuk pengetikan. Speech Recognition di windows 7 membuat
kita bisa memerintah PC dengan suara kita untuk mendikte hampir
ke berbagai aplikasi.
Sejarah
Speech Recognition
ü 1874
: Alexander Graham Bell berhasil membuktikkan bahwa frekuensi harmoni
dari sebuah sinyal elektrik dapat dibagi-bagi yang kemudian hari berlanjut pada
digitalisasi ucapan.
ü 1952
: Bell Labs mengembangkan speech recognizer pertama dengan menggunakan
teknologi pemisah frekuensi yang serupa dengan teknologi yang dikembangkan oleh
Alexander Graham Bell.
ü 1971-1976
: Defence Advance Research Project Agency dibentuk yang merupakan proyek
riset dengan dana dari pemerintah AS. Tujuan dari proyek ini adalah untuk
melakukan penelitian teknologi speech recognition. Penemuan terbesar yang
dihasilkan proyek ini adalah peningkatan dalam menekan permasalahan
variabilitas suara.
ü Pertengahan
tahun 1970-an : Itakura mengadakan sebuah riset untuk mengembangkan
sebuah produk yang berbasis pada asumsi bahwa noise itu walaupun terdengar sama
namun pada kenyataannya tidak demikian. Produk tersebut akurasinya mencapai
97,3% saat diuji menggunakan 200 kosakata.
Bell Labs
mengembangkan sistem yang mampu mengenali suara dari orang-orang yang berbeda
dengan akurasi hingga 97,1%.
ü Akhir
1970-an : Produk speech recognition pertama mulai dipasarkan dengan
harga mulai $259 hingga $100.000.
ü 1980-an
: Pasaran speech recognition mulai digolongkan menjadi dua, yaitu Call
Center Speech Recognition System dan Speech-to-Text Application.
ü 1990-an
: Prosesor sebuah personal computer telah sanggup memenuhi level
minimal yang diperlukan agar sebuah software speech recognition dapat berjalan
dengan lancar serta efektif untuk penggunaan pribadi.
ü 1999
: Sebuah program speech recognition baru telah mampu memahami
pembicaraan manusia secara berkesinambungan dengan tingkat akurasi hingga 99%
yang membuatnya dapat dengan mudah digunakan oleh pengguna awam sekaligus.
Penerapan Speech Recognition
1. Bidang
komunikasi
ü Komando
Suara adalah suatu program pada komputer yang melakukan perintah
berdasarkan komando suara dari pengguna. Contohnya pada aplikasi Microsoft
Voice yang berbasis bahasa Inggris. Ketika pengguna mengatakan “Mulai
kalkulator” dengan intonasi dan tata bahasa yang sesuai, komputer akan segera membuka aplikasi kalkulator. Jika
komando suara yang diberikan sesuai dengan daftar perintah yang tersedia,
aplikasi akan memastikan komando suara dengan menampilkan tulisan “Apakah Anda
meminta saya untuk ‘mulai kalkulator’?”. Untuk melakukan verifikasi, pengguna
cukup mengatakan “Lakukan” dan komputer akan langsung beroperasi.
ü Pendiktean adalah
sebuah proses mendikte yang sekarang ini banyak dimanfaatkan dalam pembuatan
laporan atau penelitian. Contohnya pada aplikasi Microsoft Dictation yang
merupakan aplikasi yang dapat menuliskan apa yang diucapkan oleh pengguna
secara otomatis.
ü Telepon
adalah Pada telepon, teknologi pengenal ucapan digunakan pada proses
penekanan tombol otomatis yang dapat menelpon nomor tujuan dengan komando
suara.
2. Bidang
kesehatan
Alat
pengenal ucapan banyak digunakan dalam bidang kesehatan untuk membantu para
penyandang cacat dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara
Pengguna atauVoice User Interface (VUI) yang menggunakan teknologi
pengenal ucapan dimana pengendalian saklar lampu misalnya, tidak perlu
dilakukan secara manual dengan menggerakkan saklar tetapi cukup dengan
mengeluarkan perintah dalam bentuk ucapan sebagai saklarnya. Metode ini
membantu manusia yang secara fisik tidak dapat menggerakkan saklar karena cacat
pada tangan misalnya. Penerapan VUI ini tidak hanya untuk lampu saja tapi bisa
juga untuk aplikasi-aplikasi kontrol yang lain.
3. Bidang
militer
ü Pelatihan
Penerbangan : Aplikasi alat pengenal ucapan dalam bidang militer
adalah pada pengatur lalu-lintas udara atau
yang dikenal dengan Air Traffic Controllers (ATC) yang dipakai
oleh para pilot untuk mendapatkan keterangan mengenai keadaan lalu-lintas udara
seperti radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan
sebagai pengganti operator yang memberikan informasi
kepada pilot dengan cara berdialog.
ü Helikopter :
Aplikasi alat pengenal ucapan pada helikopter digunakan untuk berkomunikasi
lewat radio dan menyesuaikan sistem navigasi. Alat ini sangat diperlukan pada
helikopter karena ketika terbang, sangat banyak gangguan yang akan menyulitkan
pilot bila harus berkomunikasi dan menyesuaikan navigasi dengan terlebih dahulu
memencet tombol tertentu.
Kelebihan
dari peralatan yang menggunakan teknologi ini adalah :
a
Cepat
Teknologi ini mempercepat transmisi informasi dan umpan balik dari transmisi tersebut. Contohnya pada komando suara. Hanya dalam selang waktu sekitar satu atau dua detik setelah kita mengkomandokan perintah melalui suara, komputer sudah memberi umpan balik atas komando kita.
Teknologi ini mempercepat transmisi informasi dan umpan balik dari transmisi tersebut. Contohnya pada komando suara. Hanya dalam selang waktu sekitar satu atau dua detik setelah kita mengkomandokan perintah melalui suara, komputer sudah memberi umpan balik atas komando kita.
b Mudah
digunakan, Kemudahan teknologi ini juga dapat dilihat dalam aplikasi
komando suara. Komando yang biasanya kita masukkan ke dalam komputer dengan
menggunakan tetikus atau papan ketik kini dapat dengan mudahnya kita lakukan tanpa
perangkat keras, yakni dengan komando suara.
Kekurangan
dari peralatan yang menggunakan teknologi ini adalah :
a
Rawan
terhadap gangguan. Hal ini disebabkan oleh proses sinyal suara yang
masih berbasis frekuensi. Ketika sebuah informasi dalam sinyal suara mempunyai
komponen frekuensi yang sama banyaknya dengan komponen frekuensi gangguannya,
akan sulit untuk memisahkan gangguan dari sinyal suara.
b Jumlah
kata yang dapat dikenal terbatas. Hal ini disebabkan pengenal ucapan
bekerja dengan cara mencari kemiripan dengan basis data yang dimiliki.
Hardware
yang dibutuhkan dalam implementasi Speech Recognition :
a
Sound
card : Merupakan perangkat yang ditambahkan dalam suatu Komputer yang
fungsinya sebagai perangkat input dan output suara untuk mengubah sinyal
elektrik, menjadi analog maupun menjadi digital.
b Microphone :
Perangkat input suara yang berfungsi untuk mengubah suara yang melewati udara,
air dari benda orang menjadi sinyal elektrik.
c Komputer
atau Komputer Server : Dalam proses suara digital menterjemahkan
gelombang suara menjadi suatu simbol biasanya menjadi suatu nomor biner yang
dapat diproses lagi kemudian diidentifikasikan dan dicocokan dengan database
yang berisi berkas suara agar dapat dikenali.
Terdapat
4 langkah utama dalam sistem pengenalan suara :
1. Penerimaan
data input
b 2. Ekstraksi,
yaitu penyimpanan data masukan sekaligus pembuatan database untuk template.
c 3. Pembandingan/pencocokan,
yaitu tahap pencocokan data baru dengan data suara (pencocokan tata bahasa)
pada template.
d 4. Validasi
identitas pengguna.
Secara
umum, speech recognition memproses sinyal suara yang masuk dan menyimpannya
dalam bentuk digital. Hasil proses digitalisasi tersebut kemudian dikonversi
dalam bentuk spektrum suara yang akan dianalisa dengan membandingkannya dengan
template suara pada database sistem.
Data
suara masukan dipilah-pilah dan diproses satu per satu berdasarkan urutannya.
Pemilahan ini dilakukan agar proses analisis dapat dilakukan secara paralel.
Proses yang pertama kali dilakukan ialah memproses gelombang kontinu spektrum
suara ke dalam bentuk diskrit.
Sumber :
http://dee-x-cisadane.webs.com/apps/blog/show/10345884-speech-recognition
Tidak ada komentar:
Posting Komentar