Jumat, 12 November 2010

Speech Synthesis

Speech synthesis atau pidato sintesis adalah produksi buatan manusia pidato. Sebuah sistem komputer yang digunakan untuk tujuan ini disebut speech synthesizer, dan dapat diimplementasikan dalam perangkat lunak atau perangkat keras. text-to-speech (TTS) sistem bahasa normal mengkonversi teks ke dalam pidato. sistem lain membuat representasi linguistik simbolis seperti transkripsi fonetik bicara.

Pidato buatan dapat dibuat dengan potongan-potongan concatenating pidato yang direkam disimpan dalam database. Sistem berbeda dalam ukuran pidato yang disimpan unit; sebuah sistem yang menyimpan telepon memberikan rentang output terbesar, tapi mungkin kurang jelas. Untuk keperluan khusus domain, yang menyimpan seluruh kata-kata atau kalimat memungkinkan output yang berkualitas tinggi. Atau, synthesizer dapat menggabungkan sebuah model dari sistem vokal dan karakteristik suara manusia lain untuk membuat yang benar-benar “sintetik” output suara. Kualitas synthesizer pidato dinilai oleh kesamaan dengan suara manusia dan kemampuannya untuk dipahami. semua dimengerti text-to-speech program yang memungkinkan orang-orang dengan gangguan visual atau membaca untuk mendengarkan karya-karya tulis di komputer rumah. Banyak sistem operasi komputer termasuk alat bicara sejak awal 1980-an.



A text-to-speech system (atau “mesin”) adalah terdiri dari dua bagian: front-end dan back-end. Front-end memiliki dua tugas utama. Pertama, mengubah teks mentah berisi simbol seperti angka dan singkatan menjadi setara dengan tertulis-kata-kata. Proses ini sering disebut normalisasi teks, pra-pengolahan, atau tokenization. Front-end kemudian menetapkan transkripsi fonetik untuk setiap kata, dan membagi dan menandai teks ke prosodic unit seperti frase dan kalimat. Proses transkripsi fonetik untuk menetapkan kata-kata ini disebut teks-ke-fonem atau grafem-ke-fonem konversi. Fonetis transkripsi dan informasi ilmu persajakan bersama-sama membentuk representasi simbolik yang linguistik output dengan front-end. Back-end-sering disebut sebagai synthesizer-maka mengubah representasi linguistik simbolik menjadi suara.

Suara teks-to-speech engine di Vista adalah Microsoft Anna, dan Microsoft Sam pada Windows XP. Vista pengguna dapat mendengar suara sangat jelas dari Anna, dan kualitas suara Anna Microsoft jauh lebih baik daripada Microsoft Sam. Sintesis pidato Windows program yang disebut narator telah dikirimkan dengan Windows2000, Windows XP dan Vista. Bila pengguna Windows ingin mendapatkan suara tidak hanya membaca tetapi juga file audio seperti gelombang dan file mp3 pidato, mereka dapat menginstal bebas teks-to-speech dan panopreter text-to-mp3 aplikasi yang ditawarkan oleh panopreter.com. Hal membaca file teks dan mengkonversi pidato menjadi gelombang dan mp3 file, pengguna dapat mengimpor file audio yang dihasilkan ke perangkat portabel, dan mendengarkan mereka sambil berjalan, jogging atau Komuter untuk bekerja.

Speech sintesis menjadi alat bantu teknologi vital dan penerapannya di daerah ini sangat signifikan dan luas, sekarang umum digunakan oleh orang-orang dengan disleksia dan kesulitan membaca lainnya maupun oleh anak-anak pra-melek. Sementara itu, aplikasi sintesis pidato dan gadget pada bahasa alat belajar. Teknik sintesis Pidato sekarang juga digunakan dalam produksi hiburan seperti game, anime dan yang sejenis, dan banyak digunakan dalam produk telekomunikasi juga

Tidak ada komentar:

Posting Komentar