Sintetizator govora - sinteza - Text To Speech (TTS) - Tekst u govor - softver, program za slepe

Sinteza - sintetizator govora veštački proizvodi ljudski govor. Sintetizator govora pretvara pisani tekst u govor (Text To Speech - TTS) i može biti realizovan softverski i hardverski.

Sintezovan govor se stvara spajanjem delova snimljenog govora. Sintetizatori se razlikuju po veličini snimljenih delova. Najčešće se koriste sistemi koji proizvode govor iz glasova i dvoglasova. Ovakvi sintetizatori su brzi, zahtevaju manje računarske resurse, ali im je jasnoća i prirodnost slabija. Za specifične upotrebe koriste se cele snimljene reči, pa čak i rečenice. U sintetizator se mogu dodati i neke specifičnosti ljudskog glasa i govora kao što su: boja i visina glasa, ženski-muški-dečiji glas, brzina govora, raspoloženje i drugo.

Sintetizator govora omogućava osobama sa oštećenim vidom (slepima i slabovidima) i osobama sa teškoćama u čitanju da slušaju napisane tekstove.Takođe, sintetizator govora omogućava slepima i slabovidima da koriste računar tako što izgovara ono što čitača ekrana (screen readera) "pročita" na ekranu i pretvori u tekst.

izvor wikipedia.org

 

Saznajte više:

Istorija sintetizatora govora (Text To Speech (TTS) - Tekst u govor)

Mehanički sintetizatori

Mnogo pre nastanka računara bilo je pokušaja da se naprave mašine koje će proizvoditi ljudski govor. Rane primerke "glava koje govore" napravili su:
- Gerbert od Aurilaka
- Gerbert of Aurillac (Pope Sylvester II (946 – 1003)),
- Albert Veliki
- Albertus Magnus (1198–1280)
- Rodžer Bejkon
- Roger Bacon (1214–1294).

1779. danski naučnik Kristijan Kratenstajn, radeći za Rusku akademiju nauka, napravio je modele ljudskog vokalnog trakta koji je mogao da proizvede pet dugih vokala ([aː], [eː], [iː], [oː] i [uː]).

Nakon toga napravljena je "akustičko-mehanička govorna mašina" koja je radila na principu mehova, koju je napravio Volfgang von Kempelen iz Beča. Opisao ju je u svom radu iz 1791. godine. Ovoj mašini dodati su modeli jezika i usana, omogućivši joj da proizvodi kako konsonante tako i vokale.

1837. Čarls Vitstoun napravio je "govornu mašinu" zasnovanu na von Kempelenovom dizajnu, a 1857. M. Faber je napravio "Eufoniju". Vitstounov dizajn je ponovo uveden 1923. od strane Padžeta.

30-tih godina 20. veka, u Bel Laboratorijama napravljen je VOKODER, elektronski analizator i sintetizator govora kojim se upravljalo preko tastature i koji je bio dosta razumljiv. Homer Dadli je usavršio ovaj uređaj u VODER, i izložio ga na Njujorškom Svetskom Sajmu 1939.

Reprodukciju ovog modela su napravili dr Frenklin S. Kuper i njegovi saradnici u Haskins Laboratorijama kasnih 1940-ih, a završili su ga 1950. godine. Bilo je nekoliko raznih verzija ovog hardverskog uređaja ali samo jedan je opstao i do danas. Ova mašina konvertuje slike akustičkih uzoraka govora u formi spektograma u zvuk. Koristeći ovaj uređaj Alvin Liberman i njegove kolege uspeli su da otkriju akustičke signale za percepciju fonetskih segmenata (konsonanata i vokala).

Rani elektronski sintetizatori govora su zvučali poput robota i često bili jedva razumljivi. Vremenom se kvalitet sintetizovanog govora toliko poboljšao da je savremene sisteme za sintezu govora ponekad teško razlikovati od pravog ljudskog govora.

Kako bude opadao odnos cena/performanse, odnosno kako sintetizatori govora budu postajali kvalitetniji, a jeftiniji, tako će veći broj osoba, posebno slepih imati koristi od njih.

Elektronski uređaji

Prva sinteza govora zasnovanu na radu računara napravljena je kasnih 1950-ih godina, a prvi kompletan sistem tekst-u-govor je završen 1968. godine. 1961. godine, fizičar Džon Lari Keli Junior i njegov kolega Luis Grestman koristili su računar IBM 704 za sintezu govora, što je bio jedan od značajnijih događaja u istoriji Bel Laboratorija. Kelijev sintisajzer snimanja glasa (vokoder) reprodukovao je pesmu "Daisy Bell" uz muzičku pratnju Maksa Metjuza. Slučajno, Artur Klark bio je u poseti kod svog prijatelja i kolege Džona Pirsa u Murej Hil ustanovi pri Bell Laboratorijama. Klark je bio toliko impresioniran demonstracijom da ju je iskoristio u uzbudljivoj sceni svog scenarija za svoju novelu 2001:Odiseja u svemiru, gde računar HAL 9000 peva istu pesmu dok ga astronaut Dejv Bovman uspavljuje.

Uprkos uspehu potpune elektronske sinteze govora i dalje se vrše istraživanja o mehaničkim sintisajzerima govora za upotrebu za čovekolike robote.

Prvi sintetizatori za ručne elektronske uređaje javljaju se 1970-tih. Jedan od prvih bio je Telesensory Systems Inc (TSI) Govor+ prenosni kalkulator za slepe proizveden 1976. Drugi uređaji su proizvedeni prvenstveno za obrazovne svrhe, kao Speak & Spell,, proizveden u Texas Instruments-u 1978. Prva multi-player igra pomoću sinteza glasa bila je Milton iz Milton Bradley Company, koja je proizvela uređaj 1980.

Vidi još: čitač ekrana (screen reader), Brajev red - displej,,