A beszédszintézis célja az, hogy mesterségesen hozzon létre beszélő emberi – vagy ahhoz a lehető legjobban hasonlító – hangot. Az első ilyen szerkezetet Kempelen Farkas konstruálta, melynek egy példánya ma a müncheni Deutsches Museumban tekinthető meg. Magyarországon az MTA Nyelvtudományi Intézetében is látható egy működő, rekonstruált változat Kempelen beszélő gépéből (2002-ből), valamint a rekonstruált gép hangja meghallgatható a magyarbeszed.tmit.bme.hu honlapon is az interaktív anyagok között.
Többféle eljárás létezik, ezek a leggyakrabban két fokozatban dolgoznak:
- az írott szöveget fonémákká alakítják;
- a fonémákat hangfeldolgozó eljárások segítségével – lehetőleg szakadásmentesen összeillesztve – valamilyen hangkeltő eszközön keresztül hanggá alakítják, például a hangképző szervek utánzásával vagy tárolt hangminták felhasználásával.
Megfontolások
- Nem minden fonéma létezik minden nyelvben (pl ü nincs az angol nyelvben).
- Egy írott szöveg lefordítása fonémákká nem triviális (például a hanglejtés miatt).
- Egy írott szöveg fonémákká alakítása nyelv- és kontextusfüggő.
Programok
Felolvasók:
Hangos (angol) szótárak (és még más is. például concordance)
Magyar kutatás (az egyik):
A másik az MTA;
a harmadik:
- a Speakboard (angol vagy magyar szöveget) felolvasó program
Kulcsszavak: voice portal, számítógépes nyelvészet, hangkódolás, prozódia, hangsúlyozás, nyelvfelismerés, Kempelen Farkas
|
Ez a szócikk vagy szakasz lektorálásra, tartalmi javításokra szorul. A felmerült kifogásokat a szócikk vitalapja részletezi (vagy extrém esetben a szócikk szövegében elhelyezett, kikommentelt szövegrészek). Ha nincs indoklás a vitalapon (vagy szerkesztési módban a szövegközben), bátran távolítsd el a sablont! Csak akkor tedd a lap tetejére ezt a sablont, ha az egész cikk megszövegezése hibás. Ha nem, az adott szakaszba tedd, így segítve a lektorok munkáját! (2005 januárjából) |