Een doorsnee automatische spraakherkenner werkt met een uitspraakwoordenboek. Dat uitspraakwoordenboek bevat een lijst van woorden die kunnen worden herkend, alsook minstens één gangbare uitspraak per woord.
Het uitspraakwoordenboek bepaalt zo de woordenschat van de herkenner. Woorden die niet tot die woordenschat behoren, zogenaamde Out-of-Vocabulary-woorden (OOV-woorden), kunnen nooit worden herkend en zorgen voor herkenningsfouten.
Het uitspraakwoordenboek bepaalt ook de verwachte uitspraken van woorden. Als woorden anders worden uitgesproken dan de herkenner verwacht, dan treden er eveneens herkenningsfouten op.
In dit proefschrift heb ik methodes ontworpen en geanalyseerd die tot doel hebben de fouten die worden veroorzaakt door OOV-woorden enerzijds, en onverwachte woorduitspraken anderzijds te minimaliseren.
Het probleem van OOV-woorden werd aangepakt in de context van Nederlandse continue spraakherkenning (bv. nuttig voor de automatische ondertiteling van nieuwsuitzendingen). Twee methodes werden uitgewerkt die, in vergelijking met de prestaties van een state-of-the-art herkenner, beide tot statistische significante verbeteringen van de herkenningsprecisie leiden.
Het probleem van de onverwachte woorduitspraken werd aangepakt in de context van meertalige eigennaamherkenning (bv. nuttig voor stemgestuurde GPS-systemen) waar heel vaak uitspraakvariaties optreden. Ook hier was ik in staat een methode te concipiëren die de herkenningsprecisie statistisch significant kan verbeteren ten aanzien van de prestatie van een state-of-the-art herkenner. | |