Doctoraat in de ingenieurswetenschappen: elektrotechniek

Optimalisatie van het uitspraakwoordenboek in automatische spraakherkenning


Doctorandus Publieke verdediging
Naam: Bert Réveil   Datum: Vrijdag 25/01/2013 om 16:00 
Adres: ()
, null null
  Lokatie: auditorium P Jozef Plateau, gelijkvloers, Jozef Plateaustraat 22, 9000 Gent
Contact FEA: info.ea@ugent.be   Taal: Nederlands

Curriculum
Master in de ingenieurswetenschappen: elektrotechniek, afstudeerrichting: informatie- en communicatietechnologie.
Behaald aan de Faculteit Ingenieurswetenschappen en Architectuur, UGent, in 2006.

Promotor
Jean-Pierre Martens

Examencommissie
em. prof. Hendrik Van Landeghem
Jean-Pierre Martens (EA06)
Lori Lamel
Torbjorn Svendsen
Bart Dhoedt
Henk van den Heuvel
Kris Demuynck, Universiteit Gent, Faculteit Ingenieurswetenschappen en Architectuur, EA06 - Vakgroep Elektronica en Informatiesystemen, Technologiepark Zwijnaarde 122, 9052 Zwijnaarde
E: kris.demuynck@ugent.be

Onderzoeksthema

Een doorsnee automatische spraakherkenner werkt met een uitspraakwoordenboek. Dat uitspraakwoordenboek bevat een lijst van woorden die kunnen worden herkend, alsook minstens één gangbare uitspraak per woord. Het uitspraakwoordenboek bepaalt zo de woordenschat van de herkenner. Woorden die niet tot die woordenschat behoren, zogenaamde Out-of-Vocabulary-woorden (OOV-woorden), kunnen nooit worden herkend en zorgen voor herkenningsfouten. Het uitspraakwoordenboek bepaalt ook de verwachte uitspraken van woorden. Als woorden anders worden uitgesproken dan de herkenner verwacht, dan treden er eveneens herkenningsfouten op. In dit proefschrift heb ik methodes ontworpen en geanalyseerd die tot doel hebben de fouten die worden veroorzaakt door OOV-woorden enerzijds, en onverwachte woorduitspraken anderzijds te minimaliseren. Het probleem van OOV-woorden werd aangepakt in de context van Nederlandse continue spraakherkenning (bv. nuttig voor de automatische ondertiteling van nieuwsuitzendingen). Twee methodes werden uitgewerkt die, in vergelijking met de prestaties van een state-of-the-art herkenner, beide tot statistische significante verbeteringen van de herkenningsprecisie leiden. Het probleem van de onverwachte woorduitspraken werd aangepakt in de context van meertalige eigennaamherkenning (bv. nuttig voor stemgestuurde GPS-systemen) waar heel vaak uitspraakvariaties optreden. Ook hier was ik in staat een methode te concipiëren die de herkenningsprecisie statistisch significant kan verbeteren ten aanzien van de prestatie van een state-of-the-art herkenner.


Taal proefschrift
Engels

Documenten