Het klinkt aanlokkelijk om uw SmartPhone of autonavigatiesysteem deels via uw stem te kunnen besturen. Maar dat vergt natuurlijk een systeem dat uw spraak kan verstaan. Een dergelijke spraakherkenner vereist op zijn beurt akoestische modellen voor de basisklanken van de taal. Gedurende jaren gebruikte men mengsels van Gaussianen als de basiscomponenten van deze modellen, maar de laatste jaren schakelt men steeds meer over naar kunstmatige neurale netwerken. In dit proefschrift worden akoestische modellen ontwikkeld op basis van Reservoir Computing Netwerken (RCN). Een RCN is een speciaal type neuraal netwerk dat via recurrente verbindingen tussen zijn neuronen, de dynamische eigenschappen van spraak tracht te exploiteren. Bovendien is een RCN vrij eenvoudig te trainen omdat een groot deel van zijn parameters op voorhand kan worden vastgelegd en de resterende parameters de oplossing vormen van een lineair regressieprobleem. Er dienden fundamenteel nieuwe ontwerpmethodes en een statistische raamwerk te worden ontwikkeld om het maximum uit de RCNs te kunnen halen. In dit proefschrift worden RCNs voor het eerst succesvol toegepast voor de herkenning van lopende spraak met een grote woordenschat. De bereikte prestaties zijn nu reeds competitief met de stand van de wetenschap en er lijkt nog voldoende marge te zijn. | |