Het begrijpen van taal door computersystemen vormt één van de grootste uitdagingen alvorens we tot artificiële intelligentie kunnen komen waarbij computersystemen met mensen communiceren. Via onderzoek naar natuurlijke taalverwerking trachten we computers ertoe in staat te stellen onze taal te interpreteren. Zo kunnen we taken zoals vertalen, samenvatten of classificeren van teksten aan grote snelheden laten uitvoeren. Dit wordt des te meer relevant nu we enorme volumes tekst genereren onder meer op het web en via sociale media. Machinaal leren voorziet ons van algoritmes gebaseerd op kansberekening en optimalisatietechnieken om computersystemen autonoom te laten leren uit data en tracht ze te laten omgaan met het ambigue karakter van taal. Nog voor we kunnen beginnen aan het proces van machinaal leren, moet de tekst eerst worden voorzien van labels of supervisie. Dit proces is duur en tijdrovend. In dit doctoraatsproefschrift presenteren we een reeks van technieken die deze supervisie op goedkopere en snellere manier genereren. Zo kunnen we sneller de complexe statistische modellen voorzien van de gelabelde tekst die ze vandaag in toenemende mate nodig hebben om intelligent taal te interpreteren en te genereren. | |