Doctoraat in de ingenieurswetenschappen: computerwetenschappen

Neurale netwerkoplossingen voor het labelen van tekstsequenties bij informatie-extractie


Doctorandus Publieke verdediging
Naam: Ioannis Bekoulis   Datum: Vrijdag 11/10/2019 om 16:00 
Adres: ()
, null null
  Lokatie: auditorium 1, iGent, eerste verdieping, Technologiepark Zwijnaarde 126, 9052 Zwijnaarde
Contact FEA: info.ea@ugent.be   Taal: Engels

Curriculum
Applied Mathematics for Datascience, Master, Ecole Polytechnique, 2016
Computer Science Engineering, Joint Bachelor and Master, University of Patras, 2012

Promotor
Chris Develder
Thomas Demeester

Examencommissie
prof. Filip De Turck
Chris Develder (EA05)
Thomas Demeester (EA05)
Tom Dhaene, Universiteit Gent, Faculteit Ingenieurswetenschappen en Architectuur, EA05 - Vakgroep Informatietechnologie, Technologiepark Zwijnaarde 126, 9052 Zwijnaarde
E: tom.dhaene@ugent.be
Sofie Van Hoecke
Veronique Hoste
Isabelle Augenstein
Kris Demuynck

Onderzoeksthema

Een belangrijk aspect binnen artificiële intelligentie (AI) is het interpreteren van menselijke taal uitgedrukt in tekstuele (geschreven) vorm: natural language processing (NLP) is belangrijk gezien tekstuele informatie nuttig is voor veel toepassingen. Toch is het verstaan ervan (zogenaamde natural language understanding, NLU) een uitdaging, gezien de ongestructureerde vorm van tekst, waarvan de betekenis vaak dubbelzinnig en contextafhankelijk is. In dit proefschrift introduceren we oplossingen voor tekortkomingen van gerelateerd werk bij het behandelen van fundamentele taken in natuurlijke taalverwerking, zoals named entity recognition (i.e., het identificeren van de entiteiten die in een zin voorkomen) en relatie-extractie (het identificeren van relaties tussen entiteiten). Vertrekkend van een specifieke probleem (met name het identificeren van de structuur van een huis aan de hand van een tekstueel zoekertje), bouwen we stapsgewijs een complete (geautomatiseerde) oplossing voor de bovengenoemde taken, op basis van neurale netwerkarchitecturen. Onze oplossingen zijn algemeen toepasbaar op verschillende toepassingsdomeinen en talen. We beschouwen daarnaast ook de taak van het identificeren van relevante gebeurtenissen tijdens een evenement (bv. een doelpunt tijdens een voetbalwedstrijd), in informatiestromen op Twitter. Meer bepaald formuleren we dit probleem als het labelen van woord sequenties (vergelijkbaar met named entity recognition), waarbij we de chronologische relatie tussen opeenvolgende tweets benutten.


Taal proefschrift
Engels

Documenten