Recente vooruitgang in taalmodellering, vooral met grote taalmodellen (LLMs) zoals ChatGPT, heeft de capaciteiten van chatbots aanzienlijk verbeterd. Deze chatbots worden grofweg ingedeeld in open-domein chatbots die algemene gesprekken voeren, en taakgerichte chatbots, die gebruikers helpen bij specifieke taken zoals het boeken van vluchten of het afhandelen van klantensupport.
Deze thesis richt zich op het democratiseren van taakgerichte chatbots door hun computationele en data-efficiëntie te verbeteren. De thesis introduceert innovatieve methoden voor twee belangrijke taken van chatbots:
1) Automatische data-annotatie: Deze techniek gebruikt unsupervised learning om klantenvragen automatisch in specifieke onderwerpen te categoriseren, waardoor de behoefte aan handmatige geannoteerde trainingsdata wordt verminderd.
2) Data-augmentatie: We presenteren methoden om extra trainingsvoorbeelden te genereren door bestaande voorbeelden systematisch te transformeren. Deze aanpak verhoogt de diversiteit in de trainingsdata en verbetert daarmee de robuustheid van chatbots tegen ruis in de data, wat vaak voorkomt in de praktijk
Met deze methodes streven we ernaar de computationele middelen en data-vereisten voor het trainen van chatbots te verminderen, waardoor geavanceerde chatbots toegankelijker en praktischer worden voor breed gebruik in verschillende industrieën. | |