Doctoraat in de ingenieurswetenschappen: computerwetenschappen

Algoritmen op basis van machinaal leren voor gestructureerde besluitvorming


Doctorandus Publieke verdediging
Naam: Rein Houthooft   Datum: Donderdag 09/03/2017 om 17:00 
Adres: ()
, null null
  Lokatie: auditorium P Jozef Plateau, gelijkvloers, Jozef Plateaustraat 22, 9000 Gent
Contact FEA: info.ea@ugent.be   Taal: Engels

Curriculum
KAHO Sint-Lieven - Bachelor of Science in Industrial Engineering Scienes: Electronics-ICT (2011)
KAHO Sint-Lieven - Master of Science in Industrial Engineering Scienes: Electronics-ICT, option ICT (2012)
Ghent University - Master of Science in Computer Science Engineering, option Software Engineering (2014)

Promotor
Filip De Turck

Examencommissie
prof. Patrick De Baets
Filip De Turck (EA05)
Emmeric Tanghe
Tom Dhaene, Universiteit Gent, Faculteit Ingenieurswetenschappen en Architectuur, EA05 - Vakgroep Informatietechnologie, Technologiepark Zwijnaarde 126, 9052 Zwijnaarde
E: tom.dhaene@ugent.be
Tim Verbelen
Femke Ongenae
Steven Verstockt
Anna Sperotto
Ann Nowé

Onderzoeksthema

Deze scriptie onderzoekt het ontwikkelen van artificiële intelligente systemen die in staat zijn gestructureerde beslissingen te nemen. Het eerste deel van deze thesis focust op het maken van gestructureerde beslissingen waarbij deze gecorreleerd zijn in het ruimtelijke domein. Een klasse methoden, genaamd structural support vector machines, wordt onderzocht en verschillende fundamentele uitbreidingen worden voorgesteld. Deze modellen worden toegepast bij het overwinnen van een belangrijke hindernis voor de realisatie van autonome voertuigen, namelijk de mogelijkheid om de omgeving semantisch waar te nemen. Camera-input van het voertuig wordt aan deze gestructureerde predictiemodellen gevoed met als doel een semantische segmentatie van de omgeving te bekomen. Het tweede deel handelt over temporeel gestructureerde beslissingname. Hierin wordt reinforcement learning (RL) onderzocht, waarbij een agent tracht een bepaald opgelegd doel te bereiken in een initieel onbekende omgeving. Omdat dit doel bereiken meerdere acties vereist, kunnen we de actiesequenties interpreteren als gestructureerde beslissingen in de tijd. Elke actie beïnvloedt namelijk de volgende. We introduceren fundamenteel nieuwe methoden voor diepe RL, reinforcement learning die gebruik maakt van diepe neurale netwerken. Deze methoden worden toegepast bij het leren van voortbewegingspatronen in robotica en het autonoom spelen van videospellen.


Taal proefschrift
Engels

Documenten