Doctorandus

Publieke verdediging

Naam:	Rein Houthooft	Datum:	Donderdag 09/03/2017 om 17:00
Adres:	() , null null	Lokatie:	auditorium P Jozef Plateau, gelijkvloers, Jozef Plateaustraat 22, 9000 Gent
Contact FEA:	info.ea@ugent.be	Taal:	Engels

Curriculum
KAHO Sint-Lieven - Bachelor of Science in Industrial Engineering Scienes: Electronics-ICT (2011) KAHO Sint-Lieven - Master of Science in Industrial Engineering Scienes: Electronics-ICT, option ICT (2012) Ghent University - Master of Science in Computer Science Engineering, option Software Engineering (2014)

Promotor

Filip De Turck

Examencommissie

prof. Patrick De Baets

Filip De Turck (EA05)

Emmeric Tanghe

Tom Dhaene, Universiteit Gent, Faculteit Ingenieurswetenschappen en Architectuur, EA05 - Vakgroep Informatietechnologie, Technologiepark Zwijnaarde 126, 9052 Zwijnaarde
E: tom.dhaene@ugent.be

Tim Verbelen

Femke Ongenae

Steven Verstockt

Anna Sperotto

Ann Nowé

Onderzoeksthema

Deze scriptie onderzoekt het ontwikkelen van artificiële intelligente systemen die in staat zijn gestructureerde beslissingen te nemen. Het eerste deel van deze thesis focust op het maken van gestructureerde beslissingen waarbij deze gecorreleerd zijn in het ruimtelijke domein. Een klasse methoden, genaamd structural support vector machines, wordt onderzocht en verschillende fundamentele uitbreidingen worden voorgesteld. Deze modellen worden toegepast bij het overwinnen van een belangrijke hindernis voor de realisatie van autonome voertuigen, namelijk de mogelijkheid om de omgeving semantisch waar te nemen. Camera-input van het voertuig wordt aan deze gestructureerde predictiemodellen gevoed met als doel een semantische segmentatie van de omgeving te bekomen. Het tweede deel handelt over temporeel gestructureerde beslissingname. Hierin wordt reinforcement learning (RL) onderzocht, waarbij een agent tracht een bepaald opgelegd doel te bereiken in een initieel onbekende omgeving. Omdat dit doel bereiken meerdere acties vereist, kunnen we de actiesequenties interpreteren als gestructureerde beslissingen in de tijd. Elke actie beïnvloedt namelijk de volgende. We introduceren fundamenteel nieuwe methoden voor diepe RL, reinforcement learning die gebruik maakt van diepe neurale netwerken. Deze methoden worden toegepast bij het leren van voortbewegingspatronen in robotica en het autonoom spelen van videospellen.

Taal proefschrift
Engels

Documenten

Doctoraat in de ingenieurswetenschappen: computerwetenschappen