Doctorandus

Publieke verdediging

Naam:	Marcin Szymczak	Datum:	Vrijdag 19/06/2015 om 14:00
Adres:	() , null null	Lokatie:	nog niet bepaald
Contact FEA:	info.ea@ugent.be	Taal:	Engels

Curriculum
Master of Science, Engineer (double degree), Poznan University of Technology (home university), Alpen Adria University of Klagenfurt (host university), 2010

Promotor

Guy De Tré

Slawomir Zadrozny

Examencommissie

prof. Rik Van de Walle

Guy De Tré (EA07)

Slawomir Zadrozny (Systems Research Institute, Polish Academy of Sciences, Warschau, Polen)

Antoon Bronselaer, Universiteit Gent, Faculteit Ingenieurswetenschappen en Architectuur, EA07 - Vakgroep Telecommunicatie en Informatieverwerking, Sint-Pietersnieuwstraat 41, 9000 Gent
E: antoon.bronselaer@ugent.be

Bart Dhoedt

Janusz Kacprzyk

Piotr Szczepaniak

Onderzoeksthema

De hoeveelheid gegevens in informatiesystemen groeit heel snel en gegevens zijn dikwijls gedistribueerd over heterogene gegevensbronnen. Bijgevolg kan dezelfde informatie op verschillende manieren gemodelleerd zijn, wat coreferentie genoemd wordt. Om de interoperabiliteit van informatiesystemen te verbeteren is het belangrijk dat coreferentie (semi-) automatisch kan worden gedetecteerd. Enerzijds voorzien metadata, bvb. een ontologie of een databankschema, in extra informatie over de data, wat het detecteren van coreferentie op het dataniveau kan ondersteunen. Anderzijds kunnen data, meer specifiek de data die beschreven zijn door metadata, worden gebruikt om coreferentie in metadata terug te vinden. In deze doctoraatsthesis stellen we twee nieuwe technieken voor om coreferentie op metadata-niveau in XML-databankschemas te detecteren. De eerste techniek vergelijkt namen van schemaelementen lexicaal en beschouwt daarbij hun onderlinge belangrijkheid. De tweede techniek is gebaseerd op inhoudelijke data: attribuutdomeinen worden lexicaal vergeleken en statistisch geanalyseerd om coreferentie te detecteren. Daarnaast wordt een nieuwe techniek voorgesteld om een kennisbank op te bouwen met semantische informatie over de domeinen van de attributen op basis van een (partiële) orderelatie die een notie van veralgemening weergeeft. Het gebruik en de impact van deze techniek op dataintegratie worden onderzocht. Dank zij de techniek is er geen a priori taxonomische kennis meer nodig over het attribuutdomein om semantische coreferentiedetectie te kunnen uitvoeren.

Taal proefschrift
Engels

Documenten

Doctoraat in de ingenieurswetenschappen: computerwetenschappen