Doctoraat in de ingenieurswetenschappen: computerwetenschappen

Correctie van derdegeneratie-sequencingdata door middel van sequentie-alignering op een graaf


Doctorandus Publieke verdediging
Naam: Giles Miclotte   Datum: Woensdag 21/08/2019 om 16:00 
Adres: vakgroep Informatietechnologie,vakgroep Plantenbiotechnologie en Bio-informatica (EA05,WE09)
Sint-Pietersnieuwstraat 41,Technologiepark Zwijnaarde 126, 9000;9052 Gent;Zwijnaarde
  Lokatie: auditorium 1, iGent, eerste verdieping, Technologiepark Zwijnaarde 126, 9052 Zwijnaarde
Contact FEA: info.ea@ugent.be   Taal: Nederlands

Curriculum
Master of Science in de wiskunde: zuivere wiskunde; Universiteit Gent; 2014

Promotor
Jan Fostier
Pieter Audenaert

Examencommissie
prof. Gert De Cooman
Jan Fostier (EA05)
Pieter Audenaert (EA05)
Stephane Rombauts
Kathleen Marchal, Universiteit Gent, Faculteit Ingenieurswetenschappen en Architectuur, EA05,WE09 - Vakgroep Informatietechnologie,Vakgroep Plantenbiotechnologie en Bio-informatica, Technologiepark Zwijnaarde 126, 9052 Zwijnaarde
E: kathleen.marchal@ugent.be
Mario Pickavet
Leena Salmela
Thomas Demeester

Onderzoeksthema

Het reconstrueren van de genoomsequentie aan de hand van korte sequentiedata wordt bemoeilijkt door herhaalde regios in het genoom. Derde generatie sequentiedata en optische kaartdata bieden hier een mogelijke oplossing voor door het verschaffen van lange afstandsinformatie. In tegenstelling tot de korte sequentiedata, hebben derde generatie sequentiedata een hoog foutenpercentage, daardoor kunnen eerdere assemblagemethoden moeilijk worden toegepast. De optische kaartdata is geen sequentiedata, maar laat het verbeteren en valideren van gereconstrueerde genomen toe. Dit doctoraatsproefschrift introduceert OMSim, een simulator voor optische kaartdata die gebruikt kan worden in de ontwikkeling van nieuwe software. Verder wordt Jabba voorgesteld, een methode om snel fouten in de lange sequentiedata te verbeteren met behulp van accurate korte sequentiedata. Jabba steunt op het seed-and-extend-paradigma, waarin maximale exacte overeenkomsten tussen de lange sequentiedata en een de Bruijn graaf gecombineerd worden met pseudomapping. Met synthetische en echte datasets wordt aangetoond dat Jabba doorgaans beter presteert dan state-of-the-art-alternatieven voor kleine tot middelgrote genomen. De methodologie uit Jabba werd verder verbeterd met een iteratief seeding algoritme, en een methode om het zoeken van overeenkomsten tussen een sequentie en een de Bruijn graaf te beperken tot een deelgraaf.


Taal proefschrift
Engels

Documenten