Optimalisatie van motiefdetectie met suffixbomen

Student:Wout De Gendt
Richting:Master of Science in de industriële wetenschappen: informatica
Abstract:In deze masterproef wordt een verbetering voorgesteld van het BLSSpeller algoritme, een algoritme dat gen regulerende motieven zoekt. De originele versie van dit algoritme werd gelimiteerd door het beschikbare geheugen van een machine en gebruikte een parallellisatiestrategie die gelijktijdigheidsproblemen veroorzaakte, hierdoor daalde de parallelle efficiëntie sterker bij meer beschikbare threads. Er wordt een nieuwe implementatie voorgesteld met een andere parallellisatiestrategie. In plaats van gelijktijdig motieven uit meerdere suffixbomen toe te voegen aan een gedeelde structuur in het geheugen (motiefmap), worden gelijktijdig meerdere motieven uit één suffixboom toegevoegd. Door de motieven die gelijktijdig worden toegevoegd zorgvuldig te kiezen, kunnen gelijktijdigheidsproblemen in deze implementatie vermeden worden. Hiervoor moet het werk van een suffixboom verdeeld worden. De manier van opsplitsen gebeurt recursief, de diepte tot waar opgesplitst wordt, is afhankelijk van de parameters. Deze nieuwe implementatie biedt de mogelijkheid om taken van een suffixboom over meerdere machines te verdelen en ervoor te zorgen dat dezelfde taken altijd naar dezelfde machine gaan. Dit betekent dat elke machine alleen de motieven hoeft op te slaan die bij de bijbehorende taak horen. Bij de originele implementatie kon enkel de uitvoeringstijd over meerdere machines verdeeld worden, bij de nieuwe implementatie kan zowel de uitvoeringstijd als het geheugengebruik over meerdere machines verdeeld worden.
Abstract (Eng):