Het fenomeen big data is het resultaat van een reeks doorbraken in verschillende domeinen die elkaar op hun beurt versterken. Zo wordt er steeds meer data verzameld, zijn er technologieën die deze data op een gedistribueerde manier kunnen opslaan en blijken ook algoritmes voor patroondetectie een pak beter te presteren als ze toegepast worden op deze grote datasets.
Dit onderzoek past perfect binnen deze trend. In het eerste deel van dit werk worden een reeks algoritmes ontwikkeld die op een gedistribueerde manier biodata kunnen verwerken. Deze parallelle aanpak laat toe om de problemen op een exacte manier op te lossen, zonder gebruik te maken van heuristieken of benaderingen. De gevonden patronen blijken in overeenstemming met welgekende experimentele resultaten.
In het tweede deel van dit werk wordt onderzocht op welke manier de gevonden patronen gepubliceerd kunnen worden op het web. Er wordt een reproduceerbare methode ontwikkeld om semantische databases te bevragen. Concreet worden een tiental technologieën geëvalueerd langs meerdere dimensies. | |