Het internet is het laatste decennium spectaculair gegroeid. In de begindagen van het internet werden er vooral statische en eenvoudige webpagina's
aangeboden. Vandaag bieden de meeste webapplicaties complexe diensten aan zoals e-mail, mediatoepassingen, sociaalnetwerkdiensten, enz. Deze diverse en complexe diensten worden vaak gebruikt door duizenden tot miljoenen gebruikers.
Om een groot aantal gebruikers te ondersteunen worden grootschalige datacenters gebouwd. Het is een grote uitdaging om deze datacenters op een efficiënte manier te beheren, zowel op prestatievlak als op het vlak van de totale kostprijs. De totale kostprijs van een datacenter wordt beïnvloed door een aantal factoren waaronder de hardware-infrastructuur, energievoorziening, koeling, software, gebouwen en operationele kosten.
In dit proefschrift stellen we een automatische techniek voor om het maximaal vermogenverbruik van datacenterhardware te bepalen, teneinde de energievoorziening efficiënter te dimensioneren. Vervolgens karakteriseren we enkele data-intensieve werklasten en één specifieke werklast, een sociaalnetwerksite. Omdat sociaalnetwerksites zeer interactief zijn, wordt er extra aandacht besteed aan de prestatie, in functie van de responstijd zoals die ervaren wordt door de eindgebruiker. Bovendien is het bij testomgevingen belangrijk om privacy en bedrijfsgevoelige informatie te beschermen. Daarom stellen we tenslotte een raamwerk voor om op een automatische manier een synthetische en geanonimiseerde kloon van een databank op te stellen. | |