Locatiegegevens spelen tegenwoordig een belangrijke rol voor internetdiensten. Zo stelt deze data bijvoorbeeld toepassingen in staat om zoekresultaten te filteren, webpagina's te personaliseren, routeplanning te voorzien of zelfs deze gegevens op zich om te vormen tot een online spel. Nu het gebruik van locatiegebaseerde diensten ingeburgerd is, groeit ook de vraag naar geografische informatie. Hoewel veel diensten reeds toelaten dat hun gebruikers - al dan niet automatisch - zogenaamde geotags kunnen aanbrengen, is er enerzijds reeds heel wat data zonder geotags en zal er anderzijds steeds bepaalde data zijn die niet automatisch wordt geannoteerd.
In dit proefschrift werd onderzocht hoe taalmodellen gebaseerd op data uit sociale media kunnen worden benut om automatisch tekstuele informatiebronnen te georefereren. De bijdragen die dit werk omvat zijn (i) een algemene verbetering van het proces voor het georefereren van Flickr foto's op basis van tags, (ii) de uitwerking van termselectietechnieken die rekening houden met de spatiale aard van het probleem, (iii) het georefereren van informatie op verschillende niveau's van granulariteit waarbij beslissingen genomen worden op basis van beschikbaar bewijsmateriaal en (iv) het aantonen van de ruimere toepasbaarheid van de voorgestelde technieken. | |