Preprocessing en Inverse Halftoning van Foto's uit Historische Kranten ter Verbetering van Metadata Extractie

Student:Florence Delporte
Richting:Master of Science in de industriƫle wetenschappen: informatica
Abstract:Historische kranten worden gedigitaliseerd voor archiverings- en wetenschappelijke doeleinden. Deze documenten zijn echter soms in vrij slechte staat, wat zich vertaalt in ruizige scans met artefacten. In deze thesis wordt een methode voorgesteld voor het preprocessen van de tekstkolommen om Optical Character Recognition te verbeteren. Verder worden vijf restauratietechnieken vergeleken in termen van prestatie en nauwkeurigheid. Dit wordt uitgevoerd in de context van het verbeteren van de beeldkwaliteit van vintage foto's gevonden in kranten van 1938. De methoden worden beoordeeld door een classificatiemodel dat de vintage foto's in vijf verschillende klassen indeelt, en dit voor en na het toepassen van de technieken.
Abstract (Eng):Historical newspapers are digitized for archival and scientific purposes. However, these documents are sometimes in quite bad shape, which translates to noisy scans with artifacts. A method is proposed in this thesis for preprocessing the text columns to improve Optical Character Recognition. Furthermore, five restoration techniques are compared in terms of performance and accuracy. This is conducted in the context of enhancing the image quality of vintage photographs found in newspapers from around 1938. The methods are evaluated using a classification model that classifies the vintage images in five different classes, and this before and after processing.