Student: | Yentl Pauwels |
---|---|
Richting: | Master of Science in de industriƫle wetenschappen: informatica |
Abstract: | ADAM: A Novel Dataset for Malicious PE DetectionDeze thesis beschrijft ADAM (Augmented Dataset on the Analysis of Malware), een nieuwe gelabelde benchmark dataset voor het trainen van ML modellen voor het detecteren van kwaadaardige Windows portable executables. De dataset bevat 32.696 geëxtraheerde samples, met een 50/50 verdeling van kwaadaardige vs. goedaardige samples, afkomstig uit een verzameling van ongeveer 110.000 recente uitvoerbare bestanden. Deze paper schetst het werk dat nodig is om feature-extractietools in het huidige framework onder te brengen en biedt een uitgebreide analyse van de verkregen dataset. |
Abstract (Eng): | ADAM: A Novel Dataset for Malicious PE DetectionThis paper describes ADAM (Augmented Dataset on the Analysis of Malware), a novel labeled benchmark dataset for training ML models to detect malicious Windows portable executables. The dataset contains 32,696 extracted samples, with a 50/50 distribution of malicious vs. benign samples, taken from a collection of roughly 110,000 recent executables. This thesis outlines the work needed to accommodate feature extraction tools in the current framework and provides an extensive analysis on the obtained dataset. |