We worden dagelijks omringd door verschillende akoestische omgevingen. Akoestische omgevingen bevatten specifieke en diverse geluidsgebeurtenissen, zoals vogelgezang, hondengeblaf en claxongebulder, maar ook bredere akoestische scènes, zoals parken, pleinen en straten. Verschillende akoestische scènes en geluidsgebeurtenissen in het leven roepen van nature verschillende emoties op bij mensen. Zo kan het zachte getjilp van vogels in een park mensen een ontspannen en gelukkig gevoel geven, terwijl bouwgeluiden of het geluid van kettingzagen 's ochtends vroeg mensen waarschijnlijk zullen irriteren. Onder de titel "Advancing machine listening: understanding scenes acoustic and events and the emotions they evoke." richt deze dissertatie zich niet alleen op de scènes en gebeurtenissen in de akoestische omgeving, maar ook op de door mensen waargenomen affectieve reacties die geluid oproept. Deze dissertatie onderzoekt hoe akoestische scènes en audiogebeurtenissen in akoestische omgevingen beter kunnen worden geïdentificeerd, terwijl geluid-emotie verder gezamenlijk wordt gemodelleerd, de soundscape caption task wordt voorgesteld met een driedimensionaal beeld van akoestische scènes, audiogebeurtenissen en affectieve kwaliteiten, en een soundscape describer wordt geconstrueerd die automatisch soundscapes analyseert en beschrijft. Dit onderzoek zal machinaal luisteren naar een hoger niveau leiden en naar een intelligenter, empathischer machineluister ecosysteem. | |