Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Noise Suppression in Audio Classification

Leonardsson, Sofia LU and Bergkvist, Victor LU (2025) In Master's Theses in Mathematical Sciences FMSM01 20251
Mathematical Statistics
Abstract
It is often impossible to capture the sound one wants without capturing noise. Consequently, research has been done on noise filtering in audio signals. Currently deep learning algorithms are used for noise filtering.

This thesis investigated the effects of noise and denoising on sound classification. The thesis used two standard datasets for clean sound and noise. FSD50K was chosen as clean sound dataset, and the noise came from CochlScene soundscapes Street, Bus, Subway, Subway Station. Clean sound and noise were mixed to a wanted level of SNR. Two recognized deep learning filters were trained, U-Net and Attention U-Net, to denoise mixed sound. They were tested against a conventional filter, spectral gating. The chosen classifier was... (More)
It is often impossible to capture the sound one wants without capturing noise. Consequently, research has been done on noise filtering in audio signals. Currently deep learning algorithms are used for noise filtering.

This thesis investigated the effects of noise and denoising on sound classification. The thesis used two standard datasets for clean sound and noise. FSD50K was chosen as clean sound dataset, and the noise came from CochlScene soundscapes Street, Bus, Subway, Subway Station. Clean sound and noise were mixed to a wanted level of SNR. Two recognized deep learning filters were trained, U-Net and Attention U-Net, to denoise mixed sound. They were tested against a conventional filter, spectral gating. The chosen classifier was Efficient-NetB0. Several classifiers were trained on the clean, noisy and denoised sound, with varying noise type, noise levels and filter types.

The results show that classifiers trained on the denoised sound barely receives higher mAP (mean average precision) score compared to classifiers trained with noise. The results also show that the deep learning denoisers were better than spectral gating. The results show that classifiers trained on clean sound get a higher classification score on the denoised sound, than the noisy sound. However, the classification score on the denoised sound was far from the classification score of the clean sound. This suggested that the classifier did not consider the denoised sound to be equivalent to clean. (Less)
Popular Abstract (Swedish)
Rapporten undersöker hur brusreducering påverkar ljudklassificering. Olika aspekter undersöks; informationsbevarande, hur bra brusreduceringen blir, samt brusnivåers och antalet klassers inverkan.

Ljudklassificering är när en dator analyserar ljud och identifierar vilka klasser ljudet tillhör. För att skapa klassificering med maskininlärning, tränas ett nätverk att till bästa förmåga klassificera ljudet. Nätverket får bildrepresentationer av ljud och det belönas när det klassificerar rätt, annars straffas det.

Ofta tränas klassificerare för att känna igen olika variationer av ljud, trots det kan den önskade ljudsignalen dränkas av överröstande oönskat ljud. Det oönskade ljudet kallas för brus och det försämrar... (More)
Rapporten undersöker hur brusreducering påverkar ljudklassificering. Olika aspekter undersöks; informationsbevarande, hur bra brusreduceringen blir, samt brusnivåers och antalet klassers inverkan.

Ljudklassificering är när en dator analyserar ljud och identifierar vilka klasser ljudet tillhör. För att skapa klassificering med maskininlärning, tränas ett nätverk att till bästa förmåga klassificera ljudet. Nätverket får bildrepresentationer av ljud och det belönas när det klassificerar rätt, annars straffas det.

Ofta tränas klassificerare för att känna igen olika variationer av ljud, trots det kan den önskade ljudsignalen dränkas av överröstande oönskat ljud. Det oönskade ljudet kallas för brus och det försämrar klassificeringsresultat.

Maskininlärning kan också användas till brusreducering. Ett nytt nätverk får en bildrepresentation av ljud med brus och tränas att återskapa samma bild, utan brus. Hypotetiskt kan ett nätverk tränas för att filtrera bort brus som förekommer där klassificeraren används. Den kan användas som ett skräddarsytt försteg, för att förbättra en befintlig klassificerare.

Olika brusreducerandemetoder tränades med djupinlärning. De jämfördes med en vanlig konventionell metod. Flera klassificerare tränades för att klassificera; rent ljud, ljud med brus och brusreducerat ljud.

När klassificerarnas resultat jämförs, har både ljud med brus och brusreducerat ljud, markant sämre klassificeringsresultat än klassificerare som är tränade på rent ljud. Men vi ser att brusreducering ökar informationen jämfört med ljud med brus. Dock, när brus tas bort försvinner också information som försämrat klassificerarnas resultat.

En klassificerare som tränats på rent ljud användes för att klassificera; rent ljud, ljud med brus och brusreducerat ljud. Djupinlärningsmetoderna ökade klassificeringsresultatet jämfört mot både konventionell reducering och ljud med brus. Alla resultat var lägre än för rent ljud, och det klassificeraren ser inte något av de andra ljuden likvärdigt med det rena.

Det undersöktes hur brusnivån påverkar brusreducering och klassificering. Brusreducering och klassificering är tränade på specifikt brus och brusnivå. En brusreduceringsmetod och en klassificerare, båda tränade på ett specifikt brus och brusnivå, fick ljud med brus som var pålagt med andra brusnivåer. Klassificeringsresultatet ökar om bruset är mindre än vad det är tränat på, och antyder på en robust metod.

En klassificerare tränades på ett mindre antal klasser, men med samma datamängd som de övriga. De individuella klasserna visar inte på högre precision jämfört med när klassificeraren tränats på ett högre antal klasser.

Arbetets resultat kan användas för att fatta mer informerade beslut kring användningen av brusreducerad ljudklassificering specifikt och ljudklassificering i allmänhet. De modeller som har skapats kan dock inte användas rakt av då det är alldeles för specifika för allmän användning. (Less)
Please use this url to cite or link to this publication:
author
Leonardsson, Sofia LU and Bergkvist, Victor LU
supervisor
organization
course
FMSM01 20251
year
type
H2 - Master's Degree (Two Years)
subject
keywords
Denoising, Audio classification, Noise suppression, Deep learning, U-Net, Attention U-Net, EfficientNet, Audio
publication/series
Master's Theses in Mathematical Sciences
report number
LUTFMS-3529-2025
ISSN
1404-6342
other publication id
2025:E73
language
English
id
9200623
date added to LUP
2025-06-18 13:06:41
date last changed
2025-06-26 14:27:31
@misc{9200623,
  abstract     = {{It is often impossible to capture the sound one wants without capturing noise. Consequently, research has been done on noise filtering in audio signals. Currently deep learning algorithms are used for noise filtering.

This thesis investigated the effects of noise and denoising on sound classification. The thesis used two standard datasets for clean sound and noise. FSD50K was chosen as clean sound dataset, and the noise came from CochlScene soundscapes Street, Bus, Subway, Subway Station. Clean sound and noise were mixed to a wanted level of SNR. Two recognized deep learning filters were trained, U-Net and Attention U-Net, to denoise mixed sound. They were tested against a conventional filter, spectral gating. The chosen classifier was Efficient-NetB0. Several classifiers were trained on the clean, noisy and denoised sound, with varying noise type, noise levels and filter types.

The results show that classifiers trained on the denoised sound barely receives higher mAP (mean average precision) score compared to classifiers trained with noise. The results also show that the deep learning denoisers were better than spectral gating. The results show that classifiers trained on clean sound get a higher classification score on the denoised sound, than the noisy sound. However, the classification score on the denoised sound was far from the classification score of the clean sound. This suggested that the classifier did not consider the denoised sound to be equivalent to clean.}},
  author       = {{Leonardsson, Sofia and Bergkvist, Victor}},
  issn         = {{1404-6342}},
  language     = {{eng}},
  note         = {{Student Paper}},
  series       = {{Master's Theses in Mathematical Sciences}},
  title        = {{Noise Suppression in Audio Classification}},
  year         = {{2025}},
}