Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Can you hear cancer? A statistical investigation into throat cancer detection using voice recordings

Moström, Gustav LU (2025) In Master's Thesis in Mathematical Sciences FMSM01 20251
Mathematical Statistics
Abstract
This thesis explores whether throat cancer can be detected from voice recordings using statistical methods in the context of mobile health applications. It focuses on two main questions: Can throat cancer be detected from voice recordings? and Which data features and models perform best in this task? To investigate these questions, acoustic features were extracted from patient recordings and analysed using various classification and outlier detection approaches. An outlier-based method proved to be the most promising, achieving a highest classification accuracy of 62.2%. This rather low scoring however indicates that the provided data pose a significant challenge in finding an effective model. Given the limited dataset, few-shot learning... (More)
This thesis explores whether throat cancer can be detected from voice recordings using statistical methods in the context of mobile health applications. It focuses on two main questions: Can throat cancer be detected from voice recordings? and Which data features and models perform best in this task? To investigate these questions, acoustic features were extracted from patient recordings and analysed using various classification and outlier detection approaches. An outlier-based method proved to be the most promising, achieving a highest classification accuracy of 62.2%. This rather low scoring however indicates that the provided data pose a significant challenge in finding an effective model. Given the limited dataset, few-shot learning is suggested as a direction for future research. The results reflect both the difficulties and the potential of using mobile health solutions for accessible and non-invasive throat cancer detection. (Less)
Popular Abstract (Swedish)
Halscancer är en livsförändrande diagnos som innefattar omständliga och obehagliga undersökningar. Då cancern påverkar stämband och form på strupen uppstår frågan: Kan man höra cancer? Detta arbete undersöker hur denna röstförändring kan användas för att tidigt diagnostisera cancer genom att analysera rösten genom ljudbehandling och statistiska modeller för klassificering.

För att undersöka huruvida cancer är identifierbart så används ett dataset bestående av mobilinspelade röstinspelningar. Datan innefattar ett antal patienter som har haft halscancer tidigare och som efter sin operation börjat göra röstinspelningar över tid. Vissa av dessa patienter får återfall av halscancer under inspelningstid och lyckas då fånga sin röst med cancer... (More)
Halscancer är en livsförändrande diagnos som innefattar omständliga och obehagliga undersökningar. Då cancern påverkar stämband och form på strupen uppstår frågan: Kan man höra cancer? Detta arbete undersöker hur denna röstförändring kan användas för att tidigt diagnostisera cancer genom att analysera rösten genom ljudbehandling och statistiska modeller för klassificering.

För att undersöka huruvida cancer är identifierbart så används ett dataset bestående av mobilinspelade röstinspelningar. Datan innefattar ett antal patienter som har haft halscancer tidigare och som efter sin operation börjat göra röstinspelningar över tid. Vissa av dessa patienter får återfall av halscancer under inspelningstid och lyckas då fånga sin röst med cancer närvarande. Det är dessa patienter som är av störst intresse.

Rösterna kan brytas ner i olika egenskaper, så kallade features, som fångar de akustiska egenskaperna i inspelningarna. Dessa innefattar alltifrån skakigheten eller grundtonerna i rösten till djupare frekvensanalys genom s.k. Fourier Transformer.

Två huvudsakliga metoder undersöks för att analysera dessa features. Antingen att använda de fåtal inspelningar vi har med cancer närvarande för att försöka lära en modell vad som specifikt identifierar cancer, eller att undersöka om man kan hitta ett normalfall av patienternas röster, som cancern får rösten att avvika ifrån. Det visar sig att den första metoden inte funkar alls medan den andra metoden visar lovande resultat.

Möjligheten att identifiera cancer hemifrån med inspelningar på sin mobil hade inneburit en stor ökad livskvalitet samt lättillgänglig och billig diagnostisering för halscancerpatienter, något som motiverar vidare undersökningar inom området. (Less)
Please use this url to cite or link to this publication:
author
Moström, Gustav LU
supervisor
organization
course
FMSM01 20251
year
type
H2 - Master's Degree (Two Years)
subject
publication/series
Master's Thesis in Mathematical Sciences
report number
LUTFMS-3514-2025
ISSN
1404-6342
other publication id
2025:E19
language
English
id
9188152
date added to LUP
2025-05-08 10:26:27
date last changed
2025-05-08 10:26:27
@misc{9188152,
  abstract     = {{This thesis explores whether throat cancer can be detected from voice recordings using statistical methods in the context of mobile health applications. It focuses on two main questions: Can throat cancer be detected from voice recordings? and Which data features and models perform best in this task? To investigate these questions, acoustic features were extracted from patient recordings and analysed using various classification and outlier detection approaches. An outlier-based method proved to be the most promising, achieving a highest classification accuracy of 62.2%. This rather low scoring however indicates that the provided data pose a significant challenge in finding an effective model. Given the limited dataset, few-shot learning is suggested as a direction for future research. The results reflect both the difficulties and the potential of using mobile health solutions for accessible and non-invasive throat cancer detection.}},
  author       = {{Moström, Gustav}},
  issn         = {{1404-6342}},
  language     = {{eng}},
  note         = {{Student Paper}},
  series       = {{Master's Thesis in Mathematical Sciences}},
  title        = {{Can you hear cancer? A statistical investigation into throat cancer detection using voice recordings}},
  year         = {{2025}},
}