Can you hear cancer? A statistical investigation into throat cancer detection using voice recordings
(2025) In Master's Thesis in Mathematical Sciences FMSM01 20251Mathematical Statistics
- Abstract
- This thesis explores whether throat cancer can be detected from voice recordings using statistical methods in the context of mobile health applications. It focuses on two main questions: Can throat cancer be detected from voice recordings? and Which data features and models perform best in this task? To investigate these questions, acoustic features were extracted from patient recordings and analysed using various classification and outlier detection approaches. An outlier-based method proved to be the most promising, achieving a highest classification accuracy of 62.2%. This rather low scoring however indicates that the provided data pose a significant challenge in finding an effective model. Given the limited dataset, few-shot learning... (More)
- This thesis explores whether throat cancer can be detected from voice recordings using statistical methods in the context of mobile health applications. It focuses on two main questions: Can throat cancer be detected from voice recordings? and Which data features and models perform best in this task? To investigate these questions, acoustic features were extracted from patient recordings and analysed using various classification and outlier detection approaches. An outlier-based method proved to be the most promising, achieving a highest classification accuracy of 62.2%. This rather low scoring however indicates that the provided data pose a significant challenge in finding an effective model. Given the limited dataset, few-shot learning is suggested as a direction for future research. The results reflect both the difficulties and the potential of using mobile health solutions for accessible and non-invasive throat cancer detection. (Less)
- Popular Abstract (Swedish)
- Halscancer är en livsförändrande diagnos som innefattar omständliga och obehagliga undersökningar. Då cancern påverkar stämband och form på strupen uppstår frågan: Kan man höra cancer? Detta arbete undersöker hur denna röstförändring kan användas för att tidigt diagnostisera cancer genom att analysera rösten genom ljudbehandling och statistiska modeller för klassificering.
För att undersöka huruvida cancer är identifierbart så används ett dataset bestående av mobilinspelade röstinspelningar. Datan innefattar ett antal patienter som har haft halscancer tidigare och som efter sin operation börjat göra röstinspelningar över tid. Vissa av dessa patienter får återfall av halscancer under inspelningstid och lyckas då fånga sin röst med cancer... (More) - Halscancer är en livsförändrande diagnos som innefattar omständliga och obehagliga undersökningar. Då cancern påverkar stämband och form på strupen uppstår frågan: Kan man höra cancer? Detta arbete undersöker hur denna röstförändring kan användas för att tidigt diagnostisera cancer genom att analysera rösten genom ljudbehandling och statistiska modeller för klassificering.
För att undersöka huruvida cancer är identifierbart så används ett dataset bestående av mobilinspelade röstinspelningar. Datan innefattar ett antal patienter som har haft halscancer tidigare och som efter sin operation börjat göra röstinspelningar över tid. Vissa av dessa patienter får återfall av halscancer under inspelningstid och lyckas då fånga sin röst med cancer närvarande. Det är dessa patienter som är av störst intresse.
Rösterna kan brytas ner i olika egenskaper, så kallade features, som fångar de akustiska egenskaperna i inspelningarna. Dessa innefattar alltifrån skakigheten eller grundtonerna i rösten till djupare frekvensanalys genom s.k. Fourier Transformer.
Två huvudsakliga metoder undersöks för att analysera dessa features. Antingen att använda de fåtal inspelningar vi har med cancer närvarande för att försöka lära en modell vad som specifikt identifierar cancer, eller att undersöka om man kan hitta ett normalfall av patienternas röster, som cancern får rösten att avvika ifrån. Det visar sig att den första metoden inte funkar alls medan den andra metoden visar lovande resultat.
Möjligheten att identifiera cancer hemifrån med inspelningar på sin mobil hade inneburit en stor ökad livskvalitet samt lättillgänglig och billig diagnostisering för halscancerpatienter, något som motiverar vidare undersökningar inom området. (Less)
Please use this url to cite or link to this publication:
http://lup.lub.lu.se/student-papers/record/9188152
- author
- Moström, Gustav LU
- supervisor
- organization
- course
- FMSM01 20251
- year
- 2025
- type
- H2 - Master's Degree (Two Years)
- subject
- publication/series
- Master's Thesis in Mathematical Sciences
- report number
- LUTFMS-3514-2025
- ISSN
- 1404-6342
- other publication id
- 2025:E19
- language
- English
- id
- 9188152
- date added to LUP
- 2025-05-08 10:26:27
- date last changed
- 2025-05-08 10:26:27
@misc{9188152, abstract = {{This thesis explores whether throat cancer can be detected from voice recordings using statistical methods in the context of mobile health applications. It focuses on two main questions: Can throat cancer be detected from voice recordings? and Which data features and models perform best in this task? To investigate these questions, acoustic features were extracted from patient recordings and analysed using various classification and outlier detection approaches. An outlier-based method proved to be the most promising, achieving a highest classification accuracy of 62.2%. This rather low scoring however indicates that the provided data pose a significant challenge in finding an effective model. Given the limited dataset, few-shot learning is suggested as a direction for future research. The results reflect both the difficulties and the potential of using mobile health solutions for accessible and non-invasive throat cancer detection.}}, author = {{Moström, Gustav}}, issn = {{1404-6342}}, language = {{eng}}, note = {{Student Paper}}, series = {{Master's Thesis in Mathematical Sciences}}, title = {{Can you hear cancer? A statistical investigation into throat cancer detection using voice recordings}}, year = {{2025}}, }