Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Classification of High Risk Prostate Cancer using Deep Learning

Olofsson, Elin LU (2019) In Master's Theses in Mathematical Sciences FMAM05 20191
Mathematics (Faculty of Engineering)
Abstract
Prostate cancer is one of the most common types of cancer for men, making proper diagnostic essential. Using machine learning as a tool to help in digital pathology has become increasingly popular and helps to limit the high intra observer variability between pathologists. Due to the many cases of prostate cancer and the large differences between tumours, treatments have to be individualized for each patient. The Active Surveillance was introduced for patients with low risk prostate cancer were treatment in the form of surgery or radiation was deemed too invasive for the cancers current state. Instead the progression is supervised and when, if ever, a certain threshold is surpassed further treatment is discussed.

In this thesis it is... (More)
Prostate cancer is one of the most common types of cancer for men, making proper diagnostic essential. Using machine learning as a tool to help in digital pathology has become increasingly popular and helps to limit the high intra observer variability between pathologists. Due to the many cases of prostate cancer and the large differences between tumours, treatments have to be individualized for each patient. The Active Surveillance was introduced for patients with low risk prostate cancer were treatment in the form of surgery or radiation was deemed too invasive for the cancers current state. Instead the progression is supervised and when, if ever, a certain threshold is surpassed further treatment is discussed.

In this thesis it is investigated if a Convolutional Neutral Network (CNN) can be trained to find high risk patients before pathologists can see cancer progression and if benign tissue holds vital information about future development. A CNN was trained on two different datasets, the first containing all of the available data and the second only including the biopsies from the latest examination in a patient's timeline.

The results indicate that the problem is hard and the biggest struggle has been to limit the data without introducing new biases. The variability within each class was seemingly large in relation to the possible underlying patterns containing clues about the cancer making the accuracy low. Generalization was overall bad but it was found that when combing the results to make a patient grading, instead of grading individual biopsies, accuracies increased. Peak performance was found when only training on the last biopsies and was for the patient grading 67%. Although no outstanding results were found further research has to be done in the area of predictive prostate cancer classification in order to draw any final conclusions. (Less)
Popular Abstract (Swedish)
Prostatacancer är den näst vanligast förekommande typen av cancer för män i världen. Att ha tillgång till ordentliga och tillräckliga diagnostiseringsverktyg är därför en avgörande faktor för hur väl vården kan hantera och behandla patienterna. Idag används Gleason gradering for att bedöma hur allvarlig cancern är. Metoden introducerades på 60-talet och går ut på att granska hur välstrukturerade cellerna är och därmed definiera stadiet av tumören.

För att undvika överklassificering av cancern och därmed introduktion av invasiva och onödiga behandlingar finns det en studie som övervakar svårigheten av tumören. Patienter som bedöms ha en lågrisk cancer som växer långsamt och inte riskerar att sprida sig eller bidra med svåra symptom får... (More)
Prostatacancer är den näst vanligast förekommande typen av cancer för män i världen. Att ha tillgång till ordentliga och tillräckliga diagnostiseringsverktyg är därför en avgörande faktor för hur väl vården kan hantera och behandla patienterna. Idag används Gleason gradering for att bedöma hur allvarlig cancern är. Metoden introducerades på 60-talet och går ut på att granska hur välstrukturerade cellerna är och därmed definiera stadiet av tumören.

För att undvika överklassificering av cancern och därmed introduktion av invasiva och onödiga behandlingar finns det en studie som övervakar svårigheten av tumören. Patienter som bedöms ha en lågrisk cancer som växer långsamt och inte riskerar att sprida sig eller bidra med svåra symptom får vara med i en så kallad Active Surveillance (AS) där de får komma på upprepade besök och lämna biopsiprover. Om cancern sedan bedöms ha utvecklats för mycket och medför en risk för spridning får patienterna vidare behandling.

Skånes Universitets Sjukhus har under tio år samlat in ett dataset över patienter som medverkar i AS. Målet med arbetet var att ta reda på om det går att använda maskininlärning för att prediktivt hitta patienterna som löper större risk att utveckla värre cancer och därmed även undersöka om den friska vävnaden innehåller information kring hur cancern stagnerar.

Sedan idén att modelera den mänskliga hjärnan introducerades har metoderna och användningsområdena mångfaldigats. I takt med att datorerna förbättrats har maskininlärningen utvecklats och även blivit populär inom medicinsk analys. Speciellt applicerbart för bildanalys är ett så kallat Convolutional Neural Network (CNN) som tar hänsyn till den spatiala strukturen i bilder. Det enda som behövs för träning av nätverket är ett dataset med bilder samt deras förbestämda klass. Träningen utförs sedan genom optimering av de variabler som nätverket byggs upp utav för att den slutgiltiga klassificeringen ska ligga så nära den ursprungliga som möjligt.

Ett CNN har i detta arbete tränats på urklipp med storlek 500x500 RGB-pixlar från nålbiopsier tagna av patienter med prostatacancer. Urklippen delades först upp i två olika klasser, de som fortfarande är aktiva i studien och de som blivit exkluderade på grund av att cancern försämrats. Två olika dataset har använts för att träna och testa nätverket, först urklipp från alla tillgängliga biopsier och sedan enbart från de biopsier som togs vid varje patients senaste provtillfälle.

Modellerna som presenteras i rapporten hade stora problem med att generalisera klassificeringen och hitta relevanta drag i bilderna som skulle kunna beskriva framtida utvekling av cancervävnaden. Några problem som belyses i rapporten är svårigheten i att begränsa datasetet så att det innehåller relevant information utan att bli för partiskt samt hur tidsaspekten på bilderna ska tas hänsyn till. (Less)
Please use this url to cite or link to this publication:
author
Olofsson, Elin LU
supervisor
organization
course
FMAM05 20191
year
type
H2 - Master's Degree (Two Years)
subject
keywords
Prostate Cancer, CNN, Deep Learning, PRIAS, Active Surveillance, Digital Pathology
publication/series
Master's Theses in Mathematical Sciences
report number
LUTFMA-3382-2019
ISSN
1404-6342
other publication id
2019:E24
language
English
id
8979205
date added to LUP
2019-07-16 13:23:29
date last changed
2019-07-16 13:23:29
@misc{8979205,
  abstract     = {{Prostate cancer is one of the most common types of cancer for men, making proper diagnostic essential. Using machine learning as a tool to help in digital pathology has become increasingly popular and helps to limit the high intra observer variability between pathologists. Due to the many cases of prostate cancer and the large differences between tumours, treatments have to be individualized for each patient. The Active Surveillance was introduced for patients with low risk prostate cancer were treatment in the form of surgery or radiation was deemed too invasive for the cancers current state. Instead the progression is supervised and when, if ever, a certain threshold is surpassed further treatment is discussed. 

In this thesis it is investigated if a Convolutional Neutral Network (CNN) can be trained to find high risk patients before pathologists can see cancer progression and if benign tissue holds vital information about future development. A CNN was trained on two different datasets, the first containing all of the available data and the second only including the biopsies from the latest examination in a patient's timeline. 

The results indicate that the problem is hard and the biggest struggle has been to limit the data without introducing new biases. The variability within each class was seemingly large in relation to the possible underlying patterns containing clues about the cancer making the accuracy low. Generalization was overall bad but it was found that when combing the results to make a patient grading, instead of grading individual biopsies, accuracies increased. Peak performance was found when only training on the last biopsies and was for the patient grading 67%. Although no outstanding results were found further research has to be done in the area of predictive prostate cancer classification in order to draw any final conclusions.}},
  author       = {{Olofsson, Elin}},
  issn         = {{1404-6342}},
  language     = {{eng}},
  note         = {{Student Paper}},
  series       = {{Master's Theses in Mathematical Sciences}},
  title        = {{Classification of High Risk Prostate Cancer using Deep Learning}},
  year         = {{2019}},
}