Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Machine Learning Algorithm for Classification of Breast Ultrasound Images

Karlsson, Jennie LU and Ramkull, Jennifer LU (2021) In Master’s Theses in Mathematical Sciences FMAM05 20211
Mathematics (Faculty of Engineering)
Abstract
Breast cancer is the most common type of cancer worldwide and the incidence is increasing. Women in low- and middle-income countries have a high mortality to incidence ratio mainly due to a lack of resources and organized health-care. A cheap and reliable breast diagnostic tool could enable an earlier diagnosis for low-resource countries and contribute to a reduction in breast cancer mortality. We suggest that a point-of-care ultrasound device combined with machine learning (ML) could be a viable solution for accessible breast diagnostics.

The aim of the thesis was to develop an ML algorithm by using three different convolutional neural networks (CNN) approaches with the goal of classifying breast ultrasound images as malignant or... (More)
Breast cancer is the most common type of cancer worldwide and the incidence is increasing. Women in low- and middle-income countries have a high mortality to incidence ratio mainly due to a lack of resources and organized health-care. A cheap and reliable breast diagnostic tool could enable an earlier diagnosis for low-resource countries and contribute to a reduction in breast cancer mortality. We suggest that a point-of-care ultrasound device combined with machine learning (ML) could be a viable solution for accessible breast diagnostics.

The aim of the thesis was to develop an ML algorithm by using three different convolutional neural networks (CNN) approaches with the goal of classifying breast ultrasound images as malignant or benign: (a) A simple CNN, (b) transfer learning using the pre-trained convolutional bases InceptionV3, ResNet50V2, VGG19 and Xception and (c) eleven networks based on combinations of the four transfer networks in (b) so-called deep feature networks.

The data consisted of two breast ultrasound image data sets: (1) An Egyptian data set collected by Cairo University at Baheya Hospital consisting of 487 benign images and 210 malignant images. This data set was divided into 80% training, 10% validation and 10% test. (2) A Swedish data set collected at Unilabs Mammography Unit at Skåne University Hospital consisting of 13 benign images and 264 malignant images. This data set was only used to evaluate the models.

All networks were evaluated using AUC, sensitivity, specificity and weighted accuracy. For the networks obtained from transfer learning Gradient-weighted Class Activation Mapping (Grad-CAM) was performed to generate heatmaps indicating which part of the image contributing to the decision of the network.

The best result was achieved by the deep feature combination of InceptionV3, Xception and VGG19 with an AUC of 0.93 and sensitivity of 95.65%. The results show that the deep feature combinations have the best performance. Possible future improvements include expanding the data set by collecting more images. (Less)
Popular Abstract (Swedish)
Bröstcancer är den vanligaste cancertypen hos kvinnor globalt sett. I låg- och medelinkomstländer är tillgången till bröstcancerdiagnostik och behandling begränsad, vilket leder till att förhållandevis fler kvinnor dör av sin cancer jämfört med till exempel Sverige. Ett billigt och lättanvänt bröstdiagnostiskt verktyg skulle kunna bidra till en minskad dödlighet i länder med begränsade resurser. Fickultraljud med granskningsstöd av artificiell intelligens (AI) kan vara ett sådant verktyg. I detta arbete har vi utvecklat AI för att analysera bröstultraljudsbilder.

Artificiella neurala nätverk är en gren inom AI som bland annat används för bildigenkänning. Givet en samling träningsbilder med tillhörande klassindelning kan nätverk lära sig... (More)
Bröstcancer är den vanligaste cancertypen hos kvinnor globalt sett. I låg- och medelinkomstländer är tillgången till bröstcancerdiagnostik och behandling begränsad, vilket leder till att förhållandevis fler kvinnor dör av sin cancer jämfört med till exempel Sverige. Ett billigt och lättanvänt bröstdiagnostiskt verktyg skulle kunna bidra till en minskad dödlighet i länder med begränsade resurser. Fickultraljud med granskningsstöd av artificiell intelligens (AI) kan vara ett sådant verktyg. I detta arbete har vi utvecklat AI för att analysera bröstultraljudsbilder.

Artificiella neurala nätverk är en gren inom AI som bland annat används för bildigenkänning. Givet en samling träningsbilder med tillhörande klassindelning kan nätverk lära sig skilja på till exempel hundar och katter. Bland annat Google har utvecklat avancerade neurala nätverk tränade på miljontals bilder som finns tillgängliga att användas av vem som helst. En metod som visat sig lovande inom medicinsk klassificering av till exempel tumörer är överföringsinlärning, vilket innebär att man återanvänder dessa avancerade nätverk på nya uppgifter.

I det här arbetet har överföringsinlärning använts för att se om det kan appliceras på bröstultraljudsbilder för att klassificera cancer eller icke-cancer. Totalt har fyra olika avancerade nätverk använts var för sig samt kombinerats. För att använda ett förtränat artificiellt nätverk på en ny uppgift behöver man finjustera parametrar, vilket görs genom att låta nätverket se en ny samling övningsbilder som i vårt fall är bröstultraljudsbilder.

Nätverken utvärderas genom att låta dem klassificera en samling bröstultraljudsbilder de aldrig sett tidigare. Prestandan mäts i Area Under Curve (AUC), ett mått på hur väl nätverket kan separera de två klasserna. En AUC-poäng på 1 innebär perfekt klassificering och 0,5 att modellen gissar på måfå. Inom medicin är även sensitivitet och specificitet två relevanta mått som mäter tillförlitlighet. Sensitivitet är sannolikheten att nätverket klassificerar en ultraljudsbild som cancer när det verkligen är cancer. Specificitet är sannolikheten att nätverket klassificerar en ultraljudsbild som icke-cancer när det verkligen är icke-cancer. I det här arbetet har AUC varit det viktigaste måttet, följt av sensitivitet.

Arbetets bästa nätverk bestod av en kombination av tre avancerade förtränade nätverk. AUC uppmättes till 0.93 och sensitivitet och specificitet uppmättes till 96% respektive 83%. Resultatet innebär att 96% av alla ultraljudsbilder med cancer upptäcks samt 83% av alla ultraljudsbilder utan cancer blir korrekt klassificerade. Resultatet kan jämföras med läkarbedömning av ultraljudsbilder vilket uppskattas till 100% sensitivitet och 80% specificitet.

För att analysera nätverk noggrannare kan man generera så kallade värmekartor. Efter analys av samtliga värmekartor kunde vi dra slutsatsen att nätverken i de flesta fall tittar på själva tumören, vilket är väntat. I några fall såg vi även att nätverken tittar nedanför tumören. Detta kan bero på det mörka eller ljusa område under tumören som beror på tumörens massa.

Resultaten i det här arbetet verkar mycket lovande. Att använda AI som stöd vid diagnos av bröstcancer skulle kunna innebära en mer kostnadseffektiv diagnostisering av bröstcancer som också är möjlig att implementera i låg- och medelinkomstländer. (Less)
Please use this url to cite or link to this publication:
author
Karlsson, Jennie LU and Ramkull, Jennifer LU
supervisor
organization
course
FMAM05 20211
year
type
H2 - Master's Degree (Two Years)
subject
publication/series
Master’s Theses in Mathematical Sciences
report number
LUTFMA-3458-2021
ISSN
1404-6342
other publication id
2021:E60
language
English
id
9066162
date added to LUP
2021-10-25 16:39:28
date last changed
2021-10-25 16:39:28
@misc{9066162,
  abstract     = {{Breast cancer is the most common type of cancer worldwide and the incidence is increasing. Women in low- and middle-income countries have a high mortality to incidence ratio mainly due to a lack of resources and organized health-care. A cheap and reliable breast diagnostic tool could enable an earlier diagnosis for low-resource countries and contribute to a reduction in breast cancer mortality. We suggest that a point-of-care ultrasound device combined with machine learning (ML) could be a viable solution for accessible breast diagnostics.

The aim of the thesis was to develop an ML algorithm by using three different convolutional neural networks (CNN) approaches with the goal of classifying breast ultrasound images as malignant or benign: (a) A simple CNN, (b) transfer learning using the pre-trained convolutional bases InceptionV3, ResNet50V2, VGG19 and Xception and (c) eleven networks based on combinations of the four transfer networks in (b) so-called deep feature networks. 

The data consisted of two breast ultrasound image data sets: (1) An Egyptian data set collected by Cairo University at Baheya Hospital consisting of 487 benign images and 210 malignant images. This data set was divided into 80% training, 10% validation and 10% test. (2) A Swedish data set collected at Unilabs Mammography Unit at Skåne University Hospital consisting of 13 benign images and 264 malignant images. This data set was only used to evaluate the models.

All networks were evaluated using AUC, sensitivity, specificity and weighted accuracy. For the networks obtained from transfer learning Gradient-weighted Class Activation Mapping (Grad-CAM) was performed to generate heatmaps indicating which part of the image contributing to the decision of the network.

The best result was achieved by the deep feature combination of InceptionV3, Xception and VGG19 with an AUC of 0.93 and sensitivity of 95.65%. The results show that the deep feature combinations have the best performance. Possible future improvements include expanding the data set by collecting more images.}},
  author       = {{Karlsson, Jennie and Ramkull, Jennifer}},
  issn         = {{1404-6342}},
  language     = {{eng}},
  note         = {{Student Paper}},
  series       = {{Master’s Theses in Mathematical Sciences}},
  title        = {{Machine Learning Algorithm for Classification of Breast Ultrasound Images}},
  year         = {{2021}},
}