Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Microarray Quality Control using Artificial Neural Networks

Andersson, Emil LU (2019) FYTM03 20191
Department of Astronomy and Theoretical Physics - Undergoing reorganization
Computational Biology and Biological Physics - Undergoing reorganization
Abstract
When using antibody microarrays to diagnose diseases, the process of quality control of the microarray data is an important step. Currently, a part of this process is performed manually by visual inspection. In this master project, we aim to automate the quality control in order to make it reproducible, as well as to find out which properties of the data that have the most to do with its quality. The tools we use for automation are artificial neural networks. From the microarray data, we construct variables based on the spot and background signal, as well as their spatial variations. We find that it is possible to reproduce the visual quality assessment with small networks using the mean and standard deviation of the microarrays'... (More)
When using antibody microarrays to diagnose diseases, the process of quality control of the microarray data is an important step. Currently, a part of this process is performed manually by visual inspection. In this master project, we aim to automate the quality control in order to make it reproducible, as well as to find out which properties of the data that have the most to do with its quality. The tools we use for automation are artificial neural networks. From the microarray data, we construct variables based on the spot and background signal, as well as their spatial variations. We find that it is possible to reproduce the visual quality assessment with small networks using the mean and standard deviation of the microarrays' background as inputs. Finally, we introduce a new, calculable measure of quality and compare it to the visual quality control classification. (Less)
Popular Abstract (Swedish)
Det finns många komplexa sjukdomar som i dagsläget är mycket svåra att diagnostisera. Det är inte ovanligt att när dessa sjukdomar slutligen diagnostiseras så är det för sent för att kunna göra någonting åt det. Men med en ny teknik kan det bli möjligt att ställa diagnoser i tid. Tekniken grundar sig i att, från ett vanligt blodprov, identifiera vilka proteiner som finns i blodet varpå sedan låta komplexa datoralgoritmer analysera proteindatan och ställa en diagnos. Dock, för att datorn ska kunna ställa en korrekt diagnos är det viktigt att proteindatan är av hög kvalitet, vilket inte alltid är fallet. I dagsläget utförs kvalitetskontrollen genom att granska datan visuellt; det här masterprojektet går ut på undersöka ifall det går att... (More)
Det finns många komplexa sjukdomar som i dagsläget är mycket svåra att diagnostisera. Det är inte ovanligt att när dessa sjukdomar slutligen diagnostiseras så är det för sent för att kunna göra någonting åt det. Men med en ny teknik kan det bli möjligt att ställa diagnoser i tid. Tekniken grundar sig i att, från ett vanligt blodprov, identifiera vilka proteiner som finns i blodet varpå sedan låta komplexa datoralgoritmer analysera proteindatan och ställa en diagnos. Dock, för att datorn ska kunna ställa en korrekt diagnos är det viktigt att proteindatan är av hög kvalitet, vilket inte alltid är fallet. I dagsläget utförs kvalitetskontrollen genom att granska datan visuellt; det här masterprojektet går ut på undersöka ifall det går att automatisera, och eventuellt förbättra, kvalitetskontrollen.

För att automatisera kvalitetskontrollen provar vi att använda så kallade artificiella neuronnätverk (ANN): en speciell inriktning inom artificiell intelligens (AI) som är löst baserat på---men under inga omständigheter ett försök att simulera---den mänskliga hjärnan. ANN låter kanske avancerat, men det är egentligen bara relativt simpla datoralgoritmer som används för att lösa problem på ett lite annorlunda sätt. Om vi med konventionell programmering försöker lösa ett klassificeringsproblem, exempelvis att avgöra om proteindata är av hög eller låg kvalitet, måste de olika klasserna definieras väl i förhand. Därmed fungerar det inte alls om definitionen av klasserna inte är kända. ANN fungerar däremot på ett annorlunda sätt: de fungerar ungefär på samma sätt som små barn. Barn lär sig inte veta ifall frukten de pekar på är ett äpple eller en banan genom att deras föräldrar beskriver de olika frukternas definition för dem. De lär sig istället genom att vid en mängd upprepade tillfällen få det berättat för sig om frukten de pekar på är ett äpple eller en banan, så får de själva lära sig vad som är skillnaden. Samma princip gäller för ANN. Istället för att programmera in hur vi definierar bra respektive dålig kvalitet på proteindata, så berättar vi för dem om proteindatan som de bearbetar för tillfället är av hög eller låg kvalitet, så får de själva lära sig vad det innebär.

En automatiserad kvalitetskontroll har två stora fördelar jämfört med en manuell sådan. För det första blir processen reproducerbar då den mänskliga faktorn tas bort. För det andra får vetenskapspersonerna som för tillfället utför kvalitetskontrollen mer tid att lägga på mer avancerat arbete som en dator inte kan klara av. Dessutom skulle en förbättrat kvalitetskontroll öka datorns precision när den ställer diagnoser. (Less)
Please use this url to cite or link to this publication:
author
Andersson, Emil LU
supervisor
organization
course
FYTM03 20191
year
type
H2 - Master's Degree (Two Years)
subject
keywords
Artificial Neural Network, ANN, Microarray, Quality Control, Automated Quality Control
language
English
id
8988646
date added to LUP
2019-07-01 11:21:12
date last changed
2019-07-01 11:21:12
@misc{8988646,
  abstract     = {{When using antibody microarrays to diagnose diseases, the process of quality control of the microarray data is an important step. Currently, a part of this process is performed manually by visual inspection. In this master project, we aim to automate the quality control in order to make it reproducible, as well as to find out which properties of the data that have the most to do with its quality. The tools we use for automation are artificial neural networks. From the microarray data, we construct variables based on the spot and background signal, as well as their spatial variations. We find that it is possible to reproduce the visual quality assessment with small networks using the mean and standard deviation of the microarrays' background as inputs. Finally, we introduce a new, calculable measure of quality and compare it to the visual quality control classification.}},
  author       = {{Andersson, Emil}},
  language     = {{eng}},
  note         = {{Student Paper}},
  title        = {{Microarray Quality Control using Artificial Neural Networks}},
  year         = {{2019}},
}