Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Autoencoder outlier detection during the Covid-19 vaccination campaign

Eriksson, Thomas LU (2022) FYTM03 20221
Computational Biology and Biological Physics - Undergoing reorganization
Department of Astronomy and Theoretical Physics - Undergoing reorganization
Abstract
Outlier detection in high-dimensional data is a complex task, useful in many fields. One major application is in healthcare, where the high-dimensional healthcare registers can be used to detect patterns related to the medical behaviour and state of the population. In this project, neural network based autoencoders were used to study the Covid-19 vaccination campaign, where it was trained on healthcare data from unvaccinated individuals. Outliers were selected by thresholding the reconstruction error from the autoencoder, both for vaccinated and unvaccinated individuals, to compare the data points. The outliers were in principle selected based on the dimensionality of their input vector, and the frequency
of representation in the training... (More)
Outlier detection in high-dimensional data is a complex task, useful in many fields. One major application is in healthcare, where the high-dimensional healthcare registers can be used to detect patterns related to the medical behaviour and state of the population. In this project, neural network based autoencoders were used to study the Covid-19 vaccination campaign, where it was trained on healthcare data from unvaccinated individuals. Outliers were selected by thresholding the reconstruction error from the autoencoder, both for vaccinated and unvaccinated individuals, to compare the data points. The outliers were in principle selected based on the dimensionality of their input vector, and the frequency
of representation in the training data set. The previously known myocarditis cases in the young male population, as a side effect of the mRNA Covid-19 vaccines, was used to model the method. The method detected various patterns, mainly vaccination patterns of the population and the vaccine effect. Outlier detection in high-dimensional healthcare registers can possibly detect patterns before statistical models, and search the data for non-linear correlations. (Less)
Popular Abstract (Swedish)
Data inom hälsovården kan användas för att hitta mönster för att exempelvis ta fram hur många som är sjuka, eller hur många som har fått ta blodprov. Det används ofta statistiska modeller för att göra undersökningar, men i detta projektet används artificiell intelligens, och mer specifikt neuronnät. Då tar vi hjälp av artificiell intelligens för att hitta mönster inom datakällor som kan vara svåra att hitta med vanliga statistiska modeller.

Inom detta projekt utforskas en metod för att leta efter mönster inom hälsovårdsdata. Specifikt försöker vi hitta avvikande värden för de som har vaccinerat sig emot Covid-19. Detta gör vi i ett försök att hitta biverkningar av vaccinet, och för att undersöka andra underliggande mönster. Sverige har... (More)
Data inom hälsovården kan användas för att hitta mönster för att exempelvis ta fram hur många som är sjuka, eller hur många som har fått ta blodprov. Det används ofta statistiska modeller för att göra undersökningar, men i detta projektet används artificiell intelligens, och mer specifikt neuronnät. Då tar vi hjälp av artificiell intelligens för att hitta mönster inom datakällor som kan vara svåra att hitta med vanliga statistiska modeller.

Inom detta projekt utforskas en metod för att leta efter mönster inom hälsovårdsdata. Specifikt försöker vi hitta avvikande värden för de som har vaccinerat sig emot Covid-19. Detta gör vi i ett försök att hitta biverkningar av vaccinet, och för att undersöka andra underliggande mönster. Sverige har väl dokumenterad hälsovård, och projektet har tillgång till Skånes hälsoregister. Därför finns det förutsättningar att i den stora datamängden göra nya upptäckter. Den stora datamängden måste hanteras på lämpligt sätt, så att den tillgängliga datorkraften räcker till.

Den artificiella intelligensen som används är ett neuronnät, och mer specifikt en autoencoder. För att se vilken data som sticker ut, får en autoencoder ta emot data och återskapa den. Hur den ska återskapa datapunkterna har den lärt sig ifrån ett valt data set. Hur väl den kan återskapa data blir ett mått på vilka mönster autoencodern har lärt sig, och vidare vilka mönster datapunkten passar in i. (Less)
Please use this url to cite or link to this publication:
author
Eriksson, Thomas LU
supervisor
organization
course
FYTM03 20221
year
type
H2 - Master's Degree (Two Years)
subject
keywords
Vaccine side effects, Covid-19, Outlier detection in high-dimensional data, Deep learning, Machine learning, AI, Autoencoder, Healthcare registers.
report number
LU-TP 22-40
language
English
id
9096359
date added to LUP
2022-08-08 10:13:09
date last changed
2022-08-08 10:13:09
@misc{9096359,
  abstract     = {{Outlier detection in high-dimensional data is a complex task, useful in many fields. One major application is in healthcare, where the high-dimensional healthcare registers can be used to detect patterns related to the medical behaviour and state of the population. In this project, neural network based autoencoders were used to study the Covid-19 vaccination campaign, where it was trained on healthcare data from unvaccinated individuals. Outliers were selected by thresholding the reconstruction error from the autoencoder, both for vaccinated and unvaccinated individuals, to compare the data points. The outliers were in principle selected based on the dimensionality of their input vector, and the frequency
of representation in the training data set. The previously known myocarditis cases in the young male population, as a side effect of the mRNA Covid-19 vaccines, was used to model the method. The method detected various patterns, mainly vaccination patterns of the population and the vaccine effect. Outlier detection in high-dimensional healthcare registers can possibly detect patterns before statistical models, and search the data for non-linear correlations.}},
  author       = {{Eriksson, Thomas}},
  language     = {{eng}},
  note         = {{Student Paper}},
  title        = {{Autoencoder outlier detection during the Covid-19 vaccination campaign}},
  year         = {{2022}},
}