Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Multi-omics integration of spatially resolved transcriptome and proteome data in mantle cell lymphoma

Nilsson, Daniel (2023) BINP50 20222
Degree Projects in Bioinformatics
Abstract
The rapid development of high-throughput technologies has made it possible to generate large-scale data such as genomics, transcriptomics, proteomics, and, more recently, spatial omics. A common approach is to analyse each data source individually (single-omics analysis). However, combining these sources of information (multi-omics integration) can create a complete picture of the biological mechanism. Thus, novel insights can be drawn for diseases, such as using multi-omics approaches wherein information from various biological sources can be investigated together. Therefore, by using both MOFA as unsupervised and DIABLO as supervised multi-omics approaches for integrating spatially resolved transcriptomics, proteomics, and spatial omics... (More)
The rapid development of high-throughput technologies has made it possible to generate large-scale data such as genomics, transcriptomics, proteomics, and, more recently, spatial omics. A common approach is to analyse each data source individually (single-omics analysis). However, combining these sources of information (multi-omics integration) can create a complete picture of the biological mechanism. Thus, novel insights can be drawn for diseases, such as using multi-omics approaches wherein information from various biological sources can be investigated together. Therefore, by using both MOFA as unsupervised and DIABLO as supervised multi-omics approaches for integrating spatially resolved transcriptomics, proteomics, and spatial omics data, we aim to understand the biological heterogeneity of a population-based cohort of mantle cell lymphoma (MCL). Data integration was performed for spatially resolved omics data generated from GeoMx digital spatial profiler against immunohistochemistry (IHC) measurement of PD-L1, PD-1, and CD163 as well as infiltration levels of active CD4 (TH,57-) and total CD4 (TH) T-cell as defined by image analysis using Cellpose and QuPath. MOFA latent factors captured variation across the omics layers associated with the PD-L1, PD-1 and CD163 expression and, TH,57- and TH populations. The latent factors also had a significant association with survival. Supervised modelling showed only TH,57- and TH populations having multiple datasets associated with transcriptomics and proteomics. DIABLO was able to identify transcriptome and proteome features not seen in a single-omic approach revealing the interplay between omics layers. Thus, by linking the different sources of omics data, more light can be shed on the complexity of the tumour immune microenvironment, which will aid in developing novel therapeutic strategies. (Less)
Popular Abstract (Swedish)
Integrerad analys av biologiska data från cancerceller och närliggande immunceller förbättrar möjligheten att utveckla nya behandlingar

Teknikutveckling har nyligen möjliggjort att detaljerad data från enskilda celler i en tumör kan samlas in – detta kallas spatial/rumslig omik. Metoden gör det möjligt att kartlägga till exempel uttrycks nivåer av protein eller gener från specifika celler i en vävnad. Detta kan användas för att förstå hur gener regleras beroende på cellers plats i en vävnad så som cancer, vilket kan leda till en bättre förståelse hur cancer utvecklas och möjliggöra utvecklingen av nya behandlingar. När man använder sig av flera källor av biologiskt material (ex. genuttryck eller proteinuttryck) så kan det vara... (More)
Integrerad analys av biologiska data från cancerceller och närliggande immunceller förbättrar möjligheten att utveckla nya behandlingar

Teknikutveckling har nyligen möjliggjort att detaljerad data från enskilda celler i en tumör kan samlas in – detta kallas spatial/rumslig omik. Metoden gör det möjligt att kartlägga till exempel uttrycks nivåer av protein eller gener från specifika celler i en vävnad. Detta kan användas för att förstå hur gener regleras beroende på cellers plats i en vävnad så som cancer, vilket kan leda till en bättre förståelse hur cancer utvecklas och möjliggöra utvecklingen av nya behandlingar. När man använder sig av flera källor av biologiskt material (ex. genuttryck eller proteinuttryck) så kan det vara fördelaktigt att kombinera dessa för att se hur de relaterar till varandra då de samverkar. I fallet med spatial omik kan integration av protein- och gen-uttrycksdata ge en mer komplett bild av mikromiljön i mänsklig vävnad. Genom att kombinera dessa två typer av data kan forskare identifiera celltyper som uttrycker specifika gener eller proteiner, och fastställa hur dessa celler interagerar med varandra inom vävnaden.

Det primära syftet för den här studien var att utforska dataintegration metoder. Insamlad protein- och gen-uttrycksdata användes för att förstå tumör och immuncells miljön i vävnaden av patienter med mantelcellslymfom vilket är en typ av malign tumörsjukdom som drabbar immunförsvarets celler. Först användes unsupervised learning, vilket är maskininlärningsalgoritm som försöker hitta mönster och strukturer i data utan någon vägledning. Därefter användes supervised learning vilket istället är en algoritm som istället tränas på en datamängd som redan har "rätt svar" för att läras att göra prediktioner baserat på linkande data. Man kan sedan få ut information om vad som algoritmerna identifierat som viktiga gener eller protein. Dessa två maskininlärningsalgoritmer användes för flera biologiska utryckta gener som visat sig vara betydande för överlevnad och mängden av T-hjälparceller vilket är en typ av immuncell som har en betydande roll att bekämpa cancer där en högre mängd celler i tumören har visats vara fördelaktig.

Resultatet visade på att de specifika uttrycken av generna och infiltrationsmängden av T-hjälparceller kunde förklaras av små variationer i protein- och gen-uttrycksdata. Vidare visade data integrering med supervised learning på viktiga kombinationer av gener och protein som inte hittades utan integration vilket visar på att protein- och gen-uttrycken från olika cell-typer till viss grad är beroende av varandra.
Dessa identifierade kombinationer av gener och protein härstammar från samma person och biologiskt system. Betydelsen på hur dessa samverkar kan ge en bättre inblick i vad de är för mekanismer som gör att vissa personer med mantelcellslymfom överlever längre än andra och förhoppningsvis ge ledtrådar till utveckling av nya behandlingsmetoder.

Masterexamensprojekt i Bioinformatik 30 hp 2023
Biologiska institutionen, Lunds universitet
Handledare: Sara Ek, Lavanya Lokhande
Institutionen för immunteknologi (Less)
Please use this url to cite or link to this publication:
author
Nilsson, Daniel
supervisor
organization
course
BINP50 20222
year
type
H2 - Master's Degree (Two Years)
subject
language
English
id
9114026
date added to LUP
2023-05-05 12:49:50
date last changed
2023-05-05 12:49:50
@misc{9114026,
  abstract     = {{The rapid development of high-throughput technologies has made it possible to generate large-scale data such as genomics, transcriptomics, proteomics, and, more recently, spatial omics. A common approach is to analyse each data source individually (single-omics analysis). However, combining these sources of information (multi-omics integration) can create a complete picture of the biological mechanism. Thus, novel insights can be drawn for diseases, such as using multi-omics approaches wherein information from various biological sources can be investigated together. Therefore, by using both MOFA as unsupervised and DIABLO as supervised multi-omics approaches for integrating spatially resolved transcriptomics, proteomics, and spatial omics data, we aim to understand the biological heterogeneity of a population-based cohort of mantle cell lymphoma (MCL). Data integration was performed for spatially resolved omics data generated from GeoMx digital spatial profiler against immunohistochemistry (IHC) measurement of PD-L1, PD-1, and CD163 as well as infiltration levels of active CD4 (TH,57-) and total CD4 (TH) T-cell as defined by image analysis using Cellpose and QuPath. MOFA latent factors captured variation across the omics layers associated with the PD-L1, PD-1 and CD163 expression and, TH,57- and TH populations. The latent factors also had a significant association with survival. Supervised modelling showed only TH,57- and TH populations having multiple datasets associated with transcriptomics and proteomics. DIABLO was able to identify transcriptome and proteome features not seen in a single-omic approach revealing the interplay between omics layers. Thus, by linking the different sources of omics data, more light can be shed on the complexity of the tumour immune microenvironment, which will aid in developing novel therapeutic strategies.}},
  author       = {{Nilsson, Daniel}},
  language     = {{eng}},
  note         = {{Student Paper}},
  title        = {{Multi-omics integration of spatially resolved transcriptome and proteome data in mantle cell lymphoma}},
  year         = {{2023}},
}