Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Workflows for the analysis of transcriptomic data at single-cell and spatial resolutions: T cells in lymphoma

Alling, Teodor (2024) BINP50 20232
Degree Projects in Bioinformatics
Abstract
There is a need to closer characterise the molecular changes associated with progression from low to high mortality stage cutaneous T cell lymphoma. This has been challenging since there is high inter-patient heterogeneity in the genetics and transcriptomics of the malignant T cell populations. Modern technology has enabled single-cell resolution as well as spatially guided cell selection for whole-transcriptome measurements and these are promising tools for closer investigation into genes, cell types, and pathways associated with disease progression. Such technologies generate large amounts of data which require workflow considerations and choices of software depending on questions asked. In this study I analysed data from single-cell RNA... (More)
There is a need to closer characterise the molecular changes associated with progression from low to high mortality stage cutaneous T cell lymphoma. This has been challenging since there is high inter-patient heterogeneity in the genetics and transcriptomics of the malignant T cell populations. Modern technology has enabled single-cell resolution as well as spatially guided cell selection for whole-transcriptome measurements and these are promising tools for closer investigation into genes, cell types, and pathways associated with disease progression. Such technologies generate large amounts of data which require workflow considerations and choices of software depending on questions asked. In this study I analysed data from single-cell RNA sequencing and spatial transcriptomics, with the goal of providing reusable workflows applied to the investigation of cutaneous T cell lymphoma. The resulting workflows incorporate methods for quality control, normalisation and batch effect correction, differential gene expression, data clustering, cell subtype annotation, and some pathway analysis. I find that normalisation with Cyclic loess followed by application of RUV4 is a useful method for reducing batch effects in our spatial transcriptomics data. To inform further hypotheses regarding T cell differentiation in the progression of this disease, I recommend the combination of Louvain clustering along with automated labelling of clusters to major T cell subtypes using SingleR, followed by manual annotation to finer subtypes based on differential expression in known marker genes. Preliminary biological results produced using the workflows include identification of T cell and skin-related pathways in general, and activity of genes TOX, GATA3 and ANXA1 in particular, that are regulated in various ways in the patients studied. The workflows are provided in the form of R scripts built on popular packages Seurat, standR, and limma, and can be reused with additional samples as well as be further modified depending on future questions. (Less)
Popular Abstract (Swedish)
Hur man analyserar data från encells- och spatial transkriptomik – Och vad man kan upptäcka med dess hjälp

Senaste tidens tekniska utveckling har gjort det möjligt att kartlägga enskilda cellers hela transkriptom – ett mått på vilka gener som uttrycks, dvs. är aktiva. Dessutom kan avancerad bildupptagning hjälpa till med att välja ut specifika områden i vävnadsprover, där man närmare undersöker genuttryck och information om cellernas fördelning. Dessa encells- och spatiala transkriptomikmetoder kan bidra till viktiga insikter i sambanden mellan genuttryck och sjukdom.

Hudlymfom är en form av okontrollerad tillväxt hos hudens T-celler, en sorts immunceller, och vissa varianter har dålig prognos. Att kunna förutse vilka patienter som... (More)
Hur man analyserar data från encells- och spatial transkriptomik – Och vad man kan upptäcka med dess hjälp

Senaste tidens tekniska utveckling har gjort det möjligt att kartlägga enskilda cellers hela transkriptom – ett mått på vilka gener som uttrycks, dvs. är aktiva. Dessutom kan avancerad bildupptagning hjälpa till med att välja ut specifika områden i vävnadsprover, där man närmare undersöker genuttryck och information om cellernas fördelning. Dessa encells- och spatiala transkriptomikmetoder kan bidra till viktiga insikter i sambanden mellan genuttryck och sjukdom.

Hudlymfom är en form av okontrollerad tillväxt hos hudens T-celler, en sorts immunceller, och vissa varianter har dålig prognos. Att kunna förutse vilka patienter som löper risk att utveckla dödlig hudlymfom hade kunnat betyda att personifierad behandling kan tillämpas i god tid. Man har tidigare observerat stor variation mellan patienter och över tid, i olika aspekter av cellernas genuppsättning och -uttryck, vilket försvårat bestämningen av tidiga indikatorer. Vi hoppas att encells- och spatial transkriptomik kan erbjuda svar på frågor som ’Finns det färre T-celler som angriper tumörceller hos vissa patienter och hur förändras antalet över tid ?’ eller ’Uttrycker T-celler i huden samma gener som i blodet?’.

Att skapa kunskap från information är bioinformatikens kärna. Encellstranskriptomik ger upphov till mått på genuttryck för tusentals gener i tusentals celler. För att få en överblick över mönster i den komplexa datan kan man gruppera celler baserat på deras genuttryck med hjälp av algoritmer såsom Louvain clustering. Det ger dig bättre förutsättningar att kunna räkna ut vilka gener som skiljer sig i uttryck mellan grupperna som ett resultat av faktiska biologiska skillnader och inte bara för att en viss cell allmänt uttrycker sina gener mer. Dessa statistiskt signifikanta, DE (differentially expressed)-gener kan i sin tur hjälpa dig identifiera vilka sorters T-celler som finns i ditt prov. DE-generna kan även jämföras med databaser över kända cellprocesser för att få ett hum om vad cellerna egentligen har för sig. Jag har även testat metoder för automatisk identifiering av kända T-cellssubtyper, och med noga utvalda referensdataset verkar de kunna spara tid i arbetsflödet. Men! Glöm inte att alltid kontrollera kvalitén på din data och exkludera celler eller prover som inte bedöms ha en tillräckligt stark eller pålitlig signal. De kan vara orepresentativa och leta till felaktiga slutaster. Likaså bör man normalisera data så att grupperna du vill jämföra är jämförbara även om de t.ex. har uppmätts på olika dagar.

Preliminärt intressanta gener är de som är involverade i hudens struktur och de som avgör vilken sorts subtyp en T-cell kommer utvecklas till. Jag hoppas att mitt reproducerbara arbetsflöde kan tillämpas på fler prover i framtiden för att förstå mer generella mönster i sjukdomsförloppet.

Masterexamensprojekt i Bioinformatik 30 hp 2023/2024
Biologiska institutionen, Lunds universitet
Handledare: Sara Ek
Institutionen för immunteknologi, LTH (Less)
Please use this url to cite or link to this publication:
author
Alling, Teodor
supervisor
organization
course
BINP50 20232
year
type
H2 - Master's Degree (Two Years)
subject
language
English
id
9150549
date added to LUP
2024-04-04 15:49:24
date last changed
2024-04-04 15:49:24
@misc{9150549,
  abstract     = {{There is a need to closer characterise the molecular changes associated with progression from low to high mortality stage cutaneous T cell lymphoma. This has been challenging since there is high inter-patient heterogeneity in the genetics and transcriptomics of the malignant T cell populations. Modern technology has enabled single-cell resolution as well as spatially guided cell selection for whole-transcriptome measurements and these are promising tools for closer investigation into genes, cell types, and pathways associated with disease progression. Such technologies generate large amounts of data which require workflow considerations and choices of software depending on questions asked. In this study I analysed data from single-cell RNA sequencing and spatial transcriptomics, with the goal of providing reusable workflows applied to the investigation of cutaneous T cell lymphoma. The resulting workflows incorporate methods for quality control, normalisation and batch effect correction, differential gene expression, data clustering, cell subtype annotation, and some pathway analysis. I find that normalisation with Cyclic loess followed by application of RUV4 is a useful method for reducing batch effects in our spatial transcriptomics data. To inform further hypotheses regarding T cell differentiation in the progression of this disease, I recommend the combination of Louvain clustering along with automated labelling of clusters to major T cell subtypes using SingleR, followed by manual annotation to finer subtypes based on differential expression in known marker genes. Preliminary biological results produced using the workflows include identification of T cell and skin-related pathways in general, and activity of genes TOX, GATA3 and ANXA1 in particular, that are regulated in various ways in the patients studied. The workflows are provided in the form of R scripts built on popular packages Seurat, standR, and limma, and can be reused with additional samples as well as be further modified depending on future questions.}},
  author       = {{Alling, Teodor}},
  language     = {{eng}},
  note         = {{Student Paper}},
  title        = {{Workflows for the analysis of transcriptomic data at single-cell and spatial resolutions: T cells in lymphoma}},
  year         = {{2024}},
}