Advanced

Performance testing of in silico HLA typing tools using a validated next generation sequencing data set, and identification of HLA allele restricted tumour neo-antigens

Salim, Maryem (2016) BINP32 20161
Degree Projects in Bioinformatics
Abstract
The exceptionally polymorphic Human Leukocyte Antigen (HLA) genes play a crucial role in the immune system’s interplay with non-immune cells. Certain HLA alleles are known to have a strong disease correlation. There is a growing interest, within several research fields, in determining (typing) HLA alleles at higher resolution than what is possible today using standard laboratory methods. Within the field of oncology, HLA typing can be used for instance in research on therapeutic “cancer vaccines”. Neo-antigens are peptides, originating from tumour-specific mutations, which can potentially be used to selectively activate an immune response against the cancer cells harbouring them. One approach to fulfil the need of HLA typing is to make use... (More)
The exceptionally polymorphic Human Leukocyte Antigen (HLA) genes play a crucial role in the immune system’s interplay with non-immune cells. Certain HLA alleles are known to have a strong disease correlation. There is a growing interest, within several research fields, in determining (typing) HLA alleles at higher resolution than what is possible today using standard laboratory methods. Within the field of oncology, HLA typing can be used for instance in research on therapeutic “cancer vaccines”. Neo-antigens are peptides, originating from tumour-specific mutations, which can potentially be used to selectively activate an immune response against the cancer cells harbouring them. One approach to fulfil the need of HLA typing is to make use of readily available deeply sequenced DNA/RNA data. In this project, the performance of four in silico HLA typing tools was evaluated, using a validated data set. Both whole exome sequencing data (from normal and tumour tissue) and RNA sequencing data (from tumour tissue) from 23 melanoma patients were used as input. The software Omixon Target HLA resulted in the highest typing accuracy, yielding 95% correctly typed alleles at >= 4-digit resolution. HLA typing of melanoma tumour samples demonstrated a trend towards “loss of heterozygosity”. The typed HLA alleles were used in a pipeline for neo-antigen prediction. An average of 52 neo-antigens [range: 5-174] were predicted per sample. The list of predicted neo-antigens can be used as an outline for further analyses addressing each antigen’s potential as a cancer vaccine component. (Less)
Popular Abstract (Swedish)
Datoranalys av cellernas eget flagg-system kan bidra till forskningen kring patient-anpassade cancerbehandlingar

Tänk dig att du zoomar in på cellytan utav dina celler. Något som du kommer lägga märke till är uppradade molekyler med små utstickande protein-stumpar (peptider). De står nästan som flaggstänger med viftande flaggor i olika former. Dessa ”flaggstänger” kallas för MHC molekyler och de har en central roll i funktionen utav ditt immunförsvar.

MHC molekyler delas in i två klasser, av vilka klass I finns representerade på i princip alla celler i kroppen, medan uttrycket utav klass II molekyler är begränsat till särskilda immunceller. Funktionen utav dessa molekyler är att hissa upp olika peptid-”flaggor” som ska reflektera... (More)
Datoranalys av cellernas eget flagg-system kan bidra till forskningen kring patient-anpassade cancerbehandlingar

Tänk dig att du zoomar in på cellytan utav dina celler. Något som du kommer lägga märke till är uppradade molekyler med små utstickande protein-stumpar (peptider). De står nästan som flaggstänger med viftande flaggor i olika former. Dessa ”flaggstänger” kallas för MHC molekyler och de har en central roll i funktionen utav ditt immunförsvar.

MHC molekyler delas in i två klasser, av vilka klass I finns representerade på i princip alla celler i kroppen, medan uttrycket utav klass II molekyler är begränsat till särskilda immunceller. Funktionen utav dessa molekyler är att hissa upp olika peptid-”flaggor” som ska reflektera vilka processer som är pågående inuti (klass I) och utanför (klass II) cellen. En särskild sorts immunceller, så kallade T-lymfocyter, bär receptorer på sina cellytor som kan scanna av andra cellers flaggor. Detta görs för att säkerställa att cellerna och deras omgivning är fria från flaggor som har sitt ursprung i bakterier, virus, skadade protein eller andra sjukdomsframkallande faktorer (patogener). Om något onormalt skulle upptäckas påbörjas en effektiv immun reaktion med målet att eliminera den bakomliggande orsaken.

För att möjliggöra att en så bred peptid repertoar som möjligt ska kunna hissas upp på MHC ”flaggstängerna” har varje individ 3 gener som kodar för MHC klass I molekyler och 3 gener (ibland fler) som kodar för MHC klass II. För var och en av dessa gener kan en individ vara homozygot eller heterozygot, vilket innebär att varje gen kan finnas som en eller två olika varianter (alleler). Personer som uttrycker många olika flaggstångs-varianter har möjligheten att visa upp mer varierade ”flaggor” och därmed signalera en mer omfattande välmåendes-rapport till omgivande T-lymfocyter. I dagsläget vet man att det finns cirka 10,000 klass I och drygt 3000 olika klass II alleler. På en populationsnivå innebär denna polymorfism (variation) att olika individer presenterar olika sorters peptider från varje patogen, vilket hindrar patogenen från att sprida sig lika framgångsrikt i alla individer, något som hejdar dess spridning.

Det går idag att genom olika labboratoriska metoder bestämma (typa) vilka MHC varianter en individ uttrycker. Detta är viktigt och utförs exempelvis systematiskt inför transplantationer. Forskning har kunnat visa att särskilda alleler är sammanlänkade till vissa sjukdomars förlopp, så som AIDS och narkolepsi. Intresset för att kunna typa MHC alleler växer och typningsmetoder med hög upplösning och precision är eftertraktade inom många medicinska fält.
I detta projekt undersöktes prestandan utav fyra datorprogram med avseende på funktionaliteten att typa MHC alleler från både normal och cancertumör DNA eller RNA sekvenseringsdata (filer med bokstavsordningen på de kvävebaser som finns representerade i DNA/RNA sekvenser). För att kunna validera typningsresultaten utfördes även typning baserad på en labboratorisk metod. Särskilt två program visade goda resultat (hög precision och upplösning) vad gäller typning av MHC alleler från normal vävnad (blod). Vid typningen av tumörer sågs en trend av ”loss of heterozygosity”, vilket innebär att variationen utav uttrycka MHC molekyler minskar. Detta kan tolkas som att tumörceller vill minska peptid repertoaren som visas på cellytan, för att undvika att bli upptäckta av T-lymfocyter och istället kunna delas och bidra till tumörens utbredning.
Ett hett område inom forskningen idag är utvecklingen utav patient-specifika behandlingar. En approach som undersöks just nu är olika former av ”cancervaccin”. Man vet att hudcancerceller uttrycker skadade, avvikande, peptider (så kallade neo-antigen) på sina cellytor. Om man tar reda på vilka dessa peptider är så tror man sig kunna rikta cancerpatientens T-lymfocyter specifikt mot celler som uttrycker de främmande flaggorna och på detta sätt hindra tumörspridningen. Utöver typningen av MHC alleler genomfördes i detta projekt prediktion utav eventuella neo-antigen. Listan på föreslagna neo-antigen kan användas som utgångsmaterial för labboratoriska analyser där förmågan av att attrahera och styra T-lymfocyt effekter bedöms.

Handledare: Katja Harbst, Avdelningen för Onkologi och Patologi, Medicon Village, Lunds universitet
Examensarbete för masterexamen i bioinformatik, 30 hp, 2016
Biologiska institutionen, Lunds universitet (Less)
Please use this url to cite or link to this publication:
author
Salim, Maryem
supervisor
organization
course
BINP32 20161
year
type
H2 - Master's Degree (Two Years)
subject
language
English
id
8891887
date added to LUP
2016-09-16 08:11:00
date last changed
2016-09-16 08:11:00
@misc{8891887,
  abstract     = {The exceptionally polymorphic Human Leukocyte Antigen (HLA) genes play a crucial role in the immune system’s interplay with non-immune cells. Certain HLA alleles are known to have a strong disease correlation. There is a growing interest, within several research fields, in determining (typing) HLA alleles at higher resolution than what is possible today using standard laboratory methods. Within the field of oncology, HLA typing can be used for instance in research on therapeutic “cancer vaccines”. Neo-antigens are peptides, originating from tumour-specific mutations, which can potentially be used to selectively activate an immune response against the cancer cells harbouring them. One approach to fulfil the need of HLA typing is to make use of readily available deeply sequenced DNA/RNA data. In this project, the performance of four in silico HLA typing tools was evaluated, using a validated data set. Both whole exome sequencing data (from normal and tumour tissue) and RNA sequencing data (from tumour tissue) from 23 melanoma patients were used as input. The software Omixon Target HLA resulted in the highest typing accuracy, yielding 95% correctly typed alleles at >= 4-digit resolution. HLA typing of melanoma tumour samples demonstrated a trend towards “loss of heterozygosity”. The typed HLA alleles were used in a pipeline for neo-antigen prediction. An average of 52 neo-antigens [range: 5-174] were predicted per sample. The list of predicted neo-antigens can be used as an outline for further analyses addressing each antigen’s potential as a cancer vaccine component.},
  author       = {Salim, Maryem},
  language     = {eng},
  note         = {Student Paper},
  title        = {Performance testing of in silico HLA typing tools using a validated next generation sequencing data set, and identification of HLA allele restricted tumour neo-antigens},
  year         = {2016},
}