Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Quantative Omics Discovery Base - A web-based workflow for improved functional enrichment analysis of comparative proteomic expression data

Rydén, Martin (2019) BINP50 20182
Degree Projects in Bioinformatics
Abstract
Despite the abundance of available tools for describing and analyzing gene expression data, few are properly suited for downstream analysis of quantitative proteomics data. An accurate depiction of the proteome requires us to move from a gene-centric analysis, towards one that accounts for the diversity of the proteome and respects its complexity. Here, an improved approach for first generation functional analysis is suggested. The quantitative omics discovery base is a fast, efficient web-based tool for exploring functional enrichment of expression sets. Insights are presented with a real application case study.
Popular Abstract (Swedish)
Ett porträtt av proteomet

Bioinformatiken är unik i sin position inom livsvetenskapen tack vare den frihet och de verktyg som finns för att förenklat kunna skildra en komplex biologisk verklighet.

Bioinformatiken står mellerst i processen att analysera ett biologiskt prov. Först i ledet av biologiska analyser finns vävnadsprovet som förbereds på ett laboratorium, så att dess molekylära beståndsdelar ska kunna identifieras och kvantifieras, med hjälp av instrument som genchip eller masspektrometrar. Sist i ledet står biologiska databaser vars annoteringsdata samlas på olika tillvägagångssätt, t.ex. algoritmisk litteratursökning, data från tidigare experiment, eller data som härletts från kunskap om närliggande biologiska system.

... (More)
Ett porträtt av proteomet

Bioinformatiken är unik i sin position inom livsvetenskapen tack vare den frihet och de verktyg som finns för att förenklat kunna skildra en komplex biologisk verklighet.

Bioinformatiken står mellerst i processen att analysera ett biologiskt prov. Först i ledet av biologiska analyser finns vävnadsprovet som förbereds på ett laboratorium, så att dess molekylära beståndsdelar ska kunna identifieras och kvantifieras, med hjälp av instrument som genchip eller masspektrometrar. Sist i ledet står biologiska databaser vars annoteringsdata samlas på olika tillvägagångssätt, t.ex. algoritmisk litteratursökning, data från tidigare experiment, eller data som härletts från kunskap om närliggande biologiska system.

Vårt mål är att inkorporera den biologiska kunskapen från databaserna för att beskriva det ursprungliga vävnadsprovet. Den data som instrumenten producerat innehåller inte bara en lista över vilka gener eller gen-produkter som upptäckts i ett prov, utan även deras respektive uttrycksnivåer. Det traditionella sättet att studera de genererade resultaten har varit att utvärdera enskilda komponenter och försöka tyda deras biologiska effekt för ett biologiskt tillstånd. Men biologiska system är mycket komplexa. När biomolekyler utför funktioner i en cell är det sällan en ensam uppgift. Biologiska processer består till stor del av interaktioner mellan proteiner och hela proteinkomplex som förändras beroende på sin cellulära omgivning. Detta innebär att forskaren har komplex miljö att beskriva, och det finns ett påtagligt behov av verktyg som kan presentera en reell men förenklad bild av dessa system.

Ett sätt att skapa en förenklad bild är att generalisera proteiners funktion, och kategorisera uppsättningar av proteiner med liknande funktion i en lista som beskrivs med en biologisk process. Vi kan sedan beräkna förekomsten av proteiner från vårt dataset i en sådan lista. För att få reda på i vilken utsträckning ”våra” proteiner är överrepresenterade i en given lista, måste vi även känna till vad som kan anses vara en normal förekomst av proteiner i listan. Därför använder vi ett statistiskt test som väljer en slumpmässig uppsättning proteiner och jämför om andelen proteiner från vårt dataset i en lista är större än den slumpmässig utvalda proteinerna.

Nästa uppgift är att visualisera proteinerna vi är intresserade av tillsammans med de kategorier de är överrepresenterade i. Med andra ord vill vi sammanfatta ett biologiskt fenomen med en bild. I detta projektet har bioinformatiska verktyg utvecklats för att jämföra prover med två olika biologiska tillstånd, välja ut intressanta proteiner från denna jämförelse, kategorisera deras biologiska funktioner och med olika visualiseringstekniker skildra en förenklad men representativ bild av deras roll i ett komplext biologiskt system.

Masterexamensprojekt i Bioinformatik 30 hp 2019
Biologiska institutionen, Lunds universitet

Handledare: Neserin Ali
Enheten för Klinisk Epidemiologi (Less)
Please use this url to cite or link to this publication:
author
Rydén, Martin
supervisor
organization
course
BINP50 20182
year
type
H2 - Master's Degree (Two Years)
subject
language
English
id
8979386
date added to LUP
2019-06-04 14:19:00
date last changed
2019-06-04 14:19:00
@misc{8979386,
  abstract     = {{Despite the abundance of available tools for describing and analyzing gene expression data, few are properly suited for downstream analysis of quantitative proteomics data. An accurate depiction of the proteome requires us to move from a gene-centric analysis, towards one that accounts for the diversity of the proteome and respects its complexity. Here, an improved approach for first generation functional analysis is suggested. The quantitative omics discovery base is a fast, efficient web-based tool for exploring functional enrichment of expression sets. Insights are presented with a real application case study.}},
  author       = {{Rydén, Martin}},
  language     = {{eng}},
  note         = {{Student Paper}},
  title        = {{Quantative Omics Discovery Base - A web-based workflow for improved functional enrichment analysis of comparative proteomic expression data}},
  year         = {{2019}},
}