Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Predicting zinc finger-DNA interactions using a scoring function based on statistic potentials

Årman, Filip (2019) BINP52 20182
Degree Projects in Bioinformatics
Abstract
Transcription factors (TFs) has an important role in our bodies, orchestrating cellular functions that are crucial for our survival, such as DNA-repair mechanisms among many others. The Cys2His2 zinc finger (C2H2-zf) family is a rich and still understudied family of TFs with regards to DNA binding specificity. Therefore, we have created a scoring function based on statistic potentials using the ZF domain specific binding data available from a comprehensive in vitro study.

We demonstrate that the scoring function significantly can distinguish positive from negative DNA binding models with a p-value < 0.05 (Mann-Whitney test). Furthermore, we demonstrate that we accurately can predict DNA binding sites of foreign ZF coming from an... (More)
Transcription factors (TFs) has an important role in our bodies, orchestrating cellular functions that are crucial for our survival, such as DNA-repair mechanisms among many others. The Cys2His2 zinc finger (C2H2-zf) family is a rich and still understudied family of TFs with regards to DNA binding specificity. Therefore, we have created a scoring function based on statistic potentials using the ZF domain specific binding data available from a comprehensive in vitro study.

We demonstrate that the scoring function significantly can distinguish positive from negative DNA binding models with a p-value < 0.05 (Mann-Whitney test). Furthermore, we demonstrate that we accurately can predict DNA binding sites of foreign ZF coming from an external database. (Less)
Popular Abstract (Swedish)
Klassificering av protein-DNA bindningar med hjälp av en algoritm baserad på bindningsstatistik

Proteiner är livsviktiga för den levande organismens överlevnad, där de spelar stor roll i alla stadier av dess liv. Dessa proteiner produceras på beordran av den DNA-kod som finns i alla celler hos organismen. Koden bestämmer exakt vilket protein som ska bli till – och hur det ska se ut genom att diktera vilka typer av byggstenar (aminosyror) som ska användas för att bygga proteinet.

Studien har fokuserat på en specifik undergrupp av proteiner som kallas zink fingrar (ZF), som fått det namnet på grund av proteinets finger-lika utseende . Dessa proteiner är extra intressanta eftersom de har som främsta egenskap att binda DNA, då de... (More)
Klassificering av protein-DNA bindningar med hjälp av en algoritm baserad på bindningsstatistik

Proteiner är livsviktiga för den levande organismens överlevnad, där de spelar stor roll i alla stadier av dess liv. Dessa proteiner produceras på beordran av den DNA-kod som finns i alla celler hos organismen. Koden bestämmer exakt vilket protein som ska bli till – och hur det ska se ut genom att diktera vilka typer av byggstenar (aminosyror) som ska användas för att bygga proteinet.

Studien har fokuserat på en specifik undergrupp av proteiner som kallas zink fingrar (ZF), som fått det namnet på grund av proteinets finger-lika utseende . Dessa proteiner är extra intressanta eftersom de har som främsta egenskap att binda DNA, då de framkallar respons genom att cellen börjar producera ett annat livsviktigt protein eller motsatsen, dvs stänga av produktionen av tidigare nämnda protein. Det fungerar helt enkelt som en på-och-av-knapp för att hålla cellens liv i balans. Mutationer i dessa zink fingrar kan orsaka cancer eller andra skadliga obalanser i cellen – därför är det intressant att studera hur dessa proteiner binder till DNA beroende på vilken aminosyra-sammansättning proteinet har.

Målet med projektet är att använda data från en övergripande forskningsstudie där hundratusentals zink fingrars DNA-bindingskapacitet testats i labbmiljö, för att sedan överföra den samlade informationen till en algoritm. Algoritmen gör en statistisk uppskattning på ZF-proteinets aminosyra-sekvens sannolikhet att interagera med olika DNA-sekvenser (baserat på den data som använts för att bygga algoritmen). Därefter väljs de DNA-sekvenserna som mest sannolikt kan interagera med det angivna ZF-proteinet ut och presenteras som troliga bindningspreferenser hos ZF-proteinet.

För att avgöra om algoritmen fungerar, använde vi ett utomstående ZF-protein med sedan tidigare känd bindningspreferens (till vänster) jämfört med algoritmens resultat (till höger).

Utifrån figurerna ser vi att algoritmen förutspådde 8 DNA-baser korrekt utifrån den kända bindningsprofilen, vilket ger en korrekthet på 80%.

Tanken är att forskare ska kunna ange ett ZF-proteins aminosyrasekvens (med okänd DNA-bindingsprofil) för att sedan erhålla en DNA-bindingsprofil för detta ZF-protein. Detta kan vara av värde när nya okända ZF-proteiners bindingspreferenser ska förundersökas, tex inför gen-terapeutiska experiment.

Masterexamensprojekt i Bioinformatik 60 hp, biologiska institutionen, Lunds Universitet
Handledare: Baldo Oliva (PI), Alberto Messeguer (PhD)
Institution: GRIB (structural bioinformatics), Parc de Recerca Biomedica de Barcelona (PRBB) (Less)
Please use this url to cite or link to this publication:
author
Årman, Filip
supervisor
organization
course
BINP52 20182
year
type
H2 - Master's Degree (Two Years)
subject
language
English
id
9004261
date added to LUP
2020-02-05 14:51:07
date last changed
2020-02-05 14:51:07
@misc{9004261,
  abstract     = {{Transcription factors (TFs) has an important role in our bodies, orchestrating cellular functions that are crucial for our survival, such as DNA-repair mechanisms among many others. The Cys2His2 zinc finger (C2H2-zf) family is a rich and still understudied family of TFs with regards to DNA binding specificity. Therefore, we have created a scoring function based on statistic potentials using the ZF domain specific binding data available from a comprehensive in vitro study.

We demonstrate that the scoring function significantly can distinguish positive from negative DNA binding models with a p-value < 0.05 (Mann-Whitney test). Furthermore, we demonstrate that we accurately can predict DNA binding sites of foreign ZF coming from an external database.}},
  author       = {{Årman, Filip}},
  language     = {{eng}},
  note         = {{Student Paper}},
  title        = {{Predicting zinc finger-DNA interactions using a scoring function based on statistic potentials}},
  year         = {{2019}},
}