Skip to main content

Lund University Publications

LUND UNIVERSITY LIBRARIES

On gene regulatory networks and data fitting

Fogelmark, Karl LU (2016)
Abstract
Living organisms can be viewed as complex biological machines. In order to function, they must regulate their internal mechanism to do the right thing, at the right time, and in the right amount. Part of this regulation is encoded in gene regulatory networks. These are built up of genes which produce special proteins (transcription factors, tf) that regulate other tf-producing genes. Thus a network is formed with genes (nodes) linked together by their mutual regulation (edges).

By constructing simplified models, we investigate such gene networks. The models allow us to probe general principles behind what shapes these networks (paper II), as well as specific networks such as that which endows the plant Arabidopsis thaliana with... (More)
Living organisms can be viewed as complex biological machines. In order to function, they must regulate their internal mechanism to do the right thing, at the right time, and in the right amount. Part of this regulation is encoded in gene regulatory networks. These are built up of genes which produce special proteins (transcription factors, tf) that regulate other tf-producing genes. Thus a network is formed with genes (nodes) linked together by their mutual regulation (edges).

By constructing simplified models, we investigate such gene networks. The models allow us to probe general principles behind what shapes these networks (paper II), as well as specific networks such as that which endows the plant Arabidopsis thaliana with the ability to predict dawn and dusk (paper III). We also present a model for dynamically generating transcriptional networks which encode function from a single variable-length binary representation of dna (string of ones and zeroes). This gives a natural way for the network to evolve by mutations. However, performing a meaningful and efficient crossover operation on two dna strings of different length becomes a challenge. We address this by introducing a heuristic algorithm, which we compare against existing methods (paper IV).

Additionally, we present a correct error estimation for the popular least squares method that is valid also for nonlinear functions applied to highly correlated data (paper I). For model fitting to correlated data, one has previously been constrained to use either a maximum likelihood approach, which leads to strong bias in the estimated parameters, or a least squares approach, which gives an incorrect error estimate. We also derive the first order contribution of the bias for both the maximum likelihood and the least squares method, and introduce a minimum variance function fitting method suited for Brownian motion. (Less)
Abstract (Swedish)
Världen är föränderlig. För att kunna överleva måste allt liv kunna anpassa sig till rådande förhållanden. För cellen, livets minsta enhet, sker detta bland annat genom reglering av produktionstakten av proteiner, vilka är de molekyler som utför de flesta grundläggande funktioner.

En speciell klass av proteiner utgörs av så kallade transkriptionsfaktorer. Dessa slår av eller på en gens produktion av proteiner, genom att binda till gens position på dna-molekylen. Eftersom dessa transkriptionsfaktorer också själva är proteiner, som produceras av gener som regleras av andra transkriptionsfaktorer, bildas komplexa nätverk där gener som producerar denna proteinklass kan sägas interagera med varandra. Dessa transkriptionsnätverk av... (More)
Världen är föränderlig. För att kunna överleva måste allt liv kunna anpassa sig till rådande förhållanden. För cellen, livets minsta enhet, sker detta bland annat genom reglering av produktionstakten av proteiner, vilka är de molekyler som utför de flesta grundläggande funktioner.

En speciell klass av proteiner utgörs av så kallade transkriptionsfaktorer. Dessa slår av eller på en gens produktion av proteiner, genom att binda till gens position på dna-molekylen. Eftersom dessa transkriptionsfaktorer också själva är proteiner, som produceras av gener som regleras av andra transkriptionsfaktorer, bildas komplexa nätverk där gener som producerar denna proteinklass kan sägas interagera med varandra. Dessa transkriptionsnätverk av genreglering ligger till grund för hur, till exempel, en växt kan stänga av klorofyllproduktion i avsaknad av ljus.

I praktiken har genregleringsnätverken gått än längre och kan — givet dagsljusets periodicitet — förutsäga solens upp- och nedgång. I två artiklar undersöker vi dessa gennätverk med hjälp av matematiska modeller. I artikel III undersöker vi ett nätverk, specifikt för växten backtrav, som fungerar som en klocka, med vilken gryning och skymning kan förutsägas genom oscillationer i specifika proteinkoncentrationer. I artikel II undersöks mer generella nätverk utan direkt anknytning till någon specifik organism. I dessa nätverk lagras den genetiska informationen i en sträng av ettor och nollor, vilken representerar dna-kedjan. Denna binära sträng tillåts i artikel IV att vara av variabel längd, vilket försvårar den matchning som är av biologisk relevans vid reproduktion. Vi undersöker därför olika metoder för att effektivt jämföra två olika långa binära strängar.

Orelaterat till genreglering ovan, presenteras i artikel I en korrigerad feluppskattningsformel för parameteranpassning till korrelerad data. När datapunkter sägs vara korrelerade avses att dessa inte är oberoende av varandra. Det vill säga, att addera fler punkter, t.ex. genom att göra fler mätningar, innebär inte nödvändigtvis att vi får mer information om systemet. Den vanligaste metoden för att anpassa en funktion till data, minsta kvadratmetoden, kommer däremot att ge sken av att så är fallet, och således ge en allt för optimistisk uppskattning av felet. Detta avhjälper vi genom att introducera en korrigerad feluppskattningsformel för minsta kvadratmetoden, vars giltighet vi demonstrerar på tre system där data är benägen att vara korrelerad.
(Less)
Please use this url to cite or link to this publication:
author
supervisor
opponent
  • Dr. Trusina, Ala, Niels Bohr Institute, University of Copenhagen, Denmark
organization
publishing date
type
Thesis
publication status
published
keywords
Circadian rhythms, gene regulation, transcription networks, correlated data, Circadian rhythms, gene regulation, transcription networks, correlated data, Fysicumarkivet A:2016:Fogelmark
pages
238 pages
publisher
Lund University, Faculty of Science, Department of Astronomy and Theoretical Physics
defense location
Lund Observatory, Lundmark Lecture hall, Sölvegatan 27, Lund
defense date
2016-05-19 10:15:00
ISBN
978-91-7623-699-4
978-91-7623-700-7
language
English
LU publication?
yes
id
12a5d61e-65f6-4abe-8fab-4bdfedb6dc6d
date added to LUP
2016-04-28 17:32:07
date last changed
2020-01-23 14:36:28
@phdthesis{12a5d61e-65f6-4abe-8fab-4bdfedb6dc6d,
  abstract     = {{Living organisms can be viewed as complex biological machines. In order to function, they must regulate their internal mechanism to do the right thing, at the right time, and in the right amount. Part of this regulation is encoded in gene regulatory networks. These are built up of genes which produce special proteins (transcription factors, tf) that regulate other tf-producing genes. Thus a network is formed with genes (nodes) linked together by their mutual regulation (edges).<br/><br/>By constructing simplified models, we investigate such gene networks. The models allow us to probe general principles behind what shapes these networks (paper II), as well as specific networks such as that which endows the plant Arabidopsis thaliana with the ability to predict dawn and dusk (paper III). We also present a model for dynamically generating transcriptional networks which encode function from a single variable-length binary representation of dna (string of ones and zeroes). This gives a natural way for the network to evolve by mutations. However, performing a meaningful and efficient crossover operation on two dna strings of different length becomes a challenge. We address this by introducing a heuristic algorithm, which we compare against existing methods (paper IV).<br/><br/>Additionally, we present a correct error estimation for the popular least squares method that is valid also for nonlinear functions applied to highly correlated data (paper I). For model fitting to correlated data, one has previously been constrained to use either a maximum likelihood approach, which leads to strong bias in the estimated parameters, or a least squares approach, which gives an incorrect error estimate. We also derive the first order contribution of the bias for both the maximum likelihood and the least squares method, and introduce a minimum variance function fitting method suited for Brownian motion.}},
  author       = {{Fogelmark, Karl}},
  isbn         = {{978-91-7623-699-4}},
  keywords     = {{Circadian rhythms, gene regulation, transcription networks, correlated data; Circadian rhythms; gene regulation; transcription networks; correlated data; Fysicumarkivet A:2016:Fogelmark}},
  language     = {{eng}},
  publisher    = {{Lund University, Faculty of Science, Department of Astronomy and Theoretical Physics}},
  school       = {{Lund University}},
  title        = {{On gene regulatory networks and data fitting}},
  url          = {{https://lup.lub.lu.se/search/files/7546375/kappa.pdf}},
  year         = {{2016}},
}