# LUP Student Papers

## LUND UNIVERSITY LIBRARIES

### Mean and variance of absorption time in a population genetics model: Comparison between Markov chain and diffusion process methods.

(2019) In Master's Theses in Mathematica Sciences MATM01 20182
Mathematics (Faculty of Sciences)
Abstract
Finding the expected number of generations it takes before every individual in a population (of constant size) only has one type of gene at a particular locus of a chromosome, can be formulated as computing the mean absorption time in a Markov chain. However, the Markov chain approach is inappropriate when the population is large. This is commonly solved by approximating the Markov chain with a diffusion process, in which the mean absorption time is found by solving an ODE with boundary conditions. In this thesis, the formulas for the mean absorption time is derived in both cases. Using these formulas, the expected number of generations is computed numerically. The two different methods are compared, and we also discuss the genetic meaning... (More)
Finding the expected number of generations it takes before every individual in a population (of constant size) only has one type of gene at a particular locus of a chromosome, can be formulated as computing the mean absorption time in a Markov chain. However, the Markov chain approach is inappropriate when the population is large. This is commonly solved by approximating the Markov chain with a diffusion process, in which the mean absorption time is found by solving an ODE with boundary conditions. In this thesis, the formulas for the mean absorption time is derived in both cases. Using these formulas, the expected number of generations is computed numerically. The two different methods are compared, and we also discuss the genetic meaning of the results. (Less)
Popular Abstract (Swedish)
Den matematiska teorin för populationsgenetik utvecklades av Sewell Wright och Ronald Fisher under 1920-30 talet. Wright-Fishers modell för evolution beskriver hur frekvenser av gener i en generation kan beräknas från frekvenserna i den föregående generationen. Förändringar i frekvenserna, evolution, uppkommer på grund av mutationer och selektion, men även på grund av slumpen, så kallad drift. Så småningom resulterar sådana förändringar i att en gen fixeras, det vill säga att det är den enda typen som kvarstår i populationen.

I en tidsdiskret utvidgning av Wright-Fishers modell beskrivs förändringar av genfrekvenser i populationen med hjälp av Markovkedjor. I denna modell kan man beräkna den förväntade tiden det tar tills dess att en... (More)
Den matematiska teorin för populationsgenetik utvecklades av Sewell Wright och Ronald Fisher under 1920-30 talet. Wright-Fishers modell för evolution beskriver hur frekvenser av gener i en generation kan beräknas från frekvenserna i den föregående generationen. Förändringar i frekvenserna, evolution, uppkommer på grund av mutationer och selektion, men även på grund av slumpen, så kallad drift. Så småningom resulterar sådana förändringar i att en gen fixeras, det vill säga att det är den enda typen som kvarstår i populationen.

I en tidsdiskret utvidgning av Wright-Fishers modell beskrivs förändringar av genfrekvenser i populationen med hjälp av Markovkedjor. I denna modell kan man beräkna den förväntade tiden det tar tills dess att en vald typ av gen fixeras. En nackdel med modellen är dock att de matriser som beskriver övergångssannolikheterna beror på populationens storlek. För större populationer blir därför de numeriska beräkningarna svåra. För att komma runt detta kan man istället använda en annan modell där den tidsdiskreta modellen approximeras med en kontinuerlig, vilket leder till en diffusionsekvation för täthetsfunktionen för processen. Denna kan i sin tur skrivas på integralform med hjälp av en Greenfunktion.

Ett mål med arbetet är att sätta sig in i dessa modeller och undersöka hur väl de överensstämmer i förutsägelser beroende på val av parametrar för populationsstorlek, mutationsfrekvens, selektionskoefficient och dominansgrad. Ett annat är att se om de beräknade värdena motsvarar vad man kan förvänta sig från en biologisk synpunkt. (Less)
author
supervisor
organization
course
MATM01 20182
year
type
H2 - Master's Degree (Two Years)
subject
keywords
Population genetics, Markov chain, Diffusion process.
publication/series
Master's Theses in Mathematica Sciences
report number
LUNFMA-3101-2019
ISSN
1404-6342
other publication id
2019:E9
language
English
id
8973050
2019-06-14 17:40:22
date last changed
2019-06-14 17:40:22
@misc{8973050,
abstract     = {Finding the expected number of generations it takes before every individual in a population (of constant size) only has one type of gene at a particular locus of a chromosome, can be formulated as computing the mean absorption time in a Markov chain. However, the Markov chain approach is inappropriate when the population is large. This is commonly solved by approximating the Markov chain with a diffusion process, in which the mean absorption time is found by solving an ODE with boundary conditions. In this thesis, the formulas for the mean absorption time is derived in both cases. Using these formulas, the expected number of generations is computed numerically. The two different methods are compared, and we also discuss the genetic meaning of the results.},
author       = {Koronen, Alexander},
issn         = {1404-6342},
keyword      = {Population genetics,Markov chain,Diffusion process.},
language     = {eng},
note         = {Student Paper},
series       = {Master's Theses in Mathematica Sciences},
title        = {Mean and variance of absorption time in a population genetics model: Comparison between Markov chain and diffusion process methods.},
year         = {2019},
}