Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Jump Estimation of Hidden Markov Models with Time-Varying Transition Probabilities

Tansjö, Henning LU (2020) In LUNFMS-4044-2020 MASK11 20201
Mathematical Statistics
Abstract
The Hidden Markov model is applicable to a wide variety of fields. Applied to financial time series, its assumed underlying state sequence can reflect the time series' tendency to behave differently over different periods of time. In many situations, models could be improved by including exogenous data. However, that may in some cases be inappropriate in practice as the model could get too mathematically complex to learn or require too strong assumptions. The jump estimator for learning Hidden Markov models by clustering temporal features is very flexible in that regard. In this thesis we conduct a simulation study to show that, assuming time-varying transition probabilities depending on exogenous variables, the jump estimator's prediction... (More)
The Hidden Markov model is applicable to a wide variety of fields. Applied to financial time series, its assumed underlying state sequence can reflect the time series' tendency to behave differently over different periods of time. In many situations, models could be improved by including exogenous data. However, that may in some cases be inappropriate in practice as the model could get too mathematically complex to learn or require too strong assumptions. The jump estimator for learning Hidden Markov models by clustering temporal features is very flexible in that regard. In this thesis we conduct a simulation study to show that, assuming time-varying transition probabilities depending on exogenous variables, the jump estimator's prediction accuracy of latent states can be significantly improved as its feature space is extended with the relevant exogenous data. To facilitate the simulation study, we use an EM-algorithm to estimate Hidden Markov models applied to the S&P 500 index with transition probabilities depending on exogenous variables. Four variables are considered in a forward selection scheme resulting in the CBOE Volatility Index being deemed the most important exogenous variable in this setting. For practical purposes, our results indicate in particular that when applying the jump estimator to the S&P 500, including features based on the volatility index improves its ability to segment the S&P 500 into periods with bullish and bearish market conditions. (Less)
Popular Abstract (Swedish)
En Dold Markovmodell (HMM) kan användas för modellera tidsserier på ett sätt som beskriver olika beteenden under olika perioder; till exempel kan den beskriva finansiella tidsseriers benägenhet att plötsligt ändra riktning då marknadssentimentet förändras, exempelvis på grund av en pandemi. Givet en tidsserie, tänker man sig att den antar olika tillstånd som ej går att observera men som reflekteras i hur variabeln i tidsserien är slumpartat fördelad. Systemet kan ses som en underliggande ”dold” process som utvecklas stegvist i tid och slumpmässigt hoppar mellan olika tillstånd samt emitterar en observation vid varje tidpunkt. Denna process kallas för Markovkedja och definieras av att sannolikheterna att hamna i olika tillstånd i framtiden... (More)
En Dold Markovmodell (HMM) kan användas för modellera tidsserier på ett sätt som beskriver olika beteenden under olika perioder; till exempel kan den beskriva finansiella tidsseriers benägenhet att plötsligt ändra riktning då marknadssentimentet förändras, exempelvis på grund av en pandemi. Givet en tidsserie, tänker man sig att den antar olika tillstånd som ej går att observera men som reflekteras i hur variabeln i tidsserien är slumpartat fördelad. Systemet kan ses som en underliggande ”dold” process som utvecklas stegvist i tid och slumpmässigt hoppar mellan olika tillstånd samt emitterar en observation vid varje tidpunkt. Denna process kallas för Markovkedja och definieras av att sannolikheterna att hamna i olika tillstånd i framtiden endast beror på nuet.

När man modellerar en tidsserie med en HMM vill man, baserat på tidigare observationer, (1) skatta parametrar som har att göra med hur den observerbara variabeln fördelas under olika tillstånd samt sannolikheterna som beskriver övergången mellan tillstånden och, (2) försöka bestämma, ”prediktera”, vilka tillstånd som har genererat varje observation i tidsserien. Traditionellt sett har detta gjorts med den så kallade Maximum Likelihood-metoden. Denna uppsats bygger på en nyligen föreslagen klustringsmetod för att lösa både parameterskattning och prediktion samtidigt. Den utnyttjar olikheter i fördelningen av olika observationer som genererats under olika tillstånd för att ordna dem i grupper som representerar de möjliga tillstånden. Till skillnad från Maximum Likelihood-metoden behöver den inte göra lika starka antaganden om systemet som modelleras, vilket minskar risken för att den blir vilseledande. Vidare kan man med fördel kontrollera hur stabila de predikterade tillstånden ska vara genom en regulariseringsparameter. Detta kan till exempel leda till lägre transaktionskostnader om en handelsstrategi baseras på modellen.

I en ”vanlig” HMM är övergångssannoliketerna i Markovkedjan konstanta. Denna kan modifieras genom att låta sannolikheterna bero på exogena variabler som skulle kunna ha en påverkan på den modellerade tidsserien. Detta skulle å ena sidan kunna förbättra modellen, men å andra sidan kan den bli svårare att arbeta med. Den ovan nämnda klustermetoden för HMMer, Jump-metoden, är däremot mycket flexibel i det avseendet och kan enkelt utvidgas för att ta hänsyn till exogen data. I denna uppsats visar vi genom en simuleringsstudie att, under antagandet att övergångssannoliketerna beror på exogena variabler, kan Jump-metodens prediktiva förmåga förbättras då den, utöver observationer från den modellerade (endogena) tidsserien, även klustrar de relevanta exogena variablerna. Simulerade tidsserier tillåter en jämförelse av Jump-metodens predikterade tillstånd vid varje tidpunkt med de ”verkliga” (som annars är okända) och därmed går det att bedöma metodens träffsäkerhet. Vi simulerar tidsserierna enligt HMMer av senast nämnda sort ämnade att modellera Standard & Poor's 500 index med exogena variabler valda så att modellerna passar observerad data väl med statistiska mått. Variabelurvalet tyder på att, framför allt, CBOE Volatility Index med fördel kan inkluderas som exogen variabel. Detta samt de positiva resultaten från simuleringsstudien verkar vara användbara i praktiken; då Jump-metoden även klustrar CBOE Volatility Index, tyder våra resultat på att dess förmåga att identifiera perioder i Standard & Poor's 500 med, i genomsnitt, antingen positiv eller negativ avkastning förbättras. (Less)
Please use this url to cite or link to this publication:
author
Tansjö, Henning LU
supervisor
organization
course
MASK11 20201
year
type
M2 - Bachelor Degree
subject
keywords
Jump estimation, Hidden Markov model, financial time series, clustering, unsupervised learning.
publication/series
LUNFMS-4044-2020
report number
2020:K9
ISSN
1654-6229
language
English
id
9013497
date added to LUP
2020-06-05 16:32:47
date last changed
2020-06-05 16:32:47
@misc{9013497,
  abstract     = {{The Hidden Markov model is applicable to a wide variety of fields. Applied to financial time series, its assumed underlying state sequence can reflect the time series' tendency to behave differently over different periods of time. In many situations, models could be improved by including exogenous data. However, that may in some cases be inappropriate in practice as the model could get too mathematically complex to learn or require too strong assumptions. The jump estimator for learning Hidden Markov models by clustering temporal features is very flexible in that regard. In this thesis we conduct a simulation study to show that, assuming time-varying transition probabilities depending on exogenous variables, the jump estimator's prediction accuracy of latent states can be significantly improved as its feature space is extended with the relevant exogenous data. To facilitate the simulation study, we use an EM-algorithm to estimate Hidden Markov models applied to the S&P 500 index with transition probabilities depending on exogenous variables. Four variables are considered in a forward selection scheme resulting in the CBOE Volatility Index being deemed the most important exogenous variable in this setting. For practical purposes, our results indicate in particular that when applying the jump estimator to the S&P 500, including features based on the volatility index improves its ability to segment the S&P 500 into periods with bullish and bearish market conditions.}},
  author       = {{Tansjö, Henning}},
  issn         = {{1654-6229}},
  language     = {{eng}},
  note         = {{Student Paper}},
  series       = {{LUNFMS-4044-2020}},
  title        = {{Jump Estimation of Hidden Markov Models with Time-Varying Transition Probabilities}},
  year         = {{2020}},
}