Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Nowcasting U.S. inflation using mixed frequency real-time data

Lundgren, Gustaf LU and Wicktor, Nils LU (2023) In Master's Theses in Mathematical Sciences FMSM01 20231
Mathematical Statistics
Abstract
Different models were developed with the aim of nowcasting inflation at a daily basis with high frequency variables, while using real-time data to avoid look ahead bias. Both popular machine learning models such as Random Forest and XGBoost, and more traditional models such as UMIDAS and Almon distributed lag models were used to make the nowcasts. The MIDAS framework was utilized as a way of handling predictors sampled at mixed frequencies and variations of LASSO were used to select the best variables and features for the model. The main analysis considers the performance of the models compared to each other and a simple benchmark AR(1) model. It can be concluded that the ML models outperform all other models, with XGboost at the top.... (More)
Different models were developed with the aim of nowcasting inflation at a daily basis with high frequency variables, while using real-time data to avoid look ahead bias. Both popular machine learning models such as Random Forest and XGBoost, and more traditional models such as UMIDAS and Almon distributed lag models were used to make the nowcasts. The MIDAS framework was utilized as a way of handling predictors sampled at mixed frequencies and variations of LASSO were used to select the best variables and features for the model. The main analysis considers the performance of the models compared to each other and a simple benchmark AR(1) model. It can be concluded that the ML models outperform all other models, with XGboost at the top. UMIDAS and Almon were slightly outperformed by the AR(1) model which could probably be explained by overparametrization and that the LASSO did not do a good enough job to remove enough features. Further, other topics related to the nowcasting of inflation was investigated. It was concluded that inflation has become harder to nowcast during the recent years. However the variables used have stayed relatively constant throughout time. The inclusion of higher frequency variables, such as daily, improved the nowcasts compared to the more traditional approach of only using monthly released macro variables. (Less)
Popular Abstract (Swedish)
Inflationen har stigit kraftigt de senaste åren runt om hela jorden. Stigningen kom oväntat och överraskade både centralbanker och kapitalförvaltare. Detta har lett till kraftiga ränteökningar för att försöka dämpa inflationen till lägre nivåer. Kanske hade det gått att undvika dessa kraftiga ränteökningarna om man hade haft tillgång till estimat av inflation på förhand.

Vi undersöker i detta examensarbete olika modellers nowcasting-förmåga för nästa släpp av inflationen i USA. Nowcasting är ett begrepp som innebär att estimera vad som händer just nu eller en kort tid framåt. Det kan exempelvis handla om att förutspå vad januaris inflation kommer vara vid en tidpunkt någon gång under januari. Nowcasting är inget nytt utan gjordes... (More)
Inflationen har stigit kraftigt de senaste åren runt om hela jorden. Stigningen kom oväntat och överraskade både centralbanker och kapitalförvaltare. Detta har lett till kraftiga ränteökningar för att försöka dämpa inflationen till lägre nivåer. Kanske hade det gått att undvika dessa kraftiga ränteökningarna om man hade haft tillgång till estimat av inflation på förhand.

Vi undersöker i detta examensarbete olika modellers nowcasting-förmåga för nästa släpp av inflationen i USA. Nowcasting är ett begrepp som innebär att estimera vad som händer just nu eller en kort tid framåt. Det kan exempelvis handla om att förutspå vad januaris inflation kommer vara vid en tidpunkt någon gång under januari. Nowcasting är inget nytt utan gjordes populärt inom metrologi för att sedan sprida sig till andra fält så som ekonomi och finans. Vi väljer att undersöka inflationen i USA då det finns en stor bredd av data tillgänglig med lång historik. Det som vårt examensarbete bidrar med som inte gjorts tidigare är att vi estimerar på dagsbasis med enbart den data som är tillgänglig vid de specifika datumen då estimeringen utförs. Detta för att simulera en verklig situation.

Modellen matas med 100 dataserier som släpps på antingen daglig, månatlig eller årlig basis. Dataserierna inkluderar traditionella ekonomiska mått som industriproduction och arbetslöshet men även priser och räntor. För att hantera att dataserierna har olika frekvenser används Mixed Data Sampling (MIDAS) som är ett ramverk för att kombinera olika frekvenser. Detta görs genom att välja ut ett visst antal tidslag (datapunkt släppt vid en viss tidpunkt) från varje variabel, istället för att mata modellerna med hela tidsserier med olika frekvenser.

Datan genomgår två steg av förbehandling innan den matas till modellerna. Syftet med förbehandlingen är att reducera antalet variabler och inkluderade observationer (tidslag) för varje variabel. Metoden som används för att göra urvalet är Adaptive Sparse Group LASSO (ASGL) som är vidareutveckling av LASSO. Modellen bygger på att ge varje inkluderad variabel ett extra straff och väljer sedan automatiskt variabler genom att lösa ett matematiskt optimeringsproblem. I första förbehandlingen tas överflödiga variabler bort och de variabler som modellen anser vara överflödiga tas bort. I nästa steg väljs det ut vilka observationer av variablerna som anses vara relevanta. Exempelvis kan vissa variabler behöva många efterföljande observationer, medan det för andra variabler endast behövs en observation för att ge tillräcklig information. Datan matas sedan till de fyra modeller som undersöks: Unrestricted-MIDAS (UMIDAS), ALMON, Random Forest (RF) och XGBoost (XGB). UMIDAS och Almon är regressionsmodeller medan RF och XGB är maskininlärningsmodeller. Slutligen testas alla modeller på två perioder: 2014-2019 och 2019-2023.

När modellernas prestanda jämförs är det tydligt att maskininlärningsmodellerna presterar bättre än regressionsmodellerna. Maskininlärningsmodellerna uppvisar lägre variation och följer det sanna värdet bättre. Vi undersöker också hur modellerna presterar beroende på hur nära nästa släpp av inflationen vi är för att se hur modellerna anpassar sig till att mer information blir tillgänglig. Modellerna förväntas prestera bättre närmre inflationssläppen eftersom de då har tillgång till mer data. Här noteras att modellerna är dåliga på att ta till sig ny information för att skapa bättre estimat även om modellerna är som bäst dagen innan nästa inflationsvärde släpps, eftersom skillnaden var mindre än förväntat.

Vid jämförelser mellan de två perioderna så visar det sig att inflationen blivit svårare att estimera för den senare perioden, troligtvis då inflationen hunnit både stiga kraftigt samt falla under de åren. Däremot är vilka variabler som anses viktiga av ASGL oförändrade under båda perioderna. (Less)
Please use this url to cite or link to this publication:
author
Lundgren, Gustaf LU and Wicktor, Nils LU
supervisor
organization
course
FMSM01 20231
year
type
H2 - Master's Degree (Two Years)
subject
keywords
Inflation, Machine Learning, Nowcasting, MIDAS, Almon distributed lag models, Real-Time data, Random Forest, XGBoost
publication/series
Master's Theses in Mathematical Sciences
report number
LUTFMS-3478-2023
ISSN
1404-6342
other publication id
2023:E38
language
English
id
9121796
date added to LUP
2023-06-09 15:45:34
date last changed
2023-08-08 11:16:01
@misc{9121796,
  abstract     = {{Different models were developed with the aim of nowcasting inflation at a daily basis with high frequency variables, while using real-time data to avoid look ahead bias. Both popular machine learning models such as Random Forest and XGBoost, and more traditional models such as UMIDAS and Almon distributed lag models were used to make the nowcasts. The MIDAS framework was utilized as a way of handling predictors sampled at mixed frequencies and variations of LASSO were used to select the best variables and features for the model. The main analysis considers the performance of the models compared to each other and a simple benchmark AR(1) model. It can be concluded that the ML models outperform all other models, with XGboost at the top. UMIDAS and Almon were slightly outperformed by the AR(1) model which could probably be explained by overparametrization and that the LASSO did not do a good enough job to remove enough features. Further, other topics related to the nowcasting of inflation was investigated. It was concluded that inflation has become harder to nowcast during the recent years. However the variables used have stayed relatively constant throughout time. The inclusion of higher frequency variables, such as daily, improved the nowcasts compared to the more traditional approach of only using monthly released macro variables.}},
  author       = {{Lundgren, Gustaf and Wicktor, Nils}},
  issn         = {{1404-6342}},
  language     = {{eng}},
  note         = {{Student Paper}},
  series       = {{Master's Theses in Mathematical Sciences}},
  title        = {{Nowcasting U.S. inflation using mixed frequency real-time data}},
  year         = {{2023}},
}