Enhancing Probability of Default Prediction: Non-Linear Modeling in Turbulent Economic Times
(2024) In Master's Theses in Mathematical Sciences FMSM01 20241Mathematical Statistics
- Abstract
- This thesis investigates the application of spline regression models to predict the Probability of Default (PD) under varying macroeconomic conditions, exploring whether these models can enhance predictive accuracy over traditional linear models and compare favorably to XGBoost. The study analyses the non-linear dynamics between PD and key macroeconomic indicators within a Swedish small-sized corporate loan portfolio from 2008 to 2022. Spline models, particularly cubic splines, are compared against linear models and XGBoost in terms of predictive performance.
The results indicate that while spline models show potential in capturing complex non-linear relationships, their performance in out-of-time validation does not consistently... (More) - This thesis investigates the application of spline regression models to predict the Probability of Default (PD) under varying macroeconomic conditions, exploring whether these models can enhance predictive accuracy over traditional linear models and compare favorably to XGBoost. The study analyses the non-linear dynamics between PD and key macroeconomic indicators within a Swedish small-sized corporate loan portfolio from 2008 to 2022. Spline models, particularly cubic splines, are compared against linear models and XGBoost in terms of predictive performance.
The results indicate that while spline models show potential in capturing complex non-linear relationships, their performance in out-of-time validation does not consistently surpass that of linear models. However, spline models provide a more nuanced understanding of the interactions between PD and macroeconomic variables, which could be crucial during turbulent economic periods. XGBoost demonstrated superior accuracy and generalization capabilities, particularly in handling diverse macroeconomic conditions without predicting excessively high PD values.
Based on these findings, spline models can serve as an effective intermediary, balancing the interpretability of linear models with the higher accuracy of XGBoost. This work contributes to the credit risk modeling discourse, particularly within the IFRS 9 framework, suggesting that incorporating non-linear modeling techniques such as splines could offer a more flexible and potentially more accurate approach to PD prediction. (Less) - Popular Abstract (Swedish)
- För att säkerställa finansiell stabilitet och undvika framtida ekonomiska kriser är det viktigt att banker noggrant hanterar sin kreditrisk. En kritisk komponent i detta är att noggrant modellera sannolikheten för att en låntagare inte kan återbetala sitt lån, även känt som sannolikheten för konkurs (Probability of
Default, PD). Mitt examensarbete fokuserar på att förbättra dessa förutsägelser genom att använda mer avancerade, icke-linjära modeller jämfört med de traditionella linjära modellerna som ofta används av banker idag.
Under 2008 års finanskris blev det uppenbart att de existerande metoderna för att bedöma kreditrisk inte var tillräckliga. Som svar på detta infördes IFRS 9, en standard som kräver att banker använder en... (More) - För att säkerställa finansiell stabilitet och undvika framtida ekonomiska kriser är det viktigt att banker noggrant hanterar sin kreditrisk. En kritisk komponent i detta är att noggrant modellera sannolikheten för att en låntagare inte kan återbetala sitt lån, även känt som sannolikheten för konkurs (Probability of
Default, PD). Mitt examensarbete fokuserar på att förbättra dessa förutsägelser genom att använda mer avancerade, icke-linjära modeller jämfört med de traditionella linjära modellerna som ofta används av banker idag.
Under 2008 års finanskris blev det uppenbart att de existerande metoderna för att bedöma kreditrisk inte var tillräckliga. Som svar på detta infördes IFRS 9, en standard som kräver att banker använder en framåtblickande modell för att uppskatta förväntade kreditförluster. Traditionellt har banker använt linjära modeller för PD, som förutsätter en linjär relation mellan ekonomiska faktorer och sannolikheten för konkurs. Detta antagande stämmer dock inte alltid, särskilt inte under turbulenta ekonomiska tider och kriser. Å andra sidan, även om maskininlärningsmodeller kan erbjuda högre precision, fungerar de ofta som "svarta lådor" där det är svårt att förstå och förklara varför de kommer fram till sina resultat, vilket är väldigt viktigt för banker som är under hårt regulatoriskt tryck. Ett effektivt alternativ, med hög precision och fortsatt hög grad av förklarbarhet, är spline-modeller.
Genom att analysera ett dataset från Nordea, som omfattar små företag i Sverige från 2008 till 2022, har jag jämfört traditionella linjära modeller med spline-modeller och maskininlärningsmetoden XGBoost i deras förmåga att förutspå PD baserat på olika makroekonomiska faktorer. Förenklat kan man säga att splines är en typ av icke-linjär modell som kan anpassa sig bättre till komplexa data genom att dela upp datan i segment och använda polynom för att beskriva varje segment för sig. Man kan också se sambandet mellan varje individuell riskfaktor och målvariabeln, på samma sätt som för linjära modeller. Splines erbjuder därmed en balans mellan enkelheten och förklarbarheten hos linjära modeller och den förbättrade prediktiva förmågan hos maskininlärningsmodeller.
Resultaten visar att även om splines erbjuder en mer detaljerad förståelse av relationen mellan makroekonomiska variabler och PD, överträffar de inte konsekvent de linjära modellerna när det gäller prediktiv förmåga. Däremot ger spline-modellerna en djupare insikt i hur olika ekonomiska faktorer påverkar kreditrisker under olika makroekonomiska förhållanden genom icke-linjära samband. XGBoost
visade överlägsen precision och generaliseringsförmåga, särskilt i att hantera olika makroekonomiska förhållanden utan att förutse överdrivet höga PD-värden.
Mitt arbete visar därmed att medan traditionella modeller fortfarande är effektiva, finns det fördelar med att inkludera icke-linjära modeller som splines och XGBoost för att bättre förstå och förutsäga kreditrisk. Denna forskning kan hjälpa banker att anpassa sina riskmodeller och säkerställa finansiell stabilitet, även under oförutsägbara ekonomiska förhållanden. (Less)
Please use this url to cite or link to this publication:
http://lup.lub.lu.se/student-papers/record/9158985
- author
- Stern, Victor LU
- supervisor
- organization
- alternative title
- Förbättrad Modellering av Sannolikheten för Konkurs: Icke-Linjära Modeller i Turbulenta Ekonomiska Tider
- course
- FMSM01 20241
- year
- 2024
- type
- H2 - Master's Degree (Two Years)
- subject
- keywords
- Probability of Default (PD), Linear regression, Splines, XGBoost, Macroeconomic indicators, Credit risk modeling
- publication/series
- Master's Theses in Mathematical Sciences
- report number
- LUTFMS-3499-2024
- ISSN
- 1404-6342
- other publication id
- 2024:E44
- language
- English
- id
- 9158985
- date added to LUP
- 2024-06-11 13:39:17
- date last changed
- 2025-01-22 14:16:22
@misc{9158985, abstract = {{This thesis investigates the application of spline regression models to predict the Probability of Default (PD) under varying macroeconomic conditions, exploring whether these models can enhance predictive accuracy over traditional linear models and compare favorably to XGBoost. The study analyses the non-linear dynamics between PD and key macroeconomic indicators within a Swedish small-sized corporate loan portfolio from 2008 to 2022. Spline models, particularly cubic splines, are compared against linear models and XGBoost in terms of predictive performance. The results indicate that while spline models show potential in capturing complex non-linear relationships, their performance in out-of-time validation does not consistently surpass that of linear models. However, spline models provide a more nuanced understanding of the interactions between PD and macroeconomic variables, which could be crucial during turbulent economic periods. XGBoost demonstrated superior accuracy and generalization capabilities, particularly in handling diverse macroeconomic conditions without predicting excessively high PD values. Based on these findings, spline models can serve as an effective intermediary, balancing the interpretability of linear models with the higher accuracy of XGBoost. This work contributes to the credit risk modeling discourse, particularly within the IFRS 9 framework, suggesting that incorporating non-linear modeling techniques such as splines could offer a more flexible and potentially more accurate approach to PD prediction.}}, author = {{Stern, Victor}}, issn = {{1404-6342}}, language = {{eng}}, note = {{Student Paper}}, series = {{Master's Theses in Mathematical Sciences}}, title = {{Enhancing Probability of Default Prediction: Non-Linear Modeling in Turbulent Economic Times}}, year = {{2024}}, }