Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Training Neural Networks to Predict Default Risk - An Analysis of the U.S. Mortgage Market

Hedman Johnson, Philip LU (2019) EXTM10 20191
Department of Economics
Popular Abstract (Swedish)
För finansiella institutioner vars affärsmodell bygger på att låna ut pengar är det högst relevant att på ett så säkert sätt som möjligt kunna avgöra om en potentiell kund är lönsam eller inte, det vill säga om det är troligt att denne betalar tillbaka sin skuld i det fall han eller hon beviljas ett lån. För att skatta sannolikheten att en kund hamnar i fallissemang och för att diskriminera mellan bra och dåliga kunder använder finansiella institut vanligtvis statistiska modeller. Att skatta sannolikheten för fallissemang är dessutom en del i ett regleringsmässigt krav där finansiella institut är skyldiga att beräkna en kapitalreserv som ska täcka oförväntade förluster.
Denna studie jämför två statistiska metoder för att prediktera... (More)
För finansiella institutioner vars affärsmodell bygger på att låna ut pengar är det högst relevant att på ett så säkert sätt som möjligt kunna avgöra om en potentiell kund är lönsam eller inte, det vill säga om det är troligt att denne betalar tillbaka sin skuld i det fall han eller hon beviljas ett lån. För att skatta sannolikheten att en kund hamnar i fallissemang och för att diskriminera mellan bra och dåliga kunder använder finansiella institut vanligtvis statistiska modeller. Att skatta sannolikheten för fallissemang är dessutom en del i ett regleringsmässigt krav där finansiella institut är skyldiga att beräkna en kapitalreserv som ska täcka oförväntade förluster.
Denna studie jämför två statistiska metoder för att prediktera fallissemangsrisken på den amerikanska bolånemarknaden. Modellerna ger baserat på ett antal förklarande variabler ett binärt svar på huruvida det är sannolikt att en potentiell kund hamnar i fallissemang eller inte och har tränats på bolåneansökningsdata från the Federal Home Loan Mortgage Corporation med explicit ojämn fördelning mellan de två klasserna. För att balansera datan har olika resamplingtekniker som Synthetic Minority Oversampling Technique, Tomek Links Undersampling, Edited Nearest Neighbour och kombinationer av dessa använts med varierande resultat.
Modellerna som jämförts är logistisk regression och neurala nätverk med olika arkitektur, aktiveringsfunktioner och regulariseringstekniker. Den modell som presterar bäst är ett neuralt nätverk med ett gömt lager som använder ReLU som aktiveringsfunktion och en kombination av dropout och L2-regularisering. Dock presterar det inte avsevärt mycket bättre än den logistiska regressionsmodellen, vilket indikerar att det inte finns någon utbredd icke-linjäritet i datan, som det neurala nätverket är bättre på att fånga upp. Givet anökningsdatan som använts i denna studie ger alltså de två modellerna relativt likvärdiga resultat. (Less)
Please use this url to cite or link to this publication:
author
Hedman Johnson, Philip LU
supervisor
organization
course
EXTM10 20191
year
type
H2 - Master's Degree (Two Years)
subject
language
English
id
8986175
date added to LUP
2019-08-08 10:26:57
date last changed
2019-08-08 10:26:57
@misc{8986175,
  author       = {{Hedman Johnson, Philip}},
  language     = {{eng}},
  note         = {{Student Paper}},
  title        = {{Training Neural Networks to Predict Default Risk - An Analysis of the U.S. Mortgage Market}},
  year         = {{2019}},
}