Training Neural Networks to Predict Default Risk - An Analysis of the U.S. Mortgage Market

Hedman Johnson, Philip

Training Neural Networks to Predict Default Risk - An Analysis of the U.S. Mortgage Market

Mark

Hedman Johnson, Philip ^LU (2019) EXTM10 20191
Department of Economics

Popular Abstract (Swedish): För finansiella institutioner vars affärsmodell bygger på att låna ut pengar är det högst relevant att på ett så säkert sätt som möjligt kunna avgöra om en potentiell kund är lönsam eller inte, det vill säga om det är troligt att denne betalar tillbaka sin skuld i det fall han eller hon beviljas ett lån. För att skatta sannolikheten att en kund hamnar i fallissemang och för att diskriminera mellan bra och dåliga kunder använder finansiella institut vanligtvis statistiska modeller. Att skatta sannolikheten för fallissemang är dessutom en del i ett regleringsmässigt krav där finansiella institut är skyldiga att beräkna en kapitalreserv som ska täcka oförväntade förluster.
Denna studie jämför två statistiska metoder för att prediktera... (More); För finansiella institutioner vars affärsmodell bygger på att låna ut pengar är det högst relevant att på ett så säkert sätt som möjligt kunna avgöra om en potentiell kund är lönsam eller inte, det vill säga om det är troligt att denne betalar tillbaka sin skuld i det fall han eller hon beviljas ett lån. För att skatta sannolikheten att en kund hamnar i fallissemang och för att diskriminera mellan bra och dåliga kunder använder finansiella institut vanligtvis statistiska modeller. Att skatta sannolikheten för fallissemang är dessutom en del i ett regleringsmässigt krav där finansiella institut är skyldiga att beräkna en kapitalreserv som ska täcka oförväntade förluster.
Denna studie jämför två statistiska metoder för att prediktera fallissemangsrisken på den amerikanska bolånemarknaden. Modellerna ger baserat på ett antal förklarande variabler ett binärt svar på huruvida det är sannolikt att en potentiell kund hamnar i fallissemang eller inte och har tränats på bolåneansökningsdata från the Federal Home Loan Mortgage Corporation med explicit ojämn fördelning mellan de två klasserna. För att balansera datan har olika resamplingtekniker som Synthetic Minority Oversampling Technique, Tomek Links Undersampling, Edited Nearest Neighbour och kombinationer av dessa använts med varierande resultat.
Modellerna som jämförts är logistisk regression och neurala nätverk med olika arkitektur, aktiveringsfunktioner och regulariseringstekniker. Den modell som presterar bäst är ett neuralt nätverk med ett gömt lager som använder ReLU som aktiveringsfunktion och en kombination av dropout och L2-regularisering. Dock presterar det inte avsevärt mycket bättre än den logistiska regressionsmodellen, vilket indikerar att det inte finns någon utbredd icke-linjäritet i datan, som det neurala nätverket är bättre på att fånga upp. Givet anökningsdatan som använts i denna studie ger alltså de två modellerna relativt likvärdiga resultat. (Less)

Please use this url to cite or link to this publication: http://lup.lub.lu.se/student-papers/record/8986175

author

Hedman Johnson, Philip ^LU

supervisor

Birger Nilsson

organization

Department of Economics

course

EXTM10 20191

year

2019

type

H2 - Master's Degree (Two Years)

subject

Mathematics and Statistics

language

English

id

8986175

date added to LUP

2019-08-08 10:26:57

date last changed

2019-08-08 10:26:57

@misc{8986175,
  author       = {{Hedman Johnson, Philip}},
  language     = {{eng}},
  note         = {{Student Paper}},
  title        = {{Training Neural Networks to Predict Default Risk - An Analysis of the U.S. Mortgage Market}},
  year         = {{2019}},
}

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Training Neural Networks to Predict Default Risk - An Analysis of the U.S. Mortgage Market