Predicting 30-day Mortality after ICU admission, with the help of SAPS 3, Medication Records, and Machine Learning
(2025) In Master’s Theses in Mathematical Sciences FMSM01 20251Mathematical Statistics
- Abstract
- Early and accurate prediction of patient outcomes in intensive care units (ICUs) is essential to help with effective clinical decision-making and resource allocation.
This thesis investigates the predictive performance of logistic regression and machine learning models for 30-day mortality following ICU admission. The
thesis has a particular focus on the contribution of medication administration records to existing prediction models. The study evaluates four predictive
approaches: standard logistic regression, LASSO regression, random forests, and XGBoost. Each model is developed using a baseline clinical feature derived from the Simplified Acute Physiology Score 3 (SAPS 3) and then expanded to include more features, including... (More) - Early and accurate prediction of patient outcomes in intensive care units (ICUs) is essential to help with effective clinical decision-making and resource allocation.
This thesis investigates the predictive performance of logistic regression and machine learning models for 30-day mortality following ICU admission. The
thesis has a particular focus on the contribution of medication administration records to existing prediction models. The study evaluates four predictive
approaches: standard logistic regression, LASSO regression, random forests, and XGBoost. Each model is developed using a baseline clinical feature derived from the Simplified Acute Physiology Score 3 (SAPS 3) and then expanded to include more features, including medication data. Performance for the models is assessed using multiple metrics, including AUROC, accuracy, Brier score, F1 score, precision, and recall, with bootstrapped confidence intervals. Contrary to expectations, the inclusion of medication variables did not lead to consistent
performance improvements in any of the modeling techniques. These findings suggest that within this dataset, SAPS 3 features alone capture the most of the variance relevant to mortality prediction, and that medication records offer
limited added predictive value. This could reflect either the comprehensive nature of SAPS 3 in summarizing patient severity or the need for more granular medication data to reveal meaningful patterns. Future research should explore alternative representations of medication exposure and investigate their potential role in prediction models. (Less) - Popular Abstract (Swedish)
- Varje minut räknas på en intensivvårdsavdelning. Att snabbt kunna avgöra vilka patienter som har störst risk att gå bort kan vara avgörande för att rädda liv och för att använda resurser på bästa sätt. Men kan moderna maskininlärnings tekniker använda sig av digitala medicinregister för att göra dagens riskbedömningar ännu bättre? I detta examensarbete undersöks om digitala medicinregister kan förbättra en av intensivvårdens mest etablerade modeller för att förutsäga dödlighet, nämligen SAPS 3.
Intensivvårdsavdelningen är den avdelning på sjukhus där de patienter i mest kritiska tillstånd omhändertas. Att förutse risken för dessa patienter är en viktig utmaning för vården för att kunna prioritera och använda resurser på ett effektivt... (More) - Varje minut räknas på en intensivvårdsavdelning. Att snabbt kunna avgöra vilka patienter som har störst risk att gå bort kan vara avgörande för att rädda liv och för att använda resurser på bästa sätt. Men kan moderna maskininlärnings tekniker använda sig av digitala medicinregister för att göra dagens riskbedömningar ännu bättre? I detta examensarbete undersöks om digitala medicinregister kan förbättra en av intensivvårdens mest etablerade modeller för att förutsäga dödlighet, nämligen SAPS 3.
Intensivvårdsavdelningen är den avdelning på sjukhus där de patienter i mest kritiska tillstånd omhändertas. Att förutse risken för dessa patienter är en viktig utmaning för vården för att kunna prioritera och använda resurser på ett effektivt sätt. I dagens sjukvård används en metod som heter SAPS 3, ett poängsystem som beräknar risken för dödlighet baserat på parametrar såsom exempelvis ålder och patientens tillstånd vid ankomsten till intensivvården.
I detta examensarbete har vi undersökt om det går att förbättra SAPS 3´s prediktion av dödlighet genom att komplettera metoden med information om vilka läkemedel patienter har fått utskrivna. Läkemedel hade potentiellt kunnat varna om underliggande sjukdomar som ej fångas i SAPS 3.
Vi analyserade data från 4 322 patienter i Region Skåne mellan 2015 och 2020, och testade fyra olika statistiska och maskininlärningsmodeller: Logistisk regression, LASSO, Random Forest och XGBoost. Varje modell testades både med och utan läkemedelsdata. Syftet var att se om medicinregistret kunde förbättra modellernas förmåga att förutsäga vilka patienter som avlider inom 30 dagar efter ankomsten till intensivvården.
Resultaten visade att SAPS 3 på egen hand gav starka prediktioner för samtliga modeller. Att lägga till information om läkemedel gav ingen signifikant förbättring av resultaten, och i vissa fall försämrades de till och med. Även om vissa modeller gav svaga indikationer på att läkemedlena kunde göra skillnad och förbättra prediktionerna var alltså detta inget som speglades i resultaten.
En viktig insikt vi lärde oss under vår uppsats som vi inte tänkte på i början, är att resultaten inte bara måste vara statistiskt starka, utan att de också måste vara praktiskt tillämpbara i vården för att göra verklig nytta. Är det av högst prioritet att inte missa en väldigt sjuk patient, eller är det viktigast för sjukhusen att spara resurser och inte lägga för mycket tid och energi på en lågrisk-patient?
Slutsatsen är att SAPS 3 är ett kraftfullt verktyg för prediktion av intensivvårds mortalitet, och att dagens tillgängliga läkemedelsdata enligt vår studie inte tillförde tillräckligt med extra information för att förbättra träffsäkerheten. I framtiden kan en mer detaljerad läkemedelsinformation och ett större dataset möjligen förbättra prestationen (Less)
Please use this url to cite or link to this publication:
http://lup.lub.lu.se/student-papers/record/9210226
- author
- Börjesson, Frans LU and Navéus, Lukas
- supervisor
- organization
- course
- FMSM01 20251
- year
- 2025
- type
- H2 - Master's Degree (Two Years)
- subject
- keywords
- ICUS, SAPS 3, eMARs, ATC codes, Mortality Prediction, Logistic Regression, Machine Learning Models
- publication/series
- Master’s Theses in Mathematical Sciences
- report number
- LUTFMS-3533-2025
- ISSN
- 1404-6342
- other publication id
- 2025:E81
- language
- English
- id
- 9210226
- date added to LUP
- 2025-08-22 10:46:36
- date last changed
- 2025-08-22 10:46:36
@misc{9210226, abstract = {{Early and accurate prediction of patient outcomes in intensive care units (ICUs) is essential to help with effective clinical decision-making and resource allocation. This thesis investigates the predictive performance of logistic regression and machine learning models for 30-day mortality following ICU admission. The thesis has a particular focus on the contribution of medication administration records to existing prediction models. The study evaluates four predictive approaches: standard logistic regression, LASSO regression, random forests, and XGBoost. Each model is developed using a baseline clinical feature derived from the Simplified Acute Physiology Score 3 (SAPS 3) and then expanded to include more features, including medication data. Performance for the models is assessed using multiple metrics, including AUROC, accuracy, Brier score, F1 score, precision, and recall, with bootstrapped confidence intervals. Contrary to expectations, the inclusion of medication variables did not lead to consistent performance improvements in any of the modeling techniques. These findings suggest that within this dataset, SAPS 3 features alone capture the most of the variance relevant to mortality prediction, and that medication records offer limited added predictive value. This could reflect either the comprehensive nature of SAPS 3 in summarizing patient severity or the need for more granular medication data to reveal meaningful patterns. Future research should explore alternative representations of medication exposure and investigate their potential role in prediction models.}}, author = {{Börjesson, Frans and Navéus, Lukas}}, issn = {{1404-6342}}, language = {{eng}}, note = {{Student Paper}}, series = {{Master’s Theses in Mathematical Sciences}}, title = {{Predicting 30-day Mortality after ICU admission, with the help of SAPS 3, Medication Records, and Machine Learning}}, year = {{2025}}, }