Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Machine learning methods on Swedish geological data

Hummel, Niklas LU (2020) In LUTFMS-3401-2020 FMSM01 20202
Mathematical Statistics
Abstract
We apply neural networks and random forest to study geological data. In part one of the thesis, a ground water level prediction task is performed with recurrent neural networks, random forest and vector autoregression. The input data consists of weather data and other ground water level time series. The MAE and R-squared is evaluated and the variation in performance of the neural networks is discussed, as is the sensitivity of the performance to the input data.
In part two, contamination of the ground water is predicted with artificial neural networks and random forest models. The input data consists of measurements of other substances and properties of the ground water as well as geochemical data from the soil and bedrock. The... (More)
We apply neural networks and random forest to study geological data. In part one of the thesis, a ground water level prediction task is performed with recurrent neural networks, random forest and vector autoregression. The input data consists of weather data and other ground water level time series. The MAE and R-squared is evaluated and the variation in performance of the neural networks is discussed, as is the sensitivity of the performance to the input data.
In part two, contamination of the ground water is predicted with artificial neural networks and random forest models. The input data consists of measurements of other substances and properties of the ground water as well as geochemical data from the soil and bedrock. The performance of the models are evaluated on MAE and R-squared for a regression setting and with F1-score and accuracy for a classification setting. We also perform a feature importance study to understand which features are most useful for making good predictions. (Less)
Popular Abstract (Swedish)
Tekniker från maskininlärning används för att undersöka grundvatten i Sverige. I den första delen av uppsatsen används artificiella neuronnätverk och beslutsträd för att förutsäga hur hög grundvattennivån kommer vara i en brunn om en månad. För att göra detta används tidigare grundvattennivåer i brunnen och i andra närliggande brunnar. Historisk data över temperatur och nederbörd används också. I den andra delen av uppsatsen undersöker vi hur man kan förutsäga hur hög koncentration av ett föroreningsämne som finns i grundvattnet. Till detta använder vi mätningar av andra ämnen i grundvattnet på samma dag och plats. Vi använder också mätningar från marken och berggrunden nära platsen där mätningen på grundvattnet genomfördes. Vi undersöker... (More)
Tekniker från maskininlärning används för att undersöka grundvatten i Sverige. I den första delen av uppsatsen används artificiella neuronnätverk och beslutsträd för att förutsäga hur hög grundvattennivån kommer vara i en brunn om en månad. För att göra detta används tidigare grundvattennivåer i brunnen och i andra närliggande brunnar. Historisk data över temperatur och nederbörd används också. I den andra delen av uppsatsen undersöker vi hur man kan förutsäga hur hög koncentration av ett föroreningsämne som finns i grundvattnet. Till detta använder vi mätningar av andra ämnen i grundvattnet på samma dag och plats. Vi använder också mätningar från marken och berggrunden nära platsen där mätningen på grundvattnet genomfördes. Vi undersöker också hur man kan titta på vilka av dessa ämnen som är viktigast för att maskininlärningsmodellen ska kunna förutsäga koncentrationen. (Less)
Please use this url to cite or link to this publication:
author
Hummel, Niklas LU
supervisor
organization
alternative title
Maskininlärningsmetoder för svensk geologisk data
course
FMSM01 20202
year
type
H2 - Master's Degree (Two Years)
subject
keywords
Machine learning, random forest, neural networks, ground water
publication/series
LUTFMS-3401-2020
report number
2020:E84
ISSN
1404-6342
language
English
id
9032342
date added to LUP
2020-11-30 15:30:48
date last changed
2020-11-30 15:30:48
@misc{9032342,
  abstract     = {{We apply neural networks and random forest to study geological data. In part one of the thesis, a ground water level prediction task is performed with recurrent neural networks, random forest and vector autoregression. The input data consists of weather data and other ground water level time series. The MAE and R-squared is evaluated and the variation in performance of the neural networks is discussed, as is the sensitivity of the performance to the input data.
In part two, contamination of the ground water is predicted with artificial neural networks and random forest models. The input data consists of measurements of other substances and properties of the ground water as well as geochemical data from the soil and bedrock. The performance of the models are evaluated on MAE and R-squared for a regression setting and with F1-score and accuracy for a classification setting. We also perform a feature importance study to understand which features are most useful for making good predictions.}},
  author       = {{Hummel, Niklas}},
  issn         = {{1404-6342}},
  language     = {{eng}},
  note         = {{Student Paper}},
  series       = {{LUTFMS-3401-2020}},
  title        = {{Machine learning methods on Swedish geological data}},
  year         = {{2020}},
}