Machine learning methods on Swedish geological data
(2020) In LUTFMS-3401-2020 FMSM01 20202Mathematical Statistics
- Abstract
- We apply neural networks and random forest to study geological data. In part one of the thesis, a ground water level prediction task is performed with recurrent neural networks, random forest and vector autoregression. The input data consists of weather data and other ground water level time series. The MAE and R-squared is evaluated and the variation in performance of the neural networks is discussed, as is the sensitivity of the performance to the input data.
In part two, contamination of the ground water is predicted with artificial neural networks and random forest models. The input data consists of measurements of other substances and properties of the ground water as well as geochemical data from the soil and bedrock. The... (More) - We apply neural networks and random forest to study geological data. In part one of the thesis, a ground water level prediction task is performed with recurrent neural networks, random forest and vector autoregression. The input data consists of weather data and other ground water level time series. The MAE and R-squared is evaluated and the variation in performance of the neural networks is discussed, as is the sensitivity of the performance to the input data.
In part two, contamination of the ground water is predicted with artificial neural networks and random forest models. The input data consists of measurements of other substances and properties of the ground water as well as geochemical data from the soil and bedrock. The performance of the models are evaluated on MAE and R-squared for a regression setting and with F1-score and accuracy for a classification setting. We also perform a feature importance study to understand which features are most useful for making good predictions. (Less) - Popular Abstract (Swedish)
- Tekniker från maskininlärning används för att undersöka grundvatten i Sverige. I den första delen av uppsatsen används artificiella neuronnätverk och beslutsträd för att förutsäga hur hög grundvattennivån kommer vara i en brunn om en månad. För att göra detta används tidigare grundvattennivåer i brunnen och i andra närliggande brunnar. Historisk data över temperatur och nederbörd används också. I den andra delen av uppsatsen undersöker vi hur man kan förutsäga hur hög koncentration av ett föroreningsämne som finns i grundvattnet. Till detta använder vi mätningar av andra ämnen i grundvattnet på samma dag och plats. Vi använder också mätningar från marken och berggrunden nära platsen där mätningen på grundvattnet genomfördes. Vi undersöker... (More)
- Tekniker från maskininlärning används för att undersöka grundvatten i Sverige. I den första delen av uppsatsen används artificiella neuronnätverk och beslutsträd för att förutsäga hur hög grundvattennivån kommer vara i en brunn om en månad. För att göra detta används tidigare grundvattennivåer i brunnen och i andra närliggande brunnar. Historisk data över temperatur och nederbörd används också. I den andra delen av uppsatsen undersöker vi hur man kan förutsäga hur hög koncentration av ett föroreningsämne som finns i grundvattnet. Till detta använder vi mätningar av andra ämnen i grundvattnet på samma dag och plats. Vi använder också mätningar från marken och berggrunden nära platsen där mätningen på grundvattnet genomfördes. Vi undersöker också hur man kan titta på vilka av dessa ämnen som är viktigast för att maskininlärningsmodellen ska kunna förutsäga koncentrationen. (Less)
Please use this url to cite or link to this publication:
http://lup.lub.lu.se/student-papers/record/9032342
- author
- Hummel, Niklas LU
- supervisor
- organization
- alternative title
- Maskininlärningsmetoder för svensk geologisk data
- course
- FMSM01 20202
- year
- 2020
- type
- H2 - Master's Degree (Two Years)
- subject
- keywords
- Machine learning, random forest, neural networks, ground water
- publication/series
- LUTFMS-3401-2020
- report number
- 2020:E84
- ISSN
- 1404-6342
- language
- English
- id
- 9032342
- date added to LUP
- 2020-11-30 15:30:48
- date last changed
- 2020-11-30 15:30:48
@misc{9032342, abstract = {{We apply neural networks and random forest to study geological data. In part one of the thesis, a ground water level prediction task is performed with recurrent neural networks, random forest and vector autoregression. The input data consists of weather data and other ground water level time series. The MAE and R-squared is evaluated and the variation in performance of the neural networks is discussed, as is the sensitivity of the performance to the input data. In part two, contamination of the ground water is predicted with artificial neural networks and random forest models. The input data consists of measurements of other substances and properties of the ground water as well as geochemical data from the soil and bedrock. The performance of the models are evaluated on MAE and R-squared for a regression setting and with F1-score and accuracy for a classification setting. We also perform a feature importance study to understand which features are most useful for making good predictions.}}, author = {{Hummel, Niklas}}, issn = {{1404-6342}}, language = {{eng}}, note = {{Student Paper}}, series = {{LUTFMS-3401-2020}}, title = {{Machine learning methods on Swedish geological data}}, year = {{2020}}, }