Advanced

Data transformation using linked data ontologies

Rolander, Gunnar LU (2017) In Thesis in geographical information technics EXTM05 20162
Dept of Physical Geography and Ecosystem Science
Surveying (M.Sc.Eng.)
Abstract
Interoperability is a sought after quality in most software. One way to
increase interoperability is to make transformation of data between formats
easier. Several transformation tools exists and many utilizes the Extract,
Transform, Load-process to perform the transformations.
The transformation part of the process can be done in several different
ways. Using a lookup table to arrange the underlying structure of data is
one way which is commonly used.
This study tests a method of transforming geodata using the semantic
web technologies to create the underlying data structure. The Semantic Web
is a concept of an internet which is readable by both man and machine, by
giving data semantic meanings that computers can understand. A... (More)
Interoperability is a sought after quality in most software. One way to
increase interoperability is to make transformation of data between formats
easier. Several transformation tools exists and many utilizes the Extract,
Transform, Load-process to perform the transformations.
The transformation part of the process can be done in several different
ways. Using a lookup table to arrange the underlying structure of data is
one way which is commonly used.
This study tests a method of transforming geodata using the semantic
web technologies to create the underlying data structure. The Semantic Web
is a concept of an internet which is readable by both man and machine, by
giving data semantic meanings that computers can understand. A test is
made where these technologies are applied in unison with a tool using the
Extract, Transform, Load (ETL) process to transform geodata. The result is
compared to a transformation done using the same ETL tool with a lookup
table approach.
The test of the method was successful. It is possible to use the semantic
web technologies when transforming geodata in ETL tools.
While the method tested works, it’s quite unwieldy and thus unlikely
to replace current methods used in transformations. It could possibly be
extended to utilize computer reasoning to a larger degree and used to
determine the transformation parameters by itself. It could also be of use as
a link between regular geodata and linked web geodata. (Less)
Popular Abstract (Swedish)
Anta att du har en viss typ av datafil, men för att ditt program ska fungera så måste din data vara i en annan typ av fil. Du har ingen aning hur filerna är uppbyggda eller hur du ska göra om dem så att ditt program kan använda dem. Den här studien har tagit första steget mot att filöversättningsverktyg själva ska kunna komma fram till hur en datafil bör översättas, så att användaren slipper involveras i det.
Ett vanligt förekommande problem i dagens digitala samhälle är att program inte stödjer vissa typer av datafiler. Ofta har det att göra med att de som tillverkar programmen enbart vill att man ska använda andra program som de utvecklat, eller att utvecklare har olika åsikter om vilket som är det bästa sättet att lagra data. Det kan... (More)
Anta att du har en viss typ av datafil, men för att ditt program ska fungera så måste din data vara i en annan typ av fil. Du har ingen aning hur filerna är uppbyggda eller hur du ska göra om dem så att ditt program kan använda dem. Den här studien har tagit första steget mot att filöversättningsverktyg själva ska kunna komma fram till hur en datafil bör översättas, så att användaren slipper involveras i det.
Ett vanligt förekommande problem i dagens digitala samhälle är att program inte stödjer vissa typer av datafiler. Ofta har det att göra med att de som tillverkar programmen enbart vill att man ska använda andra program som de utvecklat, eller att utvecklare har olika åsikter om vilket som är det bästa sättet att lagra data. Det kan också handla om att olika branscher använder olika filtyper av gammal vana, eller att vissa filtyper passar vissa typer av data bättre.
Ett sätt att kringgå problemet är att översätta filerna till ett format som programmet stödjer. Det finns program som endast är till för att översätta filer. För att översätta en datafil från ett format till ett annat krävs det att man vet hur formaten är strukturerade. Man behöver också veta vilka ändringar som behöver göras i datafilen för att den ska passa in i det nya formatets struktur. Generellt sett sköter översättningsprogrammet det mesta av det här själv, men det kan ibland behöva lite extra information om det ska utföra svåra översättningar, exempelvis mellan två väldigt olika format. Den här informationen behöver då matas in manuellt.
Om man hade kunnat utveckla en metod som tog fram delar av informationen som krävdes med hjälp av datorlogik skulle det krävas mindre manuell interaktion från en faktisk människa, vilket skulle leda till att det blev lättare att översätta data. Detta skulle i sin tur kunna leda till att fler program skulle kunna arbeta med samma data utan att ställa till besvär för användaren.
Det här examensarbetet har handlat om att undersöka en metod som till viss del ska minska den manuella interaktionen genom att själv resonera sig fram till hur man bäst översätter mellan två format. Metoden går ut på att man använder en teknik, länkad data, vars ursprungliga syfte var att ge data på internet en underförstådd mening som även datorer och maskiner skulle kunna förstå, för att styra översättningsprogrammet. Tyngdpunkten i arbetet har varit att koppla ihop översättningsprogrammet och tekniken så att de kan kommunicera med varandra.
Resultatet från studien var att det är möjligt, men komplext, att använda länkad data för att styra översättningsprogrammet. Framför allt var det ingen större förbättring i jämförelse med en annan vanlig metod som används. Eventuellt skulle vidare forskning och utveckling på området kunna leda till en förbättring av metoden. (Less)
Please use this url to cite or link to this publication:
author
Rolander, Gunnar LU
supervisor
organization
alternative title
Datatransformation med hjälp av länkade data
course
EXTM05 20162
year
type
H2 - Master's Degree (Two Years)
subject
keywords
linked data, Geographical Information Systems (GIS), semantic web, ontologies, data transformation
publication/series
Thesis in geographical information technics
report number
23
language
English
additional info
External supervisor: Ulf Månsson, Sweco Position, Malmö
id
8905534
date added to LUP
2017-06-19 15:37:55
date last changed
2017-06-19 15:37:55
@misc{8905534,
 abstract   = {Interoperability is a sought after quality in most software. One way to
increase interoperability is to make transformation of data between formats
easier. Several transformation tools exists and many utilizes the Extract,
Transform, Load-process to perform the transformations.
The transformation part of the process can be done in several different
ways. Using a lookup table to arrange the underlying structure of data is
one way which is commonly used.
This study tests a method of transforming geodata using the semantic
web technologies to create the underlying data structure. The Semantic Web
is a concept of an internet which is readable by both man and machine, by
giving data semantic meanings that computers can understand. A test is
made where these technologies are applied in unison with a tool using the
Extract, Transform, Load (ETL) process to transform geodata. The result is
compared to a transformation done using the same ETL tool with a lookup
table approach.
The test of the method was successful. It is possible to use the semantic
web technologies when transforming geodata in ETL tools.
While the method tested works, it’s quite unwieldy and thus unlikely
to replace current methods used in transformations. It could possibly be
extended to utilize computer reasoning to a larger degree and used to
determine the transformation parameters by itself. It could also be of use as
a link between regular geodata and linked web geodata.},
 author    = {Rolander, Gunnar},
 keyword   = {linked data,Geographical Information Systems (GIS),semantic web,ontologies,data transformation},
 language   = {eng},
 note     = {Student Paper},
 series    = {Thesis in geographical information technics},
 title    = {Data transformation using linked data ontologies},
 year     = {2017},
}