Advanced

Datakvalitetsarbete vid kunskapsutvinning ur databaser

Lindén, Alexander and Lagerlöv, Filip (2009)
Department of Informatics
Abstract (Swedish)
Statistik visar att data ökar exponentiellt i omfattning varje år. Det finns ett stort värde i data, speciellt för organisationer som med rätt tekniker kan använda sig av data för att kartlägga kunder eller sina egna affärsangelägenheter. För att kunna dra nytta av data i form av kunskap behöver data först sammanställas och analyseras. Ett viktigt mått vid analysering av datamängder är kvaliteten. Framförallt eftersom både djupet av data i form av kvantiteten men också bredden i form av olika typer av data ständigt växer. Vi har därför använt oss av en process som analyserar data och vars slutgiltiga mål är att skapa kunskap av data. Med hjälp av denna process har vi undersökt hur datakvalitetsarbetet bör ske parallellt med processen för... (More)
Statistik visar att data ökar exponentiellt i omfattning varje år. Det finns ett stort värde i data, speciellt för organisationer som med rätt tekniker kan använda sig av data för att kartlägga kunder eller sina egna affärsangelägenheter. För att kunna dra nytta av data i form av kunskap behöver data först sammanställas och analyseras. Ett viktigt mått vid analysering av datamängder är kvaliteten. Framförallt eftersom både djupet av data i form av kvantiteten men också bredden i form av olika typer av data ständigt växer. Vi har därför använt oss av en process som analyserar data och vars slutgiltiga mål är att skapa kunskap av data. Med hjälp av denna process har vi undersökt hur datakvalitetsarbetet bör ske parallellt med processen för att förhoppningsvis förbättra resultatet. Målet med uppsatsen har varit att först och främst undersöka hur datakvalitet kan påverka en dataanalys och den produkt som bildas. För att genomföra denna uppgift behövde vi även undersöka vilka faktorer som är speciellt intressanta för att bedöma datakvalitet. Undersökningen består även av åtkommande relationer mellan data, information och kunskap. Vi har därför behandlar hur dessa förhållanden ter sig. Med hjälp av tre olika företag som är verksamma inom områdena Artificial- och Business Intelligence har vi kunnat undersöka hur tekniken för kunskapsutvinning ur data fungerar. Vi har även fått ta del av hur datakvalitet påverkar tekniken och hur arbetet med att förbättra datakvalitet går till. De underlag som vi fått förmedlat från företagen har tillsammans med ett teoretiskt ramverk och våra egna uppfattningar bildat resultatet av undersökningen. Förutom att fastställa att datakvalitet är ett viktigt och problemartat område inom analyser av stora datamängder har vi även föreslagit ett antal faktorer som är viktiga vid bedömning av datakvalitet. Våra iakttagelser har även resulterat i en modell beskrivande hur datakvalitet bör förebyggas löpande under analyseringen för att skapa ett informativt och säkert resultat. (Less)
Please use this url to cite or link to this publication:
author
Lindén, Alexander and Lagerlöv, Filip
supervisor
organization
year
type
M2 - Bachelor Degree
subject
keywords
KDD, datakvalitet, datadimension, DM, mönster, Informatics, systems theory, Informatik, systemteori
language
Swedish
id
1468131
date added to LUP
2009-06-30 00:00:00
date last changed
2010-08-03 10:52:43
@misc{1468131,
  abstract     = {Statistik visar att data ökar exponentiellt i omfattning varje år. Det finns ett stort värde i data, speciellt för organisationer som med rätt tekniker kan använda sig av data för att kartlägga kunder eller sina egna affärsangelägenheter. För att kunna dra nytta av data i form av kunskap behöver data först sammanställas och analyseras. Ett viktigt mått vid analysering av datamängder är kvaliteten. Framförallt eftersom både djupet av data i form av kvantiteten men också bredden i form av olika typer av data ständigt växer. Vi har därför använt oss av en process som analyserar data och vars slutgiltiga mål är att skapa kunskap av data. Med hjälp av denna process har vi undersökt hur datakvalitetsarbetet bör ske parallellt med processen för att förhoppningsvis förbättra resultatet. Målet med uppsatsen har varit att först och främst undersöka hur datakvalitet kan påverka en dataanalys och den produkt som bildas. För att genomföra denna uppgift behövde vi även undersöka vilka faktorer som är speciellt intressanta för att bedöma datakvalitet. Undersökningen består även av åtkommande relationer mellan data, information och kunskap. Vi har därför behandlar hur dessa förhållanden ter sig. Med hjälp av tre olika företag som är verksamma inom områdena Artificial- och Business Intelligence har vi kunnat undersöka hur tekniken för kunskapsutvinning ur data fungerar. Vi har även fått ta del av hur datakvalitet påverkar tekniken och hur arbetet med att förbättra datakvalitet går till. De underlag som vi fått förmedlat från företagen har tillsammans med ett teoretiskt ramverk och våra egna uppfattningar bildat resultatet av undersökningen. Förutom att fastställa att datakvalitet är ett viktigt och problemartat område inom analyser av stora datamängder har vi även föreslagit ett antal faktorer som är viktiga vid bedömning av datakvalitet. Våra iakttagelser har även resulterat i en modell beskrivande hur datakvalitet bör förebyggas löpande under analyseringen för att skapa ett informativt och säkert resultat.},
  author       = {Lindén, Alexander and Lagerlöv, Filip},
  keyword      = {KDD,datakvalitet,datadimension,DM,mönster,Informatics, systems theory,Informatik, systemteori},
  language     = {swe},
  note         = {Student Paper},
  title        = {Datakvalitetsarbete vid kunskapsutvinning ur databaser},
  year         = {2009},
}