Datakvalitetsarbete vid kunskapsutvinning ur databaser
(2009)Department of Informatics
- Abstract (Swedish)
- Statistik visar att data ökar exponentiellt i omfattning varje år. Det finns ett stort värde i data, speciellt för organisationer som med rätt tekniker kan använda sig av data för att kartlägga kunder eller sina egna affärsangelägenheter. För att kunna dra nytta av data i form av kunskap behöver data först sammanställas och analyseras. Ett viktigt mått vid analysering av datamängder är kvaliteten. Framförallt eftersom både djupet av data i form av kvantiteten men också bredden i form av olika typer av data ständigt växer. Vi har därför använt oss av en process som analyserar data och vars slutgiltiga mål är att skapa kunskap av data. Med hjälp av denna process har vi undersökt hur datakvalitetsarbetet bör ske parallellt med processen för... (More)
- Statistik visar att data ökar exponentiellt i omfattning varje år. Det finns ett stort värde i data, speciellt för organisationer som med rätt tekniker kan använda sig av data för att kartlägga kunder eller sina egna affärsangelägenheter. För att kunna dra nytta av data i form av kunskap behöver data först sammanställas och analyseras. Ett viktigt mått vid analysering av datamängder är kvaliteten. Framförallt eftersom både djupet av data i form av kvantiteten men också bredden i form av olika typer av data ständigt växer. Vi har därför använt oss av en process som analyserar data och vars slutgiltiga mål är att skapa kunskap av data. Med hjälp av denna process har vi undersökt hur datakvalitetsarbetet bör ske parallellt med processen för att förhoppningsvis förbättra resultatet. Målet med uppsatsen har varit att först och främst undersöka hur datakvalitet kan påverka en dataanalys och den produkt som bildas. För att genomföra denna uppgift behövde vi även undersöka vilka faktorer som är speciellt intressanta för att bedöma datakvalitet. Undersökningen består även av åtkommande relationer mellan data, information och kunskap. Vi har därför behandlar hur dessa förhållanden ter sig. Med hjälp av tre olika företag som är verksamma inom områdena Artificial- och Business Intelligence har vi kunnat undersöka hur tekniken för kunskapsutvinning ur data fungerar. Vi har även fått ta del av hur datakvalitet påverkar tekniken och hur arbetet med att förbättra datakvalitet går till. De underlag som vi fått förmedlat från företagen har tillsammans med ett teoretiskt ramverk och våra egna uppfattningar bildat resultatet av undersökningen. Förutom att fastställa att datakvalitet är ett viktigt och problemartat område inom analyser av stora datamängder har vi även föreslagit ett antal faktorer som är viktiga vid bedömning av datakvalitet. Våra iakttagelser har även resulterat i en modell beskrivande hur datakvalitet bör förebyggas löpande under analyseringen för att skapa ett informativt och säkert resultat. (Less)
Please use this url to cite or link to this publication:
http://lup.lub.lu.se/student-papers/record/1468131
- author
- Lindén, Alexander and Lagerlöv, Filip
- supervisor
- organization
- year
- 2009
- type
- M2 - Bachelor Degree
- subject
- keywords
- KDD, datakvalitet, datadimension, DM, mönster, Informatics, systems theory, Informatik, systemteori
- language
- Swedish
- id
- 1468131
- date added to LUP
- 2009-06-30 00:00:00
- date last changed
- 2010-08-03 10:52:43
@misc{1468131, abstract = {{Statistik visar att data ökar exponentiellt i omfattning varje år. Det finns ett stort värde i data, speciellt för organisationer som med rätt tekniker kan använda sig av data för att kartlägga kunder eller sina egna affärsangelägenheter. För att kunna dra nytta av data i form av kunskap behöver data först sammanställas och analyseras. Ett viktigt mått vid analysering av datamängder är kvaliteten. Framförallt eftersom både djupet av data i form av kvantiteten men också bredden i form av olika typer av data ständigt växer. Vi har därför använt oss av en process som analyserar data och vars slutgiltiga mål är att skapa kunskap av data. Med hjälp av denna process har vi undersökt hur datakvalitetsarbetet bör ske parallellt med processen för att förhoppningsvis förbättra resultatet. Målet med uppsatsen har varit att först och främst undersöka hur datakvalitet kan påverka en dataanalys och den produkt som bildas. För att genomföra denna uppgift behövde vi även undersöka vilka faktorer som är speciellt intressanta för att bedöma datakvalitet. Undersökningen består även av åtkommande relationer mellan data, information och kunskap. Vi har därför behandlar hur dessa förhållanden ter sig. Med hjälp av tre olika företag som är verksamma inom områdena Artificial- och Business Intelligence har vi kunnat undersöka hur tekniken för kunskapsutvinning ur data fungerar. Vi har även fått ta del av hur datakvalitet påverkar tekniken och hur arbetet med att förbättra datakvalitet går till. De underlag som vi fått förmedlat från företagen har tillsammans med ett teoretiskt ramverk och våra egna uppfattningar bildat resultatet av undersökningen. Förutom att fastställa att datakvalitet är ett viktigt och problemartat område inom analyser av stora datamängder har vi även föreslagit ett antal faktorer som är viktiga vid bedömning av datakvalitet. Våra iakttagelser har även resulterat i en modell beskrivande hur datakvalitet bör förebyggas löpande under analyseringen för att skapa ett informativt och säkert resultat.}}, author = {{Lindén, Alexander and Lagerlöv, Filip}}, language = {{swe}}, note = {{Student Paper}}, title = {{Datakvalitetsarbete vid kunskapsutvinning ur databaser}}, year = {{2009}}, }