Advanced

Trend analysis of custome rbehavior and prediction of future actions

Hultkvist, Mikael and Blohmé, Emil (2017) FMS820 20171
Mathematical Statistics
Abstract
E-commerceisgrowingwithinalotsofareas. Itcreatesnewchallengesbutalsoalot of possibilities for the companies. In this thesis we will try to understand customer behaviorthroughaparametricmodel,namelylogisticregression. Theavailabledata isprovidedbyabigcompanyinSwedenwhichissellingproductsthatcanbebought weekly. Besidesunderstandingcustomers’behaviorthemodelintendtoworkasatool indecisionmaking. Subjectssuchasgeneralizedlinearmodels,selforganizingmaps and K-means will be touched upon. The final goal is to predict whether a customer will continue purchasing products in the future and to find out the reasons why they quit. A simple age clustering is made before the final modeling leading to several models, one for each age cluster. The models... (More)
E-commerceisgrowingwithinalotsofareas. Itcreatesnewchallengesbutalsoalot of possibilities for the companies. In this thesis we will try to understand customer behaviorthroughaparametricmodel,namelylogisticregression. Theavailabledata isprovidedbyabigcompanyinSwedenwhichissellingproductsthatcanbebought weekly. Besidesunderstandingcustomers’behaviorthemodelintendtoworkasatool indecisionmaking. Subjectssuchasgeneralizedlinearmodels,selforganizingmaps and K-means will be touched upon. The final goal is to predict whether a customer will continue purchasing products in the future and to find out the reasons why they quit. A simple age clustering is made before the final modeling leading to several models, one for each age cluster. The models indicate that there are differences in thebehaviorbetweenthedifferentclusters. Despitethedifferences,amodelbasedon allclusters isasgood asindividualmodels foreachcluster. Themodelsmanaged to predictthecorrectanswerabout80%ofthetime. (Less)
Popular Abstract (Swedish)
E-handeln växer sig bara starkare och starkare. För att företagen ska kunna ge en så bra upplevelse som möjligt krävs det att man förstår sig på hur kunderna beter sig. Vi har skapat en matematisk modell som i 80 % av fallen kan förutspå hur en kund kommer agera i framtiden. Länge har butiksförsäljning varit den dominanta inkomstkällan för affärskedjorna, men senaste åren har E-handeln bara vuxit sig starkare och starkare. I en så konkurrensutsatt miljö som många av dagens affärskedjor lever i gäller det att ligga steget före alla andra. Med en ökad E-handel tillkommer många nya utmaningar för affärskedjorna,menocksåmångamöjligheter. För att kunderna ska få en så bra shoppingupplevelse som möjligt är det viktigt för affärskedjorna att förstå... (More)
E-handeln växer sig bara starkare och starkare. För att företagen ska kunna ge en så bra upplevelse som möjligt krävs det att man förstår sig på hur kunderna beter sig. Vi har skapat en matematisk modell som i 80 % av fallen kan förutspå hur en kund kommer agera i framtiden. Länge har butiksförsäljning varit den dominanta inkomstkällan för affärskedjorna, men senaste åren har E-handeln bara vuxit sig starkare och starkare. I en så konkurrensutsatt miljö som många av dagens affärskedjor lever i gäller det att ligga steget före alla andra. Med en ökad E-handel tillkommer många nya utmaningar för affärskedjorna,menocksåmångamöjligheter. För att kunderna ska få en så bra shoppingupplevelse som möjligt är det viktigt för affärskedjorna att förstå hur kunder beter sig. Via E-handeln kan man till exempel enkelt lagra information om alla kunder och hålla koll på vad som köps och hur frekvent kunderna gör sina köp. Genom att använda den lagrade information har vi försökt skapa en matematisk modell som ska förutspå hur en kund kommer agera i framtiden.
För att kunna ta fram en matematisk modell så måste man fundera över vad det är som gör att kunder köper en produkt eller inte köper en produkt och såklart vilken data som är tillgänglig. Företaget som vi har fått data ifrån säljer produkter som man köper veckovis, men inte nödvändigtvis varje vecka. Att hitta mönster i enskilda kunders köpbeteende visade sig vara förhållandevis enkelt. Det svåra var att hitta varför beteendemönstren bröts. Händelser som vi har tittat på är köp tidigare veckor, säsongsfaktorer, rabatt på senaste köp, reklamationer, och utebliven leverans.
Viharocksåtittatpåomdetfinnsmönsteriolika sorters kundgrupper. Det vi fokuserade mest på var kunder i olika åldrar. En sak man bland annat kunde se var att det skilde sig hur kunder i olika åldersgrupper handlade under säsong. De äldre slutar i en högre grad handla under klassiska säsonger så som jul, påsk och under sommarveckorna jämfört med de yngre kunderna som inte påverkas lika mycket utan fortsätter handla som vanligt. Trots vissa skillnader så blir den sortens uppdelning för generaliserande och förbättrar inte resultatet särskilt mycket.
En avgörande faktor som tyvärr har satt käppar i hjulet i vårt modellerande är bristfällig data. För att en matematisk modell ska bli stabil och korrekt krävs det att det finns mycket data ochattkvalitetenärhög. Medhögkvalitetmenar vi så få saknade värden som möjligt och att datan blir insamlad på ett korrekt sätt. Vår modell lyckas förutspår hur kunden kommer agera i ungefär 80 % av fallen. Användning av modellen i dagsläget tror vi kräver mer arbete än vad det ger nytta. Trots att vår modell har ganska hög träffsäkerhet är det väldigt svårt att veta vad som förändrar en kunds beteende. Det finns många faktorer som inte ens är möjliga att mäta. Hur en kund agerar kan bero på allt ifrån att hen glömmer beställa hem produkten till att hen ska på en tre veckor lång smekmånad på Bahamas. (Less)
Please use this url to cite or link to this publication:
author
Hultkvist, Mikael and Blohmé, Emil
supervisor
organization
course
FMS820 20171
year
type
H2 - Master's Degree (Two Years)
subject
keywords
E-commerce, Predictions, Modelevaluation, Logisticregression, Clustering.
language
English
id
8915329
date added to LUP
2017-06-14 10:35:36
date last changed
2017-06-14 10:35:36
@misc{8915329,
  abstract     = {E-commerceisgrowingwithinalotsofareas. Itcreatesnewchallengesbutalsoalot of possibilities for the companies. In this thesis we will try to understand customer behaviorthroughaparametricmodel,namelylogisticregression. Theavailabledata isprovidedbyabigcompanyinSwedenwhichissellingproductsthatcanbebought weekly. Besidesunderstandingcustomers’behaviorthemodelintendtoworkasatool indecisionmaking. Subjectssuchasgeneralizedlinearmodels,selforganizingmaps and K-means will be touched upon. The final goal is to predict whether a customer will continue purchasing products in the future and to find out the reasons why they quit. A simple age clustering is made before the final modeling leading to several models, one for each age cluster. The models indicate that there are differences in thebehaviorbetweenthedifferentclusters. Despitethedifferences,amodelbasedon allclusters isasgood asindividualmodels foreachcluster. Themodelsmanaged to predictthecorrectanswerabout80%ofthetime.},
  author       = {Hultkvist, Mikael and Blohmé, Emil},
  keyword      = {E-commerce,Predictions,Modelevaluation,Logisticregression,Clustering.},
  language     = {eng},
  note         = {Student Paper},
  title        = {Trend analysis of custome rbehavior and prediction of future actions},
  year         = {2017},
}