Advanced

Forecasting commodity futures using Principal Component Analysis and Copula

Jacobsson, Martin (2015) FMS820 20151
Mathematical Statistics
Abstract
The ever ongoing battle to beat the market is in this thesis fought with
the help of mathematics with a way to reduce the information to its core.
It is called PCA, Principal Component Analysis. This is used to build a
model of future commodity prices. To assist PCA, Copula is used - a sort
of mathematical glue which can bring multiple distributions together and
represented as one.
The data used is 5 years of prices for Brent Oil, WTI Oil, Gold, Copper
and Aluminium. The model parameters are tted to 2.5 years of data and
then tested on the remaining 2.5 years.
MLE, Maximum Likelihood Estimation, was used for parameter estimation
and distributions that were found tting were logistic and Student's T
distribution
Cramer-von Mises... (More)
The ever ongoing battle to beat the market is in this thesis fought with
the help of mathematics with a way to reduce the information to its core.
It is called PCA, Principal Component Analysis. This is used to build a
model of future commodity prices. To assist PCA, Copula is used - a sort
of mathematical glue which can bring multiple distributions together and
represented as one.
The data used is 5 years of prices for Brent Oil, WTI Oil, Gold, Copper
and Aluminium. The model parameters are tted to 2.5 years of data and
then tested on the remaining 2.5 years.
MLE, Maximum Likelihood Estimation, was used for parameter estimation
and distributions that were found tting were logistic and Student's T
distribution
Cramer-von Mises tests were used to determine that T Copula was the
most suitable Copula.
The main results are that the mathematical estimations t well and
prot can be generated, but with a low Sharpe Ratio. (Less)
Popular Abstract (Swedish)
Introduktion
Inom nansbranschen sa krigar handlare dagligen om att overlista deras
ende - marknaden. Men, med dagens kommunikationsmedel sa blir handlarna
overosta med information och for att kunna salla bland all den informationen
- sa kan matematik anvandas. Denna studien forsoker ta ut
den mest vitala informationen man kan fa fran historisk data - och bygga
en modell av hur man tror priserna kommer att forandras. De matematiska
hjalpmedlena som anvands kallas principalkomponentanalys och copula. For
att sedan se hur val modellen utfaller, anvands framforallt tva handelsstrategier
- "atergang till medelvarde" och "momentum".
Historia
Studien inriktar sig generellt pa ravaror och specikt pa olja, guld, koppar
och aluminium.... (More)
Introduktion
Inom nansbranschen sa krigar handlare dagligen om att overlista deras
ende - marknaden. Men, med dagens kommunikationsmedel sa blir handlarna
overosta med information och for att kunna salla bland all den informationen
- sa kan matematik anvandas. Denna studien forsoker ta ut
den mest vitala informationen man kan fa fran historisk data - och bygga
en modell av hur man tror priserna kommer att forandras. De matematiska
hjalpmedlena som anvands kallas principalkomponentanalys och copula. For
att sedan se hur val modellen utfaller, anvands framforallt tva handelsstrategier
- "atergang till medelvarde" och "momentum".
Historia
Studien inriktar sig generellt pa ravaror och specikt pa olja, guld, koppar
och aluminium. Sjalva handeln med ravaror stracker sig
era artusenden
tillbaka. Man far ga tillbaka till den summeriska civilisationen, cirka ar
4500-4000 f.kr., for att nna de forsta tecknen pa ravaruhandel. Da anvandes
lertavlor for att visa pa exempelvis hur manga getter som skulle levereras
vid en viss tidpunkt.
Ravaruhandel
Nufortiden slipper man skriva kontrakt pa lertavlor och en leverans av guld
eller majs ar latt tillgangligt fran din dator. Det vanligaste sattet att handla
med ravaror ar att anvanda en typ av kontrakt som kallas futures. Med
dessa specieras exakt hur mycket av en viss ravara skall levereras pa en
viss tidpunkt for ett visst pris. Priset varierar och beror framst pa utbud
och efterfragan men mangden och tidpunkten for leverans forblir detsamma.
Principalkomponentanalys
Sjalva "sallandet av information" kallas i detta fall principalkomponentanalys.
Denna analys gors for att fa ut de variabler som kan forklara hur
prissvangningarna pa ravarorna sker. Variablerna optimeras pa den forsta
halvan av datan och appliceras sedan pa den andra halvan. Denna metoden,
da man optimerar pa forsta halvan och testar pa andra halvan, ar valdigt
vanlig inom modellering av handelsstrategier. Detta da om man optimerar
pa hela dataperioden, sa kan man latt "overoptimera" sina resultat och anpassa
sin modell till det som har varit istallet for att forsoka skapa nagot
som haller i framtiden.
1
Copula
For att modellera de olika ravarornas priser sa anpassas de till olika slags
fordelningar. Dessa fordelningar kan vara individuella for varje ravara och
"klistras" sedan samman med copula. Det vill saga att man ser hur fordelningarna
forhaller sig till varandra, hur de "klistras" samman. Detta klister
kan man sedan anvanda for att forutspa framtida prissvangningar.
Aterg
ang till medelv
arde
En av de vanligaste handelsstrategierna som nns kallas pa engelska mean-
reversion (atergang till medelvarde pa svenska). Denna strategin bygger pa
att man tror att alla priser kommer att jamna ut sig till sist och aterga
till det priset som det har varit(dess gamla medelvarde). Men, detta ar en
strategi som inte tar nagon beaktan i de manskliga faktorer som kan nnas
pa borser.
Momentum
Momentum ar den strategi som tar de mer mjuka vardena i beaktan, sasom
vissa typer av
ockbeteenden (folk koper nar andra koper och vice versa da
folk saljer). Detta kanaterspeglas i matematik och ar i princip den motsatta
strategin till "atergang till medelvarde". Men i studien balanserar dessa tva
strategier varandra och beroende pa hur de historiska prissvangningarna
har sett ut sa dominerar antingen den ena eller den andra strategin. Detta
fram till da "copula-klistret" trader in. Da kan klistret bli den an mer
dominerande faktorn och bestamma handelsstrategi.
Resultat
Da endast principalkomponentanalysen med sina tillhorande handelsstrategier
"atergang till medelvarde" och momentum tas i beaktan sa genereras
ingen vinst. Detta kan bero pa manga orsaker men som oftast i matematiken
sa vill man utoka mangden data. Om studien gjorts pa
er antal ravaror sa
ar det mojligt att denna del visat ett battre resultat. Nar sedan "copulaklistret"
blir en del av modellen, kan vinst genereras. Den ar huruvida inte
sa stor men det forefaller att modellen har potential.
Nar samtliga handelsstrategier har tagits i beaktan in i modellen sa visas
alltsa att man kan tjana pengar pa modellen. Tankarna och iderna som modellen
bygger pa kan alltsa forhoppningsvis hjalpa nagon handlare i slaget
mot marknaden. (Less)
Please use this url to cite or link to this publication:
author
Jacobsson, Martin
supervisor
organization
course
FMS820 20151
year
type
H2 - Master's Degree (Two Years)
subject
keywords
PCA, Copula, Mean-reversion, Momentum, Elliptical copulas, Maximum Likelihood, Cramer-von Mises, Sharpe Ratio.
language
English
id
5426542
date added to LUP
2015-05-22 14:20:42
date last changed
2016-02-04 04:02:48
@misc{5426542,
  abstract     = {The ever ongoing battle to beat the market is in this thesis fought with
the help of mathematics with a way to reduce the information to its core.
It is called PCA, Principal Component Analysis. This is used to build a
model of future commodity prices. To assist PCA, Copula is used - a sort
of mathematical glue which can bring multiple distributions together and
represented as one.
The data used is 5 years of prices for Brent Oil, WTI Oil, Gold, Copper
and Aluminium. The model parameters are tted to 2.5 years of data and
then tested on the remaining 2.5 years.
MLE, Maximum Likelihood Estimation, was used for parameter estimation
and distributions that were found tting were logistic and Student's T
distribution
Cramer-von Mises tests were used to determine that T Copula was the
most suitable Copula.
The main results are that the mathematical estimations t well and
prot can be generated, but with a low Sharpe Ratio.},
  author       = {Jacobsson, Martin},
  keyword      = {PCA,Copula,Mean-reversion,Momentum,Elliptical copulas,Maximum Likelihood,Cramer-von Mises,Sharpe Ratio.},
  language     = {eng},
  note         = {Student Paper},
  title        = {Forecasting commodity futures using Principal Component Analysis and Copula},
  year         = {2015},
}