VKrakowskaKonferencjaMatematyki Finansowej: SymulacjewR · KnowledgeTeam...

27
V Krakowska Konferencja Matematyki Finansowej: Symulacje w R Fundacja Rozwoju Zawodowego Quantitative Finance: Maciej Nasinski April 12, 2016

Transcript of VKrakowskaKonferencjaMatematyki Finansowej: SymulacjewR · KnowledgeTeam...

V Krakowska Konferencja MatematykiFinansowej Symulacje w R

Fundacja Rozwoju Zawodowego Quantitative Finance Maciej Nasinski

April 12 2016

R Markdown

Spis Tresci

1 Interesujace dane Finansowe i nie tylko2 Symulacje modeli VAR3 Symulacje handlu algorytmicznego na HFT

Fundacja Quantitative Finance - Kim jestesmy

Fundacja Rozwoju Zawodowego Quantitative Finance powstala wmaju 2012 jako odpowiedz na rozwijające się ilosciowe podejście do rynkoacutewfinansowych nazywane quantitative finance opierające się o wykorzystanienajnowszych osiągnięć ekonometrii inżynierii finansowej oraz informatykiprzy podejmowaniu decyzji inwestycyjnych oraz rozwiązywaniu problemoacutewbiznesowych Celem Fundacji jest wspieranie rozwoju rynku quantitativefinance w Polsce oraz zwiększanie świadomości tej branży śroacuted studentoacutewBudujemy wspoacutełpracę pomiędzy najbardziej innowacyjnymi pracodawcamiw Polsce ktoacuterzy poszukują osoacuteb kształcących się w quantitative financeoraz studentami i absolwentami

Prowadzone projekty

Cykl spotkan z praktykami rynku

umożliwia poznanie osoacuteb zawodowo związanych z rynkiem Studencidowiadują się o obecnych trendach w branży finansowej oraz najbardziejpożądanych umiejętnościach Każdy ma możliwość uczestnictwa wdyskusji a po spotkaniach nasi goście z chęcią odpowiadają na pytaniazadane w kuluarach Dotychczas gościliśmy min osoby odpowiedzialne zawdrożenie systemu UTP na polskiej giełdzie czy zarządzającychalgorytmicznymi funduszami inwestycyjnymi

Projekt L(a)unch your career

to cykl spotkań w formie kameralnego lunchu w ktoacuterym bierze udział kilkustudentoacutew oraz przedstawiciel top managementu firmy W przeciwieństwiedo publicznych wystąpień rozmowy mają kameralną formę dającstudentom szansę na zadanie dowolnego pytania Jest to roacutewnieżmożliwość na zaprezentowanie się jako potencjalny kandydat do pracykandydat do pracy

Knowledge Team

W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance

1 Interesujące dane Finansowe i nie tylko

Notowania

I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni

I Stooq - niskie limity

Naturalny popyt (modelowanie sprzedaży)

I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe

11a Google Finance

source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)

Google Finance WIG20

CZAS UNIX - strefy czasowe

11b Dane Google Finance

WSEWIG20

time

Pric

e

2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000

1900

1920

1940

1960

1980

12a Google Trends

gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)

start_date =(asDate(Systime())-1900)geo=PL)

source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

R Markdown

Spis Tresci

1 Interesujace dane Finansowe i nie tylko2 Symulacje modeli VAR3 Symulacje handlu algorytmicznego na HFT

Fundacja Quantitative Finance - Kim jestesmy

Fundacja Rozwoju Zawodowego Quantitative Finance powstala wmaju 2012 jako odpowiedz na rozwijające się ilosciowe podejście do rynkoacutewfinansowych nazywane quantitative finance opierające się o wykorzystanienajnowszych osiągnięć ekonometrii inżynierii finansowej oraz informatykiprzy podejmowaniu decyzji inwestycyjnych oraz rozwiązywaniu problemoacutewbiznesowych Celem Fundacji jest wspieranie rozwoju rynku quantitativefinance w Polsce oraz zwiększanie świadomości tej branży śroacuted studentoacutewBudujemy wspoacutełpracę pomiędzy najbardziej innowacyjnymi pracodawcamiw Polsce ktoacuterzy poszukują osoacuteb kształcących się w quantitative financeoraz studentami i absolwentami

Prowadzone projekty

Cykl spotkan z praktykami rynku

umożliwia poznanie osoacuteb zawodowo związanych z rynkiem Studencidowiadują się o obecnych trendach w branży finansowej oraz najbardziejpożądanych umiejętnościach Każdy ma możliwość uczestnictwa wdyskusji a po spotkaniach nasi goście z chęcią odpowiadają na pytaniazadane w kuluarach Dotychczas gościliśmy min osoby odpowiedzialne zawdrożenie systemu UTP na polskiej giełdzie czy zarządzającychalgorytmicznymi funduszami inwestycyjnymi

Projekt L(a)unch your career

to cykl spotkań w formie kameralnego lunchu w ktoacuterym bierze udział kilkustudentoacutew oraz przedstawiciel top managementu firmy W przeciwieństwiedo publicznych wystąpień rozmowy mają kameralną formę dającstudentom szansę na zadanie dowolnego pytania Jest to roacutewnieżmożliwość na zaprezentowanie się jako potencjalny kandydat do pracykandydat do pracy

Knowledge Team

W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance

1 Interesujące dane Finansowe i nie tylko

Notowania

I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni

I Stooq - niskie limity

Naturalny popyt (modelowanie sprzedaży)

I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe

11a Google Finance

source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)

Google Finance WIG20

CZAS UNIX - strefy czasowe

11b Dane Google Finance

WSEWIG20

time

Pric

e

2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000

1900

1920

1940

1960

1980

12a Google Trends

gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)

start_date =(asDate(Systime())-1900)geo=PL)

source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

Fundacja Quantitative Finance - Kim jestesmy

Fundacja Rozwoju Zawodowego Quantitative Finance powstala wmaju 2012 jako odpowiedz na rozwijające się ilosciowe podejście do rynkoacutewfinansowych nazywane quantitative finance opierające się o wykorzystanienajnowszych osiągnięć ekonometrii inżynierii finansowej oraz informatykiprzy podejmowaniu decyzji inwestycyjnych oraz rozwiązywaniu problemoacutewbiznesowych Celem Fundacji jest wspieranie rozwoju rynku quantitativefinance w Polsce oraz zwiększanie świadomości tej branży śroacuted studentoacutewBudujemy wspoacutełpracę pomiędzy najbardziej innowacyjnymi pracodawcamiw Polsce ktoacuterzy poszukują osoacuteb kształcących się w quantitative financeoraz studentami i absolwentami

Prowadzone projekty

Cykl spotkan z praktykami rynku

umożliwia poznanie osoacuteb zawodowo związanych z rynkiem Studencidowiadują się o obecnych trendach w branży finansowej oraz najbardziejpożądanych umiejętnościach Każdy ma możliwość uczestnictwa wdyskusji a po spotkaniach nasi goście z chęcią odpowiadają na pytaniazadane w kuluarach Dotychczas gościliśmy min osoby odpowiedzialne zawdrożenie systemu UTP na polskiej giełdzie czy zarządzającychalgorytmicznymi funduszami inwestycyjnymi

Projekt L(a)unch your career

to cykl spotkań w formie kameralnego lunchu w ktoacuterym bierze udział kilkustudentoacutew oraz przedstawiciel top managementu firmy W przeciwieństwiedo publicznych wystąpień rozmowy mają kameralną formę dającstudentom szansę na zadanie dowolnego pytania Jest to roacutewnieżmożliwość na zaprezentowanie się jako potencjalny kandydat do pracykandydat do pracy

Knowledge Team

W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance

1 Interesujące dane Finansowe i nie tylko

Notowania

I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni

I Stooq - niskie limity

Naturalny popyt (modelowanie sprzedaży)

I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe

11a Google Finance

source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)

Google Finance WIG20

CZAS UNIX - strefy czasowe

11b Dane Google Finance

WSEWIG20

time

Pric

e

2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000

1900

1920

1940

1960

1980

12a Google Trends

gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)

start_date =(asDate(Systime())-1900)geo=PL)

source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

Prowadzone projekty

Cykl spotkan z praktykami rynku

umożliwia poznanie osoacuteb zawodowo związanych z rynkiem Studencidowiadują się o obecnych trendach w branży finansowej oraz najbardziejpożądanych umiejętnościach Każdy ma możliwość uczestnictwa wdyskusji a po spotkaniach nasi goście z chęcią odpowiadają na pytaniazadane w kuluarach Dotychczas gościliśmy min osoby odpowiedzialne zawdrożenie systemu UTP na polskiej giełdzie czy zarządzającychalgorytmicznymi funduszami inwestycyjnymi

Projekt L(a)unch your career

to cykl spotkań w formie kameralnego lunchu w ktoacuterym bierze udział kilkustudentoacutew oraz przedstawiciel top managementu firmy W przeciwieństwiedo publicznych wystąpień rozmowy mają kameralną formę dającstudentom szansę na zadanie dowolnego pytania Jest to roacutewnieżmożliwość na zaprezentowanie się jako potencjalny kandydat do pracykandydat do pracy

Knowledge Team

W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance

1 Interesujące dane Finansowe i nie tylko

Notowania

I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni

I Stooq - niskie limity

Naturalny popyt (modelowanie sprzedaży)

I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe

11a Google Finance

source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)

Google Finance WIG20

CZAS UNIX - strefy czasowe

11b Dane Google Finance

WSEWIG20

time

Pric

e

2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000

1900

1920

1940

1960

1980

12a Google Trends

gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)

start_date =(asDate(Systime())-1900)geo=PL)

source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

Knowledge Team

W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance

1 Interesujące dane Finansowe i nie tylko

Notowania

I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni

I Stooq - niskie limity

Naturalny popyt (modelowanie sprzedaży)

I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe

11a Google Finance

source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)

Google Finance WIG20

CZAS UNIX - strefy czasowe

11b Dane Google Finance

WSEWIG20

time

Pric

e

2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000

1900

1920

1940

1960

1980

12a Google Trends

gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)

start_date =(asDate(Systime())-1900)geo=PL)

source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

1 Interesujące dane Finansowe i nie tylko

Notowania

I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni

I Stooq - niskie limity

Naturalny popyt (modelowanie sprzedaży)

I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe

11a Google Finance

source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)

Google Finance WIG20

CZAS UNIX - strefy czasowe

11b Dane Google Finance

WSEWIG20

time

Pric

e

2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000

1900

1920

1940

1960

1980

12a Google Trends

gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)

start_date =(asDate(Systime())-1900)geo=PL)

source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

11a Google Finance

source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)

Google Finance WIG20

CZAS UNIX - strefy czasowe

11b Dane Google Finance

WSEWIG20

time

Pric

e

2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000

1900

1920

1940

1960

1980

12a Google Trends

gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)

start_date =(asDate(Systime())-1900)geo=PL)

source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

11b Dane Google Finance

WSEWIG20

time

Pric

e

2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000

1900

1920

1940

1960

1980

12a Google Trends

gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)

start_date =(asDate(Systime())-1900)geo=PL)

source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

12a Google Trends

gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)

start_date =(asDate(Systime())-1900)geo=PL)

source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

12b Dane Google Trends

2011 2012 2013 2014 2015 2016

1020

3040

50

time

valu

e

name

wiedzmin call of duty

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

13a Wunderground

source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)

Wunderground LONDON

for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

13b Dane Wunderground

GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

14a Ściaganie danych - API

Bazowanie na pustych sekwencjach czasowych

I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe

Wykorzystanie funkcji typu try() oraz repeat() badz while()

I ogranicza błędy w komunikacji

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

21a Troacutejkąt Pascala

[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

21b Troacutejkąt Pascala

[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

22a Model VAR

I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)

I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

22b Liczba iteracji - model VAR

0

2500000

5000000

7500000

10000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba modeli VAR vs liczba zmiennych

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

22b2 Liczba regresji - model VAR

0

25000000

50000000

75000000

100000000

5 10 15 20liczba zmiennych

n_ite

r

25

50

75

100lag

Liczba regresji vs liczba zmiennych

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

22c Duża ilość zmiennych objasniających

Redukcja wymiaru macierzy

I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)

PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych

Problemy

I Interpretacja zmiennychI Niestandardowy rozkład zmiennych

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

22d MODEL VAR - Data Mining

col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)

comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)

comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10

[1] 163690

Transformacje średnia ruchoma stopy zwrotu

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))

for(g in 1nr_lag)

R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))

model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)

sum_VARlt-summary(model1$varresult$CPIPL_MM)

R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))

all_R2[1g]lt-R2all_R2[2g]lt-SERIAL

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

31a Dane Akcyjne HFT

I DLC

DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno

I GRS

GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie

I DR

DR można powiązać z polską definicją kwitu depozytowego

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1

repeatrepeat

ilt-i+1if (dane[idiffcc]gt015)

shortlt-dane[iprice1]longlt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])blt-irepeat

ilt-i+1if ( dane[idiffcc]lt(-015))

long2lt-dane[iprice1]short2lt-dane[iprice2]break

print(dane[ic(price1price2currencydiffcc)])

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

31c SYMULACJE ARBITRAŻU

I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)

I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

31d Wyniki symulacji

SYMULACJA W PLIKU SymulacjaStrategyFromposR

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

KONIECCo zyskujesz angażując się w pracę Fundacji QF

Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu

wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl

Kontakt

Maciej Nasiński Lead Analystnasinskimaciejgmailcom

Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl

Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl

BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR

Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr

Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr

Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04

httpsmranmicrosoftcomopen

httpswwwwundergroundcom

httpswwwgooglepltrendshl=pl