20170928 why r_r jako główna platforma do zaawansowanej analityki w enterprise

Post on 22-Jan-2018

68 views 2 download

Transcript of 20170928 why r_r jako główna platforma do zaawansowanej analityki w enterprise

R jako główna platforma do zaawansowanej analityki w

EnterpriseWit Jakuczun,

WLOG Solutions2017-09-28

Copyright (c) WLOG Solutions 2

Biznes nie rozmawia o zaawansowanej analityce.

Copyright (c) WLOG Solutions 3

Biznes nie rozmawia o platformie analitycznej.

Copyright (c) WLOG Solutions 4

Biznes rozmawia o tym jak sprawnie zarabiać pieniądze.

Copyright (c) WLOG Solutions 5

Elastyczność

Czy mogę rozwiązać ten konkretny

problem?

Jakość

Na ile wiarygodna/pewna jest

informacja?

Wydajność

Jak długo muszę czekać na informację?

Społeczność!

Jak szybko mogę dostać wsparcie?

Copyright (c) WLOG Solutions 6

4000x5 modeli (CV-5) elastic-net dla danych wymiaru 45Kx10K w 1,5 minuty!

Copyright (c) WLOG Solutions 7

A ile czasu Twój biznes czeka na wsparcie decyzji?

R jako platforma analityczna w EnterpriseJak to sprzedać swojemu szefowi oraz zaplanować wdrożenie?

8

Copyright (c) WLOG Solutions 9

Obietnica dla Szefa

Copyright (c) WLOG Solutions 10

Będziemy w stanie szybciej dać lepszej jakości odpowiedź na

więcej pytań biznesu jednocześnie obniżając tzw.

licence footprint.

Copyright (c) WLOG Solutions 11

Jak to osiągnąć?

12

Ewolucja a nie Rewolucja*

*R i tak się obroni wynikami :)

13

LudzieKompetencje

NarzędziaIntegracja

ProcesyDostosowanie

Zarządzanie zmianą!

14

Idź na najbliższy uniwersytet

Zafunduj szkolenia dla

zespołu

Wdrażaj na realnych

problemach

Pokaż korzyści i wytłumacz

Znajdź wsparcie zewnętrzne

Dostosuj projekty i

architekturę

Platforma analityczna w EnterpriseKomponenty oraz rola R

15

Copyright (c) WLOG Solutions 16

Elastyczność

Czy mogę rozwiązać ten konkretny

problem?

Jakość

Na ile wiarygodna/pewna jest

informacja?

Wydajność

Jak długo muszę czekać na informację?

Wymagania

Copyright (c) WLOG Solutions

Komponenty platformy analitycznej

Feature management

Batch processing

Predictive model factory

BI

Scheduler/W

orkflow

ma

nagem

ent

Stream processing

Storage

Data ingest

ML, Opt, Sim (Auto, GPU)

Copyright (c) WLOG Solutions 18

R jest językiem do pisania logiki przetwarzania w ramach

platformy.

Rola i miejsce R (I)

Copyright (c) WLOG Solutions 19

Predictive model factory

Data Quality management

Machine Learning

Rola i miejsce R (II)

Analizy ad-hoc Raporty powtarzalne

Automatyzacja procesów

Copyright (c) WLOG Solutions 20

System dokumentacji

pakietów

System zależności

między pakietami

Dostęp do najlepszych technologii

Dlaczego R?

“Język-klej”Szybkie

prototypowanie w dużej skali

Dostęp do wiedzy i

kompetencji

Platforma analityczna w EnterpriseJak zarządzać środowiskiem R?

21

Copyright (c) WLOG Solutions 22

R “z pudełka” nie ma bezpośredniego wsparcia

dla rozwiązań wielkiej skali w środowisku Enterprise.

Copyright (c) WLOG Solutions 23

Dev

Version controlContinuous

Integration & Deployment

Prod

Proces developerski

Copyright (c) WLOG Solutions 24

Jenkins exemplary pipeline

Copyright (c) WLOG Solutions 25

Enkapsulacja środowisk

rozwojowych

Struktura projektu

Logika w pakietach

Testy Brak dostępu do internetu

Best practices by WLOG

Copyright (c) WLOG Solutions 26

CRAN (MRAN) Github Other

R environment

Installed packages

Local CRANSource code repo

Co jest blokerem?

Copyright (c) WLOG Solutions 27

Co jest blokerem?

CRAN (MRAN) Github Other

R environment

Installed packages

Local CRANSource code repo

Copyright (c) WLOG Solutions 28

data.table

Platforma analityczna w EnterprisePrzykłady z życia

29

Copyright (c) WLOG Solutions 30

Serwer produkcyjny

Serwer developerski

Continuousintegration

Version control

R Studio Server

Copyright (c) WLOG Solutions 31

Version control

Serwer developerski

Local CRAN

Serwer produkcyjny

Copyright (c) WLOG Solutions 32

Baza analityczna

(kolumnowa)

Baza analityczna

(kolumnowa)

deploy

Model = UDF

Budowa modelu

Platforma analityczna w EnterprisePodsumowanie

33

Platforma R w środowisku Enterprise

34

Zintegrowana z infrastrukturą

Procesy wytwórcze

zgodne z polityką firmy

Szybki cykl wytwórczy

Continuous Integration & Deployment

Procesy utrzymaniowe i

backupowe

Repozytoria - modeli, buildów, kodu, zależności,

konfiguracji

Monitoring zasobów

Bezpieczeństwo i audytowalność

Copyright (c) WLOG Solutions 35

Środowisko R pozwala stworzyć platformę analityczną, która

wspiera biznes sprawnie zarabiać pieniądze.

Wit Jakuczun, PhD

wit.jakuczun@wlogsolutions.com

Field tested R ecosystem for Enterprise

http://rsuite.io

36