Big data a strategie przedsiębiorstanna.lamek/ZAJECIA/NIWPD/Linked_Open_Data.pdfW badaniu Accenture...
Transcript of Big data a strategie przedsiębiorstanna.lamek/ZAJECIA/NIWPD/Linked_Open_Data.pdfW badaniu Accenture...
Big data a strategie
przedsiębiorstw
Koncepcja Linked Open Data
Agenda
Big data – definicja
Big data a formułowanie strategii przedsiębiorstw
Koncepcja Linked Open Data
Dane powiązane
Dane otwarte
Znaczenie społeczno-gospodarcze LOD
Badania
Przydatne linki i źródła
Czym jest Big data?
[Tabakow, Korczak, Franczyk, 2014]: „…określenie
stosowane dla takich zbiorów danych, które
jednocześnie charakteryzują się dużą objętością,
różnorodnością, strumieniowym napływem w czasie
rzeczywistym, zmiennością, złożonością […] i
wymagają zastosowania innowacyjnych
technologii, narzędzi, metod informatycznych w
celu wydobycia z nich nowej i użytecznej wiedzy”
Co się dzieje w ciągu 60sek?
źródło: https://www.go-globe.com/, sierpień 2017
źródło: http://www.visualcapitalist.com/internet-minute-2018/ , listopad 2018
źródło: Wikibon 2015, Executive Summary: Big Data Vendor Revenue and Market Forecast,
2011-2026 http://wikibon.com/executive-summary-big-data-vendor-revenue-and-market-forecast-
2011-2026/ , dostęp: maj 2016r.
Wzrost zainteresowania nt. big data
źródło: opracowanie własne na podstawie Google Trends, listopad 2017
Dane rozproszone=złożone zarządzanie
Customer Data?
Legacy,
packaged apps
Jak wynika z raportu Datafloq [2016] 69% przedsiębiorstw
zwiększy budżet big data, a 92% z nich dostrzega znaczące
korzyści wynikające z zaawansowanej analityki danych
37% badanych stwierdza, że monetyzacja danych stanowizasadniczą część ich planów biznesowych
Wymaga to jednak:
otwartego dostępu do zbiorów danych (w postaci
elektronicznej)
dostępu do danych w czasie rzeczywistym
powiązania danych, tak by były rozumiane nie tylko przez ludzi,
ale przede wszystkim maszyny
Jeśli chodzi o obszary biznesowe, które przedsiębiorstwa
chcą szczególnie rozwijać przy użyciu big data są to przede
wszystkim: poszerzenie wiedzy o klientach, innowacyjne
modele biznesowe, efektywność operacyjna oraz
podejmowanie decyzji o oparciu o analizy dokonywane w
czasie rzeczywistym*.
*na podstawie badania Big Data & Advanced Analytics in Telecom: A Multi-Billion-Dollar Revenue Opportunity http://www.whitepapers.lightreading.com/pdf_whitepapers/approved/1389385525_HR_Huawei_Big_Data_WP_12-19-13_%282%29.pdf, dostęp: maj 2016r.
W badaniu Accenture z 2014r. obejmującym
przedstawicieli ponad 1000 przedsiębiorstw z 7
różnych branż z 19 krajów, blisko 90%
respondentów wyraziło opinię, że big data
zrewolucjonizuje biznes w podobnym stopniu jak
Internet.
85% uważa, że big data będzie drastycznie zmieni
sposób prowadzenia działalności gospodarczej.
79% pytanych zgodziło się, że przedsiębiorstwa,
które nie dokonają implementacji big data
stracą swoją pozycję konkurencyjną, a może
nawet staną w obliczu widma upadłości.*
*Big Success with Big Data: Executive Summary https://www.accenture.com/us-en/_acnmedia/Accenture/Conversion-Assets/DotCom/Documents/Global/PDF/Industries_14/Accenture-Big-Data-POV.pdf,
dostęp maj 2016r.
źródło: opracowanie własne na podstawie Accenture 2014, Big Success with Big Data:
Executive Summary
źródło: opracowanie własne na podstawie
Information Week 2015 Analytics & BI Survey
Wiele jednak zależy od wiedzy i umiejętności samych przedsiębiorstw.Kenneth Cukier i Viktor Mayer-Schönberger w swojej książce [Cukier K.,Mayer-Schönberger V., 2014] zwracają uwagę, że mamy do czynieniaz trzema rodzajami przedsiębiorstw, które różnią się wartością, jakąmają do zaoferowania na rynku:
dysponenci danych - firmy będące jedynie w posiadaniu danychlub mające do nich dostęp, które niekoniecznie potrafiąwygenerować wartość dodaną z tychże zasobów (przykłademmoże być Twitter, który dysponuje ogromną ilością danych, jednakw celu ich wykorzystania udostępnia je innym podmiotom lubdokonuje przejęć specjalistów od przetwarzania big data)
analitycy danych - podmioty posiadające odpowiednieumiejętności – głównie firmy analityczne i konsultingowe, które zkolei rzadko mają dostęp do określonych zasobów, w związku z tymczęsto podejmują współpracę z przedstawicielami pierwszej grupy
innowatorzy – firmy wykazujące „nastawienie” big data,charakteryzujące się dużą kreatywnością, jeśli chodzi owykorzystanie danych i pozyskiwanie z nich wartości dodanej, ajednocześnie posiadające umiejętność wykorzystaniazaawansowanych narzędzi big data.
Linked Open DataOTWARTE DANE POWIĄZANE
Formy udostępniania informacji
Sieć dokumentów... Sieć powiązanych danych…
Internet zmienia się z „sieci powiązanych dokumentów” w „sieć
powiązanych danych”...
Zobacz również: http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
http://linkeddatabook.com/editions/1.0/
źródło: https://www.youtube.com/watch?v=uju4wT9uBIA
Czym jest Linked Open Data?
Zobacz również: http://www.youtube.com/watch?v=4x_xzT5eF5Q
http://www.w3.org/DesignIssues/LinkedData.html
http://www.youtube.com/watch?v=uju4wT9uBIA
„Dane powiązane to zbiór zasad projektowania dotyczących
udostępniania danych przeznaczonych do odczytu komputerowego w
Internecie na potrzeby organów administracji publicznej, przedsiębiorstw i
obywateli.”
Analiza przypadku ISA KE: Jak dane powiązane zmieniają administrację elektroniczną
Cztery zasady projektowania danych powiązanych (wg Tima Bernersa Lee):
1. Użyj standardu URI do oznaczania nazw danych.
2. Użyj HTTP URI, aby umożliwić identyfikację zasobów.
3. Gdy ktoś szuka identyfikatora URI, umieść przydatne informacje, używającstandardów RDF* i SPARQL.
4. Umieść odnośniki do innych identyfikatorów URI, aby umożliwić dalsze wyszukiwanie
Źródło: https://news.opendatacommunities.org/content/images/2017/01/5-star-open-data-model-1.JPG
Otwarte licencje
Metody publikowania danych
Strony internetowe
Content negotation
Zrzut plików
Punkt końowy/edytor zapytań SPARQL
Aplikacje
Cykl życia LOD w kontekście popytu i podaży
Podaż Popyt
Wybór Modelo-wanie
Publikacja Wyszuka-nie
Integracja Wykorzys-tanie
Zarządzanie danymi
Publikujący
dane
Użytkownicy
danych
Informacja zwrotna
źródło: prezentacja nt. Linked Open Data, PWC, dostęp: maj 2018
Zalety LOD
• Elastyczna integracja danych: LOD ułatwia integrację danych izapewnia połączenie dotychczas rozproszonych zbiorów danych
• Wzrost jakości danych: zwiększone (ponowne) wykorzystanie LODzwiększa zapotrzebowanie na poprawę jakości danych. Dziękicrowdsourcingowi i mechanizmom samoobsługi błędy są stopniowousuwane.
• Nowe usługi: dostępność LOD sprawia, że powstają nowe usługioferowane przez sektor publiczny i/lub prywatny.
• Ułatwienie wyszukiwania informacji (a nawet odkrywania nowych,powiązanych zasobów)
• Obniżenie kosztów: ponowne wykorzystanie LOD w biznesie/administracji elektronicznej przynosi znaczące oszczędności.
Wady / Wyzwania LOD
Zazwyczaj czasochłonna identyfikacja zasobów i przydzielanie identyfikatorów URI
Brak kontroli nad uwolnionymi danymi (raz udostępnione takie już będzie)
Brak informacji o narzędziach służących do przeniesienia danych do LOD
Opanowanie technologii wymaga wysiłku i może być początkowo trudne
Konieczność zainwestowania czasu, i posiadania odpowiednich kompetencji/umiejętności
Aktualizacja wersji systemów mobilnych i kompatybilności aplikacji stworzonych w oparciu o LOD
Przykłady zasobów możliwych do wykorzystania
https://www.wroclaw.pl/open-data/
źrodło: http://www.ldf.fi/project.html
http://datos.bne.es/inicio.html
https://www.springernature.com/gp/researchers/scigraph
https://www.ibm.com/watson/marketing/pl-pl/
https://www.apple.com/siri/
https://www.bbc.com/news
źródło: https://nacoidamojepieniadze.pl/
źródło: https://nacoidamojepieniadze.pl/
Inne inicjatywy
LOD Hackathon – organizowany m.in. przez
Ministerstwo Cyfryzacji (danepubliczne.gov.pl)
Google Graph knowledge (źródła: Wikipedia,
Factbook CIA)
Zwrot informacji
Poproś (potencjalnych) użytkowników
danych o informację zwrotną:
• Jakich danych potrzebują
• Jak wykorzystali dane
• Jak oceniają jakość danych
• Upewnij się, że otrzymujesz
prośby i sugestie
użytkowników – wykorzystaj
wiedzę społecznościową do
podniesienia jakości danych!
data.overheid.nl
źródło: prezentacja nt. Linked Open Data, PWC, dostęp: maj 2018
Badania
Analiza i porównanie systemów do zarządzania treścią,
wykorzystywanych w przedsiębiorstwach (w trakcie –
cmsmatrix.org vs statyczne strony – Google Analytics)
Analiza wykorzystania koncepcji LOD w przedsiębiorstwach
i jej wpływ na formułowanie strategii (w planach)
Ocena „otwartości danych” na polskich portalach
internetowych (weryfikacja skali, w trakcie)
Wybrane publikacje (jest ich naprawdę sporo!!)
Boyd D., Crawford K.: Critical questions for big data in Information Communication & Society, 2012, vol. 15, issue
5, s. 662-679
O’Donovan P., Leahy K. , Bruton K., O’Sullivan D.: Big data in manufacturing: a systematic mapping study .
Journal of Big Data, 2015, s. 2-20.
Lee J., Bagheri B, Kao H-A. : A cyber-physical systems architecture for industry 4.0 -based manufacturing
systems. Manuf Lett, 2015, no.3, s.18–23.
Fosso Wamba S., Akter S., Edwards A., Chopin G., Gnanzou D.: How ‘big data’ can make big impact. Findings
from a systematic review and a longitudinal case study. International Journal of Production Economics, 2015,
vol. 165, s. 234-246 (IF: 2.752)
Frizzo-Barker J., Chow-White P.A, Mozafari M., (2016), An empirical study of the rise of big data in business
scholarship, “International Journal of Information Management”, Vol. 36. (IF: 1.55)
Gandomi A., Haider M., (2015), Beyond the hype: Big data concepts, methods, and analytics, International
Journal of Information Management, Vol. 35. (IF: 1.55)
Hashem I.A.T., Yaqoob I., Anuar N.B., Mokhar S" Gani A., Khan S.U. (2015), The Rise of "Big Data" on Cloud
Computing: Review and Open Research Issues, "Information Systems", Vol. 47, January, pp. 98-115. (IF:1.456)
Kambatla K., Kollias G., Kuma V., Grama A. (2014), Trends in Big Data Analytics, "Journal of Parallel and
Distributed Computing", Vol. 74, No. 7, July, pp. 2561-2573 (IF: 1.179)
http://ceur-ws.org/Vol-1034/MihindukulasooriyaEtAl_COLD2013.pdf
Dziękuję za uwagę