Otwarte dane - prezentacja na webinarium (2015)

Post on 17-Jul-2015

148 views 1 download

Transcript of Otwarte dane - prezentacja na webinarium (2015)

Dokument udostępniony na licencji Creative

Commons Uznanie Autorstwa 3.0 Polska.

http://creativecommons.org/licences/by/3.0/pl/

Otwarte dane dla każdego

(wprowadzenie dla użytkowników,

twórców danych i programistów)

Łukasz Jachowicz

@ljachowicz

Dane:

- fakty, informacje, często nieprzetworzone

- mogą być sortowane, łączone z innymi danymi, przetwarzane ręcznie lub komputerowo

- niegdyś w formie papierowej, dziś prawie wyłącznie w wersji elektronicznej

- coraz częściej zbierane maszynowo i aktualizowane na bieżąco

Na przykład: rozkład jazdy, lokalizacja przystanków autobusowych, książka telefoniczna, liczba wolnych miejsc w szpitalu czy na parkingu, rejestr umów ministerstwa…

O czym właściwie mówimy?

Kiedyś przetwarzane przez nielicznych…

…dziś może korzystać z nich każdy.

Część instytucji daje dostęp do swoich zbiorów…

…nie zawsze w formie przyjaznej komukolwiek

Czasem nawet systemy bywają przydatne…

…do wyszukiwania oszustw…

…do sprawdzenia kupowanego auta…

jednak mają mało funkcji i nie dają dostępu do czystych danych

Strona internetowa z rozkładem nie da nam wygody

A programista nie zawsze przepisze dane z PDF.

Szansą na rozwój przydatnych usług jest otwartość danych.

Otwarte dane

• Są aktualne.

• Da się z nich korzystać.

• Wolno z nich korzystać.

Otwarte dane

• Są aktualne.─ zawierają najświeższe informacje

─ wiadomo, kiedy zostały zaktualizowane i co zmieniono

• Da się z nich korzystać.─ są kompletne

─ podstawowe (zebrane u źródła), nieprzetworzone

─ są udostępnione w standardowy (otwarty) sposób

─ są przetwarzalne maszynowo

• Wolno z nich korzystać.─ dostępne dla każdego, bez rejestracji czy umowy

─ dostęp nieograniczony patentem, © czy ™

─ dostęp dla wszystkich: firm, NGOs i osób prywatnych

Jakie dane można otwierać?

• Czas – czyli podstawa działania GPS.

• Dane transportowe: rozkłady, lokalizacje, opóźnienia.

• Lokalizacje WiFi.

• Parkingi, remonty, korki.

• Geodane.

• Finanse publiczne.

• Wyniki wyborów.

• Bazy patentowe.

• Materiały edukacyjne.

• Bezpieczeństwo (pożary, przestępstwa)

• Dane o szkołach.

• Prawo.

• GUS.

Co może będzie otwarte w Warszawie?

• Liczba rowerów do wypożyczenia.

• Lokalizacje pojazdów ZTM: tramwaje, autobusy.

• Stopień zapełnienia parkingów Park&Ride.

• Średnia zajętość parkometrów.

• Dane o hotspotach WiFi.

• Ewidencja adresowa: apteki, urzędy, hotele…

• Dane systemów kolejkowych Qmatic.

• Rozkład jazdy ZTM.

• Dane z fotoradarów.

• Mapy, mapy, mapy…

Co zyskaMY?

• Dostęp do informacji, za których wytworzenie zapłaciliśmy.

• Ułatwiony dostęp do danych, które dziś są porozrzucane po dziesiątkach instytucji (np. mapa cen mieszkań + przestępczość + jakość szkół + dostępność szpitali + komunikacja).

• Możliwość monitorowania działań instytucji publicznych.

• Aplikacje ułatwiające życie: rozkłady jazdy, plany dnia biorące pod uwagę ruch w mieście, alarmy o próbie sprzedaży naszego mieszkania, przypominacze o wygasaniu ważności badań technicznych, ostrzeżenia o burzach w naszej okolicy połączone z zamykaczami okien itp.

Otwarte dane z

punktu widzenia

instytucji

Dane vs Otwarte Dane

0

1

2

3

4

5

6

7

Dane Otwarte dane

Koszt

Korzyść

• Konieczność

skatalogowania

i uporządkowania zbiorów

• Uporządkowanie kwestii

licencyjnych (mapy)

• Koszt wdrożenia systemu

udostępniania danych

• Zmiana przyzwyczajeń

• Uporządkowanie danych

• Ograniczenie silosowości

• Koniec duplikowania prac

• Dostęp pracowników i klientów do aktualnych danych

• Uniezależnienie się od dostawcy IT

• Niezależna weryfikacja danych

• Pierwszy krok ku interoperacyjnosci

• Przerzucenie części kosztów e-usług na programistów

Koszty i korzyści otwierania danych

Jak udostępniać dane?

• Przeprowadź inwentaryzację zbiorów danych.

• Przygotuj system do udostępniania (na zewnątrz lub do wewnątrz) – np CKAN.org

• Zacznij od danych, z których korzystasz przy więcej niż jednym biurku/departamencie.

• Uporządkuj dane: aktualizacja, czyszczenie, ustrukturyzowanie.

• Wykorzystuj system wewnętrznie: ma być źródłowy również dla Twojej instytucji.

• Otwórz dostęp read-only dla świata: cała baza + API.

• Pamiętaj, skan w pliku PDF jest nieużywalny (choć gdy nie ma nic innego…)

Czy ktokolwiek to robi?

• data.gov – blisko 140 tysiące zbiorów

• data.gov.uk: 23’300 zbiorów

• data.gov.au: 5’200 zbiorów

• dataSF.org: 844 zbiory

• data.London.gov.uk: 585 zbiorów

• data.worldbank.org: 203 zbiory

• data.rennes-metropole.fr: 187 zbiorów

• data.Vancouver.ca: >130 zbiorów

Zaczątki: Poznań, Wrocław, Kraków, CRIP

Otwarte dane z punktu

widzenia programisty

Korzyści

• swobodny dostęp do najdroższej części

typowego oprogramowania: danych

• dziesiątki gotowych bibliotek do zarządzania

danymi

• przewaga konkurencyjna: dane lokalne

(Transportoid/JakDojade vs Google Transport)

i lokalni użytkownicy

• konkurowanie jakością produktu, nie jakością

kontaktów z decydentami

Możliwość łączenia porozrzucanych dziś danych

Otwarte geodane + otwarte bazy dotyczące hoteli

+ otwarte bazy dotyczące zabytków + otwarte

informacje o rozkładach jazdy komunikacji

publicznej + otwarte dane archiwalne o korkach

i opóźnieniach = aplikacja podpowiadająca

najlepszy hotel pod kątem stosunku ceny do

wygody

Początki… (Housing maps – 2005)

Farmitracker

StreetBump

Toilet

Finder

Bike

City

Guide

carambla

nearhood

Second Take

(w tworzeniu)

Wyzwól kreatywność

CKAN.org

Projekt współfinansowany przez Narodowe Centrum Badań i Rozwoju w ramach Programu Innowacje Społeczne.

Dziękuję

za uwagę

Lukasz @ Jachowicz.com

@ljachowicz