Otwarte dane - prezentacja na webinarium (2015)
-
Upload
lukasz-jachowicz -
Category
Software
-
view
148 -
download
1
Transcript of Otwarte dane - prezentacja na webinarium (2015)
Dokument udostępniony na licencji Creative
Commons Uznanie Autorstwa 3.0 Polska.
http://creativecommons.org/licences/by/3.0/pl/
Otwarte dane dla każdego
(wprowadzenie dla użytkowników,
twórców danych i programistów)
Łukasz Jachowicz
@ljachowicz
Dane:
- fakty, informacje, często nieprzetworzone
- mogą być sortowane, łączone z innymi danymi, przetwarzane ręcznie lub komputerowo
- niegdyś w formie papierowej, dziś prawie wyłącznie w wersji elektronicznej
- coraz częściej zbierane maszynowo i aktualizowane na bieżąco
Na przykład: rozkład jazdy, lokalizacja przystanków autobusowych, książka telefoniczna, liczba wolnych miejsc w szpitalu czy na parkingu, rejestr umów ministerstwa…
O czym właściwie mówimy?
Kiedyś przetwarzane przez nielicznych…
…dziś może korzystać z nich każdy.
Część instytucji daje dostęp do swoich zbiorów…
…nie zawsze w formie przyjaznej komukolwiek
Czasem nawet systemy bywają przydatne…
…do wyszukiwania oszustw…
…do sprawdzenia kupowanego auta…
jednak mają mało funkcji i nie dają dostępu do czystych danych
Strona internetowa z rozkładem nie da nam wygody
≠
A programista nie zawsze przepisze dane z PDF.
Szansą na rozwój przydatnych usług jest otwartość danych.
Otwarte dane
• Są aktualne.
• Da się z nich korzystać.
• Wolno z nich korzystać.
Otwarte dane
• Są aktualne.─ zawierają najświeższe informacje
─ wiadomo, kiedy zostały zaktualizowane i co zmieniono
• Da się z nich korzystać.─ są kompletne
─ podstawowe (zebrane u źródła), nieprzetworzone
─ są udostępnione w standardowy (otwarty) sposób
─ są przetwarzalne maszynowo
• Wolno z nich korzystać.─ dostępne dla każdego, bez rejestracji czy umowy
─ dostęp nieograniczony patentem, © czy ™
─ dostęp dla wszystkich: firm, NGOs i osób prywatnych
Jakie dane można otwierać?
• Czas – czyli podstawa działania GPS.
• Dane transportowe: rozkłady, lokalizacje, opóźnienia.
• Lokalizacje WiFi.
• Parkingi, remonty, korki.
• Geodane.
• Finanse publiczne.
• Wyniki wyborów.
• Bazy patentowe.
• Materiały edukacyjne.
• Bezpieczeństwo (pożary, przestępstwa)
• Dane o szkołach.
• Prawo.
• GUS.
Co może będzie otwarte w Warszawie?
• Liczba rowerów do wypożyczenia.
• Lokalizacje pojazdów ZTM: tramwaje, autobusy.
• Stopień zapełnienia parkingów Park&Ride.
• Średnia zajętość parkometrów.
• Dane o hotspotach WiFi.
• Ewidencja adresowa: apteki, urzędy, hotele…
• Dane systemów kolejkowych Qmatic.
• Rozkład jazdy ZTM.
• Dane z fotoradarów.
• Mapy, mapy, mapy…
Co zyskaMY?
• Dostęp do informacji, za których wytworzenie zapłaciliśmy.
• Ułatwiony dostęp do danych, które dziś są porozrzucane po dziesiątkach instytucji (np. mapa cen mieszkań + przestępczość + jakość szkół + dostępność szpitali + komunikacja).
• Możliwość monitorowania działań instytucji publicznych.
• Aplikacje ułatwiające życie: rozkłady jazdy, plany dnia biorące pod uwagę ruch w mieście, alarmy o próbie sprzedaży naszego mieszkania, przypominacze o wygasaniu ważności badań technicznych, ostrzeżenia o burzach w naszej okolicy połączone z zamykaczami okien itp.
Otwarte dane z
punktu widzenia
instytucji
Dane vs Otwarte Dane
0
1
2
3
4
5
6
7
Dane Otwarte dane
Koszt
Korzyść
• Konieczność
skatalogowania
i uporządkowania zbiorów
• Uporządkowanie kwestii
licencyjnych (mapy)
• Koszt wdrożenia systemu
udostępniania danych
• Zmiana przyzwyczajeń
• Uporządkowanie danych
• Ograniczenie silosowości
• Koniec duplikowania prac
• Dostęp pracowników i klientów do aktualnych danych
• Uniezależnienie się od dostawcy IT
• Niezależna weryfikacja danych
• Pierwszy krok ku interoperacyjnosci
• Przerzucenie części kosztów e-usług na programistów
Koszty i korzyści otwierania danych
Jak udostępniać dane?
• Przeprowadź inwentaryzację zbiorów danych.
• Przygotuj system do udostępniania (na zewnątrz lub do wewnątrz) – np CKAN.org
• Zacznij od danych, z których korzystasz przy więcej niż jednym biurku/departamencie.
• Uporządkuj dane: aktualizacja, czyszczenie, ustrukturyzowanie.
• Wykorzystuj system wewnętrznie: ma być źródłowy również dla Twojej instytucji.
• Otwórz dostęp read-only dla świata: cała baza + API.
• Pamiętaj, skan w pliku PDF jest nieużywalny (choć gdy nie ma nic innego…)
Czy ktokolwiek to robi?
• data.gov – blisko 140 tysiące zbiorów
• data.gov.uk: 23’300 zbiorów
• data.gov.au: 5’200 zbiorów
• dataSF.org: 844 zbiory
• data.London.gov.uk: 585 zbiorów
• data.worldbank.org: 203 zbiory
• data.rennes-metropole.fr: 187 zbiorów
• data.Vancouver.ca: >130 zbiorów
Zaczątki: Poznań, Wrocław, Kraków, CRIP
Otwarte dane z punktu
widzenia programisty
Korzyści
• swobodny dostęp do najdroższej części
typowego oprogramowania: danych
• dziesiątki gotowych bibliotek do zarządzania
danymi
• przewaga konkurencyjna: dane lokalne
(Transportoid/JakDojade vs Google Transport)
i lokalni użytkownicy
• konkurowanie jakością produktu, nie jakością
kontaktów z decydentami
Możliwość łączenia porozrzucanych dziś danych
Otwarte geodane + otwarte bazy dotyczące hoteli
+ otwarte bazy dotyczące zabytków + otwarte
informacje o rozkładach jazdy komunikacji
publicznej + otwarte dane archiwalne o korkach
i opóźnieniach = aplikacja podpowiadająca
najlepszy hotel pod kątem stosunku ceny do
wygody
Początki… (Housing maps – 2005)
Farmitracker
StreetBump
Toilet
Finder
Bike
City
Guide
carambla
nearhood
Second Take
(w tworzeniu)
Wyzwól kreatywność
CKAN.org
Projekt współfinansowany przez Narodowe Centrum Badań i Rozwoju w ramach Programu Innowacje Społeczne.
Dziękuję
za uwagę
Lukasz @ Jachowicz.com
@ljachowicz