Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf ·...

32
WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek Statystyki Małych Obszarów Metodologia nowoczesnej statystyki działalności gospodarczej

Transcript of Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf ·...

Page 1: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

WPROWADZENIE Cele i zakres seminariów

Andrzej Młodak

Urząd Statystyczny w Poznaniu,

Ośrodek Statystyki Małych Obszarów

Metodologia nowoczesnej statystyki

działalności gospodarczej

Page 2: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Cele seminariów

Zaprezentowanie najistotniejszych z praktycznego punktu widzenia elementów projektowania i prowadzenia badań z zakresu statystyki działalności gospodarczej

Pogłębienie wiedzy z zakresu nowoczes-nych metod i narzędzi oceny oraz doskona-lenia jakości danych statystycznych dostar-czanych przez podmioty gospodarcze

Podstawa seminariów: wyniki projektu MeMoBuSt (Methodology for Modern Business Statistics) prowadzonego w ESSnet.

Page 3: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

MEETS a MeMoBuSt

Projekt MeMoBuSt stanowi jeden z elementów MEETS (Modernisation of European Enterprise and Trade Statistics) – programu modernizacji europejskiej statystyki przedsiębiorstw i handlu, ustanowionego mocą decyzji Parlamentu Europejskiego i Rady z dnia 16 grudnia 2008 r. na lata 2009 – 2013.

Realizacja MEETS odbywała się na platformie ESSnet (sieć współpracy w ramach ESS).

Page 4: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Inicjatywa MEETS

Ogromny zakres MEETS: 2009 – ok. 5 mln EUR,

2010 – ok. 10 mln EUR,

25 projektów.

Przykłady projektów, w których strona polska brała udział:

MeMoBuSt – modernizacja statystyki działalności gospodarczej

Data Integration – wypracowanie metod rozwiązywania problemów oraz oceny precyzji w zakresie integracji danych statystycznych

Small Area Estimation – synteza wiedzy dotyczącej estymacji dla małych obszarów oraz doskonalenie jej narzędzi.

Page 5: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Cele operacyjne MeMoBuSt

Cel główny: opracowanie podręcznika metodologicznego z zakresu statystyki działalności gospodarczej

Zastąpił publikację pod red. A. Willeboordse (1997), która była dalece niewystarczająca:

dotyczy raczej tylko realiów niderlandzkich

zawiera nieaktualne uregulowania prawne

nie ma kluczowych specyfikacji i analiz

brak problemu identyfikacji statusu LEA

nie porusza kwestii obciążeń odpowiedzi

rekomenduje przestarzałe narzędzia IT.

Page 6: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Cele operacyjne MeMoBuSt

Szczegółowe założenia operacyjne: objęcie zasięgiem całej dziedziny statystyki

przedsiębiorczości

uwzględnienie różnych rodzajów badań i potrzeb użytkowników

analiza metod weryfikacyjnych, redukcji obciążeń i integracji danych

łatwa dostępność podręcznika w formie elektronicznej

wykorzystanie treści nowego podręcznika jako materiału do szkoleń w ramach ESS

możliwość przeprowadzenia nowych studiów z zakresu objętego podręcznikiem.

Page 7: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Cele operacyjne MeMoBuSt

Uczestnicy projektu: Holandia (CBS – Centraal Bureau voor de Statistiek, Statistics

Netherlands) – koordynator projektu

Grecja (El–Stat – Hellenic Statistical Authority) – tylko w I fazie

Polska (GUS – US Poznań)

Norwegia (SSB – Statistics Norway, Centralny Urząd Statystyczny Norwegii)

Szwajcaria (FCSO – Federalny Urząd Statystyczny)

Szwecja (SCB – Statistics Sweden, Centralny Urząd Statystyczny Szwecji)

Węgry (HCSO – Hungarian Central Statistical Office, Węgierski Centralny Urząd Statystyczny)

Włochy (ISTAT – Instituto Nazionale di Statistica, Narodowy Instytut Statystyczny)

Page 8: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Założenia projektu MeMoBuSt

Podręcznik obejmuje poszczególne fazy Podstawowego Modelu Prowadzenia Statystyki Działalności Gospodarczej GSBPM (ang. Generic Statistical Business Process Model).

GSBPM wykorzystano w kontekście projektowania, przeprowadzania, oceny efektów i rozpoznawania reakcji respondentów badań.

http://www1.unece.org/stat/platform/display/metis/The+Generic+Statistical+Business+Process+Model – wersja 5.0 (XII 2013), wówczas 4.0 (IV 2009).

Page 9: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Założenia projektu MeMoBuSt

Konstrukcja schematu GSBPM 2013

Page 10: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Założenia projektu MeMoBuSt

Standard SDMX (ang. Statistical Data and Metadata eXchange)

standardy techniczne i statystyczne tworzone przez konsorcjum BIS, ECB, EUROSTAT, IMF, OECD, UN, Bank Światowy do efektywnej wymiany oraz współdzielenia danych i metadanych statystycznych.

Powszechny Słownik Metadanych (ang. Metadata Common Vocabulary – MCV)

specjalne repozytorium SDMX zawierające idee i odpowiednie definicje dotyczące strukturalnych i referencyjnych metadanych.

Czas trwania projektu: etap I: 28 grudnia 2010 r. – 27 czerwca 2012 r.,

etap II: 27 wrzesień 2012 r. – 26 marca 2014 r.

Page 11: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Zagadnienia kluczowe (według Eurostat-u):

projektowanie – schemat i koordynacja badań

gromadzenie danych – nowe techniki i źródła danych dla redukcji kosztów i obciążeń

estymacja – szacunki w obliczu luk w danych, prognozy, predykcja danych przeszłych.

Elementy struktury treści rozdziały

moduły tematyczne

moduły metod

Page 12: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Przedmowa

Wprowadzenie

Obserwacje ogólne Metody i jakość

Modele zarządzania jakością i ryzykiem

Dane o przebiegu procesów

Różne rodzaje badań

Europejski System Statystyczny (ESS)

GSBPM: Podstawowy Model Prowadzenia Statystyki Działalności Gospodarczej

Potrzeby użytkowników Specyfikacja potrzeb użytkowników w zakresie statystyki

działalności gospodarczej

Page 13: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Ogólne projektowanie badań

Badania powtarzalne

Projektowanie formularzy Moduł główny

Projektowanie formularza elektronicznego

Edycja podczas gromadzenia danych

Testowanie formularza

Page 14: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Rejestry i operaty statystyczne Główny moduł tematyczny.

Operaty losowania i jednostki badania w badaniach gospodarczych

Tworzenie i aktualizacja rejestrów statystycznych celem wspierania badań gospodarczych

Operaty losowania do badań gospodarczych

Projektowanie rejestrów statystycznych i operatów do badań

Jednostki statystyczne a rejestr działalności gospodarczej

Jakość rejestrów i operatów statystycznych

Page 15: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Dobór jednostek statystycznych

Dynamika zbiorowości przedsiębiorstw

Dobór prób Główny moduł tematyczny

Losowanie zbilansowane dla warstwowania wielostronnego

Losowanie podróbek dla wstępnych szacunków

Koordynacja losowania prób

Koordynacja losowania prób z wykorzystaniem schematu losowania prostego ze stałymi liczbami losowymi

Koordynacja losowania prób z wykorzystaniem schematu Poissona ze stałymi liczbami losowymi

Dobór liczb losowych gdy rozważa się koordynację losowania opartą na różnych typach jednostek.

Page 16: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Gromadzenie danych Główny moduł tematyczny

Projektowanie gromadzenia danych – część I: wybór odpowiedniej metody gromadzenia danych

Projektowanie gromadzenia danych – część II: strategie w zakresie kontaktu

Gromadzenie danych środkami mieszanymi

Techniki i narzędzia

Alokacja CATI

Gromadzenie i wykorzystanie danych wtórnych

Odpowiedzi Przetwarzanie odpowiedzi

Obciążenie odpowiedzi

Page 17: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Mikrofuzja Mikrofuzja – fuzja danych na poziomie mikro

Parowanie obiektów (łączenie rekordów)

Parowanie identyfikatorów obiektów

Nieważone parowanie charakterystyk obiektów

Ważone parowanie charakterystyk obiektów

Probabilistyczne łączenie rekordów

Podejście Fellegi–Suntera i Jaro do łączenia rekordów

Parowanie statystyczne

Metody parowania statystycznego

Rozwiązywanie konfliktów w mikrodanych

Rozdział proporcjonalny

Metody minimalnego korygowania

Korygowanie uogólnionym ilorazem

Page 18: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Kodowanie Główny moduł tematyczny

Jak zbudować bazę informacyjną

Kodowanie ręczne

Kodowanie automatyczne na zbiorach przekodowanych

Kodowanie automatyczne oparte na sieciach semantycznych

Kodowanie ze wsparciem komputerowym

Różne strategie kodowania

Pomiar jakości kodowania

Page 19: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Edycja danych statystycznych Główny moduł tematyczny

Edycja dedukcyjna

Edycja selektywna

Edycja automatyczna

Edycja ręczna

Makroedycja

Edycja danych administracyjnych

Edycja danych długookresowych

Page 20: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Imputacja Główny moduł tematyczny

Imputacja dedukcyjna

Imputacja oparta na modelach

Imputacja oparta na dawcach

Imputacja dla danych długookresowych

Metoda Little – Su

Imputacja w obliczu ograniczeń edycyjnych.

Page 21: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Ważenie i estymacja Główny moduł tematyczny

Projektowanie estymacji – pewne zagadnienia praktyczne

Kalibracja

Uogólniony estymator regresyjny (GREG)

Problem istnienia danych odstających

Estymacja wstępna z wykorzystaniem metod opartych na projekcie badania

Estymacja wstępna z wykorzystaniem metod opartych na modelu

Estymacja dla małych obszarów

Estymacja syntetyczna dla małych obszarów

Estymacja złożona dla małych obszarów

Estymacja EBLUP na poziomie obszarów w zakresie estymacji dla małych obszarów

Estymacja EBLUP na poziomie jednostek w zakresie estymacji dla małych obszarów

Metody estymacji dla małych obszarów w przypadku szeregów czasowych

Estymacja dla danych administracyjnych

Page 22: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Aspekty jakościowe Jakość statystyk

Rewizje oficjalnej statystyki gospodarczej

Makrointegracja Główny moduł tematyczny

Integracja ręczna

Metoda RAS

Metoda Stone’a

Metoda Dentona

Metoda Chow–Lina dla dezagregacji tymczasowej

Asymetria w statystyce – europejski rejestr ponadnarodowy

Page 23: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Struktura podręcznika

Dopasowanie sezonowe Wprowadzenie i opis ogólny

Dopasowanie sezonowe dla czasowych szeregów gospodarczych

Zagadnienie dopasowania sezonowego

Kontrola ujawniania danych Główny moduł tematyczny

Metody kontroli ujawniania danych dla tablic ilościowych

Rozpowszechnianie danych

Ocena Ocena statystycznych danych gospodarczych

Page 24: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Cechy podręcznika

Wykorzystanie doświadczeń różnych krajów, np.

dorobek niderlandzkiego projektu Method Series,

ocena obciążenia respondentów (ang. Perceive Response Burden) – rozwiązanie stosowane w Szwecji,

oprogramowanie CherryPi służące do automatyzacji edycji danych gospodarczych (Niderlandy),

wyniki badania satysfakcji użytkowników informacji statystycznych według ich grup oraz kategorii tychże informacji (Grecja).

Page 26: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Polski wkład do projektu

Prace prowadził Urząd Statystyczny w Poznaniu przy wsparciu CIS GUS

Polska jako lider i autor Projektowanie formularzy

Odpowiedzi

Polska jako autor (lub współautor) Obserwacje ogólne (lider – Holandia) o moduł poświęcony różnym rodzajom badań statystycznych

Ważenie i estymacja (lider – Włochy) o kalibracja

o problem istnienia obserwacji odstających

o estymacja syntetyczna dla małych obszarów

o estymacja złożona dla małych obszarów

Page 27: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Polski wkład do projektu

Polska jako recenzent (współrecenzent) potrzeby użytkowników (lider – Grecja, w II fazie – Holandia),

główny moduł tematyczny

dobór prób (lider – Norwegia) – Losowanie zbilansowane dla warstwowania wielostronnego

gromadzenie danych (lider – Włochy) – gromadzenie i wykorzystanie danych wtórnych

rozpowszechnianie danych (lider – Holandia) – główny moduł tematyczny

Page 28: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Założenia seminariów

Seminaria obejmują wybrane aspekty badań gospodarczych ujęte w podręczniku, przydatne w codziennej pracy statystycznej. Selekcji dokonano uwzględniając ocenę potrzeb w tym zakresie oraz zakres czasowy.

Z uwagi na polskie realia w niektórych przypadkach poruszono pewne dodatkowe zagadnienia, istotne w przypadku praktyki naszych badań statystycznych.

Page 29: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Prelegenci

mgr Paweł Lańduch starszy informatyk w Ośrodku Statystyki Krótkookresowej

Urzędu Statystycznego w Poznaniu, doktorant w Kolegium Analiz Ekonomicznych Szkoły Głównej Handlowej w Warszawie

dr hab. Andrzej Młodak konsultant w Ośrodku Statystyki Małych Obszarów Urzędu

Statystycznego w Poznaniu, prof. nadzw. Państwowej Wyższej Szkoły Zawodowej im. Prezydenta Stanisława Wojciechowskiego w Kaliszu

Page 30: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Tematyczny zakres seminariów

Czynniki rozwojowe i projektowanie badań

Ogólne zasady projektowania badań (Paweł Lańduch)

Dynamika zbiorowości przedsiębiorstw (Paweł Lańduch)

Projektowanie i testowanie formularzy (Paweł Lańduch)

Przetwarzanie i kontrola ujawniania danych

Mikrofuzja (Andrzej Młodak)

Edycja i podstawy imputacji danych (Andrzej Młodak)

Kontrola ujawniania danych (Paweł Lańduch)

Page 31: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Dalsze plany

Tematy przygotowywane przez mgr Monikę Natkowską (kierownika Oddziału w Kaliszu Urzędu Statystycznego w Poznaniu):

Podstawowe modele statystyki działalności gospodarczej: Model Jakości i Ryzyka w Odniesieniu do Obiektów (OQRM) oraz GSBPM

Potrzeby użytkowników

Gromadzenie danych

Przetwarzanie i obciążenie odpowiedzi.

Inne zagadnienia Ramowa Regulacja Integrująca Statystykę Działalności

Gospodarczej (FRIBS) a projekt MeMoBuSt (P. Lańduch)

Rejestry i operaty statystyczne (P. Lańduch)

Spójność i porównywalność danych (A. Młodak)

Pozostałe aspekty udostępniania i publikacji danych (A. Młodak).

Page 32: Cele i zakres seminariówpts.stat.gov.pl/.../37/44/1/1/wprowadzenie_do_sem_251115.pdf · WPROWADZENIE Cele i zakres seminariów Andrzej Młodak Urząd Statystyczny w Poznaniu, Ośrodek

Literatura uzupełniająca

Snijkers G., Haraldsen G., Jones J., Willimack D. (2013), Designing and Conducting Business Surveys, Wiley Series in Survey Methodology, John Wiley & Sons, Inc., Hoboken, New Jersey.

De Waal T., Pannekoek J., Scholtus S, (2011), Handbook of Statistical Data Editing and Imputation, Wiley Handbooks in Survey Methodology, John Wiley & Sons, Inc., Hoboken, New Jersey.

Hundepool A., Domingo-Ferrer J., Franconi L., Giessing S., Nordholt E. S., Spicer K., de Wolf P.-P. (2012), Statistical Disclosure Control, Wiley Series in Survey Methodology, John Wiley & Sons, Inc. Hoboken, New Jersey.