Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji...

7

Click here to load reader

Transcript of Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji...

Page 1: Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji danych uzyskanych za po rednictwem kwestionariusza internetowego na przykładzie

KRZYSZTOF MIATACZ

Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy

METODA REDUKCJI DANYCH UZYSKANYCH ZA PO�REDNICTWEM KWESTIONARIUSZA INTERNETOWEGO

NA PRZYKŁADZIE BADA� RYNKU TELEFONII KOMÓRKOWEJ

Streszczenie

Obecnie coraz wi�cej firm ma mo�liwo�� prowadzenia bada� swoich klientów za

po�rednictwem sieci Internet. Wiele z nich czyni to wysiłkiem własnych pracowni-

ków, bez pomocy firm doradczych.

W artykule zaprezentowano metod� redukcji danych uzyskanych za po�rednic-

twem kwestionariusza internetowego, wykorzystanej w badaniach satysfakcji klienta

indywidualnego polskich sieci komórkowych.

Słowa kluczowe: zbieranie danych przez Internet, proces badania marketingowego, czyszczenie

danych

1. Wprowadzenie

W dzisiejszych czasach, coraz wi�cej czynno�ci wchodz�cych w skład bada� marketingowych

realizuje si� za po�rednictwem sieci Internet. Proces badania marketingowego (badania rynku)

składa si� z dwóch głównych faz. S� to [1]:

- faza przygotowania badania, w skład której wchodz� kolejno czynno�ci takie jak:

1. Projektowanie badania.

2. Dobór próby.

3. Budowa instrumentu pomiarowego.

- faza realizacji badania, w skład której wchodz� kolejno czynno�ci takie jak:

4. Zbieranie danych.

5. Redukcja i wst�pna prezentacja.

6. Analiza danych.

7. Prezentacja i ocena wyników badania.

Podobne podej�cie, aczkolwiek z ro�nym naciskiem na opisywane wy�ej czynno�ci, upowszechnia

mi�dzy innymi M. Rószkiewicz, dziel�c badanie marketingowe na faz� koncepcyjn� i realizacji

[2], natomiast K. Mazurek-Łopaci�ska [3] opisuje proces badania marketingowego dziel�c go na

sze�� etapów (takie jak: okre�lenie problemu badawczego, formułowanie hipotez, opracowanie

planu bada�, wybór metod gromadzenia danych, analizowanie i interpretowanie danych, sporz�-dzanie raportu z bada�).

W niniejszym artykule autor pragnie zwróci� uwag� na propozycje wytycznych w oparciu

o które mo�na dokona� redukcji (czyszczenia) danych uzyskanych za po�rednictwem sieci Internet.

Sposób post�powania opracowano dla weryfikacji danych zebranych podczas pomiaru poziomu

satysfakcji klientów indywidualnych operatorów telefonii komórkowej w Polsce.

Page 2: Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji danych uzyskanych za po rednictwem kwestionariusza internetowego na przykładzie

Krzysztof �miatacz

Metoda redukcji danych uzyskanych za po�rednictwem kwestionariusza

internetowego na przykładzie bada� rynku telefonii komórkowej

178

2. Sposób zbierania danych

Kwestionariusz internetowy wykorzystany do pomiaru satysfakcji klientów telefonii komór-

kowej umo�liwiał ocen� satysfakcji respondentów z wymienionych elementów oferty przy wyko-

rzystaniu pi�ciostopniowej skali Likerta. Odpowied ka�dego respondenta zapisywana była jako

kolejny wiersz w bazie danych MySQL. Tabela 1 zawiera charakterystyk� zawarto�ci kolumn

fragmentu bazy danych uj�tego w tabeli 2. Skrót „BO” oznacza brak odpowiedzi.

Tabela 1. Charakterystyka danych w kolumnach od 1 do 27 z tabeli 2

Ko-

lumnaOpis zawarto�ci

1 Dane nt. oprogramowania komputera u�ywanego przez respondenta (wersja przegl�darki internetowej, sys-

tem operacyjny)

2 Czas wypełnienia kwestionariusza

3 Adres IP komputera u�ywanego przez respondenta

4 e1 – symbol elementu oferty ocenianego w skali od 1 do 5 (gdzie „1” oznacza du�e niezadowolenie z elemen-

tu oferty a „5” du�e zadowolenie)

5 e2 – symbol elementu oferty ocenianego w skali od 1 do 5

6 e29 – symbol elementu oferty ocenianego w skali od 1 do 5

7 e30 – symbol elementu oferty ocenianego w skali od 1 do 5

8 Oznaczona jako główna sie� prepaid, z której korzysta badany (OM – Orange Twoj Mix, PM – Mix Plus, S -

Simplus, OP – Orange POP, EM – Era Mix)

9 Potwierdzenie, czy okre�lona wcze�niej sie� jest główn� sieci� z jakiej korzysta badany (T – tak, N – nie)

10 e32 – symbol elementu oferty ocenianego w skali od 1 do 5

11 e36 – symbol elementu oferty ocenianego w skali od 1 do 5

12 Oznaczona jako główna sie� postpaid, z której korzysta badany (E – Era, P – Plus, O - Orange). Skrót „BIZ”

oznacza telefon słu�bowy (firmowy)

13 Potwierdzenie, czy okre�lona wcze�niej sie� jest główn� sieci� z jakiej korzysta badany (T – tak, N – nie)

14 e38 – symbol elementu oferty ocenianego w skali od 1 do 5

15 e44 – symbol elementu oferty ocenianego w skali od 1 do 5

16 Liczba sieci wykorzystywanych przez badanych

17 Odpowied na pytanie, która to sie� respondenta (w przypadku korzystania z innych w przeszło�ci)

18 Długo�� okresu korzystania z obecnej sieci (w latach), NP – nie pami�tam jak długo

19 Wiek u�ywanego telefonu (w latach)

20 Czas po�wi�cany na rozmowy (w godz./tydz.)

21 Miesi�czne wydatki na usługi telekomunikacyjne (w zł)

22 Płe� (M – m��czyzna, K – kobieta)

23 Wiek (w latach)

24 Wykształcenie (LIC - licencjat/in�ynier, SZ – �rednie zawodowe, MGR - wy�sze magisterskie mgr in�., SO -

�rednie ogólnokształc�ce, PO – pomaturalne, policealne, G – gimnazjalne)

25 Stan cywilny (Z – zam��na/�onaty, P – panna/kawaler, W – wdowiec/wdowa)

26 Dochody netto (w zł), BD – brak dochodów, OO – odmowa odpowiedzi nt. dochodów

27 Ogólna ocena sieci („1” – pozytywna, „0” – neutralna, „-1” – negatywna)

�ródło: opracowanie własne na podstawie bada� ankietowych.

Kwestionariusz składał si� z czterech cz��ci. W skład pierwszej wchodziło 30 elementów ofer-

Page 3: Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji danych uzyskanych za po rednictwem kwestionariusza internetowego na przykładzie

POLSKIE STOWARZYSZENIE ZARZ�DZANIA WIEDZ�Seria: Studia i Materiały, nr 18, 2009

179

ty (w kolumnie 4-7 tabeli 2 uj�to dwa pierwsze i dwa ostatnie), które mogli ocenia� wszyscy zain-

teresowani klienci sieci komórkowych, tj. korzystaj�cy z usług postpaid i prepaid. W skład drugiej

cz��ci wchodziło 5 elementów oferty (w kolumnie 10-11 tabeli 2 uj�to pierwszy i ostatni) dla

klientów korzystaj�cych z usług prepaid, 7 elementów wchodz�cych w skład trzeciej cz��ci (w ko-

lumnie 14-15 tabeli 2 uj�to pierwszy i ostatni) zwi�zanych było z ofert� dla klientów abonamento-

wych. Ostatni� cz��� stanowiła metryczka respondentów, zawieraj�ca dane charakteryzuj�ce cechy

badanych (wiersze 16-27 tabeli 1).

Oprogramowanie „phpMyAdmin”, umo�liwiaj�ce wgl�d do bazy danych pozwala równie� na

eksport bazy danych do formatów obsługiwanych, m.in. przez program Microsoft Excel.

3. Metoda redukcji danych

Dane surowe obci��one s� ró�nymi brakami i bł�dami [1]. Szczególnie nale�y na nie zwróci�uwag� podczas zbierania danych za po�rednictwem sieci Internet. Powodem tej szczególnej

ostro�no�ci jest m.in. brak interakcji z badanymi. Rozdaj�c kwestionariusze, np. na sali, badacz ma

mo�liwo�� poznania chocia�by ogólnego nastawienia do problemu badawczego, mo�e w wyniku

samej obserwacji wypełniaj�cych odrzuci� dokumenty wypełnione przez niektórych badanych,

którzy nie wykazuj� pozytywnego nastawienia do tre�ci kwestionariusza. W przypadku danych

pozyskiwanych za po�rednictwem Internetu badacz ma do dyspozycji tylko zapis w bazie danych,

który musi zakwalifikowa� lub nie do danych czystych podlegaj�cych dalszej obróbce.

W takiej sytuacji badacz musi wypracowa� sposób post�powania, który umo�liwia usuni�cie

niepełnowarto�ciowych wierszy z bazy danych. Bardzo wa�ne jest, aby w razie organizacji loso-

wania nagród za udział w badaniach, nie uzale�nia� mo�liwo�ci zapisania si� do procedury loso-

wania od czynno�ci wypełnienia kwestionariusza. Uniknie si� wtedy wielu opinii nie maj�cych

wi�kszej warto�ci dla firmy bo wypełnionych tylko po to aby mo�na było wzi�� udział w losowa-

niu nagrody.

W przypadku pomiaru poziomu satysfakcji, po zebraniu ocen klientów sieci komórkowych

w bazie danych usuwano z niej wiersze, które:

- nie miały wypełnionej ani jednej odpowiedzi w 1 cz��ci kwestionariusza (w kolumnie 4-7

tabeli 2) oraz w 4 cz��ci (charakteryzuj�cej populacj�) – warunkiem eliminacji było zaj-

�cie sytuacji braku odpowiedzi w obydwu cz��ciach równocze�nie (jak w lp. 1 tabeli 2),

- nie miały wypełnionej ani jednej odpowiedzi w 1 cz��ci kwestionariusza, w 2 cz��ci (w

kolumnie 10-11 tabeli 2), w 3 cz��ci (w kolumnie 14-15 tabeli 2) – warunkiem eliminacji

było zaj�cie sytuacji braku odpowiedzi w trzech cz��ciach równocze�nie (lp. 2 tabeli 2),

- nie miały wypełnionej ani jednej odpowiedzi w 4 cz��ci kwestionariusza (w kolumnie 16-

27 tabeli 2), w 2 cz��ci, w 3 cz��ci – warunkiem eliminacji było zaj�cie sytuacji braku

odpowiedzi w trzech cz��ciach równocze�nie (lp. 3 tabeli 2),

- nie miały wypełnionej ani jednej odpowiedzi w 4 cz��ci kwestionariusza (lp. 12 tabeli 2),

- nie miały okre�lonej głównej sieci, z jakiej respondent korzysta najcz��ciej, co wynikało

z porównania kolumn 9 i 13 tabeli 2 (lp. 3 tabeli 2),

- miały okre�lone dwie główne sieci, z jakiej respondent korzysta najcz��ciej, co wynikało

z porównania kolumn 9 i 13 tabeli 2 (lp. 16 tabeli 2),

Page 4: Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji danych uzyskanych za po rednictwem kwestionariusza internetowego na przykładzie

Krzysztof �miatacz

Metoda redukcji danych uzyskanych za po�rednictwem kwestionariusza

internetowego na przykładzie bada� rynku telefonii komórkowej

180

- sugerowały, i� respondent ma słu�bow� komórk� (a wypełniał kwestionariusz, mimo za-

lece�, �e posiadacze takowego telefonu nie powinni bra� udziału w badaniach). Przykła-

dem jest lp. 6 z tabeli 2,

Tabela 2. Fragment danych surowych uzyskanych podczas pomiaru satysfakcji (kolumny 1-11)

Lp. 1 2 3 4 5 6 7 8 9 10 11

1. MSIE 7.0; Windows NT

5.1 10:27 83.19.214.XX BO BO BO BO BO BO BO BO

2. MSIE 6.0; Windows NT

5.1 10:30 83.24.51.XXX BO BO BO BO BO BO BO BO

3. MSIE 6.0; Windows NT

5.1 10:40 83.143.41.XXX 3 5 3 4 BO BO BO BO

4. MSIE 6.0; Windows NT

5.1 10:43 83.4.231.XX 2 4 2 3 BO N BO BO

5. MSIE 7.0; Windows NT

5.1 10:43 83.16.82.XX 4 4 4 3 PM N 4 4

6. MSIE 6.0; Windows NT

5.1 10:45 81.211.112.XXX 4 5 2 5 BO N BO BO

7. MSIE 6.0; Windows NT

5.1 10:46 87.115.176.XXX 2 2 2 4 BO N BO BO

8. MSIE 6.0; Windows 98 10:52 89.76.236.XX 2 5 3 3 S T 3 3

9. MSIE 7.0; Windows NT

5.1 10:57 83.12.249.XXX 2 1 2 4 PM N 1 1

10. MSIE 5.0; Windows NT

5.1 10:58 85.237.176.XXX 1 5 3 5 BO N BO BO

11. MSIE 7.0; Windows NT

5.1 11:01 83.13.47.XXX 3 4 5 1 OP T BO BO

12. MSIE 5.0; Windows NT

5.1 11:03 83.31.44.XX 2 4 2 4 EM T 1 2

13. MSIE 6.0; Windows NT

5.0 11:05 153.19.48.XXX 4 5 4 5 BO N BO BO

14. MSIE 5.0; Windows NT

5.0 11:05 83.26.112.XX 4 4 4 BO PM T 4 5

15. MSIE 6.0; Windows NT

5.1 11:08 83.3.112.XXX 5 5 5 5 S T 5 5

16. MSIE 5.0; Windows NT

5 11:11 83.4.111.XXX 4 3 2 3 OP T 4 4

Obja�nienia danych w kolumnach zawarto w tabeli 1.

�ródło: opracowanie własne na podstawie wyników bada� ankietowych.

- wskazywały na mo�liwo�� wypełnienia dla �artu, m.in. takie gdzie wpisywano niski wiek

respondenta (np. 17 lat), wykształcenie magisterskie, status wdowca (lp. 14 tabeli 2),

Page 5: Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji danych uzyskanych za po rednictwem kwestionariusza internetowego na przykładzie

POLSKIE STOWARZYSZENIE ZARZ�DZANIA WIEDZ�Seria: Studia i Materiały, nr 18, 2009

181

- zawierały oceny skrajnie negatywne lub pozytywne co nie korelowało z ocen� ogóln� sie-

ci w kolumnie 27 (lp. 15 tabeli 2),

Tabela 2, cd. (kolumny 12-27)

Lp. 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

1. E T 2 1 BO BO BO BO BO BO BO BO BO BO BO BO

2. BO BO BO BO 4 4 0,5-1 do 1 1-5 51-100 M 17 BO P BD -1

3. BO BO BO BO BO BO BO BO BO BO BO BO BO BO BO BO

4. E T 2 BO BO 1 7-8 1-2 BO do-25 K 35 MGR Z BO 0

5. P T 4 4 2 2 8-9 1-2 1-5 51-100 M 34 MGR Z 3001 -

4000 1

6. BIZ T 4 1 2 2 2-3 do 1 5-10101-

200 K 34 MGR Z

1801 -

2000 1

7. O N 1 1 1 1 4-5 2-4 do 1 51-100 M 25 SO P 801 - 900 -1

8. P N BO BO BO 2 2-3 2-4 do 1 25-50 M 23 PO P 701 - 800 0

9. BO N BO BO 1 1 4-5 1-2 do 1101-

200 M 55 MGR Z

2501 -

3000 -1

10. P T 1 2 1 2 0,5-1 1-2 do 1 25-50 K 18 G P OO -1

11. BO N BO BO 2 1 NP BO do 1 25-50 K 30 MGR Z 5001 i

wi�cej 1

12. E N BO BO BO BO BO BO BO BO BO BO BO BO BO BO

13. E T 4 5 1 2 6-7 1-2 1-5 51-100 K 54 SO W 1201 -

1400 BO

14. BO N BO BO 2 5 2-3 1-2 BO 25-50 M 17 MGR W BD 1

15. BO N BO BO 2 5 0-0,5 do 1 1-5 101-

200 K 18 SO P OO -1

16. O T 4 2 2 1 5-6 1-2 1-5 51-100 M 25 MGR P BD 0

Obja�nienia danych w kolumnach zawarto w tabeli 1.

�ródło: opracowanie własne na podstawie wyników bada� ankietowych.

Kwesti� dyskusyjn� pozostaje czy w przypadku długich kwestionariuszy nale�y pozostawia� dane

od respondentów, którzy nie zaznaczyli pojedynczej (lub nawet kilku) komórek ich charakteryzu-

j�cych (w kolumnach od 16 do 27 tabeli 2). Na przykład jedni nie zdecydowali si� ujawni� swoje-

Page 6: Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji danych uzyskanych za po rednictwem kwestionariusza internetowego na przykładzie

Krzysztof �miatacz

Metoda redukcji danych uzyskanych za po�rednictwem kwestionariusza

internetowego na przykładzie bada� rynku telefonii komórkowej

182

go stanu cywilnego, inni wieku lub zarobków. Istniej� narz�dzia przy pomocy, których responden-

tów wypełniaj�cych kwestionariusze w Internecie mo�na zmusi� do wypełniania wszystkich pól.

Jednak�e pytani cz�sto nie umiej�, nie chc� lub nie s� zainteresowani ocenianiem lub wypełnia-

niem jakiej� rubryki i przymuszanie ich do tego mo�e spowodowa� ich rezygnacj� z uczestnictwa

w procesie badawczym i utrat� cennej opinii.

Podczas bada� zbierano tak�e informacje o respondencie bez jego udziału i wiedzy. Dzi�ki

nim mo�na zebra� dane takie, jak:

- informacja jaki system operacyjny ma zainstalowany respondent, oraz jakiej u�ywa przegl�-darki internetowej;

- dokładny czas wypełnienia kwestionariusza, podany przez serwer, na którym go zainstalowa-

no. Zauwa�ono, �e niektórzy respondenci nie�wiadomie po uko�czeniu wypełniania naciskaj�guzik „wy�lij dane” kilka razy i w takiej sytuacji powstaje niebezpiecze�stwo otrzymania in-

formacji, która powielona kilkukrotnie, za�mieca baz� danych. W takim przypadku dokładny

czas wypełnienia pozwala eliminowa� takie dane;

- informacja jaki numer IP w sieci Internet ma komputer respondenta. Dane w bazie pocho-

dz�ce z komputera posiadaj�cego ten sam numer IP i wysłane w tym samym czasie poddawa-

no szczególnej kontroli. Istniej� informatyczne narz�dzia sprawdzaj�ce, czy kto� przez przy-

padek lub �wiadomie nie wysyła tych samych danych kilkakrotnie. Narz�dzia takie oparte s�w wi�kszo�ci przypadków na kontroli numeru IP. Jednak�e, z uwagi na to, �e niektóre sieci

komputerowe nadaj� ten sam numer IP ka�demu z ró�nych wchodz�cych w ich skład kompu-

terów (a zatem wielu potencjalnych respondentów), zatem taka blokada mogłaby pozbawi�szansy wypełnienia kwestionariusza przez niektórych zainteresowanych. Przykładem mo�e

by� sie� domowa w której skład wchodz� dwa komputery, np. m��a i �ony, przył�czone do

routera lub niektóre sieci lokalne. Ich u�ytkownicy przewa�nie maj� taki sam numer IP.

6. Uwagi ko�cowe

Sposób przedstawiony w artykule nie wyczerpuje wszystkich kombinacji w przypadku zaj�cia

których mo�na podj�� decyzj� o czyszczeniu danych. Wskazówki przedstawione w artykule mog�by� wykorzystane przy innych badaniach opinii klientów. Warto wzi�� pod uwag� tak�e to, �e ba-

dania przez Internet powinny by� prowadzone za po�rednictwem sieci, przy zało�eniu, �e klienci

odpowiadaj�cy za po�rednictwem tego medium b�d� stanowi� prób� reprezentatywn� w stopniu

zadowalaj�cym badacza.

Page 7: Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji danych uzyskanych za po rednictwem kwestionariusza internetowego na przykładzie

POLSKIE STOWARZYSZENIE ZARZ�DZANIA WIEDZ�Seria: Studia i Materiały, nr 18, 2009

183

Bibliografia

1. Kaczmarczyk S., Badania marketingowe. Metody i techniki, PWE, Warszawa 2003, s. 35.

2. Rószkiewicz M., Metody ilo�ciowe w badaniach marketingowych, PWN, Warszawa

2002, s. 20-22.

3. Mazurek-Łopaci�ska K. (red.), Badania marketingowe. Podstawowe metody i obszary

zastosowa�, Wyd. Akademii Ekonomicznej we Wrocławiu, Wrocław 2002, s. 23-34.

THE METHOD OF DATA REDUCTION OBTAINED THROUGH THE INTERNET QUESTIONNAIRE ON THE BASIS OF MOBILE TELEPHONY MARKET RESEARCH

Summary

These days more and more companies have the opportunity to conduct research

among their customers by the medium of the Internet network. A number of them

have their employees to do the research without any help of advisory firms.

The elements of data reduction method obtained through the Internet question-

naire and used in the individual customer satisfaction research of Polish mobile te-

lephony was presented in the article.

Keywords: Internet data collecting, the process of marketing research, data cleaning

Krzysztof miatacz

Uniwersytet Technologiczno-Przyrodniczy

e-mail: [email protected]

http://www.wz.utp.edu.pl