Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji...
Click here to load reader
Transcript of Metoda redukcji danych uzyskanych za pośrednictwem ...€¦ · Krzysztof miatacz Metoda redukcji...
KRZYSZTOF MIATACZ
Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy
METODA REDUKCJI DANYCH UZYSKANYCH ZA PO�REDNICTWEM KWESTIONARIUSZA INTERNETOWEGO
NA PRZYKŁADZIE BADA� RYNKU TELEFONII KOMÓRKOWEJ
Streszczenie
Obecnie coraz wi�cej firm ma mo�liwo�� prowadzenia bada� swoich klientów za
po�rednictwem sieci Internet. Wiele z nich czyni to wysiłkiem własnych pracowni-
ków, bez pomocy firm doradczych.
W artykule zaprezentowano metod� redukcji danych uzyskanych za po�rednic-
twem kwestionariusza internetowego, wykorzystanej w badaniach satysfakcji klienta
indywidualnego polskich sieci komórkowych.
Słowa kluczowe: zbieranie danych przez Internet, proces badania marketingowego, czyszczenie
danych
1. Wprowadzenie
W dzisiejszych czasach, coraz wi�cej czynno�ci wchodz�cych w skład bada� marketingowych
realizuje si� za po�rednictwem sieci Internet. Proces badania marketingowego (badania rynku)
składa si� z dwóch głównych faz. S� to [1]:
- faza przygotowania badania, w skład której wchodz� kolejno czynno�ci takie jak:
1. Projektowanie badania.
2. Dobór próby.
3. Budowa instrumentu pomiarowego.
- faza realizacji badania, w skład której wchodz� kolejno czynno�ci takie jak:
4. Zbieranie danych.
5. Redukcja i wst�pna prezentacja.
6. Analiza danych.
7. Prezentacja i ocena wyników badania.
Podobne podej�cie, aczkolwiek z ro�nym naciskiem na opisywane wy�ej czynno�ci, upowszechnia
mi�dzy innymi M. Rószkiewicz, dziel�c badanie marketingowe na faz� koncepcyjn� i realizacji
[2], natomiast K. Mazurek-Łopaci�ska [3] opisuje proces badania marketingowego dziel�c go na
sze�� etapów (takie jak: okre�lenie problemu badawczego, formułowanie hipotez, opracowanie
planu bada�, wybór metod gromadzenia danych, analizowanie i interpretowanie danych, sporz�-dzanie raportu z bada�).
W niniejszym artykule autor pragnie zwróci� uwag� na propozycje wytycznych w oparciu
o które mo�na dokona� redukcji (czyszczenia) danych uzyskanych za po�rednictwem sieci Internet.
Sposób post�powania opracowano dla weryfikacji danych zebranych podczas pomiaru poziomu
satysfakcji klientów indywidualnych operatorów telefonii komórkowej w Polsce.
Krzysztof �miatacz
Metoda redukcji danych uzyskanych za po�rednictwem kwestionariusza
internetowego na przykładzie bada� rynku telefonii komórkowej
178
2. Sposób zbierania danych
Kwestionariusz internetowy wykorzystany do pomiaru satysfakcji klientów telefonii komór-
kowej umo�liwiał ocen� satysfakcji respondentów z wymienionych elementów oferty przy wyko-
rzystaniu pi�ciostopniowej skali Likerta. Odpowied ka�dego respondenta zapisywana była jako
kolejny wiersz w bazie danych MySQL. Tabela 1 zawiera charakterystyk� zawarto�ci kolumn
fragmentu bazy danych uj�tego w tabeli 2. Skrót „BO” oznacza brak odpowiedzi.
Tabela 1. Charakterystyka danych w kolumnach od 1 do 27 z tabeli 2
Ko-
lumnaOpis zawarto�ci
1 Dane nt. oprogramowania komputera u�ywanego przez respondenta (wersja przegl�darki internetowej, sys-
tem operacyjny)
2 Czas wypełnienia kwestionariusza
3 Adres IP komputera u�ywanego przez respondenta
4 e1 – symbol elementu oferty ocenianego w skali od 1 do 5 (gdzie „1” oznacza du�e niezadowolenie z elemen-
tu oferty a „5” du�e zadowolenie)
5 e2 – symbol elementu oferty ocenianego w skali od 1 do 5
6 e29 – symbol elementu oferty ocenianego w skali od 1 do 5
7 e30 – symbol elementu oferty ocenianego w skali od 1 do 5
8 Oznaczona jako główna sie� prepaid, z której korzysta badany (OM – Orange Twoj Mix, PM – Mix Plus, S -
Simplus, OP – Orange POP, EM – Era Mix)
9 Potwierdzenie, czy okre�lona wcze�niej sie� jest główn� sieci� z jakiej korzysta badany (T – tak, N – nie)
10 e32 – symbol elementu oferty ocenianego w skali od 1 do 5
11 e36 – symbol elementu oferty ocenianego w skali od 1 do 5
12 Oznaczona jako główna sie� postpaid, z której korzysta badany (E – Era, P – Plus, O - Orange). Skrót „BIZ”
oznacza telefon słu�bowy (firmowy)
13 Potwierdzenie, czy okre�lona wcze�niej sie� jest główn� sieci� z jakiej korzysta badany (T – tak, N – nie)
14 e38 – symbol elementu oferty ocenianego w skali od 1 do 5
15 e44 – symbol elementu oferty ocenianego w skali od 1 do 5
16 Liczba sieci wykorzystywanych przez badanych
17 Odpowied na pytanie, która to sie� respondenta (w przypadku korzystania z innych w przeszło�ci)
18 Długo�� okresu korzystania z obecnej sieci (w latach), NP – nie pami�tam jak długo
19 Wiek u�ywanego telefonu (w latach)
20 Czas po�wi�cany na rozmowy (w godz./tydz.)
21 Miesi�czne wydatki na usługi telekomunikacyjne (w zł)
22 Płe� (M – m��czyzna, K – kobieta)
23 Wiek (w latach)
24 Wykształcenie (LIC - licencjat/in�ynier, SZ – �rednie zawodowe, MGR - wy�sze magisterskie mgr in�., SO -
�rednie ogólnokształc�ce, PO – pomaturalne, policealne, G – gimnazjalne)
25 Stan cywilny (Z – zam��na/�onaty, P – panna/kawaler, W – wdowiec/wdowa)
26 Dochody netto (w zł), BD – brak dochodów, OO – odmowa odpowiedzi nt. dochodów
27 Ogólna ocena sieci („1” – pozytywna, „0” – neutralna, „-1” – negatywna)
�ródło: opracowanie własne na podstawie bada� ankietowych.
Kwestionariusz składał si� z czterech cz��ci. W skład pierwszej wchodziło 30 elementów ofer-
POLSKIE STOWARZYSZENIE ZARZ�DZANIA WIEDZ�Seria: Studia i Materiały, nr 18, 2009
179
ty (w kolumnie 4-7 tabeli 2 uj�to dwa pierwsze i dwa ostatnie), które mogli ocenia� wszyscy zain-
teresowani klienci sieci komórkowych, tj. korzystaj�cy z usług postpaid i prepaid. W skład drugiej
cz��ci wchodziło 5 elementów oferty (w kolumnie 10-11 tabeli 2 uj�to pierwszy i ostatni) dla
klientów korzystaj�cych z usług prepaid, 7 elementów wchodz�cych w skład trzeciej cz��ci (w ko-
lumnie 14-15 tabeli 2 uj�to pierwszy i ostatni) zwi�zanych było z ofert� dla klientów abonamento-
wych. Ostatni� cz��� stanowiła metryczka respondentów, zawieraj�ca dane charakteryzuj�ce cechy
badanych (wiersze 16-27 tabeli 1).
Oprogramowanie „phpMyAdmin”, umo�liwiaj�ce wgl�d do bazy danych pozwala równie� na
eksport bazy danych do formatów obsługiwanych, m.in. przez program Microsoft Excel.
3. Metoda redukcji danych
Dane surowe obci��one s� ró�nymi brakami i bł�dami [1]. Szczególnie nale�y na nie zwróci�uwag� podczas zbierania danych za po�rednictwem sieci Internet. Powodem tej szczególnej
ostro�no�ci jest m.in. brak interakcji z badanymi. Rozdaj�c kwestionariusze, np. na sali, badacz ma
mo�liwo�� poznania chocia�by ogólnego nastawienia do problemu badawczego, mo�e w wyniku
samej obserwacji wypełniaj�cych odrzuci� dokumenty wypełnione przez niektórych badanych,
którzy nie wykazuj� pozytywnego nastawienia do tre�ci kwestionariusza. W przypadku danych
pozyskiwanych za po�rednictwem Internetu badacz ma do dyspozycji tylko zapis w bazie danych,
który musi zakwalifikowa� lub nie do danych czystych podlegaj�cych dalszej obróbce.
W takiej sytuacji badacz musi wypracowa� sposób post�powania, który umo�liwia usuni�cie
niepełnowarto�ciowych wierszy z bazy danych. Bardzo wa�ne jest, aby w razie organizacji loso-
wania nagród za udział w badaniach, nie uzale�nia� mo�liwo�ci zapisania si� do procedury loso-
wania od czynno�ci wypełnienia kwestionariusza. Uniknie si� wtedy wielu opinii nie maj�cych
wi�kszej warto�ci dla firmy bo wypełnionych tylko po to aby mo�na było wzi�� udział w losowa-
niu nagrody.
W przypadku pomiaru poziomu satysfakcji, po zebraniu ocen klientów sieci komórkowych
w bazie danych usuwano z niej wiersze, które:
- nie miały wypełnionej ani jednej odpowiedzi w 1 cz��ci kwestionariusza (w kolumnie 4-7
tabeli 2) oraz w 4 cz��ci (charakteryzuj�cej populacj�) – warunkiem eliminacji było zaj-
�cie sytuacji braku odpowiedzi w obydwu cz��ciach równocze�nie (jak w lp. 1 tabeli 2),
- nie miały wypełnionej ani jednej odpowiedzi w 1 cz��ci kwestionariusza, w 2 cz��ci (w
kolumnie 10-11 tabeli 2), w 3 cz��ci (w kolumnie 14-15 tabeli 2) – warunkiem eliminacji
było zaj�cie sytuacji braku odpowiedzi w trzech cz��ciach równocze�nie (lp. 2 tabeli 2),
- nie miały wypełnionej ani jednej odpowiedzi w 4 cz��ci kwestionariusza (w kolumnie 16-
27 tabeli 2), w 2 cz��ci, w 3 cz��ci – warunkiem eliminacji było zaj�cie sytuacji braku
odpowiedzi w trzech cz��ciach równocze�nie (lp. 3 tabeli 2),
- nie miały wypełnionej ani jednej odpowiedzi w 4 cz��ci kwestionariusza (lp. 12 tabeli 2),
- nie miały okre�lonej głównej sieci, z jakiej respondent korzysta najcz��ciej, co wynikało
z porównania kolumn 9 i 13 tabeli 2 (lp. 3 tabeli 2),
- miały okre�lone dwie główne sieci, z jakiej respondent korzysta najcz��ciej, co wynikało
z porównania kolumn 9 i 13 tabeli 2 (lp. 16 tabeli 2),
Krzysztof �miatacz
Metoda redukcji danych uzyskanych za po�rednictwem kwestionariusza
internetowego na przykładzie bada� rynku telefonii komórkowej
180
- sugerowały, i� respondent ma słu�bow� komórk� (a wypełniał kwestionariusz, mimo za-
lece�, �e posiadacze takowego telefonu nie powinni bra� udziału w badaniach). Przykła-
dem jest lp. 6 z tabeli 2,
Tabela 2. Fragment danych surowych uzyskanych podczas pomiaru satysfakcji (kolumny 1-11)
Lp. 1 2 3 4 5 6 7 8 9 10 11
1. MSIE 7.0; Windows NT
5.1 10:27 83.19.214.XX BO BO BO BO BO BO BO BO
2. MSIE 6.0; Windows NT
5.1 10:30 83.24.51.XXX BO BO BO BO BO BO BO BO
3. MSIE 6.0; Windows NT
5.1 10:40 83.143.41.XXX 3 5 3 4 BO BO BO BO
4. MSIE 6.0; Windows NT
5.1 10:43 83.4.231.XX 2 4 2 3 BO N BO BO
5. MSIE 7.0; Windows NT
5.1 10:43 83.16.82.XX 4 4 4 3 PM N 4 4
6. MSIE 6.0; Windows NT
5.1 10:45 81.211.112.XXX 4 5 2 5 BO N BO BO
7. MSIE 6.0; Windows NT
5.1 10:46 87.115.176.XXX 2 2 2 4 BO N BO BO
8. MSIE 6.0; Windows 98 10:52 89.76.236.XX 2 5 3 3 S T 3 3
9. MSIE 7.0; Windows NT
5.1 10:57 83.12.249.XXX 2 1 2 4 PM N 1 1
10. MSIE 5.0; Windows NT
5.1 10:58 85.237.176.XXX 1 5 3 5 BO N BO BO
11. MSIE 7.0; Windows NT
5.1 11:01 83.13.47.XXX 3 4 5 1 OP T BO BO
12. MSIE 5.0; Windows NT
5.1 11:03 83.31.44.XX 2 4 2 4 EM T 1 2
13. MSIE 6.0; Windows NT
5.0 11:05 153.19.48.XXX 4 5 4 5 BO N BO BO
14. MSIE 5.0; Windows NT
5.0 11:05 83.26.112.XX 4 4 4 BO PM T 4 5
15. MSIE 6.0; Windows NT
5.1 11:08 83.3.112.XXX 5 5 5 5 S T 5 5
16. MSIE 5.0; Windows NT
5 11:11 83.4.111.XXX 4 3 2 3 OP T 4 4
Obja�nienia danych w kolumnach zawarto w tabeli 1.
�ródło: opracowanie własne na podstawie wyników bada� ankietowych.
- wskazywały na mo�liwo�� wypełnienia dla �artu, m.in. takie gdzie wpisywano niski wiek
respondenta (np. 17 lat), wykształcenie magisterskie, status wdowca (lp. 14 tabeli 2),
POLSKIE STOWARZYSZENIE ZARZ�DZANIA WIEDZ�Seria: Studia i Materiały, nr 18, 2009
181
- zawierały oceny skrajnie negatywne lub pozytywne co nie korelowało z ocen� ogóln� sie-
ci w kolumnie 27 (lp. 15 tabeli 2),
Tabela 2, cd. (kolumny 12-27)
Lp. 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
1. E T 2 1 BO BO BO BO BO BO BO BO BO BO BO BO
2. BO BO BO BO 4 4 0,5-1 do 1 1-5 51-100 M 17 BO P BD -1
3. BO BO BO BO BO BO BO BO BO BO BO BO BO BO BO BO
4. E T 2 BO BO 1 7-8 1-2 BO do-25 K 35 MGR Z BO 0
5. P T 4 4 2 2 8-9 1-2 1-5 51-100 M 34 MGR Z 3001 -
4000 1
6. BIZ T 4 1 2 2 2-3 do 1 5-10101-
200 K 34 MGR Z
1801 -
2000 1
7. O N 1 1 1 1 4-5 2-4 do 1 51-100 M 25 SO P 801 - 900 -1
8. P N BO BO BO 2 2-3 2-4 do 1 25-50 M 23 PO P 701 - 800 0
9. BO N BO BO 1 1 4-5 1-2 do 1101-
200 M 55 MGR Z
2501 -
3000 -1
10. P T 1 2 1 2 0,5-1 1-2 do 1 25-50 K 18 G P OO -1
11. BO N BO BO 2 1 NP BO do 1 25-50 K 30 MGR Z 5001 i
wi�cej 1
12. E N BO BO BO BO BO BO BO BO BO BO BO BO BO BO
13. E T 4 5 1 2 6-7 1-2 1-5 51-100 K 54 SO W 1201 -
1400 BO
14. BO N BO BO 2 5 2-3 1-2 BO 25-50 M 17 MGR W BD 1
15. BO N BO BO 2 5 0-0,5 do 1 1-5 101-
200 K 18 SO P OO -1
16. O T 4 2 2 1 5-6 1-2 1-5 51-100 M 25 MGR P BD 0
Obja�nienia danych w kolumnach zawarto w tabeli 1.
�ródło: opracowanie własne na podstawie wyników bada� ankietowych.
Kwesti� dyskusyjn� pozostaje czy w przypadku długich kwestionariuszy nale�y pozostawia� dane
od respondentów, którzy nie zaznaczyli pojedynczej (lub nawet kilku) komórek ich charakteryzu-
j�cych (w kolumnach od 16 do 27 tabeli 2). Na przykład jedni nie zdecydowali si� ujawni� swoje-
Krzysztof �miatacz
Metoda redukcji danych uzyskanych za po�rednictwem kwestionariusza
internetowego na przykładzie bada� rynku telefonii komórkowej
182
go stanu cywilnego, inni wieku lub zarobków. Istniej� narz�dzia przy pomocy, których responden-
tów wypełniaj�cych kwestionariusze w Internecie mo�na zmusi� do wypełniania wszystkich pól.
Jednak�e pytani cz�sto nie umiej�, nie chc� lub nie s� zainteresowani ocenianiem lub wypełnia-
niem jakiej� rubryki i przymuszanie ich do tego mo�e spowodowa� ich rezygnacj� z uczestnictwa
w procesie badawczym i utrat� cennej opinii.
Podczas bada� zbierano tak�e informacje o respondencie bez jego udziału i wiedzy. Dzi�ki
nim mo�na zebra� dane takie, jak:
- informacja jaki system operacyjny ma zainstalowany respondent, oraz jakiej u�ywa przegl�-darki internetowej;
- dokładny czas wypełnienia kwestionariusza, podany przez serwer, na którym go zainstalowa-
no. Zauwa�ono, �e niektórzy respondenci nie�wiadomie po uko�czeniu wypełniania naciskaj�guzik „wy�lij dane” kilka razy i w takiej sytuacji powstaje niebezpiecze�stwo otrzymania in-
formacji, która powielona kilkukrotnie, za�mieca baz� danych. W takim przypadku dokładny
czas wypełnienia pozwala eliminowa� takie dane;
- informacja jaki numer IP w sieci Internet ma komputer respondenta. Dane w bazie pocho-
dz�ce z komputera posiadaj�cego ten sam numer IP i wysłane w tym samym czasie poddawa-
no szczególnej kontroli. Istniej� informatyczne narz�dzia sprawdzaj�ce, czy kto� przez przy-
padek lub �wiadomie nie wysyła tych samych danych kilkakrotnie. Narz�dzia takie oparte s�w wi�kszo�ci przypadków na kontroli numeru IP. Jednak�e, z uwagi na to, �e niektóre sieci
komputerowe nadaj� ten sam numer IP ka�demu z ró�nych wchodz�cych w ich skład kompu-
terów (a zatem wielu potencjalnych respondentów), zatem taka blokada mogłaby pozbawi�szansy wypełnienia kwestionariusza przez niektórych zainteresowanych. Przykładem mo�e
by� sie� domowa w której skład wchodz� dwa komputery, np. m��a i �ony, przył�czone do
routera lub niektóre sieci lokalne. Ich u�ytkownicy przewa�nie maj� taki sam numer IP.
6. Uwagi ko�cowe
Sposób przedstawiony w artykule nie wyczerpuje wszystkich kombinacji w przypadku zaj�cia
których mo�na podj�� decyzj� o czyszczeniu danych. Wskazówki przedstawione w artykule mog�by� wykorzystane przy innych badaniach opinii klientów. Warto wzi�� pod uwag� tak�e to, �e ba-
dania przez Internet powinny by� prowadzone za po�rednictwem sieci, przy zało�eniu, �e klienci
odpowiadaj�cy za po�rednictwem tego medium b�d� stanowi� prób� reprezentatywn� w stopniu
zadowalaj�cym badacza.
POLSKIE STOWARZYSZENIE ZARZ�DZANIA WIEDZ�Seria: Studia i Materiały, nr 18, 2009
183
Bibliografia
1. Kaczmarczyk S., Badania marketingowe. Metody i techniki, PWE, Warszawa 2003, s. 35.
2. Rószkiewicz M., Metody ilo�ciowe w badaniach marketingowych, PWN, Warszawa
2002, s. 20-22.
3. Mazurek-Łopaci�ska K. (red.), Badania marketingowe. Podstawowe metody i obszary
zastosowa�, Wyd. Akademii Ekonomicznej we Wrocławiu, Wrocław 2002, s. 23-34.
THE METHOD OF DATA REDUCTION OBTAINED THROUGH THE INTERNET QUESTIONNAIRE ON THE BASIS OF MOBILE TELEPHONY MARKET RESEARCH
Summary
These days more and more companies have the opportunity to conduct research
among their customers by the medium of the Internet network. A number of them
have their employees to do the research without any help of advisory firms.
The elements of data reduction method obtained through the Internet question-
naire and used in the individual customer satisfaction research of Polish mobile te-
lephony was presented in the article.
Keywords: Internet data collecting, the process of marketing research, data cleaning
Krzysztof miatacz
Uniwersytet Technologiczno-Przyrodniczy
e-mail: [email protected]
http://www.wz.utp.edu.pl