tabela dla pytań wielokrotnego wyboru
Transkrypt
tabela dla pytań wielokrotnego wyboru
raportowanie tabela dla pytań wielokrotnego wyboru Przemysław Budzewski spss polska co to są pytania wielokrotnego wyboru? W tym artykule zajmę się sposobami prezentacji szczególnej kategorii pytań — pytaniami wielokrotnego wyboru. Pytania te stosuje się wtedy, gdy respondent może udzielić więcej niż jednej „prawdziwej” odpowiedzi na pytanie, a co więcej, odpowiedzi te interesują mnie z punktu widzenia celu badania. Mógłbym np. zapytać respondentów o sposób spędzania wolnego czasu. Formułując pytanie w następujący sposób: „ W jaki sposób najczęściej spędza Pan(i) czas wolny od pracy?” oczekuję, że każdy z respondentów wskaże tylko jedną odpowiedź. Jednakże, zadając pytanie nieco inaczej sformułowane: „W jaki sposób spędza Pan(i) czas wolny od pracy?”, daję respondentom możliwość wskazania więcej niż jednej odpowiedzi. I tak jeden z respondentów może odpowiedzieć: 1. czytam książki, 2. oglądam telewizję, 3. chodzę na spacery a inny: 1. czytam książki, 6. po prostu leżę ;-) W instrukcji do pytania w kwestionariuszu ankiety mogę również zawęzić liczbę możliwych odpowiedzi, prosząc respondentów o podanie najwyżej 3 odpowiedzi, ale mogę tego również nie robić, prosząc ich wręcz o podanie wszystkich prawdziwych odpowiedzi. Prosząc respondentów o wskazanie np. wszystkich znanych im chociażby ze słyszenia osób publicznych narodowości niemieckiej, mogę otrzymać dziesiątki nazwisk, w tym również „niepoprawne”, jak np. Adolf Hitler czy też Reinhold Messner. Stąd też istotne jest aby na etapie projektowania badania i kwestionariusza rozważyć, jaki sposób zadawania tego typu pytań jest celowy z punktu widzenia celu analizy. jak kodować pytania wielokrotnego wyboru? Pytania wielokrotnego wyboru kodowane są w edytorze danych w postaci zestawu zmiennych: albo w postaci tzw. wielokrotnych kategorii (mc ), albo w postaci wielokrotnych dychotomii (md ). 1 Techniczne aspekty kodowania i zmiany sposobu kodowania pytań wielokrotnego wyboru w pasw Statistics ujmuje materiał zamieszczony w numerze 6. biuletynu ekspress pt.„Zamiana pytań kodowanych jako mc na md” Ogólnie rzecz biorąc1 różnica polega na liczbie zmiennych oraz unikatowych kodów numerycznych potrzebnych do zakodowania odpowiedzi. W przypadku kodowania md zmiennych jest tyle ile wszystkich kategorii odpowiedzi (możliwych odpowiedzi w kafeterii) i są one kodowane zero–jedynkowo (1 — respondent wskazał kategorię, 0 — respondent nie wskazał kategorii). W przypadku kodowania mc zmiennych jest tyle, ile wynosi liczba odpowiedzi udzielonych przez respondenta, który zaznaczył maksymalną liczbę odpowiedzi, a każda kategoria odpowiedzi oznaczana jest unikatowym kodem. De facto, stwierdzenie, iż te dwa sposoby kodowania różnią się liczbą zmiennych koniecznych do pełnego opisania odpowiedzi jest nie do końca zgodne z prawdą. Może się zdarzyć, że znajdzie się osoba, która wskaże wszystkie odpowiedzi. Anegdota głosi, że w pewnych badaniach na temat zachowań ryzykownych, w pytaniu o stosowane metody antykoncepcji respondent wskazał wszystkie możliwe odpowiedzi, i dodał jeszcze do tego „wstrzemięźliwość” (sic!). Warto może zatem wspomnieć o jeszcze jednej sytuacji, to znaczy o sytuacji, w której zbiór odpowiedzi jest otwarty gramatycznie — pozostawiam dodatkowo opcję Inne (jakie?) i daję respondentowi możliwość swobodnej odpowiedzi jeśli lista pozycji na kafeterii nie jest wyczerpująca. Takie podejście wynika zazwyczaj z dwóch względów: (a) lista możliwych odpowiedzi jest długa i zbyt szczegółowa aby wprowadzać ją do narzędzia w całości lub też (b) badacz ma świadomość, iż jego wiedza o zjawisku nie jest pełna a kafeteria, potencjalnie, nie wyczerpuje tematu, w związku z tym uwzględnia możliwość pojawienia porady i wskazówki się istotnych kategorii spoza kafeterii. Jeśli rzeczywiście odpowiedzi pojawiające się w tej kategorii są analitycznie istotne, należy przeprowadzić analizę treści tych odpowiedzi zanim dokonamy kodowania zmiennej na potrzeby ostatecznej analizy. Można wtedy połączyć niektóre bliskoznaczne kategorie odpowiedzi z już obecnymi na kafeterii, lub też utworzyć dodatkowe kategorie. W dalszej części artykułu zajmę się przede wszystkim sposobem prezentacji pytań wielokrotnego wyboru w tabelach, mając świadomość, że ten krótki, wstępny opis nie wystarcza aby zaprezentować wszystkie aspekty związane z wykorzystaniem pytań wielokrotnego wyboru w badaniach ankietowych. przykład tabela częstości dla pytania o korzystanie z produktów bankowych W marketingu produktów, ale nie tylko, ważne jest by mieć możliwość oceny np. zasięgu produktu na rynku/wśród klientów. Rzadko jednak zdarza się, że klient=produkt. Aby zatem poprawnie ocenić „siłę przyciągania” (popularność) produktu na rynku powinienem mieć możliwość odpowiedzenia na przynajmniej dwa pytania: jak wielu klientów korzysta z danego produkt? oraz, jaki odsetek wszystkich produktów wykorzystywanych przez klientów stanowi ten produkt? Możecie spytać — po co mi wiedza o tym drugim (o odsetku wskazań liczonym w stosunku do wszystkich odpowiedzi, a nie w stosunku do respondentów)? Np. ze względu na to, że chciałbym uwzględnić konkurencję pomiędzy produktami. Nie jest to oczywiście odpowiedź uniwersalna. W przypadku różnych badań interpretacja procentu odpowiedzi może wskazywać na nieco inne zależności. Niemniej, spróbuję zobrazować tę zależność dodatkowo takim oto przykładem. W badaniach na temat zachowań Polaków związanych ze spędzaniem wolnego czasu, realizowanych dla dużej sieci oferującej usługi turystyczne w krajach północnej Afryki, zadaję pytanie o kraje (regiony), które respondenci odwiedzili w ciągu ostatnich 3 lat podczas urlopu. Okazuje się, że najpopularniejszymi odpowiedziami są Egipt (40% respondentów), Tunezja (38%) i Krym (12%). Czy na podstawie tych informacji mogę, pomijając oczywiście dodatkowe czynniki, prognozować podobną popularność każdego z tych miejsc w kolejnych sezonach? Wątpliwe, powinienem spodziewać się raczej, iż znaczna część osób wskazujących „Egipt” była również w Tunezji (podobna jakość, cena i „bogactwo” oferty biur turystycznych, podobne upodobania co do spędzania urlopu, typu atrakcji, itp.), i że osoby te raczej nie były zainteresowane ofertą 34 godzinnej podróży koleją z Lwowa do Simferopola w celu zobaczenia na własne oczy największego popiersia Lenina na Ukrainie. Zatem, moim kontrahentom zaprezentuję obok procentu respondentów, również zazwyczaj niższy procent odpowiedzi, który w sposób niedoskonały, niemniej na początek wystarczająco dobry, pokaże im wielkości transferu turystów, którego mogą spodziewać się w najbliższej przyszłości. (Zaznaczam, że to pierwszy, a nie ostatni krok w analizie.) Powrócę teraz do przykładu, mając nadzieję, że powrót z ciepłych krajów do prozy produktów bankowych nie będzie zbyt bolesny. Poniżej zamieściłem wizualizację odpowiedzi na pytanie o korzystanie z produktów/usług bankowych. Nieco archaiczne, jak na dzisiejsze czasy, kategorie odpowiedzi wynikają z faktu, iż badania były realizowane w pierwszej połowie lat 90. 2 porady i wskazówki Tabela 1. Korzystanie z produktów Resp % Resp Odp % Odp Książeczka oszczędnościowa 127 57% 127 18% Kredyty na zakupy 82 37% 82 12% Regularne opłaty 70 32% 70 10% Wymiana walut 61 27% 61 9% Rachunek czekowy/ oszczędnościowo rozliczeniowy 50 23% 50 7% Rachunek terminowy 45 20% 45 6% Rachunek walutowy 44 20% 44 6% Przekazy krajowe 41 18% 41 6% Informacja 40 18% 40 6% Sprzedaż/skup bonów 21 9% 21 3% Inne 20 9% 20 3% Kredyty na działalność gospodarczą 17 8% 17 2% Czeki złotowe 16 7% 16 2% Przekazy z zagranicy 13 6% 13 2% Usługi maklerskie 12 5% 12 2% Przekazy za granicę 10 5% 10 1% Rachunek przedsiębiorstwa 10 5% 10 1% Czeki dewizowe 7 3% 7 1% Przyjmowanie utargów 4 2% 4 1% Karty kredytowe 4 2% 4 1% Kredyt (ogólnie) 0 0% 0 0% Kredyt mieszkaniowy 0 0% 0 0% 222 100% 694 100% Ogółem W zaprezentowanej tabeli „% Resp” oznacza procent respondentów, którzy korzystają z danego produktu, natomiast „% Odp” oznacza procent, jaki w stosunku do wszystkich odpowiedzi wszystkich respondentów stanowią wskazania na konkretny produkt. Statystyka „% Resp” nie sumuje się, co oczywiste, do 100% — respondent mógł udzielić więcej niż jednej odpowiedzi. Bazę procentowania dla „% Resp” odczytać można z wiersza „Ogółem” i kolumny „Resp” (222 respondentów), natomiast dla „% Odp” z tego samego wiersza i kolumny „Odp” (694 odpowiedzi). Wartości w kolumnach „Resp” i „Odp” są takie same, ponieważ każdy respondent mógł wskazać jeden produkt tylko raz. Wiersze tabeli posortowane są względem liczebności („Resp”) w porządku malejącym. krok po kroku Aby utworzyć taką tabelę, muszę w pierwszej kolejności wskazać zmienne wchodzące w skład zestawu wielokrotnych odpowiedzi. Do definiowania zestawu służy okno analiza tabele specjalne zestawy odpowiedzi… lub polecenie mrset. 3 porady i wskazówki Z listy po lewej stronie wybieram zmienne wchodzące w skład zestawu i przerzucam je przy pomocy strzałki na listę w centralnej części okna. W przykładzie korzystam ze zmiennych v45_1 do v45_16. Ponieważ zmienne, których używam, kodowane są na zasadzie mc (wielokrotne kategorie), poniżej listy zmiennych zaznaczam opcję „Kategorie”. W polu tekstowym „Nazwa zestawu” wpisuję nazwę nowego zestawu wielokrotnych odpowiedzi, natomiast w polu „Etykieta zestawu” wprowadzam dłuższy opis, który wykorzystam jako tytuł/nagłówek tabeli. W ostatnim kroku, przy pomocy przycisku dodaj wprowadzam zestaw na listę „Zestawy wielokrotnych odpowiedzi”. Wychodzę z okna przy pomocy przycisku ok, przez co zestaw zostaje utworzony a w oknie edytora raportów pojawia się obiekt tabelaryczny podsumowujący dotychczasowe działania. Skoro zestaw został zdefiniowany, mogę przejść do budowy tabeli w oknie analiza tabele specjalne tabele użytkownika. Zestaw wielokrotnych odpowiedzi na liście zmiennych widoczny jest jako standardowa zmienna — opisuje go nazwa i etykieta. Jedynym elementem wyróżniającym go na tej liście jest ikona — kwadrat z czterema polami wewnątrz, symbolizującymi wiele kategorii. Lista „Kategorie” prezentuje wszystkie opisane etykietami produkty/usługi zaprezentowane respondentom do wyboru. 4 porady i wskazówki Wybieram zestaw z listy i wrzucam go w obszar wierszy w obszarze roboczym. Następnie wchodzę do okna statystyki podsumowujące i wybieram odpowiednie miary. Lista statystyk dla zestawu wielokrotnych odpowiedzi różni się nieco od listy dla standardowych zmiennych jakościowych. Dodatkowymi miarami są w tym przypadku: Odpowiedzi — liczebność odpowiedzi, oraz szereg miar procentowych, wykorzystujących odpowiedzi jako bazę procentowania (np. % z odpowiedzi w kolumnie). W tym przykładzie skorzystam z dwóch miar standardowych: „Liczebności” oraz „% z N w kolumnie”, które nazywam odpowiednio „Resp” i „% Resp” aby zaznaczyć, iż dotyczą one respondentów. Ponadto skorzystam również z „Odpowiedzi” i „% z odpowiedzi w kolumnie”, które nazywam „Odp” i „% Odp”. Zmieniam też liczbę miejsc dziesiętnych prezentowanych dla miar procentowych. Klikam „Zastosuj do wybranej” i wracam do głównego okna kreatora. Teraz wchodzę w kategorie i podsumowania , aby ustalić porządek wyświetlania kategorii w boczku tabeli oraz wyświetlić podsumowania „Ogółem”. 5 Porządek sortowania wyznaczać będzie „Liczebność” — ustalam porządek na malejący. Zaznaczam też checkbox „Podsumowania ogółem” i akceptuję zmiany przyciskiem zastosuj. W ostatnim kroku eliminuję prezentowanie etykiety zestawu w boczku tabeli natomiast wprowadzam ją na karcie Tytuły w polu „Tytuł” (np. poprzez klikniecie przycisku „BY reguła” w prawym górnym rogu okna). Mogę też dodać numer tabeli wprowadzając go „żywym” tekstem. Więcej na temat konstruowania tabel w pasw Statistics można dowiedzieć się na kursie an 2 spss polsk a ul. Racławicka 58 30–017 Kraków tel./faks 012.636.96.80 e–mail: info @ spss.pl www.spss.pl www.analizadanych.pl www.webmining.pl Struktura tabeli prezentuje się w następujący sposób. Wystarczy teraz tylko kliknąć ok .