czwartek, 30 kwietnia 2015

Obserwacja statystyczna

Po ustaleniu celu badania statystycznego (diagnostycznego
i praktycznego), określeniu zbiorowości i jednostki statystycznej (pod względem rzeczowym, przestrzennym i czasowym), jak również dokonaniu wyboru odpowiedniej metody badania (pełnego lub częściowego) – można przystąpić do drugiego etapu, jakim jest obserwacja statystyczna.
Ogólnie rzecz biorąc, metody pozyskiwania danych można podzielić na dwie grupy (por. [19, s. 20], [21, s. 20]):
1. Metody korzystania z publikowanych źródeł informacji (odpłatne lub nieodpłatne pozyskiwanie informacji od jednostek sprawozdawczych).
2. Metody przeprowadzania własnego badania statystycznego (zob. gromadzenie informacji ze źródeł pierwotnych).
Zebrane w wyniku obserwacji statystycznej dane określa się mianem materiału statystycznego [19, s. 20], przy czym – w zależności od przyjętej metody gromadzenia danych – rozróżnia się [10, s. 32]:
1. Materiał statystyczny pierwotny – informacje do prowadzenia danego badania statystycznego uzyskiwane są drogą odrębnego badania. Informacje te pochodzą z tzw. źródeł pierwotnych w wyniku pomiaru bezpośredniego (zob. kwestionariusz).
2. Materiał statystyczny wtórny – materiał zaczerpnięty spoza statystycznych źródeł, zwanych źródłami wtórnymi, który został wykorzystany w badaniach statystycznych.
Wybrane wtórne źródła danych znajdują się w pliku dane_do_analizy.xls, stanowiącym integralną część niniejszego opracowania. Plik ten zawiera wybrane dane finansowe i dane społeczno-gospodarcze. Poniżej przedstawiono
przykłady wtórnych źródeł informacji:
Przykład 1. Jednostką sprawozdawczą dostarczającą co kwartał informacji o trzyletnich stopach zwrotu Otwartych Funduszy Emerytalnych jest Komisja Nadzoru Ubezpieczeń i Funduszy Emerytalnych ( http://www.knuife.gov.pl/).
Przykład 2. Spółki notowane na Giełdzie Papierów Wartościowych w Warszawie (http://www.gpw.pl) mają obowiązek sporządzania okresowych raportów finansowych.
Przykład 3. Jednostką sprawozdawczą prezentującą m.in. poziom stóp procentowych jest Narodowy Bank Polski (http://www.nbp.pl).
Przykład 4. Instytucją prezentującą dane o przestępczości w Polsce jest Komenda Główna Policji (http://www.kgp.gov.pl).
W tym miejscu warto zwrócić uwagę na szereg zniekształceń rzeczywistości, wynikających z błędnej interpretacji oficjalnych informacji pochodzących właśnie ze źródeł wtórnych. Oto następujące sytuacje:
Sytuacja 1. Oficjalny ranking najlepiej sprzedających się płyt CD (np. z oprogramowaniem edukacyjnym) nie musi odzwierciedlać nawet kolejności miejsc w rankingu. Dzieje się tak za sprawą „drugiego” – nieoficjalnego – obrotu nielegalnym oprogramowaniem, w wyniku czego ustalenie najbardziej popularnych programów komputerowych wymaga przeprowadzenia odrębnych badań wśród wybranej grupy respondentów (anonimowość ankiety sprzyja zakreślaniu odpowiedzi, jaki program ostatnio kupił ankietowany – nie wnika się przy tym, z jakiego źródła on pochodzi).
Sytuacja 2. Ustalenie faktycznej liczby rozwiedzionych rodzin jest praktycznie niemożliwe w oparciu o dane ze źródeł wtórnych – wiadomo bowiem, iż część rodzin rozwodzi się fikcyjnie („na papierze”) w celu otrzymania zasiłku dla matki samotnie wychowującej dziecko. W tym przypadku wiarygodnych informacji mogłaby dostarczyć anonimowa ankieta.
Sytuacja 3. Kwestią kłopotliwą jest określenie skali ruchu turystycznego w pewnej nadmorskiej miejscowości w oparciu o wpływy z podatku klimatycznego (np. 1 zł za dobę). Takie informacje nie uwzględniają osób, które specjalnie przyjeżdżają na jeden dzień do tej miejscowości (np. na organizowany koncert), czy też turystów znajdujących zakwaterowanie bez rejestracji i tym samym niepłacących podatku klimatycznego.
Ponadto należy pamiętać, iż źródła wtórne niekiedy dostarczają tylko pobieżnych informacji. I tak śledząc dostępne statystyki odwiedzin pewnego portalu internetowego można dowiedzieć się, ile procent odwiedzających to kobiety, jaka jest struktura wiekowa itp. Niestety, takie zbiorcze informacje nie pozwalają na określenie zależności np. pomiędzy wiekiem a płcią osob odwiedzających portal – tu konieczne jest dotarcie do danych niepogrupowanych.
Powyższe przykłady pokazują, iż mimo bogactwa informacji pochodzących ze źródeł wtórnych, niekiedy niezbędne jest dotarcie do informacji pochodzących ze źródeł pierwotnych. W kolejnym podrozdziale dokładniej omówiono organizację własnego badania statystycznego (gromadzenie informacji ze źródeł pierwotnych).
Tym, na co należy zwrócić uwagę przy studiowaniu niniejszego rozdziału – a o czym niejednokrotnie zdarza się zapominać na egzaminie – jest rodzaj danej cechy statystycznej i związany z nią typ skali pomiarowej. Jak już była mowa, pomiar cech ilościowych na skalach „słabszych” pociąga za sobą znaczną utratę informacji. Im silniejszy typ skali pomiarowej, tym więcej
miar statystycznych można obliczyć (zob. tabela 1.5).
Ponadto – w przypadku cech ilościowych – wybór odpowiedniej miary (skorzystanie z prawidłowego wzoru statystycznego) zależy od tego, czy dane są pogrupowane, a jeśli tak, to czy pogrupowano je w szereg rozdzielczy punktowy, czy też szereg rozdzielczy z przedziałami klasowymi.

W związku z powyższym – przy prezentowaniu miar opisu statystycznego podkreślono, czy dany wzór znajduje zastosowanie dla danych niepogrupowanych, czy też pogrupowanych w szereg rozdzielczy (punktowy lub z przedziałami klasowymi). Zwrócono też uwagę na typ skali pomiaru danych, umożliwiający zastosowanie określonej miary.
WIĘCEJ INFORMACJI W: Statystyka po ludzku