Po ustaleniu celu badania statystycznego (diagnostycznego
i praktycznego), określeniu zbiorowości i jednostki
statystycznej (pod względem rzeczowym, przestrzennym i czasowym), jak również
dokonaniu wyboru odpowiedniej metody badania (pełnego lub częściowego) – można przystąpić
do drugiego etapu, jakim jest obserwacja
statystyczna.
Ogólnie rzecz biorąc, metody pozyskiwania danych
można podzielić na dwie grupy (por. [19, s. 20], [21, s. 20]):
1. Metody korzystania z publikowanych źródeł
informacji (odpłatne lub nieodpłatne pozyskiwanie informacji od jednostek
sprawozdawczych).
2. Metody przeprowadzania własnego badania
statystycznego (zob. gromadzenie informacji ze źródeł pierwotnych).
Zebrane w wyniku obserwacji statystycznej dane
określa się mianem materiału statystycznego [19, s. 20], przy czym – w
zależności od przyjętej metody gromadzenia danych – rozróżnia się [10, s. 32]:
1. Materiał statystyczny pierwotny – informacje
do prowadzenia danego badania statystycznego uzyskiwane są drogą odrębnego
badania. Informacje te pochodzą z tzw. źródeł pierwotnych w wyniku pomiaru bezpośredniego
(zob. kwestionariusz).
2. Materiał statystyczny wtórny – materiał
zaczerpnięty spoza statystycznych źródeł, zwanych źródłami wtórnymi, który
został wykorzystany w badaniach statystycznych.
Wybrane wtórne źródła danych znajdują się w
pliku dane_do_analizy.xls, stanowiącym integralną część niniejszego
opracowania. Plik ten zawiera wybrane dane finansowe i dane społeczno-gospodarcze.
Poniżej przedstawiono
przykłady wtórnych źródeł informacji:
Przykład 1. Jednostką sprawozdawczą
dostarczającą co kwartał informacji o trzyletnich stopach zwrotu Otwartych
Funduszy Emerytalnych jest Komisja Nadzoru Ubezpieczeń i Funduszy Emerytalnych
( http://www.knuife.gov.pl/).
Przykład 2. Spółki notowane na Giełdzie Papierów
Wartościowych w Warszawie (http://www.gpw.pl) mają obowiązek sporządzania
okresowych raportów finansowych.
Przykład 3. Jednostką sprawozdawczą prezentującą
m.in. poziom stóp procentowych jest Narodowy Bank Polski (http://www.nbp.pl).
Przykład 4. Instytucją prezentującą dane o
przestępczości w Polsce jest Komenda Główna Policji (http://www.kgp.gov.pl).
W tym miejscu warto zwrócić uwagę na szereg
zniekształceń rzeczywistości, wynikających z błędnej interpretacji oficjalnych
informacji pochodzących właśnie ze źródeł wtórnych. Oto następujące sytuacje:
Sytuacja 1. Oficjalny ranking najlepiej
sprzedających się płyt CD (np. z oprogramowaniem edukacyjnym) nie musi
odzwierciedlać nawet kolejności miejsc w rankingu. Dzieje się tak za sprawą
„drugiego” – nieoficjalnego – obrotu nielegalnym oprogramowaniem, w wyniku
czego ustalenie najbardziej popularnych programów komputerowych wymaga przeprowadzenia
odrębnych badań wśród wybranej grupy respondentów (anonimowość ankiety sprzyja
zakreślaniu odpowiedzi, jaki program ostatnio kupił ankietowany – nie wnika się
przy tym, z jakiego źródła on pochodzi).
Sytuacja 2. Ustalenie faktycznej liczby
rozwiedzionych rodzin jest praktycznie niemożliwe w oparciu o dane ze źródeł
wtórnych – wiadomo bowiem, iż część rodzin rozwodzi się fikcyjnie („na
papierze”) w celu otrzymania zasiłku dla matki samotnie wychowującej dziecko. W
tym przypadku wiarygodnych informacji mogłaby dostarczyć anonimowa ankieta.
Sytuacja 3. Kwestią kłopotliwą jest określenie
skali ruchu turystycznego w pewnej nadmorskiej miejscowości w oparciu o wpływy
z podatku klimatycznego (np. 1 zł za dobę). Takie informacje nie uwzględniają
osób, które specjalnie przyjeżdżają na jeden dzień do tej miejscowości (np. na
organizowany koncert), czy też turystów znajdujących zakwaterowanie bez
rejestracji i tym samym niepłacących podatku klimatycznego.
Ponadto należy pamiętać, iż źródła wtórne
niekiedy dostarczają tylko pobieżnych informacji. I tak śledząc dostępne
statystyki odwiedzin pewnego portalu internetowego można dowiedzieć się, ile
procent odwiedzających to kobiety, jaka jest struktura wiekowa itp. Niestety,
takie zbiorcze informacje nie pozwalają na określenie zależności np. pomiędzy
wiekiem a płcią osob odwiedzających portal – tu konieczne jest dotarcie do
danych niepogrupowanych.
Powyższe przykłady pokazują, iż mimo bogactwa
informacji pochodzących ze źródeł wtórnych, niekiedy niezbędne jest dotarcie do
informacji pochodzących ze źródeł pierwotnych. W kolejnym podrozdziale
dokładniej omówiono organizację własnego badania statystycznego (gromadzenie informacji ze źródeł pierwotnych).
Tym, na co należy zwrócić uwagę przy studiowaniu
niniejszego rozdziału – a o czym niejednokrotnie zdarza się zapominać na
egzaminie – jest rodzaj danej cechy statystycznej i związany z nią typ skali
pomiarowej. Jak już była mowa, pomiar cech ilościowych na skalach „słabszych”
pociąga za sobą znaczną utratę informacji. Im silniejszy typ skali pomiarowej,
tym więcej
miar statystycznych można obliczyć (zob. tabela 1.5).
Ponadto – w przypadku cech ilościowych – wybór
odpowiedniej miary (skorzystanie z prawidłowego wzoru statystycznego) zależy od
tego, czy dane są pogrupowane, a jeśli tak, to czy pogrupowano je w szereg
rozdzielczy punktowy, czy też szereg rozdzielczy z przedziałami klasowymi.
W związku z powyższym – przy prezentowaniu miar
opisu statystycznego podkreślono, czy dany wzór znajduje zastosowanie dla
danych niepogrupowanych, czy też pogrupowanych w szereg rozdzielczy (punktowy
lub z przedziałami klasowymi). Zwrócono też uwagę na typ skali pomiaru danych, umożliwiający
zastosowanie określonej miary.