wtorek, 31 marca 2015

Określenie przedmiotu badania statystycznego

Mając ustalone cele badania statystycznego oraz hipotezy robocze – można
przejść do kolejnej czynności, jaką jest określenie zbiorowości i jednostki
statystycznej.
Zbiorowość statystyczna – zwana też populacją statystyczną lub
generalną – to „ogół osób, rzeczy bądź zjawisk będących przedmiotem
badań statystycznych” [3, s. 15]. Oto przegląd klasyfikacji populacji
statystycznych według wybranych kryteriów:
Klasyfikacja zbiorowości statystycznych pod kątem wybranych kryteriów.
Kryterium
klasyfikacji
Rodzaje zbiorowości statystycznych
I
Kryterium
jednorodności
jednostek zbiorowości
1. Zbiorowość jednorodna – wszystkie jednostki są tego
samego typu, rodzaju i gatunku.
2. Zbiorowość niejednorodna – jednostki rożnią się
cechami jakościowymi.
II
Charakter jednostek
zbiorowości
1. Zbiorowość statyczna – badanie na określony moment.
2. Zbiorowość dynamiczna – badanie w danym przedziale
czasowym.
III
Ilość badanych cech
1. Zbiorowość jednowymiarowa – badanie ze względu na
jedną cechę.
2. Zbiorowość wielowymiarowa – badanie ze względu na
wiele cech.
IV
Liczba elementów
zbiorowości
1. Zbiorowość skończenie liczna – ograniczona możliwa do
określenia liczba jednostek.
2. Zbiorowość nieskończenie liczna – nieograniczona pod
względem liczebności.
V
Zasięg (zakres)
1. Zbiorowość całkowita (populacja generalna).
2. Zbiorowość próbna (próba).
Jednostka statystyczna – zwana też jednostką badania lub obserwacją – to
„najmniejszy element zbiorowości statystycznej” [3, s. 15].
Wchodzące w skład badanej zbiorowości jednostki statystyczne odznaczają
się pewnymi właściwościami, określanymi mianem cech statystycznych
[19, s. 12]. Oto szczegółowa klasyfikacja cech statystycznych:
Rysunek 1.1. Klasyfikacja cech statystycznych.
Źródło: Opracowanie własne na podstawie: [2, s. 26-28], [3, s. 18].
Ogólnie rzecz biorąc, cechy statystyczne można podzielić na dwie grupy
[21, s. 15]:
1. CECHY STAŁE – własności wspólne wszystkim jednostkom badanej
zbiorowości statystycznej.
2. CECHY ZMIENNE – własności, dzięki którym poszczególne jednostki
różnią się między sobą, przy czym dokładny stopień zmienności poszczególnych
cech jest możliwy lub niemożliwy do określenia.
Cechy stałe służą do określenia jednostki statystycznej, a tym samym zbiorowości
statystycznej, pod względem rzeczowym, przestrzennym i czasowym
i nie podlegają badaniu statystycznemu (pełnią rolę „klasyfikatorów”)
[19, s. 12]. Zatem jednostką statystyczną jest „każdy element wchodzący
w skład zbiorowości statystycznej i posiadający – tak jak wszystkie jednostki
tej zbiorowości – tę samą lub te same cechy stałe” [2, s. 25]. Wyróżnia
się następujące typy cech stałych [2, s. 26-27]:
1. Cechy rzeczowe (przedmiotowe) – właściwości, którymi charakteryzuje
się ściśle określony zbiór osób, rzeczy lub zjawisk. Cecha rzeczowa
precyzuje, kto lub co jest przedmiotem badania statystycznego.
2. Cechy przestrzenne – informują o tym, z jakiego miejsca lub obszaru
pochodzą jednostki włączone do badania statystycznego.
3. Cechy czasowe – określają, z jakiego okresu lub momentu włączono
daną jednostkę w skład zbiorowości statystycznej.
M. Sobczyk podkreśla, iż w tej samej zbiorowości można wyodrębnić rożne
jednostki statystyczne [19, s. 12]. Wybór właściwej jednostki statystycznej
zależy głownie od określonego celu badania statystycznego, co ukazują
poniższe przykłady:
Przykład 1. Celem badania statystycznego jest określenie struktury liczby
uczestników Otwartych Funduszy Inwestycyjnych (FIO), które inwestują
powierzone środki na krajowym rynku papierów wartościowych. Raport
ma dotyczyć stanu na koniec 2005 roku. Oto jak zostały określone cechy
stałe (zob. rys. 1.1):
1. Cecha rzeczowa informuje, iż przedmiotem badania jest struktura liczby
osób lokujących środki finansowe w Otwartych Funduszach Inwestycyjnych
(FIO).
2. Cecha przestrzenna zawęża krąg analizy do polskich funduszy inwestujących
w krajowe papiery wartościowe.
3. Cecha czasowa określa moment w czasie, czyli dane za rok 2005.
Rysunek 1.2. Przykład określenia zbiorowości i jednostek statystycznych według cech
stałych.
Źródło: Opracowanie własne.
Z powyższego schematu wynika, iż jednostkami statystycznymi wchodzącymi
w skład oznaczonej kolorem niebieskim populacji generalnej są poszczególne
Fundusze Inwestycyjne Otwarte, lokujące powierzone środki wyłącznie na rynku krajowym (stąd nie uwzględniono funduszu „Z”) i prowadzące
działalność w 2005 roku (nie uwzględniamy w analizie funduszy,
które powstały w trakcie 2005 roku) – łącznie 18 jednostek statystycznych.
W wyniku analizy statystycznej – zgodnie z celem tego badania – otrzyma
się rozkład liczby uczestników FIO w zależności od klasy ryzyka funduszu
(zob. miary natężenia i struktury).
Innym celem jest porównanie dynamiki liczby uczestników Funduszu „A”
Zrównoważonego z Funduszem „A” Akcji w latach 2000-2005 (zob. anali -
za dynamiki). Celem praktycznym jest określenie zmian w preferencjach
odnośnie tych dwóch funduszy i odpowiednie przygotowanie oferty promocyjnej.
Porównywane będą dwie populacje:
1. Jako cechę rzeczową przyjęto odpowiednio FIO „A” Zrównoważony
(pierwsza populacja) i FIO „A” Akcji (druga populacja).
2. W tym przypadku nie ma potrzeby określania cechy przestrzennej, ponieważ
wybrane fundusze działają na określonym rynku.
3. Cecha czasowa jest wspólna dla obu porównywanych populacji – jest
nią zakres czasowy określony na lata 2000-2005.
W tej sytuacji jednostką statystyczną (obserwacją) jest konkretny punkt danych
w przekroju czasowym – liczba obserwacji jest równa liczbie lat objętych
analizą. Należy zaznaczyć, iż możliwe jest porównywanie funduszy,
ktore działają na rynku w określonym czasie (np. porównanie z FIO „E”
Akcji ogranicza analizę do lat 2002-2005).
Przykład 2. Celem badania jest analiza dziennych zmian procentowych indeksu
największych polskich spółek WIG 20 w określonym czasie:
1. Cecha rzeczowa określa przedmiot analizy, czyli procentowe dzienne
zmiany indeksu WIG 20 (można dokonać porównań z innymi indeksami
giełdowymi, np. WIG-iem).
2. Cecha przestrzenna precyzuje, iż chodzi o GPW w Warszawie.
3. Cecha czasowa określa liczbę sesji giełdowych (np. 50 ostatnich sesji).
W tej sytuacji jednostką statystyczną jest sesja giełdowa. Celem analizy
może być także ustalenie, jakie spółki w danym dniu wpłynęły pozytywnie
na poziom badanego indeksu. Należy wyjaśnić, iż indeks ten jest wypadkową
zmian kursów akcji 20 największych spółek wchodzących w jego skład.
Oto określenie cech stałych:
1. Cecha rzeczowa – procentowe dzienne zmiany kursów akcji spółek
WIG 20.
2. Cecha przestrzenna – GPW w Warszawie.
3. Cecha czasowa – określenie sesji giełdowej (np. ostatnia sesja).
W tej sytuacji jednostką statystyczną nie będzie już sesja giełdowa, lecz
spółka zaliczana do indeksu WIG 20. Nietrudno zauważyć, iż istnieje dwadzieścia
jednostek statystycznych (w skład WIG 20 wchodzi bowiem dwadzieścia
spółek).
Przykład 3. Celem badania statystycznego jest analiza wyników egzaminu
ze statystyki w semestrze letnim roku akademickiego 2005/2006 na studiach
dziennych uczelni państwowych. Populację generalną określono pod
względem cech stałych następująco:
1. Cecha rzeczowa – studenci studiów dziennych uczelni państwowych,
którzy w semestrze letnim przystąpili do egzaminu ze statystyki (możliwe
porównanie ze studiami wieczorowymi i zaocznymi).
2. Cecha przestrzenna – osoby studiujące na terytorium RP (wyniki można
porównać np. z innymi krajami Unii Europejskiej).
3. Cecha czasowa – semestr letni roku akademickiego 2005/2006 (wyniki
analizy można np. porównać z analogicznym okresem roku poprzedniego).
Jednostki statystyczne w tym przypadku tworzą studenci studiow dziennych
polskich uczelni państwowych, którzy w semestrze letnim w roku
akademickim 2005/2006 przystąpili do egzaminu ze statystyki.
Druga grupa cech statystycznych to cechy zmienne – podlegają one badaniu
statystycznemu [19, s. 12]. Należą do nich trzy kategorie cech, a mianowicie
(zob. rys. 1.1):
1. Cecha jakościowa (nominalna) to „niemierzalna właściwość, ktorej
konkretny wariant występuje lub nie występuje w danej zbiorowości
i nie dając wyrażać się liczbowo, daje się opisać jedynie za pomocą
określeń słownych” [2, s. 28]. Wariantów cech nominalnych (zob. skala
no minalna ) nie da się uporządkować (por. [20, s. 22]).
2. Cecha quasi-ilościowa (niby-ilościowa, porządkowa) to „właściwość,
która określa natężenie badanej cechy u poszczególnych jednostek danej
zbiorowości w sposób opisowy” [2, s. 28]. Warianty cech porządkowych
(zob. skala porządkowa) – w przeciwieństwie do wariantów cech
nominalnych – można uporządkować (por. [20, s. 22]). Cechy
porządkowe – w bardziej ogólnej klasyfikacji – zaliczane są do cech
jakościowych. Istotne jest to, iż warianty cech jakościowych wyrażone
są za pomocą określeń słownych (werbalnych). Przypisywane niekiedy
cechom jakościowym (nominalnym lub porządkowym) liczby nie
wyrażają bowiem ich wartości – pełnią jedynie rolę „etykiet” (por. [3, s.
18]). Przyjęta w niniejszej publikacji szczegółowa klasyfikacja cech
statystycznych – wyodrębniająca cechy quasi-ilościowe – ma za zadanie
ułatwienie doboru skal pomiarowych w zależności od rodzaju cechy
statystycznej.
3. Cecha ilościowa to „mierzalna właściwość, występująca z określonym
natężeniem u wszystkich jednostek zbiorowości statystycznej” [2, s.
27]. Właściwości cech ilościowych – określanych też mianem cech mierzalnych
– można mierzyć za pomocą liczb mianowanych typu: metry,
kilogramy, sztuki, lata, jednostki pieniężne, czas itp. (por. skala prze -
działowa i skala ilorazowa). Do cech ilościowych należą [3, s. 18]:
cecha skokowa – warianty tej cechy wyrażone są za pomocą liczb
należących do zbioru przeliczalnego lub skończonego (typową jednostką
miary są sztuki/liczby naturalne),
cecha quasi-ciągła (niby-ciągła) – cecha ze swej natury skokowa,
ale z uwagi na bardzo dużą liczbę przyjmowanych wartości liczbowych
traktowana jako cecha ciągła. Różnica między kolejnymi wartościami
liczbowymi jest niewielka (np. ceny wyrażone z dokładnością
do jednego grosza).
cecha ciągła – cecha, której warianty wyrażone są za pomocą liczb
rzeczywistych, gdzie pomiędzy dwiema dowolnymi wartościami
liczbowymi danej cechy można teoretycznie zawsze znaleźć wartość
pośrednią cechy (typowymi jednostkami miary cech ciągłych są
m.in.: czas, metry, kilogramy, wiek).
Należy podkreślić, iż warunkiem zaklasyfikowania danej cechy do cech
skokowych nie jest fakt, iż jej warianty występują w postaci liczb całkowitych.
Przykładem mogą być oceny z egzaminu: 3; 3,5 (3+); 4; 4,5 (4+); 5.
Mimo że cecha ta nie przyjmuje wyłącznie liczb całkowitych (np. tak jak
miałoby to miejsce w przypadku liczby nieobecności w szkole), to – z uwagi
na niewielką liczbę możliwych wariantów – jest ona cechą skokową.
Przy charakterystyce cech statystycznych kilkakrotnie pojawiło się pojęcie
wariantu cechy. Wariant cechy statystycznej jest „informacją uzyskaną
o jednostce statystycznej w trakcie badania statystycznego” [7, s. 10].
Z uwagi na liczbę możliwych wariantów, cechy statystyczne dzieli się na
[20, s. 22]:
cechy dychotomiczne (zero-jedynkowe) – cecha może przyjąć tylko dwa
warianty.
cechy wielodzielne (politomiczne) – przyjmują więcej niż dwa warianty.
Liczba wariantów danej cechy może być co najwyżej równa liczbie jednostek
wchodzących w skład określonej zbiorowości statystycznej – jest to
możliwe w przypadku cech ciągłych. Zazwyczaj jednak liczba wariantów
jest mniejsza od liczby jednostek, ponieważ identyczny wariant cechy może
występować u kilku jednostek statystycznych (por. [19, s. 13]). Oto
przykłady identyfikacji rodzaju cech statystycznych (zmiennych):
Przykład 1. Nawiązując do prezentowanego wcześniej przykładu z Funduszami
Inwestycyjnymi Otwartymi (zob. rys. 1.2), należy ustalić – po określeniu
jednostki i zbiorowości statystycznej – typy cech statystycznych.
Przykład ilustruje rys. 1.3:
Rysunek 1.3. Przykłady cech statystycznych.
Źródło: Opracowanie własne (dane umowne).
Zbiorowość statystyczna została określona pod względem rzeczowym (co
jest przedmiotem badania), przestrzennym (teren badania) oraz czasowym
(moment badania określony na 2005 rok). Tak określona zbiorowość
składa się z 18 jednostek statystycznych, którymi są poszczególne
Fundusze Inwestycyjne Otwarte lokujące środki finansowe na krajowym
rynku w 2005 roku. Wybraną jednostkę statystyczną zaznaczono żółtym
kolorem. Każda jednostka posiada szereg właściwości, czyli zmiennych
cech statystycznych. Dwie pierwsze, „Nazwa funduszu” i „Klasa ryzyka”,
mają jakościowy charakter, ponieważ ich warianty dają się opisać w sposób
słowny. Pogrubionym kolorem zaznaczono jeden z wariantów cechy
„Klasa ryzyka” – cecha ta jest cechą quasi-ilościową (porządkową),
ponieważ jej warianty można uporządkować pod kątem stopnia ryzyka
(niemniej jednak w innych analizach, gdzie ryzyko nie ma znaczenia, cecha
ta jest cechą nominalną). „Stopa zwrotu” nie jest cechą quasi-ciągłą,
ponieważ teoretycznie można ją wyznaczyć z nieskończenie dużą precyzją
– jest to iloraz ceny jednostki uczestnictwa z końca do ceny z początku
2005 roku. Natomiast ceny z definicji podaje się z dokładnością do
1 grosza.
Przykład 2. Celem badania statystycznego jest analiza rynku mieszkań
w tzw. standardzie deweloperskim w Polsce. Oto zestaw cech statystycznych
branych pod uwagę:
1. Nazwa województwa – cecha jakościowa nominalna.
2. Ilość pokoi – cecha ilościowa skokowa.
3. Cena mieszkania (zł/m2) – cecha ilościowa quasi-ciągła.
Przykład 3. Przedmiotem badania statystycznego jest określenie czynników
wpływających na wyniki egzaminu ze statystyki. Jako cechę zależną
przyjęto liczbę punktów uzyskanych na egzaminie (cecha ilościowa quasi- ciągła – punkty mierzone w skali od zera do 100 z dokładnością do 0,1).
Oto zestaw zmiennych objaśniających:
1. Liczba nieobecności na zajęciach – cecha ilościowa skokowa.
2. Przeciętna liczba godzin poświęconych nauce statystyki tygodniowo –
jw.
3. Preferencje co do przedmiotu statystyka (nudny, ciekawy) – cecha porządkowa.
4. Płeć studenta – cecha jakościowa (nominalna).
Reasumując, zbiorowość statystyczną tworzą poszczególne jednostki statystyczne, posiadające określone cechy statystyczne. O ile cechy stałe
wspólne wszystkim jednostkom badania statystycznego – służą do określenia
zbiorowości, o tyle cechy zmienne podlegają badaniu. Należy ustalić,
czy będzie ono obejmowało wszystkie jednostki, czy tylko wybrane z nich,

a następnie dokonać wyboru adekwatnej metody badania.
WIĘCEJ INFORMACJI W: Statystyka po ludzku