Mając ustalone cele badania statystycznego oraz hipotezy robocze –
można
przejść do kolejnej czynności, jaką jest określenie zbiorowości i
jednostki
statystycznej.
Zbiorowość statystyczna – zwana też populacją statystyczną lub
generalną – to „ogół osób, rzeczy bądź zjawisk będących
przedmiotem
badań statystycznych” [3, s. 15]. Oto przegląd klasyfikacji
populacji
statystycznych według wybranych kryteriów:
Klasyfikacja zbiorowości statystycznych pod kątem
wybranych kryteriów.
Kryterium
klasyfikacji
Rodzaje zbiorowości statystycznych
I
Kryterium
jednorodności
jednostek
zbiorowości
1.
Zbiorowość jednorodna – wszystkie jednostki są tego
samego
typu, rodzaju i gatunku.
2.
Zbiorowość niejednorodna – jednostki rożnią się
cechami
jakościowymi.
II
Charakter
jednostek
zbiorowości
1.
Zbiorowość statyczna – badanie na określony moment.
2.
Zbiorowość dynamiczna – badanie w danym przedziale
czasowym.
III
Ilość
badanych cech
1.
Zbiorowość jednowymiarowa – badanie ze względu na
jedną
cechę.
2.
Zbiorowość wielowymiarowa – badanie ze względu na
wiele
cech.
IV
Liczba
elementów
zbiorowości
1.
Zbiorowość skończenie liczna – ograniczona możliwa do
określenia
liczba jednostek.
2.
Zbiorowość nieskończenie liczna – nieograniczona pod
względem
liczebności.
V
Zasięg
(zakres)
1.
Zbiorowość całkowita (populacja generalna).
2. Zbiorowość próbna (próba).
Jednostka statystyczna – zwana też jednostką badania lub obserwacją –
to
„najmniejszy element zbiorowości statystycznej” [3, s. 15].
Wchodzące w skład badanej zbiorowości jednostki statystyczne
odznaczają
się pewnymi właściwościami, określanymi mianem cech statystycznych
[19, s. 12]. Oto szczegółowa
klasyfikacja cech statystycznych:
Rysunek 1.1. Klasyfikacja cech
statystycznych.
Źródło: Opracowanie własne na podstawie: [2, s. 26-28], [3, s. 18].
Ogólnie rzecz biorąc, cechy statystyczne można podzielić na dwie
grupy
[21, s. 15]:
1. CECHY STAŁE – własności wspólne wszystkim jednostkom badanej
zbiorowości statystycznej.
2. CECHY ZMIENNE – własności, dzięki którym poszczególne jednostki
różnią się między sobą, przy czym dokładny stopień zmienności poszczególnych
cech jest możliwy lub niemożliwy do określenia.
Cechy stałe służą do określenia jednostki statystycznej, a
tym samym zbiorowości
statystycznej, pod względem rzeczowym, przestrzennym i czasowym
i nie podlegają badaniu statystycznemu (pełnią rolę „klasyfikatorów”)
[19, s. 12]. Zatem
jednostką statystyczną jest „każdy element wchodzący
w skład zbiorowości statystycznej i posiadający – tak jak
wszystkie jednostki
tej zbiorowości – tę samą lub te same cechy stałe” [2, s. 25]. Wyróżnia
się następujące typy cech stałych [2, s. 26-27]:
1. Cechy rzeczowe (przedmiotowe) – właściwości, którymi
charakteryzuje
się ściśle określony zbiór osób, rzeczy lub zjawisk. Cecha
rzeczowa
precyzuje, kto lub co jest przedmiotem badania statystycznego.
2. Cechy przestrzenne – informują o tym, z jakiego miejsca lub obszaru
pochodzą jednostki włączone do badania statystycznego.
3. Cechy czasowe – określają, z jakiego okresu lub momentu włączono
daną jednostkę w skład zbiorowości statystycznej.
M. Sobczyk podkreśla, iż w tej samej zbiorowości można wyodrębnić
rożne
jednostki statystyczne [19, s. 12]. Wybór właściwej
jednostki statystycznej
zależy głownie od określonego celu badania statystycznego, co ukazują
poniższe przykłady:
Przykład 1. Celem badania statystycznego jest określenie
struktury liczby
uczestników Otwartych Funduszy Inwestycyjnych (FIO), które
inwestują
powierzone środki na krajowym rynku papierów wartościowych. Raport
ma dotyczyć stanu na koniec 2005 roku. Oto jak zostały określone
cechy
stałe (zob. rys. 1.1):
1.
Cecha rzeczowa informuje, iż przedmiotem badania jest struktura liczby
osób
lokujących środki finansowe w Otwartych Funduszach Inwestycyjnych
(FIO).
2.
Cecha przestrzenna zawęża krąg analizy do polskich funduszy inwestujących
w
krajowe papiery wartościowe.
3.
Cecha czasowa określa moment w czasie, czyli dane za rok 2005.
Rysunek 1.2. Przykład określenia zbiorowości i
jednostek statystycznych według cech
stałych.
Źródło: Opracowanie własne.
Z
powyższego schematu wynika, iż jednostkami statystycznymi wchodzącymi
w
skład oznaczonej kolorem niebieskim populacji generalnej są poszczególne
Fundusze
Inwestycyjne Otwarte, lokujące powierzone środki wyłącznie
na rynku krajowym (stąd nie uwzględniono funduszu „Z”) i prowadzące
działalność w 2005 roku (nie uwzględniamy w analizie funduszy,
które powstały w trakcie 2005 roku) – łącznie 18 jednostek
statystycznych.
W wyniku analizy statystycznej – zgodnie z celem tego badania –
otrzyma
się rozkład liczby uczestników FIO w zależności od klasy ryzyka
funduszu
(zob. miary natężenia i
struktury).
Innym celem jest porównanie dynamiki liczby uczestników Funduszu „A”
Zrównoważonego z Funduszem „A” Akcji w latach 2000-2005 (zob. anali -
za dynamiki). Celem
praktycznym jest określenie zmian w preferencjach
odnośnie tych dwóch funduszy i odpowiednie przygotowanie oferty
promocyjnej.
Porównywane będą dwie populacje:
1. Jako cechę rzeczową przyjęto odpowiednio FIO „A” Zrównoważony
(pierwsza populacja) i FIO „A” Akcji (druga populacja).
2. W tym przypadku nie ma potrzeby określania cechy przestrzennej, ponieważ
wybrane fundusze działają na określonym rynku.
3. Cecha czasowa jest wspólna dla obu porównywanych populacji –
jest
nią zakres czasowy określony na lata 2000-2005.
W tej sytuacji jednostką statystyczną (obserwacją) jest konkretny
punkt danych
w przekroju czasowym – liczba obserwacji jest równa liczbie lat
objętych
analizą. Należy zaznaczyć, iż możliwe jest porównywanie funduszy,
ktore działają na rynku w określonym czasie (np. porównanie z FIO „E”
Akcji ogranicza analizę do lat 2002-2005).
Przykład 2. Celem badania jest analiza dziennych zmian
procentowych indeksu
największych polskich spółek WIG 20 w określonym
czasie:
1.
Cecha rzeczowa określa przedmiot analizy, czyli procentowe dzienne
zmiany
indeksu WIG 20 (można dokonać porównań z innymi indeksami
giełdowymi,
np. WIG-iem).
2.
Cecha przestrzenna precyzuje, iż chodzi o GPW w Warszawie.
3.
Cecha czasowa określa liczbę sesji giełdowych (np. 50 ostatnich sesji).
W
tej sytuacji jednostką statystyczną jest sesja giełdowa. Celem analizy
może
być także ustalenie, jakie spółki w danym dniu wpłynęły pozytywnie
na
poziom badanego indeksu. Należy wyjaśnić, iż indeks ten jest wypadkową
zmian
kursów akcji 20 największych spółek wchodzących w jego skład.
Oto
określenie cech stałych:
1.
Cecha rzeczowa – procentowe dzienne zmiany kursów akcji spółek
WIG
20.
2.
Cecha przestrzenna – GPW w Warszawie.
3.
Cecha czasowa – określenie sesji giełdowej (np. ostatnia sesja).
W
tej sytuacji jednostką statystyczną nie będzie już sesja giełdowa, lecz
spółka
zaliczana do indeksu WIG 20. Nietrudno zauważyć, iż istnieje dwadzieścia
jednostek
statystycznych (w skład WIG 20 wchodzi bowiem dwadzieścia
spółek).
Przykład 3. Celem
badania statystycznego jest analiza wyników egzaminu
ze
statystyki w semestrze letnim roku akademickiego 2005/2006 na studiach
dziennych
uczelni państwowych. Populację generalną określono pod
względem
cech stałych następująco:
1.
Cecha rzeczowa – studenci studiów dziennych uczelni państwowych,
którzy
w semestrze letnim przystąpili do egzaminu ze statystyki (możliwe
porównanie ze studiami wieczorowymi i zaocznymi).
2. Cecha przestrzenna – osoby studiujące na terytorium RP (wyniki można
porównać np. z innymi krajami Unii Europejskiej).
3. Cecha czasowa – semestr letni roku akademickiego 2005/2006
(wyniki
analizy można np. porównać z analogicznym okresem roku
poprzedniego).
Jednostki statystyczne w tym przypadku tworzą studenci studiow
dziennych
polskich uczelni państwowych, którzy w semestrze letnim w roku
akademickim 2005/2006 przystąpili do egzaminu ze statystyki.
Druga grupa cech statystycznych to cechy zmienne – podlegają one badaniu
statystycznemu [19, s.
12]. Należą do nich trzy
kategorie cech, a mianowicie
(zob. rys. 1.1):
1. Cecha jakościowa (nominalna) to „niemierzalna właściwość, ktorej
konkretny wariant występuje lub nie występuje w danej zbiorowości
i nie dając wyrażać się liczbowo, daje się opisać jedynie za pomocą
określeń słownych” [2, s. 28]. Wariantów cech
nominalnych (zob. skala
no minalna ) nie da
się uporządkować (por. [20, s. 22]).
2. Cecha quasi-ilościowa (niby-ilościowa, porządkowa) to „właściwość,
która określa natężenie badanej cechy u poszczególnych jednostek
danej
zbiorowości w sposób opisowy” [2, s. 28]. Warianty cech porządkowych
(zob. skala porządkowa) – w przeciwieństwie do wariantów cech
nominalnych – można uporządkować (por. [20, s. 22]). Cechy
porządkowe – w bardziej ogólnej klasyfikacji – zaliczane są do cech
jakościowych. Istotne jest to, iż warianty cech jakościowych
wyrażone
są za pomocą określeń słownych (werbalnych). Przypisywane niekiedy
cechom jakościowym (nominalnym lub porządkowym) liczby nie
wyrażają bowiem ich wartości – pełnią jedynie rolę „etykiet” (por.
[3, s.
18]). Przyjęta w niniejszej
publikacji szczegółowa klasyfikacja cech
statystycznych – wyodrębniająca cechy quasi-ilościowe – ma za zadanie
ułatwienie doboru skal
pomiarowych w zależności od rodzaju
cechy
statystycznej.
3. Cecha ilościowa to „mierzalna właściwość, występująca z określonym
natężeniem u wszystkich jednostek zbiorowości statystycznej” [2, s.
27]. Właściwości cech ilościowych
– określanych też mianem cech mierzalnych
– można mierzyć za pomocą liczb mianowanych typu: metry,
kilogramy, sztuki, lata, jednostki pieniężne, czas itp. (por. skala prze -
działowa i skala ilorazowa). Do cech ilościowych należą [3, s. 18]:
► cecha skokowa – warianty tej cechy wyrażone są za pomocą liczb
należących do zbioru przeliczalnego lub skończonego (typową
jednostką
miary są sztuki/liczby naturalne),
► cecha quasi-ciągła
(niby-ciągła) – cecha ze swej natury skokowa,
ale z uwagi na bardzo dużą liczbę przyjmowanych wartości
liczbowych
traktowana jako cecha ciągła. Różnica między kolejnymi wartościami
liczbowymi jest niewielka (np. ceny wyrażone z dokładnością
do jednego grosza).
► cecha ciągła – cecha, której warianty wyrażone są za pomocą
liczb
rzeczywistych, gdzie pomiędzy dwiema dowolnymi wartościami
liczbowymi danej cechy można teoretycznie zawsze znaleźć wartość
pośrednią cechy (typowymi jednostkami miary cech ciągłych są
m.in.: czas, metry, kilogramy, wiek).
Należy podkreślić, iż warunkiem zaklasyfikowania danej cechy do cech
skokowych nie jest fakt, iż jej warianty występują w
postaci liczb całkowitych.
Przykładem mogą być oceny z egzaminu: 3; 3,5 (3+); 4; 4,5 (4+); 5.
Mimo że cecha ta nie przyjmuje wyłącznie liczb całkowitych (np.
tak jak
miałoby to miejsce w przypadku liczby nieobecności w szkole), to –
z uwagi
na niewielką liczbę możliwych wariantów – jest ona cechą skokową.
Przy charakterystyce cech statystycznych kilkakrotnie pojawiło się
pojęcie
wariantu cechy. Wariant cechy statystycznej jest „informacją uzyskaną
o jednostce statystycznej w trakcie badania statystycznego” [7, s. 10].
Z uwagi na liczbę możliwych wariantów, cechy statystyczne dzieli
się na
[20, s. 22]:
► cechy
dychotomiczne (zero-jedynkowe) – cecha może przyjąć tylko dwa
warianty.
► cechy
wielodzielne (politomiczne) – przyjmują więcej niż dwa warianty.
Liczba wariantów danej cechy może być co najwyżej równa liczbie
jednostek
wchodzących w skład określonej zbiorowości statystycznej – jest to
możliwe w przypadku cech ciągłych. Zazwyczaj jednak liczba wariantów
jest mniejsza od liczby jednostek, ponieważ identyczny wariant
cechy może
występować u kilku jednostek statystycznych (por. [19, s. 13]). Oto
przykłady identyfikacji rodzaju cech statystycznych (zmiennych):
Przykład 1. Nawiązując do prezentowanego wcześniej przykładu
z Funduszami
Inwestycyjnymi Otwartymi (zob. rys. 1.2), należy ustalić – po określeniu
jednostki i zbiorowości statystycznej – typy cech statystycznych.
Przykład ilustruje rys. 1.3:
Rysunek 1.3. Przykłady cech
statystycznych.
Źródło: Opracowanie własne (dane umowne).
Zbiorowość
statystyczna została określona pod względem rzeczowym (co
jest
przedmiotem badania), przestrzennym (teren badania) oraz czasowym
(moment
badania określony na 2005 rok). Tak określona zbiorowość
składa
się z 18 jednostek statystycznych, którymi są poszczególne
Fundusze
Inwestycyjne Otwarte lokujące środki finansowe na krajowym
rynku
w 2005 roku. Wybraną jednostkę statystyczną zaznaczono żółtym
kolorem.
Każda jednostka posiada szereg właściwości, czyli zmiennych
cech
statystycznych. Dwie pierwsze, „Nazwa funduszu” i „Klasa ryzyka”,
mają
jakościowy charakter, ponieważ ich warianty dają się opisać w sposób
słowny.
Pogrubionym kolorem zaznaczono jeden z wariantów cechy
„Klasa
ryzyka” – cecha ta jest cechą quasi-ilościową (porządkową),
ponieważ
jej warianty można uporządkować pod kątem stopnia ryzyka
(niemniej
jednak w innych analizach, gdzie ryzyko nie ma znaczenia, cecha
ta
jest cechą nominalną). „Stopa zwrotu” nie jest cechą quasi-ciągłą,
ponieważ
teoretycznie można ją wyznaczyć z nieskończenie dużą precyzją
–
jest to iloraz ceny jednostki uczestnictwa z końca do ceny z początku
2005
roku. Natomiast ceny z definicji podaje się z dokładnością do
1
grosza.
Przykład 2. Celem
badania statystycznego jest analiza rynku mieszkań
w
tzw. standardzie deweloperskim w Polsce. Oto zestaw cech statystycznych
branych
pod uwagę:
1.
Nazwa województwa – cecha jakościowa nominalna.
2.
Ilość pokoi – cecha ilościowa skokowa.
3.
Cena mieszkania (zł/m2) – cecha
ilościowa quasi-ciągła.
Przykład 3. Przedmiotem
badania statystycznego jest określenie czynników
wpływających
na wyniki egzaminu ze statystyki. Jako cechę zależną
przyjęto
liczbę punktów uzyskanych na egzaminie (cecha ilościowa quasi- ciągła – punkty mierzone w skali od zera do 100 z dokładnością
do 0,1).
Oto zestaw zmiennych objaśniających:
1. Liczba nieobecności na zajęciach – cecha ilościowa skokowa.
2. Przeciętna liczba godzin poświęconych nauce statystyki
tygodniowo –
jw.
3. Preferencje co do przedmiotu statystyka (nudny,
ciekawy) – cecha porządkowa.
4. Płeć studenta – cecha jakościowa (nominalna).
Reasumując, zbiorowość statystyczną tworzą poszczególne jednostki statystyczne, posiadające określone cechy statystyczne. O ile cechy stałe –
wspólne wszystkim jednostkom badania statystycznego – służą do
określenia
zbiorowości, o tyle cechy zmienne podlegają
badaniu. Należy ustalić,
czy będzie ono obejmowało wszystkie jednostki, czy tylko wybrane z
nich,
a następnie dokonać wyboru adekwatnej metody
badania.