Przedstawiona w poprzednim
rozdziale graficzna prezentacja materiału statystycznego z wykorzystaniem
wykresów ukazujących strukturę badanej zbiorowości (zob. wykresy strukturalne)
pozwala na wstępną ocenę empirycznego rozkładu zbiorowości ze względu na daną
cechę statystyczną.
W tym miejscu warto
usystematyzować możliwe rozkłady empiryczne.
Można je bowiem sklasyfikować
w zależności od siły i kierunku ewentualnej asymetrii, jak również z punktu
widzenia ilości ośrodków dominujących.
Rysunek 2.1. Typologia rozkładów
empirycznych cechy ciągłej.
Źródło: Opracowanie na
podstawie: [9, s. 65].
Szczególne miejsce wśród
rozkładów cech zajmuje rozkład normalny, należący do klasy rozkładów
jednomodalnych symetrycznych. Jednak w praktyce empiryczne rozkłady cech są na
ogół bardziej „smukłe” bądź bardziej „spłaszczone” aniżeli teoretyczny rozkład
normalny (zob. eksces). Można tu zatem mówić o pewnym stopniu dopasowania
danych empirycznych do rozkładu normalnego (zob. Hipotezy nieparametryczne).
Rozkłady cechy są w różnym
stopniu lewo- bądź prawostronnie asymetryczne.
O sile i kierunku asymetrii
informują miary asymetrii. Z uwagi na siłę asymetrii rozróżnia się rozkłady
umiarkowanie asymetryczne (jeden
ośrodek dominujący) bądź
rozkłady skrajnie asymetryczne (amodalne).
Rozkłady skrajnie
asymetryczne to takie, „w których prawie wszystkie jednostki mają niskie bądź
wysokie wartości cechy” [19, s. 33]. Rozkłady typu „U” – zwane też siodłowymi –
stanowią niejako złożenie rozkładu lewo i prawostronnie asymetrycznego (w tym
przypadku zamiast o wartości dominującej można mówić o tzw. „antymodzie”, tj.
wartości będącej przeciwieństwem dominanty).
Rozkłady dwumodalne
(bimodalne) posiadają dwa wyraźnie widoczne ośrodki dominujące, przy czym żaden
z nich nie skupia wartości skrajnych (por. rozkład siodłowy). Przykładem
takiego rozkładu może być rozkład częstości kursowania autobusów komunikacji
miejskiej (ośrodkami dominującymi są godziny porannego i popołudniowego
szczytu). Analogicznie można wyznaczyć rozkład trimodalny (trzy ośrodki
dominujące) oraz – uogólniając – rozkłady wielomodalne (są to raczej
teoretyczne przypadki).
Istnieje szereg miar
statystycznych, służących do opisu zbiorowości statystycznej.
Dlatego w literaturze
przedmiotu zwykle klasyfikuje się je z punktu widzenia dwóch następujących
kryteriów (por. [3, s. 96]):
Pierwszy – podział miar ze
względu na zakres danych niezbędnych do ich wyznaczenia:
– miary klasyczne, do
wyliczenia których niezbędne są wszystkie jednostki objęte badaniem
statystycznym, – miary pozycyjne, dla wyznaczenia których potrzebne są tylko
wybrane
obserwacje ze względu na
zajmowaną pozycję w uporządkowanym zbiorze danych.
Ten podział miar
statystycznych ma swoje implikacje w praktyce. Np. w przypadku danych
pogrupowanych w szereg rozdzielczy klasowy z otwartym dolnym lub górnym
przedziałem klasowym – zastosowanie znajdują miary pozycyjne.
Drugi podział pozwala na
klasyfikację miar ze względu na rodzaj informacji, jakie one wnoszą o
empirycznym rozkładzie cechy statystycznej. I tak wyróżnia się tu (por. [19, s.
35]):
1. Miary położenia (średnie,
przeciętne) – służą do określenia wartości cechy, wokół której skupiają się
wszystkie pozostałe wartości tej cechy.
2. Miary dyspersji
(zmienności, rozproszenia) – badają stopień zróżnicowania wartości cechy, w tym
wokół miar średnich.
3. Miary asymetrii
(skośności) – służą do badania kierunku i siły ewentualnej asymetrii rozkładu
zbiorowości ze względu na daną cechę statystyczną.
4. Miary koncentracji –
pozwalają określić stopień koncentracji wokół wartości średniej, jak również
ustalić stopień koncentracji jednostek statystycznych ze względu na wartości
badanej cechy (np. koncentracja wysokości wynagrodzeń, obrotów ze sprzedaży
itp.).
Poniżej przedstawiono
typologię miar statystycznych według obu przedstawionych klasyfikacji:
Kolejne podrozdziały
odpowiadają klasyfikacji miar statystycznych ze względu na informacje, jakich
wyznaczone charakterystyki dostarczają o rozkładzie empirycznym badanej cechy.