wtorek, 5 maja 2015

Opis struktury zbiorowości

Przedstawiona w poprzednim rozdziale graficzna prezentacja materiału statystycznego z wykorzystaniem wykresów ukazujących strukturę badanej zbiorowości (zob. wykresy strukturalne) pozwala na wstępną ocenę empirycznego rozkładu zbiorowości ze względu na daną cechę statystyczną.
W tym miejscu warto usystematyzować możliwe rozkłady empiryczne.
Można je bowiem sklasyfikować w zależności od siły i kierunku ewentualnej asymetrii, jak również z punktu widzenia ilości ośrodków dominujących.
Rysunek 2.1. Typologia rozkładów empirycznych cechy ciągłej.
Źródło: Opracowanie na podstawie: [9, s. 65].
Szczególne miejsce wśród rozkładów cech zajmuje rozkład normalny, należący do klasy rozkładów jednomodalnych symetrycznych. Jednak w praktyce empiryczne rozkłady cech są na ogół bardziej „smukłe” bądź bardziej „spłaszczone” aniżeli teoretyczny rozkład normalny (zob. eksces). Można tu zatem mówić o pewnym stopniu dopasowania danych empirycznych do rozkładu normalnego (zob. Hipotezy nieparametryczne).
Rozkłady cechy są w różnym stopniu lewo- bądź prawostronnie asymetryczne.
O sile i kierunku asymetrii informują miary asymetrii. Z uwagi na siłę asymetrii rozróżnia się rozkłady umiarkowanie asymetryczne (jeden
ośrodek dominujący) bądź rozkłady skrajnie asymetryczne (amodalne).
Rozkłady skrajnie asymetryczne to takie, „w których prawie wszystkie jednostki mają niskie bądź wysokie wartości cechy” [19, s. 33]. Rozkłady typu „U” – zwane też siodłowymi – stanowią niejako złożenie rozkładu lewo i prawostronnie asymetrycznego (w tym przypadku zamiast o wartości dominującej można mówić o tzw. „antymodzie”, tj. wartości będącej przeciwieństwem dominanty).
Rozkłady dwumodalne (bimodalne) posiadają dwa wyraźnie widoczne ośrodki dominujące, przy czym żaden z nich nie skupia wartości skrajnych (por. rozkład siodłowy). Przykładem takiego rozkładu może być rozkład częstości kursowania autobusów komunikacji miejskiej (ośrodkami dominującymi są godziny porannego i popołudniowego szczytu). Analogicznie można wyznaczyć rozkład trimodalny (trzy ośrodki dominujące) oraz – uogólniając – rozkłady wielomodalne (są to raczej teoretyczne przypadki).
Istnieje szereg miar statystycznych, służących do opisu zbiorowości statystycznej.
Dlatego w literaturze przedmiotu zwykle klasyfikuje się je z punktu widzenia dwóch następujących kryteriów (por. [3, s. 96]):
Pierwszy – podział miar ze względu na zakres danych niezbędnych do ich wyznaczenia:
– miary klasyczne, do wyliczenia których niezbędne są wszystkie jednostki objęte badaniem statystycznym, – miary pozycyjne, dla wyznaczenia których potrzebne są tylko wybrane
obserwacje ze względu na zajmowaną pozycję w uporządkowanym zbiorze danych.
Ten podział miar statystycznych ma swoje implikacje w praktyce. Np. w przypadku danych pogrupowanych w szereg rozdzielczy klasowy z otwartym dolnym lub górnym przedziałem klasowym – zastosowanie znajdują miary pozycyjne.
Drugi podział pozwala na klasyfikację miar ze względu na rodzaj informacji, jakie one wnoszą o empirycznym rozkładzie cechy statystycznej. I tak wyróżnia się tu (por. [19, s. 35]):
1. Miary położenia (średnie, przeciętne) – służą do określenia wartości cechy, wokół której skupiają się wszystkie pozostałe wartości tej cechy.
2. Miary dyspersji (zmienności, rozproszenia) – badają stopień zróżnicowania wartości cechy, w tym wokół miar średnich.
3. Miary asymetrii (skośności) – służą do badania kierunku i siły ewentualnej asymetrii rozkładu zbiorowości ze względu na daną cechę statystyczną.
4. Miary koncentracji – pozwalają określić stopień koncentracji wokół wartości średniej, jak również ustalić stopień koncentracji jednostek statystycznych ze względu na wartości badanej cechy (np. koncentracja wysokości wynagrodzeń, obrotów ze sprzedaży itp.).
Poniżej przedstawiono typologię miar statystycznych według obu przedstawionych klasyfikacji:

Kolejne podrozdziały odpowiadają klasyfikacji miar statystycznych ze względu na informacje, jakich wyznaczone charakterystyki dostarczają o rozkładzie empirycznym badanej cechy.
WIĘCEJ INFORMACJI W: Statystyka po ludzku