wtorek, 5 maja 2015

Wskaźniki Analizy technicznej

Jak zapewne już się domyślacie, wskaźniki analizy technicznej to nic innego jak odpowiednio przetworzone dane. Dane w tym przypadku to ceny walut spływające do naszego komputera w czasie rzeczywistym.
Przetwarzane przez oprogramowanie zostają wyświetlone na ekranie naszego komputera w formie wykresu. To samo oprogramowanie ma możliwość przetworzenia owych danych i wyświetlenia ich w uśrednionej formie lub w jakikolwiek inny sposób przekalkulowane.
Wszystko dzieje się automatycznie, a my tylko wybieramy sposób, w jaki chcemy, ażeby oprogramowanie przetworzyło dane. Sposób ten będziemy dalej nazywać wskaźnikiem analizy technicznej. Wskaźniki tworzą linie średnie na wykresie, bądź też pokazują wyniki obróbki danych w formie osobnego wykresu. Mają one za zadanie lepsze uwidocznienie sytuacji, która ma obecnie miejsce na rynku.
Odpowiednio połączone ze sobą wskaźniki tworzą systemy analizy technicznej – kilka z nich zostało opisane w trzeciej części cyklu. Każdy wskaźnik analizy technicznej posiada zdefiniowane sygnały kupna lub sprzedaży, czyli określone jego kształty, przecięcia lub ustawienia względem wykresu czy innego wskaźnika, które wskazują na wzrost lub spadek poziomu ceny w dalszych odczytach. Nie jest jednak wskazane
stosowanie jakiegokolwiek wskaźnika samodzielnie. To czysto
statystyczne podejście, przez co obarczone błędem – nie wszystkie sygnały generowane przez dany wskaźnik są trafne. Zasadniczo wskaźniki można podzielić na dwie grupy: Wskaźniki trendu – zaliczymy do nich wszystkie średnie (arytmetyczna, wykładnicza, ważona), wskaźniki takie jak wstęga Bollingera czy Parabolic Stop and Reversal (SAR)* i inne, których linie są dodawane bezpośrednio do wykresu cenowego jako dodatkowe linie. Sygnałami sugerującymi kupno lub sprzedaż są tutaj zazwyczaj charakterystyczne przecięcia linii wskaźników ze sobą lub z wykresem cenowym. Większość
ze średnich i ich pochodnych charakteryzuje się swoistym opóźnieniem w stosunku do sytuacji rynkowej, ze względu na co są nazywane z ang.
trend followers czyli podążających za trendem.
Oscylatory – są to wskaźniki, które przetwarzają dane zwracając wynik w postaci osobnego wykresu umieszczanego pod wykresem cenowym (Np. Oscylatory stochastyczne, MACD, RSI i inne)*. Zawierają się one zazwyczaj w pewnych granicach abstrahujących od podziałki cenowej wykresu, dlatego też nie są dodawane bezpośrednio do niego.
Na rynku forex wskaźniki analizy technicznej używane są wyjątkowo często. Każdy system zakłada w większym lub mniejszym stopniu użycie jakiegoś wskaźnika. Przekonacie się o tym w trzeciej części niniejszego cyklu, gdzie zostały przedstawione systemy analizy technicznej. 
WIĘCEJ INFORMACJI: FOREX ANALIZA TECHNICZNA>>>

Opis struktury zbiorowości

Przedstawiona w poprzednim rozdziale graficzna prezentacja materiału statystycznego z wykorzystaniem wykresów ukazujących strukturę badanej zbiorowości (zob. wykresy strukturalne) pozwala na wstępną ocenę empirycznego rozkładu zbiorowości ze względu na daną cechę statystyczną.
W tym miejscu warto usystematyzować możliwe rozkłady empiryczne.
Można je bowiem sklasyfikować w zależności od siły i kierunku ewentualnej asymetrii, jak również z punktu widzenia ilości ośrodków dominujących.
Rysunek 2.1. Typologia rozkładów empirycznych cechy ciągłej.
Źródło: Opracowanie na podstawie: [9, s. 65].
Szczególne miejsce wśród rozkładów cech zajmuje rozkład normalny, należący do klasy rozkładów jednomodalnych symetrycznych. Jednak w praktyce empiryczne rozkłady cech są na ogół bardziej „smukłe” bądź bardziej „spłaszczone” aniżeli teoretyczny rozkład normalny (zob. eksces). Można tu zatem mówić o pewnym stopniu dopasowania danych empirycznych do rozkładu normalnego (zob. Hipotezy nieparametryczne).
Rozkłady cechy są w różnym stopniu lewo- bądź prawostronnie asymetryczne.
O sile i kierunku asymetrii informują miary asymetrii. Z uwagi na siłę asymetrii rozróżnia się rozkłady umiarkowanie asymetryczne (jeden
ośrodek dominujący) bądź rozkłady skrajnie asymetryczne (amodalne).
Rozkłady skrajnie asymetryczne to takie, „w których prawie wszystkie jednostki mają niskie bądź wysokie wartości cechy” [19, s. 33]. Rozkłady typu „U” – zwane też siodłowymi – stanowią niejako złożenie rozkładu lewo i prawostronnie asymetrycznego (w tym przypadku zamiast o wartości dominującej można mówić o tzw. „antymodzie”, tj. wartości będącej przeciwieństwem dominanty).
Rozkłady dwumodalne (bimodalne) posiadają dwa wyraźnie widoczne ośrodki dominujące, przy czym żaden z nich nie skupia wartości skrajnych (por. rozkład siodłowy). Przykładem takiego rozkładu może być rozkład częstości kursowania autobusów komunikacji miejskiej (ośrodkami dominującymi są godziny porannego i popołudniowego szczytu). Analogicznie można wyznaczyć rozkład trimodalny (trzy ośrodki dominujące) oraz – uogólniając – rozkłady wielomodalne (są to raczej teoretyczne przypadki).
Istnieje szereg miar statystycznych, służących do opisu zbiorowości statystycznej.
Dlatego w literaturze przedmiotu zwykle klasyfikuje się je z punktu widzenia dwóch następujących kryteriów (por. [3, s. 96]):
Pierwszy – podział miar ze względu na zakres danych niezbędnych do ich wyznaczenia:
– miary klasyczne, do wyliczenia których niezbędne są wszystkie jednostki objęte badaniem statystycznym, – miary pozycyjne, dla wyznaczenia których potrzebne są tylko wybrane
obserwacje ze względu na zajmowaną pozycję w uporządkowanym zbiorze danych.
Ten podział miar statystycznych ma swoje implikacje w praktyce. Np. w przypadku danych pogrupowanych w szereg rozdzielczy klasowy z otwartym dolnym lub górnym przedziałem klasowym – zastosowanie znajdują miary pozycyjne.
Drugi podział pozwala na klasyfikację miar ze względu na rodzaj informacji, jakie one wnoszą o empirycznym rozkładzie cechy statystycznej. I tak wyróżnia się tu (por. [19, s. 35]):
1. Miary położenia (średnie, przeciętne) – służą do określenia wartości cechy, wokół której skupiają się wszystkie pozostałe wartości tej cechy.
2. Miary dyspersji (zmienności, rozproszenia) – badają stopień zróżnicowania wartości cechy, w tym wokół miar średnich.
3. Miary asymetrii (skośności) – służą do badania kierunku i siły ewentualnej asymetrii rozkładu zbiorowości ze względu na daną cechę statystyczną.
4. Miary koncentracji – pozwalają określić stopień koncentracji wokół wartości średniej, jak również ustalić stopień koncentracji jednostek statystycznych ze względu na wartości badanej cechy (np. koncentracja wysokości wynagrodzeń, obrotów ze sprzedaży itp.).
Poniżej przedstawiono typologię miar statystycznych według obu przedstawionych klasyfikacji:

Kolejne podrozdziały odpowiadają klasyfikacji miar statystycznych ze względu na informacje, jakich wyznaczone charakterystyki dostarczają o rozkładzie empirycznym badanej cechy.
WIĘCEJ INFORMACJI W: Statystyka po ludzku

czwartek, 30 kwietnia 2015

Obserwacja statystyczna

Po ustaleniu celu badania statystycznego (diagnostycznego
i praktycznego), określeniu zbiorowości i jednostki statystycznej (pod względem rzeczowym, przestrzennym i czasowym), jak również dokonaniu wyboru odpowiedniej metody badania (pełnego lub częściowego) – można przystąpić do drugiego etapu, jakim jest obserwacja statystyczna.
Ogólnie rzecz biorąc, metody pozyskiwania danych można podzielić na dwie grupy (por. [19, s. 20], [21, s. 20]):
1. Metody korzystania z publikowanych źródeł informacji (odpłatne lub nieodpłatne pozyskiwanie informacji od jednostek sprawozdawczych).
2. Metody przeprowadzania własnego badania statystycznego (zob. gromadzenie informacji ze źródeł pierwotnych).
Zebrane w wyniku obserwacji statystycznej dane określa się mianem materiału statystycznego [19, s. 20], przy czym – w zależności od przyjętej metody gromadzenia danych – rozróżnia się [10, s. 32]:
1. Materiał statystyczny pierwotny – informacje do prowadzenia danego badania statystycznego uzyskiwane są drogą odrębnego badania. Informacje te pochodzą z tzw. źródeł pierwotnych w wyniku pomiaru bezpośredniego (zob. kwestionariusz).
2. Materiał statystyczny wtórny – materiał zaczerpnięty spoza statystycznych źródeł, zwanych źródłami wtórnymi, który został wykorzystany w badaniach statystycznych.
Wybrane wtórne źródła danych znajdują się w pliku dane_do_analizy.xls, stanowiącym integralną część niniejszego opracowania. Plik ten zawiera wybrane dane finansowe i dane społeczno-gospodarcze. Poniżej przedstawiono
przykłady wtórnych źródeł informacji:
Przykład 1. Jednostką sprawozdawczą dostarczającą co kwartał informacji o trzyletnich stopach zwrotu Otwartych Funduszy Emerytalnych jest Komisja Nadzoru Ubezpieczeń i Funduszy Emerytalnych ( http://www.knuife.gov.pl/).
Przykład 2. Spółki notowane na Giełdzie Papierów Wartościowych w Warszawie (http://www.gpw.pl) mają obowiązek sporządzania okresowych raportów finansowych.
Przykład 3. Jednostką sprawozdawczą prezentującą m.in. poziom stóp procentowych jest Narodowy Bank Polski (http://www.nbp.pl).
Przykład 4. Instytucją prezentującą dane o przestępczości w Polsce jest Komenda Główna Policji (http://www.kgp.gov.pl).
W tym miejscu warto zwrócić uwagę na szereg zniekształceń rzeczywistości, wynikających z błędnej interpretacji oficjalnych informacji pochodzących właśnie ze źródeł wtórnych. Oto następujące sytuacje:
Sytuacja 1. Oficjalny ranking najlepiej sprzedających się płyt CD (np. z oprogramowaniem edukacyjnym) nie musi odzwierciedlać nawet kolejności miejsc w rankingu. Dzieje się tak za sprawą „drugiego” – nieoficjalnego – obrotu nielegalnym oprogramowaniem, w wyniku czego ustalenie najbardziej popularnych programów komputerowych wymaga przeprowadzenia odrębnych badań wśród wybranej grupy respondentów (anonimowość ankiety sprzyja zakreślaniu odpowiedzi, jaki program ostatnio kupił ankietowany – nie wnika się przy tym, z jakiego źródła on pochodzi).
Sytuacja 2. Ustalenie faktycznej liczby rozwiedzionych rodzin jest praktycznie niemożliwe w oparciu o dane ze źródeł wtórnych – wiadomo bowiem, iż część rodzin rozwodzi się fikcyjnie („na papierze”) w celu otrzymania zasiłku dla matki samotnie wychowującej dziecko. W tym przypadku wiarygodnych informacji mogłaby dostarczyć anonimowa ankieta.
Sytuacja 3. Kwestią kłopotliwą jest określenie skali ruchu turystycznego w pewnej nadmorskiej miejscowości w oparciu o wpływy z podatku klimatycznego (np. 1 zł za dobę). Takie informacje nie uwzględniają osób, które specjalnie przyjeżdżają na jeden dzień do tej miejscowości (np. na organizowany koncert), czy też turystów znajdujących zakwaterowanie bez rejestracji i tym samym niepłacących podatku klimatycznego.
Ponadto należy pamiętać, iż źródła wtórne niekiedy dostarczają tylko pobieżnych informacji. I tak śledząc dostępne statystyki odwiedzin pewnego portalu internetowego można dowiedzieć się, ile procent odwiedzających to kobiety, jaka jest struktura wiekowa itp. Niestety, takie zbiorcze informacje nie pozwalają na określenie zależności np. pomiędzy wiekiem a płcią osob odwiedzających portal – tu konieczne jest dotarcie do danych niepogrupowanych.
Powyższe przykłady pokazują, iż mimo bogactwa informacji pochodzących ze źródeł wtórnych, niekiedy niezbędne jest dotarcie do informacji pochodzących ze źródeł pierwotnych. W kolejnym podrozdziale dokładniej omówiono organizację własnego badania statystycznego (gromadzenie informacji ze źródeł pierwotnych).
Tym, na co należy zwrócić uwagę przy studiowaniu niniejszego rozdziału – a o czym niejednokrotnie zdarza się zapominać na egzaminie – jest rodzaj danej cechy statystycznej i związany z nią typ skali pomiarowej. Jak już była mowa, pomiar cech ilościowych na skalach „słabszych” pociąga za sobą znaczną utratę informacji. Im silniejszy typ skali pomiarowej, tym więcej
miar statystycznych można obliczyć (zob. tabela 1.5).
Ponadto – w przypadku cech ilościowych – wybór odpowiedniej miary (skorzystanie z prawidłowego wzoru statystycznego) zależy od tego, czy dane są pogrupowane, a jeśli tak, to czy pogrupowano je w szereg rozdzielczy punktowy, czy też szereg rozdzielczy z przedziałami klasowymi.

W związku z powyższym – przy prezentowaniu miar opisu statystycznego podkreślono, czy dany wzór znajduje zastosowanie dla danych niepogrupowanych, czy też pogrupowanych w szereg rozdzielczy (punktowy lub z przedziałami klasowymi). Zwrócono też uwagę na typ skali pomiaru danych, umożliwiający zastosowanie określonej miary.
WIĘCEJ INFORMACJI W: Statystyka po ludzku

czwartek, 16 kwietnia 2015

Statystyka wypadków i zdarzeń potencjalnie wypadkowych


Autor: LJM



Na co dzień uznaje się, że albo jakieś zdarzenie ma charakter wypadku, albo nie. W pracy jednak zawsze jest jeszcze jedna kategoria, czyli prawie-wypadek. Ta kategoria często jest jednak zaniedbywana. Niesłusznie.

Wypadek a zdarzenie potencjalnie wypadkowe
Wypadek to zdarzenie potencjalnie wypadkowe z dalszym ciągiem, czyli nie samo poślizgnięcie się, ale również upadek. Ponieważ jednak w zdarzeniu potencjalnie wypadkowym nie ma poszkodowanych (przynajmniej na tym etapie), to ryzyko często się bagatelizuje. Tymczasem prawidłowa ścieżka postępowania to zgłoszenie takiego wydarzenia pracodawcy. Co więcej, ten musi prowadzić rejestr zdarzeń potencjalnie wypadkowych i reagowania na wszystkie zgłoszenia. Realną odpowiedzią na zgłoszenie jest analiza zagrożenia w miejscu zdarzenia, podjęcie ewentualnych działań zaradczych, jeżeli ryzyko jest wysokie, a także wdrożenie zasad postępowania na wypadek wypadku.
Statystyki zdaqrzeń potencjalni wypadkowych, a wypadki
Statystyki mówią, że zdarzenia potencjalnie wypadkowe zdarzają się przeciętnie 30 razy częściej niż wypadki. To oznacza, że jeżeli pracownicy nie zgłoszą zdarzenia potencjalnie wypadkowego, to jeden na trzydziestu z nich ulegnie wypadkowi! Dlatego właśnie tak ważne są szkolenia BHP, na których omawiana jest także tematyka zdarzeń potencjalnie wypadkowych i standardowe ścieżki postępowania w przypadki zaistnienia takich zdarzeń.
Obowiązki pracodawcy
Pracodawca ma obowiązek zapobiegania wypadkom – to najogólniej mówiąc. Temu służy rejestr zdarzeń potencjalnie wypadkowych – jest to lista zagadnień, które należy poddać analizie, na ile realne jest zagrożenie wypadkiem i w jaki sposób ryzyko to można zminimalizować. Należy pamiętać, że choć pracodawca ma obowiązek bieżącej kontroli stanu bezpieczeństwa, jest fizycznie niemożliwe, aby sam monitorował wszystkie przypadki. Ważne jest, aby pracownicy zgłaszali zdarzenia potencjalnie wypadkowe, ponieważ ma to bezpośredni wpływ na bezpieczeństwo na ich stanowiskach pracy. Pracodawca nie może takiego sygnału zignorować, może jedynie nie rozbudować instrukcji BHP, jeśli zagrożenie nie będzie realne, niemniej jednak przynajmniej analiza bezpieczeństwa musi zostać przeprowadzona.
Komunikacja ratuje życie
Istnieje prosta zależność między komunikacją w firmie w wypadkami w pracy. Jeśli nie istnieje przepływ informacji w górę, tj. od pracownika do pracodawcy, to praca w danym zakładzie obfituje w wypadki. Zdarzenia potencjalnie wypadkowe, które nie zostały zarejestrowane, nie znajdą się nigdy w instrukcjach postępowania, a to poważny kłopot, gdyż właśnie instrukcje te regulują działanie w sytuacji kryzysowej, może więc teoretycznie dojść do sytuacji, kiedy ludzie nie będą wiedzieli, jak mają się zachować w razie wypadku.
Co ważne – pracodawca nie może zostać ukarany za to, że nie wie o wszystkich zdarzeniach potencjalnie wypadkowych, ale gdyby na skutek takich zdarzeń wreszcie doszło do wypadku, to ma pełne prawo nałożyć karę na pracowników, którzy dopuścili się zaniedbania i nie złożyli zawiadomienia o wystąpieniu zdarzenia potencjalnie wypadkowego. Jeśli zaniedbanie takie zostanie udowodnione, może zostać również wstrzymana wypłata odszkodowania na rzecz pracownika, gdyż może on zostać uznany za osobę współodpowiedzialną, która doprowadziła do wypadku przez zaniedbanie.
Podsumowanie
Pracodawco! Nie tylko wypadek stanowi zagrożenie, ale także sytuacja potencjalnie wypadkowa. Wykrycie takich zdarzeń umożliwia lepsze przygotowanie planu BHP dla firmy, a to sprawia, że przedsiębiorstwo staje się lepszym miejscem pracy, pracownicy czują się bardziej komfortowo, a firma działa spokojnie i bezpiecznie nawet na wysokich obrotach.

Leszek Maruszczyk
Specjalista BHP

środa, 8 kwietnia 2015

Wybór metody badania statystycznego

Kolejną czynnością w fazie wstępnej jest określenie metody badania statystycznego.
Wybór metody zależy od takich czynników, jak:
cel badania statystycznego,
rodzaj zbiorowości statystycznej,
stopień szczegółowości badania,
ilość dostępnych środków finansowych,
stosowane metody analizy (opis lub wnioskowanie statystyczne).

Badanie statystyczne obejmuje wszystkie jednostki statystyczne lub tylko
wybrane z nich, czyli próbę. Próba to pewien podzbiór populacji generalnej,
którego elementy zostały dobrane w sposób losowy bądź nielosowy
(por. [20, s. 20]). Innymi słowy: próba to „liczebność jednostek badania”
[5, s. 19].
Klasyfikacja metod badania statystycznego – ze względu na liczbę jednostek objętych badaniem – przedstawia się następująco:
Rysunek 1.4. Klasyfikacja metod badań statystycznych ze względu na liczbę jednostek objętych badaniem.
Źródło: Opracowanie na podstawie: [7, s. 14].
Ogólnie rzecz biorąc, można wyodrębnić trzy grupy metod badania statystycznego:
1. BADANIE PEŁNE (całkowite, wyczerpujące) – polega na tym, że informacje
o badanych cechach statystycznych są gromadzone od wszystkich
jednostek statystycznych wchodzących w skład zbiorowości statystycznej
[7, s. 15].
2. BADANIE CZĘŚCIOWE (niepełne, fragmentaryczne) – obejmuje wybrane
jednostki zbiorowości statystycznej [19, s. 16].
3. SZACUNEK STATYSTYCZNY (szacunek wartości) – interpolacyjny
lub ekstrapolacyjny szacunek statystyczny zaliczany jest niekiedy w literaturze
przedmiotu do metod badania częściowego (zob. [3, s. 32]):
interpolacja polega na znajdowaniu nieznanych wartości funkcji
w dowolnym punkcie przedziału (x1, xn) na podstawie dostępnych
wartości funkcji, należących do tego przedziału (np. ustalanie wartości
kwartyli).
ekstrapolacja polega na ustaleniu nieznanych wartości funkcji w dowolnym
punkcie leżącym poza przedziałem wartości posiadanych:
xn+1, xn+i (np. prognozowanie).
Do metod badania pełnego należą (zob. [7, s. 15-18]):
1. Spis statystyczny jest to badanie polegające na zbieraniu informacji
o wartościach cechy statystycznej bezpośrednio od wszystkich jednostek
tworzących zbiorowość statystyczną. Informacje te są zbierane
przez specjalnie do tego celu przeszkolone osoby (rachmistrzów spisowych).
Jednocześnie informacje te są utrwalane na formularzach spisowych,
przygotowanych przez instytucję organizującą spis. Rachmistrze
spisowi dokonują zatem bezpośredniej obserwacji statystycznej. Spisy
statystyczne dostarczają szczegółowych informacji o badanej zbiorowości.
Ze względu na bardzo wysokie koszty omawiana metoda znajduje
zastosowanie w badaniach najważniejszych zjawisk społeczno-gospodarczych
(np. Narodowy Spis Powszechny Ludności i Mieszkań z 2002
roku przeprowadzony przez Główny Urząd Statystyczny).
2. Rejestracja statystyczna polega na wpisywaniu zdarzeń i faktow do
odpowiednich rejestrów. Rejestracja statystyczna ma węższy zakres tematyczny
aniżeli spis statystyczny. Ponadto rożni się ona od niego sposobem
gromadzenia informacji – przy rejestracji statystycznej nie występuje
bezpośrednia obserwacja statystyczna, lecz informacje będące
przedmiotem rejestracji są zgłaszane w punktach rejestracyjnych. Wyróżnia się:

doraźną rejestrację statystyczną – polega ona na tym, że w wyznaczonym
czasie określone osoby zgłaszają się w wyznaczonych miejscach
i udzielają informacji objętej tematyką rejestracji (np. ewidencja
działalności gospodarczej),
bieżącą rejestrację statystyczną – polega ona na ciągłym, bieżącym,
systematycznym notowaniu zdarzeń i faktów określonych przez instytucję
prowadzącą rejestrację (np. ewidencja ludności).
3. Sprawozdawczość statystyczna to najbardziej powszechny rodzaj pełnych
badań statystycznych – polega na przekazywaniu przez jednostki
sprawozdawcze określonych informacji liczbowych i opisowych w postaci
standardowych sprawozdań. Instytucja organizująca badanie statystyczne
powinna opracować odpowiednie formularze statystyczne wraz
z instrukcjami ich wypełniania, jak również określić termin ich przekazywania
(jako przykład można podać opracowane dla celów podatkowych
formularze PIT adresowane do osób fizycznych czy też formularze
ZUS wypełniane przez przedsiębiorców).
Zbiorowości statystycznej nie można poddać badaniu pełnemu w takich sytuacjach,
jak (por. [2, s. 23], [3, s. 31-32]):
badany element ulega zniszczeniu (badanie pełne oznaczałoby w tej sytuacji
zniszczenie wszystkich elementów),
badanie pełne jest zbyt kosztowne (np. z uwagi na dużą populację generalną),
badanie pełne jest zbyt czasochłonne (np. duża dynamika zmian badanego
zjawiska wymaga podjęcia szybkich decyzji),
badana zbiorowość jest nieskończenie duża (w praktyce za taką populację
można też uznać bardzo liczne populacje, np. liczbę potencjalnych
internautów – w tej sytuacji można mówić wyłącznie o badaniu częściowym).
W powyższych sytuacjach odpowiednim badaniem jest badanie częściowe.
W literaturze statystycznej wymienia się następujące metody badania częściowego:
1. Metoda monograficzna polega na wszechstronnym opisie i szczegółowej analizie pojedynczej jednostki statystycznej lub niewielkiej liczby charakterystycznych (typowych) jednostek badanej zbiorowości. Dzięki niewielkiej grupie jednostek można w badaniu uwzględnić stosunkowo dużą liczbę cech statystycznych (zob. cechy zmienne). Podstawowe znaczenie w tej metodzie ma opis w oparciu o dane liczbowe [10, s. 25].
Przykładem może być opis wybranej placówki wychowawczo-oświatowej.
2. Metoda ankietowa polega na tym, że podmiot organizujący badanie
zwraca się do określonej grupy osób (respondentów) z zaproszeniem do
dobrowolnego wypowiedzenia się w określonej sprawie. Zaproszenie to
może mieć charakter powszechny (ankieta kierowana do szerokiego grona
osób, np. za pośrednictwem Internetu) lub selektywny (ankieta kierowana
do wąskiej grupy respondentów, np. za pośrednictwem prasy specjalistycznej).
Z uwagi na fakt, iż ankieta wypełniana jest przez respondenta,
powinna być ona zredagowana w taki sposób, aby każdy ankietowany
jednoznacznie rozumiał stawiane mu pytania i potrafił udzielić na
nie odpowiedzi [7, s. 19-20] (zob. Gromadzenie danych ze źródeł pier -
wotnych).
3. Metoda reprezentacyjna opiera się na próbie pobranej ze zbiorowości
generalnej w sposób losowy. Z teoretycznego i praktycznego punktu widzenia
metoda ta jest najbardziej prawidłową formą badania częściowego.
Zastosowanie rachunku prawdopodobieństwa przy uogólnianiu wyników
z proby losowej na całą zbiorowość (zob. wnioskowanie statystyczne) pozwala na określenie wielkości popełnianego błędu. Możliwości
tej nie stwarzają pozostałe metody badania częściowego, tj. metoda
monograficzna i ankietowa [19, s. 17-18].
Przyjmując jako kryterium klasyfikacji częstotliwość przeprowadzania badania
statystycznego, można wyróżnić trzy rodzaje badań statystycznych
[7, s. 15]:
1. Badania doraźne (sporadyczne, jednorazowe, ad hoc) – są prowadzone
wówczas, gdy zapotrzebowanie na określony rodzaj informacji pojawia
się bardzo rzadko i jest spowodowane nieprzewidzianymi przyczynami
(np. badanie preferencji nabywców danego produktu).
2. Badania okresowe są badaniami powtarzalnymi, które przeprowadza
się w określonych momentach (np. publikowany na koniec każdego
kwartału ranking Otwartych Funduszy Emerytalnych).
3. Badania ciągłe polegają na tym, że obserwacja i rejestracja określonych
zdarzeń i faktów odbywa się w sposób ciągły. Badania ciągłe dotyczą
jedynie niektórych, ściśle określonych faktów i zdarzeń (np. analiza procesu
produkcyjnego pod względem jakości – konstrukcja tzw. kart
kontrolnych).
W wypadku podjęcia decyzji o wyborze metody badania częściowego pojawia
się kwestia doboru próby. Z uwagi na złożony charakter tego zagadnienia
– metody doboru próby omówiono w ostatnim rozdziale (zob. Dobor
proby). W tym miejscu warto podkreślić, iż w przypadku metody reprezen -
tacyjnej dobór próby powinien być wyłącznie losowy.

WIĘCEJ INFORMACJI W: Statystyka po ludzku

wtorek, 31 marca 2015

Określenie przedmiotu badania statystycznego

Mając ustalone cele badania statystycznego oraz hipotezy robocze – można
przejść do kolejnej czynności, jaką jest określenie zbiorowości i jednostki
statystycznej.
Zbiorowość statystyczna – zwana też populacją statystyczną lub
generalną – to „ogół osób, rzeczy bądź zjawisk będących przedmiotem
badań statystycznych” [3, s. 15]. Oto przegląd klasyfikacji populacji
statystycznych według wybranych kryteriów:
Klasyfikacja zbiorowości statystycznych pod kątem wybranych kryteriów.
Kryterium
klasyfikacji
Rodzaje zbiorowości statystycznych
I
Kryterium
jednorodności
jednostek zbiorowości
1. Zbiorowość jednorodna – wszystkie jednostki są tego
samego typu, rodzaju i gatunku.
2. Zbiorowość niejednorodna – jednostki rożnią się
cechami jakościowymi.
II
Charakter jednostek
zbiorowości
1. Zbiorowość statyczna – badanie na określony moment.
2. Zbiorowość dynamiczna – badanie w danym przedziale
czasowym.
III
Ilość badanych cech
1. Zbiorowość jednowymiarowa – badanie ze względu na
jedną cechę.
2. Zbiorowość wielowymiarowa – badanie ze względu na
wiele cech.
IV
Liczba elementów
zbiorowości
1. Zbiorowość skończenie liczna – ograniczona możliwa do
określenia liczba jednostek.
2. Zbiorowość nieskończenie liczna – nieograniczona pod
względem liczebności.
V
Zasięg (zakres)
1. Zbiorowość całkowita (populacja generalna).
2. Zbiorowość próbna (próba).
Jednostka statystyczna – zwana też jednostką badania lub obserwacją – to
„najmniejszy element zbiorowości statystycznej” [3, s. 15].
Wchodzące w skład badanej zbiorowości jednostki statystyczne odznaczają
się pewnymi właściwościami, określanymi mianem cech statystycznych
[19, s. 12]. Oto szczegółowa klasyfikacja cech statystycznych:
Rysunek 1.1. Klasyfikacja cech statystycznych.
Źródło: Opracowanie własne na podstawie: [2, s. 26-28], [3, s. 18].
Ogólnie rzecz biorąc, cechy statystyczne można podzielić na dwie grupy
[21, s. 15]:
1. CECHY STAŁE – własności wspólne wszystkim jednostkom badanej
zbiorowości statystycznej.
2. CECHY ZMIENNE – własności, dzięki którym poszczególne jednostki
różnią się między sobą, przy czym dokładny stopień zmienności poszczególnych
cech jest możliwy lub niemożliwy do określenia.
Cechy stałe służą do określenia jednostki statystycznej, a tym samym zbiorowości
statystycznej, pod względem rzeczowym, przestrzennym i czasowym
i nie podlegają badaniu statystycznemu (pełnią rolę „klasyfikatorów”)
[19, s. 12]. Zatem jednostką statystyczną jest „każdy element wchodzący
w skład zbiorowości statystycznej i posiadający – tak jak wszystkie jednostki
tej zbiorowości – tę samą lub te same cechy stałe” [2, s. 25]. Wyróżnia
się następujące typy cech stałych [2, s. 26-27]:
1. Cechy rzeczowe (przedmiotowe) – właściwości, którymi charakteryzuje
się ściśle określony zbiór osób, rzeczy lub zjawisk. Cecha rzeczowa
precyzuje, kto lub co jest przedmiotem badania statystycznego.
2. Cechy przestrzenne – informują o tym, z jakiego miejsca lub obszaru
pochodzą jednostki włączone do badania statystycznego.
3. Cechy czasowe – określają, z jakiego okresu lub momentu włączono
daną jednostkę w skład zbiorowości statystycznej.
M. Sobczyk podkreśla, iż w tej samej zbiorowości można wyodrębnić rożne
jednostki statystyczne [19, s. 12]. Wybór właściwej jednostki statystycznej
zależy głownie od określonego celu badania statystycznego, co ukazują
poniższe przykłady:
Przykład 1. Celem badania statystycznego jest określenie struktury liczby
uczestników Otwartych Funduszy Inwestycyjnych (FIO), które inwestują
powierzone środki na krajowym rynku papierów wartościowych. Raport
ma dotyczyć stanu na koniec 2005 roku. Oto jak zostały określone cechy
stałe (zob. rys. 1.1):
1. Cecha rzeczowa informuje, iż przedmiotem badania jest struktura liczby
osób lokujących środki finansowe w Otwartych Funduszach Inwestycyjnych
(FIO).
2. Cecha przestrzenna zawęża krąg analizy do polskich funduszy inwestujących
w krajowe papiery wartościowe.
3. Cecha czasowa określa moment w czasie, czyli dane za rok 2005.
Rysunek 1.2. Przykład określenia zbiorowości i jednostek statystycznych według cech
stałych.
Źródło: Opracowanie własne.
Z powyższego schematu wynika, iż jednostkami statystycznymi wchodzącymi
w skład oznaczonej kolorem niebieskim populacji generalnej są poszczególne
Fundusze Inwestycyjne Otwarte, lokujące powierzone środki wyłącznie na rynku krajowym (stąd nie uwzględniono funduszu „Z”) i prowadzące
działalność w 2005 roku (nie uwzględniamy w analizie funduszy,
które powstały w trakcie 2005 roku) – łącznie 18 jednostek statystycznych.
W wyniku analizy statystycznej – zgodnie z celem tego badania – otrzyma
się rozkład liczby uczestników FIO w zależności od klasy ryzyka funduszu
(zob. miary natężenia i struktury).
Innym celem jest porównanie dynamiki liczby uczestników Funduszu „A”
Zrównoważonego z Funduszem „A” Akcji w latach 2000-2005 (zob. anali -
za dynamiki). Celem praktycznym jest określenie zmian w preferencjach
odnośnie tych dwóch funduszy i odpowiednie przygotowanie oferty promocyjnej.
Porównywane będą dwie populacje:
1. Jako cechę rzeczową przyjęto odpowiednio FIO „A” Zrównoważony
(pierwsza populacja) i FIO „A” Akcji (druga populacja).
2. W tym przypadku nie ma potrzeby określania cechy przestrzennej, ponieważ
wybrane fundusze działają na określonym rynku.
3. Cecha czasowa jest wspólna dla obu porównywanych populacji – jest
nią zakres czasowy określony na lata 2000-2005.
W tej sytuacji jednostką statystyczną (obserwacją) jest konkretny punkt danych
w przekroju czasowym – liczba obserwacji jest równa liczbie lat objętych
analizą. Należy zaznaczyć, iż możliwe jest porównywanie funduszy,
ktore działają na rynku w określonym czasie (np. porównanie z FIO „E”
Akcji ogranicza analizę do lat 2002-2005).
Przykład 2. Celem badania jest analiza dziennych zmian procentowych indeksu
największych polskich spółek WIG 20 w określonym czasie:
1. Cecha rzeczowa określa przedmiot analizy, czyli procentowe dzienne
zmiany indeksu WIG 20 (można dokonać porównań z innymi indeksami
giełdowymi, np. WIG-iem).
2. Cecha przestrzenna precyzuje, iż chodzi o GPW w Warszawie.
3. Cecha czasowa określa liczbę sesji giełdowych (np. 50 ostatnich sesji).
W tej sytuacji jednostką statystyczną jest sesja giełdowa. Celem analizy
może być także ustalenie, jakie spółki w danym dniu wpłynęły pozytywnie
na poziom badanego indeksu. Należy wyjaśnić, iż indeks ten jest wypadkową
zmian kursów akcji 20 największych spółek wchodzących w jego skład.
Oto określenie cech stałych:
1. Cecha rzeczowa – procentowe dzienne zmiany kursów akcji spółek
WIG 20.
2. Cecha przestrzenna – GPW w Warszawie.
3. Cecha czasowa – określenie sesji giełdowej (np. ostatnia sesja).
W tej sytuacji jednostką statystyczną nie będzie już sesja giełdowa, lecz
spółka zaliczana do indeksu WIG 20. Nietrudno zauważyć, iż istnieje dwadzieścia
jednostek statystycznych (w skład WIG 20 wchodzi bowiem dwadzieścia
spółek).
Przykład 3. Celem badania statystycznego jest analiza wyników egzaminu
ze statystyki w semestrze letnim roku akademickiego 2005/2006 na studiach
dziennych uczelni państwowych. Populację generalną określono pod
względem cech stałych następująco:
1. Cecha rzeczowa – studenci studiów dziennych uczelni państwowych,
którzy w semestrze letnim przystąpili do egzaminu ze statystyki (możliwe
porównanie ze studiami wieczorowymi i zaocznymi).
2. Cecha przestrzenna – osoby studiujące na terytorium RP (wyniki można
porównać np. z innymi krajami Unii Europejskiej).
3. Cecha czasowa – semestr letni roku akademickiego 2005/2006 (wyniki
analizy można np. porównać z analogicznym okresem roku poprzedniego).
Jednostki statystyczne w tym przypadku tworzą studenci studiow dziennych
polskich uczelni państwowych, którzy w semestrze letnim w roku
akademickim 2005/2006 przystąpili do egzaminu ze statystyki.
Druga grupa cech statystycznych to cechy zmienne – podlegają one badaniu
statystycznemu [19, s. 12]. Należą do nich trzy kategorie cech, a mianowicie
(zob. rys. 1.1):
1. Cecha jakościowa (nominalna) to „niemierzalna właściwość, ktorej
konkretny wariant występuje lub nie występuje w danej zbiorowości
i nie dając wyrażać się liczbowo, daje się opisać jedynie za pomocą
określeń słownych” [2, s. 28]. Wariantów cech nominalnych (zob. skala
no minalna ) nie da się uporządkować (por. [20, s. 22]).
2. Cecha quasi-ilościowa (niby-ilościowa, porządkowa) to „właściwość,
która określa natężenie badanej cechy u poszczególnych jednostek danej
zbiorowości w sposób opisowy” [2, s. 28]. Warianty cech porządkowych
(zob. skala porządkowa) – w przeciwieństwie do wariantów cech
nominalnych – można uporządkować (por. [20, s. 22]). Cechy
porządkowe – w bardziej ogólnej klasyfikacji – zaliczane są do cech
jakościowych. Istotne jest to, iż warianty cech jakościowych wyrażone
są za pomocą określeń słownych (werbalnych). Przypisywane niekiedy
cechom jakościowym (nominalnym lub porządkowym) liczby nie
wyrażają bowiem ich wartości – pełnią jedynie rolę „etykiet” (por. [3, s.
18]). Przyjęta w niniejszej publikacji szczegółowa klasyfikacja cech
statystycznych – wyodrębniająca cechy quasi-ilościowe – ma za zadanie
ułatwienie doboru skal pomiarowych w zależności od rodzaju cechy
statystycznej.
3. Cecha ilościowa to „mierzalna właściwość, występująca z określonym
natężeniem u wszystkich jednostek zbiorowości statystycznej” [2, s.
27]. Właściwości cech ilościowych – określanych też mianem cech mierzalnych
– można mierzyć za pomocą liczb mianowanych typu: metry,
kilogramy, sztuki, lata, jednostki pieniężne, czas itp. (por. skala prze -
działowa i skala ilorazowa). Do cech ilościowych należą [3, s. 18]:
cecha skokowa – warianty tej cechy wyrażone są za pomocą liczb
należących do zbioru przeliczalnego lub skończonego (typową jednostką
miary są sztuki/liczby naturalne),
cecha quasi-ciągła (niby-ciągła) – cecha ze swej natury skokowa,
ale z uwagi na bardzo dużą liczbę przyjmowanych wartości liczbowych
traktowana jako cecha ciągła. Różnica między kolejnymi wartościami
liczbowymi jest niewielka (np. ceny wyrażone z dokładnością
do jednego grosza).
cecha ciągła – cecha, której warianty wyrażone są za pomocą liczb
rzeczywistych, gdzie pomiędzy dwiema dowolnymi wartościami
liczbowymi danej cechy można teoretycznie zawsze znaleźć wartość
pośrednią cechy (typowymi jednostkami miary cech ciągłych są
m.in.: czas, metry, kilogramy, wiek).
Należy podkreślić, iż warunkiem zaklasyfikowania danej cechy do cech
skokowych nie jest fakt, iż jej warianty występują w postaci liczb całkowitych.
Przykładem mogą być oceny z egzaminu: 3; 3,5 (3+); 4; 4,5 (4+); 5.
Mimo że cecha ta nie przyjmuje wyłącznie liczb całkowitych (np. tak jak
miałoby to miejsce w przypadku liczby nieobecności w szkole), to – z uwagi
na niewielką liczbę możliwych wariantów – jest ona cechą skokową.
Przy charakterystyce cech statystycznych kilkakrotnie pojawiło się pojęcie
wariantu cechy. Wariant cechy statystycznej jest „informacją uzyskaną
o jednostce statystycznej w trakcie badania statystycznego” [7, s. 10].
Z uwagi na liczbę możliwych wariantów, cechy statystyczne dzieli się na
[20, s. 22]:
cechy dychotomiczne (zero-jedynkowe) – cecha może przyjąć tylko dwa
warianty.
cechy wielodzielne (politomiczne) – przyjmują więcej niż dwa warianty.
Liczba wariantów danej cechy może być co najwyżej równa liczbie jednostek
wchodzących w skład określonej zbiorowości statystycznej – jest to
możliwe w przypadku cech ciągłych. Zazwyczaj jednak liczba wariantów
jest mniejsza od liczby jednostek, ponieważ identyczny wariant cechy może
występować u kilku jednostek statystycznych (por. [19, s. 13]). Oto
przykłady identyfikacji rodzaju cech statystycznych (zmiennych):
Przykład 1. Nawiązując do prezentowanego wcześniej przykładu z Funduszami
Inwestycyjnymi Otwartymi (zob. rys. 1.2), należy ustalić – po określeniu
jednostki i zbiorowości statystycznej – typy cech statystycznych.
Przykład ilustruje rys. 1.3:
Rysunek 1.3. Przykłady cech statystycznych.
Źródło: Opracowanie własne (dane umowne).
Zbiorowość statystyczna została określona pod względem rzeczowym (co
jest przedmiotem badania), przestrzennym (teren badania) oraz czasowym
(moment badania określony na 2005 rok). Tak określona zbiorowość
składa się z 18 jednostek statystycznych, którymi są poszczególne
Fundusze Inwestycyjne Otwarte lokujące środki finansowe na krajowym
rynku w 2005 roku. Wybraną jednostkę statystyczną zaznaczono żółtym
kolorem. Każda jednostka posiada szereg właściwości, czyli zmiennych
cech statystycznych. Dwie pierwsze, „Nazwa funduszu” i „Klasa ryzyka”,
mają jakościowy charakter, ponieważ ich warianty dają się opisać w sposób
słowny. Pogrubionym kolorem zaznaczono jeden z wariantów cechy
„Klasa ryzyka” – cecha ta jest cechą quasi-ilościową (porządkową),
ponieważ jej warianty można uporządkować pod kątem stopnia ryzyka
(niemniej jednak w innych analizach, gdzie ryzyko nie ma znaczenia, cecha
ta jest cechą nominalną). „Stopa zwrotu” nie jest cechą quasi-ciągłą,
ponieważ teoretycznie można ją wyznaczyć z nieskończenie dużą precyzją
– jest to iloraz ceny jednostki uczestnictwa z końca do ceny z początku
2005 roku. Natomiast ceny z definicji podaje się z dokładnością do
1 grosza.
Przykład 2. Celem badania statystycznego jest analiza rynku mieszkań
w tzw. standardzie deweloperskim w Polsce. Oto zestaw cech statystycznych
branych pod uwagę:
1. Nazwa województwa – cecha jakościowa nominalna.
2. Ilość pokoi – cecha ilościowa skokowa.
3. Cena mieszkania (zł/m2) – cecha ilościowa quasi-ciągła.
Przykład 3. Przedmiotem badania statystycznego jest określenie czynników
wpływających na wyniki egzaminu ze statystyki. Jako cechę zależną
przyjęto liczbę punktów uzyskanych na egzaminie (cecha ilościowa quasi- ciągła – punkty mierzone w skali od zera do 100 z dokładnością do 0,1).
Oto zestaw zmiennych objaśniających:
1. Liczba nieobecności na zajęciach – cecha ilościowa skokowa.
2. Przeciętna liczba godzin poświęconych nauce statystyki tygodniowo –
jw.
3. Preferencje co do przedmiotu statystyka (nudny, ciekawy) – cecha porządkowa.
4. Płeć studenta – cecha jakościowa (nominalna).
Reasumując, zbiorowość statystyczną tworzą poszczególne jednostki statystyczne, posiadające określone cechy statystyczne. O ile cechy stałe
wspólne wszystkim jednostkom badania statystycznego – służą do określenia
zbiorowości, o tyle cechy zmienne podlegają badaniu. Należy ustalić,
czy będzie ono obejmowało wszystkie jednostki, czy tylko wybrane z nich,

a następnie dokonać wyboru adekwatnej metody badania.
WIĘCEJ INFORMACJI W: Statystyka po ludzku