czwartek, 24 grudnia 2015

Excel. Format daty

Excel. Format daty
Liczba może być wyświetlana jako data, gdyż data w komputerze to liczba dni,
które upłynęły od 30-12-1899 r. Czasem, wbrew oczekiwaniom, wpisując liczbę
otrzymujemy właśnie datę. Dzieje się tak wtedy, gdy komórka była uprzednio
sformatowana na datę. Niezamierzonego formatowania możemy się pozbyć wybierając

dla komórki format liczby.

poniedziałek, 7 grudnia 2015

Formatowanie liczb

Zawartość komórek możemy formatować. Może to dotyczyć czcionki (styl, wielkość, kolor), tła (kolor komórki) i postaci liczb, gdy zawartość komórki jest liczbą.
Liczby, które są wynikiem działań zawierają często zbyt wiele cyfr, co utrudnia szybką identyfikację ich wielkości. Najczęściej formatowanie liczb – wyników formuł w Excelu – dotyczy właśnie zmniejszenia w ich wyglądzie ilości pokazywanych cyfr dziesiętnych. Liczba, gdy jest pobierana do dalszych operacji, nadal ma taką samą ilość cyfr, zmienia się tylko jej obraz przedstawiany na ekranie. Najprościej możemy dokonać formatowania liczby wykorzystując przyciski z paska narzędziowego Liczba.

Liczby występujące w obliczeniach mają czasem postać naukową, wtedy w liczbie występuje litera E symbolizująca mnożenie przez potęgę liczby 10. Na przykład 1,102E-3 przedstawia liczbę 1,102*10-3.Taka postać występuje często, gdy otrzymana w wyniku liczba jest bardzo mała lub bardzo duża. Można ją sformatować na postać z kropką dziesiętną, ale liczba pokazywanych cyfr będzie bardzo duża.

poniedziałek, 16 listopada 2015

Dane i ich typy

Plik Excela, czyli skoroszyt, składa się z kilku arkuszy podzielonych na komórki służące do przechowywania danych. Nowy arkusz dodajemy ikonką widoczną u dołu arkusza. Dane w Excelu wprowadzamy bezpośrednio do komórek. Zawartość komórki może być tekstem, gdy zaczyna się od litery, liczbą, gdy zaczyna się od cyfry i ma budowę liczby (liczba może być poprzedzona znakiem +, -, =), lub formułą, gdy zaczyna się znakiem = i zawiera adresy komórek, funkcje i liczby połączone znakami działań. Rysunek 1 przedstawia dane różnych typów.

wtorek, 3 listopada 2015

Rozkład dwumianowy

Rozkład dwumianowy
(Bernoulliego) zmiennej losowej X znajduje zastosowanie
wówczas, gdy (por. [21, s. 195]):
1. Przeprowadza się n jednakowych doświadczeń.
2. Dla każdego doświadczenia możliwe są dwa wyniki: sukces lub porażka.
3. Prawdopodobieństwo sukcesu p w kolejnych doświadczeniach nie zmienia
się (doświadczenia niezależne).
4. Liczba doświadczeń n jest niewielka (zał. n < 30).
Funkcja prawdopodobieństwa rozkładu dwumianowego jest następująca:
Dwumian Newtona oblicza się według wzoru:
Oto podstawowe charakterystyki rozkładu:
a) wartość oczekiwana:
b) odchylenie standardowe:
Dystrybuantą zmiennej losowej X o rozkładzie dwumianowym jest funkcja
postaci (por. [9, s. 95]):
!( ) !
!
k n k
n
k
n
-
= ÷
÷ø
ö
ç çè
æ
m = np
s = np(1- p)
F(k ) = P( X £ k )
Analogicznie można określić dystrybuantę dla pozostałych rozkładów skokowych.
Przykład. Student na „chybił-trafił” rozwiązuje test wielokrotnego wyboru
ze statystyki, gdzie tylko jedna spośród czterech opcji odpowiedzi jest prawidłowa.
Test liczy 10 pytań. Proszę obliczyć prawdopodobieństwo tego,
że ponad 40 proc. odpowiedzi będzie prawidłowych. Wypisujemy dane:
a) liczba sukcesów polegających na właściwym zaznaczeniu odpowiedzi:
P(X > 4),
b) liczba niezależnych prób (pytań w teście): n = 10,
c) prawdopodobieństwo sukcesu: p = 0,25.
Możemy skorzystać ze wzoru na prawdopodobieństwo dopełnienia zdarzeń:
Następnie obliczamy prawdopodobieństwa cząstkowe ze wzoru na funkcję
prawdopodobieństwa rozkładu dwumianowego. Oto sposób obliczeń dla
k = 0:
Wracamy do wzoru:
P( X > 4) =1- P( X £ 4) =1- [P( X = 0) + P( X =1) + P( X = 2) + P( X = 3) + P( X = 4)]
( ) (0,25)0 (1 0,25)10 0
0
10
0 - - × × ÷ ÷ø
ö
ç çè
æ
P X = =
( ) 1
1 10!
10!
0! 10 0 !
10!
0
10
=
×
=
-
= ÷
÷ø ö
ç çè
æ
P( X = 0) =1×1× (1- 0,25)10 = (0,75)10 = 0,0563
Analogicznie obliczamy prawdopodobieństwa dla k = 1, k = 2, k = 3 i k = 4.
Suma prawdopodobieństw cząstkowych to:
Powyższe prawdopodobieństwo jest wartością dystrybuanty rozkładu dwumianowego
w punkcie 4. Oto wykres dystrybuanty tego rozkładu:
Rysunek 3.4. Dystrybuanta rozkładu dwumianowego.
Źródło: Opracowanie własne.
Prawdopodobieństwo tego, że student poprawnie wskaże ponad 40 proc.
odpowiedzi, wynosi (przy założeniu, że za dane pytanie jest zero punktów
lub jeden punkt):
Jedynie ośmiu studentów na stu uzyska ponad 40 proc. poprawnych odpowiedzi
zakreślając odpowiedzi na „chybił-trafił”.
Szczególnym przypadkiem rozkładu dwumianowego jest rozkład dwupunktowy
(zerojedynkowy). W tej sytuacji ma miejsce:
a) prawdopodobieństwo sukcesu:
b) prawdopodobieństwo porażki:
Charakterystyki tego rozkładu są następujące:
a) wartość oczekiwana:
b) odchylenie standardowe:
Nawiązując do powyższego przykładu: możemy stwierdzić, że prawdopodobieństwo
sukcesu, jakim jest losowy wybór prawidłowej opcji odpowiedzi
wynosi 0,25. Jednocześnie prawdopodobieństwo porażki, tj. zaznaczenia
nieprawidłowej odpowiedzi, wynosi 0,75.
O ile rozkład dwumianowy określa liczbę k sukcesów wśród n powtórzeń
doświadczenia (np. n rzutów monetą), o tyle rozkład geometryczny wyznacza
prawdopodobieństwo pojawienia się pierwszego sukcesu:
Charakterystyki:
a) wartość oczekiwana:
b) odchylenie standardowe:
Przykład. Średnio rzecz biorąc, co piąty internauta odwiedzający pewien
sklep internetowy robi w nim zakupy. Należy obliczyć prawdopodobieństwo
tego, że pierwsza transakcja pojawi się przy trzecim wejściu na stronę.
Ile powinno być wejść na stronę, aby została dokonana transakcja kupna-
sprzedaży?:
Wypisujemy dane:
p = 0,2 (co piąty internauta)
k = 3
Podstawiamy do wzoru na funkcję prawdopodobieństwa rozkładu geometrycznego:
Prawdopodobieństwo tego, że pierwsza transakcja zostanie zawarta po trzecim
wejściu na stronę, wynosi 12,8 proc.
Aby odpowiedzieć na pytanie, ile powinno być średnio wejść na stronę, by
została dokonana transakcja kupna-sprzedaży, obliczamy wartość oczekiwaną:
Należy oczekiwać, iż średnio przy pięciu wejściach na stronę zostanie zakupiony
jakiś produkt ze sklepu internetowego. Oczywiście pierwszy internauta
może od razu nabyć pewien produkt, ale też może zdarzyć się sytuacja,
w której nawet pięć wejść nie gwarantuje zbytu produktów. Warto
więc obliczyć jeszcze odchylenie standardowe:
Górną granicę typowego obszaru zmienności uzyskamy, dodając do wartości
oczekiwanej obliczone powyżej odchylenie standardowe. Zatem o nietypowej
sytuacji możemy mówić w przypadku, gdy na stronę wejdzie więcej

niż dziewięciu internautów i nie zostanie zawarta transakcja kupna sprzedaży.
WIĘCEJ INFORMACJI W: Statystyka po ludzku

środa, 14 października 2015

Charakterystyka wybranych rozkładów prawdopodobieństwa

W niniejszym podrozdziale omowiono wybrane rozkłady prawdopodobieństwa.
Obliczeń można dokonać w załączonym dodatku Rozkłady prawdopodobieństwa.
W tym podrozdziale położono nacisk na odpowiedni wybor
rozkładu, a także na umiejętność odczytu żądanych wartości z tablic statystycznych.
Oto klasyfikacja omowionych w dalszej części rozkładow prawdopodobieństwa:
Rozkład dwumianowy
Rozkład dwumianowy (Bernoulliego) zmiennej losowej X znajduje zastosowanie
wowczas, gdy (por. [21, s. 195]):
1. Przeprowadza się n jednakowych doświadczeń.
2. Dla każdego doświadczenia możliwe są dwa wyniki: sukces lub porażka.
3. Prawdopodobieństwo sukcesu p w kolejnych doświadczeniach nie zmienia
się (doświadczenia niezależne).
4. Liczba doświadczeń n jest niewielka (zał. n < 30).
Funkcja prawdopodobieństwa rozkładu dwumianowego jest następująca:
Dwumian Newtona oblicza się według wzoru:
Oto podstawowe charakterystyki rozkładu:
a) wartość oczekiwana:
b) odchylenie standardowe:
Dystrybuantą zmiennej losowej X o rozkładzie dwumianowym jest funkcja
postaci (por. [9, s. 95]):
Copyright by Wydawnictwo Złote Myśli & Paweł Tatarzycki
!( ) !
!
k n k
n
k
n
-
= ÷
÷ø
ö
ç çè
æ
m = np
s = np(1- p)
F(k ) = P( X £ k )
Analogicznie można określić dystrybuantę dla pozostałych rozkładow skokowych.
Przykład. Student na „chybił-trafił” rozwiązuje test wielokrotnego wyboru
ze statystyki, gdzie tylko jedna spośrod czterech opcji odpowiedzi jest prawidłowa.
Test liczy 10 pytań. Proszę obliczyć prawdopodobieństwo tego,
że ponad 40 proc. odpowiedzi będzie prawidłowych. Wypisujemy dane:
a) liczba sukcesow polegających na właściwym zaznaczeniu odpowiedzi:
P(X > 4),
b) liczba niezależnych prob (pytań w teście): n = 10,
c) prawdopodobieństwo sukcesu: p = 0,25.
Możemy skorzystać ze wzoru na prawdopodobieństwo dopełnienia zdarzeń:
Następnie obliczamy prawdopodobieństwa cząstkowe ze wzoru na funkcję
prawdopodobieństwa rozkładu dwumianowego. Oto sposob obliczeń dla
k = 0:
Wracamy do wzoru:
Copyright by Wydawnictwo Złote Myśli & Paweł Tatarzycki
P( X > 4) =1- P( X £ 4) =1- [P( X = 0) + P( X =1) + P( X = 2) + P( X = 3) + P( X = 4)]
( ) (0,25)0 (1 0,25)10 0
0
10
0 - - × × ÷ ÷ø
ö
ç çè
æ
P X = =
( ) 1
1 10!
10!
0! 10 0 !
10!
0
10
=
×
=
-
= ÷
÷ø ö
ç çè
æ
P( X = 0) =1×1× (1- 0,25)10 = (0,75)10 = 0,0563
Analogicznie obliczamy prawdopodobieństwa dla k = 1, k = 2, k = 3 i k = 4.
Suma prawdopodobieństw cząstkowych to:
Powyższe prawdopodobieństwo jest wartością dystrybuanty rozkładu dwumianowego
w punkcie 4. Oto wykres dystrybuanty tego rozkładu:
Rysunek 3.4. Dystrybuanta rozkładu dwumianowego.
Źródło: Opracowanie własne.
Prawdopodobieństwo tego, że student poprawnie wskaże ponad 40 proc.
odpowiedzi, wynosi (przy założeniu, że za dane pytanie jest zero punktow
lub jeden punkt):
Jedynie ośmiu studentow na stu uzyska ponad 40 proc. poprawnych odpowiedzi
zakreślając odpowiedzi na „chybił-trafił”.
Szczegolnym przypadkiem rozkładu dwumianowego jest rozkład dwupunktowy
(zerojedynkowy). W tej sytuacji ma miejsce:
a) prawdopodobieństwo sukcesu:
b) prawdopodobieństwo porażki:
Charakterystyki tego rozkładu są następujące:
a) wartość oczekiwana:
b) odchylenie standardowe:
Nawiązując do powyższego przykładu: możemy stwierdzić, że prawdopodobieństwo
sukcesu, jakim jest losowy wybor prawidłowej opcji odpowiedzi
wynosi 0,25. Jednocześnie prawdopodobieństwo porażki, tj. zaznaczenia
nieprawidłowej odpowiedzi, wynosi 0,75.
O ile rozkład dwumianowy określa liczbę k sukcesow wśrod n powtorzeń
doświadczenia (np. n rzutow monetą), o tyle geometryczny wyznacza
prawdopodobieństwo pojawienia się pierwszego sukcesu:
Charakterystyki:
a) wartość oczekiwana:
b) odchylenie standardowe:
Przykład. Średnio rzecz biorąc, co piąty internauta odwiedzający pewien
sklep internetowy robi w nim zakupy. Należy obliczyć prawdopodobieństwo
tego, że pierwsza transakcja pojawi się przy trzecim wejściu na stronę.
Ile powinno być wejść na stronę, aby została dokonana transakcja kupna-
sprzedaży?:
Wypisujemy dane:
p = 0,2 (co piąty internauta)
k = 3
Podstawiamy do wzoru na funkcję prawdopodobieństwa rozkładu geometrycznego:
Prawdopodobieństwo tego, że pierwsza transakcja zostanie zawarta po trzecim
wejściu na stronę, wynosi 12,8 proc.
Aby odpowiedzieć na pytanie, ile powinno być średnio wejść na stronę, by
została dokonana transakcja kupna-sprzedaży, obliczamy wartość oczekiwaną:
Należy oczekiwać, iż średnio przy pięciu wejściach na stronę zostanie zakupiony
jakiś produkt ze sklepu internetowego. Oczywiście pierwszy internauta
może od razu nabyć pewien produkt, ale też może zdarzyć się sytuacja,
w ktorej nawet pięć wejść nie gwarantuje zbytu produktow. Warto
więc obliczyć jeszcze odchylenie standardowe:
Gorną granicę typowego obszaru zmienności uzyskamy, dodając do wartości
oczekiwanej obliczone powyżej odchylenie standardowe. Zatem o nietypowej
sytuacji możemy mowić w przypadku, gdy na stronę wejdzie więcej

niż dziewięciu internautow i nie zostanie zawarta transakcja kupna sprzedaży.
WIĘCEJ INFORMACJI W: Statystyka po ludzku>>>

poniedziałek, 28 września 2015

Wybrane zagadnienia z rachunku prawdopodobieństwa

Wnioskowanie statystyczne opiera się na rachunku prawdopodobieństwa, a reguły tego wnioskowania określają metody wchodzące w skład statystyki matematycznej, w tym metody estymacji (szacowania) nieznanych parametrów strukturalnych oraz metody weryfikacji (sprawdzania) hipotez statystycznych. Estymację przedziałową oraz weryfikację hipotez statystycznych poprzedzono krótkim wprowadzeniem do rachunku prawdopodobieństwa, jak również omówiono wybrane skokowe i ciągłe rozkłady prawdopodobieństwa. Rozkłady te w większości przypadków znajdują bowiem zastosowanie w metodach wnioskowania statystycznego.



Wybrane zagadnienia
z rachunku prawdopodobieństwa
Na wstępie należałoby zdefiniować pojęcie prawdopodobieństwa. Prawdopodobieństwo
to „numeryczne wyrażenie szansy wystąpienia jakiegoś zdarzenia”
[21, s. 166]. Jest to miara unormowana, tj. należąca do przedziału
[0-1]. Jeżeli prawdopodobieństwo jest równe zeru, to wówczas dane zdarzenie
nie wystąpi, gdy jest równe 1 – to zdarzenie jest pewne. Natomiast
zdarzenia, dla których wartości prawdopodobieństwa należą do zbioru (0,1)
nie są ani pewne, ani niemożliwe – przypisane im ułamki są prawdopodobieństwem
zajścia danego zdarzenia.
Zgodnie z klasyczną definicją prawdopodobieństwa: prawdopodobieństwo
zdarzenia losowego A – przy założeniu, że wszystkie zdarzenia elementarne
są jednakowo możliwe – jest ilorazem liczby zdarzeń elementarnych
sprzyjających temu zdarzeniu i liczby wszystkich zdarzeń elementarnych Klasyczną definicję prawdopodobieństwa zdarzenia A można
wyrazić wzorem:
Oto dwa proste przykłady ilustrujące sposób obliczania prawdopodobieństwa
zgodnie z klasyczną definicją:
Przykład 1. Gra „szczęśliwy numerek” polega na wylosowaniu jednej liczby
spośród 49. W tej sytuacji liczba zdarzeń elementarnych wynosi n = 49
(może zostać wylosowana liczba od 1 do 49). Tylko jedna z nich okaże się
wygrywającą, stąd k = 1. Prawdopodobieństwo wygranej to:
Przykład 2. Wśród 200 złożonych w pewnej miejscowości wniosków
o dotacje unijne 25 okazało się źle wypełnionych. Należy obliczyć prawdopodobieństwo
błędnego wypełnienia wniosku. Dane:
n = 200 wniosków,
k = 25 wniosków źle wypełnionych.
Prawdopodobieństwo zdarzenia A, polegającego na wylosowaniu wniosku
posiadającego wady, wynosi:
Rozwinięciem klasycznej definicji prawdopodobieństwa jest definicja
graficzna:
Obszar całkowity to przestrzeń zdarzeń elementarnych o określonej jednostce
miary (długość, pole, objętość). Obszar A spełnia warunki określone
zdarzeniem A. Przedstawiona definicja znajduje zastosowanie np. w roz -
kładach ciągłych, gdzie pole pod tzw. funkcją gęstości wynosi 1. W przypadku
cech ciągłych skorzystanie z klasycznej definicji prawdopodobieństwa
jest bezzasadne, ponieważ w tej sytuacji prawdopodobieństwo przyjęcia
określonej wartości przez zmienną losową jest równe zeru.
Trzecia, statystyczna definicja prawdopodobieństwa – zwana też częstościową
lub frekwencyjną – mówi, że prawdopodobieństwo zdarzenia A jest
granicą częstości tego zdarzenia, gdy liczba doświadczeń n rośnie nieograniczenie
[19, s. 81]. Można to zapisać następująco:
Statystyczna definicja prawdopodobieństwa pozwala przypuszczać, że
wraz ze wzrostem próby losowej frakcja (zob. wskaźnik struktury) wyznaczona
na jej podstawie jest coraz bliższa wartości prawdopodobieństwa
określonej według definicji częstościowej. Można tu posłużyć się prostym
przykładem:
Przykład. Funkcja los() programu MS Excel generuje liczby z przedziału
[0,1]. Jako nA można określić wartości mniejsze bądź równe 0,5. Im więcej
prób, tym wartości empiryczne (frakcje) będą bliższe teoretycznej wartości
0,5 (zob. Przykłady – zbieżność prawdopodobieństwa).
Rysunek 3.1. Zbieżność prawdopodobieństwa do teoretycznej wartości 0,5.
Źródło: Opracowanie własne.
Symulację przeprowadzono dla 10, 50 i 100 prób. Im więcej prób, tym
różnice pomiędzy frakcjami a wartością teoretyczną 50 proc. są coraz
mniejsze. Jest to zgodne z przedstawioną statystyczną definicją prawdopodobieństwa.
Mając już zdefiniowane prawdopodobieństwo, możemy sprecyzować,
czym jest zdarzenie losowe A – jest to podzbiór przestrzeni zdarzeń elementarnych
(W), zawierający wyróżnione ze względu na daną cechę zdarzenia
elementarne, czyli wyniki doświadczenia losowego (por. [21, s.
167]). Nawiązując do powyższego przykładu: interesującymi nas zdarzeniami
elementarnymi były wygenerowane za pomocą funkcji los() liczby
nieprzekraczające 0,5. Kolejną kwestią jest algebra zdarzeń. Na szczególną uwagę zasługuje tu
prawdopodobieństwo dopełnienia zdarzenia A (zwanego też zdarzeniem
przeciwnym do A). Prawdopodobieństwo dopełnienia można zapisać następująco
[1, s. 79]:
Powyższa reguła będzie stosowana przy omawianiu rozkładów prawdopodobieństwa
(zob. Charakterystyka wybranych rozkładów prawdopodobień -
stwa).
Przykład. Należy obliczyć prawdopodobieństwo tego, że losowo wybrany
wniosek o dotację UE został prawidłowo wypełniony, wiedząc, że co ósmy
zawiera błędy. Oznaczamy:
P(A) – prawdopodobieństwo tego, że wniosek został źle wypełniony.
Podstawiamy do wzoru:
Zatem prawdopodobieństwo prawidłowego wypełnienia wniosku wynosi
7/8.
Następną ważną regułą w algebrze zdarzeń jest tzw. reguła sumowania.
Prawdopodobieństwo sumy dwóch zdarzeń można przedstawić następująco
[1, s. 79]:
Copyright by
Warto tu wskazać na przypadek szczególny, jakim są zdarzenia wykluczające
się wzajemnie. W tej sytuacji brak jest części wspólnej:
stąd:
W rachunku prawdopodobieństwa istotny jest podział zdarzeń losowych
na:
1. Zdarzenia niezależne – zajście jednego z tych zdarzeń nie ma wpływu
na prawdopodobieństwo zajścia drugiego z nich. Oto warunek niezależności
zdarzeń:
2. Zdarzenia zależne – prawdopodobieństwo zajścia zdarzenia A zależy
od zajścia zdarzenia B. Można tu mówić o tzw. prawdopodobieństwie
warunkowym zdarzenia A przy założeniu, że zaszło zdarzenie B:
Z powyższego równania można wyprowadzić wzór na iloczyn zdarzeń A
i B:
W przypadku gdy zdarzenia są zależne – warto posłużyć się tzw. drzewem
stochastycznym:
Rysunek 3.2. Drzewo stochastyczne.
Źródło: Opracowanie własne.
Zdarzenia na poszczególnych „gałęziach” drzewa są parami przeciwstawne,
stąd np.:
P(B1) + P(B2) + … + P(Bn) = 1
Na podstawie powyższego schematu można wyprowadzić ogólny wzór na
prawdopodobieństwo całkowite:
Mając obliczone prawdopodobieństwo zajścia zdarzenia X – można skorzystać
z tzw. wzoru Bayesa:
Wzór ten pozwala na wyznaczenie prawdopodobieństw zdarzeń Bi, gdy
wiemy, że zaszło zdarzenie X.
Przykład. Prawdopodobieństwo zdania egzaminu ze statystyki w pierwszym
terminie uzależnione jest od tego, czy student korzysta z dodatkowych
form nauczania. Z badań przeprowadzonych wśród wybranej grupy
studentów wynika, iż czterech na dziesięciu studentów skorzystało z dodatkowych
form nauczania. Wśród tej grupy osób aż 70 proc. zdało egzamin
w pierwszym terminie. Natomiast egzamin w pierwszym terminie zdał tylko
co drugi student niekorzystający z dodatkowych form nauczania. Należy
obliczyć:
a) prawdopodobieństwo zdania egzaminu ze statystyki w pierwszym terminie,
b) prawdopodobieństwo, że losowo wybrany student, który zdał egzamin
w pierwszym terminie korzystał z dodatkowych form nauczania.
Wprowadzamy następujące oznaczenia:
P(X) – prawdopodobieństwo zdania egzaminu ze statystyki w pierwszym
terminie,
P(B1) – prawdopodobieństwo, że student korzystał z dodatkowych form
nauczania,
P(B2) – prawdopodobieństwo, że student nie korzystał z dodatkowych form
nauczania.
Dane przedstawiono na drzewie stochastycznym:
Rysunek 3.3. Drzewo stochastyczne – przykład liczbowy.
Źródło: Dane umowne.
a) obliczamy prawdopodobieństwo całkowite:
b) korzystamy ze wzoru Bayesa:
Prawdopodobieństwo zdania egzaminu w pierwszym terminie wynosi 58
proc. Prawdopodobieństwo, że losowo wybrany student, który zdał egzamin
w pierwszym terminie, korzystał z dodatkowych form nauczania wynosi
48,3 proc.
To, czy zdarzenia są od siebie zależne, czy też nie, będzie miało wpływ na
wybór rozkładu prawdopodobieństwa, a także na dobór niektórych testów
statystycznych.
Opis struktury zbiorowości dotyczył empirycznych rozkładów cech jakościowych
i ilościowych. W przypadku teoretycznych rozkładów prawdopodobieństwa
można mówić o tzw. zmiennej losowej. Mianem zmiennej losowej
określa się „każdą jednoznacznie określoną funkcję rzeczywistą wy znaczoną na zbiorze zdarzeń elementarnych” [9, s. 88]. Zmienne losowe
dzielą się na (por. [8, s. 30]):
1. Skokowe (por. cecha skokowa) – w przypadku zmiennych losowych
skokowych (dyskretnych) można mówić o rozkładzie masy prawdopodobieństwa:
2. Ciągłe (por. cecha ciągła i quasi -ciągła ) – w przypadku zmiennych losowych
ciągłych mówimy o tzw. rozkładzie gęstości prawdopodobieństwa:
Teoretyczne rozkłady prawdopodobieństwa posiadają syntetyczne charakterystyki
(por. [8, s. 35]):
– wartość oczekiwana (por. średnia arytmetyczna),
– wariancja bądź odchylenie standardowe (pierwiastek kwadratowy z wariancji).
Sposób obliczania wymienionych charakterystyk zawiera tabela:
Tabela 3.1. Podstawowe charakterystyki rozkładów zmiennych losowych.
Zmienne losowe skokowe Zmienne losowe ciągłe
Wartość
oczekiwana
Wariancja
Źródło: Opracowanie własne na podstawie: [8, s. 35].
Copyright by Wydawnictwo Złote Myśli & Paweł Tatarzycki
( ) i i P X = x = p
( < < ) = ò ( ) =
b
a
i P a X b f x dx p
( ) å=
= =
k
i
i i E X m x p
1
( ) ò ( )
E X = m = x × f x dx
( ) ( ) å=
= = - ×
k
i
i i D X x m p
1
2 s 2 2
( ) ò( ) ( )
D2 X =s 2 = x - m 2 × f x dx
W kolejnym podrozdziale omówiono wybrane rozkłady skokowe i ciągłe.
Należy zaznaczyć, iż charakterystyki są obliczane nie ze wzorów prezentowanych

w tabeli 3.1, lecz ze wzorów uproszczonych.