wtorek, 3 listopada 2015

Rozkład dwumianowy

Rozkład dwumianowy
(Bernoulliego) zmiennej losowej X znajduje zastosowanie
wówczas, gdy (por. [21, s. 195]):
1. Przeprowadza się n jednakowych doświadczeń.
2. Dla każdego doświadczenia możliwe są dwa wyniki: sukces lub porażka.
3. Prawdopodobieństwo sukcesu p w kolejnych doświadczeniach nie zmienia
się (doświadczenia niezależne).
4. Liczba doświadczeń n jest niewielka (zał. n < 30).
Funkcja prawdopodobieństwa rozkładu dwumianowego jest następująca:
Dwumian Newtona oblicza się według wzoru:
Oto podstawowe charakterystyki rozkładu:
a) wartość oczekiwana:
b) odchylenie standardowe:
Dystrybuantą zmiennej losowej X o rozkładzie dwumianowym jest funkcja
postaci (por. [9, s. 95]):
!( ) !
!
k n k
n
k
n
-
= ÷
÷ø
ö
ç çè
æ
m = np
s = np(1- p)
F(k ) = P( X £ k )
Analogicznie można określić dystrybuantę dla pozostałych rozkładów skokowych.
Przykład. Student na „chybił-trafił” rozwiązuje test wielokrotnego wyboru
ze statystyki, gdzie tylko jedna spośród czterech opcji odpowiedzi jest prawidłowa.
Test liczy 10 pytań. Proszę obliczyć prawdopodobieństwo tego,
że ponad 40 proc. odpowiedzi będzie prawidłowych. Wypisujemy dane:
a) liczba sukcesów polegających na właściwym zaznaczeniu odpowiedzi:
P(X > 4),
b) liczba niezależnych prób (pytań w teście): n = 10,
c) prawdopodobieństwo sukcesu: p = 0,25.
Możemy skorzystać ze wzoru na prawdopodobieństwo dopełnienia zdarzeń:
Następnie obliczamy prawdopodobieństwa cząstkowe ze wzoru na funkcję
prawdopodobieństwa rozkładu dwumianowego. Oto sposób obliczeń dla
k = 0:
Wracamy do wzoru:
P( X > 4) =1- P( X £ 4) =1- [P( X = 0) + P( X =1) + P( X = 2) + P( X = 3) + P( X = 4)]
( ) (0,25)0 (1 0,25)10 0
0
10
0 - - × × ÷ ÷ø
ö
ç çè
æ
P X = =
( ) 1
1 10!
10!
0! 10 0 !
10!
0
10
=
×
=
-
= ÷
÷ø ö
ç çè
æ
P( X = 0) =1×1× (1- 0,25)10 = (0,75)10 = 0,0563
Analogicznie obliczamy prawdopodobieństwa dla k = 1, k = 2, k = 3 i k = 4.
Suma prawdopodobieństw cząstkowych to:
Powyższe prawdopodobieństwo jest wartością dystrybuanty rozkładu dwumianowego
w punkcie 4. Oto wykres dystrybuanty tego rozkładu:
Rysunek 3.4. Dystrybuanta rozkładu dwumianowego.
Źródło: Opracowanie własne.
Prawdopodobieństwo tego, że student poprawnie wskaże ponad 40 proc.
odpowiedzi, wynosi (przy założeniu, że za dane pytanie jest zero punktów
lub jeden punkt):
Jedynie ośmiu studentów na stu uzyska ponad 40 proc. poprawnych odpowiedzi
zakreślając odpowiedzi na „chybił-trafił”.
Szczególnym przypadkiem rozkładu dwumianowego jest rozkład dwupunktowy
(zerojedynkowy). W tej sytuacji ma miejsce:
a) prawdopodobieństwo sukcesu:
b) prawdopodobieństwo porażki:
Charakterystyki tego rozkładu są następujące:
a) wartość oczekiwana:
b) odchylenie standardowe:
Nawiązując do powyższego przykładu: możemy stwierdzić, że prawdopodobieństwo
sukcesu, jakim jest losowy wybór prawidłowej opcji odpowiedzi
wynosi 0,25. Jednocześnie prawdopodobieństwo porażki, tj. zaznaczenia
nieprawidłowej odpowiedzi, wynosi 0,75.
O ile rozkład dwumianowy określa liczbę k sukcesów wśród n powtórzeń
doświadczenia (np. n rzutów monetą), o tyle rozkład geometryczny wyznacza
prawdopodobieństwo pojawienia się pierwszego sukcesu:
Charakterystyki:
a) wartość oczekiwana:
b) odchylenie standardowe:
Przykład. Średnio rzecz biorąc, co piąty internauta odwiedzający pewien
sklep internetowy robi w nim zakupy. Należy obliczyć prawdopodobieństwo
tego, że pierwsza transakcja pojawi się przy trzecim wejściu na stronę.
Ile powinno być wejść na stronę, aby została dokonana transakcja kupna-
sprzedaży?:
Wypisujemy dane:
p = 0,2 (co piąty internauta)
k = 3
Podstawiamy do wzoru na funkcję prawdopodobieństwa rozkładu geometrycznego:
Prawdopodobieństwo tego, że pierwsza transakcja zostanie zawarta po trzecim
wejściu na stronę, wynosi 12,8 proc.
Aby odpowiedzieć na pytanie, ile powinno być średnio wejść na stronę, by
została dokonana transakcja kupna-sprzedaży, obliczamy wartość oczekiwaną:
Należy oczekiwać, iż średnio przy pięciu wejściach na stronę zostanie zakupiony
jakiś produkt ze sklepu internetowego. Oczywiście pierwszy internauta
może od razu nabyć pewien produkt, ale też może zdarzyć się sytuacja,
w której nawet pięć wejść nie gwarantuje zbytu produktów. Warto
więc obliczyć jeszcze odchylenie standardowe:
Górną granicę typowego obszaru zmienności uzyskamy, dodając do wartości
oczekiwanej obliczone powyżej odchylenie standardowe. Zatem o nietypowej
sytuacji możemy mówić w przypadku, gdy na stronę wejdzie więcej

niż dziewięciu internautów i nie zostanie zawarta transakcja kupna sprzedaży.
WIĘCEJ INFORMACJI W: Statystyka po ludzku