(image)

Rachunek prawdopodobieństwa 1, 2

4.2 Rozkłady dyskretne i rozkłady ciągłe

Najczęściej rozważamy rozkłady dyskretne oraz rozkłady ciągłe (istnieją też inne rozkłady).

  • Definicja – 4.6 (Rozkład dyskretny) Rozkład n-wymiarowy \(Q\) nazywamy rozkładem dyskretnym, jeżeli istnieje zbiór borelowski \(K \subset \r ^n\) taki, że:

    \[ Q(K) = 1 \;\;\mbox { oraz } \;\; x \in K \Rightarrow Q(x) > 0. \]

  • Uwaga – 4.7 Występujący w powyższej definicji zbiór \(K\) jest skończony lub przeliczalny.

Dowód. Zauważmy, że \(K\) można przedstawić jako przeliczalną sumę zbiorów skończonych.

Dokładniej: \(K = \bigcup _{i=1}^{\infty } K_i\), gdzie \(K_i = \{x \in \r ^n : Q(x) \ge \frac {1}{i}\}\).

Widzimy, że \(1 \ge Q(K_i) \ge \#K_i\cdot \frac {1}{i}\), a więc \(\#K_i \le i.\)   

Z powyższej uwagi wynika, iż możemy zbiór \(K\) ustawić w ciąg, powiedzmy \(K = \{x_i: i= 1,\dots ,m\}\), gdzie \(m\) jest liczbą naturalną lub \(m = \infty \), i oznaczyć \(p_i = Q(x_i)\). Mamy wtedy:

\[ \sum _{i=1}^m p_i = 1 \;\;\mbox { oraz }\;\;p_i > 0 \mbox { dla wszystkich } i. \]

(image)
\(Q(0) = 0.6, \ \ Q(1)= 0.4\)

(image)
\(Q(1) = \frac {3}{12}, \ \ Q(2)= \frac {1}{6}, \ \ Q(3)= \frac {1}{6}\)

\(Q(4) = \frac {1}{6}, \ \ Q(5)= \frac {1}{6}, \ \ Q(6)= \frac {1}{12}\)

Zdefiniowane w ten sposób ciągi \(\{x_i\}\) i \(\{p_i\}\) wyznaczają jednoznacznie rozkład \(Q\). Mianowicie, dla każdego zbioru borelowskiego A mamy \(Q(A) = Q(A\cap K)\) (dlaczego?) i dalej:

\begin{equation} Q(A) = \sum _{i: x_i \in A} p_i. \label {eq:Q(A)} \end{equation}

W związku z powyższym, często używa się sformułowania: rozkład dyskretny zadany przez ciągi \(\{x_i\}\) i \(\{p_i\}\).

Dystrybuanta rozkładu dyskretnego Niech rozkład dyskretny \(Q\) będzie zadany przez ciągi \(\{x_i\}\) oraz \(\{p_i\}\). Wtedy otrzymujemy:

\[ F_Q(x) = \sum _{i:x_i \le x} p_i. \]

Trywialnym przykładem rozkładu dyskretnego jest rozkład jednopunktowy \(\delta _c\). Nietrywialnymi przykładami są kombinacje barycentryczne takich rozkładów.

Rozkład \((0,1,p)\) Jest to rozkład skupiony w dwóch punktach \(0\) oraz \(1\) mający parametr \(0<p<1\). Mianowicie:

\[ Q(0) = 1- p, \ \ \ \ \ Q(1) = p. \]

Jest często używany, jako model doświadczenia, które może dać dokładnie dwa wyniki nazywane często sukcesem – 1 i porażką – 0.

Rozkład dwumianowy, \(B(n,p)\) Jest to rozkład skupiony w punktach \(0,1,\dots , n\), przy czym:

\[Q(k) = \binom {n}{k} p^k(1 -p)^{n-k}\;\;\textrm {dla}\;\;k= 0,1,\dots , n.\]

Pamiętamy, że powyższy wzór określa prawdopodobieństwo dokładnie \(k\) sukcesów w \(n\) niezależnych próbach Bernoulliego.

  • Przykład – 4.8 Możemy zinterpretować graficznie wzór (4.5) dla rozkładu \(B(20,0.4)\).

    (image)

    (image)

    (image)

    (image)

  • Definicja – 4.9 (Rozkład ciągły) Rozkład n-wymiarowy \(Q\) nazywamy rozkładem ciągłym, jeżeli istnieje funkcja całkowalna \(f\colon \rn \str \r \) taka, że dla każdego zbioru borelowskiego \(A \subset \rn \):

    \begin{equation} Q(A) = \int _Af(x)\, dx = \mu _{L_{n+1}}(A_f) \label {eq:A(A)c} \end{equation}

    gdzie \(\int _Af(x)\, dx\) oznacza całkę względem miary Lebesgue’a po zbiorze \(A\) z funkcji \(f\).

    \[ A_f = \{(x,y) \in \r ^{n+1}: x \in A, 0 \le y \le f(x) \}. \]

    Funkcję \(f\) nazywamy wówczas gęstością rozkładu \(Q\).

  • Przykład – 4.10 Przykłady gęstości rozkładów ciągłych wraz z interpretacją wzoru (4.6):

    (image)
    \(A = (2,4)\), \(Q(A) = \frac {2}{10}\)

    (image)
    \(A = (180,185)\),

    \(Q(A)\) – zakreskowane pole

    (image)

    (image)

    (image)

    (image)

Widać, że (bierzemy \(A = \rn \)):

\[\int _{\rn } f(x)\,dx = 1.\]

oraz

\[f(x) \ge 0 \mbox { prawie wszÄŹdzie,}\]

co rozumiemy następująco:

\(\mu _{L_n}(\{x \in \rn : f(x) < 0 \}) = 0\), gdzie \(\mu _{L_n}\) oznacza miarę Lebesgue’a.

Gdyby \(\mu _{L_n}(\{x \in \rn : f(x) < 0 \}) > 0\), to \(Q(\{x \in \rn : f(x) < 0 \}) = \int _{\{x \in \rn : f(x) < 0 \}} f(x)\, dx < 0\).

  • Uwaga – 4.11 Jeżeli funkcja \(f: \rn \to \r \) spełnia dwa powyższe warunki, to jest ona gęstością pewnego rozkładu \(Q\).

Wystarczy wziąć: \(Q(A) = \int _A f(x)\,dx\), dla \(A \in {\bf B}(\rn )\).

Dystrybuanta rozkładu ciągłego Niech rozkład ciągły \(Q\) ma gęstość \(f\). Wtedy wprost z definicji otrzymujemy:

\[ F_Q(x) = Q(-\infty ,x] = \int _{-\infty }^x f(t)\,dt. \]

Zauważmy, że w rozkładzie ciągłym zbiory jednopunktowe mają miarę zero, a więc dystrybuanta jest ciągłą w każdym punkcie.

Można podać przykład dystrybuanty, która jest funkcją ciągłą w każdym punkcie, ale jej rozkład NIE JEST ciągły.

Jeżeli pewna funkcja \(f\) mierzalna spełnia powyższy wzór, to jest ona gęstością rozkładu, którego dystrybuantą jest \(F\). Jeżeli więc wiemy, że dystrybuanta jest funkcją ciągłą i różniczkowalną, ewentualnie poza skończoną liczbą punktów, to jej pochodna jest gęstością rozważanego rozkładu. Wiadomo ponadto, że w każdym punkcie \(x\), który jest punktem ciągłości \(f\), funkcja górnej granicy całkowania, a więc dystrybuanta, jest różniczkowalna oraz zachodzi wzór:

\[F'(x) = f(x).\]

Przykładem rozkładu ciągłego jest:

Rozkład jednostajny, \(U(G)\). Niech \(G \subset \rn \) będzie zbiorem borelowskim o dodatniej i skończonej mierze Lebesgue’a, to znaczy \(0 < \mu _{L_n}(G) < \infty \). Określmy funkcję:

\[ f(x) = \left \{\begin {array}{rll} 0, & \mbox { gdy } & x \notin G\\[0,3cm] \di \frac {1}{\mu _{L_n}(G)}, & \mbox { gdy } & x \in A. \end {array} \right . \]

Jest oczywiste, że \(f\) spełnia warunki wymagane od gęstości, jest więc gęstością pewnego rozkładu prawdopodobieństwa. Rozkład ten nazywamy rozkładem jednostajnym.

(image)
\(G = (-1,1) \subset \r \)

(image)
\(G = \{(x,y):x^2+y^2 < 1\} \subset \r ^2\)

  • Przykład – 4.12

    Niech \(F\) będzie dystrybuantą rozkładu jednostajnego na odcinku \((a,b)\), \(U(a,b)\). Otrzymujemy:

    \[ F(x) =\left \{ \begin {array}{rl} 0, & x < a\\[0.2cm] \di \frac {x-a}{b-a}, & a\le x < b\\[0.3cm] 1, & b \le x. \end {array} \right . \]

    ,

(image)
\(f(x) = \frac {1}{2}I_{[-1,1]}\)

(image)
\(F(x) = \frac {x+1}{2}\) dla \(-1<x<\)

Zauważmy, że \(F\) nie jest różniczkowalna w punktach \(a\), \(b\) i w tych samych punktach \(f\) nie jest ciągła.

Nie jest też istotne ile wynosi \(f(a)\) oraz \(f(b)\).