(image)

Rachunek prawdopodobieństwa 1, 2

Rozdział 5 Zmienne i wektory losowe

Rozważając matematyczny model zjawiska o charakterze losowym nie zawsze potrafimy (lub chcemy) opisywać odpowiadającą mu przestrzeń probabilistyczną. Operujemy jednak wielkościami, które są interpretowane jako wartości odpowiednich funkcji określonych na tej przestrzeni. O ile spełniają odpowiednie warunki, funkcje te nazywane są zmiennymi lub wektorami losowymi.

5.1 Definicje i własności

Niech \((\Omega ,\Sigma ,P)\) będzie przestrzenią probabilistyczną.

  • Definicja – 5.1 (wektor losowy) Funkcję \(X\colon \Omega \str \rn \) nazywamy wektorem losowym, jeżeli jest ona funkcją mierzalną względem \(\sigma \)-algebry \(\Sigma \), to znaczy:

    \[ X^{-1}(B) = \{\omega \in \Omega : X(\o ) \in B \} \in \Sigma \]

    dla każdego zbioru borelowskiego \(B \in {\cal B}(\rn )\).

    Zmienna losowa jest to jednowymiarowy wektor losowy.

Wyróżnianie zmiennych losowych nie ma formalnego uzasadnienia, stosuje się je ze względów tradycyjnych. Dość często określenie „wektor losowy"i „zmienna losowaśą używane zamiennie.

Zbiory \(X^{-1}(B)\), gdzie \(B \in {\cal B}({\rn })\), będziemy nazywać zbiorami opisywanymi przez wektor losowy \(X\). Podkreślamy wyraźnie, że są to zbiory postaci \(\{\omega \in \Omega : X(\omega )\in B\}\), co skrótowo będziemy zapisywać \(\{X \in B\}\). Tak więc, na przykład, wyrażenie \(P(X < \varepsilon )\) oznacza: \(P(\{\omega \in \Omega : X(\omega ) < \varepsilon \}).\)

Warunek mierzalności oznacza, że wszystkie zdarzenia opisane przez \(X\) są elementami \(\Sigma \), czyli, że mamy dostępną informację na temat takich zdarzeń.

  • Przykład – 5.2

    Niech \(\Omega = \{(i,j): i,j = 1, \dots ,6\}\). Niech \(\Sigma = \sigma (F_1, \dots , F_6\}\), gdzie \(F_k = \{(i,j): \max (i,j) = 6\}\).

    Niech \(X: \Omega \str \r \) będzie funkcją określoną jako \(X(i,j) = i\). \(X\) nie jest zmienną losową, gdyż na przykład zbioru

    \[\{(i,j); X(i,j) = 1\}= \{(1,1), (1,2), (1,3), (1,4), (1,5), (1,6)\}\]

    nie można przedstawić jako sumy pewnych zbiorów \(F_i\). Inaczej mówiąc. Nie potrafimy za pomocą dostępnej informacji (znajomości \(\Sigma \)) zinterpretować wyniku zaobserwowanego na pierwszej kostce.

    Niech \(Y : \Omega \str \r \) będzie funkcją określoną jako; \(Y(i,j) =1\), gdy \(i = 6\) oraz \(j = 6\), oraz \(Y(i,j) = 0\) w przeciwnym przypadku. \(Y\) nie jest zmienną losową, gdyż \(Y^{-1}(1) = \{(6,6)\}\) nie można przedstawić jako sumy pewnych zbiorów \(F_i\).

    Niech \(Z : \Omega \str \r \) będzie funkcją określoną jako; \(Z(i,j) =1\), gdy \(i = 6\) lub \(j = 6\), oraz \(Z(i,j) = 0\) w przeciwnym przypadku. \(Z\) jest zmienną losową, gdyż \(Z^{-1}(1) = F_6\), \(Z^{-1}(0) = F_1 \cup \dots \cup F_5\). Dla każdego zbioru borelowskiego \(B\) mamy \(Z^{-1}(B) = Z^{-1}(B \cap \{0,1\}) = Z^{-1}(B \cap \{0\}) \cup Z^{-1}(B \cap \{1\}) \in \Sigma \).

  • Przykład – 5.3 Niech (Ω, Σ, P ) będzie przestrzenią probabilistyczną, \(A\subset \Omega \). Określamy funkcję charakterystyczną zbioru \(A\)

    \[ I_A(x) = \left \{ \begin {array}{lll} 1, & \mbox { dla } & x \in A,\\ 0, & \mbox { dla } & x \notin A. \end {array} \right . \]

    Wtedy: \(A \in \Sigma \) \(\rwn \) \(I_A\) jest zmienną losową.

  • Uwaga – 5.4 Gdy \(\Sigma = {\cal P}(\Omega )\), to każda funkcja \(X : \Omega \to \rn \) jest zmienną losową.

Odwzorowania mierzalne, a więc także wektory losowe, mają szereg pożytecznych własności dotyczących działań algebraicznych, złożeń, kresów, zbieżności. Znane są one z innych kursów i będziemy z nich wielokrotnie korzystać w dalszej części wykładu. Poniżej podajemy ważniejsze z nich w języku wektorów i zmiennych losowych.

  • Twierdzenie – 5.5 Zachodzą następujące własności:

    • 1. Suma, różnica, iloczyn, iloraz (o ile jest wykonalny) wektorów losowych jest wektorem losowym.

    • 2. Zestawienie wektorów losowych jest wektorem losowym.

    • 3. Minimum i maksimum zmiennych losowych jest zmienną losową.

    • 4. Kres, dolny i górny, ciągu zmiennych losowych jest zmienną losową.

    • 5. Granica ciągu wektorów losowych jest wektorem losowym.

    • 6. Złożenie \(g \circ X\) wektora losowego \(X\) z funkcją borelowską \(g\) jest wektorem losowym. (Funkcja \(g\) jest borelowska \(\rwn g^{-1}(B)\) jest zbiorem borelowskim, gdy \(B\) jest zbiorem borelowskim).

      W szczególności zmiennymi losowymi są:

    • 7. Funkcje proste (funkcje schodkowe) zdefiniowane jako:

      \[ X(x) = c_i, \mbox { dla } x \in A_i, \]

      przy czym \(A_1, \dots , A_k \in \Sigma \) są zbiorami parami rozłącznymi i dającymi w sumie całą przestrzeń \(\Omega \), a liczby \(c_1, \dots , c_k\) są dowolne. Mianowicie \(X\) jest sumą:

      \[X(x) = \sum _{i=1}^kc_iI_{A_i}. \]

    • 8. Funkcje \(X^+\) oraz \(X^-\) zdefiniowane dla zmiennej losowej \(X\) jako:

      \[ X^+(x) = \max (X(x),0), \ \ \ \ \ \ X^-(x) = - \min (X(x),0). \]

    • 9. Niech \(X, Y : \Omega \to \r \). Wtedy:
      \(X\), \(Y\) są zmiennymi losowymi \(\rwn (X,Y)\) jest wektorem losowym.

  • Definicja – 5.6 Rozkład wektora losowego \(X\colon \Omega \str \rn \) jest to rozkład określony wzorem:

    \[ P_X(B) = P(X^{-1}(B)),\mbox { dla } B\in {\cal B}(\rn ). \]

Mierzalność \(X\) gwarantuje sensowność tej definicji – ponieważ \(P\) jest określone na zdarzeniach z \(\Sigma \), musimy mieć gwarancję, że \(X^{-1}(B) \in \Sigma \).

Łatwo sprawdzić, że powyższy wzór określa rzeczywiście rozkład.

Często piszemy \(X \sim Q\), gdy \(P_X = Q\).

Dystrybuantę rozkładu \(P_X\) będziemy nazywać dystrybuantą zmiennej losowej \(X\) i oznaczać często przez \(F_X\).

Zazwyczaj używając pojęcia zmienna losowa (wektor losowy) oraz operując jej (jego) rozkładem nie zwracamy zbytniej uwagi na przestrzeń probabilistyczną na której jest ten obiekt określony. W wielu przypadkach postępowanie takie jest usprawiedliwione dzięki następującemu twierdzeniu:

  • Twierdzenie – 5.7 Niech \(Q\) będzie \(n\)-wymiarowym rozkładem prawdopodobieństwa. Wtedy istnieje przestrzeń probabilistyczna (Ω, Σ, P ) oraz wektor losowy \(X: \Omega \str \rn \), taki, że \(Q = P_X\).

Dowód. Wystarczy wziąć: \(\Omega = \rn \), \(\Sigma = {\cal B}(\rn )\), \(P = Q\) oraz \(X = id_{\rn }\).   \(\Box \)

  • Przykład – 5.8 W urnie są dwie białe i trzy czarne kule. Losujemy pojedynczo kule do momentu wyciągnięcia białej kuli. Niech \(X\) oznacza liczbę losowań. Wyznaczymy rozkład \(X\).

    (a) losowanie ze zwracaniem. Widać, że \(X\) przyjmuje wartości \(1,2,3, \dots \). łatwo też sprawdzić, że \(p_k = P(X = k) = (\frac {3}{5})^{k-1} \frac {2}{5}\), \(k = 1,2,3, \dots \). Tak więc \(P_X\) ma rozkład dyskretny zadany jest ciągi \(\{k\}, \{ (\frac {3}{5})^{k-1} \frac {2}{5} \}\), \(k = 1, 2, 3, \dots \).

    (b) losowanie bez zwracania. Widać, że \(X\) przyjmuje wartości \(1,2,3, 4\). łatwo też sprawdzić, że:
    \(P(X=1) = P(B_1) = \frac {2}{5}\),
    \(P(X=2) = P(C_1\cap B_2) = P(B_2|C_1)P(C_1) = \frac {2}{4} \cdot \frac {3}{5} = \frac {3}{10}\),
    \(P(X=3) = P(C_1 \cap C_2 \cap B_3) = P(B_3|C_1 \cap C_2) P(C_1 \cap C_2) = \frac {2}{3} \cdot \frac {2}{4} \cdot \frac {3}{5} = \frac {2}{10} \),
    \(P(X=4) = 1 - ( P(X=1) + P(X=2) +P(X=3)) = \frac {1}{10} \).

  • Przykład – 5.9 Pan Adam jeździ rano do pracy i wraca z pracy wieczorem autobusami, które jeżdżą dokładnie co 10 minut. Niech \(X\) oznacza sumę czasów rano i wieczorem spędzonych przez pana Adama na przystankach.

    Znajdziemy rozkład \(X\).

    Wyznaczamy dystrybuantę \(F\). Czyli dla każdego \(x \in \r \) wyznaczmy \(F(x) = P(X\le x)\). Oczywiście \(F(x) = 0\) dla \(x \le 0\) oraz \(F(x) = 1\) dla \(x \ge 20\). Dla pozostałych \(x\) korzystamy z modelu prawdopodobieństwa geometrycznego. Dla \(0\le x \le 10\) mamy \(F(x) = \frac {x^2/2}{100}\). Dla \(10\le x \le 20\) mamy \(F(x) = \frac {100 -(20 -x)^2/2}{100}\).

    (image)

    Zauważmy, że jest to funkcja ciągła, łatwo też pokazać, że jest we wszystkich punktach różniczkowalna. Jej pochodna \(F'\) jest więc gęstością rozkładu \(P_X\), czyli krótko mówiąc jest gęstością zmiennej losowej \(X\).

    \[ f(x)= F'(x) = \left \{\begin {array}{lll} 0 & \mbox { dla } & x \le 0\\ \frac {x}{100} & \mbox { dla } & 0\le x \le 10\\[2mm] \frac {20-x}{100} & \mbox { dla } & 10\le x \le 20\\ 0 & \mbox { dla } & 20 \le x \end {array} \right . \]

    (image)

Znając gęstość lub dystrybuantę można wyznaczać prawdopodobieństwa zdarzeń opisanych przez \(X\).

\[P(a < X < b) = P(a \le X \le b) = F(b) - F(a) = \int _a^bf(x)\,dx.\]

Jakie jest prawdopodobieństwo tego, że pan Adam spędzi na przystankach co najmniej pięć, lecz nie więcej niż dziesięć minut?

(image)
\(P(5 \le X \le 10) = F(10) - F(5) \) = \(\frac {1}{2} - \frac 18 = \frac {3}{8}.\)

(image)
\(P(5 \le X \le 10) = \int _{5}^{10} f(x) \,dx = \frac {3}{8}.\)

Jakie jest prawdopodobieństwo tego, że pan Adam spędzi na przystankach więcej niż 15 minut?

(image)
\(P(X \ge 15) = 1 - F(15) \) = \(1 - \frac 78 = \frac {1}{8}.\)

(image)
\(P(X \ge 15) = \int _{15}^{\infty } f(x) \,dx = \frac {1}{8}.\)

Jakie jest prawdopodobieństwo tego, że pan Adam spędzi na przystankach dokładnie tyle samo czasu, powiedzmy po \(c\) minut na każdym?

Tego zdarzenia nie opisuje zmienna \(X\)! Jednak, szukane prawdopodobieństwo jest nie większe niż \(P(X=2c) = \int _{2c}^{2c} f(x)\,dx = 0\).

Ile wynosi prawdopodobieństwo tego, że pan Adam spędzi na przystankach rano i wieczorem mniej niż 5 minut na każdym?

Tego zdarzenia nie opisuje zmienna losowa \(X\), niemniej odpowiedź jest oczywista: \(\frac {1}{2} \cdot \frac {1}{2} = \frac {1}{4}\).

  • Przykład – 5.10 Pewnego dnia p. Adam zmienia strategię. Gdy wieczorem wychodzi z pracy czeka na przystanku maksymalnie 3 minuty i gdy jego autobus nie przyjedzie idzie do domu na piechotę. Jaki jest rozkład czasu \(X\) spędzonego na przystanku wieczorem?

    Zauważmy, że \(X = \min (Y,3)\), gdzie \(Y\) ma rozkład jednostajny na odcinku \((0,10)\) (\(P_Y = U(0,10)\)). Niech \(F =F_X\). Wtedy

    \[ F(x) = P(X \le x) = P(\min (Y,3) \le x) = \left \{\begin {array}{lll} 0 & \mbox { dla } & x \le 0\\ \frac {x}{10} & \mbox { dla } & 0\le x < 3\\ 1 & \mbox { dla } & 3 \le x. \end {array} \right . \]

    Ta dystrybuanta nie jest ciągła w punkcie \(x=3\), więc mamy do czynienia z rozkładem, który nie jest ani dyskretny ani ciągły.

    Przy okazji: \(P(X=3) = \frac {7}{10}\).

    (image)