(image)

Rachunek prawdopodobieństwa 1, 2

5.4 Funkcje zmiennych/wektorów losowych

Niech (Ω, Σ, P ) będzie przestrzenią probabilistyczną, \(X : \Omega \to \r ^n\) wektorem losowym, \(g : \rn \to \r ^m\) funkcją borelowską (\(\forall \ C \in {\cal B}(\r ^m) \ g^{-1}(C) \in {\cal B}(\rn )\)).

Zgodnie ze zwyczajem oznaczamy złożenie \(g \circ X\) symbolem \(g(X)\),

\[ g(X) = g \circ X : \Omega \ni \o \to g(X(\o )) \in \r ^m. \]

Ważny problem praktyczny: znając rozkład \(X\) wyznaczyć rozkład \(Y = g(X)\).

Rozwiązanie formalne. \(P_Y(C) = P(g(X)^{-1}(C)) = P((g\circ X)^{-1}(C)) = P(X^{-1}(g^{-1}(C))) = P_X(g^{-1}(C))\).

\[ P_Y(C) = P_X(g^{-1}(C)). \]

Z praktycznego punktu widzenia jest to wzór mało przydatny. W poszczególnych przypadkach możemy stosować różne sposoby.

  • Przykład – 5.29

    Zmienna losowa \(X\) ma rozkład dany przez ciągi \(- 1, 0, 1, 2\) oraz \(1/2, 1/8, 1/4, 1/8\). Wtedy zmienna \(X^2\) ma rozkład dany przez ciągi \(0, 1, 4\), oraz \(1/8, 3/4, 1/8\).

Zauważmy, że funkcja \(g(X)\) wektora losowego \(X\) o rozkładzie dyskretnym skupionym na zbiorze \(K\) (o którym wiemy, że jest skończony lub przeliczalny) ma rozkład dyskretny skupiony na zbiorze \(g(K)\). Dla rozkładó ciągłych to nie jest prawdą: na przykład, gdy \(g\) jest funkcją stałą \(g(X)\) ma rozkład jednopunktowy.

  • Przykład – 5.30 Znajdziemy rozkład \(\cos X\), gdy \(X\) ma rozkład jednostajny na odcinku \((-\pi ,\pi )\). Policzymy dystrybuantę tej funkcji w punktach \(y \in (-1,1)\). Niech \(y =\cos x\), gdzie \(x \in (0,\pi )\), inaczej \(x = \arccos y\). Wtedy mamy:

    \[ F_{\cos X}(y) = P(\cos X \le y) = P(-\pi ,-x] + P[x,\pi ) = \frac {-x + \pi }{2\pi } + \frac {\pi - x}{2\pi } = \frac {\pi - \arccos x}{\pi }. \]

    Różniczkując otrzymamy gęstość:

    \[ f_{\cos X}(y) = \frac {1}{\pi \sqrt {1-y^2}} \mbox { dla } y \in (-1,1) \]

    oraz \(0\) dla pozostałych \(y\).

  • Przykład – 5.31 Niech \(X\), \(Y\) będą niezależnymi zmiennymi losowymi o rozkładzie \(U(0,1)\) każda. Znajdziemy rozkład zmiennej losowej \(Z = \frac XY\).

    Znajdziemy najpierw dystrybuantę \(F_Z\). Niech \(z > 0\). \(F_Z(z) = P(F_Z \le z) = P(\frac XY \le z)\). Ponieważ \((X,Y)\) ma rozkład geometryczny na kwadracie \([0,1]^2\) możemy to prawdopodobieństwo interpretować jako prawdopodobieństwo geometryczne. Łatwo widać, że:

    \[ F_Z(z) = \left \{\begin {array}{ll} 0 & \mbox { dla } z \le 0 \\ \frac z2, & \mbox { dla } 0 < z < 1\\ 1 -\frac {1}{2z}, & \mbox { dla } 1 \le z. \end {array} \right . \]

    Różniczkując otrzymujemy gęstość:

    \[ f_Z(z) = \left \{\begin {array}{ll} 0 & \mbox { dla } z \le 0] \\ \frac 12, & \mbox { dla } 0 < z < 1\\ \frac {1}{2z^2}, & \mbox { dla } 1 \le z. \end {array} \right . \]

  • Przykład – 5.32

    Niech \(X\) będzie dowolnie ustaloną zmienną losową, \(F = F_X \) jej dystrybuantą, \(a,\, b \in \r \) ustalonymi liczbami, \(a \neq 0\). Policzymy dystrybuantę zmiennej losowej \(Y = aX + b\).

    Dla \(a > 0\) mamy

    \[ F_Y(x) = P(Y \le x) = P(aX +b \le x) = P(X \le \frac {x-b}{a}) = F_X\left (\frac {x-b}{a}\right ). \]

    Podobnie, dla \(a < 0\)

    \[ F_Y(x) = P(Y \le x) = P(aX +b \le x) = P(X \ge \frac {x-b}{a}) = \]

    \[ 1 - P(X < \frac {x-b}{a}) = 1 - F_X\left (\frac {x-b}{a}\right )^-. \]

Załóżmy teraz dodatkowo, że zmienna \(X\) ma gęstość \(f\) (dla uproszczenia zakładamy, że \(f\) jest ciągła, co w świetle następnego przykładu nie jest konieczne). Wtedy wiemy, że dystrybuanta \(F_X\) jest różniczkowalna; z powyższych wzorów także \(F_Y\) jest różniczkowalna, a więc \(Y\) ma rozkład ciągły o gęstości

\[ g(x) = \frac {1}{|a|} f\left (\frac {x-b}{a}\right ) \]

Powyższy wzór jest szczególnym przypadkiem następującego twierdzenia.

  • Twierdzenie – 5.33

    Niech \(X\) będzie wektorem losowym o n-wymiarowym rozkładzie ciągłym i niech \(f: \rn \longrightarrow \r \) będzie jego gęstością. Zakładamy ponadto, że \(\f : \rn \longrightarrow \rn \) jest dyfeomorfizmem. Wtedy wektor losowy \(\f (X)\) ma również rozkład ciągły o gęstości \(g\) danej wzorem

    \[ g(x) = |Jac_x\phi ^{-1}|\,f(\f ^{-1}(x)). \]

Dowód. Korzystamy z definicji rozkładu ciągłego. Z twierdzenia o zmianie zmiennych mamy dla każdego zbioru borelowskiego \(A\)

\[ P(\f (X) \in A) = P(X \in \f ^{-1}(A)) = \]

\[ \int _{\f ^{-1}(A)}f(x)\,dx = \int _Af(\f ^{-1}(x))\,|Jac_x\f ^{-1}|\,dx. \]

  

Funkcje niezależnych wektorów losowych są niezależne.

Formalnie:

  • Twierdzenie – 5.34 Niech (Ω, Σ, P ) będzie przestrzenią probabilistyczną, \(X : \Omega \to \r ^n\), \(Y : \Omega \to \r ^m\) wektorami losowymi. Niech \(g : \rn \to \r ^k\), \(h : \r ^m \to \r ^l\) będą funkcjami borelowskimi.

    \[ X, Y \mbox { sÄĚ niezaleÅijne } \imp \ g(X), h(Y) \mbox { sÄĚ niezaleÅijne }. \]

Dowód. Dla dowolnych zbiorów borelowskich \(C\), \(D\) mamy:

\(P(g(X) \in C, h(Y) \in D) = P((g\circ X)^{-1}(C) \cap (h\circ Y)^{-1}(D)) = P(X^{-1}(g^{-1}(C)) \cap Y^{-1}(h^{-1}(D))) = P(X^{-1}(g^{-1}(C))) \cdot P(Y^{-1}(h^{-1}(D)) = P((g\circ X)^{-1}(C)) \cdot P((h\circ Y)^{-1}(D)) = P(g(X) \in C) \cdot P(h(Y) \in D)\).   \(\Box \)