Rachunek prawdopodobieństwa 1, 2

5.2 Rozkłady brzegowe i warunkowe

Przykład – 5.11 Rozważmy rzut dwiema kostkami symetrycznymi. Niech $X$ oznacza numer kostki na której wypadła większa liczba, lub 0, gdy na obydwu kostkach wypadła ta sama liczba, a $Y$ oznacza maksimum uzyskanych oczek. Znajdziemy rozkład wektora losowego $(X,Y)$.

Z dodatnimi prawdopodobieństwami $(X,Y)$ może potencjalnie przyjmować 18 wartości. W tym przypadku można zobrazować to tabelką zawierającą liczności zdarzeń $(X = i, Y=j)$, $i = 0,1,2$, $j = 1,2,3,4,5,6$.

\[ \begin {array}{ccccccc} $X$\backslash $Y$ & 1 & 2 & 3 & 4 & 5 & 6 \\[1mm] 0 & 1 & 1 & 1 & 1 & 1 & 1 \\ 1 & 0 & 1 & 2 & 3 & 4 & 5 \\ 2 & 0 & 1 & 2 & 3 & 4 & 5 \end {array} \]

W takim razie prawdopodobieństwa $p_{i,j} = P(X = i, Y=j)$ też tworzą macierz:

\[ \begin {array}{ccccccc} $X$\backslash $Y$ & 1 & 2 & 3 & 4 & 5 & 6 \\[1mm] 0 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 \\ 1 & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 \\ 2 & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 \end {array} \]

Przykład – 5.12 (kontynuacja Przykładu poprzedniego)

Sumując wiersze i kolumny otrzymujemy rozkłady zmiennych $X$ oraz $Y$.

\[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{0} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{1} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12}\\ \color {red}{2} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12} \\[1mm] \color {blue}{Y} & \color {blue}{1/36} & \color {blue}{3/36} & \color {blue}{5/36} & \color {blue}{7/36} & \color {blue}{9/36} & \color {blue}{11/36} \end {array} \]

Nazywamy je rozkładami brzegowymi. Ogólnie.

Definicja – 5.13 (Rozkład brzegowy) Dla danego rozkładu $n+m$ wymiarowego $Q : {\cal B}(\r ^n \times \r ^m) \to \r $ określamy rozkłady brzegowe $Q_1 : {\cal B}(\r ^n) \to \r $, $Q_2 : {\cal B}(\r ^m) \to \r $ za pomocą formuły:

\[ Q_1(A) = Q(A \times \r ^m), \ \ Q_2(B) = Q(\rn \times B). \]

W dalszym ciągu rozważamy przypadek $n = m = 1$. Uogólnienie na dowolne $n, m$ jest oczywiste.

Niech $(X,Y)$ będzie dwuwymiarowym wektorem losowym określonym na przestrzeni probabilistycznej (Ω, Σ, P ) i niech $Q$ będzie jego rozkładem, czyli $Q = P_{(X,Y)}$. Wtedy: dla dowolnego $A \in {\cal B}(\r )$ mamy:
$P_X(A) = P(X \in A) = P(X \in A,Y\in \r ) = P((X,Y) \in A \times \r ) = P_{(X,Y)} (A \times \r ) = Q(A\times \r ) = Q_1(A)$. Tak więc $P_X = Q_1$. Podobnie $P_Y = Q_2$.

Uwaga – 5.14 Rozkłady brzegowe wektora losowego $(X,Y)$ pokrywają się z rozkładami zmiennych losowych $X$ oraz $Y$.

Niech $Q$ będzie dyskretnym rozkładem 2-wymiarowym skupionym na zbiorze (co najwyżej przeliczalnym) $K$. Możemy taki rozkład jednoznacznie scharakteryzować przez podanie dwóch macierzy; punktów oraz ich prawdopodobieństw. Mianowicie, weźmy najmniejsze zbiory co najwyżej przeliczalne $K_1, K_2 \subset \r $ takie, że $K \subset K_1 \times K_2$ i ustawmy je w ciągi, powiedzmy $K_1 = \{x_i\}_{i=1}^M$, $K_2 = \{y_j\}_{j=1}^N$, $M, N \le \infty $ oraz niech $p_{ij} = Q(x_i,y_j)$. Widać, że:

$p_{ij} \ge 0$ dla wszystkich $i,j$, oraz $\di \sum _{i,j}p_{ij} = 1$.

Z doboru zbiorów $K_1$, $K_2$ wynika też, że $\forall \, i \ \exists \, j \ p_{ij} > 0$ oraz $\forall \, j \ \exists \, i \ p_{ij} > 0$. Gdyby tak nie było, można by zmniejszyć $K_1$ lub $K_2$.

Para $(\{(x_i,y_j)\},\{ p_{ij}\} )$ w pełni charakteryzuje rozkład $Q$.

Wtedy rozkłady brzegowe $Q_1$, $Q_2$ są określone odpowiednio przez pary ciągów. $Q_1$ przez $(\{x_i\}, \{p_{i.}\})$, $Q_2$ przez $(\{y_j\}, \{p_{.j}\})$, przy czym:

\[ p_{i.} = Q_1(x_i) = Q(\{x_i\} \times \r ) = \sum _{j}p_{ij}, \ \ \‚p_{.j} = Q_2(y_j) = Q(\r \times \{y_j\}) = \sum _{i}p_{ij}. \]

Ponieważ występujące powyżej sumy mają wszystkie składniki nieujemne oraz przynajmniej jeden składnik dodatni, wszystkie liczby $p_{i.}$ oraz $p_{.j}$ są dodatnie. W dalszej części mówiąc o rozkładach dyskretnych wielowymiarowych będziemy zawsze zakładać, że mają powyższą własność.

Niech $(X,Y)$ będzie dwuwymiarowym wektorem losowym określonym na przestrzeni probabilistycznej (Ω, Σ, P ) i niech $Q$ będzie jego rozkładem, czyli $Q = P_{(X,Y)}$. Jeżeli jest to rozkład dyskretny scharakteryzowany przez parę $(\{(x_i,y_j)\},\{ p_{ij}\} )$, to oznacza, że:

\[P(X=x_i,Y=y_j) = p_{ij},\]

\[P(X= x_i) = P(X = x_i,Y \in \r ) = Q(\{x_i\} \times \r ) = Q_1(x_i) = p_{i.},\]

\[P(Y= y_j) = P(X \in \r ,Y =y_j) = Q(\r \times \{y_j\}) = Q_2(y_j) = p_{.j}.\]

Inaczej:

\[P(X= x_i) = \sum _{j}p_{ij}, \ \ \ P(Y= y_j) = \sum _{i}p_{ij}\]

Niech $Q$ będzie 2-wymiarowym rozkładem ciągłym o gęstości $f : \r ^2 \to \r $. Wtedy rozkłady brzegowe też są ciągłe i mają gęstości $f_1$, $f_2$ dane wzorami:

\[f_1(x) = \int _\r f(x,y)\,dy, \ \ \ f_2(y) = \int _\r f(x,y)\,dx. \]

Dowód. $\di Q_1(A) = Q(A\times \r ) = \int _{A\times \r } f(x,y)\,d(x,y) = $

stosujemy twierdzenie Fubiniego

$\di = \int _A\left (\int _\r f(x,y)\,dy\right )\,dx$,

Więc $\di f_1(x) = \int _\r f(x,y)\,dy$.

W języku zmiennych losowych. Jeżeli $f$ jest gęstością wektora losowego $(X,Y)$, to $X$ oraz $Y$ mają gęstości:

\[f_X(x) = \int _\r f(x,y)\,dy, \ \ \ f_Y(y) = \int _\r f(x,y)\,dx. \]

Przykład – 5.15 Wektor losowy $(X,Y)$ ma rozkład jednostajny na zbiorze $G : x^2 + y^2 \le 1, y \ge 0$. Znaleźć rozkłady $X$ oraz $Y$.

$\di f_{X,Y)} = \frac {2}{\pi }I_G$.
$\di f_X(x) = \int _{-\infty }^\infty \frac {2}{\pi }I_G(x,y)\,dy = \int _{0}^{\sqrt {1-x^2}}\frac {2}{\pi }\,dy = \frac {2}{\pi } \sqrt {1-x^2}$ dla $-1 \le x \le 1$.
$\di f_Y(y) = \int _{-\infty }^\infty \frac {2}{\pi }I_G(x,y)\,dx = \int _{- \sqrt {1-y^2}}^{\sqrt {1-y^2}}\frac {2}{\pi }\,dx = \frac {4}{\pi } \sqrt {1-y^2} $ dla $0 \le y \le 1$.

$f_X$

$f_Y$

Pytanie. Czy rozkłady brzegowe wyznaczają jednoznacznie rozkład 2-wymiarowy?

N I E !!!

Przykład – 5.16 Niech $X = Y$ oznaczają liczbę oczek która wypadnie w rzucie jedną kostką.

\[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{1} & 1/6 & 0 & 0 & 0 & 0 & 0 & \color {red}{1/6}\\ \color {red}{2} & 0 & 1/6 & 0 & 0 & 0 & 0 & \color {red}{1/6}\\ \color {red}{3} & 0 & 0 & 1/6 & 0 & 0 & 0 & \color {red}{1/6}\\ \color {red}{4} & 0 & 0 & 0 & 1/6 & 0 & 0 & \color {red}{1/6}\\ \color {red}{5} & 0 & 0 & 0 & 0 & 1/6 & 0 & \color {red}{1/6}\\ \color {red}{6} & 0 & 0 & 0 & 0 & 0 & 1/6 & \color {red}{1/6}\\[1mm] \color {blue}{Y} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} \end {array} \]

Niech $X, Y$ oznaczają liczbę oczek które wypadną w dwóch rzutach kostką.

\[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{1} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{2} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{3} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{4} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{5} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{6} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\[1mm] \color {blue}{Y} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} \end {array} \]

Określimy pojęcie rozkładu warunkowego tylko w kontekście zmiennych losowych. Niech $(X,Y)$ będzie będzie wektorem o dyskretnym rozkładzie 2-wymiarowym danym przez $(\{(x_i,y_j)\},\{ p_{ij}\} )$. Czyli $P(X = x_i,Y = y_j) = p_{ij}$. Niech:

\[p_{i|j} = P(X=x_i|Y=y_j) = \frac {P(X=x_i,Y=y_j)}{P(Y=y_j)} = \frac {p_{ij}}{P_{.j}}.\]

\[p_{j|i} = P(Y=y_j|X=x_j) = \frac {P(X=x_i,Y=y_j)}{P(X=x_i)} = \frac {p_{ij}}{p_{i.}}.\]

Uwaga. Oznaczenia są formalnie niepoprawne. Ale są zwyczajowo stosowane.

Definicja – 5.17 Rozkład dany przez ciągi $\{x_i\}, \{p_{i|j}\}$ nazywamy rozkładem warunkowym $X$ pod warunkiem $Y= y_j$. Oznaczamy go $P_{X|Y=y_j}$.

Rozkład dany przez ciągi $\{y_j\}, \{p_{j|i}\}$ nazywamy rozkładem warunkowym $Y$ pod warunkiem $X= x_i$. Oznaczamy go $P_{Y|X=x_i}$.

Przykład – 5.18 Wróćmy do rozkładu:

\[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{0} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{1} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12}\\ \color {red}{2} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12} \\[1mm] \color {blue}{Y} & \color {blue}{1/36} & \color {blue}{3/36} & \color {blue}{5/36} & \color {blue}{7/36} & \color {blue}{9/36} & \color {blue}{11/36} \end {array} \]

$P_{X|Y=1}$ jest rozkładem jednopunktowym $\delta _0$.

$P_{X|Y=6}$ jest rozkładem skupionym w punktach $0,1,2$ z prawdopodobieństwami $\frac {1}{11}$, $\frac {5}{11}$, $\frac {5}{11}$.

$P_{Y|X = 0}$ jest skupiony w punktach $1,2,3,4,5,6$ z równymi prawdopodobieństwami.

\[ p_{ij} = p_{i|j}p_{.j} = p_{j|i}p_{i.}. \]

Znając rozkłady brzegowe i warunkowe można wyznaczyć rozkład wektora losowego.

Przykład – 5.19 Rzucamy kostką symetryczną uzyskując $X$ oczek, a następnie rzucamy $X$ razy monetą symetryczną uzyskując $Y$ orłów. Interesuje nas rozkład wektora losowego $(X,Y)$. Oczywiście wektor ten może przyjmować wartości w punktach $(x_i,y_j), i = 1, \dots , 6$, $j = 0,1, \dots , 6$ z prawdopodobieństwami $p_{ij} = p_{j|i}p_{i.}$, gdzie $p_{j|i}$, $p_{i.}$ są dane. Na przykład: $p_{53} = \binom {5}{3}\frac {1}{2^5} \frac {1}{6} = \frac {5}{96}$, $p_{35} = 0 \frac {1}{6} = 0$.

Niech $(X,Y)$ będzie będzie wektorem o ciągłym rozkładzie 2-wymiarowym danym przez gęstość $f$.

Formalnie nie możemy (jeszcze) mówić o rozkładzie warunkowym pod warunkiem, którego prawdopodobieństwo jest równe zeru. Możemy jednak formalnie zdefiniować funkcje:

\[ f_{X|Y=y}(x) = f(x|y) = \left \{\begin {array}{lll} \frac {f(x,y)}{\int _\r f(x,y)\,dx} = \frac {f(x,y)}{f_Y(y)}, & \mbox { gdy } & f_Y(y) >0\\ 0, & \mbox { gdy } & f_Y(y) = 0 \end {array} \right . \]

\[ f_{Y|X=x}(y) = f(y|x) = \left \{\begin {array}{lll} \frac {f(x,y)}{\int _\r f(x,y)\,dy} = \frac {f(x,y)}{f_X(x)}, & \mbox { gdy } & f_X(x) >0\\ 0, & \mbox { gdy } & f_X(x) = 0 \end {array} \right . \]

Są to gęstości (ćwiczenie).

Definicja – 5.20 Rozkład o gęstości $f(\cdot |y)$ nazywamy rozkładem warunkowym $X$ pod warunkiem $(Y= y)$ i oznaczamy $P_{X|Y=y}$.

Rozkład o gęstości $f(\cdot |x)$ nazywamy rozkładem warunkowym $Y$ pod warunkiem $(X= x)$ i oznaczamy $P_{Y|X=x}$.

Podobnie jak w przypadku dyskretnym:

\[ f(x,y) = f(y|x)f_X(x) = f(x|y)f_Y(y).\]

Przykład – 5.21

Losujemy według rozkładu jednostajnego liczbę $X$ z odcinka $[0,1]$ a następnie według rozkładu jednostajnego liczbę $Y$ z odcinka $[0,X]$. Według jakiego rozkładu została wylosowana liczba $Y$?

Mamy kolejno:

$f_X = I_{[0,1]}$ – funkcja charakterystyczna odcinka $[0,1]$.

Gęstość warunkową $f(\cdot |x) = \frac {1}{x}I_{[0,x]}$, dla $0 < x \le 1$.

\[f(x,y) = f(y|x)f_X(x) = \left \{\begin {array}{ll} \frac {1}{x} &\mbox { dla } 0 < y \le x \le 1\\ 0 & \mbox { dla pozostaÅĆych } (x,y) \in \r ^2. \end {array} \right .\]

$f_Y(y)= \int _\r f(x,y)\,dx = \int _y^1\frac {1}{x}\,dx = \ln x |_y^1 = - \ln y$, dla $0 < y \le 1$,

$f_Y(y) = 0 $ dla pozostałych $y$.

Można też wyznaczyć gęstość rozkładu warunkowego $P_{X|Y = y}$ dla $0 < y < 1$:

$f(x|y) = \frac {1/x}{- \ln y} = - \frac {1}{ x\ln y}$ dla $y <x < 1$.

$f_X(x) = 1$ dla $0 \le x \le 1$,

$f(y|x) = f_{Y|X=x}(y) = \frac {1}{x}$, dla $0 \le y \le x \le 1$.

$f_X$

$f_{Y|X=0.2}$, $f_{Y|X=0.6}$

$f_{(X,Y)}$

$f_Y$

$f_{X|Y=0.2}$, $f_{X|Y=0.6}$