Przykład – 5.11 Rozważmy rzut dwiema kostkami symetrycznymi. Niech \(X\) oznacza numer kostki na której wypadła większa liczba, lub 0, gdy na obydwu kostkach wypadła ta sama liczba, a \(Y\) oznacza maksimum uzyskanych oczek. Znajdziemy rozkład wektora losowego \((X,Y)\).
Z dodatnimi prawdopodobieństwami \((X,Y)\) może potencjalnie przyjmować 18 wartości. W tym przypadku można zobrazować to tabelką zawierającą liczności zdarzeń \((X = i, Y=j)\), \(i = 0,1,2\), \(j = 1,2,3,4,5,6\).
\[ \begin {array}{ccccccc} $X$\backslash $Y$ & 1 & 2 & 3 & 4 & 5 & 6 \\[1mm] 0 & 1 & 1 & 1 & 1 & 1 & 1 \\ 1 & 0 & 1 & 2 & 3 & 4 & 5 \\ 2 & 0 & 1 & 2 & 3 & 4 & 5 \end {array} \]
W takim razie prawdopodobieństwa \(p_{i,j} = P(X = i, Y=j)\) też tworzą macierz:
\[ \begin {array}{ccccccc} $X$\backslash $Y$ & 1 & 2 & 3 & 4 & 5 & 6 \\[1mm] 0 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 \\ 1 & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 \\ 2 & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 \end {array} \]
Przykład – 5.12 (kontynuacja Przykładu poprzedniego)
Sumując wiersze i kolumny otrzymujemy rozkłady zmiennych \(X\) oraz \(Y\).
\[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{0} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{1} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12}\\ \color {red}{2} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12} \\[1mm] \color {blue}{Y} & \color {blue}{1/36} & \color {blue}{3/36} & \color {blue}{5/36} & \color {blue}{7/36} & \color {blue}{9/36} & \color {blue}{11/36} \end {array} \]
Nazywamy je rozkładami brzegowymi. Ogólnie.
Definicja – 5.13 (Rozkład brzegowy) Dla danego rozkładu \(n+m\) wymiarowego \(Q : {\cal B}(\r ^n \times \r ^m) \to \r \) określamy rozkłady brzegowe \(Q_1 : {\cal B}(\r ^n) \to \r \), \(Q_2 : {\cal B}(\r ^m) \to \r \) za pomocą formuły:
\[ Q_1(A) = Q(A \times \r ^m), \ \ Q_2(B) = Q(\rn \times B). \]
W dalszym ciągu rozważamy przypadek \(n = m = 1\). Uogólnienie na dowolne \(n, m\) jest oczywiste.
Niech \((X,Y)\) będzie dwuwymiarowym wektorem losowym określonym na przestrzeni probabilistycznej (Ω, Σ, P ) i niech \(Q\) będzie jego rozkładem, czyli \(Q = P_{(X,Y)}\). Wtedy: dla dowolnego \(A \in {\cal B}(\r )\) mamy:
\(P_X(A) = P(X \in A) = P(X \in A,Y\in \r ) = P((X,Y) \in A \times \r ) = P_{(X,Y)} (A \times \r ) = Q(A\times \r ) = Q_1(A)\). Tak więc \(P_X = Q_1\). Podobnie \(P_Y = Q_2\).
Uwaga – 5.14 Rozkłady brzegowe wektora losowego \((X,Y)\) pokrywają się z rozkładami zmiennych losowych \(X\) oraz \(Y\).
Niech \(Q\) będzie dyskretnym rozkładem 2-wymiarowym skupionym na zbiorze (co najwyżej przeliczalnym) \(K\). Możemy taki rozkład jednoznacznie scharakteryzować przez podanie dwóch macierzy; punktów oraz ich prawdopodobieństw. Mianowicie, weźmy najmniejsze zbiory co najwyżej przeliczalne \(K_1, K_2 \subset \r \) takie, że \(K \subset K_1 \times K_2\) i ustawmy je w ciągi, powiedzmy \(K_1 = \{x_i\}_{i=1}^M\), \(K_2 = \{y_j\}_{j=1}^N\), \(M, N \le \infty \) oraz niech \(p_{ij} = Q(x_i,y_j)\). Widać, że:
\(p_{ij} \ge 0\) dla wszystkich \(i,j\), oraz \(\di \sum _{i,j}p_{ij} = 1\).
Z doboru zbiorów \(K_1\), \(K_2\) wynika też, że \(\forall \, i \ \exists \, j \ p_{ij} > 0\) oraz \(\forall \, j \ \exists \, i \ p_{ij} > 0\). Gdyby tak nie było, można by zmniejszyć \(K_1\) lub \(K_2\).
Para \((\{(x_i,y_j)\},\{ p_{ij}\} )\) w pełni charakteryzuje rozkład \(Q\).
Wtedy rozkłady brzegowe \(Q_1\), \(Q_2\) są określone odpowiednio przez pary ciągów. \(Q_1\) przez \((\{x_i\}, \{p_{i.}\})\), \(Q_2\) przez \((\{y_j\}, \{p_{.j}\})\), przy czym:
\[ p_{i.} = Q_1(x_i) = Q(\{x_i\} \times \r ) = \sum _{j}p_{ij}, \ \ \‚p_{.j} = Q_2(y_j) = Q(\r \times \{y_j\}) = \sum _{i}p_{ij}. \]
Ponieważ występujące powyżej sumy mają wszystkie składniki nieujemne oraz przynajmniej jeden składnik dodatni, wszystkie liczby \(p_{i.}\) oraz \(p_{.j}\) są dodatnie. W dalszej części mówiąc o rozkładach dyskretnych wielowymiarowych będziemy zawsze zakładać, że mają powyższą własność.
Niech \((X,Y)\) będzie dwuwymiarowym wektorem losowym określonym na przestrzeni probabilistycznej (Ω, Σ, P ) i niech \(Q\) będzie jego rozkładem, czyli \(Q = P_{(X,Y)}\). Jeżeli jest to rozkład dyskretny scharakteryzowany przez parę \((\{(x_i,y_j)\},\{ p_{ij}\} )\), to oznacza, że:
\[P(X=x_i,Y=y_j) = p_{ij},\]
\[P(X= x_i) = P(X = x_i,Y \in \r ) = Q(\{x_i\} \times \r ) = Q_1(x_i) = p_{i.},\]
\[P(Y= y_j) = P(X \in \r ,Y =y_j) = Q(\r \times \{y_j\}) = Q_2(y_j) = p_{.j}.\]
Inaczej:
\[P(X= x_i) = \sum _{j}p_{ij}, \ \ \ P(Y= y_j) = \sum _{i}p_{ij}\]
Niech \(Q\) będzie 2-wymiarowym rozkładem ciągłym o gęstości \(f : \r ^2 \to \r \). Wtedy rozkłady brzegowe też są ciągłe i mają gęstości \(f_1\), \(f_2\) dane wzorami:
\[f_1(x) = \int _\r f(x,y)\,dy, \ \ \ f_2(y) = \int _\r f(x,y)\,dx. \]
Dowód. \(\di Q_1(A) = Q(A\times \r ) = \int _{A\times \r } f(x,y)\,d(x,y) = \)
stosujemy twierdzenie Fubiniego
\(\di = \int _A\left (\int _\r f(x,y)\,dy\right )\,dx\),
Więc \(\di f_1(x) = \int _\r f(x,y)\,dy\).
W języku zmiennych losowych. Jeżeli \(f\) jest gęstością wektora losowego \((X,Y)\), to \(X\) oraz \(Y\) mają gęstości:
\[f_X(x) = \int _\r f(x,y)\,dy, \ \ \ f_Y(y) = \int _\r f(x,y)\,dx. \]
Przykład – 5.15 Wektor losowy \((X,Y)\) ma rozkład jednostajny na zbiorze \(G : x^2 + y^2 \le 1, y \ge 0\). Znaleźć rozkłady \(X\) oraz \(Y\).
\(\di f_{X,Y)} = \frac {2}{\pi }I_G\).
\(\di f_X(x) = \int _{-\infty }^\infty \frac {2}{\pi }I_G(x,y)\,dy = \int _{0}^{\sqrt {1-x^2}}\frac {2}{\pi }\,dy = \frac {2}{\pi } \sqrt {1-x^2}\) dla \(-1 \le x \le 1\).
\(\di f_Y(y) = \int _{-\infty }^\infty \frac {2}{\pi }I_G(x,y)\,dx = \int _{- \sqrt {1-y^2}}^{\sqrt {1-y^2}}\frac {2}{\pi }\,dx = \frac {4}{\pi } \sqrt {1-y^2} \) dla \(0 \le y \le 1\).
Pytanie. Czy rozkłady brzegowe wyznaczają jednoznacznie rozkład 2-wymiarowy?
N I E !!!
Przykład – 5.16 Niech \(X = Y\) oznaczają liczbę oczek która wypadnie w rzucie jedną kostką.
\[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{1} & 1/6 & 0 & 0 & 0 & 0 & 0 & \color {red}{1/6}\\ \color {red}{2} & 0 & 1/6 & 0 & 0 & 0 & 0 & \color {red}{1/6}\\ \color {red}{3} & 0 & 0 & 1/6 & 0 & 0 & 0 & \color {red}{1/6}\\ \color {red}{4} & 0 & 0 & 0 & 1/6 & 0 & 0 & \color {red}{1/6}\\ \color {red}{5} & 0 & 0 & 0 & 0 & 1/6 & 0 & \color {red}{1/6}\\ \color {red}{6} & 0 & 0 & 0 & 0 & 0 & 1/6 & \color {red}{1/6}\\[1mm] \color {blue}{Y} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} \end {array} \]
Niech \(X, Y\) oznaczają liczbę oczek które wypadną w dwóch rzutach kostką.
\[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{1} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{2} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{3} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{4} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{5} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{6} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\[1mm] \color {blue}{Y} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} \end {array} \]
Określimy pojęcie rozkładu warunkowego tylko w kontekście zmiennych losowych. Niech \((X,Y)\) będzie będzie wektorem o dyskretnym rozkładzie 2-wymiarowym danym przez \((\{(x_i,y_j)\},\{ p_{ij}\} )\). Czyli \(P(X = x_i,Y = y_j) = p_{ij}\). Niech:
\[p_{i|j} = P(X=x_i|Y=y_j) = \frac {P(X=x_i,Y=y_j)}{P(Y=y_j)} = \frac {p_{ij}}{P_{.j}}.\]
\[p_{j|i} = P(Y=y_j|X=x_j) = \frac {P(X=x_i,Y=y_j)}{P(X=x_i)} = \frac {p_{ij}}{p_{i.}}.\]
Uwaga. Oznaczenia są formalnie niepoprawne. Ale są zwyczajowo stosowane.
Definicja – 5.17 Rozkład dany przez ciągi \(\{x_i\}, \{p_{i|j}\}\) nazywamy rozkładem warunkowym \(X\) pod warunkiem \(Y= y_j\). Oznaczamy go \(P_{X|Y=y_j}\).
Rozkład dany przez ciągi \(\{y_j\}, \{p_{j|i}\}\) nazywamy rozkładem warunkowym \(Y\) pod warunkiem \(X= x_i\). Oznaczamy go \(P_{Y|X=x_i}\).
Przykład – 5.18 Wróćmy do rozkładu:
\[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{0} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{1} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12}\\ \color {red}{2} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12} \\[1mm] \color {blue}{Y} & \color {blue}{1/36} & \color {blue}{3/36} & \color {blue}{5/36} & \color {blue}{7/36} & \color {blue}{9/36} & \color {blue}{11/36} \end {array} \]
\(P_{X|Y=1}\) jest rozkładem jednopunktowym \(\delta _0\).
\(P_{X|Y=6}\) jest rozkładem skupionym w punktach \(0,1,2\) z prawdopodobieństwami \(\frac {1}{11}\), \(\frac {5}{11}\), \(\frac {5}{11}\).
\(P_{Y|X = 0}\) jest skupiony w punktach \(1,2,3,4,5,6\) z równymi prawdopodobieństwami.
\[ p_{ij} = p_{i|j}p_{.j} = p_{j|i}p_{i.}. \]
Znając rozkłady brzegowe i warunkowe można wyznaczyć rozkład wektora losowego.
Przykład – 5.19 Rzucamy kostką symetryczną uzyskując \(X\) oczek, a następnie rzucamy \(X\) razy monetą symetryczną uzyskując \(Y\) orłów. Interesuje nas rozkład wektora losowego \((X,Y)\). Oczywiście wektor ten może przyjmować wartości w punktach \((x_i,y_j), i = 1, \dots , 6\), \(j = 0,1, \dots , 6\) z prawdopodobieństwami \(p_{ij} = p_{j|i}p_{i.}\), gdzie \(p_{j|i}\), \(p_{i.}\) są dane. Na przykład: \(p_{53} = \binom {5}{3}\frac {1}{2^5} \frac {1}{6} = \frac {5}{96}\), \(p_{35} = 0 \frac {1}{6} = 0\).
Niech \((X,Y)\) będzie będzie wektorem o ciągłym rozkładzie 2-wymiarowym danym przez gęstość \(f\).
Formalnie nie możemy (jeszcze) mówić o rozkładzie warunkowym pod warunkiem, którego prawdopodobieństwo jest równe zeru. Możemy jednak formalnie zdefiniować funkcje:
\[ f_{X|Y=y}(x) = f(x|y) = \left \{\begin {array}{lll} \frac {f(x,y)}{\int _\r f(x,y)\,dx} = \frac {f(x,y)}{f_Y(y)}, & \mbox { gdy } & f_Y(y) >0\\ 0, & \mbox { gdy } & f_Y(y) = 0 \end {array} \right . \]
\[ f_{Y|X=x}(y) = f(y|x) = \left \{\begin {array}{lll} \frac {f(x,y)}{\int _\r f(x,y)\,dy} = \frac {f(x,y)}{f_X(x)}, & \mbox { gdy } & f_X(x) >0\\ 0, & \mbox { gdy } & f_X(x) = 0 \end {array} \right . \]
Są to gęstości (ćwiczenie).
Definicja – 5.20 Rozkład o gęstości \(f(\cdot |y)\) nazywamy rozkładem warunkowym \(X\) pod warunkiem \((Y= y)\) i oznaczamy \(P_{X|Y=y}\).
Rozkład o gęstości \(f(\cdot |x)\) nazywamy rozkładem warunkowym \(Y\) pod warunkiem \((X= x)\) i oznaczamy \(P_{Y|X=x}\).
Podobnie jak w przypadku dyskretnym:
\[ f(x,y) = f(y|x)f_X(x) = f(x|y)f_Y(y).\]
Przykład – 5.21
Losujemy według rozkładu jednostajnego liczbę \(X\) z odcinka \([0,1]\) a następnie według rozkładu jednostajnego liczbę \(Y\) z odcinka \([0,X]\). Według jakiego rozkładu została wylosowana liczba \(Y\)?
Mamy kolejno:
\(f_X = I_{[0,1]}\) – funkcja charakterystyczna odcinka \([0,1]\).
Gęstość warunkową \(f(\cdot |x) = \frac {1}{x}I_{[0,x]}\), dla \(0 < x \le 1\).
\[f(x,y) = f(y|x)f_X(x) = \left \{\begin {array}{ll} \frac {1}{x} &\mbox { dla } 0 < y \le x \le 1\\ 0 & \mbox { dla pozostaÅĆych } (x,y) \in \r ^2. \end {array} \right .\]
\(f_Y(y)= \int _\r f(x,y)\,dx = \int _y^1\frac {1}{x}\,dx = \ln x |_y^1 = - \ln y\), dla \(0 < y \le 1\),
\(f_Y(y) = 0 \) dla pozostałych \(y\).
Można też wyznaczyć gęstość rozkładu warunkowego \(P_{X|Y = y}\) dla \(0 < y < 1\):
\(f(x|y) = \frac {1/x}{- \ln y} = - \frac {1}{ x\ln y}\) dla \(y <x < 1\).
\(f_X(x) = 1\) dla \(0 \le x \le 1\),
\(f(y|x) = f_{Y|X=x}(y) = \frac {1}{x}\), dla \(0 \le y \le x \le 1\).