(image)

Rachunek prawdopodobieństwa 1, 2

5.2 Rozkłady brzegowe i warunkowe

  • Przykład – 5.11 Rozważmy rzut dwiema kostkami symetrycznymi. Niech \(X\) oznacza numer kostki na której wypadła większa liczba, lub 0, gdy na obydwu kostkach wypadła ta sama liczba, a \(Y\) oznacza maksimum uzyskanych oczek. Znajdziemy rozkład wektora losowego \((X,Y)\).

    Z dodatnimi prawdopodobieństwami \((X,Y)\) może potencjalnie przyjmować 18 wartości. W tym przypadku można zobrazować to tabelką zawierającą liczności zdarzeń \((X = i, Y=j)\), \(i = 0,1,2\), \(j = 1,2,3,4,5,6\).

    \[ \begin {array}{ccccccc} $X$\backslash $Y$ & 1 & 2 & 3 & 4 & 5 & 6 \\[1mm] 0 & 1 & 1 & 1 & 1 & 1 & 1 \\ 1 & 0 & 1 & 2 & 3 & 4 & 5 \\ 2 & 0 & 1 & 2 & 3 & 4 & 5 \end {array} \]

    W takim razie prawdopodobieństwa \(p_{i,j} = P(X = i, Y=j)\) też tworzą macierz:

    \[ \begin {array}{ccccccc} $X$\backslash $Y$ & 1 & 2 & 3 & 4 & 5 & 6 \\[1mm] 0 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 \\ 1 & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 \\ 2 & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 \end {array} \]

  • Przykład – 5.12 (kontynuacja Przykładu poprzedniego)

    Sumując wiersze i kolumny otrzymujemy rozkłady zmiennych \(X\) oraz \(Y\).

    \[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{0} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{1} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12}\\ \color {red}{2} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12} \\[1mm] \color {blue}{Y} & \color {blue}{1/36} & \color {blue}{3/36} & \color {blue}{5/36} & \color {blue}{7/36} & \color {blue}{9/36} & \color {blue}{11/36} \end {array} \]

Nazywamy je rozkładami brzegowymi. Ogólnie.

  • Definicja – 5.13 (Rozkład brzegowy) Dla danego rozkładu \(n+m\) wymiarowego \(Q : {\cal B}(\r ^n \times \r ^m) \to \r \) określamy rozkłady brzegowe \(Q_1 : {\cal B}(\r ^n) \to \r \), \(Q_2 : {\cal B}(\r ^m) \to \r \) za pomocą formuły:

    \[ Q_1(A) = Q(A \times \r ^m), \ \ Q_2(B) = Q(\rn \times B). \]

W dalszym ciągu rozważamy przypadek \(n = m = 1\). Uogólnienie na dowolne \(n, m\) jest oczywiste.

Niech \((X,Y)\) będzie dwuwymiarowym wektorem losowym określonym na przestrzeni probabilistycznej (Ω, Σ, P ) i niech \(Q\) będzie jego rozkładem, czyli \(Q = P_{(X,Y)}\). Wtedy: dla dowolnego \(A \in {\cal B}(\r )\) mamy:
\(P_X(A) = P(X \in A) = P(X \in A,Y\in \r ) = P((X,Y) \in A \times \r ) = P_{(X,Y)} (A \times \r ) = Q(A\times \r ) = Q_1(A)\). Tak więc \(P_X = Q_1\). Podobnie \(P_Y = Q_2\).

  • Uwaga – 5.14 Rozkłady brzegowe wektora losowego \((X,Y)\) pokrywają się z rozkładami zmiennych losowych \(X\) oraz \(Y\).

Niech \(Q\) będzie dyskretnym rozkładem 2-wymiarowym skupionym na zbiorze (co najwyżej przeliczalnym) \(K\). Możemy taki rozkład jednoznacznie scharakteryzować przez podanie dwóch macierzy; punktów oraz ich prawdopodobieństw. Mianowicie, weźmy najmniejsze zbiory co najwyżej przeliczalne \(K_1, K_2 \subset \r \) takie, że \(K \subset K_1 \times K_2\) i ustawmy je w ciągi, powiedzmy \(K_1 = \{x_i\}_{i=1}^M\), \(K_2 = \{y_j\}_{j=1}^N\), \(M, N \le \infty \) oraz niech \(p_{ij} = Q(x_i,y_j)\). Widać, że:

\(p_{ij} \ge 0\) dla wszystkich \(i,j\), oraz \(\di \sum _{i,j}p_{ij} = 1\).

Z doboru zbiorów \(K_1\), \(K_2\) wynika też, że \(\forall \, i \ \exists \, j \ p_{ij} > 0\) oraz \(\forall \, j \ \exists \, i \ p_{ij} > 0\). Gdyby tak nie było, można by zmniejszyć \(K_1\) lub \(K_2\).

Para \((\{(x_i,y_j)\},\{ p_{ij}\} )\) w pełni charakteryzuje rozkład \(Q\).

Wtedy rozkłady brzegowe \(Q_1\), \(Q_2\) są określone odpowiednio przez pary ciągów. \(Q_1\) przez \((\{x_i\}, \{p_{i.}\})\), \(Q_2\) przez \((\{y_j\}, \{p_{.j}\})\), przy czym:

\[ p_{i.} = Q_1(x_i) = Q(\{x_i\} \times \r ) = \sum _{j}p_{ij}, \ \ \‚p_{.j} = Q_2(y_j) = Q(\r \times \{y_j\}) = \sum _{i}p_{ij}. \]

Ponieważ występujące powyżej sumy mają wszystkie składniki nieujemne oraz przynajmniej jeden składnik dodatni, wszystkie liczby \(p_{i.}\) oraz \(p_{.j}\) są dodatnie. W dalszej części mówiąc o rozkładach dyskretnych wielowymiarowych będziemy zawsze zakładać, że mają powyższą własność.

Niech \((X,Y)\) będzie dwuwymiarowym wektorem losowym określonym na przestrzeni probabilistycznej (Ω, Σ, P ) i niech \(Q\) będzie jego rozkładem, czyli \(Q = P_{(X,Y)}\). Jeżeli jest to rozkład dyskretny scharakteryzowany przez parę \((\{(x_i,y_j)\},\{ p_{ij}\} )\), to oznacza, że:

\[P(X=x_i,Y=y_j) = p_{ij},\]

\[P(X= x_i) = P(X = x_i,Y \in \r ) = Q(\{x_i\} \times \r ) = Q_1(x_i) = p_{i.},\]

\[P(Y= y_j) = P(X \in \r ,Y =y_j) = Q(\r \times \{y_j\}) = Q_2(y_j) = p_{.j}.\]

Inaczej:

\[P(X= x_i) = \sum _{j}p_{ij}, \ \ \ P(Y= y_j) = \sum _{i}p_{ij}\]

Niech \(Q\) będzie 2-wymiarowym rozkładem ciągłym o gęstości \(f : \r ^2 \to \r \). Wtedy rozkłady brzegowe też są ciągłe i mają gęstości \(f_1\), \(f_2\) dane wzorami:

\[f_1(x) = \int _\r f(x,y)\,dy, \ \ \ f_2(y) = \int _\r f(x,y)\,dx. \]

Dowód. \(\di Q_1(A) = Q(A\times \r ) = \int _{A\times \r } f(x,y)\,d(x,y) = \)

stosujemy twierdzenie Fubiniego

\(\di = \int _A\left (\int _\r f(x,y)\,dy\right )\,dx\),

Więc \(\di f_1(x) = \int _\r f(x,y)\,dy\).   

W języku zmiennych losowych. Jeżeli \(f\) jest gęstością wektora losowego \((X,Y)\), to \(X\) oraz \(Y\) mają gęstości:

\[f_X(x) = \int _\r f(x,y)\,dy, \ \ \ f_Y(y) = \int _\r f(x,y)\,dx. \]

  • Przykład – 5.15 Wektor losowy \((X,Y)\) ma rozkład jednostajny na zbiorze \(G : x^2 + y^2 \le 1, y \ge 0\). Znaleźć rozkłady \(X\) oraz \(Y\).

    \(\di f_{X,Y)} = \frac {2}{\pi }I_G\).
    \(\di f_X(x) = \int _{-\infty }^\infty \frac {2}{\pi }I_G(x,y)\,dy = \int _{0}^{\sqrt {1-x^2}}\frac {2}{\pi }\,dy = \frac {2}{\pi } \sqrt {1-x^2}\) dla \(-1 \le x \le 1\).
    \(\di f_Y(y) = \int _{-\infty }^\infty \frac {2}{\pi }I_G(x,y)\,dx = \int _{- \sqrt {1-y^2}}^{\sqrt {1-y^2}}\frac {2}{\pi }\,dx = \frac {4}{\pi } \sqrt {1-y^2} \) dla \(0 \le y \le 1\).

(image)
\(f_X\)

(image)
\(f_Y\)

Pytanie. Czy rozkłady brzegowe wyznaczają jednoznacznie rozkład 2-wymiarowy?

N I E !!!

  • Przykład – 5.16 Niech \(X = Y\) oznaczają liczbę oczek która wypadnie w rzucie jedną kostką.

    \[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{1} & 1/6 & 0 & 0 & 0 & 0 & 0 & \color {red}{1/6}\\ \color {red}{2} & 0 & 1/6 & 0 & 0 & 0 & 0 & \color {red}{1/6}\\ \color {red}{3} & 0 & 0 & 1/6 & 0 & 0 & 0 & \color {red}{1/6}\\ \color {red}{4} & 0 & 0 & 0 & 1/6 & 0 & 0 & \color {red}{1/6}\\ \color {red}{5} & 0 & 0 & 0 & 0 & 1/6 & 0 & \color {red}{1/6}\\ \color {red}{6} & 0 & 0 & 0 & 0 & 0 & 1/6 & \color {red}{1/6}\\[1mm] \color {blue}{Y} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} \end {array} \]

    Niech \(X, Y\) oznaczają liczbę oczek które wypadną w dwóch rzutach kostką.

    \[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{1} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{2} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{3} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{4} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{5} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{6} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\[1mm] \color {blue}{Y} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} & \color {blue}{1/6} \end {array} \]

Określimy pojęcie rozkładu warunkowego tylko w kontekście zmiennych losowych. Niech \((X,Y)\) będzie będzie wektorem o dyskretnym rozkładzie 2-wymiarowym danym przez \((\{(x_i,y_j)\},\{ p_{ij}\} )\). Czyli \(P(X = x_i,Y = y_j) = p_{ij}\). Niech:

\[p_{i|j} = P(X=x_i|Y=y_j) = \frac {P(X=x_i,Y=y_j)}{P(Y=y_j)} = \frac {p_{ij}}{P_{.j}}.\]

\[p_{j|i} = P(Y=y_j|X=x_j) = \frac {P(X=x_i,Y=y_j)}{P(X=x_i)} = \frac {p_{ij}}{p_{i.}}.\]

Uwaga. Oznaczenia są formalnie niepoprawne. Ale są zwyczajowo stosowane.

  • Definicja – 5.17 Rozkład dany przez ciągi \(\{x_i\}, \{p_{i|j}\}\) nazywamy rozkładem warunkowym \(X\) pod warunkiem \(Y= y_j\). Oznaczamy go \(P_{X|Y=y_j}\).

    Rozkład dany przez ciągi \(\{y_j\}, \{p_{j|i}\}\) nazywamy rozkładem warunkowym \(Y\) pod warunkiem \(X= x_i\). Oznaczamy go \(P_{Y|X=x_i}\).

  • Przykład – 5.18 Wróćmy do rozkładu:

    \[ \begin {array}{cccccccc} $X$\backslash $Y$ & \color {blue}{1} & \color {blue}{2} & \color {blue}{3} & \color {blue}{4} & \color {blue}{5} & \color {blue}{6} & \ \color {red}{X} \\[1mm] \color {red}{0} & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & 1/36 & \color {red}{1/6}\\ \color {red}{1} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12}\\ \color {red}{2} & 0 & 1/36 & 2/36 & 3/36 & 4/36 & 5/36 & \color {red}{5/12} \\[1mm] \color {blue}{Y} & \color {blue}{1/36} & \color {blue}{3/36} & \color {blue}{5/36} & \color {blue}{7/36} & \color {blue}{9/36} & \color {blue}{11/36} \end {array} \]

    \(P_{X|Y=1}\) jest rozkładem jednopunktowym \(\delta _0\).

    \(P_{X|Y=6}\) jest rozkładem skupionym w punktach \(0,1,2\) z prawdopodobieństwami \(\frac {1}{11}\), \(\frac {5}{11}\), \(\frac {5}{11}\).

    \(P_{Y|X = 0}\) jest skupiony w punktach \(1,2,3,4,5,6\) z równymi prawdopodobieństwami.

\[ p_{ij} = p_{i|j}p_{.j} = p_{j|i}p_{i.}. \]

Znając rozkłady brzegowe i warunkowe można wyznaczyć rozkład wektora losowego.

  • Przykład – 5.19 Rzucamy kostką symetryczną uzyskując \(X\) oczek, a następnie rzucamy \(X\) razy monetą symetryczną uzyskując \(Y\) orłów. Interesuje nas rozkład wektora losowego \((X,Y)\). Oczywiście wektor ten może przyjmować wartości w punktach \((x_i,y_j), i = 1, \dots , 6\), \(j = 0,1, \dots , 6\) z prawdopodobieństwami \(p_{ij} = p_{j|i}p_{i.}\), gdzie \(p_{j|i}\), \(p_{i.}\) są dane. Na przykład: \(p_{53} = \binom {5}{3}\frac {1}{2^5} \frac {1}{6} = \frac {5}{96}\), \(p_{35} = 0 \frac {1}{6} = 0\).

Niech \((X,Y)\) będzie będzie wektorem o ciągłym rozkładzie 2-wymiarowym danym przez gęstość \(f\).

Formalnie nie możemy (jeszcze) mówić o rozkładzie warunkowym pod warunkiem, którego prawdopodobieństwo jest równe zeru. Możemy jednak formalnie zdefiniować funkcje:

\[ f_{X|Y=y}(x) = f(x|y) = \left \{\begin {array}{lll} \frac {f(x,y)}{\int _\r f(x,y)\,dx} = \frac {f(x,y)}{f_Y(y)}, & \mbox { gdy } & f_Y(y) >0\\ 0, & \mbox { gdy } & f_Y(y) = 0 \end {array} \right . \]

\[ f_{Y|X=x}(y) = f(y|x) = \left \{\begin {array}{lll} \frac {f(x,y)}{\int _\r f(x,y)\,dy} = \frac {f(x,y)}{f_X(x)}, & \mbox { gdy } & f_X(x) >0\\ 0, & \mbox { gdy } & f_X(x) = 0 \end {array} \right . \]

Są to gęstości (ćwiczenie).

  • Definicja – 5.20 Rozkład o gęstości \(f(\cdot |y)\) nazywamy rozkładem warunkowym \(X\) pod warunkiem \((Y= y)\) i oznaczamy \(P_{X|Y=y}\).

    Rozkład o gęstości \(f(\cdot |x)\) nazywamy rozkładem warunkowym \(Y\) pod warunkiem \((X= x)\) i oznaczamy \(P_{Y|X=x}\).

Podobnie jak w przypadku dyskretnym:

\[ f(x,y) = f(y|x)f_X(x) = f(x|y)f_Y(y).\]

  • Przykład – 5.21

    Losujemy według rozkładu jednostajnego liczbę \(X\) z odcinka \([0,1]\) a następnie według rozkładu jednostajnego liczbę \(Y\) z odcinka \([0,X]\). Według jakiego rozkładu została wylosowana liczba \(Y\)?

    Mamy kolejno:

    \(f_X = I_{[0,1]}\) – funkcja charakterystyczna odcinka \([0,1]\).

    Gęstość warunkową \(f(\cdot |x) = \frac {1}{x}I_{[0,x]}\), dla \(0 < x \le 1\).

    \[f(x,y) = f(y|x)f_X(x) = \left \{\begin {array}{ll} \frac {1}{x} &\mbox { dla } 0 < y \le x \le 1\\ 0 & \mbox { dla pozostaÅĆych } (x,y) \in \r ^2. \end {array} \right .\]

    \(f_Y(y)= \int _\r f(x,y)\,dx = \int _y^1\frac {1}{x}\,dx = \ln x |_y^1 = - \ln y\), dla \(0 < y \le 1\),

    \(f_Y(y) = 0 \) dla pozostałych \(y\).

    Można też wyznaczyć gęstość rozkładu warunkowego \(P_{X|Y = y}\) dla \(0 < y < 1\):

    \(f(x|y) = \frac {1/x}{- \ln y} = - \frac {1}{ x\ln y}\) dla \(y <x < 1\).

    \(f_X(x) = 1\) dla \(0 \le x \le 1\),

    \(f(y|x) = f_{Y|X=x}(y) = \frac {1}{x}\), dla \(0 \le y \le x \le 1\).

(image)
\(f_X\)

(image)
\(f_{Y|X=0.2}\), \(f_{Y|X=0.6}\)

(image)
\(f_{(X,Y)}\)

(image)
\(f_Y\)

(image)
\(f_{X|Y=0.2}\), \(f_{X|Y=0.6}\)