(image)

Rachunek prawdopodobieństwa 1, 2

11.2 Funkcje charakterystyczne

Zamiast badać zbieżność miar, nieraz łatwiej jest badać zbieżność ich funkcji charakterystycznych zdefiniowanych poniżej. Funkcje charakterystyczne wykorzystywane są także do innych celów.3

Niech \(P\) będzie rozkładem na \(\r \).

  • Definicja – 11.12 Funkcję \(h :\r \longrightarrow \C \) określoną wzorem:

    \[ h(u) = \int _\r e^{iux}\,dP(x) = \int _\r \cos ux\,dP(x) +i\int _\r \sin ux\,dP(x) \]

    nazywamy funkcją charakterystyczną rozkładu \(P\). Oznaczamy, \(h_P\) zamiast \(h\).

Jeżeli rozkład ma dystrybuantę \(F\), to piszemy też \(h_F\) zamiast \(h_P\). Podobnie gdy \(P\) jest rozkładem pewnej zmiennej losowej \(X\), to mówimy o funkcji charakterystycznej zmiennej losowej, mając na myśli funkcję charakterystyczną jej rozkładu. Piszemy wtedy \(h_X\).

W tym ostatnim przypadku mamy:

\[ h_X(u) = E(e^{iuX}) = E(\cos uX) + iE(\sin uX). \]

Niech \(h\) będzie funkcją charakterystyczną pewnego rozkładu. Wtedy:

  • 1. \(\;\;h(0) = 1.\)

  • 2. \(\;\;|h(u)| \le 1\), dla każdego \(u \in {\bf R},\)

  • 3. \(\;\;h\) jest funkcją ciągłą.

    Dla dowolnej zmiennej losowej \(X\) oraz liczb rzeczywistych \(a,b\) mamy

  • 4. \(\;\;h_{aX + b}(u) = e^{iub}\,h_X(au)\).

Dowód. wynika natychmiast z odpowiednich własności całek (ćwiczenie).   \(\Box \)

  • Twierdzenie – 11.13 Niech \(X_1, X_2,\,\dots ,X_n\) będą niezależnymi zmiennymi losowymi. Wtedy

    \[ h_{X_1+\dots +X_n }(u) = h_{X_1}(u)\cdot \dots \cdot h_{X_n}(u). \]

Dowód. \(X_1,X_2,\,\dots ,X_n\) są niezależne, \(e^{iuX_1},\dots ,e^{iuX_n}\) (traktowane jako wektory losowe o wartościach w \(\r ^2\)), a więc: \(\di h_{X_1+\dots +X_n }(u) = E\left (e^{iu(X_1 + \dots + X_n)} \right ) = E\left (e^{iuX_1} \cdot \dots \cdot e^{iuX_n} \right ) = E\left (e^{iuX_1}\right ) \cdot \dots \cdot E\left (e^{iuX_n} \right ) = h_{X_1}(u) \cdot \dots \cdot h_{X_n}(u)\).   \(\Box \)

  • Twierdzenie – 11.14 (o jednoznaczności) Niech \(P_1\) oraz \(P_2\) będą rozkładami takimi, że \(h_{P_1} = h_{P_2}\).

    Wtedy \(P_1 = P_2\).

Dowód. Jeżeli mamy równość funkcji charakterystycznych \(h_{P_1} = h_{P_2}\), to są sobie równe ich części rzeczywiste i urojone, a więc dla każdego \(u \in \r \) mamy:

\[ \int _{\r }\cos ux\,dP_1(x) = \int _{\r }\cos ux\,dP_2(x), \]

\[ \int _{\r }\sin ux\,dP_1(x) = \int _{\r }\sin ux\,dP_2(x). \]

Z liniowości całek możemy rozszerzyć tę równość na dowolne wielomiany trygonometryczne a następnie na funkcje ciągłe i okresowe \({\r } \longrightarrow {\r }\), gdyż z analizy wiadomo, że każdą funkcję ciągłą i okresową można aproksymować jednostajnie na \(\r \) wielomianami trygonometrycznymi.

Niech teraz \(g\) będzie dowolną funkcją ciągłą o suporcie zwartym. Pokażemy, że równość powyższa zachodzi także dla \(g\), czyli że

\[ \int _{\r }g(x)\,dP_1(x) = \int _{\r }g(x)\,dP_2(x). \]

Ustalmy dowolne \(\varepsilon > 0\) i niech \(M = \sup \{|g(x)|: x\in {\r }\}\). Ponieważ zbiory \({\r }\setminus (-T,T)\,\) tworzą ciąg zstępujący (gdy T rośnie) o części wspólnej \(=\emptyset ,\) więc można znaleźć takie \(T\), że \(P_i({\r } \setminus I) \le {\varepsilon \over 2M}\) dla \(i=1,\,2\) oraz \(supp\,g \subset I\), gdzie \(I\) oznacza przedział \((-T,T).\)

Zmodyfikujmy funkcją \(g\) poza przedziałem \(I\) tak, aby otrzymać funkcję \(\tilde {g}\) okresową i ciągłą, określoną na \(\r \) i taką, że \(g|I = \tilde {g}|I\) .

Oczywiście \(|\tilde {g}(x)| \le M,\) dla każdego \(x \in {\r },\) przy czym:

\[ \int _{\r }\tilde {g}(x)\,dP_1(x) = \int _{\r }\tilde {g}(x)\,dP_2(x). \]

Z równości tej kolejno otrzymujemy:

\[ \int _{I}\tilde {g}(x)\,dP_1(x) + \int _{\r \setminus I}\tilde {g}(x)\,dP_1(x) = \int _{I}\tilde {g}(x)\,dP_2(x) \int _{\r \setminus I}\tilde {g}(x)\,dP_2(x). \]

\[ \left |\int _I\tilde {g}(x)\,dP_1(x) - \int _I\tilde {g}(x)\,dP_2(x)\right | = \left |\int _{{\r }\setminus I}\tilde {g}(x)\,dP_1(x) - \int _{{\r }\setminus I}\tilde {g}(x)\,dP_2(x)\right | \le \]

\[ \left |\int _{{\r }\setminus I}\tilde {g}(x)\,dP_1(x)\right | + \left | \int _{{\r }\setminus I}\tilde {g}(x)\,dP_2(x)\right | \le 2\, M{\varepsilon \over 2M } =\varepsilon . \]

Mamy więc:

\[ \left |\int _{\r }g(x)\,dP_1(x) - \int _{\r }g(x)\,dP_2(x)\right | = \left |\int _I\tilde {g}(x)\,dP_1(x) - \int _I\tilde {g}(x)\,dP_2(x)\right | \le \varepsilon . \]

Ponieważ \(\varepsilon > 0\) jest dowolne, więc dla funkcji ciągłych o suporcie zwartym całki reż są sobie równe.

Z Lematu 11.7, \(P_1 = P_2\).   \(\Box \)

Istnieje iniekcja określona na zbiorze rozkładów w zbiór funkcji ciągłych i ograniczonych \(\r \to K(0,1) \subset \C \), spełniających warunek \(h(0) = 1\). UWAGA. (1) To nie jest suriekcja na powyższy zbiór. (2) Istnieje jednak pełna charakteryzacja obrazu tego odwzorowania.

  • Twierdzenie – 11.15 Niech \(X :\Omega \longrightarrow {\r }\) będzie zmienną losową, \(h= h_X\) jej funkcją charakterystyczną.

    Jeżeli istnieje moment rzędu \(k\) i jest skończony, to funkcja \(h\) jest k-krotnie różniczkowalna. Wtedy:

    \[ h^{(k)}(0) = i^k\,E(X^k). \]

Dowód. Przeprowadzimy dla \(k = 1\); dla pozostałych \(k\) dowód jest już prosty.

Ponieważ

\[ \int _{\r }\left |\frac {d}{du}e^{iux}\right |dP_X(x) = \int _{\r }|ixe^{iux}|dP_X(x) = \int _{\r }|x|dP_X(x) = E(|X|) < \infty , \]

więc – korzystając ze znanego z kursu analizy twierdzenia – istnieje pochodna funkcji określonej przez całkę: \(\frac {d}{du}\,\int _{\r }e^{iux}dP(x) = h'(u)\), i aby ją obliczyć, można różniczkować pod znakiem całki. Tak więc

\[h'(u) = \int _{\r }ix\,e^{iux}dP_X(x),\]

a kładąc \(u = 0\), mamy \(\di h'(0) =i\,\int _{\r }xdP_X(x) = i\, E(X)\).   \(\Box \)

Większość używanych rozkładów na już dawno wyznaczone swoje funkcje charakterystyczne. Warto jednak zobaczyć choćby jak to się robi.

  • 1. Dla rozkładu dyskretnego

    \[ h_P(u) = \sum _{k=0}^Ne^{iux_k}p_k. \]

  • 2. Dla rozkładów ciągłych

    \[ h_P(u) = \int _\r e^{iux}f(x)\, dx. \]

Przykład, rozkład \(\delta _c\).

\(h_{\delta _c}(u) = e^{iuc} 1 = e^{iuc}\). Przykład, rozkład \(N(0,1)\).

  • Twierdzenie – 11.16 Funkcja charakterystyczna \(h\) rozkładu normalnego \(N(0,1)\) wyraża się wzorem

    \[ h(u) = e^{-\frac {1}{2}u^2}. \]

Dowód. (nieobowiązkowy)

Dopełniając do kwadratu, otrzymujemy

\[ h(u) = \int _\r e^{iux}\frac {1}{\sqrt {2\pi }} e^{-\frac {1}{2}x^2}\,dx = \frac {e^{-\frac {u^2}{2}}} {\sqrt {2\pi }}\int _\r e^{-\frac {1}{2}(x-iu)^2}\,dx \]

Wystarczy udowodnić, że \(I:= \int _\r e^{-\frac {1}{2}(x-iu)^2}\,dx = \sqrt {2\pi }. \)

Wiedząc, że całka z funkcji analitycznej po drodze zamkniętej jest równa zeru, rozważmy funkcję \(f(z)=e^{-\frac {1}{2}z^2}\) oraz prostokąt o wierzchołkach w punktach \(-N - iu,\, N- iu,\,N,\,-N\), gdzie \(N\) oraz \(u\) są ustalonymi liczbami rzeczywistymi.

\[ \int _{-N -iu}^{N-iu}f(z)\,dz + \int _N^{-N}f(z)\,dz + R_N = 0. \]

gdzie \(R_N\) jest sumą dwóch całek po odcinkach pionowych. Niech \(z = x -iu\)

\[ \int _{-N}^Ne^{-\frac {1}{2}(x-iu)^2}\,dx = \int _{-N}^Nf(z)\,dz - R_N = \int _{-N}^Ne^{-\frac {1}{2}x^2}\,dx - R_N. \]

Gdy \(N\longrightarrow \infty \), to \(R_N \longrightarrow 0\), gdyż miara pionowych odcinków jest stała, a funkcja \(f\) na tych odcinkach maleje do \(0\). W takim razie

\[ I = \lim _{N\rightarrow \infty } \int _{-N}^Ne^{-\frac {1}{2}(x-iu)^2}\,dx = \lim _{N\rightarrow \infty }\int _{-N}^Ne^{-\frac {1}{2}x^2}\,dx =\int _{-\infty }^\infty e^{-\frac {1}{2}x^2}\,dx = \sqrt {2\pi }. \]

  

  • Przykład – 11.17 (Rozkład \(N(m,\sigma )\)) Jeżeli zmienna losowa \(X\) rozkład \(N(0.1)\), to zmienna losowa \(Y = \sigma X + m\) ma rozkład \(N(m,\sigma )\). W takim razie funkcja charakterystyczna \(h\) tego rozkładu jest równa \(h_Y\).

    \(h(u) = h_Y(u) = e^{ium}h_X(\sigma u) = e^{ium}e^{-\frac {1}{2}(\sigma u)^2} = e^{ium -\frac {1}{2}\sigma ^2 u^2}\).

  • Przykład – 11.18 (Rozkład sumy i.i.d. o rozkładach normalnych.)

    Niech \(P_X = N(m_1,\sigma _1)\), \(P_Y = N(m_2, \sigma _2)\). Wtedy: \(\di h_{X+Y}(u) = h_X(u) h_Y(u) = e^{ium_1 -\frac {1}{2}\sigma _1^2 u^2}e^{ium_2 -\frac {1}{2}\sigma _2^2 u^2} = e^{iu(m_1+m_2) -\frac {1}{2}(\sigma _1^2 + \sigma _2^2) u^2}\).

    A to jest funkcja charakterystyczna rozkładu \(N(m_1+m_2, \sqrt {\sigma _1^2 + \sigma _2^2}).\) Więc \(P_{X+Y} = N(m_1+m_2, \sqrt {\sigma _1^2 + \sigma _2^2}).\)

Znajomość funkcji charakterystycznej pozwala czasami na oszacowanie prawdopodobieństwa „ogona" rozkładu:

  • Twierdzenie – 11.19 Niech \(P\) będzie rozkładem. a \(h\) jego funkcją charakterystyczną. Niech \(u > 0\). Wtedy:

    \[ P(x \in \r : |x| \ge \frac {2}{u}) \le \frac {1}{u}\int _{-u}^u 1 - h(s)\,ds \in \r . \]

Dowód. \(\di \int _{-u}^u 1 - h(s)\,ds = \int _{-u}^u \int _\r dP(x) - \int _\r e^{isx}dP(x)\,ds = \) \(\di \int _\r \int _{-u}^u 1 - \cos (sx)\,ds\,dP(x) = \int _\r 2u - 2\frac {\sin (ux)}{x} \,dP(x) = \) \(\di 2u\left (\int _{\{x: |ux| < 2 \}} 1 - \frac {\sin (ux)}{ux} \,dP(x) + \int _{\{x: |ux| \ge 2 \}} 1 - \frac {\sin (ux)}{ux} \,dP(x) \right ) \ge \)

\(\di 2u(0 + \frac {1}{2}P(x: |ux| \ge 2)) = u P(x: |ux| \ge 2)\).   \(\Box \)

Jednym z najważniejszych zalet funkcji charakterystycznych jest zgodność zbieżności ciągu rozkładów ze zbieżnością odpowiedniego ciągu funkcji charakterystycznych. Mówi o tym następujące twierdzenie.

  • Twierdzenie – 11.20 (o ciągłości) Niech \(\{P_n\}\) będzie ciągiem rozkładów, a \(h_n = h_{P_n}\) ciągiem funkcji charakterystycznych.

    • 1. Jeżeli \(P\) jest rozkładem i \(P_n \stackrel {d}{\longrightarrow } P\), to \(\forall \, u \in \r \lim _{n\to \infty }h_n(u) = h_P(u)\).

    • 2. Jeżeli \(h :\r \to \C \) jest funkcją ciągłą w 0 oraz \(\forall \, u \in \r \lim _{n\to \infty }h_n(u) = h(u)\), to istnieje rozkład \(P\) taki, że \(P_n \stackrel {d}{\longrightarrow } P\). Wtedy też \(h = h_P\).

Dowód. Ad 1. Dla każdego \(u\), \(\sin (ux)\) oraz \(\cos (ux)\) są funkcjami ciągłymi i ograniczonymi, więc stosuje się Twierdzenie 11.11 o zbieżności rozkładów.

Ad 2. Udowodnimy, że \(\{P_n\}\) spełnia warunek Prochorowa. Niech \(\ve > 0\). Niech \(0 < \ve ' < \ve \). Istnieje \(u > 0\), takie, że \(|1 - h(s)| \le \frac {\ve '}{2}\), dla \(|s| \le u\).
Z własności całek: \(\di \frac {1}{2u} \int _{-u}^u |1- h(s)|\,ds \le \frac {\ve '}{2}\).
Z twierdzenia Lebesgue’a \(\di \frac {1}{2u} \int _{-u}^u |1- h_n(s)|\,ds \to \frac {1}{2u} \int _{-u}^u |1- h(s)|\,ds\). Istnieje \(n_0\) takie, że dla \(n \ge n_0\) \(\frac {1}{2u} \int _{-u}^u1- h_n(s)\,ds \le \frac {\ve }{2}\). Z poprzedniego twierdzenia: \(P_n(x \in \r : |x| \ge \frac {2}{u}) \le \frac {1}{u}\int _{-u}^u 1 - h_n(s)\,ds \le \ve \).

\(\{P_n\}\) spełnia więc warunek Prochorowa. Istniej podciąg \(\{P_{k_n}\}\) oraz rozkład \(P\), taki, że \(P_{p_n} \stackrel {d}{\longrightarrow } P\). Z punktu 1: \(\forall \, u \in \r \lim _{n\to \infty }h_{P_{k_n}}(u) = h_P(u)\). Ale również \(\forall \, u \in \r \lim _{n\to \infty }h_{P_{k_n}}(u) = h(u)\). Więc \(h_P = h\). Gdyby \(P_n\) nie zmierzał do \(P\), to istniałby podciąg \(P_{l_n}\) oraz rozkład \(Q\) różny od \(P\) taki, że \(P_{l_n} \stackrel {d}{\longrightarrow } Q\). Rozumując jak poprzednio widzimy, że \(h_Q = h = h_P\). Z twierdzenia o jednoznaczności \(P = Q\).   \(\Box \)