Algebra liniowa z geometrią

Klaudiusz Wójcik

Notatki do wykładu

Wydział Matematyki i Informatyki UJ

Kraków 2020

Część I Algebra liniowa z geometrią 1

Rozdział 1 Kilka uwag i wskazówek dla studentów

Wykłady na UJ nie są obowiązkowe i otrzymacie ode mnie notatki do wykładu. Mimo to, gorąco zachęcam Was do chodzenia na wykłady - nie tylko moje :). Notatki nigdy nie zawierają wszystkiego. Wykład to kontakt z żywym człowiekiem, pozwalający przekazać mniej formalne informacje i intuicje. Na wykładzie dowiecie się co jest naprawdę istotne, a co jest tylko detalem technicznym. Nie wyczytacie tego z notatek.
Kolekcjonujcie i analizujcie możliwie dużo konkretnych przykładów. Są one równie ważne jak definicje i twierdzenia. Starajcie się każdą definicje i każde twierdzenie widzieć w kontekście przykładów. Nie bójcie się rachunków na prostych przykładach. Wyrabiają one intuicje i często zawierają w sobie zalążki formalnych dowodów.
O ile to możliwe starajcie się myśleć geometrycznie i robić rysunki. Wiele pojęć matematycznych ma znaczenie geometryczne pozwalające na lepsze ich zrozumienie.
W trakcie wykładu zaproponuje Wam serię zadań. Spróbujcie je rozwiązać samodzielnie. Nie bójcie się dyskusji o nich z koleżankami i kolegami - to zawsze może pomóc. Jeśli się to nie uda, poproście o pomoc prowadzących ćwiczenia. Ostrzeżenie: prowadzący ćwiczenia łatwo rozpoznają czy próbowaliście rozwiązać problemy czy poszliście na łatwiznę.
Zaproponuję Wam również serię testów typu prawda czy fałsz. Powinniście je rozwiązać samodzielnie. Liczba sukcesów w odpowiedziach da Wam wyobrażenie o stopniu zrozumienia prezentowanego na wykładach materiału.
Wszystko w Waszych rękach. My jesteśmy tu po to, aby Wam pomóc. Reszta należy do Was.
  • U

    To jest przykład Uwagi - będą one przewijały się w tekście i powinniście je wnikliwie przemyśleć.

    W tekście pojawiają się Definicje, Twierdzenia, Lematy, Wnioski i Przykłady. Definicje nadają nazwy obiektom ważnym dla rozważanej teorii. Twierdzenia opisują szczególnie ważne własności wcześniej zdefiniowanych pojęć. Z logicznego punktu widzenia, Lematy są tym samym co Twierdzenia, ale ich rola jest pomocnicza - często dowody Twierdzeń są poprzedzone serią Lematów. Wnioski są zazwyczaj szczególnymi przypadkami lub prostymi konsekwencjami Twierdzeń i Definicji podkreślającymi ich użyteczność. Ważna wskazówka: starajcie się analizować założenia Twierdzeń. Zadawajcie sobie pytania typu: a może jakieś założenie nie jest potrzebne, aby zaszła teza? Analizujcie proste konkretne przykłady. Często dają one odpowiedź dlaczego założenia twierdzeń są konieczne i nie można ich pominąć.

Przykład 1.1.

Zobrazuję powyższą uwagę konkretnym przykładem. Rozważmy Twierdzenie:

Suma liczb całkowitych jest liczbą całkowitą.

Chyba się zgodzimy, że jest to zdanie prawdziwe, czyli Twierdzenie. Powinniście sobie zadać pytanie:

Co się stanie jak liczby całkowite zastąpimy innym zbiorem liczbowym?

Czy prawdziwe są stwierdzenia

Suma liczb wymiernych jest liczbą wymierną.

albo

Suma liczb niewymiernych jest liczbą niewymierną.

Przemyślcie Swoje odpowiedzi!

  • !

    A teraz przykład Ostrzeżenia - będą to szczególnie ważne Uwagi.

    Jeśli Wniosek z Twierdzenia nie jest całkiem oczywisty w mojej opinii, to będę podawał jego uzasadnienie (dowód). Jeżeli Wniosek jest podany bez dowodu, to powinniście dobrze przemyśleć dlaczego uznałem, że nie ma potrzeby podawać dodatkowych argumentów jego prawdziwości, gdyż jest on bezpośrednią konsekwencją Definicji albo bardziej ogólnego Twierdzenia.

Rozdział 2 Pojęcia wstępne

SŁOWA KLUCZOWE ROZDZIAŁU ciało liczb rzeczywistych ciało liczb zespolonych wzór de Moivre’a zasadnicze twierdzenie algebry ciało p grupa grupa 𝕊1 grupa pierwiastków zespolonych z jedynki

2.1 Zbiory i liczby rzeczywiste

Zbiór jest kolekcją pewnych obiektów. Dla przykładu, zbiór

A={1,2,3}

składa się z elementów 1,2,3 będących liczbami naturalnymi. Napis 1A oznacza, że liczba naturalna 1 jest elementem zbioru A. Natomiast napis 4A stwierdza, że 4 nie jest elementem zbioru A. Zbiory A i Brówne, gdy składają się z tych samych elementów. Zbiory

{1,2,3}={3,2,1}={1,2,3,1}

są równe. Napis AB oznacza, że zbiór A jest podzbiorem zbioru A, czyli każdy element zbioru A jest elementem zbioru B. Dla przykładu,

{1,2}{-1,0,1,2},{1,8}{-1,0,1,2}.
Przykład 2.1.

Ważne zbiory liczbowe:

  • zbiór liczb naturalnych ={1,2,3,4,5,};

  • zbiór liczb całkowitych ={,-3,-2,-1,0,1,2,3,};

  • zbiór liczb wymiernych ={mn:m,n{0}};

  • zbiór liczb rzeczywistych .

Zachodzą zawierania

,

ale żadne z nich nie jest równością. Zbiór liczb rzeczywistych składa się z liczb wymiernych i liczb niewymiernych . Przykładowo, liczby 2, π, 3-3 są niewymierne.

Zbiór pusty , to zbiór który nie zawiera żadnych elementów. Przykładowo,

={n:n2=-1}
={x:x00}
={m:m3=2}
={m:3.01m<3.99}.
  • 𝗧𝗘𝗦𝗧

    Oceń czy poniższe zdania są prawdziwe:

    • Zbiory A={x:x2=16} i B={x:x2=16} są równe;

    • Suma liczby wymiernej x i niewymiernej y jest liczbą niewymierną;

    • Suma x+y i iloczyn xy liczb wymiernych jest liczbą wymierną;

    • Suma x+y liczb niewymiernych jest liczbą niewymierną;

    • Iloczyn xy liczb niewymiernych jest liczbą niewymierną;

    • Iloczyn xy liczb: wymiernej x i niewymiernej y jest liczbą niewymierną;

    • Suma x+y liczb: wymiernej x i niewymiernej y jest liczbą niewymierną.

Liczby rzeczywiste możemy dodawać i mnożyć. Wynikiem tych operacji jest ponownie liczba rzeczywista. Bardziej formalnie oznacza to, że określone są dwie funkcje (operacje): dodawanie liczb rzeczywistych

+:×(x,y)x+y

oraz ich mnożenie

:×(x,y)xy.

Jeśli poprawnie rozwiązaliście Test to zauważycie, że dodawanie i mnożenie jest również dobrze określonym działaniem w zbiorze liczb wymiernych. Powyższe zdanie oznacza tyle, że suma x+y i iloczyn xy liczb wymiernych jest liczbą wymierną. Nie jest tak z liczbami niewymiernymi. Działania te wyprowadzają nas ze zbioru liczb niewymiernych. Przykładowo, liczby 2 i -2 są niewymierne, ale ich suma 2+(-2)=0 i iloczyn 2(-2)=-2 są liczbami wymiernymi (nawet całkowitymi).

Wróćmy do działań dodawania i mnożenia w zbiorze liczb rzeczywistych. Zakładamy, że dla dowolnych liczb rzeczywistych a,b,c zachodzą warunki (aksjomaty):

  • (i)

    (a+b)+c=a+(b+c)

  • (ii)

    a+b=b+a

  • (iii)

    a+0=a

  • (iv)

    istnieje taka liczba rzeczywista b, że a+b=0

  • (v)

    (ab)c=a(bc)

  • (vi)

    ab=ba

  • (vii)

    a1=a

  • (viii)

    jeżeli a0, to istnieje taka liczba rzeczywista a-1 , że aa-1=1

  • (ix)

    a(b+c)=ab+ac

Algebraicy mówią wtedy krótko, że zbiór liczb rzeczywistych z działaniami + oraz jest ciałem. Oznacza to, że trójka (,+,) (zbiór i dwa działania w nim) spełnia warunki (i)-(ix).

Liczby rzeczywiste możemy ze sobą porównywać. Dla dowolnych x,y zachodzi jeden z warunków

x=ylubx<yluby<x.

Relacja < jest zgodna z działaniami w tym sensie, że zachodzą warunki:

  • (1)

    jeśli a<c i b<d, to a+b<c+d,

  • (2)

    jeśli a<b i c>0, to ac<bc.

Dla liczby rzeczywistej x definiujemy jej wartość bezwzględną wzorem

|x|={x,gdy x0,-x,gdy x0

Liczby rzeczywiste możemy interpretować jako punktu na prostej. Liczba nieujemna |x| jest odległością punktu x od punktu 0. Dla liczb rzeczywistych x,y zachodzi nierówność

|x+y||x|+|y|.

2.2 Liczby zespolone

Wprowadzimy teraz ważne uogólnienie ciała liczb rzeczywistych, czyli ciało liczb zespolonych.

Zbiór liczb zespolonych definiujemy jako zbiór uporządkowanych par liczb rzeczywistych, czyli

:={(x,y):x,y}.

Podobnie jak liczby rzeczywiste możemy interpretować jako punkty na prostej, tak elementy zbioru są punktami na płaszczyźnie.

Na razie mamy pewien zbiór tzn. zbiór punktów na płaszczyźnie. Aby mówić o ciele liczb zespolonych musimy w zbiorze wprowadzić dwa działania + oraz spełniające warunki (i)-(ix). Zrobimy to wykorzystując działania określone w zbiorze liczb rzeczywistych. Jest to typowy dla matematyki mechanizm tworzenia nowych struktur w oparciu o struktury już istniejące.

Definicja 2.1 (Suma i iloczyn liczb zespolonych).

Sumę i iloczyn liczb zespolonych (x1,y1), (x2,y2) określamy wzorami

(x1,y1)+(x2,y2) :=(x1+x2,y1+y2), (2.1)
(x1,y1)(x2,y2) :=(x1x2-y1y2,x1y2+y1x2). (2.2)
  • !

    Wzory (2.1) i (2.2) wymagają pewnego komentarza. W formule (2.1) znak + z lewej strony równości jest nowo definiowanym pojęciem dodawania liczb zespolonych przy pomocy, wcześniej zdefiniowanej, formuły z prawej strony: jest to więc znak dodawania punktów na płaszczyźnie. Po prawej stronie znak + jest już wcześniej znaną operacją dodawania liczb rzeczywistych. Mamy tu więc do czynienia z pewną kolizją oznaczeń: znak + z prawej i lewej strony oznacza inne operacje, zdefiniowane w innych zbiorach. Musimy się do tego przyzwyczaić i domyślać się z kontekstu o jakie działanie chodzi. Alternatywą byłoby oznaczanie dodawania liczb zespolonych jakimś innym symbolem niż + np. . Moglibyśmy wtedy formułę (2.1) zapisać jako

    (x1,y1)(x2,y2)=(x1+x2,y1+y2).

    Tego typu mnożenie oznaczeń nie wydaje się jednak celowe. Zachęcam do analogicznego przeanalizowania znaczenia symboli , ± we wzorze (2.2).

Dla liczby zespolonej z=(x,y) wygodnie jest wprowadzić następującą terminologię. Liczby rzeczywiste x oraz y nazywamy odpowiednio częścią rzeczywistą i częścią urojoną liczby zespolonej z. Będziemy używać oznaczeń

Rez:=x,Imz:=y.
Definicja 2.2 (Sprzężenie i moduł liczby zespolonej).

Dwie liczby zespolone (x1,y1) oraz (x2,y2)równe, wtedy i tylko wtedy, gdy x1=x2 oraz y1=y2, tzn. zarówno ich części rzeczywiste, jak i urojone są równe. Dla liczby zespolonej z=(x,y) definiujemy liczbę przeciwną -z:=(-x,-y) oraz

z¯: =(x,-y) sprzężenie liczby zespolonej
|z|: =x2+y2 moduł liczby zespolonej.

Moduł liczby zespolonej z=(x,y) jest odległością punktu (x,y) od początku układu współrzędnych (0,0).

Zachodzą własności

z1+z2¯=z¯1+z¯2,z1z2¯=z¯1z¯2
|z1+z2||z1|+|z2|,|z1z2|=|z1||z2|
Rez=z+z¯2,Imz=z-z¯2i.
Przykład 2.2.

Uzasadnimy, że

|z+w||z|+|w|,z,w.

Zauważmy, że

|z+w|2 =(z+w)(z+w¯)
=(z+w)(z¯+w¯)
=|z|2+zw¯+z¯w+|w|2
=|z|2+|w|2+2Re(zw¯)
|z|2+|w|2+2|zw|
=(|z|+|w|)2.
Wniosek 2.1.

Dla dowolnej liczby zespolonej z=(x,y)C zachodzi wzór

zz¯=(|z|2,0).
Dowód.

Dowód polega na bezpośrednim rachunku. Mamy

zz¯ =(x,y)(x,-y)
=(xx-y(-y),x(-y)+yx)
=(x2+y2,0)
=(|z|2,0).

Twierdzenie 2.1.

Dla dowolnych liczb zespolonych z,w,q mamy

  • (i)

    (z+w)+q=z+(w+q)

  • (ii)

    z+w=w+z

  • (iii)

    z+(0,0)=z

  • (iv)

    z+(-z)=(0,0)

  • (v)

    (zw)q=z(wq)

  • (vi)

    zw=wz

  • (vii)

    z(1,0)=z

  • (viii)

    jeżeli z0, to istnieje jedyna taka liczba zespolona z-1, że zz-1=(1,0)

  • (ix)

    z(w+q)=zw+zq

W szczególności, trójka (C,+,) jest ciałem.

Dowód.

Udowodnimy dla przykładu punkty (viii) i (ix) pozostawiając dowody pozostałych punktów jako ćwiczenie. Zaczniemy od dowodu punktu (ix). Niech z=(x1,y1), w=(x2,y2) i q=(x3,y3) będą dowolnymi liczbami zespolonymi. Wtedy

z(w+q) =(x1,y1)((x2,y2)+(x3,y3))
=(x1,y1)(x2+x3,y2+y3)
=(x1(x2+x3)-y1(y2+y3),x1(y2+y3)+y1(x2+x3))
=(x1x2-y1y2+x1x3-y1y3,x1y2+y1x2+x1y3+y1x3)
=(x1x2-y1y2,x1y2+y1x2)+(x1x3-y1y3,x1y3+y1x3)
=zw+zq.

Zajmiemy się teraz dowodem punktu (ix). Niech z=(x,y)(0,0) będzie dowolną, niezerową liczbą zespoloną. Zauważmy, że |z|2=x2+y20. Szukamy takiej liczby zespolonej z-1, że zz-1=(1,0). Ponieważ

zz¯=(|z|2,0),

więc wystarczy przyjąć, że

z-1=(x|z|2,-y|z|2)=z¯|z|2.

Liczby zespolone postaci (x,0) będziemy utożsamiać z liczbami rzeczywistymi, tzn. będziemy pisać (x,0)=x.

Definicja 2.3 (Jednostka urojona).

Liczbę zespoloną

i:=(0,1)

nazywamy jednostką urojoną.

Zauważmy, że

i2=(0,1)(0,1)=(-1,0)=-1.

Stąd

i2=-1,i3=-i,i4=1,

czyli

i4k=1,i4k+1=i,i4k+2=-1,i4k+3=-i,k.

Każdą liczbę zespoloną z=(x,y) możemy zapisać w postaci algebraicznej:

z=(x,y)=(x,0)+(0,y)=(x,0)+(0,1)(y,0)=x+iy.

Dodawanie i mnożenie liczb zespolonych z1=x1+iy1 oraz z2=x2+iy2 w postaci algebraicznej przyjmuje postać

z1+z2=(x1+x2)+i(y1+y2),
z1z2=(x1x2-y1y2)+i(x1y2+y1x2).

W tej konwencji zapisu liczby zespolone mnożymy tak samo jak liczby rzeczywiste pamiętając, że i2=-1. Dla przykładu,

(1+i2)(4+3i) =4+4i2+3i+32i2
=4-32+i(42+3).
Rysunek 2.1: Mnożenie przez i jest obrotem o π/2.
Rysunek 2.2: Liczba zespolona z, jej argument, moduł i liczba zespolona z¯ sprzężona do z.
Przykład 2.3.

Zapiszemy liczbę 11+3i w postaci a+bi. Mamy

11+3i =11+3i1-3i1-3i
=1-3i1+32
=1-3i10.

Każdą liczbę zespoloną z=x+iy0 można zapisać w postaci

z=x+iy=|z|(x|z|+iy|z|).

Ponadto,

x|z|=cosφ,y|z|=sinφ, (2.3)

gdzie φ jest kątem między między osią rzeczywistą a półprostą o początku w punkcie (0,0) przechodzącą przez punkt (x,y). Otrzymujemy stąd postać trygonometryczną liczby zespolonej:

z=|z|(cosφ+isinφ). (2.4)

Każdą liczbę φ spełniającą równania (2.3) nazywamy argumentem liczby zespolonej z0 i oznaczamy arg(z).

Argument arg(z) nie jest wyznaczony jednoznacznie. Jeżeli φ jest pewnym argumentem z, to każdy inny argument z jest postaci

φ+2kπ,

dla pewnego k. Jeśli z=0, to równość (2.4) zachodzi dla dowolnej liczby rzeczywistej φ. Argumentem głównym liczby zespolonej z0 nazywamy liczbę rzeczywistą φ(-π,π] określoną równaniami (2.3). Oznaczamy go przez Arg(z).

Z powyższy rozważań wynika, że liczba zespolona z0 jest jednoznacznie wyznaczona przez swój moduł i argument. Wynika stąd, że dwie liczby zespolone są równe wtedy i tylko wtedy, gdy mają równe moduły i ich argumenty różnią się o całkowitą wielokrotność 2π.

Przykład 2.4.

Zapiszemy liczbę z=1+i3 w postaci trygonometrycznej. Mamy |z|=4=2 oraz

cosθ=12,sinθ=32.

Stąd θ=π3, czyli

1+i3=2(cosπ3+isinπ3).
Lemat 2.1.

Dla danych w postaci trygonometrycznej liczb zespolonych

z1=|z1|(cosϕ+isinϕ),z2=|z2|(cosψ+isinψ)

zachodzi wzór

z1z2=|z1||z2|(cos(ϕ+ψ)+isin(ϕ+ψ)).
Dowód.

Bezpośredni rachunek pokazuje, że

z1z2 =|z1|(cosϕ+isinϕ)|z2|(cosψ+isinψ)
=|z1||z2|(cosϕcosψ-sinϕsinψ+i(sinϕcosψ+cosϕsinψ))
=|z1||z2|(cos(ϕ+ψ)+isin(ϕ+ψ)).

Twierdzenie 2.2 (Wzór de Moivre’a).

Dla liczby zespolonej z=|z|(cosϕ+isinϕ) oraz dla nN zachodzi wzór

zn=|z|n(cosnϕ+isinnϕ).

W szczególności, jeśli |z|=1, to

(cosϕ+isinϕ)n=cosnϕ+isinnϕ.
Dowód.

Zastosujemy indukcję względem n. Wzór zachodzi dla n=1. Zakładamy teraz, że jest on prawdziwy dla pewnej liczby naturalnej n. Udowodnimy, że zachodzi on również dla n+1. Mamy

zn+1 =zzn
=|z|(cosϕ+isinϕ)|z|n(cosnϕ+isinnϕ)
=|z|n+1(cos(n+1)ϕ+isin(n+1)ϕ).

Przykład 2.5.

Obliczymy (1+i3)5. Ponieważ 1+i3=2(cosπ3+isinπ3), więc

(1+i3)5 =25(cos5π3+isin5π3)
=32(12-i32).
Definicja 2.4 (Pierwiastek z liczby zespolonej).

Niech n. Liczbę zespoloną w nazywamy pierwiastkiem stopnia n z liczby zespolonej z, jeśli wn=z.

Niech w=|w|(cosψ+isinψ) będzie pierwiastkiem stopnia n z liczby z=|z|(cosϕ+isinϕ)0. Ze wzoru de Moivre’a wynika, że wtedy

|w|n(cosnψ+isinnψ)=|z|(cosϕ+isinϕ).

Stąd |w|n=|z| oraz

nψ=ϕ+2kπ,

dla pewnego k. Wynika stąd, że dla pewnego k mamy

w=|z|n(cos(ϕ+2kπn)+isin(ϕ+2kπn)). (2.5)

Łatwo sprawdzamy, że istnieje dokładnie n różnych pierwiastków stopnia n z liczby z0 danych wzorami

wk=|z|n(cos(ϕ+2kπn)+isin(ϕ+2kπn)),k=0,1,,n-1.
  • U

    Na pierwiastki wk stopnia n z niezerowej liczby zespolonej z=|z|(cosϕ+isinϕ) możemy popatrzeć następująco. Niech

    u=|z|n(cos(ϕn)+isin(ϕn))

    będzie oczywistym pierwiastkiem. Dla pierwiastka stopnia n z jedynki:

    ω=cos2πn+isin2πn

    mamy

    wk=uωk,k=0,,n-1,

    czyli pierwiastkami stopnia n z liczby z

    u,uω,uω2,,uωn-1.
Przykład 2.6.

Wyznaczymy pierwiastki zespolone stopnia trzeciego z liczby

1+i3=2(cosπ3+isinπ3).

Dla k=0 mamy

w0=23(cosπ9+isinπ9).

Dla k=1 otrzymujemy

w1 =23(cosπ3+2π3+isinπ3+2π3)
=23(cos7π9+isin7π9),

a dla k=2 mamy

w2 =23(cosπ3+4π3+isinπ3+4π3)
=23(cos13π9+isin13π9).
Przykład 2.7.

Pierwiastkami zespolonymi stopnia 4 z jedynki są liczby

1,i,-1,-i.
  • U

    Ponieważ pierwiastki wk dla k=0,1,,n-1 mają moduły równe |z|n i kolejne argumenty różnią się o 2πn, więc wk są wierzchołkami n-kąta foremnego wpisanego w okrąg o środku w punkcie (0,0) i promieniu |z|n.

Przykład 2.8 (Pierwiastki zespolone wielomianu rzeczywistego).

Rozważmy równanie wielomianowe o współczynnikach rzeczywistych a0,,an:

anzn++a1z+a0=0,an0.

Uzasadnimy, że jeżeli liczba zespolona z jest pierwiastkiem tego równania, to jest nim również z¯. Nie jest to prawda, gdy współczynniki a0,,an są zespolone, ale nie są rzeczywiste. Jeśli

anzn++a1z+a0=0,

to

0=0¯ =anzn++a1z+a0¯
=an¯z¯n++a1¯z¯+a0¯
=anz¯n++a1z¯+a0.
Twierdzenie 2.3 (Zasadnicze twierdzenie algebry).

Każdy wielomian

w(z)=zn+an-1zn-1++a1z+a0,ai

o współczynnikach zespolonych ma n pierwiastków zespolonych (liczonych z krotnościami) z1,,zn. Ponadto,

w(z)=(z-z1)(z-z2)(z-zn).

Pierwszy dowód Twierdzenia 2.3 podał Gauss w 1799 roku.

  • U

    Rozkład wielomianu rzeczywistego nad

    Z Zasadniczego twierdzenia algebry wynika, że wielomian o współczynnikach zespolonych p(z)=zn+an-1zn-1++a1z+a0 ma rozkład na iloczyn wielomianów stopnia pierwszego

    p(z)=(z-z1)(z-zn),

    gdzie z1,,zn są pierwiastkami p. Zastanówmy się co możemy powiedzieć o rozkładzie wielomianu p(z)=zn+an-1zn-1++a1z+a0 o współczynnikach rzeczywistych. Jak wiemy, jeśli liczba zespolona z1=a+ib z b0 jest jego pierwiastkiem, to jest nim również liczba sprzężona z2=a-ib. Zauważmy, że

    (z-z1)(z-z2) =(z-(a+ib))(z-(a-ib))
    =z2-2az+a2+b2,

    jest wielomianem stopnia 2 o współczynnikach rzeczywistych nie posiadającym pierwiastków rzeczywistych. Wynika stąd, że p możemy rozłożyć na iloczyn wielomianów stopnia jeden i wielomianów nierozkładalnych stopnia dwa o współczynnikach rzeczywistych.

Przykład 2.9.

Można sprawdzić, że wielomian w(z)=z4-5z2-10z-6 ma pierwiastki zespolone -1,3,-1+i,-1-i. Jako wielomian o współczynnikach zespolonych rozkłada się on na czynniki stopnia pierwszego:

w(z)=(z+1)(z-3)(z+1+i)(z+1-i).

Jeśli chcemy, go rozłożyć na iloczyn wielomianów o współczynnikach rzeczywistych, to otrzymujemy

w(z)=(z+1)(z-3)(z2+2z+2)=(z+1+i)(z+1-i).
Przykład 2.10 (Pierwiastki zespolone równania kwadratowego).

Rozważmy równanie kwadratowe

az2+bz+c=0,a0

o współczynnikach rzeczywistych. Jeśli Δ=b2-4ac<0, to ma ono dwa sprzężone rozwiązania zespolone dane wzorami

z1=-b-i|Δ|2a,z2=-b+i|Δ|2a.

Przykładowo, dla

z2+z+1=0

mamy Δ=-3 oraz

z1=-1-i32,z2=-1+i32.
  • U

    Pierwiastki równania kwadratowego Rozważmy równanie kwadratowe

    az2+bz+c=0,a0

    o współczynnikach zespolonych a,b,c. Dla Δ=b2-4ac możemy je zapisać w postaci

    a[(z+b2a)2-Δ4a2]=0,

    co jest równoważne z równością

    (z+b2a)2=Δ4a2,

    czyli

    (2az+b)2=Δ.

    Wystarczy więc znaleźć pierwiastki kwadratowe z liczby zespolonej Δ.

    Zauważmy, że jeśli z1,z2 są pierwiastkami równania az2+bz+c=0, to

    az2+bz+c=a(z-z1)(z-z2)

    oraz zachodzą wzory Viete’a

    z1+z2=-ba,z1z2=ca.
Przykład 2.11.

Rozwiążemy równanie

4z2+4iz+(-13-16i)=0,z.

Jest ono równoważne z równaniem z2+iz+-13-16i4=0, czyli

(z+i2)2+14-134-4i=0.

Stąd

(z+i2)2=3+4i.

Znajdziemy pierwiastki stopnia 2 z liczby 3+4i. Jeśli (a+ib)2=3+4i, to

a2-b2=3,2ab=4.

Z drugiego równania a i b są różne od zera i b=2a. Z pierwszego równania mamy

a2-4a2=3,

czyli

a4-3a2-4=0.

Stąd

(a2+1)(a2-4)=0,

czyli a=±2. W konsekwencji, b=±1. Mamy więc, że

z+i2=2+ilubz+i2=-2-i,

czyli

z=2+i2lubz=-2-3i2.

2.3 Grupy i ciała

Wprowadzimy teraz pewne podstawowe struktury algebraiczne. Ten fragment będzie nieco bardziej abstrakcyjny i wymaga od Was szczególnej uwagi. Ten trud opłaci się w Waszym dalszym matematycznym życiu. Podejmijcie go! Robimy to nie tylko z miłości do abstrakcji, ale przede wszystkim dlatego, że wprowadzenie i używanie tego języka jest po prostu wygodne. Niech X będzie niepustym zbiorem.

Definicja 2.5 (Działanie wewnętrzne w zbiorze).

Działaniem wewnętrznym w zbiorze X nazywamy dowolne odwzorowanie

:X×X(x,y)xy:=(x,y)X

przyporządkowujące uporządkowanej parze elementów zbioru X element zbioru X.

Przykład 2.12.

Dodawanie i mnożenie liczb rzeczywistych (zespolonych) są działaniami wewnętrznymi w zbiorze (). Ponieważ 2-3=-1, więc odejmowanie nie jest działaniem wewnętrznym w zbiorze liczb naturalnych . Dzielenie xy=xy nie jest działaniem wewnętrznym w zbiorze liczb rzeczywistych , bo nie jest zdefiniowane dla pary (2,0) – nie wolno dzielić przez 0.

Definicja 2.6 (Grupa i grupa abelowa).

Niech :X×XX będzie działaniem w zbiorze X. Para (X,) jest grupą, jeśli zachodzą warunki

  • (G1)

    Dla dowolnych x,y,zX zachodzi

    (xy)z=x(yz)łączność działania
  • (G2)

    Istnieje taki eX, że dla dowolnego xX zachodzi

    ex=x=xeistnieje element neutralny.
  • (G3)

    Dla dowolnego xX istnieje taki xX, że

    xx=xx=eistnieje element odwrotny.

Jeżeli ponadto,

  • (G4)

    Dla dowolnych x,yX mamy

    xy=yx,przemienność działania

to (G,) nazywamy grupą przemienną lub abelową.

  • U

    Element neutralny e w grupie G jest wyznaczony jednoznacznie. Rzeczywiście, jeśli e,e*G są elementami neutralnymi, to

    e=ee*=e*.

    Podobnie, element odwrotny x do x jest wyznaczony jednoznacznie. Jeśli x,x′′ są odwrotne do x, to

    x =xe
    =x(xx′′)
    =(xx)x′′
    =ex′′
    =x′′.
  • 𝗧𝗘𝗦𝗧

    Oceń które ze zdań jest prawdziwe

    • (,+) jest grupą abelową;

    • (,+) jest grupą abelową;

    • (,+) jest grupą abelową;

    • (,+) jest grupą abelową;

    • (,+) jest grupą abelową;

    • ((0,+),+) jest grupą abelową;

    • (,) jest grupą abelową;

    • (,) jest grupą abelową;

    • (,) jest grupą abelową;

    • (,) jest grupą abelową;

    • (,) jest grupą abelową;

    • ({0},) jest grupą abelową;

    • ({0},) jest grupą abelową;

    • ({0},) jest grupą abelową;

    • ({0},) jest grupą abelową.

Przykład 2.13.

Niech

G={x+y5:x,y,x2-5y2=1}.

Pokażemy, że G z mnożeniem liczb rzeczywistych jest grupą abelową. Musimy przede wszystkim pokazać, że jest to działanie wewnętrzne w G. Niech x+y5,u+w5G. Oznacza to, że x,y,u,w oraz

x2-5y2=1=u2-5w2.

Mamy

(x+y5)(u+w5)=xu+5yw+(xw+yu)5.

Musimy pokazać, że (xu+5yw)2-5(xw+yu)2=1. Sprawdzamy, że

(xu+5yw)2-5(xw+yu)2 =x2u2+10xuyw+25y2w2-5x2w2-10xwyu-5y2u2
=x2u2+25y2w2-5x2w2-5y2u2
=(x2-5y2)=1(u2-5w2)=1
=1.

Mnożenie liczb rzeczywistych jest łączne i przemienne, więc warunki (G1) i (G4) są spełnione. Ponadto, 1G, więc zachodzi warunek (G2). Zauważmy, że jeśli x+y5G, to z warunku x2-5y2=1 wynika, że x0. Ponadto, x+y50, bo wtedy 5 byłby liczbą wymierną, gdy y0. Łatwo sprawdzamy, że x-y5G oraz

(x+y5)(x-y5)=x2-5y2=1,

czyli warunek (G3) zachodzi.

Przykład 2.14 (Grupa S1).

Poprawne rozwiązanie Testu 1 prowadzi nas do wniosku, że ({0},) jest grupą abelową. Oznacza to, że działanie mnożenia

:{0}×{0}(z,w)zw{0}

spełnia warunki (G1)-(G4) z definicji grupy. Zbiór {0} jest płaszczyzną z usuniętym początkiem układu współrzędnych. Rozważmy okrąg jednostkowy o środku w początku układu

𝕊1:={z:|z|=1}.

Oczywiście 𝕊1{0}. Zauważmy, że jeżeli z1, z2𝕊1, to z1z2𝕊1, gdyż

|z1z2|=|z1||z2|=1.

Oznacza to, że iloczyn liczb zespolonych ze zbioru 𝕊1 jest ponownie liczbą należącą do 𝕊1. Wynika stąd, że mnożenie liczb zespolonych jest działaniem wewnętrznym w zbiorze 𝕊1 i możemy je traktować jako odwzorowanie

:𝕊1×𝕊1𝕊1.

W takim razie może (𝕊1,) jest również grupą?

  • U

    Podgrupa

    Przypuśćmy, że (G,) jest grupą i HG jest takim jej niepustym podzbiorem, że xyH dla x,yH. Oznacza to, że jest również działaniem wewnętrznym w H. To jeszcze za mało, aby (H,) było grupą. Rozważmy prosty przykład grupy liczb całkowitych G= z działaniem dodawania liczb całkowitych =+. Wtedy jest to również działanie wewnętrzne w zbiorze liczb naturalnych H=G=. Zauważmy, że (,+) nie jest grupą. Przede wszystkim dodawanie nie ma elementu neutralnego w , bo 0. W takim razie rozważmy podzbiór 0={0}. Oczywiście, dodawanie liczb całkowitych jest również działaniem wewnętrznym w 0 i nie mamy już problemu z elementem neutralnym. Pojawia się jednak nowy problem, gdyż przykładowo, element 10 nie ma elementu odwrotnego (przeciwnego) w zbiorze 0, bo -10.

    Z naszych rozważań wynika, że podzbiór HG dziedziczy strukturę grupy z (G,), jeśli spełnione są warunki:

    • xyH dla wszystkich x,yH,

    • eH, gdzie eG jest elementem neutralnym dla ,

    • xH, gdzie xG jest elementem odwrotnym do xH.

    Wtedy rzeczywiście (H,) jest grupą. Algebraicy mówią wtedy, że (H,) jest podgrupą grupy (G,).

Wróćmy do okręgu 𝕊1. Zauważmy, że element neutralny 1, dla mnożenia liczb zespolonych, należy do zbioru 𝕊1. Ponadto, dla z𝕊1 mamy z-1=z¯𝕊1, bo |z¯|=|z|. Ponieważ warunki (G1)-(G4) zachodzą w zbiorze {0}, więc tym bardziej są spełnione w mniejszym zbiorze 𝕊1. Wynika stąd, że para (𝕊1,) jest również grupą abelową. Jest ona podgrupą grupy ({0},).

Przykład 2.15 (Grupa zespolonych pierwiastków z jedynki).

Zdefiniujemy teraz jeszcze pewne ważne podgrupy grupy (𝕊1,). Będą one składały się ze skończonej liczby elementów. Ustalmy dowolną liczbę naturalną n1. Rozważmy zbiór Gn wszystkich pierwiastków stopnia n z liczby 1, czyli

Gn={ϵk:k=0,1,,n-1},

gdzie

ϵk=cos(2kπn)+isin(2kπn).

Zauważmy, że dla z,wGn mamy

(zw)n=znwn=11=1.

Wynika stąd, że mnożenie liczb zespolonych jest działaniem wewnętrznym w zbiorze Gn. Ponadto, 1Gn oraz z-1=z¯, więc z-1Gn, czyli (Gn,) jest grupą abelową.

Rysunek 2.3: Pierwiastki zespolone szóstego stopnia z jedynki. Stanowią one grupę abelową z działaniem mnożenia liczb zespolonych.

Podamy teraz abstrakcyjną definicję algebraicznej struktury ciała z którą zetknęliśmy się już w przypadku liczb rzeczywistych i zespolonych. Rozważmy zbiór 𝔽 w którym określone są dwa działania wewnętrzne

+:𝔽×𝔽𝔽,:𝔽×𝔽𝔽.

Zgodnie z przyjętym (całkowicie umownie) oznaczeniem będziemy je nazywali dodawaniem i mnożeniem, chociaż nie muszą one mieć nic wspólnego ze znanymi nam działaniami arytmetycznymi w zbiorach liczbowych.

Definicja 2.7 (Ciało).

Trójka (𝔽,+,) jest ciałem, jeśli zachodzą warunki

  • (F1)

    para (𝔽,+) jest grupą abelową z elementem neutralnym 0𝔽 dla działania +;

  • (F2)

    para (𝔽{0},) jest grupą abelową z działaniem ;

  • (F3)

    x(y+z)=xy+xz dla dowolnych x,y,z𝔽.

  • !

    W punkcie (F2) w sposób niejawny zakładamy, że iloczyn elementów różnych od 0 jest różny od 0, bo mnożenie jest z założenia działaniem wewnętrznym w zbiorze 𝔽{0} (definicja grupy).

    Z drugiej strony dla dowolnego x𝔽 zachodzi równość

    0x=0,

    bo

    0x=(0+0)x=0x+0x.
Przykład 2.16 (Rozszerzenie ciała Q o 2).

Rozważmy zbiór

(2):={a+b2:a,b}.

Elementy zbioru (2) są liczbami rzeczywistymi, czyli (2). Pokażemy, że struktura ciała (,+,) ,,dziedziczy się’’ na zbiór (2) z działaniami dodawania i mnożenia liczb rzeczywistych zawężonymi do zbioru (2). Zauważmy najpierw, że

0=0+02(2),1=1+02(2),

czyli elementy neutralne działań należą do zbioru (2). Ponadto, działania są wewnętrzne w (2), bo

(a+b2)+(a1+b12)=a+a1+(b+b1)2(2),

oraz

(a+b2)(a1+b12)=aa1+2bb1+(ab1+ba1)2(2).

Zauważmy, że

(a+b2)+(-a-b2)=0,

więc element odwrotny do a+b2 względem działania +, czyli -a-b2 jest elementem zbioru (2).

Załóżmy, że a+b20. Wtedy a-b20. Stąd

a2-2b2=(a+b2)(a-b2)0,

czyli

(a+b2)(a-b2a2-2b2)=1,

więc

a-b2a2-2b2=aa2-2b2-ba2-2b22(2)

jest elementem odwrotnym do a+b2. Z powyższych rozważań wynika, że ((2),+,) jest ciałem.

Przykład 2.17.

Rozważmy zbiór

X={a+b53:a,b}.

Uzasadnimy, że nie jest on ciałem z dodawaniem i mnożeniem liczb rzeczywistych. Problem mamy z mnożeniem, bo nie jest ono działaniem wewnętrznym w zbiorze X. Pokażemy bowiem, że (53)2X. Przypuśćmy, że (53)2=a+b53 dla pewnych a,b. Mnożąc przez 53 dostajemy, że

5= a53+b(53)2
=a53+ab+b253
=ab+53(a+b2).

Ponieważ 53 jest liczbą niewymierną, więc a+b2=0 i ab=5, czyli -b3=5, więc 53=-b. Otrzymana sprzeczność pokazuje, że (53)2X.

Przykład 2.18 (Ciało Z2).

Niech 2={0,1}. Definiujemy dodawanie + w zbiorze 2={0,1} przez tabelę wyników tego działania

+ 0 1
0 0 1
1 1 0

Analogicznie definiujemy mnożenie w zbiorze 2={0,1} poprzez tabelę

0 1
0 0 0
1 0 1

Sprawdzamy łatwo, że tak zdefiniowana trójka (2,+,) jest ciałem.

  • U

    Ciało p

    Niech 3={0,1,2}. Definiujemy działania + oraz w zbiorze 3 przez

    + 0 1 2
    0 0 1 2
    1 1 2 0
    2 2 0 1
    0 1 2
    0 0 0 0
    1 0 1 2
    2 0 2 1

    Sprawdzamy łatwo, że (3,+,) jest ciałem.

    Dla liczby całkowitej x i liczby naturalnej n1 przez [x]n oznaczamy resztę z dzielenia liczby x przez n. Zauważcie, że działania w 3 możemy zapisać następująco:

    x+y=[x+y]3,xy=[xy]3,x,y3.

    Nic nie stoi na przeszkodzie, aby podobnie zdefiniować działania w zbiorze

    n={0,1,,n-1}

    dla liczby naturalnej n1. Przyjmujemy, że

    x+y=[x+y]n,xy=[xy]n,x,yn.

    Trójka (n,+,) nie zawsze jest ciałem. Elementem neutralnym dodawania jest 0. Zauważmy, że przykładowo w 6 mamy

    23=[6]6=0.

    Oznacza to, że 6 nie jest ciałem. Analogiczny argument pokazuje, że n nie jest ciałem, gdy n nie jest liczbą pierwszą. Można sprawdzić, że (ćwiczenie) (n,+,) jest ciałem wtedy i tylko wtedy, gdy n jest liczbą pierwszą.

  • U

    Ciało skończone nie musi być równe p dla liczby pierwszej p. Poniższe tabelki definiują ciało 4-elementowe:

    + 0 1 a b
    0 0 1 a b
    1 1 0 b a
    a a b 0 1
    b b a 1 0
    0 1 a b
    0 0 0 0 0
    1 0 1 a b
    a 0 a b 1
    b 0 b 1 a

    (4,+,) nie jest ciałem, bo 22=0.

2.4 Macierze M2×2(𝔽)

Niech 𝔽 będzie ciałem. Przez macierz A=[aij] wymiaru 2 rozumiemy tablicę

A=[a11a12a21a22],aij𝔽

mającą dwa wiersze i dwie kolumny. Zbiór wszystkich takich macierzy będziemy oznaczać przez M2×2(𝔽). Powiemy, że A=[aij],B=[bij]M2×2(𝔽)równe (A=B), jeśli aij=bij dla i,j=1,2.

W zbiorze M2×2(𝔽) definiujemy działanie dodawania

+:M2×2(𝔽)×M2×2(𝔽)M2×2(𝔽)

wzorem

A+B=[a11a12a21a22]+[b11b12b21b22]=[a11+b11a12+b12a21+b21a22+b22].

Sprawdzamy łatwo, że (M2×2(𝔽),+) jest grupą abelową. Elementem neutralnym dodawania jest macierz zerowa

0=[0000],

a elementem przeciwnym do A jest macierz

-A:=[-a11-a12-a21-a22].

W zbiorze M2×2(𝔽) definiujemy działanie mnożenia

:M2×2(𝔽)×M2×2(𝔽)M2×2(𝔽).

Formuła na AB jest nieco bardziej skomplikowana i w dalszym ciągu wyjaśni się dlaczego taka właśnie. Definiujemy

AB=[a11a12a21a22][b11b12b21b22]=[a11b11+a12b21a11b12+a12b22a21b11+a22b21a21b12+a22b22].

Sprawdzamy łatwo, że dla macierzy

I=[1001]

oraz dowolnej macierzy AM2×2(𝔽) mamy

IA=AI=A.

Oznacza to, że I jest elementem neutralnym mnożenia macierzy. Naturalne jest pytanie czy trójka (M2×2(𝔽),+,) jest ciałem. Bezpośredni rachunek pokazuje, że spełnione są następujące warunki:

  • (A+B)+C=A+(B+C)

  • A+0=0+A=A,

  • A+(-A)=0,

  • A+B=B+A,

  • (AB)C=A(BC),

  • AI=IA=A,

  • A(B+C)=AB+BC.

Z definicją ciała mamy jednak kilka problemów. Po pierwsze dla niezerowej macierzy A=[0010] mamy

[0010][0010]=[0000],

czyli mnożenie macierzy nie jest działaniem wewnętrznym w zbiorze macierzy niezerowych. Nie mamy więc do czynienia z ciałem. Ponadto, niezerowa macierz A=[0010] nie posiada elementu odwrotnego względem mnożenia macierzy. Rzeczywiście, dla dowolnej macierzy B=[abcd] mamy

AB=[0010][abcd]=[00ab]I.

Mnożenie macierzy nie jest też przemienne, bo przykładowo

[0010]A[0100]B=[0001],
[0100]B[0010]A=[1000].
Przykład 2.19.

Dla macierzy A=[1000], B=[0100]M2×2(𝔽) mamy

AB=B,BA=0.
  • U

    Możecie, a nawet powinniście zapytać, dlaczego mnożenie macierzy definiujemy tak dziwną formułą. Moglibyśmy przecież, przez analogię do definicji dodawania macierzy, przyjąć że

    AB=[a11a12a21a22][b11b12b21b22]=[a11b11a12b12a21b21a22b22].

    Przecież nie jest to takie złe mnożenie. Ma element neutralny, czyli macierz [1111]. Jest ono oczywiście łączne i przemienne. Oczywiście mamy problem z istnieniem elementu odwrotnego do macierzy niezerowej, bo jeśli tylko w macierzy A=[abcd] któryś z wyrazów a,b,c,d jest równy zero, to A nie posiada macierzy odwrotnej. Ale przecież podobne problemy mieliśmy z wcześniej zdefiniowanym mnożeniem. Powód takiego zdefiniowania mnożenia macierzy jest nieco głębszy i poznamy go nieco później.

Naturalne jest pytanie dla jakich macierzy A istnieje taka macierz BM2×2(𝔽), że

AB=BA=I.

Okazuje się, że takie macierze A można łatwo scharakteryzować. W tym celu dla macierzy A=[abcd] definiujemy element ciała 𝔽 wzorem

detA=ad-bc

i nazywamy wyznacznikiem macierzy A.

Wniosek 2.2.

Dla A,BM2×2(F) mamy

det(AB)=detAdetB

oraz detI=1.

Dowód.

Sprawdzamy to bezpośrednim rachunkiem. Oczywiście zachodzi równość detI=1. Dla macierzy A=[abcd] oraz B=[efgh] mamy

det(AB) =det[ae+bgaf+bhce+dgcf+dh]
=(ae+bg)(cf+dh)-(ce+dg)(af+bh)
=aedh+bgcf-cebh-dgaf
=(ad-bc)(eh-fg)
=detAdetB.

Wniosek 2.3.

Zachodzą warunki:

  • det(A1An)=detA1detAn

  • det(An)=(detA)n

  • det[zazbzczd]=z2det[abcd],z𝔽

  • det[abcd]=-det[badc]

  • det[zabzcd]=zdet[abcd]

  • det[a+ebc+fd]=det[abcd]+det[ebfd]

Jeśli A=det[abcd]M2×2() jest macierzą zespoloną, to definiujemy

A¯=[a¯b¯c¯d¯]M2×2().

Wtedy

  • detA¯=detA¯,

  • (A¯)¯=A,AB¯=A¯B¯,

  • A+B¯=A¯+B¯,zA¯=z¯A¯,

  • jeśli detA0, to (A¯)-1=A-1¯

Twierdzenie 2.4.

Dla macierzy A=[abcd]M2×2(F) następujące warunki są równoważne

  • (1)

    detA0,

  • (2)

    istnieje taka macierz BM2×2(𝔽), że

    AB=BA=I.

    Piszemy wtedy, że B=A-1.

Dowód.

(1) wynika z (2), bo wtedy

detAdetB=det(AB)=detI=1,

czyli detA0.

Jeśli zachodzi warunek (1), to definiujemy B wzorem

B=1detA[d-b-ca].

Sprawdzamy łatwo, że AB=BA=I. ∎

Wniosek 2.4.

Niech A=[abcd]M2×2(F). Jeśli detA0, to

A-1=1detA[d-b-ca].

Dla macierzy A=[abcd]M2×2(𝔽) definiujemy jej macierz transponowaną

AT=[acbd]

oraz dla z𝔽 określamy

z[abcd]=[zazbzczd].

Bezpośredni rachunek pokazuje, że

  • (i)

    (AT)T=A,

  • (ii)

    (A+B)T=AT+BT,

  • (iii)

    (zA)T=zAT,

  • (iv)

    (AB)T=BTAT,

  • (v)

    detAT=detA.

Ponadto, jeśli A jest odwracalna, to A-1A=I, czyli AT(A-1)T=I, więc AT jest też odwracalna oraz (AT)-1=(A-1)T.

Przykład 2.20 (Macierzowa interpretacja ciała C).

Wskażemy teraz podzbiór zbioru M2×2(), który pod względem algebraicznym bardzo przypomina ciało liczb zespolonych. Definiujemy

M:={AM2×2():A=[x-yyx],x,y}.

Łatwo sprawdzamy, że jeśli A=[x-yyx],B=[u-wwu]M, to

A+B=[x+u-(y+w)y+wx+u]M

oraz

AB=[Re(x+iy)(u+iw)-Im(x+iy)(u+iw)Im(x+iy)(u+iw)Re(x+iy)(u+iw)]M,

więc dodawanie i mnożenie macierzy jest działaniem wewnętrznym w M.

Można sprawdzić bezpośrednim rachunkiem, że trójka (M,+,) jest ciałem. My, aby to zauważyć, zastosujemy nieco inne podejście. W tym celu definiujemy

f:x+iy[x-yyx]M.

Jest to bijekcja oraz f(0)=0, f(1)=I. Ponadto,

f(z1+z2)=f(z1)+f(z2),

oraz

f(z1z2)=f(z1)f(z2),

dla dowolnych z1,z2.

Bijekcja f o powyższych własnościach pozwala na identyfikację struktur algebraicznych (,+,) oraz (M,+,). Algebraicy mówią wtedy, że te ciała są izomorficzne. Z algebraicznego punktu widzenia ciała izomorficzne są nierozróżnialne.

Sprawdzamy poprzez bezpośredni rachunek, że f ma dodatkowe własności:

  • dla macierzy J=[0-110] mamy

    J2=-IorazJ4=I,
  • f(i)=J,

  • f(zn)=(f(z))n,

  • f(z¯)=(f(z))T, gdzie

    [x-yyx]T:=[xy-yx],
  • detf(z)=|z|2,

  • f(1/z)=(f(z))-1=1|z|2(f(z))T.

MACIERZOWA INTERPRETACJA CIAŁA z=x+iyA=[x-yyx]=xI+yJ  z¯=x-iyAT=[xy-yx] (x+iy)(x-iy)=x2+y2[x-yyx][xy-yx]=(x2+y2)[1001] (x+iy)(a+ib) =xa-yb+i(xb+ya) [x-yyx][a-bba]=[xa-yb-(xb+ya)xb+yaxa-yb] Dla x2+y20 z-1=1x+iy=x-iyx2+y2[x-yyx]-1=1x2+y2[xy-yx] in=cosnπ2+isinnπ2[0-110]n=[cosnπ2-sinnπ2sinnπ2cosnπ2] (cosθ+isinθ)n=cosnθ+isinnθ[cosθ-sinθsinθcosθ]n=[cosnθ-sinnθsinnθcosnθ] Dla z=x+iy=|z|(cosθ+isinθ) zn=|z|n(cosnθ+isinnθ)[x-yyx]n=|z|n[cosnθ-sinnθsinnθcosnθ]
Przykład 2.21 (Grupy izomorficzne).

Zobrazujemy pojęcie izomorfizmu grup. Rozważmy grupę abelową

G4={1,i,-1,-i}={1,i,i2,i3}

pierwiastków zespolonych 4 stopnia z jedynki. Działaniem grupowym jest mnożenie liczb zespolonych. Zbiór

G4={I,J,-I,-J}={I,J,J2,J3}

jest grupą abelową z działaniem mnożenia macierzy. Zbiór reszt z dzielenia liczby całkowitej przez 4

4={0, 1, 2, 3}

jest grupą z działaniem ,,dodawania reszt‘‘. Działania w tych grupach są opisane tabelkami:

1 i -1 -i
1 1 i -1 -i
i i -1 -i 1
-1 -1 -i 1 i
-i -i 1 i -1
I J -I -J
I I J -I -J
J J -I -J I
-I -I -J I J
-J -J I J -I
+ 0 1 2 3
0 0 1 2 3
1 1 2 3 0
2 2 3 0 1
3 3 0 1 2

Powyższe tabelki pokazują, że struktura algebraiczna wszystkich trzech grup jest identyczna. Jest ona taka sama jak dla grupy 4-elementowej G={e,a,b,c} z działaniem opisanym tabelką

e a b c
e e a b c
a a b c e
b b c e a
c c e a b
Przykład 2.22 (M2×2(Z2)).

Zbiór M2×2(2) składa się z 24 elementów. Macierz AM2×2(2) jest odwracalna, gdy detA0. W ciele 2 oznacza to, że detA=1. Mamy 6 macierzy spełniających ten warunek:

[1001],[1101],[1011],[1110],[0110],[0111].

Podzbiory M2×2(𝔽) dostarczają wielu przykładów grup.

Przykład 2.23 (Grupa GL2(F)).

Rozważmy zbiór macierzy odwracalnych

GL2(𝔽)={AM2×2(𝔽):detA0}.

Jeśli A,BGL2(𝔽), to

det(AB)=detAdetB0,

czyli ABGL2(𝔽). Ponadto, IGL2(𝔽) oraz A-1GL2(𝔽) dla AGL2(𝔽), bo

1 =detI
=det(AA-1)
=detAdetA-1,

czyli detA-10. Oznacza to, że GL2(𝔽) z działaniem mnożenia macierzy jest grupą. Nie jest to grupa abelowa, bo przykładowo

[1101][1011]=[2111],
[1011][1101]=[1112].

Definiujemy ponadto zbiór

SL2(𝔽)={AM2×2(𝔽):detA=1}GL2(𝔽).

Jest on również grupą (nieabelową) z mnożeniem macierzy.

Przykład 2.24 (Macierze symplektyczne).

Definiujemy zbiór macierzy symplektycznych jako

Symp(2):={AM2×2():ATJA=J},J=[0-110].

Sprawdzimy, że jest to grupa z mnożeniem macierzy. Można to zrobić sprawdzając warunki definiujące grupę. W tym celu należy sprawdzić, że

  • jeśli A,BSymp(2), to ABSymp(2),

  • ISymp(2),

  • jeśli ASymp(2), to A jest odwracalna oraz A-1Symp(2).

My zrobimy to nieco inaczej. Bezpośredni rachunek pokazuje, że

ATJA=[0-detAdetA0].

Wynika stąd, że ASymp(2) wtedy i tylko wtedy, gdy det(A)=1. Oznacza to, że

Symp(2)=SL2()
Przykład 2.25 (Macierze górnie trójkątne).

Macierz A=[ab0d]M2×2(𝔽) nazywamy górnie trójkątną. Zauważmy, że

[ab0d][xy0z]=[axay+bz0dz],

czyli iloczyn macierzy górnie trójkątnych jest macierzą górnie trójkątną. Macierz A=[ab0d] jest odwracalna wtedy i tylko wtedy, gdy detA=ad0. Macierz odwrotna jest wtedy równa

A-1=[1a-bad01d],

czyli jest górnie trójkątna. Wynika stąd, że macierze górnie trójkątne o niezerowym wyznaczniku tworzą grupę z mnożeniem macierzy. Jest ona podgrupą grupy GL2(𝔽). Podobnie, macierze górnie trójkątne o wyznaczniku równym 1 (tzn. d=1/a) tworzą podgrupę grupy SL2(𝔽). Ponadto, macierze górnie trójkątne spełniające warunek a=d=1 są również podgrupą SL2(𝔽).

Przykład 2.26 (Macierze ortogonalne).

Definiujemy zbiór macierzy ortogonalnych przez

O(2)={AM2×2():ATA=I}.

Zauważmy, że

1 =detI
=det(ATA)
=det(AT)detA
=(detA)2,

więc detA=±1. Oznacza to, że A jest odwracalna, czyli istnieje taka macierz A-1, że A-1A=AA-1=I. Mnożąc równość ATA=I z prawej strony przez A-1, otrzymujemy, że AT=A-1.

Jeśli A,BO(2), to

(AB)T(AB) =(BTAT)(AB)
=BT(ATA)=IB
=BTB
=I,

czyli ABO(2). Oczywiście IO(2). Ponieważ A-1=AT dla AO(2) oraz

(AT)TAT=AAT=I,

czyli A-1O(2). Wynika stąd, że O(2) jest grupą i podgrupą grupy GL2(). Nie jest ona abelowa. Przyglądniemy się jej bliżej. Niech

A=[abcd]O(2).

Jeśli detA=1, to

A-1=[d-b-ca],

czyli z równości AT=A-1 mamy

a=d,b=-c.

Macierz A ma więc postać

A=[a-cca]

dla pewnych takich liczb a,c, że a2+c2=detA=1. Wynika stąd, że

A=[cosθ-sinθsinθcosθ]

dla pewnego θ.

Jeśli detA=-1, to

A-1=-[d-b-ca],

więc równość AT=A-1 oznacza, że

a=-d,b=c.

Macierz A ma więc postać

A=[acc-a]

dla pewnych takich liczb a,c, że a2+c2=-detA=1. Wynika stąd, że

A=[cosθsinθsinθ-cosθ]

dla pewnego θ.

Zbiór

SO(2)={AO(2):detA=1}

jest grupą z mnożeniem macierzy. Składa się ona z wszystkich macierzy postaci

[cosθ-sinθsinθcosθ],θ.

Sprawdzamy łatwo, że jest to grupa abelowa. Jest ona izomorficzna z grupą (𝕊1,) poprzez

f:𝕊1cosθ+isinθ[cosθ-sinθsinθcosθ]SO(2).
  • U

    Macierze ortogonalne i symplektyczne możemy traktować jako szczególny przypadek ogólniejszej konstrukcji. Mianowicie, dla ustalonej macierzy SM2×2() rozważmy

    GS={AGL2():ATSA=S}.

    Jest to grupa z mnożeniem macierzy. Dla S=I otrzymujemy O(2), a dla S=J grupę Sp(2).

Przykład 2.27 (Macierze symetryczne).

Zbiór rzeczywistych macierzy symetrycznych

Sym2()={AM2×2():A=AT}

jest grupą z działaniem dodawania macierzy.

Dla macierzy A=[abcd]M2×2(𝔽) definiujemy jej ślad wzorem

trA=a+d.

Sprawdzamy łatwo, że

  • (i)

    tr(A+B)=trA+trB,

  • (ii)

    tr(zA)=ztrA,

  • (iii)

    tr(AB)=tr(BA),

  • (iv)

    tr(AT)=trA.

  • U

    Niech AM2×2(𝔽). Mówimy, że macierz BM2×2(𝔽) jest podobna do A, jeśli istnieje taka macierz odwracalna SM2×2(𝔽), że B=S-1AS. Wtedy

    detB =det(S-1AS)
    =detS-1=1detSdetAdetS
    =detA

    oraz

    trB =tr(S-1AS)
    =tr((S-1A)S)
    =tr(S(S-1A))
    =tr((SS-1)A)
    =trA.
Przykład 2.28 (Macierze o śladzie równym 0).

Definiujemy zbiór

T0(𝔽)={AM2×2(𝔽):trA=0}.

Jest to grupa abelowa z działaniem dodawania macierzy.

Przykład 2.29 (Macierze hamiltonowskie).

Rozważmy zbiór

H2={AM2×2():(JA)T=JA}.

Ponieważ JT=-J więc (JA)T=JA wtedy i tylko wtedy, gdy

JA+ATJ=0.

Takie macierze są nazywane macierzami hamiltonowskimi. Pełnią one ważną rolę w teorii równań różniczkowych i mechanice klasycznej. Uzasadnimy, że H2 jest grupą z dodawaniem macierzy. Zamiast sprawdzać warunki z definicji grupy zauważmy, że

JA+ATJ=[0-trAtrA0].

Oznacza to, że H2=T0(), czyli jest grupą.

Przykład 2.30 (Macierze unitarne).

Dla macierzy zespolonej A=[z1w1z2w2]M2×2() definiujemy

A*=[z¯1z¯2w¯1w¯2]

Sprawdzamy łatwo, że

  • A*=(A¯)T,

  • detA*=detA¯,

  • (A*)*=A,(zA+B)*=z¯A*+B*,

  • (AB)*=B*A*,

  • detA*=detA¯.

Rozważmy zbiór macierzy unitarnych

U(2):={AM2×2():A*A=I}.

Warunek A*A=I oznacza, że A*=A-1 oraz |detA|=1. U(2) stanowi grupę z mnożeniem macierzy.

Jeśli detA=1, to

A-1=[w2-w1-z2z1].

Z równości A*=A-1 otrzymujemy, że

z1=w¯2,z2=-w¯1.

Macierz A ma więc w tym przypadku postać

A=[zw-w¯z¯]

dla pewnych takich liczb zespolonych z,w, że

|z|2+|w|2=detA=1.

Grupa

SU(2)={AU(2):detA=1}

składa się więc z macierzy postaci

[zw-w¯z¯],gdzie|z|2+|w|2=1.
Przykład 2.31 (Macierze hermitowskie).

Zbiór zespolonych macierzy hermitowskich

Herm2()={AM2×2():A=A*}

jest grupą z działaniem dodawania macierzy. Przyglądniemy się jej bliżej. Niech A=[z1w1z2w2]Herm2(). Ponieważ

A*=[z¯1z¯2w¯1w¯2],

więc

z1=z¯1,w2=w¯2,w1=z¯2.

Wynika stąd, że AHerm2() jeśli A ma postać

A=[ac¯cd],gdziea,d,c.
Przykład 2.32 (Macierze hermitowskie).

Zbiór zespolonych macierzy hermitowskich

Herm2()={AM2×2():A=A*}

jest grupą z działaniem dodawania macierzy. Przyglądniemy się jej bliżej. Niech A=[z1w1z2w2]Herm2(). Ponieważ

A*=[z¯1z¯2w¯1w¯2],

więc

z1=z¯1,w2=w¯2,w1=z¯2.

Wynika stąd, że AHerm2() jeśli A ma postać

A=[ac¯cd],gdziea,d,c.

2.5 Pewne ważne macierze

Rozważymy pewne specjalne macierze, które będą pojawiały się w dalszym ciągu wykładu. Zaczniemy od pewnego ogólnego rezultatu zwanego Twierdzeniem Cayleya–Hamiltona.

Lemat 2.2 (Twierdzenie Cayleya–Hamiltona).

Dla macierzy AM2×2(F) zachodzi równość

A2-tr(A)A+det(A)I=[0000].
Dowód.

Zastosujemy brutalną siłę, czyli bezpośredni rachunek. Niech A=[abcd]. Mamy

A2-(a+d)A+(ad-bc)I =(A-aI)(A-dI)-(bc)I
=[0bcd-a][a-dbc0]-[bc00bc]
=[bc0c(a-d)+(d-a)cbc]-[bc00bc]
=[0000].

  • U

    Twierdzenie Cayleya–Hamiltona pozwala wyznaczyć macierz odwrotną do macierzy nieosobliwej A. Mnożąc równość A2-tr(A)A+det(A)I=0 przez A-1 otrzymujemy, że

    A-1=1det(A)(tr(A)I-A)

    Ponadto, tr(A2)=(tr(A))2-2det(A).

  • U

    Wzory Viete’a

    Dla macierzy AM2×2() rozważmy równanie kwadratowe

    pA(z)=z2-tr(A)z+det(A)=0.

    Ma ono dwa pierwiastki zespolone λ1,λ2, czyli

    z2-tr(A)z+det(A) =(z-λ1)(z-λ2)
    =z2-(λ1+λ2)z+λ1λ2.

    Wynika stąd, że

    tr(A)=λ1+λ2,det(A)=λ1λ2.

    Liczby λ1,λ2 będziemy nazywać wartościami własnymi macierzy A.

    Z twierdzenia Cayleya–Hamiltona mamy

    A2-(λ1+λ2)A+(λ1λ2)I=[0000],

    czyli

    [0000]=(A-λ1I)(A-λ2I)=(A-λ2I)(A-λ1I).
Przykład 2.33.

Niech A=[1101]M2×2(). Korzystając z Twierdzenia Cayleya–Hamiltona obliczymy A5+A3. Rozważmy wielomian w(z)=z5+z3. Dzieląc go przez wielomian charakterystyczny pA(z)=z2-2z+1=(z-1)2 macierzy A otrzymujemy, że

w(z)=(z3+2z2+4z+6)pA(z)+(8z-6).

Z Twierdzenia Cayleya–Hamiltona mamy

A5+A3=(A3+2A2+4A+6I)(A-I)2=0+(8A-6I)=8A-6I,

czyli

A5-A3=8[1101]-6[1001]=[2802].
Przykład 2.34.

Korzystając z Twierdzenia Cayleya–Hamiltona obliczymy A1000, gdzie A=[1102]. Wielomian charakterystyczny pA(z)=z2-3z+2 ma dwa pierwiastki λ1=1 i λ2=2. Dzieląc wielomian w(z)=z1000 przez pA otrzymujemy, że

w(z)=q(z)pA(z)+r(z),

gdzie r(z)=r1z+r0 jest resztą z dzielenia. Współczynniki r1 i r0 możemy wyznaczyć podstawiając λ1 i λ2 za z. Otrzymujemy, że

r1+r0=λ11000=1,2r1+r0=λ21000=21000.

Rozwiązaniem układu są

r1=21000-1,r0=2-21000.

Z Twierdzenia Cayleya–Hamiltona wynika, że

A1000 =r(A)
=(21000-1)[1102]+(2-21000)[1001]
=[121000-1021000].
Przykład 2.35 (Wartości własne macierzy symetrycznych i hermitowskich).

Jeśli A=[abbd]M2×2() jest macierzą symetryczną, to A ma rzeczywiste wartości własne. Rzeczywiście, dla równania

z2-(a+d)z+ad-b2=0

mamy

(a+d)2-4(ad-b2) =a2+2ad+d2-4ad+4b2
=(a-d)2+4b2
0.

Również, jeśli

A=[ac¯cd]M2×2(),a,d,c

jest macierzą hermitowską, to A ma rzeczywiste wartości własne. Dla równania

0=z2-(a+d)z+ad-cc¯=z2-(a+d)z+ad-|c|2

mamy

(a+d)2-4(ad-|c|2) =a2+2ad+d2-4ad+4|c|2
=(a-d)2+4|c|2
0.
  • U

    Twierdzenie Cayleya–Hamiltona pozwala łatwo obliczać potęgi macierzy A. Rozważmy macierz A=[1234]. Wtedy A2-5A-2I=0. Powiedzmy, że chcemy znaleźć A4. Mamy

    A3 =A(5A+2I)=A2
    =5A2+2A
    =5(5A+2I)+2A
    =27A+10I

    oraz

    A4 =A3A
    =(27A+10I)A
    =27A2+10A
    =27(5A+2I)+10A
    =145A+54I.

    Analogicznie pokazuje się, że An=aA+bI dla pewnych a,b𝔽

Przykład 2.36 (Macierz nilpotentna).

Powiemy, że macierz AM2×2() jest nilpotentna, jeśli An=0 dla pewnego n. Pokażemy najpierw, że A2=0. Możemy założyć, że n2, bo A=0 dla n=1. Zauważmy, że

0=detAn=(detA)n,

czyli detA=0. Niech A=[abcd]. Wtedy

A2=[a2+bcab+bdac+cdbc+d2].

Ponieważ, detA=ad-bc, więc

A2=[(a+d)a(a+d)b(a+d)c(a+d)d]=tr(A)A.

Stąd

0=An=(tr(A))n-1A,

czyli trA=a+d=0. Z twierdzenia Cayleya–Hamiltona wynika, że

A2=0.

Warunek ten oznacza, że

a2+bc=b(a+d)=c(a+d)=bc+d2=0.

Wiemy, że a+d=0, czyli a=-d. Przyglądnijmy się równaniu a2+bc=0. Mamy dwa przypadki ze względu na c:

  • jeśli c=0, to a=0 i A=[0b00] dla b.

  • jeśli c0, to b=-a2c oraz

    A=[a-a2cc-a]=1c[ac-a2c2-ac],a,c,c0.
Przykład 2.37 (Inwolucja).

Powiemy, że AM2×2() jest inwolucją, jeśli A2=I. Wynika stąd, że (detA)2=1, czyli detA=±1. Ponadto, A-1=A. Ze wzoru na A-1 mamy, że

[d-b-ca]=det(A)[abcd].

Jeśli detA=1, to a=d oraz b=c=0. Ponadto, 1=ad-bc=a2 czyli a=±1. Stąd, A=I lub A=-I.

Jeśli detA=-1, to a=-d i -1=ad-bc=-a2-bc, czyli a2+bc=1. Mamy dwa przypadki względem b:

  • jeśli b=0, to a=±1 i c jest dowolne; wtedy

    A=[-10c1]lubA=[10c-1].
  • jeśli b0, to c=1-a2b oraz

    A=[ab1-a2b-a],a,b{0}.
Przykład 2.38 (Macierz idempotentna).

Macierz AM2×2() nazywamy idempotentną, jeśli A2=A. Ponieważ (detA)2=detA, więc detA=1 lub detA=0. Jeśli A=[abcd], to A2=A oznacza, że

a2+bc=a,b(a+d-1)=c(a+d-1)=(a-d)(a+d-1)=0.

Jeśli a+d-10, to b=c=0, a=d i a2=a. Wtedy A=0 lub A=I.

Jeśli a+d-1=0, to warunki redukują się do a2+bc=a.

Mamy dwa przypadki względem b:

  • jeśli b0, to c=a2-ab oraz

    A=[aba-a2b1-a],a,b{0}.
  • jeśli b=0, to albo a=0 albo a=1 i wtedy

    A=[00c1]lub[10c0],c.
Przykład 2.39 (Macierz Grama).

Dla macierzy rzeczywistej A=[abcd]M2×2() jej macierz Grama jest zdefiniowana jako ATA. Stąd

ATA=[acbd][abcd]=[a2+c2ab+cdab+cdb2+d2].

Zauważmy, że

  • ATA jest symetryczna,

  • ATA ma rzeczywiste wartości własne,

  • trATA=a2+b2+c2+d2,

  • trATA=0 wtedy i tylko wtedy, gdy A=0.

Przyglądnijmy się wyznacznikowi macierzy ATA. Mamy

detATA =detATdetA
=(detA)20.
Przykład 2.40 (Rzeczywista macierz normalna).

Rozważmy taką macierz rzeczywistą A=[abcd]M2×2(), że

ATA=AAT.

Nazywamy ją macierzą normalną. Oznacza to, że

[a2+c2ab+cdab+cdb2+d2]=[a2+b2ac+bdac+bdc2+d2],

czyli

c2=b2,ab+cd=ac+bd.

Mamy dwie możliwości:

  • jeśli c=b, to A jest symetryczna,

  • jeśli b=-c, to c(d-a)=c(a-d); wtedy albo c=0 i A jest symetryczna albo c0 i wtedy a=d oraz A ma postać

    A=[a-cca].

Rozdział 3 Przestrzeń wektorowa

SŁOWA KLUCZOWE ROZDZIAŁU przestrzenie wektorowe n i n przestrzeń wektorowa 𝔽n kombinacja liniowa liniowa niezależność baza baza standardowa 𝔽n iloczyn skalarny w n norma w n nierówność Cauchy’ego–Schwarza wektory ortogonalne proste i płaszczyzny w 3 iloczyn hermitowski

3.1 Płaszczyzna 2 jako przestrzeń wektorowa

Punkt na płaszczyźnie 2 utożsamiamy z jego współrzędnymi kartezjańskimi (x1,x2), czyli liczbą zespoloną z=x1+ix2. Wprowadzimy teraz w zbiorze 2 pewną nową strukturę algebraiczną, strukturę przestrzeni wektorowej. Geometrycznie punkt P=(x1,x2) na płaszczyźnie będziemy interpretowali jako wektor będący strzałką o początku w punkcie 0=(0,0) i o końcu w punkcie P. W tej interpretacji będzie dla nas wygodne zastosowanie nieco innej konwencji zapisu współrzędnych punktu. Zamiast pisać (x1,x2) będziemy stosować zapis kolumnowy [x1x2], czyli pierwsza współrzędna nad drugą. Dla oszczędności papieru wprowadzamy oznaczenie

[x1,x2]T:=[x1x2].

Napis (x1,x2) oznacza, że mamy na myśli liczbę zespoloną, a napis sugeruje [x1,x2]T, że myślimy o wektorze na płaszczyźnie.

Definicja 3.1.

Płaszczyzna R2

Płaszczyzną rzeczywistą nazywamy zbiór

2:={[x1,x2]T:x1,x2}.

Jego elementy będziemy nazywać wektorami.

Zbiór 2 możemy łatwo wyposażyć w dodatkową strukturę algebraiczną. Wektory będziemy dodawać i mnożyć je przez liczbę rzeczywistą.

Definicja 3.2.

Dodawanie wektorów i mnożenie ich przez skalar

Niech x=[x1,x2]T,y=[y1,y2]T2. Definiujemy ich sumę przez

x+y=[x1,x2]T+[y1,y2]T=[x1+y1,x2+y2]T.

W zapisie kolumnowym mamy

[x1x2]+[y1y2]=[x1+y1x2+y2]

Powyższy wzór określa dodawanie +:2×22 punktów (wektorów) na płaszczyźnie. Przypisuje ono dwóm punktom płaszczyzny pewien punkt na płaszczyźnie.

Niech a i x=[x1,x2]T2. Definiujemy mnożenie wektora przez liczbę rzeczywistą a wzorem

a[x1,x2]T=[ax1,ax2]T.

Równoważnie,

a[x1x2]=[ax1ax2]

Zdefiniowane powyżej mnożenie definiuje odwzorowanie :×22. Przypisuje ono liczbie rzeczywistej i punktowi na płaszczyźnie pewien punkt na płaszczyźnie.

Rysunek 3.1: Dodawanie wektorów i mnożenie ich przez liczbę rzeczywistą. Suma wektorów u+v jest przekątną równoległoboku R rozpiętego na wektorach u i v. Różnicę wektorów u-v otrzymujemy dodając do wektora u wektor v pomnożony przez liczbę -1 tzn. u-v=u+(-1)v. Długość wektora u-v jest równa długości drugiej przekątnej równoległoboku R. Mnożąc niezerowy wektor v przez wszystkie liczby rzeczywiste otrzymujemy prostą na płaszczyźnie. Dokładniej, zbiór {tv:t} jest prostą przechodzącą przez 0 i równoległą do wektora v.

3.2 Definicja przestrzeni wektorowej

Naturalne jest pytanie: dlaczego mielibyśmy się ograniczać wyłącznie do płaszczyzny 2? Przecież podobną konstrukcję możemy powtórzyć w przestrzeni 3, gdzie położenie punktu jest opisane trzema współrzędnymi w miejsce dwóch. A może rozważyć pięć współrzędnych? Lepiej zróbmy to od razu ogólnie dla dowolnej liczby naturalnej n.

Definicja 3.3.

Przestrzeń wektorowa RnNiech n. Definiujemy zbiór

n:={[x1,,xn]T:x1,,xn},

gdzie

[x1,,xn]T=[x1x2xn].

Analogicznie do płaszczyzny 2 definiujemy działanie dodawania wektorów +:n×nn oraz ich mnożenie przez liczbę rzeczywistą :×nn wzorami

x+y=[x1,,xn]T+[y1,,yn]T=[x1+y1,,xn+yn]T

t[x1,,xn]T=[tx1,,txn]T,t

  • U

    Początek układu współrzędnych, czyli wektor zerowy [0,,0]T będziemy oznaczać przez 0. Zazwyczaj nie prowadzi to do nieporozumień – z kontekstu wynika czy 0 oznacza zero jako liczbę rzeczywistą czy raczej wektor zerowy w n.

n - AKSJOMATY PRZESTRZENI WEKTOROWEJ
Lemat 3.1.
Dla dowolnych wektorów x,y,zRn i liczb rzeczywistych a,bR mamy (1) (x+y)+z=x+(y+z)     (łączność dodawania wektorów) (2) x+y=y+x     (przemienność dodawania wektorów) (3) x+0=x (4) istnieje (jedyny) taki wektor x, że x+x=0     (x=(-1)x) (5) a(x+y)=ax+ay     (rozdzielność) (6) (a+b)x=ax+bx     (rozdzielność) (7) (ab)x=a(bx)     (łączność) (8) 1x=x.
Dowód.

Dowód jest bardzo prosty. Jak się dobrze przyglądniemy to zauważymy, że wszystkie własności (1)-(8) wynikają bezpośrednio z własności działań w zbiorze liczb rzeczywistych. Wystarczy je zastosować do każdej współrzędnej z osobna. ∎

Początki teorii przestrzeni wektorowych związane są z Williamem Rowanem Hamiltonem (1805–1865) oraz Hermannem Guntherem Grassmannem (1809–1877)

Mamy więc do czynienia z pewnym zbiorem V(=n) i dwoma działaniami

+:V×VV,:×VV

spełniającymi warunki (1)-(8).

Definicja 3.4.

Przestrzeń wektorowa nad ciałem R

Rozważmy trójkę (V,+,) z opisanymi powyżej działaniami

+:V×VV,:×VV.

Powiemy, że (V,+,) jest przestrzenią wektorową nad ciałem , (bo mnożymy elementy zbiory V przez liczby rzeczywiste) jeśli zachodzą powyższe warunki (1)-(8).

  • U

    Z powyższych rozważań wynika, że (n,+,) jest przykładem przestrzeni wektorowej nad ciałem . Możecie zapytać po co nam jakieś przestrzenie wektorowe. Przecież mamy już wektory w n, które dodajemy i mnożymy przez liczbę rzeczywistą. Czy to nie wystarczy? Otóż nie. Popatrzcie na funkcję x2+sin(x) (przepraszam ortodoksyjnych matematyków za ten zapis funkcji bez podania dziedziny i przeciwdziedziny). Przecież to też jest suma pewnych obiektów (w tym wypadku funkcji), tylko teraz dodajemy funkcje zamiast liczb lub wektorów z n. Funkcje, podobnie jak wektory możemy mnożyć przez liczby. Pewnie zetknęliście się z funkcjami typu 3x4 lub -2cos(x).

Przykład 3.1 (Przestrzeń F(R,R) funkcji f:RR).

Niech F(,) będzie zbiorem wszystkich funkcji f:. W zbiorze F(,) mamy naturalne dodawanie +:F(,)×F(,)F(,) dane wzorem

(f+g)(x)=f(x)+g(x),

oraz mnożenie przez skalar :×F(,)F(,) zdefiniowane formułą

(af)(x)=af(x).

Trójka (F(,),+,) spełnia warunki (1)-(8), więc jest przestrzenią wektorową nad ciałem liczb rzeczywistych.

Przykład 3.2 (Przestrzeń wielomianów).

Niech P będzie zbiorem wszystkich wielomianów o współczynnikach rzeczywistych. Z naturalnymi działaniami dodawania + i mnożenia przez liczbą , trójka (P,+,) jest przestrzenią wektorową nad ciałem liczb rzeczywistych.

  • U

    Jak pewnie zauważyliście, przez cały czas podkreślam, że rozważane dotąd przestrzenie wektorowe V są przestrzeniami wektorowymi nad ciałem . Może moglibyśmy rozważać przestrzenie wektorowe nad innymi ciałami? Poniższy przykład pokazuje, że możemy to robić. Co więcej jest to bardzo naturalne, a naturalne konstrukcje bardzo w matematyce lubimy.

Przykład 3.3 (Przestrzeń wektorowa Cn).

Przez analogię do zbioru n możemy zdefiniować zbiór n jako

n:={[z1,,zn]T:z1,,zn},

gdzie

[z1,,zn]T=[z1z2zn].

W zbiorze n mamy naturalnie zdefiniowane działanie dodawania

+:n×nn

oraz ich mnożenie przez liczbę zespoloną

:×nn.

Są one dane wzorami

z+w=[z1,,zn]T+[w1,,wn]T=[z1+w1,,zn+wn]T,

t[z1,,zn]T=[tz1,,tzn]T,t.

Łatwo sprawdzamy, że tak określona trójka (n,+,) spełnia warunki (1)-(8). Jedyna różnica polega na tym, że wektory (elementy zbioru n) mnożymy teraz przez liczby zespolone, a nie liczby rzeczywiste. Możemy, więc stwierdzić, że (n,+,) jest przestrzenią wektorową nad ciałem liczb zespolonych. Możecie powiedzieć, że przecież to nie koniec. Taką samą konstrukcje możemy przeprowadzić rozważając zbiór n i jego elementy mnożyć przez liczby wymierne. Otrzymamy przestrzeń wektorową nad ciałem liczb wymiernych . Prowadzi nas to do ogólnej definicji przestrzeni wektorowej nad dowolnym ciałem 𝔽.

Definicja 3.5 (Przestrzeń wektorowa nad ciałem F).

Niech V będzie zbiorem i niech 𝔽 będzie ciałem. Załóżmy, że określone są działania: +:V×VV (dodawanie wektorów) oraz :𝔽×VV (mnożenie przez skalar). Powiemy, że trójka (V,+,) jest przestrzenią wektorową nad ciałem 𝔽, jeśli dla dowolnych wektorów x,y,zV oraz skalarów a,b𝔽 zachodzą warunki:

  • (1)

    (x+y)+z=x+(y+z)

  • (2)

    x+y=y+x

  • (3)

    istnieje taki wektor 0V, że x+0=x

  • (4)

    istnieje taki wektor x, że x+x=0

  • (5)

    a(x+y)=ax+ay

  • (6)

    (a+b)x=ax+bx

  • (7)

    (ab)x=a(bx)

  • (8)

    1x=x.

Zauważmy, że pierwsze cztery warunki dotyczą wyłącznie dodawania wektorów i oznaczają, że (V,+) jest grupą abelową W dalszym ciągu napis VVekt𝔽 będzie oznaczał, że V jest przestrzenią wektorową nad ciałem 𝔽.

  • U

    Wektor zerowy 0V jest wyznaczony jednoznacznie. Jeśli 01,02V spełniają warunek (3), to 01=01+02=02.

  • U

    Rozważmy przestrzeń wektorową VVekt𝔽 nad ciałem 𝔽. Uzasadnimy, że dla vV oraz 0𝔽 (elementu neutralnego dodawania w ciele 𝔽) zachodzi równość

    0v=0V.

    Możecie powiedzieć, że to przesada aby uzasadnić takie rzeczy. Przecież 0𝔽 pomnożone przez ,,cokolwiek’’ daje 0. Tak jest, gdy ,,cokolwiek’’ jest elementem ciała 𝔽. W naszym przypadku 0v oznacza, że mnożymy 0𝔽 przez wektor vV, natomiast 0 po prawej stronie jest wektorem, a nie elementem ciała 𝔽.

    Z własności (6) i definicji 0 jako elementu neutralnego dla dodawania w ciele 𝔽 wynika, że

    0v =(0+0)v
    =0v+0v,

    więc 0v=0.

  • U

    Niech xV. Wektor x spełniający warunek x+x=0 jest wyznaczony jednoznacznie. Rzeczywiście, jeśli x+x=0=x+x′′, to

    x =x+0
    =x+(x+x′′)
    =(x+x)+x′′
    =0+x′′
    =x′′

    Wektor x nazywamy wektorem przeciwnym do x i oznaczamy przez -x. Uzasadnimy, że -x=(-1)x.

    x+(-1)x =(1+(-1))x
    =0x
    =0,

    czyli x=-x=(-1)x.

    Analogicznie pokazujemy, że
    a0=0 oraz -av=(-a)v

Przykład 3.4 (Przestrzeń wektorowa (Fn,+,)).

Jeśli 𝔽 jest dowolnym ciałem, to naturalnie określona trójka (𝔽n,+,) jest przestrzenią wektorową nad ciałem 𝔽. W szczególności, (𝔽,+,) jest przestrzenią wektorową nad ciałem 𝔽.

Przykład 3.5 (O co chodzi z tymi ciałami?).

Rozważmy ponownie przestrzeń wektorową (n,+,). Mnożenie jest mnożeniem wektora przez liczbę zespoloną. Oznaczmy je chwilowo przez . Zauważmy, że w zbiorze n mamy też dobrze określone mnożenie przez liczbę rzeczywistą. Trójki (n,+,) oraz (n,+,) są różnymi obiektami matematycznymi. (n,+,) jest przestrzenią wektorową nad ciałem , a (n,+,) jest przestrzenią wektorową nad ciałem . Co za różnica? Otóż zasadnicza. Pierwsze dwa elementy trójek są identyczne tzn. zbiór n i określone w nim działanie dodawania wektorów +. Aby dostrzec różnicę rozważmy wektor v=[1+2i,1+2i]T2. Zauważmy, że w przestrzeni (n,+,) nad ciałem zachodzi równość

[1+2i1+2i]=(1+2i)[11].

W przestrzeni (n,+,) nad ciałem taka równość nie zachodzi. Co więcej, napis

(1+2i)[11]

nie ma sensu w tej przestrzeni, bo dopuszczamy tylko mnożenie wektorów z 2 przez liczby rzeczywiste.

Przykład 3.6.

Rozważmy przestrzeń wektorową

35=3×3×3×3×3

oraz wektory

u=[2,2,0,1,2]T,v=[1,2,2,2,1]T.

Wtedy

u+v=[0,1,2,0,0]T,2u=[1,1,0,2,1]T.
  • U

    Uważny czytelnik zauważył z pewnością, że działania w przestrzeni funkcyjnej F(,) są zdefiniowane dzięki temu, że potrafimy dodawać wartości dwóch funkcji z F(,) oraz mnożyć wartości funkcji z F(,). Jest to możliwe, bo przeciwdziedzina funkcji z F(,), czyli jest ciałem. Nie jest natomiast ważne, że ich dziedzina ma strukturę ciała. Możemy więc rozważać bardziej ogólne funkcyjne przestrzenie wektorowe. Dokładniej, jeśli X jest dowolnym niepustym zbiorem i 𝔽 jest ciałem, to zbiór

    F(X,𝔽)

    wszystkich funkcji f:X𝔽 jest przestrzenią wektorową z działaniami

    (f+g)(x)=f(x)+g(x),(af)(x)=af(x),a𝔽.

    Przykładowo, F([-1,1],) jest rzeczywistą przestrzenią wektorową. Zwróćcie uwagę, że powyżej zdefiniowane działania, nie są działaniami wewnętrznymi w zbiorze F(,[-1,1]), bo sin,cosF(,[-1,1]), ale sin+cosF(,[-1,1]) oraz 2sinF(,[-1,1]).

Niech 𝔽 będzie ciałem. W przestrzeni wektorowej (𝔽n,+,) wyróżniamy n wektorów danych przez

e1=[1,0,,0]T,e2=[0,1,,0]T,,en=[0,,0,1]T

Zauważmy, że każdy wektor v=[v1,,vn]T𝔽n możemy zapisać jako

[v1,,vn]T =[v1,,0]T++[0,,vn]T
=v1[1,,0]T++vn[0,,1]T
=v1e1++vnen.

Oznacza to, że zachodzi równość

v=v1e1++vnen,vi𝔽.

Mówimy wtedy, że wektor v jest kombinacją liniową wektorów e1,,en. Zdefiniujemy to pojęcie bardziej ogólnie, co przyda nam się w przyszłości.

Definicja 3.6.

Kombinacja liniowa wektorów

Niech (V,+.) będzie przestrzenią wektorową nad ciałem 𝔽. Dla wektorów v1,,vkV oraz skalarów a1,,ak𝔽, wektor

a1v1++akvkV

nazywamy kombinacją liniową wektorów v1,,vkV.

Przykład 3.7.

Niech (V,+,) będzie przestrzenią wektorową nad ciałem 𝔽. Ustalmy wektory v1,,vkV i rozważmy zbiór

span{v1,,vk}={a1v1++akvk:a1,,ak𝔽}

wszystkich możliwych kombinacji liniowych wektorów v1,,vk. Działania + oraz są działaniami wewnętrznymi w zbiorze span{v1,,vk} oraz (span{v1,,vk},+,) jest przestrzenią wektorową nad ciałem 𝔽.

Załóżmy, że V=2. Mamy

  • (a)

    span{0}={0},

  • (b)

    jeśli 0v2, to span{v}={av:a} jest prostą przechodzącą przez 0 i równoległą do wektora v.

Lemat 3.2.

Rozważmy przestrzeń wektorową (Fn,+,). Wtedy każdy wektor vFn można jednoznacznie zapisać w postaci kombinacji liniowej

v=v1e1++vnen,vi𝔽.
Dowód.

Wiemy już, że dla dowolnego wektora v𝔽n istnieją takie skalary v1,,vn𝔽, że v=v1e1++vnen. Pokażemy, że takie przedstawienie wektora v w postaci kombinacji liniowej wektorów e1,,en jest wyznaczone jednoznacznie. Przypuśćmy, że

v=v1e1++vnen=x1e1++xnen.

Wtedy

0=[0,,0]T =v+(-1)v
=(v1-x1)e1++(vn-xn)en
=[v1-x1,,vn-xn]T,

czyli v1=x1,,vn=xn. ∎

Rysunek 3.2: Przykładowa kombinacja liniowa wektorów [2,1]T i [-1,1]T.
Definicja 3.7.

Baza standardowa Fn

Wektory e1,,en nazywamy bazą standardową przestrzeni 𝔽n.

  • U

    Zauważmy, że jednoznaczność przedstawienia wektora v jako kombinacji liniowej wektorów e1,,en wynika z prawdziwości następującej implikacji:

    x1e1++xnen=0x1==xn=0.

    Jest to więc ważna własność wektorów e1,,en. Warto więc ją jakoś nazwać i zbadać.

Definicja 3.8.

Liniowa niezależność

Niech V będzie przestrzenią wektorową nad ciałem 𝔽. Wektory v1,,vkV nazywamy liniowo niezależnymi, jeśli dla x1,,xk𝔽 zachodzi implikacja

x1v1++xkvk=0x1==xk=0.
Przykład 3.8.

Niech v,w2. Przypuśćmy, że wektory v,w są liniowo zależne. Wtedy istnieją takie liczby rzeczywiste a,b, że a0 lub b0 oraz av+bw=0. Jeśli a0, to v=-baw, czyli wektor v leży na prostej {tw:t}.

Przykład 3.9.

Wektory

v1=[1,1,0]T,v2=[1,0,1]T

są liniowo niezależne w 𝔽. Przypuśćmy bowiem, że x1v1+x2v2=0 dla pewnych x1,x2𝔽. Ponieważ x1v1+x2v2=[x1+x2,x1,x2]T, więc

x1+x2=0,x1=0,x2=0,

czyli v1 i v2 są liniowo niezależne.

Definicja 3.9.

Baza przestrzeni wektorowej

Niech V będzie przestrzenią wektorową nad ciałem 𝔽. Wektory v1,,vkv nazywamy bazą przestrzeni wektorowej V, jeśli dla dowolnego wektora vV istnieją jednoznacznie wyznaczone takie skalary x1,,xk𝔽, że

v=x1v1++xkvk.
Przykład 3.10.

Podmieńmy wektor e3=[0,0,1]T w bazie dla 𝔽3 przez wektor u=[0,1,1]T. Pokażemy, że wektory e1, e2, u tworzą bazę 𝔽3. Rozważmy dowolny wektor [a,b,c]T𝔽3. Musimy uzasadnić, że istnieją jedyne takie skalary x1, x2, x3𝔽3, że x1e1+x2e2+x3u=[a,b,c]T. Zwróćmy uwagę, że

x1e1+x2e2+x3u=[x1,x2+x3,x3]T.

Równość [x1,x2+x3,x3]T=x1e1+x2e2+x3u=[a,b,c]T jest więc równoważna z układem równań

x1=a,x2+x3=b,x3=c.

Ma on jednoznaczne rozwiązanie

x1=a,x2=b-c,x3=c,

czyli e1, e2, u są bazą 𝔽3.

Przykład 3.11.

Wektory v1=[1,0,0]T, v2=[0,1,1]T są liniowo niezależne, bo równość

[0,0,0]T =x1v1+x2v2
=x1[1,0,0]T+x2[0,1,1]T
=[x1,x2,x2]T,

oznacza, że x1=x2=0. Nie tworzą one jednak bazy 𝔽3, bo ich kombinacje liniowe x1v1+x2v2 mają postać [x1,x2,x2]T, więc przykładowo, wektor [1,2,3]T nie jest kombinacją liniową v1 i v2.

Każdy wektor [x1,x2,x3]T𝔽3 jest kombinacją liniową wektorów e1, e2, e3, [0,1,1]T, bo

[x1,x2,x3]T=x1e1+x2e2+x3e3+0[0,1,1]T.

Wektory e1, e2, e3, [0,1,1]T nie tworzą jednak bazy 𝔽3, bo przykładowo

[0,1,1]T =0e1+1e2+1e3+0[0,1,1]T
=0e1+0e2+0e3+1[0,1,1]T,

czyli przedstawienie nie jest jednoznaczne. Wynika to z faktu, że wektory e1, e2, e3, [0,1,1]T są liniowo zależne, bo

0e1+1e2+1e3-1u=0.
Rysunek 3.3: Baza standardowa e1, e2 na płaszczyźnie. Każdy wektor na płaszczyźnie można jednoznacznie zapisać jako kombinację liniową wektorów e1, e2.
Przykład 3.12 (Przestrzeń wektorowa macierzy M2×2(F)).

Rozważmy zbiór macierzy M2×2(𝔽). Jest w nim określone działanie dodawania macierzy

+:M2×2(𝔽)×M2×2(𝔽)M2×2(𝔽)

dane wzorem

[abcd]+[efgh]=[a+eb+fc+gd+h]

oraz mnożenie macierzy przez skalar

:𝔽×M2×2(𝔽)M2×2(𝔽)

zdefiniowane wzorem

t[abcd]=[tatbtctd],t𝔽.

Trójka (M2×2(𝔽),+,) jest przestrzenią wektorową nad ciałem 𝔽. Ponadto, dla A=[abcd]M2×2(𝔽) mamy

[abcd]=a[1000]+b[0100]+c[0010]+d[0001].

Powyższym przedstawienie jest jednoznacznie wyznaczone przez macierz A, czyli macierze

[1000],[0100],[0010],[0001]

tworzą bazę przestrzeni M2×2(𝔽).

3.3 Iloczyn skalarny i norma w n

Wprowadzimy teraz w przestrzeni wektorowej (n,+,) pewną dodatkową geometryczną strukturę, zadaną przez euklidesowy iloczyn skalarny.

Definicja 3.10.

Euklidesowy iloczyn skalarny w Rn

Iloczynem skalarnym wektorów v=[v1,v2]T,u=[u1,u2]T2 nazywamy liczbę rzeczywistą

(v|u):=v1u1+v2u2.

Analogicznie, iloczyn skalarny wektorów

v=[v1,,vn]T,u=[u1,,un]Tn

definiujemy jako liczbę rzeczywistą

(v|u):=v1u1++vnun

  • U

    Iloczyn skalarny jest też często oznaczany symbolem <v,u>. My będziemy używali oznaczenia (v|u), bo w tej konwencji nierówność (v|u)>0 jest czytelniejsza niż napis <v,u0.

Iloczyn skalarny jest więc odwzorowaniem

(|):n×n(v,u)(v|u).

Przypisuje ono parze wektorów (v,u) liczbę rzeczywistą (v|u).

Lemat 3.3.

Dla dowolnych wektorów u,v,wRn i skalarów a,bR zachodzą następujące własności

  • (1)

    (dwuliniowość)

    (au+bv|w)=a(u|w)+b(v|w),
    (u|av+bw)=a(u|v)+b(u|w).
  • (2)

    (symetryczność)

    (u|v)=(v|u)

  • (3)

    (dodatnia określoność)

    (u|u)0

    przy czym (u|u)=0 wtedy i tylko wtedy, gdy u=0.

Definicja 3.11.

Norma euklidesowa w Rn

Normą (długością) wektora u=[u1,,un]Tn nazywamy liczbę

u:=(u|u)=u12++un20

  • U

    Zauważmy, że wektor [cosθ,sinθ]T ma normę jeden i każdy wektor o normie jeden można zapisać w tej postaci dla pewnego θ. W szczególności, dowolny wektor v2 można zapisać w postaci

    v=v[cosθ,sinθ]T.
Lemat 3.4 (Tożsamość równoległoboku).

Dla dowolnych wektorów u,vRn zachodzi równość

u+v2+u-v2=2(u2+v2)

Dowód.

Bezpośredni rachunek pokazuje, że

u+v2+u-v2 =(u+v|u+v)+(u-v|u-v)
=(u|u)+(u|v)+(v|u)+(v|v)
+(u|u)-(u|v)-(v|u)+(v|v)
=2(u|u)+2(v|v)=2(u2+v2).

Lemat 3.5 (Wzór polaryzacyjny).

Zachodzi wzór polaryzacyjny

(u|v)=14(u+v2-u-v2).

Dowód.

Mamy

u+v2-u-v2 =(u+v|u+v)-(u-v|u-v)
=(u|u)+(u|v)+(v|u)+(v|v)
-((u|u)-(u|v)-(v|u)+(v|v))
=4(u|v).

Lemat 3.6.

Niech u,vRn będą wektorami. Wówczas,

(u,v)=0u-v2=u2+v2.
Dowód.

Zauważmy, że

u-v2 =(u-v|u-v)
=u2-2(u|v)+v2,

czyli teza zachodzi. ∎

Twierdzenie 3.1 (Nierówność Cauchy’ego–Schwarza).

Dla dowolnych wektorów u i vRn zachodzi nierówność

|(u|v)|uv.

Dowód.

Możemy założyć że wektory u i v są niezerowe. Dla dowolnego t mamy

0 u+tv2
=(u+tv|u+tv)
=u2+2t(u|v)+t2v2,
czyli z własności funkcji kwadratowych wynika, że
4((u|v))2-4u2v20,

co kończy dowód. ∎

Wniosek 3.1 (Własności normy).

Dla dowolnych u,vRn i aR mamy

  • (1)

    u0 oraz u=0 wtedy i tylko wtedy, gdy u=0;

  • (2)

    au=|a|u;

  • (3)

    (nierówność trójkąta)

    u+vu+v

Dowód.

Pierwsza własność wynika bezpośrednio z definicji normy. Dla dowodu drugiej zauważamy, że

au2 =(au|au)
=a2(u|u)
=a2u2.

Uzasadnimy nierówność trójkąta. Stosując nierówność Cauchy’ego–Schwarza mamy

u+v2 =u2+2(u|v)+v2
u2+2uv+v2
=(u+v)2,

co kończy dowód. ∎

Definicja 3.12.

Wektory ortogonalne

Wektory u,vn są ortogonalne (prostopadłe) wtedy i tylko wtedy, gdy

(u|v)=0.

W szczególności, wektor zerowy jest prostopadły do każdego wektora, więc również do samego siebie.

  • U

    Pokażemy, że dla dowolnych wektorów u,v2 zachodzi równość

    (u|v)=uvcos(u,v),

    gdzie (u,v) jest kątem między wektorami u i v. W szczególności,

    |(u|v)|uv.

    Jeśli któryś z wektorów u lub v jest zerowy to powyższa równość jest prawdziwa. Załóżmy więc, że wektory u i v są niezerowe. Niech wektor q będzie rzutem prostopadłym wektora u na prostą rozpiętą przez wektor v. Wtedy q=cv dla pewnego c. Stąd wektor w=u-cv jest prostopadły do wektora v. Gdy kąt (u,v) jest ostry, to c0 oraz

    cos(u,v)=cvu=|c|vu.

    Jeśli kąt (u,v) jest rozwarty, to c<0 oraz

    cos(u,v)=cos(π-(u,-v))=-cos(u,-v)=-|c|vu.

    W obydwu przypadkach

    cos(u,v)=cvu.

    Ponieważ wektor w=u-cv jest prostopadły do v, więc

    0=(u-cv,v)=(u|v)-cv2,

    czyli

    c=(u|v)v2.

    Stąd

    cos(u,v)=(u|v)v2vu=(u|v)vu,

    co kończy dowód.

    Możemy na to spojrzeć jeszcze inaczej. Wektory u i v możemy zapisać w postaci trygonometrycznej:

    u=|u|(cosθ,sinθ)T,v=|v|(cosψ,sinψ)T.

    Wtedy

    (u|v)=|u||v|(cosθcosψ+sinθsinψ)=|u||v|cos(θ-ψ).

Z nierówności Cauchy’ego–Schwarza wynika, że dla niezerowych wektorów u,vn mamy

-1(u|v)uv1,u,v0.

Istnieje więc jednoznacznie wyznaczony taki kąt 0(u,v)π, że

cos(u,v)=(u|v)uv.
Definicja 3.13.

Kąt między wektorami

Kątem (u,v) pomiędzy niezerowymi wektorami u,vn nazywamy jedyny taki kąt 0(u,v)π, że

cos(u,v)=(u|v)uv.
Definicja 3.14.

Wektor jednostkowy

Wektor un nazywamy jednostkowym, gdy u=1.

Rysunek 3.4: Normalizacja niezerowego wektora v. Wektor u=vv leży na okręgu jednostkowym.
Przykład 3.13.

Jeśli wektor vn jest niezerowy, to wektor u=vv jest wektorem jednostkowym.

Przykład 3.14.

Niech A=[abcd]M2×2(). Niech a1=[a,c]T i a2=[b,d]T2 będą wektorami utworzonymi z kolumn macierzy A. Macierz Grama ma postać

ATA=[acbd][abcd]=[(a1|a1)(a1|a2)(a1|a2)(a2|a2)].

W szczególności, AO(2) jest ortogonalna tzn. ATA=I wtedy i tylko wtedy, gdy

a1=a2=1,(a1|a2)=0,

czyli kolumny A są wektorami jednostkowymi i są ortogonalne do siebie.

  • U

    METRYKA EUKLIDESOWA

    Korzystając z normy możemy zdefiniować funkcję

    d:n×n,

    wzorem

    d(v,w)=v-w=(v1-w1)2++(vn-wn)2.

    Z własności normy, dla dowolnych v,w,un mamy

    • (i)

      d(v,w)0 oraz d(v,w)=0 wtedy i tylko wtedy, gdy v=w,

    • (ii)

      d(v,w)=d(w,v),

    • (iii)

      d(v,w)d(v,u)+d(u,w).

    Przykładowo,

    d(v,w) =v-w
    =(v-u)+(u-w)
    v-u+u-w
    =d(v,u)+d(u,w)

    Funkcję d nazywamy metryką euklidesową w n. Liczbę d(v,w) nazywamy odległością między v i w.

3.4 Proste i płaszczyzny

Rozważmy niezerowy wektor v=[v1,v2]T2. Jak wiemy zbiór wszystkich wektorów postaci tv dla t jest prostą równoległą do wektora v i przechodzącą przez punkt 0. Prostą równoległą do v i przechodzącą przez punkt [a1,a2]T możemy opisać jako zbiór punktów postaci [a1,a2]T+tv (t).

Definicja 3.15.

Równanie parametryczne prostej

Równanie parametryczne prostej l przechodzącej przez [a1,a2]T i równoległej do niezerowego wektora v=[v1,v2]T ma postać

[x1,x2]T=[a1,a2]T+t[v1,v2]T,t2

W skrócie, x=a+tv.

Rysunek 3.5: Mnożąc niezerowy wektor v przez wszystkie liczby rzeczywiste t otrzymujemy prostą.
  • U

    Definicja oznacza, że współrzędne punktu [x1,x2]T leżącego na prostej l spełniają, dla pewnego skalara t, układ równań

    {x1=a1+tv1x2=a2+tv2

    Ponieważ wektor v jest niezerowy, więc któraś z jego współrzędnych v1 lub v2 jest różna od zera. Załóżmy przykładowo, że v10. Możemy wtedy z pierwszego równania wyliczyć t otrzymując, że t=x1-a1v1. Wstawiając do drugiego równania otrzymujemy, że

    x2-a2-x1-a1v1v2=0,

    czyli

    -v2(x1-a1)+v1(x2-a2)=0.

    Jest to równanie ogólne prostej l przechodzącej przez punkt [a1,a2]T i równoległej do wektora v.

Definicja 3.16.

Równanie ogólne prostej

Równanie ogólne prostej na płaszczyźnie ma postać

Ax1+Bx2+C=0,A2+B2>0.
  • U

    Zauważmy, że prosta o równaniu ogólnym

    Ax1+Bx2+C=0

    przechodzi przez początek układu współrzędnych 0=[0,0]T wtedy i tylko wtedy, gdy C=0. Ma ona wtedy równanie Ax1+Bx2=0, które możemy zapisać przy pomocy iloczynu skalarnego następująco:

    ([A,B]T|[x1,x2]T)=0.

    Oznacza to, że składa się ona ze wszystkich wektorów [x1,x2]T prostopadłych do wektora [A,B]T.

Wniosek 3.2.

Prosta o równaniu ogólnym

A(x1-a1)+B(x2-a2)=0,A2+B2>0

przechodzi przez punkt [a1,a2]T i jest prostopadła do wektora [A,B]T.

Analogicznie, dla niezerowego wektora v=[v1,,vn]Tn i punktu a=[a1,,an]T równanie parametryczne prostej równoległej do v i przechodzącej przez a ma postać

x=a+tv,t.

Przyglądnijmy się przypadkowi n=3, czyli prostym w przestrzeni 3. W postaci parametrycznej jest ona zadana układem równań

{x1=a1+tv1x2=a2+tv2x3=a3+tv3
Rysunek 3.6: Prosta 2x+y=0 jest prostopadła do wektora [2,1]T.

Jeżeli wszystkie liczby v10 dla i=1,2,3, to eliminując t z powyższego układu otrzymujemy dwa równania

x-a1v1=x-a2v2=x-a3v3,

nazywane równaniami kanonicznymi prostej w przestrzeni. Jeżeli np. v3=0 a v1, V20, to równania przyjmują postać

x-a1v1=x-a2v2,x3=a3.

Gdy np. v2=v3=0 i v10, to równanie ma postać

x2=a2,x3=a3.
Przykład 3.15.

Zastanówmy się jaki podzbiór P przestrzeni 3 jest opisany przez równanie

2x1-x2+3x3=0.

Możemy je zapisać równoważnie wykorzystując iloczyn skalarny jako

([2,-1,3]T|[x1,x2,x3]T)=0,

czyli zbiór P składa się z wszystkich wektorów [x1,x2,x3]T w 3 prostopadłych do wektora [2,-1,3]T. Oznacza to, że P jest płaszczyzną prostopadłą do wektora [2,-1,3]T i zawierającą początek układu 0=[0,0,0]T.

Definicja 3.17.

Równanie ogólne płaszczyzny w R3

Równanie ogólne płaszczyzny w przestrzeni 3 ma postać

Ax1+Bx2+Cx3+D=0,A2+B2+C2>0.

W szczególności, równanie

A(x1-a1)+B(x2-a2)+C(x3-a3)=0

opisuje płaszczyznę przechodzącą przez punkt [a1,a2,a3]T i prostopadłą do wektora [A,B,C]T.

Rysunek 3.7: Płaszczyzna x+y-z=0.
Rysunek 3.8: Płaszczyzny x-2y+3z=1, x+y+z=1 i ich przecięcie będące prostą w 3.
Przykład 3.16.

Rozważmy układ równań liniowych

{x-2y+3z=1x+y+z=1

Równania układu opisują dwie nierównoległe płaszczyzny. Zbiorem rozwiązań układu jest prosta L będąca ich częścią wspólną.

Wyznaczymy dokładniej prostą L. Odejmując pierwsze równanie od drugiego otrzymujemy układ równoważny

{x-2y+3z=13y-2z=0{x-2y+3z=1y=23z

Stąd

{x=1-53zy=23z

Zbiór rozwiązań układu jest dany jako zbiór

{[1-5/3z,2/3z,z]T:z}.

Zauważmy, że

[1-5/3z,2/3z,z]T=[-5/3,2/3,1]Tz+[1,0,0]T.

Rozwiązaniem układu jest prosta L o równaniu parametrycznym

[-5/3,2/3,1]Tz+[1,0,0]T,z.

Rozdział 4 Układy równań liniowych

SŁOWA KLUCZOWE ROZDZIAŁU układ równań liniowych dozwolone operacje macierz rozszerzona układu eliminacja Gaussa postać schodkowa podprzestrzeń span{a1,,ak} układy jednorodne wyznacznik wzory Cramera

Rozważmy układ równań

{x1+x2+x3=0x1-x2+x3=0

Każde z równań układu opisuje pewną płaszczyznę w 3. Szukamy więc punktów leżących na obydwu płaszczyznach. Obydwie płaszczyzny zawierają punkt 0. Pierwsza z nich jest prostopadła do wektora [1,1,1]T, a druga jest prostopadła do wektora [1,-1,1]T. Nie są one równoległe, więc ich przecięciem jest pewna prosta w 3. Naszym najbliższym celem będzie nauczenie się wyznaczania zbioru rozwiązań układu równań liniowych.

Definicja 4.1.

Układ równań liniowychł Niech 𝔽 będzie ciałem. Układem równań liniowych nazywamy układ równań postaci:

{a11x1++a1nxn=b1ak1x1++aknxn=bk (4.1)

Skalary aij𝔽 nazywamy współczynnikami układu, a bi𝔽 wyrazami wolnymi. Jest to układ k równań z n niewiadomymi x1,,xn. Zbiór rozwiązań układu składa się ze wszystkich wektorów [x1,,xn]T𝔽n, których współrzędne spełniają wszystkie równania tego układu. Mówimy, że układ

  • jest sprzeczny, gdy zbiór rozwiązań jest pusty;

  • ma rozwiązanie, jeśli zbiór rozwiązań jest niepusty;

  • ma nieskończenie wiele rozwiązań, gdy zbiór rozwiązań jest nieskończony;

  • ma dokładnie jedno rozwiązanie, jeśli zbiór rozwiązań jest jednoelementowy.

  • U

    Dwa układy równań są równoważne, jeżeli mają takie same zbiory rozwiązań.

    Istnieją pewne operacje, które możemy wykonać na układzie równań (4.1) otrzymując układ równoważny.

    DOZWOLONE OPERACJE NA RÓWNANIACH UKŁADU (I) możemy dwa równania układu zamienić miejscami; (II) możemy obydwie strony któregoś z równań pomnożyć przez dowolny niezerowy skalar; (III) możemy równanie pomnożone przez dowolny skalar dodać do innego równania.

    Punkty (I) i (II) są oczywiste. Punkt (III) wynika z faktu, że [x1,,xn]T spełnia

    ai1x1++ainxn =bi
    aj1x1++ajnxn =bj

    wtedy i tylko wtedy, gdy spełnia

    ai1x1++ainxn =bi
    (aj1+cai1)x1++(ajn+cain)xn =bj+cbi.
Definicja 4.2.

Dozwolone operacje

Operacje (I)-(III) nazywamy dozwolonymi operacjami na równaniach układu równań liniowych.

Przykład 4.1.

Szczególnie łatwe do rozwiązania są układu w postaci ,,schodkowej’’. Przykładowo, w układzie równań (w ciele )

{3x1+2x2+x3=1x2-x3=22x3=4

ostatnie równanie oznacza, że x3=2. Wtedy z drugiego równania x2=4. W konsekwencji, z pierwszego równania otrzymujemy, że x1=-3. Zbiór rozwiązań układu składa się z jednego wektora [-3,4,2]T.

4.1 Eliminacja Gaussa

Opiszemy na przykładzie metodę eliminacji Gaussa pozwalającą sprowadzić dowolny układ do postaci schodkowej. Rozważmy układ równań (w ciele )

{x1+x2+x3+x4+x5=1-x1-x2+0x3+0x4+x5=-1-2x1-2x2+0x3+0x4+3x5=10x1+0x2+x3+x4+3x5=3x1+x2+2x3+2x4+4x5=4

Wszystkie informacje o rozważanym układzie możemy wygodnie zakodować przy pomocy macierzy (tabeli):

A=[11111-1-1001-2-20030011311224],[Ab]=[111111-1-1001-1-2-20031001133112244].

W wierszach macierzy [Ab] wypisujemy współczynniki i wyrazy wolne poszczególnych równań. Macierz A nazywamy macierzą układu, a macierz [Ab] jego macierzą rozszerzoną. Dozwolone operacje (I)-(III) mają swój odpowiednik w postaci dozwolonych operacji na wierszach macierzy:

DOZWOLONE OPERACJE NA WIERSZACH MACIERZY UKŁADU RÓWNAŃ LINIOWYCH (I) możemy dwa wiersze macierzy zamienić miejscami (permutacja); (II) możemy wiersz pomnożyć przez dowolną niezerową liczbę rzeczywistą (skalowanie); (III) możemy wiersz pomnożony przez dowolną liczbę rzeczywistą dodać do innego wiersza.

Zaczynamy od tego, że szukamy wiersza w którym pierwszy wyraz jest niezerowy. W naszym przypadku jest to wiersz pierwszy. Jeśli pierwszy niezerowy wyraz jest różny od 1, to używamy skalowania (II), aby uzyskać 1 na pierwszej pozycji.

  • U

    Jeżeli w pierwszym wierszu na pierwszej pozycji jest zero, to szukamy innego wiersza z niezerowym wyrazem na pierwszej pozycji. Jeśli taki istnieje, to używamy pierwszej operacji (I) i zamieniamy go miejscami z wierszem pierwszym. Może się zdarzyć, że wszystkie wiersze mają na pierwszej pozycji 0. Wtedy powtarzamy procedurę szukając wiersza z niezerowym wyrazem na drugiej pozycji i iterujemy poprzednią procedurę.

W pierwszym kroku, używamy pierwszego wiersza i operacji (III) do wprowadzenia zer w pierwszej kolumnie pod jedynką w pierwszym wierszu. Dodając pierwszy wiersz do drugiego otrzymujemy macierz:

[𝟏11111001120-2-20031001133112244]

Następnie, pomnożony przez 2 pierwszy wiersz dodajemy do wiersza trzeciego

[𝟏11111001120002253001133112244]

Kończymy ten krok odejmując pierwszy wiersz od wiersza piątego

[11111100𝟏120002253001133001133].

W drugim kroku używamy analogicznie drugiego wiersza do eliminacji niezerowych elementów w trzeciej kolumnie i wierszach od trzeciego do piątego. W efekcie otrzymujemy

[1111110011200000𝟏3000013000013].

W ostatnim kroku używamy trzeciego wiersza do eliminacji jedynek w piątej kolumnie oraz czwartym i piątym wierszu. Otrzymujemy macierz:

[111111001120000013000000000000].

Ostatnie dwa wiersze nie niosą ze sobą żadnej informacji, więc możemy je pominąć otrzymując w efekcie macierz

[𝟏1111100𝟏1200000𝟏3],

której odpowiada układ równań

{x1+x2+x3+x4+x5=1x3+x4+2x5=0x5=3

Wstawiamy teraz x5=3 do trzeciego równania i wyliczamy w nim x3 otrzymując

{x1+x2+x3+x4+x5=1x3=-x4-6x5=3

Cofamy się teraz do pierwszego równania i wyliczamy x1 po wstawieniu wartości za x3 i x5 otrzymując

{x1=-x2+4x3=-x4-6x5=3

x2 i x3 pełnią tu rolę parametrów. Zbiór rozwiązań jest dany przez

{[-x2+4,x2,-x4-6,x4,3]T:x2,x4}.

Przykładowo, dla x2=x4=0 jednym z rozwiązań jest [4,0,-6,0,3]T. Zbiór rozwiązań jest nieskończony, bo dowolnie wybranym x2 i x4 odpowiada jakieś rozwiązanie.

Przykład 4.2.

Przyglądnijmy się układom 3 równań z 3 niewiadomymi. Dla macierzy A z niezerową pierwszą kolumną postać schodkowa musi być wtedy jednej z postaci:

[𝟏***0𝟏**00𝟏*],[𝟏***0𝟏**000],[𝟏***00𝟏*000],
[𝟏***0𝟏**000],[𝟏***00𝟏*000],[𝟏***000000],[𝟏***0000000]

W pierwszym przypadku układ ma dokładnie jedno rozwiązanie. W przypadku drugim, x1 i x2 możemy uzależnić od x3, które pełni rolę parametru. Zbiór rozwiązań jest nieskończony, bo x3 może być dowolne. W trzecim przypadku, x3 jest jednoznacznie wyznaczone i możemy uzależnić x1 od x2 pełniącego rolę parametru. Ponownie zbiór rozwiązań jest nieskończony. W czwartym, piątym i szóstym przypadku układ jest sprzeczny. W ostatnim układzie zbiorem rozwiązań jest płaszczyzna.

  • U

    Zredukowana postać schodkowa macierzy AMm×n(𝔽) jest wyznaczona jednoznacznie. Uzasadnimy ten fakt stosując indukcję względem n, czyli liczby kolumn macierzy A. Dla n=1 jest to oczywiste. Niech n>1. Rozważmy macierz A otrzymaną z A przez skreślenie ostatniej kolumny. Każdy ciąg operacji elementarnych, który sprowadza A do zredukowanej postaci schodkowej, sprowadza również macierz A do zredukowanej postaci schodkowej. Z założenia indukcyjnego wynika więc, że jeśli B i C są zredukowanymi postaciami schodkowymi macierzy A, to B i C mogą się różnić jedynie ostatnią kolumną. Przypuśćmy, że BC. Z definicji zredukowanej postaci schodkowej wynika, że na przykład n-ta kolumna B jest niezerowa, a n-ta kolumna C jest zerowa. Rozważmy taki wektor x, że Bx=0. Równoważnie Cx=0, bo dozwolone operacje nie zmieniają zbioru rozwiązań. Stąd również (B-C)x=0, czyli xn=0, bo n-1-pierwszych kolumn macierzy B-C jest zerowych, a n-ta jest niezerowa. Prowadzi to do sprzeczności, bo n-ta kolumna macierzy C jest zerowa, więc xn w takim wektorze x, że Cx=0 może być dowolne.

Przykład 4.3.

Znajdziemy wielomian stopnia 3 przechodzący przez punkty

(x1,y1)=(1,3),(x2,y2)=(2,-2),(x3,y3)=(3,-5),(x4,y4)=(4,0).

Szukany wielomian ma postać

w(x)=a0+a1x+a2x2+a3x3.

Jego współczynniki a0,a1,a2,a3 muszą spełniać układ równań

{a0+a1x1+a2x12+a3x13=y1a0+a1x2+a2x22+a3x23=y2a0+a1x3+a2x32+a3x33=y3a0+a1x4+a2x42+a3x43=y4

o macierzy rozszerzonej

[1x1x12x13y11x2x22x23y21x3x32x33y31x4x42x43y4]=[111131248-213927-51416640][10004010030010-500011].

Stąd

a0=4,a1=3,a2=-5,a3=1,

czyli

w(x)=4+3x-5x2+x3.
Rysunek 4.1: Natężenie ruchu w sieci skrzyżowań.
Przykład 4.4.

Rozważmy system skrzyżowań dwóch zbiorów dróg jednokierunkowych pokazany na Rys. 4.1. Liczby przy strzałkach oznaczają godzinną średnią liczbę pojazdów wkraczających i opuszczających skrzyżowanie w godzinach szczytu. Ponieważ liczba pojazdów wjeżdżających na skrzyżowanie jest równa liczbie pojazdów z niego wyjeżdżających, więc otrzymujemy układ równań

{x1+450=x2+610x2+520=x3+480x3+390=x4+600x4+640=x1+310
Przykład 4.5.

Rozwiążemy następujący układ równań nad 3:

{x1+2x2+x3=0x1+x3=2x2+2x3=1

Jest on równoważny z układem

{x1+2x2+x3=03x1+4x2+3x3=2x2+2x3=1

czyli

{x1+2x2+x3=00x1+x2+0x3=2x2+2x3=1

Stąd x2=2, więc 2+2x3=1, czyli x3=1 oraz x1=1.

ELIMINACJA GAUSSA – PODSUMOWANIE Jest to proces sprowadzania macierzy do postaci schodkowej. Możemy używać trzech dozwolonych operacji na wierszach: Permutacja wierszy – Skalowanie wierszy – Dodawanie wiersza do innego wiersza
POSTAĆ SCHODKOWA MACIERZY jeśli wiersz jest niezerowy, to pierwszym wyrazem niezerowym (liderem) jest 1 jeśli wiersz k-ty jest niezerowy, to liczba wiodących wyrazów zerowych w wierszu k+1 jest większa niż w wierszu k-tym, jeśli są wiersze zerowe, to są one poniżej wierszy niezerowych. [𝟏0𝟏000𝟏],[𝟏0𝟏0000],[𝟏***0𝟏**00𝟏*000𝟏]
ZREDUKOWANA POSTAĆ SCHODKOWA MACIERZY macierz ma postać schodkową, pierwszy niezerowy element w wierszu jest jedynym niezerowym elementem w jego kolumnie. [𝟏000𝟏0000𝟏],[𝟏00𝟏0000],[𝟏0000𝟏0000𝟏0000𝟏]
Rząd macierzy: rankA= liczba niezerowych wierszy w postaci schodkowej macierzy A= liczba kolumna zawierających lidera. rank[𝟏0*00𝟏*0000𝟏]=3,rank[𝟏0**0𝟏**0000]=2,rank[𝟏0000𝟏0000𝟏0000𝟏]=4
ZBIÓR ROZWIĄZAŃ Dla k×n-macierzy A oraz bk mamy układ ma dokładnie jedno rozwiązanie rankA=rank[Ab]=n układ jest sprzeczny rankA<rank[Ab] układ ma nieskończenie wiele rozwiązań rankA=rank[Ab]<n

4.2 Kilka ważnych obserwacji

Dla układu równań (4.1) wprowadzamy następujące oznaczenia: macierz

A:=[a11a12a1nak1ak2akn] (4.2)

nazywamy macierzą główną układu, natomiast macierz

[Ab]:=[a11a12a1nb1ak1ak2aknbk],

macierzą rozszerzoną układu. Macierz A ma k wierszy i n kolumn. Przez Mk×n(𝔽) oznaczamy zbiór wszystkich macierzy A postaci (4.2), gdzie wszystkie wyrazy macierzy aij (i=1,k, j=1,,n) są elementami ciała 𝔽.

Kolumny macierzy A oraz prawą stronę układu możemy interpretować jako wektory w 𝔽k:

a1=[a11ak1],a2=[a12ak2],,an=[a1nakn],b=[b1bk].

Będziemy wtedy pisali, że

A=[a1an],[Ab]=[a1anb].

Zauważmy, że wektor x=[x1,,xn]T jest rozwiązaniem układu (4.1) wtedy i tylko wtedy, gdy

x1[a11ak1]++xn[a1nakn]=[b1bk],

czyli

x1a1++xnan=b.

KONWENCJE MACIERZOWE ZAPISU UKŁADU RÓWNAŃ W konwencji wierszy Ax=[-w1--w2--wk-][|x|]=[(w1T|x)(w2T|x)(wkT|x)] W konwencji kolumn Ax=[a1a2an][x1x2xk]=x1a1++xnan.
UKŁAD RÓWNAŃ W ZAPISIE MACIERZOWYM {a11x1++a1nxn=b1ak1x1++aknxn=bk Ax=b [a11a12a1nak1ak2akn][x1x2xk]=[b1b2bk] x1a1++xnan=b b1=(w1T|x),,bk=(wkT|x)

Układ równań (4.1) będziemy zapisywać w skrócie jako Ax=b. Będziemy mówili, że układ Ax=b ma rozwiązanie, jeśli zbiór jego rozwiązań jest niepusty. Powiemy, że ma on jednoznaczne rozwiązanie, jeśli zbiór jego rozwiązań składa się z jednego wektora.

Wniosek 4.1.

Układ równań Ax=b ma rozwiązanie wtedy i tylko wtedy, gdy wektor b jest kombinacją liniową kolumn a1,,an macierzy A.

Rysunek 4.2: Kolumny macierzy A=[a1|a2|a3] leżą w jednej płaszczyźnie V=span{a1,a2,a3}3. Po lewej: bV, więc Ax=b nie ma rozwiązań. Po prawej: bV i układ ma rozwiązanie. Nie jest ono jednoznaczne. Wektor b jest kombinacją liniową kolumn a1, a2, ale jest również kombinacją kolumn a1 i a3 oraz kolumn a2, a3.

Dla wektorów a1,,an𝔽k naturalnym więc jest rozważenie zbioru

Span{a1,,an}={x1a1++xnan:x1,,xn𝔽}

wszystkich możliwych kombinacji liniowych wektorów a1,,an.

Wniosek 4.2.

Układ równań liniowych Ax=b ma rozwiązanie wtedy i tylko wtedy, gdy bSpan{a1,,an}.

Definicja 4.3.

Układ jednorodny

Układ równań (4.1) nazywamy jednorodnym, gdy

b1==bk=0.
Wniosek 4.3.

Jeżeli układ (4.1) jest jednorodny, to x1==xn=0 jest jednym z jego rozwiązań.

Wektor zerowy x=0 jest zawsze jednym z rozwiązań układu jednorodnego Ax=0. Ciekawe jest pytanie o to kiedy układ jednorodny Ax=0 nie ma innych rozwiązań. Kiedy Ax=0 ma jednoznaczne rozwiązanie? Aby tak było musi zachodzić implikacja: jeśli x1a1++xnan=0 dla pewnych xi𝔽, to x1==xn=0. Innymi słowy, jeśli kombinacja liniowa wektorów a1,,an jest wektorem zerowym, to wszystkie jej współczynniki skalarne są równe 0. Oznacza to liniową niezależność wektorów a1,,an.

Wniosek 4.4.

Układ jednorodny Ax=0 ma jednoznaczne rozwiązanie wtedy i tylko wtedy, gdy kolumny a1,,an macierzy A są liniowo niezależne.

Wniosek 4.5.

Układ Ax=b ma co najwyżej jedno rozwiązanie wtedy i tylko wtedy, gdy kolumny a1,,an macierzy A są liniowo niezależne.

Dowód.

Zauważmy, że wektory v=[v1,,vn]T,w=[w1,,wn]T𝔽n są rozwiązaniami układu Ax=b wtedy i tylko wtedy, gdy wektor v-w jest rozwiązaniem układu jednorodnego Ax=0. ∎

4.3 Układy dwóch równań z dwoma niewiadomymi

Zajmiemy się teraz dokładniej układem dwóch równań liniowych (w ciele ) z dwoma niewiadomymi

{a11x1+a12x2=b1a21x1+a22x2=b2 (4.3)

Skojarzone z nim macierze: główna i rozszerzona to odpowiednio

A=[a11a12a21a22],[Ab]=[a11a12b1a21a22b2].

Przyglądnijmy się możliwym przypadkom.

Przypadek 1. Zakładamy, że

A=[0000]

jest macierzą zerową. Układ (4.3) przyjmuje postać

{0=b10=b2

Jeżeli któraś z liczb b1 lub b2 jest różna od zera, to układ jest sprzeczny, czyli jego zbiór rozwiązań jest zbiorem pustym. Jeśli b1=b2=0, to zbiorem rozwiązań jest cała płaszczyzna 2.

Przypadek 2. Zakładamy, że któryś z wierszy macierzy A, powiedzmy drugi jest zerowy (czyli a21=a22=0), a pierwszy jest niezerowy. Układ (4.3) ma wtedy postać

{a11x1+a12x2=b10=b2

Jeśli b20, to układ jest sprzeczny. Dla b2=0 redukuje się on do jednego równania

a11x1+a12x2=b1

opisującego prostą na płaszczyźnie, bo założyliśmy, że a112+a122>0. W tym przypadku zbiorem rozwiązań układu jest więc prosta na płaszczyźnie.

Rysunek 4.3: Dwie proste na płaszczyźnie: albo przecinają się w jednym punkcie albo są równe albo nie mają punktów wspólnych.

Przypadek 3. Zakładamy, że obydwa wiersze macierzy A są niezerowe. Wtedy obydwa równania opisują proste na płaszczyźnie. Szukamy więc punktów wspólnych dwóch prostych l1 i l2 na płaszczyźnie. Zachodzi jedna z trzech możliwości:

  • (i)

    Proste są równe (l1=l2). Wtedy zbiorem rozwiązań jest prosta l1.

  • (ii)

    Proste l1 i l2 są równoległe, ale różne. Wtedy układ jest sprzeczny.

  • (iii)

    Proste l1 i l2 nie są równoległe. Wtedy przecinają się w jednym punkcie. Zbiór rozwiązań układu jest jednoelementowy, czyli układ ma dokładnie jedno rozwiązanie.

Definicja 4.4.

Wyznacznik

Wyznacznik macierzy

A=[a1a2]=[a11a12a21a22]M2×2(𝔽)

definiujemy jako skalar

det(A):=a11a22-a12a21𝔽.
  • U

    Dla niezerowego skalara a𝔽 przez 1a będziemy oznaczać element odwrotny a-1 do a względem mnożenia w ciele 𝔽.

Twierdzenie 4.1 (Wzory Cramera).

Układ równań (4.3) ma dokładnie jedno rozwiązanie wtedy i tylko wtedy, gdy det(A)0. Jest ono wtedy dane wzorami Cramera

x1=det[ba2]det[a1a2],x2=det[a1b]det[a1a2].
Dowód.

Załóżmy, że det(A)=a11a22-a12a210. Wtedy a110 lub a210 tzn. wektor a1 nie może być zerowy. Załóżmy, że a110. Dowód w przypadku a210 jest analogiczny. Z pierwszego równania x1=b1-a12x2a11. Po podstawieniu do drugiego równania otrzymujemy równoważny z (4.3) układ równań

{a11x1+a12x2=b1(a11a22-a12a21)x2=b1a21-b2a11 (4.4)

Jego rozwiązaniem jest jeden punkt

x1=b1a22-b2a12a11a22-a12a21,x2=b1a21-b2a11a11a22-a12a21,

co kończy dowód tej implikacji.

Zakończymy dowód pokazując, że jeżeli det(A)=0, to układ (4.3) jest albo sprzeczny albo jego zbiór rozwiązań jest nieskończony. Zachodzi jedna z dwóch moźliwości

  • (a)

    a1=[0,0]T;

  • (b)

    a1[0,0]T.

W przypadku (a) układ (4.3) przyjmuje postać

{a12x2=b1a22x2=b2

Jest on albo sprzeczny (nie istnieje rozwiązanie x2) albo ma nieskończenie wiele rozwiązań (istnieje rozwiązanie x2 i wtedy x1 jest dowolną liczbą rzeczywistą).

W przypadku (b), jeśli przykładowo gdy a110, to na mocy poprzedniej części dowodu układ (4.3) jest równoważny z układem (4.4), czyli

{a11x1+a12x2=b10=b1a21-b2a11

Jest on albo sprzeczny, gdy b1a21-b2a110 albo ma nieskończenie wiele rozwiązań spełniających a11x1+a12x2=b1, gdy b1a21-b2a11=0. ∎

Twierdzenie 4.2.

Wektory a1,a2F2 są liniowo niezależne wtedy i tylko wtedy, gdy

det[a1a2]0.

Wówczas, dla dowolnego bF2 istnieją jednoznacznie wyznaczone takie skalary x1,x2F, że

x1a1+x2a2=b.
Dowód.

Liniowa niezależność wektorów a1 i a2 jest z definicji równoważna z faktem, że równość x1a1+x2a2=0 implikuje, że x1=x2=0, czyli układ równań

{a11x1+a12x2=0a21x1+a22x2=0

ma dokładnie jedno rozwiązanie x1=x2=0. Ponieważ x1=x2=0 jest pewnym rozwiązaniem tego układu, więc teza wynika z Twierdzenia 4.1.

Wniosek 4.6.

Niech a1,a2,a3F2. Wtedy wektory a1,a2,a3 są liniowo zależne.

Dowód.

Przeprowadzimy dowód niewprost. Przypuśćmy, że wektory a1, a2, a3 są liniowo niezależne. Z definicji liniowej niezależności wynika, że wtedy również wektory a1,a2 są liniowo niezależne. Z Twierdzenia 4.2 istnieją takie skalary x1,x2𝔽, że

x1a1+x2a2=a3,

co prowadzi do sprzeczności z liniową niezależnością wektorów a1, a2, a3, bo

x1a1+x2a2+(-1)a3=0.

  • U

    Podamy pewną geometryczną interpretację wyznacznika na płaszczyźnie 2. Załóżmy, że wektory e1=[1,0]T i u=[u1,u2]T są liniowo niezależne. Wtedy det[e1u]=u20. Zauważmy, że

    • det[e1u]>0 wtedy i tylko wtedy, gdy u2>0 wtedy i tylko wtedy, gdy najkrótszy kąt obrotu od wektora e1 do wektora u jest skierowany przeciwnie do ruchu wskazówek zegara;

    • det[e1u]<0 wtedy i tylko wtedy, gdy u2<0 wtedy i tylko wtedy, gdy najkrótszy kąt obrotu od wektora e1 do wektora u jest skierowany zgodnie z ruchem wskazówek zegara.

PO CO NAM WYZNACZNIK? Dla macierzy A=[a1a2]=[a11a12a21a22] poniższe warunki są równoważne: detA0, kolumny a1, a2 są liniowo niezależne, każdy wektor b2 można jednoznacznie zapisać w postaci kombinacji liniowej b=x1a1+x2a2, dla każdego wektora b2 układ równań Ax=b ma dokładnie jedno rozwiązanie.

Rozdział 5 Baza i wymiar

SŁOWA KLUCZOWE ROZDZIAŁU generowanie liniowa niezależność baza wymiar postać schodkowa podprzestrzeń span{a1,,ak} przestrzeń wektorowa Mm×n(𝔽) podprzestrzeń wektorowa

5.1 Generowanie i liniowa niezależność

Definicja 5.1.

Podprzestrzeń generowana przez wektory

Niech (V,+,) będzie przestrzenią wektorową nad ciałem 𝔽. Kombinacją liniową wektorów v1,,vkV nazywamy dowolny wektor v postaci

v=x1v1++xkvk,x1,,xk𝔽.

Zbiór span{v1,,vk} oznacza zbiór wszystkich wektorów będących kombinacjami liniowymi wektorów v1,,vk, czyli

span{v1,,vk}={x1v1++xkvk:x1,,xk𝔽}.

Nazywamy go podprzestrzenią generowaną przez wektory v1,,vk. Powiemy, że wektory v1,,vk generują przestrzeń wektorową V, jeśli

span{v1,,vk}=V.
Przykład 5.1.

Niech v=[0,1,1]T,u=[1,1,1]T23. Wyznaczymy span{v,u}23. Mamy 4 możliwe kombinacje liniowe:

  • 0u+0v=0,

  • 1u+0v=u,

  • 0u+1v=v,

  • 1u+1v=[0,1,1]T+[1,1,1]T=[1,0,0]T.

Stąd

span{v,u}={0,v,u,[1,0,0]T}.
Definicja 5.2.

Liniowa niezależność wektorów

Wektory v1,,vkV są liniowo niezależne, jeśli dla skalarów x1,,xk𝔽 zachodzi implikacja

x1v1++xkvk=0x1==xk=0.

Oznacza to, że jeśli kombinacja liniowa wektorów v1,,vk jest wektorem zerowym, to wszystkie jej skalarne współczynniki są równe zero.

Przykład 5.2.

Rozważmy przestrzeń wektorową V wszystkich funkcji f:. Pokażemy, że funkcje f=sin(x) i g=cos(x) są liniowo niezależne. Przypuśćmy, że x1f+x2g=0 dla pewnych x1,x2. Oznacza to, że dla dowolnego x mamy

x1sin(x)+x2cosx=0.

Podstawiając w tej równości x=0 otrzymujemy, że x2=0. Wstawiając x=π/2 dostajemy, że x1=0.

Przykład 5.3.

Pokażemy, że wektory

v=[1,1,3]T,u=[2,0,2]T,w=[4,3,0]T53

są liniowo zależne w 53. Zauważmy, że

v+u=[3,1,0]T

oraz

3(v+u)=[4,3,0]T=w,

czyli w jest kombinacją liniową wektorów v,u.

Z drugiej strony, wektory v,u,w3 są liniowo niezależne nad . Rzeczywiście, równość

xv+yu+zw=0,x,y,z

oznacza, że

x+2y+4z=x+3z=3x+2y=0,

więc x=y=z=0.

Definicja 5.3.

Baza przestrzeni wektorowej

Niech V będzie przestrzenią wektorową nad ciałem 𝔽. Wektory v1,,vnV stanowią bazę przestrzeni wektorowej V, jeśli spełnione są warunki:

  • (B1)

    wektory v1,,vn generują przestrzeń V, czyli

    span{v1,,vn}=V,
  • (B2)

    wektory v1,,vnliniowo niezależne.

Warunek (B1) oznacza, że każdy wektor vV można przedstawić jako kombinację liniową wektorów v1,,vn, a warunek (B2) gwarantuje, że takie przedstawienie jest jednoznaczne.

Przykład 5.4.

Wektory

e1=[1,0,,0]T,e2=[0,1,0,,0]T,,en=[0,,0,1]T

stanowią bazę przestrzeni wektorowej 𝔽n. Rzeczywiście, są one liniowo niezależne, bo jeśli

[0,,0]T =x1e1++xnen
=[x1,,xn]T,

to x1==xn=0. Sprawdzimy warunek (B2). Niech v=[x1,,xn]T𝔽n będzie dowolnym wektorem. Wtedy

v =[x1,,xn]T
=[x1,0,,0]T++[0,,0,xn]T
=x1e1++xnen,

czyli vspan{e1,,en}.

Wniosek 5.1.

Wektory v1,,vn stanowią bazę dla V wtedy i tylko wtedy, gdy dla każdego wektora vV istnieją jednoznacznie wyznaczone takie skalary x1,,xkF, że

v=x1v1++xnvn.
Dowód.

Załóżmy najpierw, że v1,,vn tworzą bazę V. Niech vV będzie dowolnym wektorem. Z warunku (B2) wynika, że istnieją takie skalary x1,,xn𝔽, że v=x1v1++xnvn. Musimy pokazać, że są one wyznaczone jednoznacznie. Przypuśćmy więc, że

v=y1v1++ynvn,

gdzie yi𝔽. Wtedy

0 =v-v
=(x1v1++xnvn)-(y1v1++ynvn)
=(x1-y1)v1++(xn-yn)vn.
Ponieważ wektory v1,,vn są liniowo niezależne, więc
x1-y1==xn-yn=0,

co kończy dowód pierwszej implikacji.

Załóżmy teraz, że dla każdego wektora vV istnieją jednoznacznie wyznaczone takie skalary x1,,xk𝔽, że

v=x1v1++xnvn.

Wtedy oczywiście zachodzi warunek (B2). Pokażemy liniową niezależność wektorów v1,,vn. Przypuśćmy, że x1v1++xnvn=0 dla pewnych skalarów x1,,xn𝔽. Ponieważ

0x1++0xn=0=x1v1++xnvn,

więc z założonej jednoznaczności skalarów wynika, że x1==xn=0.

Lemat 5.1.

Niech v1,,vnV. Jeśli vspan{v1,,vn}, to

span{v1,,vn}=span{v1,,vn,v}.
Dowód.

Oczywiście span{v1,,vn}span{v1,,vn,v}. Niech wspan{v1,,vn,v}. Wtedy

w=x1v1++xnvn+xv,

dla pewnych skalarów x1,,xn,x𝔽. Ponieważ vspan{v1,,vn}, więc v=y1v1++ynvn dla pewnych skalarów y1,,yn𝔽. Stąd

w=(x1+xy1)v1++(xn+xyn)vnspan{v1,,vn}.

Lemat 5.2.

Załóżmy, że wektory v1,,vkV są liniowo niezależne. Jeśli vk+1span{v1,,vk}, to

v1,,vk,vk+1

są liniowo niezależne.

Dowód.

Załóżmy, że

x1v1++xkvk+xk+1vk+1=0

dla pewnych skalarów xi𝔽. Zauważmy, że xk+1=0, bo w przeciwnym razie

vk+1=-1xk+1(x1v1++xkvk)span(v1,,vk).

W konsekwencji, również x1==xk=0, bo v1,,vkV są liniowo niezależne. ∎

Twierdzenie 5.1.

Załóżmy, że span{v1,,vk}=V0. Wtedy istnieje

B{v1,,vk}

baza dla V.

Dowód.

Bez straty ogólności, na podstawie Lematu 5.1, możemy założyć, że wektory vi są niezerowe. Jeżeli span{v1}=V, to dowód jest zakończony. Jeśli span{v1}V, to któryś z wektorów v2,,vk nie należy do span{v1}. Powiedzmy, że jest to v2. Wtedy v1,v2 są liniowo niezależne z Lematu 5.2. Możemy ten proces kontynuować rozważając teraz span{v1,v2}. W skończonej liczbie kroków wybierzemy bazę B ze zbioru {v1,,vk}. ∎

Twierdzenie 5.2 (Steinitz).

Załóżmy, że V=span{v1,,vn} dla pewnych wektorów v1,,vnV (n1). Jeśli wektory w1,,wmV są liniowo niezależne, to

  • mn

  • po ewentualnym przenumerowaniu wektorów v1,,vn mamy

    span{w1,,wm,vm+1,,vn}=V.
Dowód.

Zastosujemy indukcję względem k{1,,m}. Niech k=1. Oczywiście n1. Rozważmy wektor w1. Ponieważ span{v1,,vn}=V, więc

w1=x1v1++xnvn

dla pewnych skalarów x1,,xn𝔽. Ponieważ z założenia w10, więc któryś ze skalarów xi jest różny od zera. Przenumerowując wektory vi i skalary xi możemy założyć, że x10. Uzasadnimy, że span{w1,v2,,vn}=V. Ponieważ w1V=span{v1,,vn}, więc z Lematu 5.1 wynika, że

span{v1,,vn}=span{w1,v1,,vn}.

Z drugiej strony x10, więc v1=1x1(w1-x2v2--xnvn)span{w1,v2,,vn}, czyli

span{w1,v2,,vn}=span{w1,v1,v2,,vn}=span{v1,v2,,vn}=V.

Zakładamy teraz, że teza zachodzi dla pewnego 1k<m. Pokażemy, że zachodzi dla k+1. Z założenia indukcyjnego kn oraz

span{w1,,wk,vk+1,,vn}=V.

Istnieją więc takie skalary c1,,cn𝔽, że

wk+1=c1w1++ckwk+ck+1vk+1++cnvn.

Zauważmy, że istnieje takie k<i0n, że ci00, bo w przeciwnym razie wk+1=c1w1++ckwk co jest sprzeczne z ich liniową zależnością. Po ewentualnym przenumerowaniu możemy założyć, że i0=k+1. W szczególności, k+1n. Mamy

vk+1=1ck+1(wk+1-i=1kciwi-i=k+2civi).

Ponieważ vk+1span{w1,,wk+1,vk+2,,vn}, więc

span{w1,,wk+1,vk+2,,vn}=span{w1,,wk+1,vk+1vk+2,,vn}=
span{w1,,wk,vk+1vk+2,,vn}=V.

Twierdzenie 5.3.

Załóżmy, że wektory v1,,vn stanowią bazę przestrzeni wektorowej V. Jeśli wektory w1,,wmV są liniowo niezależne, to mn.

Dowód.

Przypuśćmy, że m>n. Pokażemy, że wektory w1,,wn są bazą V. Prowadzi to do sprzeczności, bo wtedy wn+1 jest kombinacją liniową wektorów w1,,wn, a z założenia wektory w1,,wn,wn+1 są liniowo niezależne.

Rozważmy wektor w1. Ponieważ v1,,vn są bazą V, więc

w1=x1v1++xnvn

dla jednoznacznie wyznaczonych skalarów x1,,xn𝔽. Ponieważ z założenia w10, więc któryś ze skalarów xi jest różny od zera. Przenumerowując wektory vi i skalary xi możemy założyć, że x10. Uzasadnimy, że w1,v2,,vn są bazą dla V. Przypuśćmy, że

λ1w1+λ2v2++λnvn=0,

dla pewnych skalarów λi. Jeśli λ1=0, to również λ2==λn=0 bo wektory v2,,vn są liniowo niezależne. Jeśli λ10, to

w1=-1λ1(λ2v2++λnvn),

co jest sprzeczne z jednoznacznością zapisu w1 w bazie v1,,vn, bo x10.

Pokażemy teraz, że w1,v2,,vn generują V. Ponieważ w1V=span{v1,,vn}, więc z Lematu 5.1 wynika, że

span{v1,,vn}=span{w1,v1,,vn}.

Z drugiej strony v1span{w1,v2,,vn}, więc

span{w1,v2,,vn}=span{w1,v1,v2,,vn}.

Uzasadnimy, że możemy ten proces iterować. Przypuśćmy, że dla pewnego 1k<n wektory

w1,,wk,vk+1,,vn

tworzą bazę V. Istnieją więc jedyne takie skalary c1,,cn𝔽, że

wk+1=c1w1++ckwk+ck+1vk+1++cnvn.

Zauważmy, że istnieje takie k<i0n, że ci00, bo w przeciwnym razie wk+1=c1w1++ckwk co jest sprzeczne z liniową zależnością. Z dokładnością do permutacji możemy założyć, że ck+10 i możemy podmienić wektor vk+1 na wk+1 otrzymując bazę

w1,,wk,wk+1,vk+2,,vn.

Wniosek 5.2.

Załóżmy, że v1,,vn jest bazą V. Wtedy każda baza w V ma n elementów.

Definicja 5.4.

Przestrzeń skończenie wymiarowa

Niech V będzie przestrzenią wektorową nad ciałem 𝔽. Powiemy, że przestrzeń V jest skończenie wymiarowa, jeśli posiada bazę skończoną. Wymiarem przestrzeni skończenie wymiarowej V nazywamy liczbę elementów jej dowolnej bazy i oznaczamy przez dim𝔽V lub dimV. Przyjmujemy z definicji, że dimV=0, gdy V={0}. Jeśli przestrzeń V nie jest skończenie wymiarowa, to mówimy, że jest nieskończenie wymiarowa.

  • U

    Istnienie bazy skończonej v1,,vn w przestrzeni wektorowej V bardzo ułatwia analizę jej własności, bo pozwala ograniczyć się do rozważania kombinacji liniowych x1v1++xnvn skończonej liczby wektorów. Z drugiej strony musimy być świadomi w jaki sposób, jeśli w ogóle, rozważane przez nas pojęcia lub przeprowadzane rozumowania zależą od wyboru bazy w przestrzeni V. Przykładowo definiując wymiar przestrzeni wektorowej musieliśmy uzasadnić, że wszystkie bazy mają tyle samo elementów.

Wniosek 5.3.

dim𝔽𝔽n=n dla nN.

Dowód.

Wektory e1,,en stanowią bazę dla 𝔽n złożoną z n-wektorów. ∎

Przykład 5.5.

W przestrzeni wektorowej V=2 nad 2 istnieje tylko jedna baza, bo w 2={0,1} mamy tylko jeden niezerowy wektor.

Przykład 5.6 (Przestrzeń Cn nad ciałami C i R).

Rozważmy przestrzenie wektorowe (n,+,) oraz (n,+,). Pierwsza jest przestrzenią zespoloną oraz

dim(n,+,)=n.

Bazą dla (2,+,) są przykładowo wektory e1=[1,0]T,e2=[0,1]T2. Druga przestrzeń, (n,+,) jest przestrzenią rzeczywistą oraz

dim(n,+,)=2n.

Bazą dla (2,+,) są na przykład wektory:

e1,e2,[i,0]T,[0,i]T.

Rzeczywiście, dla [a+ib,c+id]T i a,b,c,d mamy

[a+ib,c+id]T=a[1,0]T+c[0,1]T+b[i,0]T+d[0,i]T,

i to przedstawienie jest jednoznaczne.

Przykład 5.7 (Przestrzeń wektorowa macierzy Mk×n(F)).

Wprowadzimy strukturę przestrzeni wektorowej w zbiorze Mk×n(𝔽). W tym celu określimy działania

+:Mk×n(𝔽)×Mk×n(𝔽)Mk×n(𝔽)

oraz

:𝔽×Mk×n(𝔽)Mk×n(𝔽).

Dla A,BMk×n(𝔽) i t𝔽 definiujemy

[a11a1nak1akn]A+[b11b1nbk1bkn]B=[a11+b11a1n+b1nak1+bk1akn+bkn]A+B,
t[a11a12a1nak1ak2akn]=[ta11ta12ta1ntak1tak2takn].

Sprawdzamy łatwo, że trójka (Mk×n(𝔽),+,) jest przestrzenią wektorową nad ciałem 𝔽. Znajdziemy bazę dla przestrzeni (M2×2(𝔽),+,). Zauważmy, że dla dowolnej macierzy AM2×2(𝔽) mamy

[a11a12a21a22]=[a11000]+[0a1200]+[00a210]+[000a22]
=a11[1000]+a12[0100]+a21[0010]+a22[0001].

Ponieważ współczynniki aij są w tym przedstawieniu wyznaczone jednoznacznie przez macierz A, więc macierze

[1000],[0100],[0010],[0001]

są bazą M2×2(𝔽), więc dim𝔽M2×2(𝔽)=4.

Z powyższego wynika, że dimM2×2()=4. Przestrzeń M2×2() możemy również traktować jako przestrzeń wektorową nad . Zastanówmy się jaki jest wymiar dimM2×2(). Każdy ze współczynników macierzy A jest liczbą zespoloną. Macierz A możemy teraz mnożyć tylko przez liczby rzeczywiste. Mamy

A =[a11+ib11a12+ib12a21+ib21a22+ib22]=[a11+ib11000]+[0a12+ib1200]
+[00a21+ib210]+[000a22+ib22]
=a11[1000]+a12[0100]+a21[0010]+a22[0001]
+b11[i000]+b12[0i00]+b21[00i0]+b22[000i].

Wynika stąd, że dimM2×2()=8.

Przykład 5.8.

Pokażemy, że rozważanie przestrzeni wektorowych nad 2 może być użyteczne w rozwiązywaniu problemów kombinatorycznych.

W pewnym mieście mieszka n osób i działa m klubów dyskusyjnych. Każda z nich ma nieparzystą liczbę członków oraz każde dwa kluby mają parzystą liczbę wspólnych członków. Pokażemy, że mn.

Dla i=1,,m, przez vi=[v1i,,vni]T2n oznaczamy wektor przynależności mieszkańców do klubu i. Oznacza to, że vji=1, gdy j-ty mieszkaniec należy do klubu i. W przeciwnym razie vji=0. Wtedy (vi|vi)=j=1(vji)2 jest liczbą członków klubu i. Wiemy, że jest to liczba nieparzysta. W 2 mamy więc, że (vi|vi)=1. Analogicznie dla ij, (vi|vj) jest liczbą osób będących w klubach i oraz j. Z założenia wynika, że (vi|vj)=0 dla ij. Wystarczy pokazać, że v1,,vm są liniowo niezależne w 2n. Przypuśćmy, że dla pewnych c1,,cm2 mamy

c1v1++cmvm=0.

Ponieważ (vi|vj)=δij, więc c1==cm=0.

Lemat 5.3.

Niech V będzie przestrzenią wektorową. Następujące warunki są równoważne

  • (i)

    V jest nieskończenie wymiarowa,

  • (ii)

    istnieje taki nieskończony ciąg wektorów v1,v2,, że dla każdego n wektory v1,,vn są liniowo niezależne.

Dowód.

Załóżmy, że V jest nieskończenie wymiarowa. Niech v1V będzie niezerowym wektorem. Ponieważ span{v1}V, więc istnieje wektor v2Vspan{v1}. Wtedy v1,v2 są liniowo niezależne. Analogicznie, span{v1,v2}V, więc istnieje wektor v3Vspan{v1,v2}. Wtedy v1,v2,v3 są liniowo niezależne. Możemy ten proces kontynuować dla każdego n, co kończy dowód punktu (ii).

Załóżmy, że zachodzi warunek (ii). Gdyby V miała wymiar skończony n1, to wektory v1,,vn+1 byłyby liniowo zależne. ∎

  • U

    Pojęcie bazy w przestrzeni nieskończenie wymiarowej V możemy zdefiniować następująco. Powiemy, że podzbiór AV jest liniowo niezależny, jeżeli dla dla każdego n dowolne różne wektory v1,,vnA są liniowo niezależne. Podzbiór A generuje V, gdy dla każdego wektora vV istnieją takie wektory w1,,wnA oraz skalary x1,,xn𝔽, że v=x1v1++xnvn. Podzbiór BV jest bazą, jeśli B jest liniowo niezależny i generuje V. W oparciu o Lemat Kuratowskiego-Zorna można udowodnić, że w każdej przestrzeni wektorowej istnieje baza. Dokładniej, jeśli AV jest liniowo niezależny, CV generuje V oraz AC, to istnieje taka baza B, że ABC.

Przykład 5.9 (Przestrzeń wektorowa ciągów rzeczywistych).

Rozważmy przestrzeń wektorową

={[x1,x2,]T:xi}

wszystkich ciągów nieskończonych o wyrazach rzeczywistych z naturalnie określonymi działaniami. Sprawdzamy łatwo, że ciąg wektorów

e1=[1,0,0]T,e2=[0,1,0,]T,

tworzy zbiór liniowo niezależny A, więc jest nieskończenie wymiarowa. A nie generuje przestrzeni , bo na przykład ciąg

1=[1,1,1,]T

nie jest skończoną kombinacją liniową wektorów e1,e2,.

Przykład 5.10 (Przestrzeń wektorowa wielomianów).

Niech (P,+,) będzie przestrzenią wektorową wszystkich wielomianów o współczynnikach rzeczywistych. Nie jest to przestrzeń skończonego wymiaru, bo wielomiany

1,x,x2,x3,

są liniowo niezależne.

Niech PnP będzie zbiorem wielomianów stopnia co najwyżej n. Wtedy, Pn jest podprzestrzenią wektorową oraz

dimPn=n+1.

Bazą dla Pn są wielomiany 1,x,x2,,xn.

Jeśli P(n)P jest zbiorem wielomianów stopnia n1, to P nie jest podprzestrzenią wektorową, bo wielomian zerowy nie należy do Pn.

Twierdzenie 5.4.

Niech VVektF i dimFV=nN. Dla wektorów v1,,vnV następujące warunki są równoważne:

  • (1)

    v1,,vn są liniowo niezależne;

  • (2)

    span{v1,,vn}=V;

  • (3)

    v1,,vn stanowią bazę V.

Dowód.

(1) (2). Zakładamy, że v1,vn są liniowo niezależne. Przypuśćmy, że

span{v1,,vn}V.

Istnieje wtedy wektor vVspan{v1,,vn}. Z Lematu 5.2 wynika, że wektory v1,vn,v są liniowo niezależne. Jest to sprzeczne z Twierdzeniem 5.3.

(2) (3) Wynika z Lematu 5.1 i Wniosku 5.2.

(3) (1) Jest konsekwencją definicji bazy. ∎

Wniosek 5.4.

Wektory a1,a2F2 tworzą bazę F2 wtedy i tylko wtedy, gdy

det[a1a2]0.
Wniosek 5.5.

Niech A=[a1an]Mn×n(F). Następujące warunki są równoważne

  • (1)

    układ Ax=0 ma jednoznaczne rozwiązanie zerowe,

  • (2)

    układ Ax=b ma rozwiązanie dla każdego b𝔽n,

  • (3)

    kolumny a1,,an tworzą bazę 𝔽n.

Dowód.

Punkt (1) oznacza, że wektory a1,,an są liniowo niezależne, a punkt (2) mówi, że span{a1,,an}=𝔽n. ∎

Wniosek 5.6.

Załóżmy, że dimV=n, 1k<n i wektory v1,,vk są liniowo niezależne. Wtedy istnieją takie wektory vk+1,,vn, że wektory v1,,vn tworzą bazę V.

Dowód.

Ponieważ k<n, więc v1,,vk nie jest bazą. Istnieje więc wektor

vk+1span{v1,,vk}.

Z Lematu 5.2 wektory v1,,vk,vk+1 są liniowo niezależne. Iterujemy tę procedurę i zakończy się ona po skończonej liczbie kroków. ∎

5.2 Podprzestrzenie wektorowe

Definicja 5.5.

Podprzestrzeń wektorowa

Niech (V,+,) będzie przestrzenią wektorową nad ciałem 𝔽 i niech SV. Powiemy, że S jest podprzestrzenią wektorową przestrzeni V, jeśli zachodzą warunki

  • (P1)

    0S tzn. wektor zerowy należy do S;

  • (P2)

    v+wS dla dowolnych v,wS tzn. dodawanie wektorów nie wyprowadza nas ze zbioru S;

  • (P3)

    tvS dla dowolnych t𝔽 i vV tzn. mnożenie przez skalar nie wyprowadza nas ze zbioru S.

  • U

    Czasami (P1) zastępuje się warunkiem, że S. Te dwie definicje są równoważne. Rzeczywiście, załóżmy, że S i zachodzą warunki (P2) i (P3). Niech vS. Wtedy -vS z warunku (P3) i 0=v+(-v)S z warunku (P2).

Wniosek 5.7.

Jeśli v1,,vkV, to span{v1,,vk} jest podprzestrzenią przestrzeni wektorowej V.

Wniosek 5.8.

Zbiór rozwiązań równania jednorodnego Ax=0 jest podprzestrzenią wektorową przestrzeni Fn dla AMk×n(F).

Przykład 5.11.

Rozważmy płaszczyznę S={[x1,x2,x3]T3:2x1-3x2+x3=0}. Zauważmy, że wtedy x3=3x2-2x1, więc

[x1,x2,x3]T =[x1,x2,3x2-2x1]T
=[x1,0,-2x1]T+[0,x2,3x2]T
=x1[1,0,-2]T+x2[0,1,3]T.

Stąd S=span{[1,0,-2]T,[0,1,3]T}, czyli jest to podprzestrzeń wektorowa w 3.

Przykład 5.12.

Pokażemy, że zbiór S={[a+b,a-b+2c,b,c]T:a,b,c}4 jest podprzestrzenią wektorową w 4. Zauważmy, że

[a+b,a-b+2c,b,c]T =[a,a,0,0]T+[b,-b,b,0]T+[0,2c,0,c]T
=a[1,1,0,0]T+b[1,-1,1,0]T+c[0,2,0,1]T.

Oznacza to, że S=span{[1,1,0,0]T,[1,-1,1,0]T,[0,2,0,1]T}, więc jest to podprzestrzeń wektorowa.

Przykład 5.13.

Okrąg 𝕊12 nie spełnia ani jednego z warunków (P1)-(P3). Nie jest więc podprzestrzenią wektorową.

Przykład 5.14.

Zbiór S={[x1,x2]T2:x1x2=0} spełnia warunki (P1) i (P3), ale nie spełnia (P2). Nie jest więc podprzestrzenią wektorową.

Przykład 5.15.

Zbiór S={[x1,x2]T2:x20} spełnia warunki (P1) i (P2), ale nie spełnia (P3). Nie jest więc podprzestrzenią wektorową.

Przykład 5.16.

Zbiór pusty 2 spełnia warunki (P2) i (P3), ale nie spełnia (P1). Nie jest więc podprzestrzenią wektorową.

Przykład 5.17.

Rozważmy podprzestrzeń V23 daną przez

V={[x1,x2,x3]T23:x1+x2+x3=0}.

W ciele 2 równość x1+x2+x3=0 oznacza, że x1=x2+x3, czyli wektory z V mają postać

[x2+x3,x2,x3]T=x2[1,1,0]T+x3[1,0,1],x2,x32.

Wektory [1,1,0]T,[1,0,1]T23 są liniowo niezależne, więc dimV=2. Sprawdzamy łatwo rozważając wszystkie możliwości wyboru x2 i x3, że

V={[0,0,0]T,[1,0,1]T,[1,1,0]T,[0,1,1]T}.
Przykład 5.18.

Zastanówmy się ile 2-wymiarowych podprzestrzeni ma przestrzeń wektorowa 24? Niech v24 będzie niezerowym wektorem. Wtedy

span{v}={0,v},

więc jeśli v,u są różnymi niezerowymi wektorami, to są one liniowo niezależne w 24. Ponadto,

span{u,v}={0,u,v,u+v}

składa się z 4 różnych wektorów. W przestrzeni 24 mamy 24 wektorów i 24-1 wektorów niezerowych. Par liniowo niezależnych wektorów u,v mamy więc (24-1)(24-2)2. Ponieważ

span{u,v}=span{u,u+v}=span{v,u+v},

więc różnych podprzestrzeni 2 wymiarowych jest (24-1)(24-2)6.

  • 𝗧𝗘𝗦𝗧

    Oceń prawdziwość zdań:

    • Jeśli v1,v2,v3 tworzą bazę 3 i b3 jest niezerowym wektorem, to b+v1,v2,v3 również tworzy bazę 3.

    • Istnieją takie 2-wymiarowe podprzestrzenie wektorowe U i W w 3, że UW={0}.

    • Istnieją takie 2-wymiarowe podprzestrzenie wektorowe U i W w 4, że UW={0}.

    • Jeśli U,W są podprzestrzeniami wektorowymi 2, to UW jest również podprzestrzenią wektorową.

    • Jeśli wektory v1,,vn generują n, to są liniowo niezależne.

    • Jeśli wektory v1,,vn generują przestrzeń wektorową V, to są liniowo niezależne.

    • Jeśli wektory v1,,vn są liniowo zależne, to któryś z nich jest wektorem zerowym.

    • Jeśli wektory v1,,vk są liniowo zależne w n, to k>n.

    • Jeśli span{v1,,vk}=n, to k=n.

    • Jeśli span{u,v}=2, to span{u,v+w}=2 dla dowolnego w2.

    • Przestrzenie Mn×n() i Mn×n() mają ten sam wymiar nad ciałem liczb rzeczywistych .

    • Jeśli span{u,v,w}=2, to któreś dwa wektory spośród u,v,w są liniowo niezależne.

    • Dla dowolnej macierzy AM2×2() macierze I,A,A2,A3,A4 są liniowo zależne w przestrzeni wektorowej M2×2().

    • Dla dowolnej macierzy niezerowej AM2×2() macierze

      I,A,A2,A3,A4

      generują przestrzeń wektorową M2×2().

    • Zbiór wszystkich takich funkcji f:, że f(0)=3f(1) jest przestrzenią wektorową z naturalnymi działaniami.

    • Funkcje x2 i sinx są liniowo niezależne w przestrzeni funkcji f:.

    • Funkcje x2 i sinx generują przestrzeń funkcji f:.

    • Jeśli v3 jest dowolnym wektorem, to

      v={w3:(v|w)=0}

      jest podprzestrzenią wektorową 3.

    • Jeśli u,vn są takie, że (u|v)=0, to u,v są liniowo niezależne.

  • 𝗧𝗘𝗦𝗧

    Oceń które z poniższych podzbiorów przestrzeni wektorowej M2×2() są jej podprzestrzeniami wektorowymi:

    • {AM2×2():det(A)=0},

    • {AM2×2():tr(A)=0},

    • {AM2×2():det(A)0},

    • {AM2×2():tr(A)0},

    • {AM2×2():A=A*},

    • {AM2×2():A=A¯},

    • {AM2×2():A=AT},

    • {AM2×2():A2=0},

    • {AM2×2():a11=0},

    • {AM2×2():a12=a21=0},

    • {AM2×2():tr(A)=tr(A¯)},

    • {AM2×2():AJ=JA}, gdzie J=[0-110],

    • {AM2×2():AB=0}, gdzie BM2×2() jest ustaloną macierzą.

  • 𝗧𝗘𝗦𝗧

    Oceń które z poniższych podzbiorów przestrzeni wektorowej F(,) funkcji F: są jej podprzestrzeniami wektorowymi:

    • C(,)={fF(,):fjest ciągła},

    • B(,)={fF(,):fjest ograniczona},

    • {fF(,):|f(x)|<1dla każdegox},

    • CB(,)={fF(,):fjest ciągła i ograniczona},

    • {fF(,):fjest injekcją},

    • {fF(,):fjest surjekcją},

    • {fF(,):fjest bijekcją},

    • {fF(,):fjest różniczkowalna},

    • C1(,)={fF(,):fma ciągłą pochodną},

    • C2(,)={fF(,):fma ciągłą pochodną rzędu 2},

    • Ck(,)={fF(,):fma ciągłą pochodną rzęduk},

    • C(,)={fF(,):fma ciągłą pochodną dowolnego rzęduk},

    • {fF(,):f(0)=0},

    • {fF(,):f(0)=1},

    • Fo(,)={fF(,):fjest nieparzysta},

    • Fe(,)={fF(,):fjest parzysta}.

NIE ZA DUŻO NIE ZA MAŁO TYLKO W SAM RAZ Niech n=dimV. jeśli w1,,wk są liniowo niezależne, to kn; wtedy w1,,wk da się uzupełnić do bazy, jeśli span{w1,,wk}=V, to kn; wtedy ze zbioru {w1,,wk} da się wybrać bazę. Poniższe warunki są równoważne v1,,vn są bazą V, v1,,vn są liniowo niezależne, span{v1,,vn}=V.

Rozdział 6 Odwzorowania liniowe

SŁOWA KLUCZOWE ROZDZIAŁU odwzorowanie liniowe macierz jako odwzorowanie liniowe rzut prostopadły na prostą symetria względem prostej obrót przestrzeń wektorowa odwzorowań liniowych jądro i obraz mono-epi-izo formuła wymiaru Dwie podstawowe podprzestrzenie: jądro i obraz.
Definicja 6.1.

Odwzorowanie liniowe

Niech V, W będą przestrzeniami wektorowymi nad tym samym ciałem 𝔽. Odwzorowanie L:VW nazywamy odwzorowaniem liniowym, jeśli zachodzą warunki

  • (L1)

    (addytywność)

    L(v1+v2)=L(v1)+L(v2),v1,v2V,
  • (L2)

    (jednorodność)

    L(tv)=tL(v),t𝔽,vV.
Wniosek 6.1.

Jeśli L:VW jest odwzorowaniem liniowym, to L(0)=0.

Dowód.

Teza zachodzi, bo L(0)=L(0+0)=L(0)+L(0), więc L(0)=0. ∎

Przykład 6.1.

Odwzorowanie L:xx+1 nie jest odwzorowaniem liniowym, bo L(0)=10.

Przykład 6.2.

Odwzorowanie L:xx2 nie jest odwzorowaniem liniowym pomimo, że L(0)=0. Nie spełnia ono żadnego z warunków (L1)-(L2). Rzeczywiście, L(x+y)=(x+y)2 oraz L(x)+L(y)=x2+y2 i równość (x+y)2=x2+y2 nie zachodzi dla wszystkich liczb rzeczywistych. Podobnie, L(tx)=t2x2, a tL(x)=tx2.

Przykład 6.3.

Pokażemy, że jeśli L: jest liniowe, to istnieje taka liczba rzeczywista a, że L(x)=ax. Rzeczywiście,

L(x)=L(x1)=xL(1),

więc wystarczy przyjąć, że a=L(1).

ODWZOROWANIE LINIOWE ZADANE MACIERZĄ Rozważmy macierz A=[a1an]Mk×n(𝔽) i wektor x=[x1,,xn]T𝔽n. Definiujemy Ax =[a11a1nak1akn][x1xn] :=[x1a11++xna1nx1ak1++xnakn] =x1a1++xnan𝔽k. Możemy określić odwzorowanie LA:𝔽n𝔽k przez LA(x):=Ax. Jest to odwzorowanie liniowe, bo jak łatwo sprawdzamy A(x+y)=Ax+Ay,A(tx)=tAx.
Przykład 6.4.

Odwzorowanie

L:2[x1,x2]T[3x1-2x2,x1+4x2,x1+x2]T3

jest liniowe, bo L=LA (jest ono zadane macierzą A) dla

A=[3-21411].

Zauważmy, że A=[L(e1)L(e2)].

Przykład 6.5 (Rzut prostopadły na prostą w R2).

Niech u=[u1,u2]T2 będzie niezerowym wektorem. Rozważmy odwzorowanie P:22 dane wzorem

P(v)=(v|u)(u|u)u.

Jest to rzut prostopadły na prostą generowaną przez wektor u. Zauważmy, że

P(e1)=1u12+u22[u12u1u2],P(e2)=1u12+u22[u1u2u22].

Rozważmy macierz

A=1u12+u22[u12u1u2u1u2u22].

Wtedy P(v)=LAv. Zauważmy, że dla wektora jednostkowego u=[cosθ,sinθ]T mamy

A=[cos2θsinθcosθsinθcosθsin2θ]=[cosθsinθ][cosθsinθ]iloczyn macierzy.
Przykład 6.6 (Symetria względem prostej na płaszczyźnie).
Rysunek 6.1: Symetria S względem prostej l. Jeśli P jest rzutem prostopadłym na prostą l, to S(v)+v=2P(v).

Załóżmy, że prosta l tworzy z osią x kąt θ. Znajdziemy macierz MS symetrii S względem prostej l. Wektor u=[cosθ,sinθ]T jest wektorem jednostkowym na prostej l. Niech MP będzie macierzą rzutu prostopadłego P na prostą l. Sprawdzamy łatwo, że

S+I=2P,

czyli S=2P-I. Stąd

MS =2MP-I
=[2cos2θ-12sinθcosθ2sinθcosθ2sin2θ-1]
=[cos2θsin2θsin2θ-cos2θ].
Rysunek 6.2: Obrazy kwadratu jednostkowego pod wpływem macierzy A.
  • 𝗧𝗘𝗦𝗧

    Rysunek 6.2 przedstawia obrazy kwadratu jednostkowego rozpiętego na wektorach bazowych e1,e2 pod wpływem działania macierzy AM2×2(). Dopasować poniższe macierze z odpowiednim obrazkiem:

    • A=[1a01] z 0<a<1,

    • A=[10a1] z 0<a<1,

    • jednokładność: A=[a00a] z 0<a<1,

    • jednokładność: A=[a00a] z 1<a,

    • symetria względem osi x: A=[100-1],

    • obrót: A=[cosθ-sinθsinθcosθ]

    • symetria względem punktu 0: A=[-100-1],

    • symetria względem prostej nachylonej do osi x pod kątem θ: A=[cos2θsin2θsin2θ-cos2θ],

    • A=[a-bba] z a,b>0,

    • rzutowanie na oś x: A=[1000],

    • rzutowanie na oś x: A=[0001],

    Przeanalizować jak zmienia się pole obrazu kwadratu jednostkowego przez A w zależności od wyznacznika macierzy A.

6.1 Przestrzeń wektorowa odwzorowań liniowych

Definicja 6.2.

Przestrzeń wektorowa odwzorowań liniowych

Niech V,WVekt𝔽. Definiujemy zbiór

(V,W)={L:VW:L𝗃𝖾𝗌𝗍𝗅𝗂𝗇𝗂𝗈𝗐𝖾}.

Wprowadzimy w zbiorze (V,W) strukturę przestrzeni wektorowej nad cialem 𝔽. Dla L,G(V,W) oraz t𝔽 definiujemy:

(L+G)(v):=L(v)+G(v),(tL)(v):=tL(v),vV

Tak określona trójka ((V,W),+,) jest przestrzenią wektorową nad ciałem 𝔽.

  • U

    Załóżmy, że v1,,vn jest bazą przestrzeni wektorowej V i L:VW jest odwzorowaniem liniowym. Dla dowolnego vV istnieją jednoznacznie wyznaczone takie skalary x1,,xn, że v=x1v1++xnvn. Wtedy z liniowości L otrzymujemy, że

    L(v) =L(x1v1++xnvn)
    =L(x1v1)++L(xnvn)
    =x1L(v1)++xnL(vn),

    czyli

    L(v)=x1L(v1)++xnL(vn). (6.1)

    Równość (6.1) oznacza, że odwzorowanie L jest jednoznacznie wyznaczone przez swoje wartości L(v1),,L(vn) na dowolnej bazie przestrzeni V. Jest to bardzo przyjemna własność odwzorowań liniowych: wystarczy znać skończoną liczbę wartości, aby znać całe odwzorowanie.

Wniosek 6.2.

Niech v1,,vn będzie bazą przestrzeni wektorowej V. Dla dowolnych wektorów w1,,wnW istnieje dokładnie jedno takie odwzorowanie liniowe L:VW, że

L(v1)=w1,,L(vn)=wn.

W szczególności, jeśli L,GL(V,W) są takie, że

L(v1)=G(v1),,L(vn)=G(vn),

to L=G.

Dowód.

Pokażemy najpierw, że takie odwzorowanie liniowe L istnieje. Wektor vV zapisujemy jednoznacznie w bazie v1,,vn jako kombinację liniową v=x1v1++xnvn. Definiujemy odwzorowanie L:VW przez

L(v)=x1L(v1)++xnL(vn):=x1w1++xnwn.

Tak zdefiniowane L jest oczywiście liniowe. Jeśli, L:VW jest innym odwzorowaniem liniowym spełniającym tezę, to

L(v) =L(x1v1++xnvn)
=L(x1v1)++L(xnvn)
=x1L(v1)++xnL(vn)
=x1w1++xnwn=L(v).

Lemat 6.1.

Jeśli L:VW i G:WZ są odwzorowaniami liniowymi, to GL:VZ jest również liniowe.

Dowód.

Warunek (L1) zachodzi, bo dla v1,v2V mamy

(GL)(v1+v2) =G(L(v1+v2))
=G(L(v1)+L(v2))
=G(L(v1))+G(L(v2))
=(GL)(v1)+(GL)(v2).
Podobnie,
(GL)(tv) =G(L(tv))
=G(tL(v))
=tG(L(v))
=t(GL)(v).

6.2 Jądro i obraz odwzorowania liniowego

Definicja 6.3.

Jądro odwzorowania liniowego

Jądro odwzorowania liniowego L:VW definiujemy jako

kerL:={vV:L(v)=0}=L-1({0}).
Wniosek 6.3.

Jeśli L:VW jest odwzorowaniem liniowym, to kerL jest podprzestrzenią przestrzeni wektorowej V.

Dowód.

Ponieważ L(0)=0, więc 0kerL, czyli zachodzi warunek (P1). Jeśli v,wkerL, to

L(v+w) =L(v)+L(w)
=0+0=0,

więc v+wkerL, czyli spełniony jest warunek (P2). Dla t𝔽 i vkerL, to

L(tv) =tL(v)
=t0=0,

czyli zachodzi warunek (P3). ∎

Przykład 6.7.

Rozważmy płaszczyznę P o równaniu 3x1-x2+2x3=0 w 3. Ponieważ odwzorowanie

L:3[x1,x2,x3]T3x1-x2+2x3

jest liniowe oraz P=kerL, więc P jest podprzestrzenią wektorową w 3.

Definicja 6.4.

Obraz odwzorowania liniowego

Obraz odwzorowania liniowego L:VW to zbiór

imL:=L(V)={L(v):vV}W.
Wniosek 6.4.

Jeśli L:VW jest odwzorowaniem liniowym, to jego obraz L(V) jest podprzestrzenią wektorową w W.

Dowód.

Ponieważ L(0)=0, więc 0L(V). Niech w1,w2L(W). Wtedy istnieją takie v1,v2V, że

L(v1)=w2,L(v2)=w2.

Stąd

w1+w2 =L(v1)+L(v2)
=L(v1+v2),

czyli w1+w2L(V). Jeśli t𝔽 i wL(V), to istnieje taki wektor vV, że L(v)=w. Stąd

tw =tL(v)
=L(tv),

czyli twL(V). ∎

Przykład 6.8.

Zbiór

S={[x1+x2,2x1-3x2,-x1+4x2,x2]T4:x1,x2}

jest podprzestrzenią wektorową w 4, bo jest on obrazem odwzorowania liniowego

L:2[x1,x2]T[x1+x2,2x1-3x2,-x1+4x2,x2]T4.

6.3 Mono-Epi-Izo. Formuła wymiaru

Definicja 6.5.

Monomorfizm-epimorfizm-izomorfizm

Niech L:VW będzie odwzorowaniem liniowy. Mówimy, że

  • (i)

    L jest monomorfizmem, gdy L jest różnowartościowe (injekcją),

  • (ii)

    L jest epimorfizmem, gdy W=L(V), czyli L jest surjekcją,

  • (iii)

    L jest izomorfizmem, gdy L jest bijekcją, czyli jest zarówno monomorfizmem jak i epimorfizmem.

  • U

    Możecie zapytać dlaczego wprowadzamy nowe nazwy monomorfizm, epimorfizm, izomorfizm na znane nam z teorii mnogości pojęcia injekcja, surjekcja, bijekcja. Odpowiedź jest prosta. Robimy to dla wygody. Przykładowo, stwierdzenie L:VW jest monomorfizmem niesie w sobie więcej treści niże samo stwierdzenie, że L jest odwzorowaniem różnowartościowym. Zamiast krótkiego L:VW jest monomorfizmem powinniśmy powiedzieć: L:VW jest odwzorowaniem liniowym przestrzeni wektorowych i jest różnowartościowe. Monomorfizm oznacza więc różnowartościowość, ale jednocześnie liniowość odwzorowania.

    Wiele problemów matematycznych da się sprowadzić do zagadnienia istnienia i jednoznaczności rozwiązań równania

    L(x)=y,

    gdzie L:VW jest odwzorowaniem i yW. Różnowartościowość L oznacza, że przy ustalonym y istnieje co najwyżej jedno rozwiązanie x. Z drugiej strony, surjektywność gwarantuje, że dla dowolnego yW istnieje pewne rozwiązanie xV. Połączenie tych warunków, czyli bijektywność L oznacza, że dla dowolnego yW istnieje dokładnie jeden taki xV, że L(x)=y.

Lemat 6.2.

L:VW jest monomorfizmem wtedy i tylko wtedy, gdy kerL={0}.

Dowód.

Niech L będzie monomorfizmem. Jeśli vkerL, to L(0)=0=L(v), czyli v=0. Oznacza to, że kerL={0}. Załóżmy teraz, że kerL={0}. Jeśli v,wV oraz L(v)=L(w), to z liniowości L mamy

0=L(v)-L(w)=L(v-w),

czyli v-wkerL, więc v-w=0. ∎

Lemat 6.3.

Jeśli L:VW jest monomorfizmem i v1,,vnV są liniowo niezależne, to wektory

L(v1),,L(vn)

są liniowo niezależne.

Dowód.

Załóżmy, że x1L(v1)++xnL(vn)=0 dla pewnych skalarów xi𝔽. Wtedy

0 =L(x1v1++xnvn),
czyli
x1v1++xnvnkerL={0},
więc
x1v1++xnvn=0.

Ponieważ v1,,vnV są liniowo niezależne, więc x1==xn=0. ∎

Lemat 6.4.

Jeśli L:VW jest epimorfizmem i V=span{v1,,vn}, to W=span{L(v1),,L(vn)}.

Dowód.

Niech wW. Ponieważ L jest epimorfizmem, więc istnieje taki wektor vV, że L(v)=w. Z założenia V=span{v1,,vn}, więc v=x1v1++xnvn dla pewnych xi𝔽. Wtedy

w =L(v)
=L(x1v1++xnvn)
=x1L(v1)++xnL(vn),

czyli wspan{L(v1),,L(vn)}. ∎

Wniosek 6.5.

Jeśli L:VW jest izomorfizmem liniowym i v1,,vnV jest bazą V, to L(v1),,L(vn) jest bazą W.

Wniosek 6.6.

Niech L:VW będzie odwzorowaniem liniowym i dimV=n. Następujące warunki są równoważne:

  • (i)

    L:VW jest izomorfizmem,

  • (ii)

    dla każdej bazy v1,,vn w V, wektory L(v1),,L(vn) tworzą bazę w W,

  • (iii)

    istnieje taka baza v1,,vn w V, że wektory L(v1),,L(vn) tworzą bazę w W.

Wniosek 6.7.

Jeśli odwzorowanie L:VW jest liniowe i dimV<, to dimL(V)dimV<.

Dowód.

Zauważmy, że odwzorowanie liniowe

L:VL(V)

jest epimorfizmem, więc jeśli v1,,vn jest bazą dla V, to

L(V)=span{L(v1),,L(vn)}.

  • U

    Jeśli L:VW jest izomorfizmem liniowym, to odwzorowanie odwrotne L-1:WV jest również liniowe. Rzeczywiście, niech w1,w2W. Musimy uzasadnić, że L-1(w1+w2)=L-1(w1)+L-1(w2). Niech v1=L-1(w1) i v2=L-1(w2). Z liniowości L mamy

    w1+w2=L(v1)+L(v2)=L(v1+v2),

    czyli v1+v2=L-1(w1+w2).

    Analogicznie uzasadniamy, że L-1(tw)=tL-1(w). Niech v=L-1(w). Wtedy

    L(tv)=tL(v)=tw,

    czyli tL-1(w)=tv=L-1(tw).

Wniosek 6.8.

Niech L:VV będzie odwzorowaniem liniowym i dimV<. Wtedy następujące warunki są równoważne

  • (1)

    L jest monomorfizmem,

  • (2)

    L jest epimorfizmem,

  • (3)

    L jest izomorfizmem.

Rysunek 6.3: Wybór bazy v1,,vn w V zadaje izomorfizm z 𝔽n. Wektorowi v=c1v1++cnvn przypisujemy wektor [c1,,cn]T jego współrzędnych.
Twierdzenie 6.1.

Niech VVektF. Jeśli dimFV=n<, to V jest izomorficzna z Fn.

Dowód.

Niech v1,,vn będzie bazą dla V, a e1,,en bazą standardową w 𝔽n. Definiujemy odwzorowanie liniowe L:V𝔽n zadając jego wartości na bazie:

L(v1)=e1,,L(vn)=en.

Wniosek 6.9.

Jeśli V,WVektF są skończenie wymiarowe, to V jest izomorficzna z W wtedy i tylko wtedy, gdy dimV=dimW.

Dowód.

Jeśli dimV=dimW=n, to V i W są izomorficzne, gdyż obydwie są izomorficzne z 𝔽n. Z drugiej strony, jeśli V i W są izomorficzne, to mają taki sam wymiar, bo izomorfizm przekształca bijektywnie bazę na bazę. ∎

Twierdzenie 6.2 (Formuła wymiaru).

Załóżmy, że odwzorowanie L:VW jest liniowe i dimV<. Wtedy

dimV=dimkerL+dimImL.

Dowód.

Wybieramy bazę v1,,vp dla kerLV i rozszerzamy ją do bazy

v1,,vp,u1,,uq

dla V. Wtedy

p=dimkerL,p+q=dimV.

Mamy udowodnić, że q=dimL(V). Wystarczy pokazać, że wektory L(u1),,L(uq) tworzą bazę L(V). Pokażemy najpierw, że wektory L(u1),,L(uq) generują L(V). Niech wL(V). Istnieje więc taki wektor

v =c1v1++cpvp+x1u1++xquq,
że L(v)=w. Stąd
w =L(c1v1++cpvp+x1u1++xquq)
=c1L(v1)++cpL(vp)+x1L(u1)++xqL(uq)
=x1L(u1)++xqL(uq),

czyli wspan{L(u1),,L(uq)}.

Pokażemy teraz, że wektory L(u1),,L(uq) są liniowo niezależne. Przypuśćmy, że

0 =x1L(u1)++xqL(uq)
dla pewnych skalarów xi. Musimy pokazać, że
x1==xq=0.
Z liniowości L otrzymujemy, że
0 =L(x1u1++xquq),
czyli x1u1++xquqkerL. Stąd
x1u1++xquq
jest kombinacją liniową wektorów v1,,vp, czyli
x1u1++xquq=c1v1++cpvp
dla pewnych skalarów ci. Wtedy
x1u1++xquq-c1v1--cpvp=0,

więc x1==xq=c1==cp=0, bo v1,,vp,u1,,uq tworzą bazę V.

Przykład 6.9.

Rozważmy odwzorowanie liniowe L:2323 dane przez

L([x1,x2,x3]T)=[x1+x2,x3+x1,x2+x3]T.

Przestrzeń 23 składa się tylko z 8 wektorów, więc możemy wypisać wszystkie wartości L:

L([0,0,0]T)=L([1,1,1]T)=[0,0,0]T,
L([1,1,0]T)=L([0,0,1]T)=[0,1,1]T,
L([1,0,1]T=L([0,1,0]T)=[1,0,1]T,
L([0,1,1]T)=L([1,0,0]T)=[1,1,0]T.

Stąd,

kerL=span{[1,1,1]T}={[0,0,0]T,[1,1,1]T},
imL=span{[1,1,0]T,[1,0,1]T}={[1,1,0]T,[1,0,1]T,[1,1,0]T}.

Rozdział 7 Działania na macierzach

SŁOWA KLUCZOWE ROZDZIAŁU transponowanie macierz symetryczna i antysymetryczna macierz identycznościowa macierz nieosobliwa odwrotność iloczynu transpozycja iloczynu jądro i obraz rząd macierzy formuła wymiaru rząd macierzy transponowanej macierz diagonalna macierz trójkątna ślad macierzy grafy rekurencje liniowe macierze elementarne macierze wierszowo równoważne rozkład LU zmiana bazy macierz przejścia

7.1 Transponowanie

W zbiorze macierzy Mk×n(𝔽) zdefiniowaliśmy dodawanie

+:Mk×n(𝔽)×Mk×n(𝔽)Mk×n(𝔽)

oraz mnożenie macierzy przez skalar

:𝔽×Mk×n(𝔽)Mk×n(𝔽).

Otrzymaliśmy w ten sposób przestrzeń wektorową (Mk×n(𝔽),+,). Przypomnijmy, że przyjęliśmy konwencję

[x1,,xn]T=[x1xn].

Wektor [x1,,xn]T𝔽n możemy interpretować jako macierz o n-wierszach i jednej kolumnie, czyli element Mn×1(𝔽). Z drugiej strony [x1,,xn] jest w naturalny sposób macierzą o jednym wierszu i n-kolumnach, czyli elementem M1×n(𝔽).

Definicja 7.1.

Macierz transponowana

Niech AMn×k(𝔽) będzie macierzą o wierszach a(1),,a(n)M1×k(𝔽). Macierz transponowana ATMk×n(𝔽) jest zdefiniowana jako

AT=[a(1)Ta(n)T].

Oznacza to, że wiersze macierzy A stają się kolumnami macierzy transponowanej AT. Wynika stąd, że jeśli A=[aij] oraz AT=[aijT], to

aijT=aji.

Przykładowo,

[3-2241-3]T=[321-24-3].
MACIERZ TRANSPONOWANA A=[-a(1)--a(2)--a(k)-]Mk×n(𝔽),AT=[a(1)Ta(k)T]Mn×k(𝔽) gdzie a(i)=[ai1,,ain]M1×n(𝔽),a(i)T=[ai1ain]Mn×1(𝔽)
Wniosek 7.1.

Dla macierzy A,BMk×n(F) i tF zachodzą warunki

  • (i)

    (AT)T=A,

  • (ii)

    (tA)T=tAT,

  • (iii)

    (A+B)T=AT+BT.

  • U

    Warunki (ii) i (iii) oznaczają, że transponowanie macierzy

    L:Mk×n(𝔽)AATMn×k(𝔽)

    jest odwzorowaniem liniowym i jest to izomorfizm. Warunek (i) gwarantuje dla k=n, że LL=id.

Definicja 7.2.

Macierz symetryczna i antysymetryczna

Macierz kwadratową AMn×n(𝔽) nazywamy symetryczną, gdy

AT=A.

Powiemy, że A jest skośnie symetryczna (antysymetryczna), gdy

AT=-A.
Wniosek 7.2.

Niech F=C. Dla dowolnej macierzy AMn×n(C) macierz A+AT jest symetryczna, a macierz A-AT jest skośnie symetryczna. W szczególności, każda macierz AMn×n jest sumą macierzy symetrycznej i skośnie symetrycznej:

A=12(A+AT)+12(A-AT).

Podamy teraz geometryczną interpretację rzeczywistej macierzy transponowanej.

Lemat 7.1.

Niech AMn×k(R) oraz BMk×n(R). Następujące warunki są równoważne

  • (i)

    (Ax|y)=(x|By) dla wszystkich xk, yn,

  • (ii)

    B=AT.

Dowód.

Dla x=[x1,,xk]Tk, y=[y1,,yn]Tn mamy

(Ax|y) =i=1kj=1nxiyj(Aei|ej)
=i=1kj=1nxiyj(ai|ej)
=i=1kj=1nxiyjaji
oraz
(x|By) =i=1kj=1nxiyj(ei|Bej)
=i=1kj=1nxiyj(ei|bj)
=i=1kj=1nxiyjbij.

Wynika stąd, że (Ax|y)=(x|By) dla wszystkich xk i yn wtedy i tylko wtedy, gdy bij=aji dla wszystkich i=1,,k oraz j=1,n, czyli gdy B=AT. ∎

Wniosek 7.3.

Dla dowolnej macierzy A=[aij]Mn×n(R) mamy

(Ax|y)=(x|ATy),x,yn.

Ponadto, AMn×n(R) jest symetryczna wtedy i tylko wtedy, gdy

(Ax|y)=(x|Ay),x,yn.

7.2 Iloczyn macierzy

Rozważmy macierze

a=[a11a1k]M1×k(𝔽),b=[b11bk1]Mk×1(𝔽).

Definiujemy iloczyn

(aT|b)=[a11a1k][b11bk1]=a11b11+a12b21++a1kbk1.

Dla macierzy A=[a1ak]Mn×k(𝔽) o wierszach a(1),,a(n)M1×k(F) oraz macierzy (wektora) b=[b1,,bk]TMk×1() przyjmujemy, że

Ab=[(a(1)T|b)(a(n)T|b)]=b1a1++bkakn.
Rysunek 7.1: Macierz mnoży wektor – wersja kolumnowa.
Definicja 7.3.

Iloczyn macierzy

Niech AMk×n(𝔽) i B=[b1bm]Mn×m(𝔽). Definiujemy iloczyn macierzy ABMk×m(𝔽) wzorem

AB:=[Ab1Abm]Mk×m(𝔽).

Z definicji wynika, że jeśli A=[aij]Mk×n(𝔽), B=[bjl]Mn×m(𝔽) i AB=[cil]Mk×m(𝔽), to

cil =(a(i)T|bl)
=ai1b1l++ainbnl
AB =[-w1--w2--wk-][||a1an||]
=[(w1T|a1)(w1T|a2)(w1T|an)(w2T|a1)(w2T|a2)(w2T|an)(wkT|a1)(wkT|a2)(wkT|an)]

Wyraz o numerze ij macierzy AB jest iloczynem skalarnym i-tego wiersza A oraz j-tej kolumny macierzy B.

Rysunek 7.2: Macierz mnoży macierz w wersji kolumnowej.
Przykład 7.1.

Dla macierzy

A=[3-2241-3],B=[-213416]

mamy

AB =[3-2241-3][-213416]
=[3(-2)-2431-2133-262(-2)+4421+4123+461(-2)-3411-3113-36].

Czasami stosuje się poniższą konwencję:

[-213416]B
[3-2241-3]A [-161-312630-14-2-15]AB
Przykład 7.2.

Uzupełnić pozostałe miejsca ?.

[124𝟐𝟔][41𝟒30-1𝟑127𝟓2]=[??????26?]
  • !

    Dla macierzy kwadratowych A,BMn×n() zdefiniowane są obydwa iloczyny AB i BA, ale nie muszą one być równe. Mnożenie macierzy w zbiorze Mn×n() nie jest przemienne dla n2. Przykładowo, dla

    A=[1100],B=[1122],

    mamy

    AB=[1100][1122]=[3300],
    BA=[1122][1100]=[1122].
Lemat 7.2 (Mnożenie macierzy jest łączne).

Załóżmy, że AMm×n(F), BMn×r(F) i CMr×s(F). Wtedy

(AB)C=A(BC)

Dowód.

Z definicji iloczynu macierzy mamy

(AB)C =[ABc1ABcs]
=A[Bc1Bcs]
=A(BC).

Lemat 7.3.

Niech AMk×n(F) i BMn×m(F). Wtedy

LAB=LALB

Dowód.

Wystarczy pokazać, że odwzorowania liniowe LAB oraz LALB:𝔽m𝔽k przyjmują takie same wartości na bazie e1,,em. Mamy

LAB(ei) =ABei=Abi
=LA(bi)=LA(LB(ei))
=(LALB)ei.

Definicja 7.4.

Macierz identycznościowa

Macierz identycznościowa I=In=[δij]Mn×n(𝔽) to macierz o współczynnikach zdefiniowanych symbolem Kroneckera:

δij:={1,gdy i=j,0,gdy ij

Innymi słowy, In=[e1en]. Przykładowo,

I2=[1001],I3=[100010001].
Wniosek 7.4.

Dla dowolnej macierzy AMk×n(F) mamy

IkA=A=AIn.
Definicja 7.5.

Macierz nieosobliwa

Macierz AMn×n(𝔽) jest nieosobliwa (odwracalna) wtedy i tylko wtedy, gdy istnieje taka macierz BMn×n(𝔽), że

BA=AB=In

Macierz B nazywamy wtedy macierzą odwrotną do macierzy A i oznaczamy przez A-1.

  • U

    Jeżeli A jest nieosobliwa, to macierz odwrotna do A jest wyznaczona jednoznacznie. Rzeczywiście, jeśli B i C są odwrotne do A, to

    B=BI=B(AC)=(BA)C=IC=C.
Wniosek 7.5 (Odwrotność iloczynu).

Jeśli A,BMn×n(F) są nieosobliwe, to macierz AB jest nieosobliwa oraz

(AB)-1=B-1A-1.

Dowód.

Sprawdzamy, że

(B-1A-1)(AB) =B-1(A-1A)B
=B-1IB
=B-1B
=I.

Analogicznie pokazujemy, że (AB)(B-1A-1)=I. ∎

Lemat 7.4.

Dla macierzy kwadratowej AMn×n(F) następujące warunki są równoważne:

  • (i)

    A jest nieosobliwa,

  • (ii)

    LA:nxAxn jest izomorfizmem.

Dowód.

Jeśli A jest nieosobliwa, to AA-1=A-1A=I, więc

I=LI=LAA-1=LALA-1,I=LI=LA-1A=LA-1LA,

czyli LA jest izomorfizmem liniowym o odwrotnym LA-1.

Załóżmy, że LA:nn jest izomorfizmem liniowym. Istnieje więc odwzorowanie odwrotne L-1. Definiujemy macierz

B=[L-1e1L-1en].

Wtedy L-1=LB, bo L-1ei=Bei=LB(ei). Ponadto,

I=L-1L=LBLA=LBA,I=LL-1=LALB=LAB,

więc BA=I=AB, czyli A jest nieosobliwa i B=A-1. ∎

Lemat 7.5 (Transpozycja iloczynu).

Dla macierzy A,BMk×n(F) i BMn×k(F) mamy

(AB)T=BTAT.

Dowód.

Porównamy elementy na pozycji il po obu stronach równości. Dla macierzy (AB)T na pozycji il stoi element j=1naljbji. Dla macierz BTAT jest to element j=1nbjialj. ∎

Wprowadzimy jeszcze kilka pojęć związanych z macierzami kwadratowymi.

Definicja 7.6.

Macierz diagonalna

Macierz AMn×n(𝔽) nazywamy diagonalną, jeśli aij=0 dla ij. Będziemy wtedy czasem pisać A=diag(a11,,ann).

Definicja 7.7.

Macierz górnie/dolnie trójkątna

Macierz AMn×n(𝔽) nazywamy górnie trójkątną, gdy aij=0 dla i>j. Analogicznie, A jest dolnie trójkątna, jeśli aij=0 dla i<j.

Przykład 7.3.

Macierz diagonalna, górnie trójkątna i dolnie trójkątna:

[𝐚𝟏𝟏000𝐚𝟐𝟐000𝐚𝟑𝟑]  [𝐚𝟏𝟏𝐚𝟏𝟐𝐚𝟏𝟑0𝐚𝟐𝟐𝐚𝟐𝟑00𝐚𝟑𝟑]  [𝐚𝟏𝟏00𝐚𝟐𝟏𝐚𝟐𝟐0𝐚𝟑𝟏𝐚𝟑𝟐𝐚𝟑𝟑].
  • U

    Macierze górnie trójkątne mają użyteczną charakteryzację geometryczną. Niech e1,,en będzie bazą standardową 𝔽n. Dla i=1,,n rozważamy podprzestrzeń

    Vi=span{e1,,ei}

    generowaną przez pierwszych i wektorów bazowych. Bezpośrednio z definicji, wynika, że macierz A jest górnie trójkątna wtedy i tylko wtedy, gdy dla każdego i=1,,n podprzestrzeń Vi jest niezmiennicza dla A tzn. jeśli vVi, to AvVi. Wynika, to z faktu, że Ae1,,AeiVi dla każdego i dokładnie wtedy, gdy A jest górnie trójkątna.

Wniosek 7.6.

Macierz AMn×n(F) jest diagonalna wtedy i tylko wtedy, gdy A jest dolnie i górnie trójkątna.

Definicja 7.8.

Ślad macierzy

Ślad tr(A) macierzy AMn×n(𝔽) definiujemy jako liczbę

tr(A)=a11++ann

7.3 Rząd i jądro macierzy

Rozważmy macierz AMk×n(𝔽) i skojarzone odwzorowanie liniowe LA(v)=Av dla v𝔽n. Przypomnijmy, że jeśli v=[x1,,xn]T=x1e1++xnen, to

LA(v) =Av
=[a11a12a1nak1ak2akn][x1xn]
=[x1a11++xna1nx1ak1++xnakn]
=x1a1++xnan.

Wynika stąd, że obraz LA(𝔽n) jest generowany przez kolumny macierzy A, czyli

LA(𝔽n)=span{a1,,an}.
Definicja 7.9.

Rząd macierzy

Rząd rankA macierzy A definiujemy jako wymiar obrazu

LA(𝔽n)=span{a1,,an},

czyli rankA jest (maksymalną) liczbą liniowo niezależnych kolumn macierzy A.

Rząd macierzy został wprowadzony w 1878 przez Georga Frobeniusa (1849–1917).

Definicja 7.10.

Jądro macierzy

Jądro kerA macierzy A definiujemy jako jądro odwzorowania LA. Jest to więc zbiór takich wektorów v𝔽n, że Av=0.

Jądro macierzy został wprowadzony w 1884 przez Jamesa Josepha Sylvestera (1814–1887).

Wniosek 7.7 (Formuła wymiaru dla macierzy).

Dla AMk×n(F) mamy

n=dimkerA+rankA.

Wniosek 7.8.

Dla macierzy kwadratowej AMn×n(F) następujące warunki są równoważne

  • (1)

    A jest nieosobliwa,

  • (2)

    kerA={0},

  • (3)

    rankA=n.

W szczególności, macierz AMn×n(F) jest odwracalna wtedy i tylko wtedy, gdy jej kolumny są liniowo niezależne.

Lemat 7.6.

Dla dowolnej macierzy AMk×n(F) maksymalna liczba liniowo niezależnych kolumn macierzy A jest większa bądź równa od maksymalnej liczby liniowo niezależnych wierszy macierzy A. W szczególności,

rankArankAT.
Dowód.

Niech 1rk będzie maksymalną liczbą liniowo niezależnych wierszy macierzy A. Niech v1,,vr będą takimi wierszami A, że wektory v1T,,vrTsą liniowo niezależne. Pokażemy, że Av1T,,AvrT są liniowo niezależne. Przypuśćmy, że

x1Av1T++xrAvrT=0,

dla pewnych skalarów xi𝔽. Wtedy dla v=x1v1T++xrvrT mamy

Av =A(x1v1T++xrvrT)
=x1Av1T++xrAvrT
=0.

Z definicji iloczynu Av oznacza to, że (viT|v)=0 dla i=1,,r. Ponieważ vspan{v1T,,vrT}, więc (v|v)=0. Stąd v=0, czyli x1==xr=0. Oznacza to, że Av1T,,AvrT są liniowo niezależne. Ponieważ należą one do LA(𝔽n), więc z definicji rzędu wynika teza. ∎

Twierdzenie 7.1 (Rząd macierzy transponowanej).

Dla dowolnej macierzy AMk×n(F) zachodzi równość

rankA=rankAT.

Dowód.

Stosujemy Lemat 7.6 do macierzy A i AT. ∎

Wniosek 7.9.

Dla dowolnej macierzy AMk×n(F) maksymalna liczba liniowo niezależnych kolumn jest równa maksymalnej liczbie liniowo niezależnych wierszy.

Przykład 7.4 (Macierze elementarne).

Wprowadzimy teraz pojęcie macierzy elementarnych. Będą to macierze nieosobliwe M, które zastosowane do układu (7.1) skutkują operacjami elementarnymi na wierszach macierzy A. Zrobimy to przykładowo dla k=n=3.

Startujemy z macierzy identycznościowej

I=[100010001].

Macierze elementarne powstają z macierzy I przez zastosowanie do I operacji elementarnych na wierszach macierzy. Będziemy więc mieć do czynienia z trzema typami macierzy elementarnych.

Typ I. Macierze elementarne odpowiadające zamianie miejscami wierszy w macierzy I. Rozważmy przykładowo macierz

E1=[010100001]

powstałą z I przez zamianę pierwszego i drugiego wiersza. Zauważmy, że dla AM3×3() mamy

E1A=[010100001][a11a12a13a21a22a23a31a32a33]=[a21a22a23a11a12a13a31a32a33].
AE1=[a11a12a13a21a22a23a31a32a33][010100001]=[a𝟏𝟐a𝟏𝟏a13a𝟐𝟐a𝟐𝟏a23a𝟑𝟐a𝟑𝟏a33],

czyli iloczyn E1A odpowiada wykonanej operacji na wierszach macierzy I. Iloczyn AE1 permutuje pierwszą i drugą kolumnę.

Typ II. Są to macierze elementarne otrzymane z I przez przemnożenie jej wiersza przez niezerową liczbę rzeczywistą. Przykładowo,

E2=[100010003].

Wtedy

E2A=[10001000𝟑][a11a12a13a21a22a23a31a32a33]=[a11a12a13a21a22a23𝟑a31𝟑a32𝟑a33].
AE2=[a11a12a13a21a22a23a31a32a33][10001000𝟑]=[a12a11𝟑a13a22a21𝟑a23a32a31𝟑a33].

Typ III. Macierze elementarne powstałe z I przez dodanie do pewnego jej wiersza innego wiersza pomnożonego przez liczbę rzeczywistą. Dla przykładu,

E3=[103010001].

Mamy

E3A=[10𝟑010001][a11a12a13a21a22a23a31a32a33]=[a11+𝟑a31a12+𝟑a32a13+𝟑a33a21a22a23a31a32a33].
AE3=[a11a12a13a21a22a23a31a32a33][10𝟑010001]=[a12a11𝟑a11+a13a22a21𝟑a21+a23a32a31𝟑a31+a33].
Wniosek 7.10.

Jeśli E jest macierzą elementarną, to E jest nieosobliwa i E-1 jest macierzą elementarną tego samego typu.

Definicja 7.11.

Macierze wierszowo równoważne

Niech A, BMk×n(𝔽). Powiemy, że A jest wierszowo równoważna z B, jeśli istnieje taki ciąg macierzy elementarnych E1,E2,,Ek, że

B=EkE1A

Jest to relacja równoważności w zbiorze Mk×n(𝔽).

Wniosek 7.11.

Jeśli A, BMk×n(F) są wierszowo równoważne, to rankA=rankB.

Wniosek 7.12.

Macierz AMk×n(F) jest wierszowo równoważna ze swoją postacią schodkową i zredukowaną postacią schodkową otrzymanymi metodą eliminacji Gaussa.

Wniosek 7.13.

Niech AMn×n(R) będzie macierzą kwadratową. Następujące warunki są równoważne:

  • (1)

    A jest nieosobliwa,

  • (2)

    A jest wierszowo równoważna z macierzą identycznościową.

Dowód.

Załóżmy, że zachodzi warunek (1). Wtedy układ Ax=0 ma tylko zerowe rozwiązanie. Stosując metodę eliminacji Gaussa możemy sprowadzić macierz A do postaci schodkowej U. Oczywiście, U jest wierszowo równoważna z A. Jeśli któryś z elementów diagonalnych U jest zerem, to ostatni wiersz macierzy U jest zerowy. Wtedy kerU{0}, więc Ux=0 ma niezerowe rozwiązania. Otrzymujemy sprzeczność, bo Ax=0 i Ux=0 mają takie same zbiory rozwiązań. Macierz U jest więc macierzą górnie trójkątną ze wszystkimi elementami na przekątnej równymi 1. Taka macierz jest oczywiście wierszowo równoważna z macierzą I, bo I jest jej zredukowaną postacią schodkową.

Jeśli zachodzi warunek (2), to istnieje taki ciąg macierzy elementarnych E1,E2,,Ek, że

I=EkE1A.

Stąd A-1=EkE1. ∎

  • U

    W dowodzie powyższym skorzystaliśmy z następującego faktu: jeśli A,BMn×n() są macierzami kwadratowymi i BA=I, to A jest nieosobliwa i A-1=B. Musimy tu być trochę ostrożni. Jak wiemy mnożenie macierzy nie jest przemienne. Potencjalnie mogłoby się więc zdarzyć, że ABI. Pokażemy, że jednak AB=I. Uzasadnimy najpierw, że A jest nieosobliwa. Wystarczy pokazać, że kerA={0}. Jeśli vkerA, to

    v=Iv=BAv=B0=0,

    więc v=0. Istnieje więc macierz odwrotna A-1. Wtedy

    BA=I(BA)A-1=A-1B=B(AA-1)=A-1.
  • U

    Jak wiemy, macierz AMn×n() jest nieosobliwa wtedy i tylko wtedy, gdy A jest wierszowo równoważna z I. Ponadto, A-1=EkE1 dla pewnych macierzy elementarnych. Wynika stąd, że macierz [AI] możemy z pomocą operacji elementarnych sprowadzić do postaci [IA-1]. Pozwala to na wyznaczenie macierzy odwrotnej A-1.

Przykład 7.5.

Znajdziemy macierz odwrotną do macierzy

[143-1-20223]

wykorzystując elementarne operacje na jej wierszach. Tworzymy macierz [AI]. Jeżeli przekształcimy ją w macierz [IB], to wtedy B=A-1. W naszym przypadku

[143100-1-20010223001] [1431000231100-6-3-201]
[143100023110006131]
[14012-32-1202012-12-12006131]
[100-12-121202012-12-12006131]
[100-12-121201014-14-14001161216]

więc

A-1=[-12-121214-14-14161216].
Rysunek 7.3: Przykładowy graf o pięciu wierzchołkach.
Przykład 7.6 (Macierze i grafy).

Teoria grafów pełni bardzo ważną rolę dla zastosowań matematyki. Graf G jest zdefiniowany jako skończony zbiór wierzchołków, czyli pewien n-elementowy zbiór skończony {v1,,vn} oraz zbiór krawędzi, czyli pewien zbiór par wierzchołków. Przykładowo, na Rys. (7.3) przedstawiono graf o pięciu wierzchołkach v1,v2,v3,v4,v5 oraz krawędziach

{v1,v2},{v2,v5},{v3,v4},{v3,v5},{v4,v5}.

Z grafem G o n wierzchołkach możemy skojarzyć pewną macierz A=[aij]Mn×n(), zwaną macierzą połączeń w grafie G. Jest ona zdefiniowana regułą:

aij={1,gdy {vi,vj} jest krawędzią,0,w przeciwnym razie.

Dla grafu z Rys. (7.3) mamy

A=[0100010001000110010101110].

Możemy myśleć o ścieżce w grafie G jako o skończonym ciągu krawędzi od jednego wierzchołka do drugiego. Przykładowo, krawędzie {v1,v2}, {v2,v5} są pewną ścieżką od wierzchołka v1 do v5. Prostym sposobem określenia ścieżki jest jest opisanie ruchu używając wierzchołków. Powyższa ścieżka ma opis

v1v2v5

i ma długość 2. Podobnie,

v5v3v5v3

jest ścieżką długości 3 z v5 do v3.

Niech Ak=[aij(k)]Mn×n. Uzasadnimy, że aij(k) jest liczbą ścieżek długości k z wierzchołka vi do wierzchołka vj. Zastosujemy indukcję względem k. Dla k=1 teza zachodzi z definicji macierzy A. Załóżmy, że teza zachodzi dla pewnej liczby naturalnej m, czyli ail(m) jest liczbą ścieżek długości m z wierzchołka vi do wierzchołka vl. Jeśli istnieje krawędź {vl,vj}, to ail(m)alj=ail(m) jest liczbą ścieżek długości m+1 z vi do vj postaci

v1vlvj.

Ogólna liczba ścieżek długości m+1 z vi do vj jest równa,

ai1(m)a1j++ain(m)anj,

ale ta liczba to aij(m+1) z definicji iloczynu macierzy.

W przypadku grafu z Rys. 7.3 mamy

A3=[0211020114112341132404442].

Przykładowo, liczba ścieżek długości 3 z v3 do v5 jest więc równa a35(3)=4. Zauważmy, że macierz A3 (podobnie jak Ak) jest symetryczna. Odzwierciedla to fakt, że liczba ścieżek długości 3 z vi do vj jest równa liczbie ścieżek długości 3 z vj do vi.

Powyższe rozważania pozostają prawdziwe dla grafów skierowanych w których krawędzie mają kierunek. Oznacza to, że może istnieć krawędź z wierzchołka vi do vj, ale nie koniecznie również z vj do vi. Macierz A nie musi być wtedy symetryczna.

Rysunek 7.4: Graf skierowany opisujący zwycięstwa drużyn w turnieju.
Przykład 7.7.

Pięć reprezentacji siatkarskich: Polska, Brazylia, Stany Zjednoczone, Rosja i Włochy rozgrywają turniej grając mecze każdy z każdym. Chcemy ustalić ranking drużyn w którym liczą się tylko zwycięstwa – nieważne jakim stosunkiem setów. Tworzymy macierz A w której wierszach kodujemy wyniki kolejnych reprezentacji: piszemy 1 jeśli reprezentacja wygrała mecz i 0 jeśli nie wygrała (na przekątnej są zera, bo reprezentacje nie grają ze sobą). Załóżmy, że A ma postać

A=[0101100111100100000100100]

Jest to macierz skojarzona z grafem skierowanym, którego wierzchołkami jest pięć reprezentacji, a krawędzie są zadane zwycięstwami. Przykładowo, z wierzchołka Polska wychodzą krawędzie do wierzchołków Brazylia, Rosja i Włochy. Z kolei, Polska jest końcem krawędzi o początku w wierzchołku Stany Zjednoczone. Przykładowo, pierwszy wiersz oznacza, że Polska wygrała z Brazylią, Rosją i Włochami, a przegrała ze Stanami Zjednoczonymi. Rosja (czwarty wiersz) wygrała tylko z Włochami. Liczbę zwycięstw poszczególnych drużyn otrzymujemy obliczając

[0101100111100100000100100][11111]=[33211].

Oznacza to, że najlepsze w takim rankingu są Polska i Brazylia z trzema zwycięstwami. Następne są Stany Zjednoczone, a ostanie są Rosja i Włochy z jednym zwycięstwem.

Zauważmy, że Polska może argumentować, że jest najlepszą drużyną bo wygrała z Brazylią. Rosja wygrała z Włochami, ale Włochy mogą powiedzieć, że pokonali Stany Zjednoczone, które wygrały z Polską i Rosją. Włochy mają dwa ,,niebezpośrednie’’ zwycięstwa. Spróbujmy więc policzyć zwycięstwa reprezentacji łącznie z ich ,,niebezpośrednimi’’ zwycięstwami. Odpowiada to sumie

[0101100111100100000100100][11111]+[0101100111100100000100100]2[11111]=
[0122310222110220010110110][11111]=[87623].
Rysunek 7.5: Łańcuch Markowa.
Przykład 7.8 (Łańcuchy Markowa).

W badaniach preferencji rynkowych dotyczących dwóch marek pasty do zębów A i B bierze udział 200 osób. Z badań wynika, że każdego miesiąca 70 procent użytkowników marki A używa jej w następnym miesiącu, a 30 procent dokonuje zmiany na markę B. Wśród użytkowników marki B te proporcje są odpowiednio równe 80 i 20 procent. Załóżmy, że na początku było 120 użytkowników marki A i 80 marki B. Zbadamy jak wiele osób będzie używać poszczególnych marek w kolejnych miesiącach. Po miesiącu marki A będzie używać

0.7120+0.280=100

osób, a marki B

0.3120+0.880=100

osób. Rozważmy macierz

A=[0.70.20.30.8].

Wtedy

[0.70.20.30.8][12080]=[100100].

Po n miesiącach liczbę osób otrzymujemy jako wektor

[0.70.20.30.8]n[12080].

Czasami wygodniej zamiast posługiwania się liczbą użytkowników marek 120 i 80 wygodniej jest użyć ich procentowego udziału, czyli zamiast wektora [120,80]T używamy wtedy wektora [0.6,0.4]T. Wtedy

[0.70.20.30.8][0.60.4]=[0.50.5],
[0.70.20.30.8]2[0.60.4]=[0.70.20.30.8][0.50.5]=[0.450.55].
Przykład 7.9 (Macierze Leslie’go).

Pewien gatunek żuka żyje co najwyżej 3 lata. Podzielimy populację jego samic na trzy grupy:

  • młode: wiek 0-1,

  • dojrzałe: wiek 1-2,

  • dorosłe: wiek 2-3.

Młode z prawdopodobieństwem 1/2 staną się dojrzałe, dojrzałe z prawdopodobieństwem 1/4 staną się dorosłymi. Młode nie znoszą jajek, dojrzałe produkują średnio 4 samice, a dorosłe średnio 3 samice. Przypuśćmy, że wśród populacji 100 samic jest 40 młodych, 40 dojrzałych, 20 dorosłych. Spróbujemy przewidzieć populację po 3 latach. Zobaczmy jak populacja będzie wyglądała po roku. Młodych będzie

404+203=220.

Dojrzałych będzie tyle ile młodych, które przetrwały, czyli

400.5=20,

a dorosłych tyle ile dojrzałych które przetrwały, czyli

400.25=10.

Rozważmy macierz

L=[0430.50000.250]

Zauważmy, że

[0430.50000.250][404020]=[2202010]

Możemy ten proces iterować otrzymując po dwóch latach

[0430.50000.250][2202010]=[1101105],

po trzech latach

[0430.50000.250][1101105]=[4555527.5].
  • 𝗧𝗘𝗦𝗧

    Oceń prawdziwość zadań

    • Jeśli macierze A,BM2×2() są nieosobliwe, to macierz A+B jest nieosobliwa i (A+B)-1=A-1+B-1.

    • Dla dowolnych A,BM2×2() zachodzi równość (A-B)2=A2-2AB+B2.

    • Jeśli D1,D2Mn×n() są macierzami diagonalnymi, to D1D2=D2D1.

    • Jeśli AMn×n() i B=3A4-5A3+A2+7A+I, to AB=BA.

    • Jeśli A,BMn×n() są symetryczne, to AB=BA wtedy i tylko wtedy, gdy AB jest symetryczna.

    • Jeśli A=[aij]Mn×n() jest skośnie symetryczna, to a11==ann=0.

    • Iloczyn macierzy górnie trójkątnych jest macierzą górnie trójkątną.

    • Macierz górnie trójkątna jest nieosobliwa wtedy i tylko wtedy, gdy wszystkie jej wyrazy diagonalne aii są niezerowe.

    • Jeśli A,B,C są takimi 2×2-macierzami, że AB=AC, to B=C.

7.4 Układy równań liniowych raz jeszcze

Wniosek 7.14.

Niech A=[a1an]Mk×n(F) i bFk. Następujące warunki są równoważne:

  • (i)

    zbiór rozwiązań układu Ax=b jest niepusty,

  • (ii)

    bspan{a1,,an},

  • (iii)

    rankA=rank[Ab].

Wniosek 7.15.

Niech AMk×n(R). Wektor zerowy 0Fn jest jedynym rozwiązaniem układu jednorodnego Ax=0Fk wtedy i tylko wtedy, gdy wektory a1,,an są liniowo niezależne. Wtedy rank(A)=n oraz kn.

Twierdzenie 7.2.

Niech A=[a1an]Mk×n(F). Następujące warunki są równoważne:

  • (i)

    Dla każdego wektora b𝔽k układ Ax=b ma dokładnie jedno rozwiązanie x𝔽n,

  • (ii)

    k=n i macierz A jest nieosobliwa.

Dowód.

Załóżmy najpierw, że zachodzi warunek (ii). Ustalmy wektor b𝔽k=𝔽n. Mamy pokazać, że istnieje dokładnie jeden taki wektor x𝔽n, że Ax=b. Z warunku (ii) istnieje A-1Mn×n(𝔽). Wtedy dla x=A-1b mamy

Ax=AA-1b=Ib=b,

czyli wektor x=A-1b jest rozwiązaniem układu Ax=b. Takie rozwiązanie jest jedyne, bo jeśli Av=b, to

A-1Av=A-1bv=A-1b.

Niech teraz zachodzi warunek (i). Wystarczy pokazać, że wektory a1,,an są bazą 𝔽k. Zauważmy, że warunek (i) implkuje, że

span{a1,,an}=𝔽k.

Z drugiej strony, stosując (i) do wektora b=0𝔽k otrzymujemy, że wektory a1,,an są liniowo niezależne. Stąd a1,,an tworzą bazę 𝔽k, czyli k=n. ∎

  • U

    Dla A=[a1an]Mk×n(𝔽) i b𝔽k rozważmy ponownie układ

    Ax=b. (7.1)

    Dla macierzy nieosobliwej MMk×k(𝔽) rozważmy układ

    MAx=Mb. (7.2)

    Sprawdzamy łatwo, że układy (7.1) i (7.2) są równoważne tzn. mają równe zbiory rozwiązań. Zamiast więc rozwiązywać układ (7.1) możemy rozwiązać układ (7.2), który przy odpowiednim wyborze macierzy nieosobliwej M może okazać się układem prostszym do analizy.

7.5 Zmiana bazy

Rysunek 7.6: Zmiana bazy. Baza w1=[2,1]T, w2=[1,4]T zadaje nowy układ współrzędnych na płaszczyźnie. Wektor x=[7,7]T ma w bazie standardowej współrzędne x1=7, x2=7, bo w=7e1+7e2. W bazie w1, w2 wektor w ma współrzędne c1=3, c2=1, bo w=3w1+1w2.
7.5.1 Zmiana bazy w 𝔽2

Dla dowolnego wektora x=[x1,x2]T𝔽2 zachodzi równość

x=x1e1+x2e2,

gdzie e1,e2 jest bazą standardową. Skalary x1 i x2 nazywamy współrzędnymi wektora x w bazie standardowej. Możemy to pojęcie uogólnić. Załóżmy, że w1, w2 jest ustaloną bazą 𝔽2. Dla dowolnego wektora w𝔽2 istnieją jednoznacznie wyznaczone takie skalary c1,c2𝔽, że

w=c1w1+c2w2.

Wektor c=[c1,c2]T𝔽2 będziemy nazywali współrzędnymi wektora w w bazie w1, w2.

  • U

    Zwróćcie uwagę, że mówiąc o bazie w1, w2 mamy tu na myśli bazę uporządkowaną tzn. ciąg wektorów (w1,w2). Podając wektor współrzędnych w bazie c=[c1,c2]T istotne jest który wektor bazowy jest pierwszy, a który drugi.

Przykład 7.10.

Rozważmy bazę w1=[2,1]T, w2=[1,4]T w 2. Łatwo sprawdzamy, że dla wektora w=[7,7]T mamy

w=3w1+1w2.

Współrzędne wektora w=[7,7]T w bazie w1,w2 są dane wektorem c=[3,1]T.

Niech w1, w2 będzie dowolną bazą 𝔽2. Zajmiemy się teraz następującymi problemami:

(I) Dla danego wektora x=[x1,x2]T=x1e1+x2e2 (znamy jego współrzędne w bazie standardowej e1, e2) znajdziemy jego współrzędne c=[c1,c2]T w bazie w1, w2. (II) Dla danego wektora c1w1+c2w2 (znamy jego współrzędne w bazie w1, w2) znajdziemy jego współrzędne x=[x1,x2]T w bazie e1, e2.

Zaczniemy od problemu (II) bo jest on łatwiejszy. Załóżmy, że

w1=[a11,a21]T=a11e1+a21e2,w2=[a12,a22]T=a12e1+a22e2.

Znamy więc współrzędne wektorów bazowych w1, w2 w bazie e1, e2. Zauważmy, że

c1w1+c2w2 =(a11c1e1+a21c1e2)+(a12c2e1+a22c2e2)
=(a11c1+a12c2)e1+(a21c1+a22c2)e2.
Wynika stąd, że współrzędne wektora c1w1+c2w2 w bazie standardowej e1, e2 są dane wektorem
x =[a11c1+a12c2,a21c1+a22c2]T
=[a11c1+a12c2a21c1+a22c2]
=[a11a12a21a22][c1c2].

Prowadzi nas to do następującej konkluzji. Jeśli c=[c1,c2]T są współrzędnymi wektora w w bazie w1, w2 oraz x=[x1,x2]T są współrzędnymi wektora w w bazie e1, e2, to

x=Wc,gdzieW=[w1w2]M2×2(𝔽).
Definicja 7.12.

Macierz przejścia do bazy standardowej

Macierz W=[w1w2] nazywamy macierzą przejścia od bazy w1,w2 do bazy standardowej e1,e2.

Możemy teraz łatwo rozwiązać problem (I). Ponieważ macierz W=[w1w2] jest nieosobliwa, więc

c=W-1x.

Przypuśćmy teraz, że mamy dwie dowolne bazy w1,w2 oraz u1,u2 w 𝔽2. Rozważmy wektor

w=c1w1+c2w2=c1*u1+c2*u2.

Znajdziemy związek pomiędzy współrzędnymi c=[c1,c2]T wektora w w bazie w1,w2, a jego współrzędnymi c*=[c1*,c2*]T w bazie u1,u2. Niech [x1,x2]T będą współrzędnymi wektora w w bazie standardowej, czyli w=x1e1+x2e2. Jak wiemy dla macierzy W=[w1w2] oraz U=[u1u2] mamy

Wc=[x1,x2]T=Uc*.

Stąd

c=W-1Uc*,c*=U-1Wc.

Macierz S:=U-1W możemy zinterpretować jeszcze inaczej. Niech S=[s1s2]. Zobaczymy jak wyglądają kolumny s1 i s2 macierzy S. Oczywiście

s1=Se1,s2=Se2.

Dla wektora w=w1 mamy c=e1, bo w1=1w1+0w2, czyli s1=c* są współrzędnymi wektora w1 w bazie u1,u2, więc

w1=s11u1+s21u2.

Analogicznie, w2=s12u1+s22u2, czyli

S=U-1W=[s11s12s21s22].

Nazywamy ją macierzą przejścia od bazy w1,w2 do bazy u1,u2.

7.5.2 Zmiana bazy w 𝔽n
Definicja 7.13.

Współrzędne wektora w bazie

Niech V będzie przestrzenią wektorową wymiaru n (nad ciałem 𝔽) i w1,,wn pewną bazą w V. Dowolny wektor wV możemy jednoznacznie zapisać jako kombinację liniową

w=c1w1++cnwn.

Wektor c=[c1,,cn]T𝔽n nazywamy współrzędnymi wektora w w bazie (uporządkowanej) w1,,wn.

Definicja 7.14.

Macierz przejścia - zmiana bazy

Niech w1,,wn oraz u1,,un będą bazami V. Istnieją jednoznacznie wyznaczone takie skalary sij, że

w1 =s11u1+s21u2++sn1un,
wn =s1nu1+s2nu2++snnun.

Macierz SMn×n(𝔽) daną przez

S=[s1sn]=[s11s12s1ns21s22s2nsn1sn2snn]

nazywamy macierzą przejścia od bazy w1,,wn do bazy u1,,un. Oznacza to, że i-ta kolumna si macierzy S jest wektorem współrzędnych wektora wi w bazie u1,,un.

Lemat 7.7.

Niech c=[c1,,cn]T,c*=[c1*,,cn*]TFn. Równość

c1w1++cnwn=c1*u1++cn*un

zachodzi wtedy i tylko wtedy, gdy c*=Sc.

Dowód.

Zauważmy, że

c1w1++cnwn=(j=1ns1jcj)u1++(j=1nsnjcj)un,

więc teza zachodzi. ∎

Wniosek 7.16.

Macierz przejścia SMn×n(F) jest nieosobliwa.

Dowód.

Wystarczy pokazać, że jedynym rozwiązaniem Sc=0 jest c=0. Jeśli Sc=0, to c*=0, czyli

c1w1++cnwn=0u1++0un=0,

więc c1==cn=0, bo w1,,wn są liniowo niezależne. ∎

Przykład 7.11.

Znajdziemy macierz przejścia od bazy 1, x, x2 dla P2 do bazy 1, 2x, 4x2-2. Wygodnie jest znaleźć najpierw macierz przejścia S od bazy 1, 2x, 4x2-2 do bazy 1, x, x2. Ponieważ

1 =11+0x+0x2
2x =01+2x+0x2
4x2 =-21+0x+4x2

więc

S=[10-2020004].

Macierz przejścia od bazy 1, x, x2 dla P2 do bazy 1, 2x, 4x2-2 jest równa

S-1=[101/201/20001/4].
ZMIANA BAZY: OD DOWOLNEJ DO STANDARDOWEJ Niech v1,,vn będzie bazą 𝔽n. S=[v1vn] jest nieosobliwa. Jeśli v=x1e1++xnen=c1v1++cnvn, to S[c1,,cn]T=[x1,,xn]T,[c1,,cn]T=S-1[x1,,xn]T.
ZMIANA BAZY. PODSUMOWANIE Niech v1,,vn oraz w1,,wn będą bazami 𝔽n. vi=s1iw1++sniwn,i=1,,n. Macierz S=[s1sn],si=[s1i,,sni]T jest nieosobliwa. Jeśli v=x1w1++xnwn=c1v1++cnvn, to S[c1,,cn]T=[x1,,xn]T.
  • 𝗧𝗘𝗦𝗧

    Oceń które ze zdań jest prawdziwe:

    • Transpozycja macierzy górnie trójkątnej jest macierzą górnie trójkątną.

    • Odwrotność nieosobliwej macierzy górnie trójkątnej jest macierzą dolnie trójkątną.

    • Macierz górnie trójkątna i symetryczna jest diagonalna.

    • Jeśli A+B jest górnie trójkątna, to A i B są górnie trójkątne.

    • Jeśli A2 jest symetryczna, to A jest symetryczna.

    • Jeśli A jest nieosobliwa, to ATA i AAT są nieosobliwe.

    • Jeśli A, BMn×n(𝔽) są nieosobliwe, to AB jest nieosobliwa.

    • Jeśli A, BMn×n(𝔽) są nieosobliwe, to A+B jest nieosobliwa.

    • Dla dowolnych n×n macierzy kwadratowych zachodzi A2-B2=(A-B)(A+B).

    • Dla dowolnej macierzy kwadratowej I-A2=(I-A)(I+A).

    • Istnieją takie macierze nieosobliwe, że (AB)-1=A-1B-1.

    • Istnieje taka macierz AM2×2(), że kerA=imA.

    • Istnieje taka macierz AM3×3(), że kerA=imA.

Rozdział 8 Reprezentacja macierzowa

SŁOWA KLUCZOWE ROZDZIAŁU macierz odwzorowania liniowego macierze podobne ślad iloczynu ślad macierzy podobnych Reprezentacja odwzorowania liniowego.

8.1 Macierz odwzorowania liniowego

Lemat 8.1.

Niech L:FnFm będzie odwzorowaniem liniowym. Istnieje taka macierz AMm×n(F), że

L(v)=Av,v𝔽n.

Ponadto,

A=[L(e1)L(en)].
Dowód.

Definiujemy wektory

ai=L(ei),i=1,,n

oraz macierz A:=[a1an]. Niech v=x1e1++xnen będzie dowolnym wektorem w 𝔽n. Wtedy

L(v) =x1L(e1)++xnL(en)
=x1a1++xnan
=Av.

Definicja 8.1.

Macierz standardowa odwzorowania liniowego

Niech L:𝔽n𝔽m będzie odwzorowaniem liniowym. Macierz

A=[L(e1)L(en)]

nazywamy macierzą odwzorowania liniowego L w bazach standardowych lub macierzą standardową L.

Przykład 8.1.

Niech L:32 będzie odwzorowaniem liniowym danym przez

L([x1,x2,x3]T)=[x1-x2+x3,2x2+3x3]T.

Wtedy

L([1,0,0]T)=[1,0]T,L([0,1,0]T)=[-1,2]T,L([0,0,1]T)=[1,3]T,

czyli macierz standardowa odwzorowania L jest równa

A=[1-11023].
  • U

    Załóżmy, że L:nm, G:mk. Niech AMm×n() będzie standardową reprezentacją macierzową dla L, a BMk×m() dla G. Wtedy BAMk×n() jest reprezentacją macierzową dla GL:nk. Rzeczywiście niech CMk×n() będzie macierzową reprezentacją odwzorowania GL:nk. Z definicji, C=[c1cn], gdzie ci=(GL)(ei) dla i=1,,n. Zauważmy, że

    ci =(GL)(ei)
    =G(L(ei))=G(ai)
    =G(a1ie1++amiem)
    =a1iG(e1)++amiG(em)
    =a1ib1++amibm=Bai,

    czyli ci jest i-tą kolumną macierzy BA.

Uogólnimy powyższą konstrukcję macierzy skojarzonej z odwzorowaniem liniowym. Niech V będzie przestrzenią wektorową wymiaru n i niech W będzie przestrzenią wektorową wymiaru m. Ustalmy bazę

v1,,vn

dla przestrzeni V oraz bazę

w1,,wm

dla przestrzeni W. Dla wektora

v=x1v1++xnvn

wektor

x=[x1,,xn]T𝔽n

zadaje współrzędne wektora v w bazie v1,,vn. Pokażemy, że istnieje (jedyna) taka macierz AMm×n(𝔽), że

Ax=y

wtedy i tylko wtedy, gdy

L(v)=y1w1+y2w2++ynwm

dla każdego vV, czyli y jest wektorem współrzędnych L(v) w bazie w1,,wm.

Istnieją wyznaczone jednoznacznie takie skalary aij, że

L(vj)=a1jw1+a2jw2++amjwm,1jn.

Wektor

aj=[a1j,a2j,,amj]T𝔽m,j=1,,n

zadaje współrzędne wektora L(vj) w bazie w1,,wm dla W.

Definicja 8.2.

Macierz odwzorowania liniowego

Macierz A=[a1an]Mm×n(𝔽) nazywamy macierzą odwzorowania liniowego L:VW w bazach v1,,vn dla V oraz w1,,wm dla W, jeśli

aj=[a1j,a2j,,amj]T𝔽m,

gdzie

L(vj)=a1jw1+a2jw2++amjwm,1jn.
Wniosek 8.1.

Niech x=[x1,,xn]TFn, y=[y1,,ym]TFm. Następujące warunki są równoważne:

  • (1)

    v=x1v1++xnvn i L(v)=y1w1++ymwm,

  • (2)

    Ax=y.

Dowód.

Wystarczy zauważyć, że

L(v) =L(x1v1++xnvn)
=j=1nxjL(vj)
=j=1nxj(i=1maijwi)
=i=1m(j=1naijxj)wi.

Wniosek 8.2.

Załóżmy, że v1,,vn jest bazą V i L:VV jest odwzorowaniem liniowym. Niech AMn×n(F) będzie macierzą odwzorowania L w bazie v1,,vn. Następujące warunki są równoważne

  • (1)

    v=x1v1++xnvn i L(v)=y1v1++xnvn,

  • (2)

    Ax=y.

Oznacza to, że macierz A przekształca współrzędne wektora v w bazie v1,,vn na współrzędne wektora L(v) w tej bazie.

  • U

    Zauważmy, że jeżeli v1,,vn oraz w1,wn są bazami przestrzeni V, to macierz przejścia S od bazy v1,,vn do bazy w1,wn jest macierzą odwzorowania identycznościowego na V w tych bazach.

  • U

    Popatrzmy na konstrukcję macierzy odwzorowania liniowego jeszcze trochę inaczej. Niech v1,,vn będzie bazą dla V oraz w1,,wm bazą dla W. Rozważmy izomorfizmy

    R:Vx1v1++xnvn[x1,,xn]Tn,
    S:Wy1v1++ymvm[y1,,ym]Tm,

    czyli przykładowo R(v) jest wektorem współrzędnych v w bazie v1,,vn.

    Dla odwzorowania liniowego L:VW możemy rozważyć odwzorowanie liniowe

    SLR-1:nm.

    Zobaczmy jak wygląda jego macierz w bazach standardowych. Mamy

    (SLR-1)(ei) =(SL)(vi)
    =S(L(vi)),

    czyli i-ta kolumna tej macierzy to współrzędne wektora L(vi) w bazie w1,,wn.

Przykład 8.2.

Niech P1 będzie przestrzenią wielomianów stopnia co najwyżej 1. Rozważmy odwzorowanie liniowe

L:P1a+bx(a+b)xP1.

Znajdziemy jego macierz A w bazie 1-x,1+x. Ponieważ

L(1-x)=0=0(1-x)+0(1+x),
L(1+x)=2x=(-1)(1-x)+1(1+x),

więc

A=[0-101].
Lemat 8.2.

Niech L:FnFm będzie odwzorowaniem liniowym. Jeśli

A=[a1an]

jest macierzą L w bazach u1,,un dla Fn i b1,,bm dla Fm, to

aj=B-1L(uj),j=1,,n

gdzie B=[b1bm].

Dowód.

Z definicji

L(uj)=a1jb1++amjbm=Baj.

Wniosek 8.3.

Niech L:RnRm będzie odwzorowaniem liniowym. Jeśli

A=[a1an]

jest macierzą L w bazach u1,,un dla Rn i b1,,bm dla Rm oraz B=[b1bm], to macierze [BL(u1)L(un)] i [IA] są wierszowo równoważne.

Dowód.

Macierze

[BL(u1)L(un)],B-1[BL(u1)L(un)]

są wierszowo równoważne. Teza zachodzi, bo

B-1[BL(u1)L(un)] =[IB-1L(u1)B-1L(un)]
=[IA].

Przykład 8.3.

Rozważmy odwzorowanie liniowe L:23 dane wzorem

L[x1,x2]T=[x2,x1+x2,x1-x2]T.

Znajdziemy jego reprezentację macierzową A w bazach u1=[1,2]T, u2=[3,1]T oraz

b1=[1,0,0]T,b2=[1,1,0]T,b3=[1,1,1]T.

Ponieważ L(u1)=[2,3,-1]T i L(u2)=[1,4,2]T, więc rozważamy macierz

[1112101134001-12].

Sprowadzamy ją łatwo (poprzez dozwolone operacje na wierszach) do postaci

[100-1-301042001-12].

czyli

A=[-1-342-12].

8.2 Macierze podobne

Rozważmy odwzorowanie liniowe L:𝔽2𝔽2. Reprezentacja macierzowa A dla L w bazie standardowej e1,e2 (w dziedzinie i przeciwdziedzinie) ma postać

A=[a1a2],a1=L(e1),a2=L(e2).

Rozważmy teraz inną bazę u1,u2 w 2. Znajdziemy reprezentację B odwzorowania L w tej bazie. W tym celu musimy znaleźć współrzędne wektorów L(u1) i L(u2) w bazie u1, u2, bo z definicji bij są zadane przez równości

L(u1)=b11u1+b21u2,L(u2)=b12u1+b22u2.

Współrzędne wektora L(u1) w bazie standardowej e1,e2 są równe

L(u1)=Au1.

Jak już wiemy jego współrzędne w bazie u1,u2 są dane przez

U-1Au1,U=[u1u2].

Analogicznie współrzędne wektora L(u2)=Au2 w bazie u1,u2 są równe U-1Au2. Z definicji reprezentacji macierzowej mamy

B=[U-1Au1U-1Au2].

Z kolei [U-1Au1U-1Au2]=U-1AU z definicji mnożenia macierzy, więc

B=U-1AU.
Twierdzenie 8.1 (Reprezentacja macierzowa w różnych bazach).

Załóżmy, że V jest przestrzenią wektorową wymiaru n oraz v1,,vn i w1,,wn są bazami V. Niech

  • L:VV będzie odwzorowaniem liniowym,

  • S będzie macierzą przejścia od bazy w1,,wn do bazy v1,,vn,

  • AMn×n(𝔽) będzie reprezentacją L w bazie v1,,vn,

  • BMn×n(𝔽) będzie reprezentacją L w bazie w1,,wn.

Wtedy

B=S-1AS.

Dowód.

Dla wektora x=[x1,,xn]T𝔽n rozważmy wektor

v=x1w1++xnwnV.

Z definicji macierzy przejścia S dla wektora y=Sxn mamy

v=y1v1++ynvn.

Ponadto, Ay zadaje współrzędne L(v) w bazie v1,,vn oraz Bx zadaje współrzędne L(v) w bazie w1,,wn. Stąd

S-1Ay=Bx,

czyli S-1ASx=Bx dla każdego x𝔽n, więc S-1AS=B.

Definicja 8.3.

Macierze podobne

Niech A,BMn×n(𝔽). Mówimy, że B jest podobna do A, jeśli istnieje taka macierz nieosobliwa SMn×n(𝔽), że

B=S-1AS.

Podobieństwo macierzy jest relacją równoważności w Mn×n(𝔽).

Wniosek 8.4 (Ślad iloczynu macierzy).

Dla dowolnych macierzy AMn×k(F) i BMk×n(F) mamy

tr(AB)=tr(BA).

W szczególności,

tr(A)=tr(S-1AS)

dla dowolnej macierzy nieosobliwej SMn×n(F) i AMn×n(F).

Dowód.

Ślad macierzy kwadratowej jest sumą wyrazów na głównej przekątnej. Z definicji iloczynu macierzy mamy

tr(AB) =j=1n(AB)jj=j=1n(a(j)T|bj)
=j=1n(i=1kajibij)
=j=1ni=1kajibij=i=1k(j=1nbijaji)
=i=1k(b(i)T|ai)=i=1k(BA)ii
=tr(BA).

Jeśli B=S-1AS, to

trB =tr(S-1A)S
=trS(S-1A)
=trA.

Pozwala to nam zdefiniować ślad odwzorowania liniowego L:VV przestrzeni skończenie wymiarowej V jako ślad macierzy A odwzorowania L w dowolnej bazie dla V.

  • U

    Przypuśćmy, że L:Mn×n(𝔽)𝔽 jest takim odwzorowaniem liniowym, że

    L(AB)=L(BA),A,B𝔽.

    Pokażemy, że istnieje taka λ𝔽, że

    L(A)=λtrA,AMn×n(𝔽).

    Niech Eji (i,j{1,,n}) będzie bazą standardową Mn×n(𝔽), czyli na przecięciu j-tego wiersza oraz i-tej kolumny jest 1, a pozostałe wyrazy są równe 0. Zauważmy, że

    ElkEji=δkjEli,i,j,k,l{1,,n}.

    Stąd dla ij mamy

    L(Eji) =L(EjjEji)
    =L(EjiEjj)
    =L(0)
    =0

    oraz

    L(Eii) =L(Ei1E1i)
    =L(E1iEi1)
    =L(E11).

    Dla λ=L(E11) mamy więc

    L(Eji)=δjiλ,i,j{1,,n}.

    Ponieważ dla A=[aji] mamy A=i,j=1najiEji, więc

    L(A) =i,j=1najiL(Eji)
    =i,j=1najiδjiλ
    =i=1naiiλ
    =λtrA.

Dowód poniższego twierdzenia jest bardzo podobny do dowodu Twierdzenia 8.1.

Twierdzenie 8.2.

Załóżmy, że

  • u1,,up i u1,,up są bazami przestrzeni wektorowej U,

  • v1,,vq i v1,,vq są bazami przestrzeni wektorowej V,

  • L:UV jest odwzorowaniem liniowym,

  • A jest macierzą L w bazach u1,,up i v1,,vq,

  • A jest macierzą L w bazach u1,,up i v1,,vq,

  • P jest macierzą przejścia od bazy u1,,up do bazy u1,,up,

  • Q jest macierzą przejścia od bazy v1,,vq do bazy v1,,vq.

Wtedy

A=Q-1AP.
  • 𝗧𝗘𝗦𝗧

    Oceń prawdziwość zdań:

    • Jeśli A i B są reprezentacjami odwzorowań liniowych L,G:nn w bazie standardowej, to istnieje taka macierz nieosobliwa S, że S-1AS=B.

    • Reprezentacją macierzową odwzorowania identycznościowego jest w dowolnej bazie macierz identycznościowa.

    • Odwzorowanie L:2[x,y]T[y,x+y]T2, to L ma w pewnej bazie reprezentację

      [1212].
    • Jeśli L:nn jest izomorfizmem i A jest jego reprezentacją w pewnej bazie, to A jest nieosobliwa.

8.3 Pouczający przykład

Zobrazujemy wprowadzone pojęcia na przykładzie przestrzeni i pewnej jej podprzestrzeni. Przypomnijmy, że

={(x1,x2,x3,):xi},

jest przestrzenią wektorową wszystkich ciągów o wyrazach rzeczywistych z działaniami

(x1,x2,x3,)+(y1,y2,y3,)=(x1+y1,x2+y2,x3+y3,),
t(x1,x2,x3,)=(tx1,tx2,tx3,).

Dla liczby naturalnej n1 definiujemy

n={(x1,x2,x3,):i>nxi=0}.

Są to podprzestrzenie wektorowe przestrzeni oraz

123

Odwzorowanie liniowe

Ln:n(x1,,xn,0,0,)[x1,,xn]Tn

jest izomorfizmem. W szczególności, dimn=n, czyli przestrzeń zawiera podprzestrzeń wymiaru n dla dowolnej liczby naturalnej.

Zbiór

0:=n=1n

jest również podprzestrzenią wektorową przestrzeni . Składa się ona z wszystkich ciągów, które mają tylko skończenie wiele niezerowych wyrazów. Naturalnie zdefiniowany nieskończony zbiór wektorów

e1,e2,e3,,en,0

składa się z wektorów liniowo niezależnych. Jest on bazą dla 0, ale nie jest bazą dla . Przestrzeń nie ma przeliczalnej bazy.

Dla niezerowej liczby rzeczywistej a{0} definiujemy ciąg xa przez

xa=(a,a2,a3,).

Uzasadnimy, że każdy skończony podzbiór zbioru (równolicznego z )

{xa:a{0}}

jest zbiorem wektorów liniowo niezależnych.

Rozważmy odwzorowanie liniowe (przesunięcie) σ: zdefiniowane wzorem

σ((x1,x2,x3,))=(x2,x3,x4,).

Zauważmy, że

σ(xa)=axa.

Niech a1,,an{0} będą różnymi liczbami rzeczywistymi. Pokażemy, że wektory xa1,,xan są liniowo niezależne. Przypuśćmy, że maksymalna liczba wektorów liniowo niezależnych spośród nich jest równa 1r<n. Możemy założyć, że xa1,,xar są liniowo niezależne. Z określenia r wynika, że xa1,,xar,xar+1 są liniowo zależne, czyli

xar+1=t1xa1++trxar

dla pewnych t1,,tr. Stąd

ar+1xar+1=σ(xar+1)=t1a1xa1++trarxar,

więc

0=t1(a1-ar+1)xa1++tr(ar-ar+1)xar.

Ponieważ xa1,,xar są liniowo niezależne oraz aiar+1, więc t1==tr=0. Prowadzi to do sprzeczności, bo xar+10.

Przyglądnijmy się jeszcze odwzorowaniu σ.

Rozważmy odwzorowanie liniowe σ0: zdefiniowane wzorem

σ0((x1,x2,x3,))=(0,x1,x2,x3,x4,).

Zauważmy, że

σσ0((x1,x2,x3,))=((x1,x2,x3,)),

czyli

σσ0=id.

W szczególności, σ jest epimorfizmem i σ0 jest monomorfizmem. Żadne z nich nie jest izomorfizmem. Jądro kerσ jest 1-wymiarowe, bo

kerσ=1.

Z drugiej strony, σ0 nie jest epimorfizmem, bo

1imσ0.

Zbadamy teraz jeszcze jedną podprzestrzeń wektorową przestrzeni . Powiemy, że ciąg

x=(x1,x2,x3,)

jest typu Fibonacciego, gdy

xn+1=xn-1+xn,n2.

Przypomnijmy, że klasyczny ciąg Fibonacciego

F=(F1,F2,F3,)=(0,1,1,2,3,5,8,13,)

otrzymujemy przyjmując x1=0 i x2=1.

Niech będzie zbiorem wszystkich ciągów typu Fibonacciego. Jest to podprzestrzeń wektorowa przestrzeni . Pokażemy, że jest ona izomorficzna z 2. Szukanym izomorfizmem jest odwzorowanie L:2 dane przez

L((x1,x2,x3,))=[x1,x2]T2.

Odwzorowanie odwrotne przypisuje wektorowi [x1,x2]T2 ciąg Fibonacciego o dwóch pierwszych wyrazach x1,x2.

Bazie standardowej e1=[1,0]T, e2=[0,1]T2 odpowiada przez izomorfizm L baza złożona z ciągów

F=(1,0,1,1,2,3,),F=(0,1,1,2,3,).

Ponadto, dla ciągu (x1,x2,x3,) mamy

(x1,x2,x3,)=x1F+x2F.

Zauważmy, że

σ(F)=F,F=σ(F)-F,

czyli

(x1,x2,x3,)=x1(σ(F)-F)+x2F

dla dowolnego ciągu x=(x1,x2,x3,). Rozważmy ciąg xk=σk(F) dla k1. Z definicji odwzorowania przesunięcia wynika, że n-ty wyraz ciągu xk jest równy

xnk=(σk(F))n=Fn+k.

Ponieważ

x1k=Fk+1,x2k=Fk+2,

więc

σk(F)=Fk+1(σ(F)-F)+Fk+2F,

czyli otrzymujemy równość

Fn+k=Fk+1(Fn+1-Fn)+Fk+2Fn.

Zastanówmy się teraz, czy w przestrzeni leży jakiś ciąg geometryczny (1,q,q2,q3,)? Sprawdzamy, że musi zachodzić warunek q2=q+1, czyli jest tak dla

q1=1+52,q2=1-52.

Ponieważ wektory [1,q1]T, [1,q2]T2 są liniowo niezależne, więc ciągi

x=(1,q1,q12,),y=(1,q2,q22,)

tworzą bazę dla . Zapiszmy ciąg Fibonacciego w tej bazie. Szukamy takich liczb rzeczywistych a,b, że

F=ax+by.

Liczby a,b spełniają układ równań

a+b=1,aq1+bq2=1.

Jego jedynym rozwiązaniem są

a=15,b=-15.

Ostatecznie

Fn=q1n-q2n5.

Rozdział 9 Suma prosta

SŁOWA KLUCZOWE ROZDZIAŁU suma algebraiczna podprzestrzeni suma prosta macierze blokowe podprzestrzenie niezmiennicze 3=UV.
Definicja 9.1.

Suma algebraiczna i suma prosta

Załóżmy, że V jest przestrzenią wektorową nad ciałem 𝔽. Niech U1,U2V będą podprzestrzeniami wektorowymi V. Definiujemy sumę algebraiczną U1,U2 jako

U1+U2={u1+u2:uiUi,i=1,2}

Wtedy U1+U2 jest podprzestrzenią wektorową V. Mówimy, że V jest sumą prostą U1 oraz U2 , jeśli zachodzą warunki

V=U1+U2,U1U2={0}.

Piszemy wtedy, że V=U1U2.

Wniosek 9.1.

Dla podprzestrzeni U1,U2V przestrzeni wektorowej V następujące warunki są równoważne

  • (i)

    V=U1U2,

  • (ii)

    Dowolny wektor vV można jednoznacznie przedstawić w postaci

    v=v1+v2,

    gdzie viUi dla i=1,2.

Dowód.

Załóżmy, że V=U1U2 i niech vV. Ponieważ V=U1+U2, więc istnieją takie wektory viUi (i=1,2), że v=v1+v2. Pokażemy, że takie przedstawienie jest jednoznaczne. Przypuśćmy, że

v=v1+v2=u1+u2,

dla pewnych uiUi. Wtedy

v1-u1U1=u2-v2U2U1U2={0},

czyli v1=u1 oraz v2=u2.

Załóżmy teraz, że zachodzi warunek (ii). Wtedy oczywiście V=U1+U2. Pokażemy, że U1U2={0}. Niech vU1U2. Wtedy

v=0U1+vU2=vU1+0U2,

czyli z jednoznaczności w warunku (ii) wynika, że v=0. ∎

Przykład 9.1.

Rozważmy przestrzeń wektorową M2×2() i jej dwie podprzestrzenie wektorowe

Sym2()={AM2×2():A=AT},Asym2()={AM2×2():A=-AT}.

Wtedy

Sym2()Asym2()={0},Sym2()+Asym2()=M2×2(),

czyli

M2×2()=Sym2()Asym2()
Przykład 9.2.

Niech F(,) będzie przestrzenią wektorową funkcji f:. Rozważmy podprzestrzeń Fo(,) funkcji nieparzystych i podprzestrzeń Fe(,) funkcji parzystych. Sprawdzimy, że

F(,)=Fe(,)Fo(,).

Jeśli fF(,), to

f(x)=12(f(x)+f(-x))Fe(,)+12(f(x)-f(-x))Fo(,),

czyli

F(,)=Fe(,)+Fo(,).

Jeśli fFe(,)Fo(,), to dla x mamy

f(x)=f(-x)=-f(x),

więc f(x)=0. W konsekwencji,

Fe(,)Fo(,)={0}.

Możemy to pojęcie uogólnić na większą liczbę podprzestrzeni U1,,Uk.

Definicja 9.2.

Niech U1,,UkV będą podprzestrzeniami wektorowymi V. Mówimy, że V jest sumą prostą podprzestrzeni U1,,Un tzn.

V=U1Vk

jeśli każdy wektor vV można jednoznacznie przedstawić w postaci sumy

v=u1++uk,

gdzie uiUi dla i=1,,k.

Wniosek 9.2.

Niech U1,U2V będą podprzestrzeniami przestrzeni wektorowej V. Załóżmy, że v1,,vk jest bazą U1 oraz vk+1,,vn jest bazą U2. Następujące warunki są równoważne

  • (1)

    V=U1U2,

  • (2)

    v1,,vn jest bazą V.

W szczególności, jeśli dimV<, to V=U1U2 wtedy i tylko wtedy, gdy

dimV=dimU1+dimU2,U1U2={0}.

Dowód.

Załóżmy, że V=U1U2. Wtedy span{v1,,vn}=V, bo V=U1+U2. Wektory v1,,vn są liniowo niezależne, bo jeśli

x1v1++xkvk+xk+1vk+1+xnvn=0,

to

x1v1++xkvkU1=-(xk+1vk+1+xnvn)U2U1U2={0},

czyli z założenia o bazach dla U1 i U2 mamy, że x1==xk=0 oraz xk+1==xn=0.

Jeśli v1,,vn jest bazą dla V, to każdy wektor vV da się jednoznacznie zapisać w postaci v=u1+u2, gdzie u1U1 i u2U2, czyli V=U1U2. ∎

  • U

    MACIERZE BLOKOWE

    Niech 𝔽n=U1U2 i niech v1,,vn będzie taką bazą V, że v1,,vkU1 tworzą bazę U1 oraz vk+1,,vnU2 tworzą bazę U2. Odwzorowanie liniowe L:𝔽n𝔽n ma w tej bazie macierz postać blokową

    A=[A11A12A21A22].

    Przykładowo, jeśli U1=span{e1,e2,e3} oraz U2=span{e4,e5} oraz A jest macierzą odwzorowania liniowego L:𝔽5𝔽5 w bazie e1,e2,e3,e4,e5, to

    A=[A11A12A21A22]=[a11a12a13a14a15a21a22a23a24a25a31a32a33a34a35a41a42a43a44a45a51a52a53a54a55].

    Zauważmy, że A12=0 wtedy i tylko wtedy, gdy A(U2)U2, czyli U2 jest niezmiennicza dla A. Analogicznie, A21=0 wtedy i tylko wtedy, gdy A(U1)U1. Jeśli U1 i U2 są niezmiennicze dla A, to A ma postać

    A=[A1100A22]=[a11a12a1300a21a22a2300a31a32a3300000a44a45000a54a55].
  • U

    Rozważmy macierz AMn×n(𝔽). Jak wiemy

    n=dimkerA+rankA=dimkerA+dimimA.

    Zazwyczaj jednak nie jest prawdą, że 𝔽n jest sumą prostą podprzestrzeni kerA oraz imA. Może się nawet zdarzyć, że kerA=imA. Przykładowo, rozważmy niezerowy wektor a2 i macierz A=[aa]. Wtedy kerA=span{[1,-1]T} niezależenie do wyboru wektora a. Przyjmując, że a=[1,-1]T otrzymujemy, że

    kerA=imA.

    Z drugiej strony, jeśli a jest liniowo niezależny z [1,-1]T, to

    2=kerAimA.

    Ponadto, gdy a=[-1,1]T, to proste kerA i imA są prostopadłe.

Rozdział 10 Wyznacznik

SŁOWA KLUCZOWE ROZDZIAŁU
wyznacznik jako funkcja kolumn permutacje wyznacznik iloczynu wyznacznik macierzy odwrotnej wyznacznik macierzy transponowanej wyznacznik a liniowa niezależność dopełnienie algebraiczne rozwinięcie Laplace’a macierz odwrotna wzory Cramera rozkład Schura orientacja iloczyn wektorowy iloczyn mieszany objętość równoległościanu

10.1 Grupa permutacji

Definicja 10.1.

Permutacja

Rozważmy zbiór skończony {1,,n} dla n. Permutacją zbioru {1,,n} nazywamy dowolną bijekcję

σ:{1,,n}{1,,n}.

Przez Sn oznaczamy zbiór wszystkich permutacji zbioru {1,,n} tzn.

Sn={σ|σ:{1,,n}{1,,n}jest bijekcją}

Ponieważ złożenie bijekcji jest bijekcją, więc składanie odwzorowań określa strukturę grupy w zbiorze Sn. Jej elementem neutralnym jest odwzorowanie identycznościowe id na zbiorze {1,,n}. Elementem odwrotnym do permutacji σ jest odwzorowanie odwrotne do σ (istnieje ono, bo σ jest bijekcją).

Przykład 10.1.

Permutację σ:{1,,n}{1,,n} zapisujemy często w postaci tabeli

σ=(123nσ(1)σ(2)σ(3)σ(n))

Przykładowo,

σ=(1234532415),τ=(1234524531)

są pewnymi permutacjami zbioru 5-elementowego {1,2,3,4,5}. Ich iloczyn jest równy

τσ=(1234554321).

Istnieje bardziej zwarty sposób zapisu permutacji σSn. Pochodzi on od Cauchy’ego. Niech x1,,xr będą różnymi elementami zbioru {1,,n}. W szczególności, 2rn. Przez (x1,,xr) oznaczamy taką permutację z Sn, że

x1x2x3xrx1

oraz

xx,dlax{1,,n}{x1,,xr}.

Permutację (x1,,xr)Sn nazywamy r-cyklem. Jeśli r=2, to 2-cykl nazywamy transpozycją. Dwa cykle z Sn nazywamy rozłącznymi, jeśli nie mają wspólnych wyrazów.

Przykład 10.2.

Dla permutacji

σ=(1234521354),τ=(1234554123)

mamy (opuszczamy w zapisie 1-cykle):

σ=(1,2)(3)(4,5)=(1,2)(4,5),τ=(1,5,3)(2,4).
Przykład 10.3.

Niech σ=(1,2,3)Sn. Wtedy σ-1=(3,2,1), bo

(1,2,3)(3,2,1)=id.

Ponadto, (1,2,3)3=(1,2,3)(1,2,3)(1,2,3)=id oraz 3 jest najmniejszą taką liczbą naturalną n, że (1,2,3)n=id.

  • U

    Jeśli n>2, to grupa (Sn,) nie jest abelowa. Przykładowo,

    (2,3)(1,2)=(123312)=(1,3,2)

    oraz

    (1,2)(2,3)=(123231)=(1,2,3).

Dla σSn definiujemy zbiór

σ*={i{1,,n}:σ(i)i}.

Zauważmy, że jeśli iσ*, to σ(i)σ*. Jeśli σ=(x1,,xr)Sn jest cyklem, to σ*={x1,,xr}. Cykle σ i τrozłączne, gdy σ*τ*=.

Lemat 10.1.

Jeśli σ,τSn i σ*τ*=, to στ=τσ.

Dowód.

Niech i{1,,n} będzie ustalone. Sprawdzimy, że στ(i)=τσ(i). Ponieważ cykle τ i σ są rozłączne, więc mamy trzy możliwości:

  • (1)

    τ(i)=i=σ(i),

  • (2)

    τ(i)i oraz σ(i)=i,

  • (3)

    σ(i)i oraz τ(i)=i.

Przypadek (1) jest oczywisty, a (2) i (3) są symetryczne, więc można założyć, że zachodzi (2). Ponieważ cykle są rozłączne, więc również σ(τ(i))=τ(i), czyli teza zachodzi. ∎

Lemat 10.2.

Każda permutacja σSn{id} jest iloczynem rozłącznych cykli. Taki rozkład jest jednoznaczny z dokładnością do kolejności czynników.

Dowód.

Jeśli σ*=, to σ=id=(1)(2)(n), więc teza zachodzi. Niech σ* i sσ*. Rozważmy zbiór

{σk(s):k}.

Ponieważ jest on skończony, więc σi(s)=σj(s) dla pewnych liczb naturalnych i<j. Wtedy σj-i(s)=s. Istnieje więc najmniejsza liczba naturalna l2 taka, że σl(s)=s. Wtedy liczby s,,σl-1(s) są różne z definicji l oraz τ=(s,σ(s),,σl-1(s)) jest l-cyklem. Dla ρ=στ-1 mamy σ=ρτ oraz ρ nie rusza punktów s,σ(s),,σl-1(s). Stosujemy teraz powyższą procedurę do ρ. Zauważmy, że ρ* jest istotnym podzbiorem σ*, więc procedura skończy się po skończonej liczbie kroków, bo σ* jest zbiorem skończonym. Dowodzi to rozkładu σ na rozłączne cykle.

Przypuśćmy, że

σ=σ1σk=τ1τl

są dwoma rozkładami σ na rozłączne cykle. Przypuśćmy, że σ1(i)=ji. Wtedy również τp(i)i dla pewnego p. Z rozłączności cykli mamy τp(i)=j=σ1(i). Rozważmy teraz σ1(j). Z tych samych względów mamy τp(j)=σ1(j). Kontynuując dostajemy, że σ1=τp i teza wynika poprzez indukcję. ∎

Lemat 10.3.

Dowolną permutację σSn można przedstawić jako złożenie skończonej liczby transpozycji. Ponadto, jeśli σ jest złożeniem parzystej liczby pewnych transpozycji, to każde jej przedstawienie jako złożenie transpozycji (nie jest ono jednoznacznie wyznaczone) składa się z parzystej liczby transpozycji. Takie permutacje σ nazywamy parzystymi. Jeśli σ jest złożeniem nieparzystej liczby transpozycji, to nazywamy ją nieparzystą.

Dowód.

Wiemy, że σ możemy rozłożyć na iloczyn rozłącznych cykli. Każdy cykl (a1,,ak) jest iloczynem transpozycji, bo

(a1,,ak)=(a1,ak)(a1,a2).

Przypuśćmy, że mamy dwa rozkłady σ na iloczyny transpozycji:

σ=τ1τr=ρ1ρp.

Pokażemy, że rp(mod2). Ponieważ

id=τ1τrρp-1ρ1-1,

więc wystarczy pokazać, że id może być iloczynem tylko parzystej liczby transpozycji. Przypuśćmy, że

id=(a1b1)(a2b2)(akbk) (10.1)

gdzie k1 oraz aibi dla i=1,,k. Pokażemy, że k jest parzyste. Zauważmy, że nie może być k=1, bo id(a1,b1). Dla k=2 teza zachodzi. Załóżmy, że k3 i teza zachodzi dla wszystkich iloczynów mniejszej liczby transpozycji. Jedna z transpozycji (aibi) dla i{2,,k} musi ruszać a1, bo inaczej (10.1) nie może zachodzić. Stąd a1 musi być jednym z ai dla pewnego i2 (zmieniając ewentualnie rolami ai z bi). Zauważmy, że jeśli różne litery oznaczają różne liczby to zachodzą równości

(cd)(ab)=(ab)(cd),(bc)(ab)=(ab)(bc),

więc możemy założyć, że a2=a1.

Jeśli b2=b1, to iloczyn (a1b1)(a1b2) jest identycznością i możemy go pominąć otrzymując id jako iloczyn k-2 transpozycji. Z założenia indukcyjnego k-2 jest parzyste, więc k jest parzyste.

Jeśli b2b1, to iloczyn (a1b1)(a1b2) jest równy (a1b2)(b1b2), czyli (10.1) przyjmuje postać

id=(a1b2)(b1b2)(akbk). (10.2)

Zauważmy, że w formule (10.2) jest mniej transpozycji które ruszają a1 niż w (10.1). Rozumujemy teraz analogicznie. Pewna transpozycja w iloczynie (10.2) inna niż (a1b1) musi ruszać a1. Mamy znowu dwie możliwości albo możemy zredukować liczbę transpozycji o 2 i zastosować indukcję albo możemy zmniejszyć o 1 liczbę transpozycji ruszających a1 w formule (10.2). Ponieważ id nie może być iloczynem transpozycji w którym tylko jedna rusza a1, więc w skończonej liczbie kroków musi zajść sytuacja, że iloczyn pierwszych dwóch transpozycji będzie identycznością, więc teza wynika poprzez indukcję. ∎

Przykład 10.4.

Rozważmy permutację

σ=(123456156432)S6.

Powyższy napis oznacza, że

σ(1)=1,σ(2)=5,σ(3)=6,σ(4)=4,σ(5)=3,σ(6)=2.

Sprawdzamy łatwo, że

σ =(2,6)(2,3)(2,5)
=(5,2)(3,5)(6,3)
=(1,3)(3,1)(2,6)(2,3)(2,5).

Widzimy, że przedstawienie permutacji σ jako złożenie transpozycji nie jest jednoznaczne, ale parzystość liczby transpozycji w przedstawieniu nie zmienia się. Permutacja σ jest nieparzysta.

Definicja 10.2.

Znak permutacji

Znak permutacji σSn definiujemy jako liczbę:

sgn(σ)={1,gdy σ jest parzysta,-1,gdy σ jest nieparzysta. 

Sprawdzamy łatwo, że

sgn(στ)=sgn(σ)sgn(τ),sgn(σ-1)=sgn(σ).

10.2 Definicja wyznacznika i jego własności

Pojęcie wyznacznika pojawiło się pod koniec XVII wieku w pracach Gottfrieda Wilhelma Leibnitza oraz japońskiego matematyka Seki Kova znanego również jako Takakazu (1642–1708). Systematyczna teoria wyznacznika pochodzi od Cauchy’ego (1789–1857) oraz Jacobiego (1804–1851).

Dla macierzy kwadratowej AM2×2(𝔽) zdefiniowaliśmy wyznacznik wzorem

det(A)=a11a22-a12a21.
Wniosek 10.1.

Dla dowolnych wektorów u,v,wF2 i liczb rzeczywistych a,bF zachodzą warunki:

  • (1)

    dwuliniowość wyznacznika jako funkcji kolumn macierzy

    (i)det[au+bvw]=adet[uw]+bdet[vw],
    (ii)det[uav+bw]=adet[uv]+bdet[uw];
  • (2)
    det[uu]=0,
  • (3)

    detI2=1.

Dowód.

Wystarczy przeprowadzić bezpośredni rachunek. Uzasadnimy dla przykładu warunek (1). Niech u=[u1,u2]T, v=[v1,v2]t oraz w=[w1,w2]T. Wtedy

[au+bvw]=[au1+bv1w1au2+bv2w2],

więc

det[au+bvw] =(au1+bv1)w2-(au2+bv2)w1
=a(u1w2-u2w1)+b(v1w2-v2w1)
=adet[uw]+bdet[vw].

  • U

    Pokażemy, że każde odwzorowanie F:M2×2(𝔽)𝔽 spełniające warunki (1)-(3) musi być dane wzorem:

    F(A)=a11a22-a12a21.

    Oznacza to, że wyznacznik jest jednoznacznie wyznaczony przez warunki (1)-(3) i musi być zadany powyższym wzorem.

    Lemat 10.4.

    Jeśli F:M2×2(F)F spełnia warunki (1)-(2), to dla dowolnych macierzy A,BM2×2(F) zachodzi wzór

    F(AB)=F(A)(b11b22-b12b21). (10.3)
    Dowód.

    Niech

    A=[a1a2]=[a11a12a21a22],B=[b11b12b21b22].

    Wtedy

    AB =[a11b11+a12b21a11b12+a12b22a21b11+a22b21a21b12+a22b22]
    =[b11a1+b21a2b12a1+b22a2].

    Z warunku (1) zastosowanego dwukrotnie mamy

    F(AB) =F(b11a1+b21a2,b12a1+b22a2)
    =b11F(a1,b12a1+b22a2)+b21F(a2,b12a1+b22a2)
    =b11b12F(a1,a1)+b11b22F(a1,a2)
    +b21b12F(a2,a1)+b21b22F(a2,a2).

    Z warunku (2) wynika, że F(v,v)=0 dla dowolnego wektora v𝔽2 oraz

    F(a2,a1)=-F(a1,a2).

    Stąd

    F(AB) =F(a1,a2)(b11b22-b12b21)
    =F(A)(b11b22-b12b21).

    Twierdzenie 10.1.

    Istnieje dokładnie jedno odwzorowanie F:M2×2(F)F spełniające warunki (1)-(3). Ponadto,

    F(B)=b11b22-b12b21,BM2×2(𝔽).
    Dowód.

    Przyjmując A=I w Lemacie 10.4 i korzystając z warunku (3) otrzymujemy, że dla dowolnej macierzy BM2×2(𝔽) mamy

    F(B) =F(IB)
    =F(I)(b11b22-b12b21)
    =b11b22-b12b21,

    co kończy dowód. ∎

    Uogólnimy ten rezultat na dowolny wymiar i zdefiniujemy wyznacznik dowolnej macierzy kwadratowej AMn×n(𝔽). Będziemy w tym celu potrzebowali pewnych faktów dotyczących permutacji zbiorów skończonych.

Będziemy potrzebowali jeszcze jednego pojęcia. Odwzorowanie

F:Mn×n(𝔽)𝔽

będziemy traktowali jako funkcję zależną od n kolumn macierzy A=[a1an]Mn×n(𝔽), czyli F=F(a1,,an) jest funkcją zależną od n wektorów.

Definicja 10.3.

Odwzorowanie n-liniowe

Odwzorowanie F:Mn×n(𝔽)𝔽 nazywamy n-liniowym, jeśli jest ono liniowe ze względu na każdą zmienną. Oznacza to, że dla dowolnie ustalonego i{1,,n} oraz wektorów ai,bi𝔽n i skalarów α,β𝔽 zachodzi równość

F(a1,,αai+βbii,an)=αF(a1,,aii,an)+βF(a1,,bii,an).
Przykład 10.5.

Iloczyn skalarny

n×n(x,y)(x|y)𝔽

jest odwzorowaniem dwuliniowym.

Twierdzenie 10.2 (Definicja wyznacznika).

Istnieje dokładnie jedno odwzorowanie

F:Mn×n(𝔽)𝔽

spełniające warunki

  • (1)

    F jest n-liniowe (jako funkcja kolumn macierzy AMn×n(𝔽)),

  • (2)

    jeśli A ma dwie identyczne kolumny tzn., ai=aj dla pewnych ij, to F(A)=0,

  • (3)

    F(I)=1.

Ponadto, dla dowolnej macierzy B=[bij]Mn×n(F) zachodzi

F(B)=σSnsgn(σ)bσ(1)1bσ(n)n. (10.4)

Nazywamy ją wyznacznikiem i oznaczamy przez det. Czasami będziemy również stosować oznaczenie |B|:=detB.

  • U

    Z warunków (1) i (2) wynika, że jeśli c𝔽 oraz ij, to

    F(a1,,ai+caj,,an)=F(a1,,ai,,an).
Wniosek 10.2.

Jeśli F spełnia warunki (1)-(2), to (2’) F jest antysymetryczne tzn. jeśli ij, to F(a1,,aii,,ajj,an)=-F(a1,,aji,,aij,an).

Dowód.

Niech ij. Wtedy z warunków (1)-(2) mamy

0 =F(a1,,ai+aji,,ai+ajj,an)
=F(a1,,aii,,aij,an)+F(a1,,aii,,ajj,an)
+F(a1,,aji,,aij,an)+F(a1,,aji,,ajj,an)
=F(a1,,aii,,ajj,an)+F(a1,,aji,,aij,an).

  • U

    Jeśli F spełnia (2’), to

    F(a1,,aii,,aij,an)=-F(a1,,aii,,aij,an),

    więc jeśli 𝔽 jest takim ciałem, że 1+10, to warunek (2’) implikuje (2).

  • U

    Jeśli F spełnia (1) oraz F(A)=0 dla macierzy które mają takie same dwie sąsiadujące kolumny, to F spełnia (2). Rzeczywiście, z dowodu Wniosku 10.2 wynika wtedy, że F zmienia znak, gdy zmienimy miejscami dwie sąsiadujące kolumny.

Przykład 10.6.

Załóżmy, że n=2. Wtedy S2 składa się z dwóch permutacji: id (parzysta) oraz transpozycji (12) (nieparzysta). Wynika stąd, że dla BM2×2(𝔽) mamy

det(B)=F(B)=b11b22-b12b21.
Przykład 10.7.

Zobaczmy jakie są konsekwencje warunków (1)-(2) dla n=3. Rozważmy macierz A=[a1a2a3]M3×3(𝔽) oraz

B=[b11b12b13b21b22b23b31b32b33].

Wtedy

AB=[b11a1+b21a2+b31a3b12a1+b22a2+b32a3b13a1+b23a2+b33a3].

Z warunku (1) tzn. 3-liniowości F i warunku (2) otrzymujemy, że

F(AB) =b11b12b13F(a1,a1,a1)=0+b11b12b23F(a1,a1,a2)=0+b11b12b33F(a1,a1,a3)=0
+b11b22b13F(a1,a2,a1)=0+b11b22b23F(a1,a2,a2)=0+b11b22b33F(a1,a2,a3)
+b11b32b13F(a1,a3,a1)=0+b11b32b23F(a1,a3,a2)+b11b32b33F(a1,a3,a3)=0
+b21b12b13F(a2,a1,a1)=0+b21b12b23F(a2,a1,a2)=0+b21b12b33F(a2,a1,a3)
+b21b22b13F(a2,a2,a1)=0+b21b22b23F(a2,a2,a2)=0+b21b22b33F(a2,a2,a3)=0
+b21b32b13F(a2,a3,a1)+b21b32b23F(a2,a3,a2)=0+b21b32b33F(a2,a3,a3)=0
+b31b12b13F(a3,a1,a1)=0+b31b12b23F(a3,a1,a2)+b31b12b33F(a3,a1,a3)=0
+b31b22b13F(a3,a2,a1)+b31b22b23F(a3,a2,a2)=0+b31b22b33F(a3,a2,a3)=0
+b31b32b13F(a3,a3,a1)=0+b31b32b23F(a3,a3,a2)=0+b31b32b33F(a3,a3,a3)=0

W efekcie

F(AB) =b11b22b33F(a1,a2,a3)+b11b32b23F(a1,a3,a2)
+b21b12b33F(a2,a1,a3)+b21b32b13F(a2,a3,a1)
+b31b12b23F(a3,a1,a2)+b31b22b13F(a3,a2,a1).

Z warunku (2) tzn. antysymetryczności F otrzymujemy, że

F(AB) =b11b22b33F(a1,a2,a3)-b11b32b23F(a1,a2,a3)
-b21b12b33F(a1,a2,a3)+b21b32b13F(a1,a2,a3)
+b31b12b23F(a1,a2,a3)-b31b22b13F(a1,a2,a3).

Wzór na F(AB) możemy zapisać w bardziej zwartej formie korzystając z grupy permutacji S3. Składa się ona z 3!=6 permutacji:

S3={id,(12),(13),(23),(123),(132)}.

Transpozycje są nieparzyste, a permutacje id=(12)(21), (123)=(13)(12) i (132)=(12)(13) są parzyste. Stąd

F(AB) =sgnidb11b22b33F(a1,a2,a3)+sgn(23)b11b32b23F(a1,a2,a3)
+sgn(12)b21b12b33F(a1,a2,a3)+sgn(123)b21b32b13F(a1,a2,a3)
+sgn(132)b31b12b23F(a1,a2,a3)+sgn(13)b31b22b13F(a1,a2,a3)
=(σS3sgn(σ)bσ(1)1bσ(2)2bσ(3)3)F(A).

Z warunku (3) dla A=I mamy

F(B)=σS3sgn(σ)bσ(1)1bσ(2)2bσ(3)3.
Lemat 10.5.

Załóżmy, że F:Mn×n(F)F spełnia warunki (1)-(2). Dla dowolnych A,BMn×n(F) mamy

F(AB)=F(A)(σSnsgn(σ)bσ(1)1bσ(n)n).
Dowód.

Niech A=[a1an] i B=[bij]. Dla AB=[c1cn], z definicji iloczynu macierzy wynika, że

ck=i=1nbikai=b1ka1++bnkan.

Z warunku (1) wynika, że

F(AB) =i1,,in=1nF(bi11ai1,,binnain)
=i1,,in=1nbi11binnF(ai1,,ain).

Użyjemy teraz warunku (2). Wynika z niego, że jeśli ik=ij dla pewnych kj, to F(ai1,,ain)=0. Stąd zamiast sumy

i1,,in=1nbi11binnF(ai1,,ain)

możemy rozważać sumę

σSnbσ(1)1bσ(n)nF(aσ(1),,aσ(n)).

Teraz wystarczy tylko zauważyć, że warunek (2) gwarantuje, że

F(aσ(1),,aσ(n))=sgn(σ)F(a1,,an).

Dowód.

Dowód Twierdzenia 10.2: Stosujemy Lemat 10.5 dla A=I i warunek (3) otrzymując, że dla dowolnej macierzy BMn×n(𝔽) zachodzi

F(B)=σSnsgn(σ)bσ(1)1bσ(n)n

co dowodzi jednoznaczności funkcji F spełniającej (1)-(3). Dla dowodu istnienia, definiujemy odwzorowanie F wzorem (10.4). Sprawdzamy łatwo, że tak określone odwzorowanie F spełnia warunki (1) i (3). Uzasadnimy, że zachodzi również warunek (2). Załóżmy, że dwie kolumny macierzy B są równe tzn. bj=bk dla pewnych jk. Wtedy

F(B)=σAnbσ(1)1bσ(n)n-σAnbστ(1)1bστ(n)n,

więc wystarczy pokazać, że dla σAn mamy

bσ(1)1bσ(n)n=bστ(1)1bστ(n)n.

Jeśli i{j,k}, to στ(i)=σ(i), więc bσ(i)i=bστ(i)i. Ponadto, ponieważ bj=bk, więc

bστ(j)j=bσ(k)j=bσ(k)k,

oraz

bστ(k)k=bσ(j)k=bσ(j)j,

co kończy dowód. ∎

Wniosek 10.3 (Wyznacznik iloczynu macierzy).

Dla dowolnych macierzy A,BMn×n(F) zachodzi wzór Cauchy’ego

det(AB)=det(A)det(B).

W szczególności, jeśli A jest nieosobliwa, to

det(A-1)=1det(A).
Lemat 10.6.

Niech AMn×n(F). Kolumny macierzy A są liniowo zależne wtedy i tylko wtedy, gdy det(A)=0.

Dowód.

Jeśli kolumny A są liniowo zależne, to z warunków (1) i (2) wynika, że det(A) jest równy wyznacznikowi macierzy z pewną kolumną zerową, więc det(A)=0. Załóżmy, że det(A)=0 i przypuśćmy, że kolumny macierzy A są liniowo niezależne. Wtedy kerA={0}, czyli A jest nieosobliwa. Istnieje więc taka macierz BMn×n(𝔽), że I=AB. Wtedy

1=det(I)=det(A)det(B)=0,

co prowadzi do sprzeczności. ∎

Przykład 10.8.

Uzasadnimy, że

|sinαcosαsin(α+δ)sinβcosβsin(β+δ)sinγcosγsin(γ+δ)|=0.

Ponieważ

sin(x+δ)=sinxcosδ+cosxsinδ,

więc trzecia kolumna jest kombinacją liniową dwóch pierwszych kolumn.

Wniosek 10.4.

Niech AMn×n(F). Kolumny macierzy A są liniowo niezależne wtedy i tylko wtedy, gdy det(A)0. W szczególności, A jest nieosobliwa wtedy i tylko wtedy, gdy detA0.

Twierdzenie 10.3 (Wyznacznik transpozycji macierzy).

Dla dowolnej macierzy AMn×n(F) mamy

det(AT)=det(A)

Dowód.

Z definicji wyznacznika i macierzy transponowanej wystarczy zaobserwować, że

σSnsgn(σ)aσ(1)1aσ(n)n=σSnsgn(σ)a1σ(1)anσ(n).

Niech σ-1 będzie permutacją odwrotną do σ. Wtedy sgn(σ)=sgn(σ-1) oraz

aσ(1)1aσ(n)n =aσ(1)σ-1(σ(1))aσ(n)σ-1(σ(n))
=a1σ-1(1)anσ-1(n),

co kończy dowód. ∎

Wniosek 10.5.

Kolumny (wiersze) macierzy kwadratowej A są liniowo zależne wtedy i tylko wtedy, gdy det(A)=0.

Definicja 10.4.

Dopełnienie algebraiczne wyrazu macierzy

Dla macierzy AMn×n(𝔽) oraz i,j{1,,n} definiujemy macierz

A(i,j)M(n-1)×(n-1)(𝔽)

otrzymaną z macierzy A przez wykreślenie i-tego wiersza oraz j-tej kolumny. Dopełnieniem algebraicznym wyrazu aij nazywamy liczbę

Aij=(-1)i+jdetA(i,j).

Przykład 10.9.

Rozważmy macierz

A=[a11a12a13a21a22a23a31a32a33]M3×3().

Przykładowo, dla i=2 oraz j=3 w macierzy

[a11a12𝐚𝟏𝟑𝐚𝟐𝟏𝐚𝟐𝟐𝐚𝟐𝟑a31a32𝐚𝟑𝟑]

wykreślamy drugi wiersz i trzecią kolumnę otrzymując macierz

A(2,3)=[a11a12a31a32].

Znaki (-1)i+j w zależności od pozycji wyrazu aij mają następujący rozkład

[+-+-+-+-+].
Twierdzenie 10.4 (Rozwinięcie względem pierwszego wiersza).

Załóżmy, że AM3×3(F). Wtedy

det(A) =i=13a1iA1i=a11A11+a12A12+a13A13
=a11|a22a23a32a33|-a12|a21a23a31a33|+a13|a21a22a31a32|.
Dowód.

Wystarczy sprawdzić, że odwzorowanie F:M3×3(𝔽)𝔽 zdefiniowane dla macierzy A=[a1a2a3] wzorem

F(A)=a11|a22a23a32a33|-a12|a21a23a31a33|+a13|a21a22a31a32|

spełnia warunki (1)-(3) z Twierdzenia 10.2. Są one łatwe do weryfikacji bezpośrednim rachunkiem. W warunku (1) sprawdzimy przykładowo liniowość F względem pierwszej zmiennej. Dla b1=[b11,b21,b31]T mamy

F(a1+b1,a2,a3) =(a11+b11)|a22a23a32a33|-a12|a21+b21a23a31+b31a33|+a13|a21+b21a22a31+b31a32|
=a11|a22a23a32a33|-a12|a21a23a31a33|+a13|a21a22a31a32|
+b11|a22a23a32a33|-a12|b21a23b31a33|+a13|b21a22b31a32|
=F(a1,a2,a3)+F(b1,a2,a3).

Dla c𝔽 mamy

F(ca1,a2,a3) =ca11|a22a23a32a33|-a12|ca21a23ca31a33|+a13|ca21a22ca31a32|
=ca11|a22a23a32a33|-ca12|a21a23a31a33|+ca13|a21a22a31a32|
=cF(a1,a2,a3).

Dla sprawdzenia warunku (2) zobaczmy przykładowo co się stanie, gdy z pierwsza i trzecia kolumna są identyczne. Mamy

F(a1,a2,a1)=a11|a22a21a32a31|-a12|a21a21a31a31|+a11|a21a22a31a32|=0.

Warunek (3) zachodzi, bo

F(I)=1|1001|-0|0001|+0|0100|=1.

  • U

    Analogiczny jak w Twierdzeniu 10.4 wzór na wyznacznik zachodzi dla rozwinięcia względem dowolnego wiersza i dowolnej kolumny. Dowód jest ideologicznie taki sam jak dowód Twierdzenia 10.4. Przykładowo, dla rozwinięcia względem drugiej kolumny przyjmuje on postać

    det(A)=-a12|a21a23a31a33|+a22|a11a13a31a33|-a32|a11a13a21a23|.

    Analogiczne rozumowanie prowadzi nas do wzoru na wyznacznik dla macierzy n×n dla dowolnego n. Pozwala on zredukowć wyznaczenie wyznacznika macierzy AMn×n(𝔽) do obliczenia n wyznaczników macierzy o rozmiarze (n-1)×(n-1).

Wniosek 10.6 (Rozwinięcie Laplace’a).

Niech AMn×n(F) z n2. Dla dowolnych i=1,,n i j=1,,n zachodzą równości

det(A)=ai1Ai1++ainAin=a1jA1j++anjAnj. (10.5)
Dowód.

Ponieważ det(A)=det(AT), więc wystarczy udowodnić, że

det(A)=ai1Ai1++ainAin,

czyli zachodzi wzór na rozwinięcie Laplace’a względem i-tego wiersza. Wystarczy sprawdzić, że funkcja F(A)=ai1Ai1++ainAin spełnia warunki (1)-(3). Warunki (1) i (3) są łatwe do sprawdzenia. Dla dowodu (2) wystarczy zauważyć, że F(A)=0, gdy A ma dwie sąsiadujące kolumny identyczne. ∎

  • U

    Stosując wzór Laplace’a mamy swobodę wyboru wiersza lub kolumny względem której zastosujemy rozwinięcie. Oczywiście korzystnie jest wybrać kolumnę (wiersz) z największą liczbą zer. Zanim zastosujemy wzór Lapalce’a możemy najpierw użyć operacji na kolumnach (wierszach) nie zmieniających wyznacznika, aby wprowadzić możliwie dużo wyrazów zerowych w danej kolumnie (wierszu). Możemy więc, do ustalonej kolumny (wiersza) dodać kombinację liniową innych kolumn (wierszy).

Przykład 10.10.

Odejmując pierwszy wiersz od pozostałych wierszy i stosując rozwinięcie względem pierwszej kolumny mamy:

|1aa21bb21cc2| =|1aa20b-ab2-a20c-ac2-a2|
=|b-ab2-a2c-ac2-a2|
=(b-a)(c2-a2)-(c-a)(b2-a2)
=(b-a)(c-a)(c-b)
Wniosek 10.7 (Własności wyznacznika).
  • (i)

    Jeśli A ma dwa identyczne wiersze (kolumny), to det(A)=0.

  • (ii)

    Jeśli A ma zerowy wiersz (kolumnę), to det(A)=0.

  • (iii)

    A jest nieosobliwa wtedy i tylko wtedy, gdy det(A)0 wtedy i tylko wtedy, gdy kolumny (wiersze) A są liniowo niezależne.

  • (iv)

    Jeśli A jest górnie (dolnie) trójkątna, to

    det(A)=a11a22ann.
  • (v)

    Jeśli σSn, to

    det[aσ(1)||aσ(n)]=sgn(σ)det[a1||an].
  • (vi)

    Jeśli S jest nieosobliwa, to

    det(A)=det(S-1AS).
Przykład 10.11.

Rozważmy macierz Vandermonde’a

A=[1aa2a31bb2b31cc2c31dd2d3].

Uzasadnimy formułę rekurencyjną

|1aa2a31bb2b31cc2c31dd2d3|=(b-a)(c-a)(d-a)|1bb21cc21dd2|

łączącą wyznacznik macierzy Vandermonde’a rozmiaru 4 z wyznacznikiem macierzy Vandermonde’a rozmiaru 3. W tym celu stosujemy najpierw operacje nie zmieniające wyznacznika, aby wprowadzić zerowe wyrazy w pierwszym wierszu macierzy A:

[1aa2a31bb2b31cc2c31dd2d3] [1aa201bb2b2(b-a)1cc2c2(c-a)1dd2d2(d-a)]operacjak4-ak3
[1a001bb(b-a)b2(b-a)1cc(c-a)c2(c-a)1dd(d-a)d2(d-a)]operacjak3-ak2
[10001b-ab(b-a)b2(b-a)1c-ac(c-a)c2(c-a)1d-ad(d-a)d2(d-a)]operacjak2-ak1.

Z rozwinięcia Lapalce’a względem pierwszego wiersza mamy

|1aa2a31bb2b31cc2c31dd2d3| =|b-ab(b-a)b2(b-a)c-ac(c-a)c2(c-a)d-ad(d-a)d2(d-a)|
=(b-a)(c-a)(d-a)|1bb21cc21dd2|.
Przykład 10.12.

Niech

Δn=|a0000b0a00b000ab0000ba000b00a0b0000a|

będzie wyznacznikiem powyższej macierzy rozmiaru 2n. Przykładowo,

Δ1=|abba|=a2-b2,
Δ2 =|a00b0ab00ba0b00a|
=a|ab0ba000a|-b|00bab0ba0|
=a2Δ1-b2Δ1=(a2-b2)Δ1
=(a2-b2)2.

Stosując rozwinięcie względem pierwszej kolumny i dokonując dalszej redukcji otrzymujemy, że

Δn =a|a00b00ab000ba00b00a00000a|-b|0000ba00b00ab000ba00b00a0|
=a2Δn-1-b2Δn-1=(a2-b2)Δn-1.

Indukcyjnie dostajemy, że Δn=(a2-b2)n.

Przykład 10.13.

Odejmując ostatni wiersz od pozostałych wierszy otrzymujemy, że

|1-n111111-n111111-n111111-n111111-n| =|-n000n0-n00n00-n0n000-nn11111-n|
=nn-1|-100010-100100-101000-1111111-n|
=nn-1|-100010-100100-101000-1100000|=0.
Przykład 10.14.

Pokażemy, że

|1234561334561254561237561234961234511|=5!=120.

Dla j=2,3,4,5,6 od j-tej kolumny odejmujemy pierwszą kolumnę pomnożoną przez j otrzymując macierz dolnie trójkątną:

|1234561334561254561237561234961234511|=|100000110000102000100300100040100005|=5!.
Wniosek 10.8.

Dla dowolnej macierzy AMn×n(F) zachodzi równość

ai1Aj1++ainAjn={det(A),gdy i=j,0,gdy ij (10.6)
Dowód.

Dla i=j jest to równość (10.5). Załóżmy, że ij. Niech A* będzie macierzą powstałą z macierzy A poprzez wstawienie w miejsce j-tego wiersza i-tego wiersza macierzy A. Wtedy det(A*)=0, bo A* ma dwa takie same wiersze. Ze wzoru (10.5) wynika, że

0=det(A*)=ai1Aj1++ainAjn.

Definicja 10.5.

Dla macierzy AMn×n(𝔽) definiujemy macierz dołączoną adjAMn×n(𝔽) jako macierz

adjA=[A11A21An1A12A22An2A1nA2nAnn].
Wniosek 10.9 (Macierz odwrotna).

Jeśli macierz AMn×n(F) jest nieosobliwa, to

A-1=1det(A)adjA. (10.7)
Dowód.

Ze wzoru (10.6) wynika, że

A(adjA) =[a11a12a1na21a22a2nan1an2ann][A11A21An1A12A22An2A1nA2nAnn]
=det(A)I.

Przykład 10.15.

Zobaczmy jak wzór na macierz odwrotną wygląda w niskich wymiarach. Dla n=2 i A=[a11a12a21a22] mamy

A11=a22,A21=-a12,A12=-a21,A22=a22,

czyli otrzymujemy znany nam wzór

A-1=1det(A)[a22-a12-a21a11].

Niech teraz n=3 i A=[a11a12a13a21a22a23a31a32a33]. Wtedy

A-1=1det(A)[A11A21A31A12A22A32A13A23A33],

gdzie

A11=|a22a23a32a33|,A21=-|a21a23a31a33|,A31=|a21a22a31a32|,
A12=-|a12a13a32a33|,A22=|a11a13a31a33|,A32=-|a11a12a31a32|,
A13=|a12a13a22a23|,A23=-|a11a13a21a23|,A33=|a11a12a21a22|.

Przykładowo, dla A=[242311101] otrzymujemy, że

A-1=-18[1-42-204-14-10].
Twierdzenie 10.5 (Wzory Cramera).

Załóżmy, że macierz AMn×n(F) jest nieosobliwa. Niech Ai oznacza macierz otrzymaną z A przez zastąpienie i-tej kolumny w A przez wektor bRn. Jedyne rozwiązanie x=[x1,,xn]TFn równania Ax=b jest dane przez

xi=det(Ai)det(A),dlai=1,,n.
Dowód.

Ponieważ x=A-1b, więc

xi=b1A1i++bnAnidet(A)=det(Ai)det(A).

Przykład 10.16.

Rozwiążemy układ równań

[521320102][xyz]=[853].

Macierz układu A=[521320102] jest nieosobliwa (det(A)=6), więc

x=|821520302|det(A)=66=1,y=|581350132|det(A)=66=1,z=|528325103|det(A)=66=1.
Przykład 10.17 (Rozkład Schura).

Przy obliczaniu wyznacznika często stosuje się metodę rozkładu pochodzącą od Schura. Rozważmy macierz blokową

P=[ABCD],

gdzie A i D są macierzami kwadratowymi. Spróbujmy znaleźć takie macierze X i Y, że

P=[ABCD] =[A0CI][IY0X]
=[AAYCCY+X].

Jeśli nam się to uda, to detP=detAdetX. Taki rozkład jest zawsze możliwy, gdy macierz A jest nieosobliwa. Możemy wtedy przyjąć, że

Y=A-1B,X=D-CA-1B.

Zauważmy, że

[AAYCCY+X]=[A0CX][IY0I],

więc możemy również użyć rozkładu

P =[A0CX][IY0I]
=[I0CA-1I][A00X][IY0I].

Jeśli macierz D jest nieosobliwa, to mamy analogiczny rozkład

P=[IBD-10I][A-BD-1C00D][I0D-1CI].

Ponieważ

[IY0I]-1=[I-Y0I],

więc powyższe rozkłady pozwalają łatwo wyznaczyć P-1.

  • 𝗧𝗘𝗦𝗧

    Oceń prawdziwość zdań

    • Dla dowolnych macierzy A,BM2×2() zachodzi równość det(A+B)=det(A)+det(B).

    • Dla dowolnych macierzy A,BM2×2() zachodzi równość det(AB)=det(BA).

    • Dla dowolnych macierzy A,BM2×2() równość det(A)=det(B) implikuje, że A=B.

    • Niech AM2×2(). Jeśli Ax=0 ma niezerowe rozwiązanie, to det(A)=0.

    • Jeśli A jest macierzą kwadratową i Ak=0 dla pewnego k, to det(A)=0.

    • Jeśli AMn×n() jest skośnie symetryczna (tzn. AT=-A), to det(A)=0.

    • Jeśli AMn×n() jest skośnie symetryczna i n jest nieparzyste, to det(A)=0.

    • Dla dowolnej macierzy kwadratowej detA2=(detA)2.

    • Jeśli A jest nieosobliwa i górnie trójkątna, to

      detA-1=1a111ann.
    • Jeśli A, BMn×n(𝔽) i detA=detB, to det(A+B)=2detA.

    • Dla macierzy kwadratowej A mamy detATA=detAAT.

Definicja 10.6.

Wyznacznik odwzorowania liniowego

Niech V będzie przestrzenią wektorową wymiaru n. Wyznacznik detL odwzorowania liniowego L:VV definiujemy jako det(A), gdzie A jest macierzową reprezentacją L w pewnej bazie v1,,vn dla V.

  • U

    Definicja wyznacznika detL nie zależy od wyboru reprezentacji macierzowej A dla L. Rzeczywiście, jeśli B jest inną reprezentacją macierzową L, to B jest podobna do A, więc det(A)=det(B).

Wniosek 10.10.

Niech L:VV będzie odwzorowaniem liniowym i dim(V)<. Wyznacznik detL0 wtedy i tylko wtedy, gdy L jest izomorfizmem liniowym.

Wniosek 10.11.

Jeśli L,G:VV są odwzorowaniami liniowymi, to detGL=detGdetL.

10.3 Geometryczna interpretacja wyznacznika

Definicja 10.7.

Iloczyn wektorowy w R3

Iloczynem wektorowym wektorów u=[u1,u2,u3]T,v=[v1,v2,v3]T3 nazywamy wektor

u×v:=|u2u3v2v3|e1-|u1u3v1v3|e2+|u1u2v1v2|e33.

Przez analogię do wzoru Laplace’a będziemy stosować następujące niezbyt formalne oznaczenie:

u×v=|𝐞𝟏𝐞𝟐𝐞𝟑u1u2u3v1v2v3|.
Wniosek 10.12 (Własności iloczynu wektorowego).

Iloczyn wektorowy

×:3×33

ma dla dowolnych u,v,wR3 i a,bR następujące własności:

  • (1)

    (dwuliniowość)

    (au+bv)×w=a(u×w)+b(v×w)
    u×(av+bw)=a(u×v)+b(u×w)
  • (2)

    (antysymetryczność)

    u×v=-v×u

  • (3)

    (reguła śruby prawoskrętnej)

    e1×e2=e3,e2×e3=e1,e3×e1=e2

W szczególności, u×u=0 dla dowolnego wektora uR3.

Wniosek 10.13.

Wektor u×v jest prostopadły do wektorów u i v.

Dowód.

Sprawdzamy łatwo, że

(u×v|u)=det[uuv]=0.

Rysunek 10.1: Iloczyn wektorowy.
  • U

    Iloczyn wektorowy możemy zapisać w konwencji macierzowej. Niech u=[a,b,c]T, v=[x,y,z]T3. Bezpośredni rachunek pokazuje, że

    u×v=[0-cbc0-a-ba0]:=Au[xyz]=Au(v).

    Stąd

    u×(u×v)=Au(u×v)=Au2(v).

    Z drugiej strony, sprawdzamy łatwo, że

    u×(u×v)=(u|v)u-(u|u)v.

    Jeśli u jest wektorem jednostkowym, to otrzymujemy, że

    v-(v|u)u=-Au2(v)=[-b2-c2abacab-a2-c2bcacba-a2-b2][xyz].

    Odwzorowanie vv-(v|u)u jest rzutem ortogonalnym na płaszczyznę ortogonalną do wektora jednostkowego u.

Lemat 10.7.

Dla dowolnych wektorów 0u,vR3 zachodzi równość

u×v=uvsin(u,v).
Dowód.

Bezpośredni rachunek pokazuje, że zachodzi tożsamość Lagrange’a:

u×v2=u2v2-((u|v))2.

Rzeczywiście, dla u=[u1,u2,u3]T i v=[v1,v2,v3]T mamy

u×v2 =|u2u3v2v3|2+|u1u3v1v3|2+|u1u2v1v2|2
=(u2v3-v2u3)2+(u1v3-u3v1)2+(u1v2-v1u2)2
=(u12+u22+u32)(v12+v22+v32)-(u1v1+u2v2+u3v3)2
=u2v2-((u|v))2.

Stąd

u×v2=u2v2(1-cos2(u,v))=u2v2sin2(u,v)

Wniosek 10.14 (Pole równoległoboku).

Niech u,vR3. Wtedy u×v jest polem równoległoboku rozpiętego na wektorach u i v. W szczególności, jeśli u i v są liniowo niezależne, to u×v0.

Wniosek 10.15.

Niech u=[u1,u2]T,v=[v1,v2]TR2. Wtedy

|det[uv]|

jest polem równoległoboku rozpiętego na wektorach u i v.

Dowód.

Rozważmy wektory u*=[u1,u2,0]T,v*=[v1,v2,0]T3. Zauważmy, że

u*×v*=|u1u2v1v2|e3,

więc

u*×v*=|u1u2v1v2|2=|det[uv]|.

Rysunek 10.2: Wyznacznik i pole
Definicja 10.8.

Iloczyn mieszany w R3

Dla wektorów u,v,w3 definiujemy ich iloczyn mieszany jako liczbę

(u×v|w).

Zauważmy, że

det[wuv] =det[wuv]T
=|w1w2w3u1u2u3v1v2v3|
=|u2u3v2v3|w1-|u1u3v1v3|w2+|u1u2v1v2|w3
=(u×v|w).
Wniosek 10.16 (Objętość równoległościanu).

Objętość równoległościanu rozpiętego na wektorach u,v,w jest równa

|(u×v|w)|.
Dowód.

Objętość równoległościanu rozpiętego na wektorach u,v,w jest równa iloczynowi pola równoległoboku rozpiętego na wektorach u, v (jest ono równe u×v) i odległości h punktu w od płaszczyzny P rozpiętej na wektorach u, v. Wysokość h jest długościom rzutu prostopadłego wektora w na wektor u×v prostopadły do P. Wtedy h=(w|u×v)u×v2(u×v), czyli

hu×v=(w|u×v)u×v2(u×v)u×v=|(u×v|w)|.

Wniosek 10.17.

Niech u,v,wR3. Objętość równoległościanu rozpiętego na wektorach u,v,w jest równa

|det[uvw]|.
Wniosek 10.18 (Iloczyn wektorowy i mieszany – podsumowanie).

Niech u,v,w,qR3. Zachodzą równości

  • (1)

    u×v=-v×u.

  • (3)

    (u|v×w)=(u×v|w).

  • (4)

    Zachodzi tożsamość Jacobiego

    u×(v×w)+v×(w×u)+w×(u×v)=0.
  • (5)

    Zachodzi toṡamość Lagrange’a

    u2v2=u×v2+((u|v))2.
  • (6)
    (u×v|w×q)=|(u|w)(v|w)(u|q)(v|q)|.
  • (8)

    det[u|v|w]=(u×v|w).

  • (9)

    |det[u|v|w]|=|(u×v|w)| jest objętością równoległościanu rozpiętego na wektorach u,v,w.

  • (10)

    Iloczyn wektorowy nie jest przemienny ani łączny.

Lemat 10.8.

Jeśli AM3×3(R) i u,vR3, to

AT((Au)×(Av))=det(A)(u×v).

W szczególności, jeśli ATA=I, to

(Au)×(Av)=det(A)A(u×v).

Jeśli ASO(3) tzn. AAT=I i det(A)=1, to

(Au)×(Av)=A(u×v).
Dowód.

Dla dowolnego w3 zachodzą równości

((Au)×(Av)|Aw) =det[Au|Av|Aw]
=det(A[u|v|w])
=det(A)det([u|v|w])
=(det(A)(u×v)|w),

oraz

((Au)×(Av)|Aw)=(AT((Au)×(Av))|w).

Stąd

AT((Au)×(Av))=det(A)(u×v).

10.4 Orientacja n

Niech V będzie przestrzenią wektorową nad ciałem o wymiarze skończonym n1. Dla dwóch uporządkowanych baz B=b1,,bn oraz B=b1,,bn przez SB,B=[sij] oznaczamy macierz przejścia od bazy B do B, czyli

bi=j=1nsjibj,i=1,,n.

Niech oznacza zbiór wszystkich baz V. W zbiorze definiujemy relację równoważności R przez: BRB wtedy i tylko wtedy, gdy

detSB,B>0.
Definicja 10.9.

Orientacja

Powiemy, że bazy B i B zadają taką samą orientację V jeśli BRB. Przez wybór orientacji w V rozumiemy wybór dowolnej uporządkowanej bazy (jej klasy abstrakcji w relacji R) B=b1,b2,,bn.

Przykład 10.18 (Standardowa orientacja Rn).

Dla n1 standardowa orientacja n jest zadana przez bazę standardową e1,,en.

  • (1)

    Przypomnijmy, że macierz przejścia od bazy B=b1,,bn do bazy standardowej jest równa S=[b1||bn]. W szczególności, B zadaje standardową orientację n, gdy det[b1||bn]>0.

  • (2)

    Baza b1, b2 dla 2 zadaje standardową orientację 2 wtedy i tylko wtedy, gdy najkrótszy kąt od b1 do b2 jest skierowany przeciwnie do ruchu wskazówek zegara. Rzeczywiście, możemy założyć, że b1=b2=1. Niech R będzie takim obrotem, że R(b1)=e1. Zauważmy, że

    det[R(b1),R(b2)]=detR[b1|b2]=det(R)det[b1,b2].

    Ponieważ det(R)=1, więc b1,b2 zadaje standardową orientację wtedy i tylko wtedy, gdy R(b1),R(b2) zadaje standardową orientację 2. Możemy więc założyć, że b1=e1. Niech b2=[a,b]T. Wtedy det[e1|b2]=b>0 wtedy i tylko wtedy, gdy najkrótszy kąt między e1 i [a,b]T jest skierowany przeciwnie do ruchu wskazówek zegara.

  • (3)

    Jeśli b1,b23 są liniowo niezależne, to b1,b2,b1×b2 zadaje standardową orientację 3. Rzeczywiście,

    det[b1|b2|b1×b2]=(b1×b2|b1×b2)>0.
Wniosek 10.19.

Niech L:RnRn będzie izomorfizmem liniowym. Następujące warunki są równoważne

  • (1)

    baza L(e1),,L(en) zadaje standardową orientację n,

  • (2)

    detL>0,

  • (3)

    jeśli b1,,bn zadaje standardową orientację n, to L(b1),,L(bn) zadaje standardową orientację n.

Rozdział 11 Do czego zmierzamy?

SŁOWA KLUCZOWE ROZDZIAŁU wektor własny wartość własna diagonalizacja baza wektorów własnych diagonalizacja ortogonalna macierz stochastyczna dominująca wartość własna wielomian charakterystyczny zespolona postać Jordana rzeczywista postać Jordana krotność geometryczna i algebraiczna twierdzenie Cayleya–Hamiltona diagonalizacja ortogonalna macierzy symetrycznej

Przedstawimy teraz motywację dla naszych dalszych rozważań. Jak już pewnie zauważyliście szczególnie łatwe do analizy są macierze diagonalne

D=diag(λ1,,λn),λ1,,λn.

Przykładowo,

Dk=diag(λ1k,,λnk),detD=λ1λn.

Jeśli D jest nieosobliwa, to D-1=diag(1/λ1,,1/λn).

Załóżmy, że macierz AMn×n() jest podobna do macierzy diagonalnej D, czyli istnieje taka macierz nieosobliwa

S=[v1vn]Mn×n(),

że

S-1AS=D.

Wtedy A=SDS-1, więc

Ak=SDkS-1,detA=detD,

czyli A jest równie prosta do analizy jak macierz diagonalna D.

PROBLEM 1 Scharakteryzować macierze AMn×n(), które są diagonalizowalne tzn. istnieje taka macierz nieosobliwa S=[v1vn]Mn×n(), że S-1AS=D=diag(λ1,,λn)=[λ1e1λnen].

Załóżmy, że S-1AS=D. Wtedy AS=SD, czyli

[Av1Avn] =AS=SD
=S[λ1e1λnen]
=[λ1Se1λnSen]
=[λ1v1λnvn].
Stąd
Av1=λ1v1,,Avn=λnvn.

Z powyższych rozważań wynika następujące:

Twierdzenie 11.1 (Diagonalizacja).

Dla macierzy AMn×n(R) poniższe warunki są równoważne

  • (i)

    istnieje taka macierz nieosobliwa SMn×n(), że S-1AS jest diagonalna,

  • (ii)

    istnieje baza v1,,vn dla n oraz takie skalary λ1,,λn, że

    Avi=λivi,i=1,,n.

Warto jakoś nazwać własność jaką spełniają wektory vi w punkcie (ii). Będą one pełniły podstawową rolę w naszych dalszych rozważaniach.

Definicja 11.1.

Wektor własny i wartość własna

Powiemy, że niezerowy wektor 0vn jest wektorem własnym macierzy rzeczywistej AMn×n(), jeśli istnieje taka liczba rzeczywista λ, że

Av=λv.

Liczbę λ nazywamy wartością własną macierzy AMn×n() dla wektora własnego vn.

Twierdzenie 11.1 możemy sformułować następująco:

Twierdzenie 11.2 (Diagonalizacja=baza wektorów własnych).

Dla macierzy AMn×n(R) poniższe warunki są równoważne

  • (i)

    istnieje taka macierz nieosobliwa SMn×n(), że S-1AS jest diagonalna,

  • (ii)

    istnieje baza v1,,vn dla n złożona z wektorów własnych A.

Podamy geometryczną interpretację wektora własnego.

Wniosek 11.1.

Dla niezerowego wektora vRn i macierzy AMn×n(R) poniższe warunki są równoważne

  • (1)

    v jest wektorem własnym A,

  • (2)

    prosta generowana przez v jest niezmiennicza dla A tzn.

    A(span{v})span{v}.
  • U

    Nie każda macierz rzeczywista ma jakiś wektor własny. Wystarczy znaleźć macierz rzeczywistą A, która nie ma prostych niezmienniczych. Przykładowo, macierz obrotu o kąt π2, czyli

    A=[0-110],

    nie ma żadnej prostej niezmienniczej.

    Możemy na to spojrzeć jeszcze trochę inaczej. Wektor 0v2 jest wektorem własnym A, gdy dla pewnej liczby rzeczywistej λ zachodzi warunek

    (A-λI)v=0,

    czyli ker(A-λI)0, więc det(A-λI)=0 dla pewnej liczby rzeczywistej λ. Zauważmy, że w naszym przykładzie

    det(A-λI)=λ2+10,

    dla λ.

    Macierz rzeczywistą A możemy traktować w naturalny sposób jako macierz zespoloną. Możemy, więc spytać o istnienie zespolonych wektorów własnych v2. Zauważmy, że det(A-λI)=0 dla λ=±i. Rozważmy macierz

    A-iI=[-i-11-i]

    i znajdźmy taki niezerowy wektor v=[a+ib,c+id]2, że (A-iI)v=0. Mamy

    (A-iI)v=[-ia+b-c-id,a+ib-ic+d]T=[0,0]T,

    czyli

    a+d=0,b-c=0.

    Wektor v ma więc postać

    v=[a+ib,b-ia]T=[a+ib,-i(a+ib)]T=(a+ib)[1,-i]T.

    Wynika stąd, że

    A[1,-i]T=i[1,-i]T,

    czyli [1,-i]T jest zespolonym wektorem własnym A z wartością własną i. Analogicznie sprawdzamy, że [1,i]T jest zespolonym wektorem własnym A dla wartości własnej -i. Macierz A jest diagonalizowalna jako macierz zespolona. Dla

    S=[11i-i]

    mamy

    S-1AS=[i00-i].
  • U

    Pojęcie wektora własnego możemy też zdefiniować w bardziej ogólnym kontekście. Niech L:VV będzie odwzorowaniem liniowym. Powiemy, że niezerowy wektor vV jest wektorem własnym L jeśli

    L(v)=λv.

    Przestrzeń V nie musi być skończenie wymiarowa. Przykładowo, niech C(,) będzie przestrzenią wszystkich funkcji f: mających ciągłą pochodną dowolnego rzędu. Wtedy odwzorowanie (operator różniczkowania)

    L:C(,)ffC(,)

    jest liniowe. Ponadto, dla f=eλxC(,) mamy

    L(f) =(eλx)
    =λeλx
    =λf,

    czyli f=eλx jest wektorem własnym L dla wartości własnej λ.

    Uzasadnimy teraz, że jeśli L(f)=λf, to f=Ceλx dla pewnego C. Rzeczywiście, równość f=λf oznacza, że f-λf=0, czyli również

    fe-λx-λe-λxf=(fe-λx)=0,

    czyli fe-λx jest funkcją stałą, więc fe-λx=C.

    Wynika stąd, że jądro ker(L-λI) ma wymiar 1 oraz

    ker(L-λI)=span{eλx}.
  • U

    Niech L:VV będzie odwzorowaniem liniowym i niech v1,,vnV będzie bazą V. Rozważmy macierz AMn×n(𝔽) odwzorowania L w tej bazie. Wektor v=x1v1++xnvn jest wektorem własnym L dla wartości własnej λ𝔽 wtedy i tylko wtedy, gdy wektor współrzędnych [x1,,xn]T𝔽n jest wektorem własnym macierzy A dla wartości własnej λ.

Możemy pójść jeszcze krok dalej. Wektory własne macierzy diagonalnej D to wektory bazy standardowej e1,,en. Ma ona własność

(ei|ej)=δij.

Takie bazy n będziemy nazywać ortonormalnymi. Wektory ei oraz ej są ortogonalne i mają normę 1.

PROBLEM 2 Scharakteryzować macierze AMn×n(), które są ortogonalnie diagonalizowalne tzn. istnieje taka macierz nieosobliwa S=[v1vn]Mn×n(), że S-1AS=D=diag(λ1,,λn)=[λ1e1λnen] oraz (vi|vj)=δij.

Zaczniemy od przyglądnięcia się takim macierzom

S=[v1vn]Mn×n(),

że (vi|vj)=δij. Bezpośrednio z definicji iloczynu macierzy i definicji macierzy transponowanej wynika, że wtedy

STS=I,czyliS-1=ST.

Takie macierze będziemy nazywać ortogonalnymi. W Problemie 2 pytamy więc o istnienie takiej macierzy ortogonalnej SMn×n(), że

S-1AS=STAS=D

jest diagonalna. Zauważmy, że wtedy A=SDST oraz

AT =(SDST)T
=(ST)TDTST
=SDST
=A,

czyli A musi być symetryczna. Jest to warunek konieczny, aby zaszła sytuacja opisana w Problemie 2. W następnych rozdziałach pokażemy, że macierze symetryczne to jedyne macierze rzeczywiste rozwiązujące Problem 2.

11.1 Rozkład Jordana w wymiarze 2

Spróbujmy nabrać intuicji w przypadku wymiaru 2. Zakładamy, że ciało F jest równe lub . Rozważmy macierz AM2×2(𝔽).

Definicja 11.2.

Wektor własny i wartość własna

Liczbę λ𝔽 nazywamy wartością własną macierzy AM2×2(𝔽), jeśli istnieje taki niezerowy wektor v𝔽2, że

Av=λv.

Każdy taki wektor v nazywamy wektorem własnym A odpowiadającym wartości własnej λ.

  • U

    Niech 𝔽=. Interpretacja geometryczna jest następująca. Jeśli v2 jest wektorem własnym dla wartości własnej λ, to prosta l=span{v} jest niezmiennicza dla A tzn. jeśli wl, to Awl.

Jeśli v𝔽2 jest wektorem własnym dla wartości własnej λ𝔽, to (A-λI)v=0. Oznacza to, że ker(A-λI){0}, czyli det(A-λI)=0. Odwrotnie, jeśli det(A-λI)=0 dla pewnego skalara λ𝔽, to macierz A-λI jest osobliwa. W szczególności, ker(A-λI){0}, czyli istnieje wektor własny vker(A-λI).

Wniosek 11.2.

Dla AM2×2(F) i λF następujące warunki są równoważne

  • (1)

    λ jest wartością własną A;

  • (2)

    ker(A-λI){0};

  • (3)

    A-λI jest osobliwa;

  • (4)

    det(A-λI)=0.

Warunek (4) oznacza, że wartość własna λ𝔽 jest pierwiastkiem wielomianu

pA(x)=det(A-xI)

Wielomian pA nazywamy wielomianem charakterystycznym macierzy A. Bezpośredni rachunek pokazuje, że

pA(x) =det[a11-xa12a21a22-x]
=x2-(a11+a22)x+(a11a22-a12a22)
=x2-tr(A)x+det(A).
  • U

    Macierze podobne mają takie same wielomiany charakterystyczne. Rzeczywiście, jeśli B=S-1AS, to

    det(B-xI) =det(S-1AS-xI)
    =det(S-1(A-xI)S)
    =det(A-xI).

    Jeśli macierze A i B mają takie same wielomiany charakterystyczne, to nie muszą być podobne. Przykładowo, A=0 oraz B=[0100] mają taki sam wielomian charakterystyczny p(x)=x2, ale nie są podobne, bo macierz zerowa jest podobna tylko do siebie samej.

Dla 𝔽= zasadnicze twierdzenie algebry gwarantuje, że wielomian pA ma dwa (niekoniecznie różne) pierwiastki zespolone λ1, λ2. Są one wtedy wartościami własnymi macierzy AM2×2(). Macierz zespolona ma więc zawsze dwie wartości własne. Nie oznacza to, że ma ona dwa liniowo niezależne wektory własne. Przykładowo, wartościami własnymi macierzy

A=[λ10λ],λ,

λ1=λ2=λ. Mamy więc dwukrotną wartość własną λ. Zobaczmy jak wyglądają wektory własne. Niezerowy wektor v=[v1,v2]T2 jest wektorem własnym dla λ jeśli (A-λI)v=0, czyli

[00]=[0100][v1v2]=[v20].

Stąd v2=0, czyli wektor własny v ma postać

[v10]=v1[10]=v1e1.

W przypadku 𝔽=, z algebraicznego punktu widzenia dla wielomianu charakterystycznego mamy trzy możliwości:

  • (i)

    pA ma dwa różne pierwiastki rzeczywiste;

  • (ii)

    pA ma dwukrotny pierwiastek rzeczywisty;

  • (iii)

    pA ma dwa sprzężone (nierzeczywiste) pierwiastki zespolone.

W przypadku (iii) macierz rzeczywista A nie ma rzeczywistych wartości własnych.

Wniosek 11.3.

Niech AM2×2(C). Jeśli λ1,λ2C są pierwiastkami równania charakterystycznego

x2-tr(A)x+det(A)=0,

to zachodzą wzory Viete’a

tr(A)=λ1+λ2,det(A)=λ1λ2.

Dowód.

Z założenia mamy

(x-λ1)(x-λ2)=pA(x)=x2-tr(A)x+det(A),

wystarczy więc porównać współczynniki wielomianów po obu stronach równości. ∎

  • U

    Dla dowolnych macierzy X,YM2×2() macierze XY i YX mają takie same wielomiany charakterystyczne. Wynika, to z faktu, że

    trXY=trYX,detXY=detYX.
Lemat 11.1.

Jeśli AM2×2(F) ma dwie różne rzeczywiste wartości własne λ1λ2 oraz viF2 są wektorami własnymi odpowiadającymi λiF, to v1, v2 są liniowo niezależne. W szczególności, v1,v2 tworzą bazę F2.

Dowód.

W przeciwnym razie v2=pv1 dla pewnego skalara p𝔽. Wtedy

λ2v2 =A(v2)
=A(pv1)
=pA(v1)
=pλ1v1
=λ1v2,

czyli λ1=λ2, co prowadzi do sprzeczności. Skorzystaliśmy tu z faktu, że v20. ∎

Twierdzenie 11.3.

Jeśli AM2×2(F) ma dwa liniowo niezależne wektory własne v1,v2F2 odpowiadające wartościom własnym λ1, λ2F (niekoniecznie różnym), to dla macierzy B=[v1v2] mamy

Λ:=B-1AB=[λ100λ2]

Dowód.

Z definicji B mamy, że B(ei)=vi dla i=1,2. Oczywiście B jest odwracalna oraz dla i=1,2 mamy

B-1ABei =B-1Avi
=B-1(λivi)
=λiei.

  • U

    Twierdzenie 11.3 orzeka, że jeśli 𝔽2 ma bazę złożoną z wektorów własnych, to AM2×2(𝔽) ma w tej bazie postać diagonalną Λ. Macierz Λ nazywamy postacią Jordana macierzy A.

Rysunek 11.1: Działanie macierzy A na wektorach własnych v1, v2 o wartościach własnych λ1=4, λ2=-3.
Przykład 11.1.

Znajdziemy postać Jordana macierzy

A=[323-2].

Szukamy najpierw wartości własnych czyli pierwiastków równania charakterystycznego

pA(x)=x2-x-12=0.

Są nimi liczby λ1=4 oraz λ2=-3. Aby znaleźć wektor własny dla λ1=4 znajdujemy jądro macierzy

A-4I=[-123-6].

Rozwiązując równanie (A-4I)x=0 otrzymujemy, że x=[2x2,x2]T. Jednym z wektorów własnych jest v1=[2,1]T. Analogicznie, v2=[-1,3]T jest wektorem własnym dla λ2. W bazie v1, v2 macierz A ma postać diagonalną

Λ=[400-3].
  • !

    Macierz zespolona AM2×2() może mieć rzeczywistą wartość własną, ale może nie mieć odpowiadającego jej rzeczywistego wektora własnego w 2. Dla przykładu rozważmy macierz

    A=[0-ii0].

    Wielomian charakterystyczny ma postać

    pA(x)=x2-1,

    więc A ma wartości własne λ1=1 oraz λ2=-1. Wektor własny [x,y]T2 dla λ1=1 jest niezerowym rozwiązaniem równania

    [-1-ii-1][xy]=[00],

    czyli

    -x-iy=0,ix-y=0.

    Stąd, y=ix oraz każdy wektor własny jest postaci

    c[1,i]T,c{0}.

    Nie może on być wektorem z 2.

Zajmiemy się teraz przypadkiem, gdy λ𝔽 jest dwukrotnym pierwiastkiem wielomianu charakterystycznego pA. Mogą zachodzić dwie możliwości:

  • dimker(A-λI)=2. Mówimy wtedy, że krotność geometryczna wartości własnej λ jest równa jej krotności algebraicznej. Wówczas A ma dwa liniowo niezależne wektory własne odpowiadające λ i jesteśmy w sytuacji opisanej Twierdzeniem 11.3. Wtedy postać Jordana Λ macierzy A jest diagonalna:

    Λ:=B-1AB=[λ00λ]=λI.

    Z powyższej równości wynika, że wtedy A=λI.

  • dimker(A-λI)=1. Istnieje wtedy tylko jeden liniowo niezależny wektor własny v𝔽2 dla λ𝔽.

Wniosek 11.4.

Jeśli λF jest dwukrotnym pierwiastkiem charakterystycznym macierzy AM2×2(F) i AλI, to dimker(A-λI)=1 i A ma tylko jeden liniowo niezależny wektor własny.

Lemat 11.2 (Twierdzenie Cayleya–Hamiltona).

Dla macierzy AM2×2(F) zachodzi równość

pA(A)=A2-tr(A)A+det(A)I=[0000].
Dowód.

Zastosujemy brutalną siłę, czyli bezpośredni rachunek. Niech A=[abcd]. Ponieważ pA(x)=(x-a)(x-d)-bc, więc

pA(A) =(A-aI)(A-dI)-bcI
=[0bcd-a][a-dbc0]-[bc00bc]
=[bc0c(a-d)+(d-a)cbc]-[bc00bc]
=[0000].

Przykład 11.2.

Niech AM2×2(). Twierdzenie Cayleya–Hamiltona pozwala łatwo wyznaczyć An dla n. Niech λ1, λ2 będą wartościami własnymi A. Wtedy

A2-(λ1+λ2)A+λ1λ2I=0,

czyli

(A-λ1I)(A-λ2I)=0.

Jeśli λ1λ2, to rozważamy macierze

X=A-λ2Iλ1-λ2,Y=A-λ1Iλ2-λ1.

Wtedy

X2=X,XY=YX=0,Y2=Y

Środkowa równość wynika bezpośrednio z Twierdzenia Cayleya–Hamiltona. Sprawdzimy równość X2=X. Mamy

X2 =(A-λ2I)2(λ1-λ2)2
=(A-λ2I)(A-λ1I+(λ1-λ2)I)(λ1-λ2)2
=(A-λ2I)(A-λ1I)(λ1-λ2)2+(A-λ2)(λ1-λ2)I(λ1-λ2)2
=A-λ2I(λ1-λ2)
=X.

Stąd dla k2 mamy

Xk=X,Yk=Y,λ1λ2.

Dla λ1=λ2 rozważamy

Z=A-λ1I.

Wtedy Zk=0 dla k2. Mamy więc

An={(λ1X+λ2Y)n=λ1nX+λ2nY,gdy λ1λ2(λ1I+Z)n=λ1nI+nλ1n-1Z,gdy λ1=λ2
Wniosek 11.5.

Jeśli AM2×2(C) jest nieosobliwa, to

A-1=1detA(trAI-A),trA-1=trAdetA.

Ponadto,

detA=12((trA)2-trA2).
Dowód.

Z twierdzenia Cayleya–Hamiltona mamy

A2-tr(A)A+det(A)I=[0000].

Mnożąc powyższą równość przez A-1 otrzymujemy, że

A-1=1detA(trAI-A).

Biorąc ślady obu stron w tej równości dostajemy, że trA-1=trAdetA. Wzór na detA otrzymujemy obliczając ślady macierzy po obu stronach w równości Cayleya–Hamiltona. ∎

Wniosek 11.6.

Niech AM2×2(C). Jeśli A{αI:αC} oraz A2-aA+bI= dla pewnych a,bC, to

a=trA,b=detA.
Dowód.

Z założenia i twierdzenia Cayleya–Hamiltona wynika, że

(a-trA)A=(b-detA)I.

Zauważmy, że a-trA=0, bo inaczej A=b-detAa-trAI, co jest sprzeczne z założeniem. Stąd również b-detA=0. ∎

  • U

    Macierz AM2×2() jest nilpotentna, jeśli An=0 dla pewnego n. Pokażemy, że wtedy 0 jest jedyną wartością własną A oraz A2=0. Zauważmy, że jeśli λ jest wartością własną dla wektora własnego v0, to 0=Anv=λnv, czyli λ=0. W szczególności, trA=0 i detA=0, czyli pA(x)=x2. Z twierdzenia Cayleya–Hamiltona wynika, że A2=0.

Lemat 11.3.

Jeśli λF jest dwukrotnym pierwiastkiem wielomianu charakterystycznego pA, to

(A-λI)2=[0000].
Dowód.

Ze wzorów Viete’a mamy tr(A)=2λ i det(A)=λ2. Z Lematu Cayleya–Hamiltona wynika, że

A2-2λA+λ2I=[0000].

Ponieważ macierze A i λI komutują ze sobą, więc

(A-λI)2=A2-2λA+λ2I.

Twierdzenie 11.4.

Jeśli λF jest dwukrotną wartością własną macierzy AM2×2(F) i AλI, to istnieje taka baza v,w dla F2, że

Av=λv,Aw=v+λw

W szczególności, dla macierzy S=[vw] mamy następującą postać Jordana dla A:

Λ=S-1AS=[λ10λ]

Dowód.

Niech 0vker(A-λI) będzie dowolnym wektorem własnym dla λ. Każdy wektor własny A jest postaci pv, gdzie v jest pewnym wektorem własnym A dla λ oraz 0p𝔽. Niech 0u𝔽2 będzie dowolnym wektorem liniowo niezależnym z v. W szczególności, u nie jest wektorem własnym odpowiadającym λ, więc (A-λI)u0. Ponieważ,

0=(A-λI)2u=(A-λI)(A-λI)u,

więc (A-λI)uker(A-λI) jest wektorem własnym odpowiadającym λ. Stąd

(A-λI)u=pv,

dla pewnego 0p. Dla wektora w=1pu otrzymujemy, że (A-λI)w=v, czyli Aw=v+λw. ∎

POSTAĆ JORDANA MACIERZY ZESPOLONEJ Macierz zespolona AM2×2() ma jedną z dwóch postaci Jordana [λ100λ2],[λ10λ].
Wniosek 11.7.
  • (i)

    Jeśli 0AM2×2() jest macierzą nilpotentną, to

    A=S[0100]S-1

    dla pewnej macierzy nieosobliwej S.

  • (ii)

    Jeśli AM2×2() jest taka, że A2=A, to A=0 lub A=I lub

    A=S[1000]S-1

    dla pewnej macierzy nieosobliwej S.

  • (iii)

    Jeśli AM2×2() jest taka, że A2=I, to A=±I lub

    A=S[100-1]S-1

    dla pewnej macierzy nieosobliwej S.

  • (iv)

    Jeśli AM2×2() jest taka, że A2=-I, to A=±iI lub

    A=S[0-110]S-1

    dla pewnej macierzy nieosobliwej S.

Wniosek 11.8.

Dla dowolnej macierzy AM2×2(C) mamy

  • (i)

    A jest podobna do AT.

  • (ii)

    A jest podobna do macierzy symetrycznej.

  • (iii)

    A jest iloczynem macierzy symetrycznych.

Dowód.

Punkt (i). Możemy założyć, że A jest w postaci Jordana. Jeśli jest ona diagonalna, to nie ma czego dowodzić. Załóżmy więc, że

A=[λ10λ].

Wtedy dla S=[0110] mamy S-1AS=AT.

Punkt (ii). Ponownie możemy założyć, że A=[λ10λ]. Szukamy takiej macierzy nieosobliwej S=[abcd]M2×2(), że S-1AS jest symetryczna. Dla Δ=detS0 mamy

S-1AS=[cd+λΔd2-c2-cd+λΔ].

Ponieważ szukamy macierzy symetrycznej, więc musi zachodzić warunek c2+d2=0. Wystarczy więc przyjąć takie a,b,c,d, że ad-bc0 i c2+d2=0. Zwróćmy uwagę, że S nie może być rzeczywista. Przykładowo, dla d=i=a, c=1 i b=0 mamy

S=[i01i],S-1AS=[λ-i11λ+i].

Punkt (iii). Zauważmy najpierw, że możemy założyć, że A jest w postaci Jordana Λ, bo jeśli Λ=BC jest iloczynem macierzy symetrycznych, to

A=SΛS-1=(SBST)((S-1)TCS-1)

jest również iloczynem macierzy symetrycznych. Dla Λ=[λ100λ2] wystarczy przyjąć

B=[λ1001],C=[100λ2].

Jeśli Λ=[λ10λ], to przyjmujemy

B=[1110],C=[0λλ1-λ].

  • U

    Rozważmy macierz A w postaci bloku Jordana

    A=[λ10λ].

    Dla macierzy

    S=[0110]

    mamy S-1=S oraz

    S-1AS =[0110][λ10λ][0110]
    =[λ01λ]
    =AT.

Naturalne jest pytanie o postać macierzy AM2×2(), gdy jej wielomian charakterystyczny pA ma dwie zespolone wartości własne λ1=α+iβ, λ2=α-iβ oraz β0. Macierz AM2×2() możemy traktować jako element przestrzeni M2×2(). Istnieje więc wektor własny v2 odpowiadający wartości własnej λ1=α+iβ. Wektor v2 wygodnie jest zapisać w postaci

v=[a1+ia2b1+ib2]=[a1b1]+i[a2b2]:=v1+iv2,v1,v22.

Wówczas

Av=Av1+iAv2.

Ponadto,

A(v1-iv2)=(α-iβ)(v1-iv2),

czyli wektor v1-iv2 jest wektorem własnym odpowiadającym wartości własnej λ2=α-iβ.

Pokażemy, że wektory v1,v22 są liniowo niezależne. Rzeczywiście, przypuśćmy, że v1=pv2 dla pewnej liczby rzeczywistej p. Wtedy

A(v1+iv2)=(α+iβ)(v1+iv2)=(α+iβ)(p+i)v2

oraz

A(v1+iv2)=A((p+i)v2)=(p+i)A(v2),

więc A(v2)=(α+iβ)v2, co prowadzi do sprzeczności z warunkiem β0.

Zauważmy, że

A(v1)+iA(v2)=A(v1+iv2)=(α+iβ)(v1+iv2),

więc

A(v1)=αv1-βv2,A(v2)=βv1+αv2.

Dla macierzy S=[v1v2] otrzymujemy równość

Λ:=S-1AS=[αβ-βα].

Dla S1=[v2v1] mamy

S1-1AS1=[α-ββα].
Wniosek 11.9 (Rzeczywista postać Jordana).

Jeśli λ1=α+iβ, λ2=α-iβ z β0 są pierwiastkami wielomianu charakterystycznego pA dla macierzy AM2×2(R), to istnieje taka nieosobliwa macierz SM2×2(R), że

Λ=S-1AS=[αβ-βα].

Ponadto, S=[v1v2] dla dowolnego takiego niezerowego wektora v1+iv2C, że

A(v1+iv2)=(α+iβ)(v1+iv2).
Przykład 11.3 (Ciąg Fibonacciego).

Ciąg Fibonacciego un jest zdefiniowany rekurencyjnie wzorem

un+1=un+un-1,u1=1,u0=0.

Dla macierzy

A=[1110]

mamy więc

[1110][unun-1]=[un+1un].

Wynika stąd, że

[un+1un]=An[u1u0]=Ane1.

Wielomian charakterystyczny A ma postać pA(x)=x2-x-1, więc wartościami własnymi A

λ+=5+12,λ-=1-52.

Wektory własne mają postać

v+=[(1+5)/2,1]T,v-=[(1-5)/2,1]T.

Ponieważ

e1=15(v+-v-),

więc

[un+1un]=15(λ+nv+-λ-nv-),

czyli otrzymujemy formułę Bineta

un=15(1+52)n-15(1-52)n.
Przykład 11.4.

Rozważmy macierz

A=[31-11].

Jej wielomian charakterystyczny ma postać

pA(x)=x2-4x+4=(x-2)2.

Stąd λ=2 jest dwukrotną wartością własną macierzy A. Ponieważ

A-2I=[11-1-1],

więc [x,y]Tker(A-2I) jeśli x+y=0, czyli

ker(A-2I)=span{[1,-1]T}.

Wektor v=[1,-1]T jest wektorem własnym i każdy inny wektor własny jest liniowo zależny z v.

Szukamy teraz takiego wektora w=[x,y]T2, że

(A-2I)w=v=[1,-1]T.

Musimy więc rozwiązać układ równań

x+y=1,-x-y=-1.

Rozwiązaniami są wektory postaci [x,1-x]T=x[1,-1]T+[0,1]T. Możemy więc przyjąć, że

w=[1,0]T=e1.

Dla macierzy

S=[11-10],

mamy

S-1AS=[0-111][31-11][11-10]=[2102].
Przykład 11.5.

Macierz

A=[0-410]

ma zespolone wartości własne λ1=2i oraz λ2=-2i. Znajdziemy wektor własny v1=[a+bi,c+di]T2 dla λ1=2i. Szukamy niezerowych rozwiązań równania

0=(A-2iI)v =[-2i-41-2i][a+bic+di]
=[-2ia+2b-4c-4dia+bi-2ic+2d]
=[-2ia+2(b-2c)-2i(a+2d)a+2d+i(b-2c)].

Stąd a+2d=0 oraz b-2c=0. Możemy więc przyjąć, że

v1=[2,-i]T=[2,0]T+i[0,-1]T.

Dla wartości własnej λ2=-2i wektorem własnym jest więc v2=[2,i]T. Dla macierzy

S=[22-ii]

mamy

S-1AS=14i[i-2i2][0-410][22-ii]=[2i00-2i]

Aby znaleźć rzeczywistą postać Jordana rozważamy macierz

P=[200-1]

której kolumnami są część rzeczywista i urojona wektora v1=[2,-i]T=[2,0]T+i[0,-1]T. Wtedy

P-1AP=[1/200-1][0-410][200-1]=[02-20].

11.2 Rozkład Jordana w wymiarze 3

Podamy dowód Twierdzenia Jordana dla macierzy zespolonej AM3×3(). Zastosujemy podejście, które uogólnia się na wyższe wymiary.

Twierdzenie 11.5 (Rozkład Jordana macierzy zespolonej).

Niech AM3×3(C). Istnieje taka macierz nieosobliwa SM3×3(C), że S-1AS jest jednej z poniższych postaci:

[λ1000λ2000λ3],[λ1000λ2100λ2],[λ1100λ1100λ1].

Ponadto, λiC są wartościami własnymi macierzy A.

Lemat 11.4.

Załóżmy, że wartości własne λ1,λ2,λ3C macierzy AM3×3(C) są różne. Wtedy odpowiadające im wektory własne v1,v2,v3 są liniowo niezależne oraz dla S=[v1v2v3] mamy

S-1AS=diag(λ1,λ2,λ3).
Dowód.

Zauważmy najpierw, że v1 i v2 są liniowo niezależne. Przypuśćmy, że v2=xv1 dla pewnego x. Wtedy x0, bo v20. Mamy

λ2v2 =Av2
=A(xv1)
=xλ1v1
=λ1v2,

czyli λ1=λ2, sprzeczność.

Przypuśćmy, że v3span{v1,v2}. Wtedy v3=x1v1+x2v2 dla pewnych x1,x2. Przynajmniej jedna z liczb x1, x2 jest różna od zera, bo v30. Otrzymujemy, że

λ3v3 =Av3
=A(x1v1+x2v2)
=x1λ1v1+x2λ2v2,

czyli

λ3(x1v1+x2v2)=x1λ1v1+x2λ2v2.

W efekcie

x1(λ3-λ1)v1+x2(λ2-λ1)v2=0,

co jest sprzeczne z liniową niezależnością v1 i v2. ∎

Lemat 11.5.

Niech AM3×3(C). Istnieje taka macierz nieosobliwa SM3×3(C), że macierz S-1AS jest górnie trójkątna.

Dowód.

Niech λ będzie wartością własną A i niech v3 będzie odpowiadającym jej wektorem własnym. Uzupełniamy v do bazy v, u, w dla 3. Rozważmy macierz W=[vuw]. Macierz W-1AW ma postać blokową

W-1AW=[λ**0ab0cd].

Z rozkładu Jordana w wymiarze 2 istnieje taka macierz nieosobliwa VM2×2(), że

V-1[abcd]V=T

jest górnie trójkątna. Definiujemy macierz nieosobliwą

U=[100V]M3×3().

Wtedy

U-1W-1AWU =U-1[λ**0ab0cd]U
=[100V-1][λ**0ab0cd][100V]
=[λ*0T],

jest górnie trójkątna i teza zachodzi dla S=WU. ∎

Lemat 11.6.

Rozważmy macierz górnie trójkątną z 0 jako jedyną wartością własną

A=[0ab00c000].

Wtedy zachodzi jeden z warunków

  • (i)

    A=0,

  • (ii)

    dimkerA=2 i A jest podobna do macierzy

    [010000000],
  • (iii)

    dimkerA=1 oraz A jest podobna do macierzy

    [010001000].
Dowód.

Sprawdzamy, że

A2=[0ab00c000][0ab00c000]=[00ac000000],
A3=[0ab00c000][00ac000000]=0.

Mamy trzy możliwości

  • (i)

    A=0,

  • (ii)

    A0, A2=0,

  • (iii)

    A20, A3=0.

W przypadku (ii) a=0 lub c=0, bo A2=0 i macierz A jest jednej z postaci

A=[00b00c000]c0,A=[0ab000000]a0,A=[00b000000]b0.

We wszystkich przypadkach rankA=dimimA=1 oraz

imAkerA,dimkerA=2.

Inkluzja imAkerA wynika stąd, że A2=0. Niech v1imA będzie niezerowym wektorem. Istnieje więc taki (niezerowy) wektor v23, że Av2=v1. Wybieramy teraz wektor v3kerA liniowo niezależny z v1. Rozważmy macierz

S=[v1v2v3].

Ponieważ v2kerA, więc v1,v2,v3 są liniowo niezależne, czyli S jest nieosobliwa. Ponadto,

S-1AS=[010000000]

W przypadku (iii) mamy a0 i c0, więc

rankA=dimimA=2.

Ponadto,

imA2kerA,dimkerA=1,więcimA2=kerA.

Niech vkerA będzie wektorem własnym dla wartości własnej 0. Ponieważ

imA2=kerA,

więc istnieje taki wektor u3, że A2u=v. Wektory

v,Au,u

są liniowo niezależne. Rzeczywiście, przypuśćmy, że xv+yAu+zu=0 dla pewnych x,y,z. Wtedy

0=A2(xv+yAu+zu)=zv,

czyli z=0, bo v0. W konsekwencji,

0=A(xv+yAu)=yv,

czyli y=0. Z równości xv=0 również x=0. Dla

S=[vAuu]

mamy

S-1AS=[010001000]

Wniosek 11.10.

Załóżmy, że λC jest 3-krotną wartością własną macierzy AM3×3(C). Wtedy

  • (i)

    jeśli dimker(A-λI)=3, to A=λI,

  • (ii)

    jeśli dimker(A-λI)=2, to A jest podobna do macierzy

    [λ100λ000λ].
  • (iii)

    jeśli dimker(A-λI)=1, to A jest podobna do macierzy

    [λ100λ100λ].
Dowód.

Z Lematu 11.5 możemy założyć, że A jest górnie trójkątna. Stosujemy Lemat 11.6 do macierzy A-λI. ∎

Lemat 11.7.

Załóżmy, że AM3×3(C) jest macierzą górnie trójkątną postaci

A=[λab00c000],λ0.

Wtedy

  • (i)

    dimkerA<3,

  • (ii)

    jeśli dimkerA=2, to S-1AS=[λ00000000] dla pewnej macierzy nieosobliwej SM3×3(),

  • (iii)

    jeśli dimkerA=1, to S-1AS=[λ00001000] dla pewnej macierzy nieosobliwej SM3×3().

Dowód.

Zauważmy, że

dimimA={1,gdy c=0,2,gdy c0

czyli

dimkerA={2,gdy c=0,1,gdy c0

Załóżmy, że dimkerA=2. Niech v2,v3kerA będą bazą dla jądra. Jeśli v1 jest wektorem własnym dla λ, to v1,v2,v3 są liniowo niezależne. Przypuśćmy bowiem, że v1=x2v2+x3v3. Wtedy

λv1=Av1=x2Av2+x3Av3=0,

sprzeczność. Dla macierzy nieosobliwej S=[v1v2v3] mamy

S-1AS=[λ00000000].

Niech teraz dimkerA=1, czyli c0. Zauważmy, że teza zajdzie, gdy znajdziemy taką bazę v1,v2,v3, że

Av1=λv1,Av2=0,Av3=v2.

Z wyborem v1 i v2 nie mamy problemu: bierzemy wektory własne dla λ i 0. Musimy dobrać wektor v3, aby Av3=v2. W tym celu wystarczy zauważyć, że

kerAimA.

Rzeczywiście, A[x,y,z]T=[λx+ay+bz,cz,0]T, czyli [x,y,z]TkerA, gdy z=0 i x=aλy, czyli jądro jest generowane przez wektor [a/λ,1,0]T. Sprawdzamy łatwo, że jest on w obrazie A generowanym przez wektory [λ,0,0]T i [b,c,0]T.

Pozostaje sprawdzić, że v1,v2,v3 są liniowo niezależne. Wiemy, że v1 i v2 są liniowo niezależne. Przypuśćmy, że v3=x1v1+x2v2. Wtedy

v2 =Av3
=x1Av1+x2Av2
=x1λv1,

co jest sprzeczne z liniową niezależnością v1 i v2. ∎

Wniosek 11.11.

Załóżmy, że λ,λ1C są różnymi wartościami własnymi macierzy AM3×3(C) oraz λ1 ma krotność 2. Wtedy

  • (i)

    dimker(A-λ1I)<3,

  • (ii)

    jeśli dimker(A-λ1I)=2, to A jest podobna do macierzy

    [λ000λ1000λ1].
  • (iii)

    jeśli dimker(A-λ1I)=1, to A jest podobna do macierzy

    [λ000λ1100λ1].
Dowód.

Z Lematu 11.5 możemy założyć, że A jest górnie trójkątna. Stosujemy rozumowanie jak w dowodzie Lematu 11.7. ∎

Zajmiemy się teraz macierzami rzeczywistymi AM3×3(). Wtedy wielomian charakterystyczny pA jest stopnia 3 i ma współczynniki rzeczywiste. Jeśli liczba zespolona λ jest pierwiastkiem pA, to jest nim również λ¯. Wynika stąd, że istnieje co najmniej jeden pierwiastek rzeczywisty pA. Jest on oczywiście wartością własną pA. Jeśli A ma trzy (liczone z krotnościami) rzeczywiste wartości własne, to A ma taką samą postać Jordana jak w przypadku zespolonym.

Pozostaje nam rozważyć przypadek, gdy pA ma rzeczywisty pierwiastek λ1 i parę pierwiastków λ2=α+iβ oraz λ2¯=α-iβ z β0.

Wniosek 11.12 (Rzeczywista postać Jordana).

Jeśli dla AM3×3(R) ma rzeczywisty pierwiastek λ1=λR i parę pierwiastków sprzężonych λ2=α+iβ oraz λ2¯=α-iβ z β0, to istnieje taka nieosobliwa macierz SM3×3(R), że

S-1AS=[λ000αβ0-βα].
Dowód.

Niech v3 będzie wektorem własnym dla λ, a w=w1+iw2 zespolonym wektorem własnym dla α+iβ. Wtedy w¯=w1-iw2 jest wektorem własnym dla α-iβ. Z naszych rozważań w wymiarze 2 wystarczy pokazać, że v,w1,w2 są liniowo niezależne nad , bo wtedy teza zachodzi dla S=[vw1w2]. Wiemy już, że w1 i w2 są liniowo niezależne. Przypuśćmy, że

v=x1w1+x2w2,

dla pewnych x1,x2. Ponieważ

w1=12(w+w¯),w2=12i(w-w¯),

więc

v=x1-ix22w+x1+ix22w¯,

czyli v,w,w¯ są liniowo zależne nad . Prowadzi to do sprzeczności, bo wektory te odpowiadają różnym wartościom własnym. ∎

Przykład 11.6.

Macierz

A=[-30003-2011]

ma wartości własne λ1=-3, λ2=2+i, λ3=λ2¯=2-i. Odpowiadającymi im wektorami własnymi są przykładowo

v1=[1,0,0]T=e1,v2=[0,1+i,1]T,v3=[0,1-i,1]T.

Dla

S=[10001+i1-i011]

mamy

S-1AS=[-30002+i002-i].

Aby otrzymać postać rzeczywistą rozważamy macierz

P=[100011010]

której druga i trzecia kolumna, to odpowiednio, część rzeczywista i urojona wektora własnego v2=[0,1,1]T+i[0,1,0]T. Otrzymujemy, że

P-1AP=[-3000210-12].
Przykład 11.7.

Wartości własne macierzy

A=[100-120112]

to λ1=1 i λ2=λ3=2. Sprawdzamy łatwo, że odpowiadające im wektory własne, to

v1=[1,1,-2]T,v2=[0,0,1]T.

Krotność algebraiczna wartości własnej λ2=2 jest równa 2, ale jej krotność geometryczna jest równa 1. Macierz A nie ma więc bazy wektorów własnych, czyli nie jest diagonalizowalna. Aby wyznaczyć postać Jordana A szukamy takiego wektora w, że

(A-2I)w=v2.

Ponieważ

A-2I=[-100-100110],

więc możemy przyjąć, że w=[0,1,0]T. Dla macierzy

S=[100101-210]

mamy

S-1AS=[100201-110][100-120112][100101-210]=[100011001].
Przykład 11.8.

Macierz

A=[2100200-12]

ma tylko jedną wartość własną λ=2 o krotności algebraicznej 3. Zauważmy, że

A-2I=[0100000-10],

więc

ker(A-2I)=span{e1,e3}.

Ponadto,

im(A-2I)=span{[1,0,-1]T}ker(A-2I).

Szukamy teraz takiego wektora w, że

(A-2I)w=[1,0,-1]T.

Łatwo sprawdzamy, że możemy przyjąć w=[0,1,0]T=e2. Dla bazy

v1=[1,0,-1]T,v2=[0,1,0]T,v3=[1,0,0]T

Dla

S=[101010-100]

mamy

S-1AS=[00-1010100][2100200-12][101010-100]=[210020002]
Przykład 11.9.

Przyglądniemy się teraz macierzom antysymetrycznym AM3×3(). Ponieważ AT=-A, więc A ma postać

A=[0ab-a0c-b-c0],a,b,c.

Zakładamy, że A jest niezerowa, czyli a2+b2+c20. Ponieważ A jest antysymetryczna i wymiar n=3 jest nieparzysty, więc detA=0. W szczególności, 0 jest zawsze wartością własną. Ma ona krotność 1, bo jak łatwo sprawdzić pozostałe wartości własne, to ±ia2+b2+c2. Wektor własny dla wartości własnej 0 jest równy

vA=[-c,b,-a]T.

Ponadto, jeśli A,BM3×3() są antysymetryczne, to

tr(AB)=-2(vA|vB).

Co więcej, macierz

[A,B]:=AB-BA

jest antysymetryczna oraz

v[A,B]=vA×vB.

11.3 Diagonalizacja w wymiarach 2 i 3

Niech

A=[accb]

będzie rzeczywistą macierzą symetryczną. Równanie charakterystyczne dla A ma postać

pA(x)=x2-(a+b)x+ab-c2=0.

Ponieważ

Δ:=(a+b)2-4(ab-c2)=(a-b)2+4c20,

więc wartości własne λ1, λ2 macierzy A są rzeczywiste oraz

λ1=a+b+Δ2,λ2=a+b-Δ2.
Twierdzenie 11.6.

Dla macierzy rzeczywistej AM2×2(R) następujące warunki są równoważne

  • (i)

    A=AT,

  • (ii)

    2 ma bazę ortonormalną złożoną z wektorów własnych A,

  • (iii)

    Istnieje taka macierz ortogonalna QM2×2(), że

    QTAQ=D,

    gdzie D=diag(λ1,λ2) jest diagonalna z wartościami własnymi A na przekątnej.

Dowód.

(i)(ii)

Załóżmy, że A jest symetryczna. Jeśli c=0, to e1, e2 jest bazą ortonormalną złożoną z wektorów własnych macierzy A=diag(a,b).

Jeśli c0, to Δ>0 i A ma dwie różne rzeczywiste wartości własne λ1, λ2. Niech v1, v2 będą odpowiadającymi im wektorami własnymi o normie 1. Pokażemy, że wektory v1, v2 są ortogonalne. Mamy

λ1(v1|v2) =(λ1v1|v2)
=(Av1|v2)
=(v1|Av2)
=(v1|λ2v2)
=λ2(v1|v2),

więc (v1|v2)=0, bo λ1λ2.

(ii)(iii) Wystarczy przyjąć Q=[v1v2] dla bazy ortonormalnej v1, v2 złożonej z wektorów własnych.

(iii)(i)

Wiemy, że A=QDQT. Wtedy

AT =(QT)TDTQT
=QDQT
=A.

Rozważmy teraz macierz symetryczną AM3×3(). Istnieje λ1 rzeczywista wartość własna dla A. Niech v1 będzie odpowiadającym jej wektorem własnym o normie 1. Niech V3 będzie płaszczyzną prostopadłą do wektora v1. Wybierzmy bazę ortonormalną v2, v3V dla V. Wtedy v1, v2, v3 jest bazą ortonormalną dla 3.

Pokażemy, że Av2, Av3V, czyli A(V)V. Ze względu na symetrię wystarczy pokazać, że Av2V. Ponieważ A jest symetryczna, więc

(v1|Av2) =(Av1|v2)
=(λ1v1|v2)
=λ1(v1|v2)
=0.

Rozważmy macierz ortogonalną W=[v1v2v3]. Wtedy

W-1AW=WTAW=[λ1000ac0db].

Ponieważ WTAW jest symetryczna, więc d=c, czyli

WTAW=[λ1000ac0cb]

Wiemy już, że istnieje taka macierz ortogonalna BM2×2(), że

BT[accb]B=diag(λ2,λ3).

Dla macierzy ortogonalnej

U=[100B]M3×3()

mamy

UTWTAWU=diag(λ1,λ2,λ3).

Macierz Q=WU jest ortogonalna i jej kolumny są bazą ortonormalną złożoną z wektorów własnych.

Wniosek 11.13.

Dla macierzy rzeczywistej AM3×3(R) następujące warunki są równoważne

  • (i)

    A=AT,

  • (ii)

    3 ma bazę ortonormalną złożoną z wektorów własnych A,

  • (iii)

    Istnieje taka macierz ortogonalna QM3×3(), że

    QTAQ=D,

    gdzie D=diag(λ1,λ2,λ3) jest diagonalna z wartościami własnymi A na przekątnej.

11.4 Twierdzenie Cayleya–Hamiltona w wymiarze 3

Twierdzenie 11.7 (Twierdzenie Cayleya–Hamiltona).

Niech λ1,λ2,λ3C będą wartościami własnymi macierzy AM3×3(C). Wtedy

(A-λ1I)(A-λ2I)(A-λ3I)=0.
Dowód.

Z Lematu 11.5 istnieje taka macierz nieosobliwa SM3×3(), że S-1AS jest górnie trójkątna. Zauważmy, że

(S-1AS-λ1I) (S-1AS-λ2I)(S-1AS-λ3I)=
(S-1AS-λ1S-1S)(S-1AS-λ2S-1S)(S-1AS-λ3S-1S)=
S-1(A-λ1I)SS-1(A-λ2I)SS-1(A-λ3I)S=
S-1(A-λ1I)(A-λ2I)(A-λ3I)S.

Wynika stąd, że teza zachodzi dla A wtedy i tylko wtedy, gdy zachodzi dla S-1AS. Możemy więc założyć, że A jest górnie trójkątna postaci

A=[λ1ab0λ2c00λ3]

Niech v=[x,y,z]T3 będzie dowolnym wektorem. Zauważmy, że

(A-λ3I)v=[x1,y1,0]T,

dla pewnych x1,y1. Następnie,

(A-λ2I)[x1,y1,0]T=[x2,0,0]T,

dla pewnego x2. Ostatecznie,

(A-λ1I)[x2,0,0]T=[0,0,0]T,

czyli

(A-λ1I)(A-λ2I)(A-λ3I)v=0.

  • U

    Z pewnością zauważyliście, że dokładnie te same argumenty pokazują, że dla macierzy górnie trójkątnej AMn×n() zachodzi

    pA(A)=0.

    Dowód opiera się na obserwacji, że dla macierzy górnie trójkątnej A podprzestrzenie span{e1,,ek} są niezmiennicze dla A. Pokażemy później, że każda macierz AMn×n() jest podobna do macierzy górnie trójkątnej, więc Twierdzenie Cayleya–Hamiltona zachodzi dla dowolnej macierzy AMn×n().

  • 𝗧𝗘𝗦𝗧

    Niech A=[abcd]M2×2(). Oceń prawdziwość poniższych zdań:

    • Jeśli a+b=c+d=1, to [1,1]T jest wektorem własnym A.

    • Jeśli A ma prostą niezmienniczą, to A ma rzeczywiste wartości własne.

    • A ma rzeczywisty wektor własny.

    • Jeśli A jest górnie trójkątna tzn. c=0, to A jest diagonalizowalna.

    • Jeśli detA<0, to A jest diagonalizowalna.

    • Jeśli detA<0, to A jest ortogonalnie diagonalizowalna.

    • Jeśli A3=0, to A2=0.

    • Jeśli 2 ma bazę złożoną z wektorów własnych A, to A jest nieosobliwa.

    • 0 jest jedyną wartością własną A wtedy i tylko wtedy, gdy A2=0.

    • Jeśli trA=0, to A jest diagonalizowalna lub A2=0.

    • Jeśli detA=0, to A ma prostą niezmienniczą.

    • A i A2 mają takie same wartości własne.

    • A i A2 mają takie same wektory własne.

    • Jeśli A jest nieosobliwa, to A i A-1 mają takie same wartości własne.

    • Jeśli A jest nieosobliwa, to A i A-1 mają takie same wektory własne.

    • A i AT mają takie same wartości własne.

    • A i AT mają takie same wektory własne.

    • Jeśli SM2×2() jest nieosobliwa, to A i S-1AS mają takie same wartości własne.

    • Jeśli SM2×2() jest nieosobliwa, to A i S-1AS mają takie same wektory własne.

    • Jeśli A jest nieosobliwa i diagonalizowalna, to A-1 jest diagonalizowalna.

    • Jeśli macierz kwadratowa A jest diagonalizowalna, to AT jest również diagonalizowalna.

    • Jeśli macierz kwadratowa ma dwa identyczne wiersze (kolumny), to 0 jest jej wartością własną.

Indeks pojęć

Literatura

  • 1 S. Axler Linear Algebra Done Right Springer, 1997
  • 2 J. Komorowski Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk PWN, 1978
  • 3 S. J. Leon Linear Algebra with Applications Pearson 2015
  • 4 C. D. Meyer Matrix Analysis and Applied Linear Algebra SIAM,
  • 5 D. Poole Linear Algebra: A Modern Introduction Cengage Learning, 2015
  • 6 B. Solomon Linear Algebra, Geometry and Transformations CRC Press, 2015
  • 7 K. Tapp Matrix Groups for Undergraduates. AMS, 1971.