Algebra liniowa z geometrią
Klaudiusz Wójcik
Notatki do wykładu
Wydział Matematyki i Informatyki UJ
Kraków 2020
Spis Treści:
Część I Algebra liniowa z geometrią 1
Rozdział 1 Kilka uwag i wskazówek dla studentów
Wykłady na UJ nie są obowiązkowe i otrzymacie ode mnie notatki do wykładu. Mimo to, gorąco zachęcam Was do chodzenia na wykłady - nie tylko moje :). Notatki nigdy nie zawierają wszystkiego. Wykład to kontakt z żywym człowiekiem, pozwalający przekazać mniej formalne informacje i intuicje. Na wykładzie dowiecie się co jest naprawdę istotne, a co jest tylko detalem technicznym. Nie wyczytacie tego z notatek. |
Kolekcjonujcie i analizujcie możliwie dużo konkretnych przykładów. Są one równie ważne jak definicje i twierdzenia. Starajcie się każdą definicje i każde twierdzenie widzieć w kontekście przykładów. Nie bójcie się rachunków na prostych przykładach. Wyrabiają one intuicje i często zawierają w sobie zalążki formalnych dowodów. |
O ile to możliwe starajcie się myśleć geometrycznie i robić rysunki. Wiele pojęć matematycznych ma znaczenie geometryczne pozwalające na lepsze ich zrozumienie. |
W trakcie wykładu zaproponuje Wam serię zadań. Spróbujcie je rozwiązać samodzielnie. Nie bójcie się dyskusji o nich z koleżankami i kolegami - to zawsze może pomóc. Jeśli się to nie uda, poproście o pomoc prowadzących ćwiczenia. Ostrzeżenie: prowadzący ćwiczenia łatwo rozpoznają czy próbowaliście rozwiązać problemy czy poszliście na łatwiznę. |
Zaproponuję Wam również serię testów typu prawda czy fałsz. Powinniście je rozwiązać samodzielnie. Liczba sukcesów w odpowiedziach da Wam wyobrażenie o stopniu zrozumienia prezentowanego na wykładach materiału. |
Wszystko w Waszych rękach. My jesteśmy tu po to, aby Wam pomóc. Reszta należy do Was. |
-
To jest przykład Uwagi - będą one przewijały się w tekście i powinniście je wnikliwie przemyśleć.
W tekście pojawiają się Definicje, Twierdzenia, Lematy, Wnioski i Przykłady. Definicje nadają nazwy obiektom ważnym dla rozważanej teorii. Twierdzenia opisują szczególnie ważne własności wcześniej zdefiniowanych pojęć. Z logicznego punktu widzenia, Lematy są tym samym co Twierdzenia, ale ich rola jest pomocnicza - często dowody Twierdzeń są poprzedzone serią Lematów. Wnioski są zazwyczaj szczególnymi przypadkami lub prostymi konsekwencjami Twierdzeń i Definicji podkreślającymi ich użyteczność. Ważna wskazówka: starajcie się analizować założenia Twierdzeń. Zadawajcie sobie pytania typu: a może jakieś założenie nie jest potrzebne, aby zaszła teza? Analizujcie proste konkretne przykłady. Często dają one odpowiedź dlaczego założenia twierdzeń są konieczne i nie można ich pominąć.
Przykład 1.1.
Zobrazuję powyższą uwagę konkretnym przykładem. Rozważmy Twierdzenie:
Suma liczb całkowitych jest liczbą całkowitą. |
Chyba się zgodzimy, że jest to zdanie prawdziwe, czyli Twierdzenie. Powinniście sobie zadać pytanie:
Co się stanie jak liczby całkowite zastąpimy innym zbiorem liczbowym? |
Czy prawdziwe są stwierdzenia
Suma liczb wymiernych jest liczbą wymierną. |
albo
Suma liczb niewymiernych jest liczbą niewymierną. |
Przemyślcie Swoje odpowiedzi!
-
A teraz przykład Ostrzeżenia - będą to szczególnie ważne Uwagi.
Jeśli Wniosek z Twierdzenia nie jest całkiem oczywisty w mojej opinii, to będę podawał jego uzasadnienie (dowód). Jeżeli Wniosek jest podany bez dowodu, to powinniście dobrze przemyśleć dlaczego uznałem, że nie ma potrzeby podawać dodatkowych argumentów jego prawdziwości, gdyż jest on bezpośrednią konsekwencją Definicji albo bardziej ogólnego Twierdzenia.
Rozdział 2 Pojęcia wstępne
SŁOWA KLUCZOWE ROZDZIAŁU ciało liczb rzeczywistych ciało liczb zespolonych wzór de Moivre’a zasadnicze twierdzenie algebry ciało grupa grupa grupa pierwiastków zespolonych z jedynki |
2.1 Zbiory i liczby rzeczywiste
Zbiór jest kolekcją pewnych obiektów. Dla przykładu, zbiór
składa się z elementów będących liczbami naturalnymi. Napis oznacza, że liczba naturalna jest elementem zbioru . Natomiast napis stwierdza, że nie jest elementem zbioru . Zbiory i są równe, gdy składają się z tych samych elementów. Zbiory
są równe. Napis oznacza, że zbiór jest podzbiorem zbioru , czyli każdy element zbioru jest elementem zbioru . Dla przykładu,
Przykład 2.1.
Ważne zbiory liczbowe:
-
•
zbiór liczb naturalnych ;
-
•
zbiór liczb całkowitych ;
-
•
zbiór liczb wymiernych ;
-
•
zbiór liczb rzeczywistych .
Zachodzą zawierania
ale żadne z nich nie jest równością. Zbiór liczb rzeczywistych składa się z liczb wymiernych i liczb niewymiernych . Przykładowo, liczby , , są niewymierne.
Zbiór pusty , to zbiór który nie zawiera żadnych elementów. Przykładowo,
-
Oceń czy poniższe zdania są prawdziwe:
-
–
Zbiory i są równe;
-
–
Suma liczby wymiernej i niewymiernej jest liczbą niewymierną;
-
–
Suma i iloczyn liczb wymiernych jest liczbą wymierną;
-
–
Suma liczb niewymiernych jest liczbą niewymierną;
-
–
Iloczyn liczb niewymiernych jest liczbą niewymierną;
-
–
Iloczyn liczb: wymiernej i niewymiernej jest liczbą niewymierną;
-
–
Suma liczb: wymiernej i niewymiernej jest liczbą niewymierną.
-
–
Liczby rzeczywiste możemy dodawać i mnożyć. Wynikiem tych operacji jest ponownie liczba rzeczywista. Bardziej formalnie oznacza to, że określone są dwie funkcje (operacje): dodawanie liczb rzeczywistych
oraz ich mnożenie
Jeśli poprawnie rozwiązaliście Test to zauważycie, że dodawanie i mnożenie jest również dobrze określonym działaniem w zbiorze liczb wymiernych. Powyższe zdanie oznacza tyle, że suma i iloczyn liczb wymiernych jest liczbą wymierną. Nie jest tak z liczbami niewymiernymi. Działania te wyprowadzają nas ze zbioru liczb niewymiernych. Przykładowo, liczby i są niewymierne, ale ich suma i iloczyn są liczbami wymiernymi (nawet całkowitymi).
Wróćmy do działań dodawania i mnożenia w zbiorze liczb rzeczywistych. Zakładamy, że dla dowolnych liczb rzeczywistych zachodzą warunki (aksjomaty):
-
(i)
-
(ii)
-
(iii)
-
(iv)
istnieje taka liczba rzeczywista , że
-
(v)
-
(vi)
-
(vii)
-
(viii)
jeżeli , to istnieje taka liczba rzeczywista , że
-
(ix)
Algebraicy mówią wtedy krótko, że zbiór liczb rzeczywistych z działaniami oraz jest ciałem. Oznacza to, że trójka (zbiór i dwa działania w nim) spełnia warunki (i)-(ix).
Liczby rzeczywiste możemy ze sobą porównywać. Dla dowolnych zachodzi jeden z warunków
Relacja jest zgodna z działaniami w tym sensie, że zachodzą warunki:
-
(1)
jeśli i , to ,
-
(2)
jeśli i , to .
Dla liczby rzeczywistej definiujemy jej wartość bezwzględną wzorem
Liczby rzeczywiste możemy interpretować jako punktu na prostej. Liczba nieujemna jest odległością punktu od punktu . Dla liczb rzeczywistych zachodzi nierówność
2.2 Liczby zespolone
Wprowadzimy teraz ważne uogólnienie ciała liczb rzeczywistych, czyli ciało liczb zespolonych.
Zbiór liczb zespolonych definiujemy jako zbiór uporządkowanych par liczb rzeczywistych, czyli
Podobnie jak liczby rzeczywiste możemy interpretować jako punkty na prostej, tak elementy zbioru są punktami na płaszczyźnie.
Na razie mamy pewien zbiór tzn. zbiór punktów na płaszczyźnie. Aby mówić o ciele liczb zespolonych musimy w zbiorze wprowadzić dwa działania oraz spełniające warunki (i)-(ix). Zrobimy to wykorzystując działania określone w zbiorze liczb rzeczywistych. Jest to typowy dla matematyki mechanizm tworzenia nowych struktur w oparciu o struktury już istniejące.
Definicja 2.1 (Suma i iloczyn liczb zespolonych).
Sumę i iloczyn liczb zespolonych , określamy wzorami
(2.1) | ||||
(2.2) |
-
Wzory (2.1) i (2.2) wymagają pewnego komentarza. W formule (2.1) znak z lewej strony równości jest nowo definiowanym pojęciem dodawania liczb zespolonych przy pomocy, wcześniej zdefiniowanej, formuły z prawej strony: jest to więc znak dodawania punktów na płaszczyźnie. Po prawej stronie znak jest już wcześniej znaną operacją dodawania liczb rzeczywistych. Mamy tu więc do czynienia z pewną kolizją oznaczeń: znak z prawej i lewej strony oznacza inne operacje, zdefiniowane w innych zbiorach. Musimy się do tego przyzwyczaić i domyślać się z kontekstu o jakie działanie chodzi. Alternatywą byłoby oznaczanie dodawania liczb zespolonych jakimś innym symbolem niż np. . Moglibyśmy wtedy formułę (2.1) zapisać jako
Tego typu mnożenie oznaczeń nie wydaje się jednak celowe. Zachęcam do analogicznego przeanalizowania znaczenia symboli , we wzorze (2.2).
Dla liczby zespolonej wygodnie jest wprowadzić następującą terminologię. Liczby rzeczywiste oraz nazywamy odpowiednio częścią rzeczywistą i częścią urojoną liczby zespolonej . Będziemy używać oznaczeń
Definicja 2.2 (Sprzężenie i moduł liczby zespolonej).
Dwie liczby zespolone oraz są równe, wtedy i tylko wtedy, gdy oraz , tzn. zarówno ich części rzeczywiste, jak i urojone są równe. Dla liczby zespolonej definiujemy liczbę przeciwną oraz
sprzężenie liczby zespolonej | ||||
Moduł liczby zespolonej jest odległością punktu od początku układu współrzędnych .
Zachodzą własności
Przykład 2.2.
Uzasadnimy, że
Zauważmy, że
Wniosek 2.1.
Dla dowolnej liczby zespolonej zachodzi wzór
Dowód.
Dowód polega na bezpośrednim rachunku. Mamy
∎
Twierdzenie 2.1.
Dla dowolnych liczb zespolonych mamy
-
(i)
-
(ii)
-
(iii)
-
(iv)
-
(v)
-
(vi)
-
(vii)
-
(viii)
jeżeli , to istnieje jedyna taka liczba zespolona , że
-
(ix)
W szczególności, trójka jest ciałem.
Dowód.
Udowodnimy dla przykładu punkty (viii) i (ix) pozostawiając dowody pozostałych punktów jako ćwiczenie. Zaczniemy od dowodu punktu (ix). Niech , i będą dowolnymi liczbami zespolonymi. Wtedy
Zajmiemy się teraz dowodem punktu (ix). Niech będzie dowolną, niezerową liczbą zespoloną. Zauważmy, że . Szukamy takiej liczby zespolonej , że . Ponieważ
więc wystarczy przyjąć, że
∎
Liczby zespolone postaci będziemy utożsamiać z liczbami rzeczywistymi, tzn. będziemy pisać .
Definicja 2.3 (Jednostka urojona).
Liczbę zespoloną
nazywamy jednostką urojoną.
Zauważmy, że
Stąd
czyli
Każdą liczbę zespoloną możemy zapisać w postaci algebraicznej:
Dodawanie i mnożenie liczb zespolonych oraz w postaci algebraicznej przyjmuje postać
W tej konwencji zapisu liczby zespolone mnożymy tak samo jak liczby rzeczywiste pamiętając, że . Dla przykładu,
Przykład 2.3.
Zapiszemy liczbę w postaci . Mamy
Każdą liczbę zespoloną można zapisać w postaci
Ponadto,
(2.3) |
gdzie jest kątem między między osią rzeczywistą a półprostą o początku w punkcie przechodzącą przez punkt . Otrzymujemy stąd postać trygonometryczną liczby zespolonej:
(2.4) |
Każdą liczbę spełniającą równania (2.3) nazywamy argumentem liczby zespolonej i oznaczamy .
Argument nie jest wyznaczony jednoznacznie. Jeżeli jest pewnym argumentem , to każdy inny argument jest postaci
dla pewnego . Jeśli , to równość (2.4) zachodzi dla dowolnej liczby rzeczywistej . Argumentem głównym liczby zespolonej nazywamy liczbę rzeczywistą określoną równaniami (2.3). Oznaczamy go przez .
Z powyższy rozważań wynika, że liczba zespolona jest jednoznacznie wyznaczona przez swój moduł i argument. Wynika stąd, że dwie liczby zespolone są równe wtedy i tylko wtedy, gdy mają równe moduły i ich argumenty różnią się o całkowitą wielokrotność .
Przykład 2.4.
Zapiszemy liczbę w postaci trygonometrycznej. Mamy oraz
Stąd , czyli
Lemat 2.1.
Dla danych w postaci trygonometrycznej liczb zespolonych
zachodzi wzór
Dowód.
Bezpośredni rachunek pokazuje, że
∎
Twierdzenie 2.2 (Wzór de Moivre’a).
Dla liczby zespolonej oraz dla zachodzi wzór
W szczególności, jeśli , to
Dowód.
Zastosujemy indukcję względem . Wzór zachodzi dla . Zakładamy teraz, że jest on prawdziwy dla pewnej liczby naturalnej . Udowodnimy, że zachodzi on również dla . Mamy
∎
Przykład 2.5.
Obliczymy . Ponieważ , więc
Definicja 2.4 (Pierwiastek z liczby zespolonej).
Niech . Liczbę zespoloną nazywamy pierwiastkiem stopnia z liczby zespolonej , jeśli .
Niech będzie pierwiastkiem stopnia z liczby . Ze wzoru de Moivre’a wynika, że wtedy
Stąd oraz
dla pewnego . Wynika stąd, że dla pewnego mamy
(2.5) |
Łatwo sprawdzamy, że istnieje dokładnie różnych pierwiastków stopnia z liczby danych wzorami
-
Na pierwiastki stopnia z niezerowej liczby zespolonej możemy popatrzeć następująco. Niech
będzie oczywistym pierwiastkiem. Dla pierwiastka stopnia z jedynki:
mamy
czyli pierwiastkami stopnia z liczby są
Przykład 2.6.
Wyznaczymy pierwiastki zespolone stopnia trzeciego z liczby
Dla mamy
Dla otrzymujemy
a dla mamy
Przykład 2.7.
Pierwiastkami zespolonymi stopnia z jedynki są liczby
-
Ponieważ pierwiastki dla mają moduły równe i kolejne argumenty różnią się o , więc są wierzchołkami -kąta foremnego wpisanego w okrąg o środku w punkcie i promieniu .
Przykład 2.8 (Pierwiastki zespolone wielomianu rzeczywistego).
Rozważmy równanie wielomianowe o współczynnikach rzeczywistych :
Uzasadnimy, że jeżeli liczba zespolona jest pierwiastkiem tego równania, to jest nim również . Nie jest to prawda, gdy współczynniki są zespolone, ale nie są rzeczywiste. Jeśli
to
Twierdzenie 2.3 (Zasadnicze twierdzenie algebry).
Każdy wielomian
o współczynnikach zespolonych ma pierwiastków zespolonych (liczonych z krotnościami) . Ponadto,
Pierwszy dowód Twierdzenia 2.3 podał Gauss w 1799 roku.
-
Rozkład wielomianu rzeczywistego nad
Z Zasadniczego twierdzenia algebry wynika, że wielomian o współczynnikach zespolonych ma rozkład na iloczyn wielomianów stopnia pierwszego
gdzie są pierwiastkami . Zastanówmy się co możemy powiedzieć o rozkładzie wielomianu o współczynnikach rzeczywistych. Jak wiemy, jeśli liczba zespolona z jest jego pierwiastkiem, to jest nim również liczba sprzężona . Zauważmy, że
jest wielomianem stopnia o współczynnikach rzeczywistych nie posiadającym pierwiastków rzeczywistych. Wynika stąd, że możemy rozłożyć na iloczyn wielomianów stopnia jeden i wielomianów nierozkładalnych stopnia dwa o współczynnikach rzeczywistych.
Przykład 2.9.
Można sprawdzić, że wielomian ma pierwiastki zespolone . Jako wielomian o współczynnikach zespolonych rozkłada się on na czynniki stopnia pierwszego:
Jeśli chcemy, go rozłożyć na iloczyn wielomianów o współczynnikach rzeczywistych, to otrzymujemy
Przykład 2.10 (Pierwiastki zespolone równania kwadratowego).
Rozważmy równanie kwadratowe
o współczynnikach rzeczywistych. Jeśli , to ma ono dwa sprzężone rozwiązania zespolone dane wzorami
Przykładowo, dla
mamy oraz
-
Pierwiastki równania kwadratowego Rozważmy równanie kwadratowe
o współczynnikach zespolonych . Dla możemy je zapisać w postaci
co jest równoważne z równością
czyli
Wystarczy więc znaleźć pierwiastki kwadratowe z liczby zespolonej .
Zauważmy, że jeśli są pierwiastkami równania , to
oraz zachodzą wzory Viete’a
Przykład 2.11.
Rozwiążemy równanie
Jest ono równoważne z równaniem , czyli
Stąd
Znajdziemy pierwiastki stopnia z liczby . Jeśli , to
Z drugiego równania i są różne od zera i . Z pierwszego równania mamy
czyli
Stąd
czyli . W konsekwencji, . Mamy więc, że
czyli
2.3 Grupy i ciała
Wprowadzimy teraz pewne podstawowe struktury algebraiczne. Ten fragment będzie nieco bardziej abstrakcyjny i wymaga od Was szczególnej uwagi. Ten trud opłaci się w Waszym dalszym matematycznym życiu. Podejmijcie go! Robimy to nie tylko z miłości do abstrakcji, ale przede wszystkim dlatego, że wprowadzenie i używanie tego języka jest po prostu wygodne. Niech będzie niepustym zbiorem.
Definicja 2.5 (Działanie wewnętrzne w zbiorze).
Działaniem wewnętrznym w zbiorze nazywamy dowolne odwzorowanie
przyporządkowujące uporządkowanej parze elementów zbioru element zbioru .
Przykład 2.12.
Dodawanie i mnożenie liczb rzeczywistych (zespolonych) są działaniami wewnętrznymi w zbiorze (). Ponieważ , więc odejmowanie nie jest działaniem wewnętrznym w zbiorze liczb naturalnych . Dzielenie nie jest działaniem wewnętrznym w zbiorze liczb rzeczywistych , bo nie jest zdefiniowane dla pary – nie wolno dzielić przez .
Definicja 2.6 (Grupa i grupa abelowa).
Niech będzie działaniem w zbiorze . Para jest grupą, jeśli zachodzą warunki
-
(G1)
Dla dowolnych zachodzi
-
(G2)
Istnieje taki , że dla dowolnego zachodzi
-
(G3)
Dla dowolnego istnieje taki , że
Jeżeli ponadto,
-
(G4)
Dla dowolnych mamy
to nazywamy grupą przemienną lub abelową.
-
Element neutralny w grupie jest wyznaczony jednoznacznie. Rzeczywiście, jeśli są elementami neutralnymi, to
Podobnie, element odwrotny do jest wyznaczony jednoznacznie. Jeśli są odwrotne do , to
-
Oceń które ze zdań jest prawdziwe
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową;
-
–
jest grupą abelową.
-
–
Przykład 2.13.
Niech
Pokażemy, że z mnożeniem liczb rzeczywistych jest grupą abelową. Musimy przede wszystkim pokazać, że jest to działanie wewnętrzne w . Niech . Oznacza to, że oraz
Mamy
Musimy pokazać, że . Sprawdzamy, że
Mnożenie liczb rzeczywistych jest łączne i przemienne, więc warunki (G1) i (G4) są spełnione. Ponadto, , więc zachodzi warunek (G2). Zauważmy, że jeśli , to z warunku wynika, że . Ponadto, , bo wtedy byłby liczbą wymierną, gdy . Łatwo sprawdzamy, że oraz
czyli warunek (G3) zachodzi.
Przykład 2.14 (Grupa ).
Poprawne rozwiązanie Testu 1 prowadzi nas do wniosku, że jest grupą abelową. Oznacza to, że działanie mnożenia
spełnia warunki (G1)-(G4) z definicji grupy. Zbiór jest płaszczyzną z usuniętym początkiem układu współrzędnych. Rozważmy okrąg jednostkowy o środku w początku układu
Oczywiście . Zauważmy, że jeżeli , , to , gdyż
Oznacza to, że iloczyn liczb zespolonych ze zbioru jest ponownie liczbą należącą do . Wynika stąd, że mnożenie liczb zespolonych jest działaniem wewnętrznym w zbiorze i możemy je traktować jako odwzorowanie
W takim razie może jest również grupą?
-
Podgrupa
Przypuśćmy, że jest grupą i jest takim jej niepustym podzbiorem, że dla . Oznacza to, że jest również działaniem wewnętrznym w . To jeszcze za mało, aby było grupą. Rozważmy prosty przykład grupy liczb całkowitych z działaniem dodawania liczb całkowitych . Wtedy jest to również działanie wewnętrzne w zbiorze liczb naturalnych . Zauważmy, że nie jest grupą. Przede wszystkim dodawanie nie ma elementu neutralnego w , bo . W takim razie rozważmy podzbiór . Oczywiście, dodawanie liczb całkowitych jest również działaniem wewnętrznym w i nie mamy już problemu z elementem neutralnym. Pojawia się jednak nowy problem, gdyż przykładowo, element nie ma elementu odwrotnego (przeciwnego) w zbiorze , bo .
Z naszych rozważań wynika, że podzbiór dziedziczy strukturę grupy z , jeśli spełnione są warunki:
-
–
dla wszystkich ,
-
–
, gdzie jest elementem neutralnym dla ,
-
–
, gdzie jest elementem odwrotnym do .
Wtedy rzeczywiście jest grupą. Algebraicy mówią wtedy, że jest podgrupą grupy .
-
–
Wróćmy do okręgu . Zauważmy, że element neutralny , dla mnożenia liczb zespolonych, należy do zbioru . Ponadto, dla mamy , bo . Ponieważ warunki (G1)-(G4) zachodzą w zbiorze , więc tym bardziej są spełnione w mniejszym zbiorze . Wynika stąd, że para jest również grupą abelową. Jest ona podgrupą grupy .
Przykład 2.15 (Grupa zespolonych pierwiastków z jedynki).
Zdefiniujemy teraz jeszcze pewne ważne podgrupy grupy . Będą one składały się ze skończonej liczby elementów. Ustalmy dowolną liczbę naturalną . Rozważmy zbiór wszystkich pierwiastków stopnia z liczby , czyli
gdzie
Zauważmy, że dla mamy
Wynika stąd, że mnożenie liczb zespolonych jest działaniem wewnętrznym w zbiorze . Ponadto, oraz , więc , czyli jest grupą abelową.
Podamy teraz abstrakcyjną definicję algebraicznej struktury ciała z którą zetknęliśmy się już w przypadku liczb rzeczywistych i zespolonych. Rozważmy zbiór w którym określone są dwa działania wewnętrzne
Zgodnie z przyjętym (całkowicie umownie) oznaczeniem będziemy je nazywali dodawaniem i mnożeniem, chociaż nie muszą one mieć nic wspólnego ze znanymi nam działaniami arytmetycznymi w zbiorach liczbowych.
Definicja 2.7 (Ciało).
Trójka jest ciałem, jeśli zachodzą warunki
-
(F1)
para jest grupą abelową z elementem neutralnym dla działania ;
-
(F2)
para jest grupą abelową z działaniem ;
-
(F3)
dla dowolnych .
-
W punkcie (F2) w sposób niejawny zakładamy, że iloczyn elementów różnych od jest różny od , bo mnożenie jest z założenia działaniem wewnętrznym w zbiorze (definicja grupy).
Z drugiej strony dla dowolnego zachodzi równość
bo
Przykład 2.16 (Rozszerzenie ciała o ).
Rozważmy zbiór
Elementy zbioru są liczbami rzeczywistymi, czyli . Pokażemy, że struktura ciała ,,dziedziczy się’’ na zbiór z działaniami dodawania i mnożenia liczb rzeczywistych zawężonymi do zbioru . Zauważmy najpierw, że
czyli elementy neutralne działań należą do zbioru . Ponadto, działania są wewnętrzne w , bo
oraz
Zauważmy, że
więc element odwrotny do względem działania , czyli jest elementem zbioru .
Załóżmy, że . Wtedy . Stąd
czyli
więc
jest elementem odwrotnym do . Z powyższych rozważań wynika, że jest ciałem.
Przykład 2.17.
Rozważmy zbiór
Uzasadnimy, że nie jest on ciałem z dodawaniem i mnożeniem liczb rzeczywistych. Problem mamy z mnożeniem, bo nie jest ono działaniem wewnętrznym w zbiorze . Pokażemy bowiem, że . Przypuśćmy, że dla pewnych . Mnożąc przez dostajemy, że
Ponieważ jest liczbą niewymierną, więc i , czyli , więc . Otrzymana sprzeczność pokazuje, że .
Przykład 2.18 (Ciało ).
Niech . Definiujemy dodawanie w zbiorze przez tabelę wyników tego działania
+ | 0 | 1 |
---|---|---|
0 | 0 | 1 |
1 | 1 | 0 |
Analogicznie definiujemy mnożenie w zbiorze poprzez tabelę
0 | 1 | |
---|---|---|
0 | 0 | 0 |
1 | 0 | 1 |
Sprawdzamy łatwo, że tak zdefiniowana trójka jest ciałem.
-
Ciało
Niech . Definiujemy działania oraz w zbiorze przez
+ 0 1 2 0 0 1 2 1 1 2 0 2 2 0 1 0 1 2 0 0 0 0 1 0 1 2 2 0 2 1 Sprawdzamy łatwo, że jest ciałem.
Dla liczby całkowitej i liczby naturalnej przez oznaczamy resztę z dzielenia liczby przez . Zauważcie, że działania w możemy zapisać następująco:
Nic nie stoi na przeszkodzie, aby podobnie zdefiniować działania w zbiorze
dla liczby naturalnej . Przyjmujemy, że
Trójka nie zawsze jest ciałem. Elementem neutralnym dodawania jest . Zauważmy, że przykładowo w mamy
Oznacza to, że nie jest ciałem. Analogiczny argument pokazuje, że nie jest ciałem, gdy nie jest liczbą pierwszą. Można sprawdzić, że (ćwiczenie) jest ciałem wtedy i tylko wtedy, gdy jest liczbą pierwszą.
-
Ciało skończone nie musi być równe dla liczby pierwszej . Poniższe tabelki definiują ciało -elementowe:
0 1 a b 0 0 1 a b 1 1 0 b a a a b 0 1 b b a 1 0 0 1 a b 0 0 0 0 0 1 0 1 a b a 0 a b 1 b 0 b 1 a nie jest ciałem, bo .
2.4 Macierze
Niech będzie ciałem. Przez macierz wymiaru rozumiemy tablicę
mającą dwa wiersze i dwie kolumny. Zbiór wszystkich takich macierzy będziemy oznaczać przez . Powiemy, że są równe (), jeśli dla .
W zbiorze definiujemy działanie dodawania
wzorem
Sprawdzamy łatwo, że jest grupą abelową. Elementem neutralnym dodawania jest macierz zerowa
a elementem przeciwnym do jest macierz
W zbiorze definiujemy działanie mnożenia
Formuła na jest nieco bardziej skomplikowana i w dalszym ciągu wyjaśni się dlaczego taka właśnie. Definiujemy
Sprawdzamy łatwo, że dla macierzy
oraz dowolnej macierzy mamy
Oznacza to, że jest elementem neutralnym mnożenia macierzy. Naturalne jest pytanie czy trójka jest ciałem. Bezpośredni rachunek pokazuje, że spełnione są następujące warunki:
-
•
-
•
,
-
•
,
-
•
,
-
•
,
-
•
,
-
•
.
Z definicją ciała mamy jednak kilka problemów. Po pierwsze dla niezerowej macierzy mamy
czyli mnożenie macierzy nie jest działaniem wewnętrznym w zbiorze macierzy niezerowych. Nie mamy więc do czynienia z ciałem. Ponadto, niezerowa macierz nie posiada elementu odwrotnego względem mnożenia macierzy. Rzeczywiście, dla dowolnej macierzy mamy
Mnożenie macierzy nie jest też przemienne, bo przykładowo
Przykład 2.19.
Dla macierzy , mamy
-
Możecie, a nawet powinniście zapytać, dlaczego mnożenie macierzy definiujemy tak dziwną formułą. Moglibyśmy przecież, przez analogię do definicji dodawania macierzy, przyjąć że
Przecież nie jest to takie złe mnożenie. Ma element neutralny, czyli macierz . Jest ono oczywiście łączne i przemienne. Oczywiście mamy problem z istnieniem elementu odwrotnego do macierzy niezerowej, bo jeśli tylko w macierzy któryś z wyrazów jest równy zero, to nie posiada macierzy odwrotnej. Ale przecież podobne problemy mieliśmy z wcześniej zdefiniowanym mnożeniem. Powód takiego zdefiniowania mnożenia macierzy jest nieco głębszy i poznamy go nieco później.
Naturalne jest pytanie dla jakich macierzy istnieje taka macierz , że
Okazuje się, że takie macierze można łatwo scharakteryzować. W tym celu dla macierzy definiujemy element ciała wzorem
i nazywamy wyznacznikiem macierzy .
Wniosek 2.2.
Dla mamy
oraz .
Dowód.
Sprawdzamy to bezpośrednim rachunkiem. Oczywiście zachodzi równość . Dla macierzy oraz mamy
∎
Wniosek 2.3.
Zachodzą warunki:
-
•
-
•
-
•
-
•
-
•
-
•
Jeśli jest macierzą zespoloną, to definiujemy
Wtedy
-
•
,
-
•
,
-
•
,
-
•
jeśli , to
Twierdzenie 2.4.
Dla macierzy następujące warunki są równoważne
-
(1)
,
-
(2)
istnieje taka macierz , że
Piszemy wtedy, że .
Dowód.
(1) wynika z (2), bo wtedy
czyli .
Jeśli zachodzi warunek (1), to definiujemy wzorem
Sprawdzamy łatwo, że . ∎
Wniosek 2.4.
Niech . Jeśli , to
Dla macierzy definiujemy jej macierz transponowaną
oraz dla określamy
Bezpośredni rachunek pokazuje, że
-
(i)
,
-
(ii)
,
-
(iii)
,
-
(iv)
,
-
(v)
.
Ponadto, jeśli jest odwracalna, to , czyli , więc jest też odwracalna oraz .
Przykład 2.20 (Macierzowa interpretacja ciała ).
Wskażemy teraz podzbiór zbioru , który pod względem algebraicznym bardzo przypomina ciało liczb zespolonych. Definiujemy
Łatwo sprawdzamy, że jeśli , to
oraz
więc dodawanie i mnożenie macierzy jest działaniem wewnętrznym w .
Można sprawdzić bezpośrednim rachunkiem, że trójka jest ciałem. My, aby to zauważyć, zastosujemy nieco inne podejście. W tym celu definiujemy
Jest to bijekcja oraz , . Ponadto,
oraz
dla dowolnych .
Bijekcja o powyższych własnościach pozwala na identyfikację struktur algebraicznych oraz . Algebraicy mówią wtedy, że te ciała są izomorficzne. Z algebraicznego punktu widzenia ciała izomorficzne są nierozróżnialne.
Sprawdzamy poprzez bezpośredni rachunek, że ma dodatkowe własności:
-
•
dla macierzy mamy
-
•
,
-
•
,
-
•
, gdzie
-
•
,
-
•
.
MACIERZOWA INTERPRETACJA CIAŁA Dla Dla |
Przykład 2.21 (Grupy izomorficzne).
Zobrazujemy pojęcie izomorfizmu grup. Rozważmy grupę abelową
pierwiastków zespolonych stopnia z jedynki. Działaniem grupowym jest mnożenie liczb zespolonych. Zbiór
jest grupą abelową z działaniem mnożenia macierzy. Zbiór reszt z dzielenia liczby całkowitej przez
jest grupą z działaniem ,,dodawania reszt‘‘. Działania w tych grupach są opisane tabelkami:
1 | i | -1 | -i | |
1 | 1 | i | -1 | -i |
i | i | -1 | -i | 1 |
-1 | -1 | -i | 1 | i |
-i | -i | 1 | i | -1 |
I | J | -I | -J | |
---|---|---|---|---|
I | I | J | -I | -J |
J | J | -I | -J | I |
-I | -I | -J | I | J |
-J | -J | I | J | -I |
0 | 1 | 2 | 3 | |
0 | 0 | 1 | 2 | 3 |
1 | 1 | 2 | 3 | 0 |
2 | 2 | 3 | 0 | 1 |
3 | 3 | 0 | 1 | 2 |
Powyższe tabelki pokazują, że struktura algebraiczna wszystkich trzech grup jest identyczna. Jest ona taka sama jak dla grupy -elementowej z działaniem opisanym tabelką
e | a | b | c | |
---|---|---|---|---|
e | e | a | b | c |
a | a | b | c | e |
b | b | c | e | a |
c | c | e | a | b |
Przykład 2.22 ().
Zbiór składa się z elementów. Macierz jest odwracalna, gdy . W ciele oznacza to, że . Mamy macierzy spełniających ten warunek:
Podzbiory dostarczają wielu przykładów grup.
Przykład 2.23 (Grupa ).
Rozważmy zbiór macierzy odwracalnych
Jeśli , to
czyli . Ponadto, oraz dla , bo
czyli . Oznacza to, że z działaniem mnożenia macierzy jest grupą. Nie jest to grupa abelowa, bo przykładowo
Definiujemy ponadto zbiór
Jest on również grupą (nieabelową) z mnożeniem macierzy.
Przykład 2.24 (Macierze symplektyczne).
Definiujemy zbiór macierzy symplektycznych jako
Sprawdzimy, że jest to grupa z mnożeniem macierzy. Można to zrobić sprawdzając warunki definiujące grupę. W tym celu należy sprawdzić, że
-
•
jeśli , to ,
-
•
,
-
•
jeśli , to jest odwracalna oraz .
My zrobimy to nieco inaczej. Bezpośredni rachunek pokazuje, że
Wynika stąd, że wtedy i tylko wtedy, gdy . Oznacza to, że
Przykład 2.25 (Macierze górnie trójkątne).
Macierz nazywamy górnie trójkątną. Zauważmy, że
czyli iloczyn macierzy górnie trójkątnych jest macierzą górnie trójkątną. Macierz jest odwracalna wtedy i tylko wtedy, gdy . Macierz odwrotna jest wtedy równa
czyli jest górnie trójkątna. Wynika stąd, że macierze górnie trójkątne o niezerowym wyznaczniku tworzą grupę z mnożeniem macierzy. Jest ona podgrupą grupy . Podobnie, macierze górnie trójkątne o wyznaczniku równym (tzn. ) tworzą podgrupę grupy . Ponadto, macierze górnie trójkątne spełniające warunek są również podgrupą .
Przykład 2.26 (Macierze ortogonalne).
Definiujemy zbiór macierzy ortogonalnych przez
Zauważmy, że
więc . Oznacza to, że jest odwracalna, czyli istnieje taka macierz , że . Mnożąc równość z prawej strony przez , otrzymujemy, że .
Jeśli , to
czyli . Oczywiście . Ponieważ dla oraz
czyli . Wynika stąd, że jest grupą i podgrupą grupy . Nie jest ona abelowa. Przyglądniemy się jej bliżej. Niech
Jeśli , to
czyli z równości mamy
Macierz ma więc postać
dla pewnych takich liczb , że . Wynika stąd, że
dla pewnego .
Jeśli , to
więc równość oznacza, że
Macierz ma więc postać
dla pewnych takich liczb , że . Wynika stąd, że
dla pewnego .
Zbiór
jest grupą z mnożeniem macierzy. Składa się ona z wszystkich macierzy postaci
Sprawdzamy łatwo, że jest to grupa abelowa. Jest ona izomorficzna z grupą poprzez
-
Macierze ortogonalne i symplektyczne możemy traktować jako szczególny przypadek ogólniejszej konstrukcji. Mianowicie, dla ustalonej macierzy rozważmy
Jest to grupa z mnożeniem macierzy. Dla otrzymujemy , a dla grupę .
Przykład 2.27 (Macierze symetryczne).
Zbiór rzeczywistych macierzy symetrycznych
jest grupą z działaniem dodawania macierzy.
Dla macierzy definiujemy jej ślad wzorem
Sprawdzamy łatwo, że
-
(i)
,
-
(ii)
,
-
(iii)
,
-
(iv)
.
-
Niech . Mówimy, że macierz jest podobna do , jeśli istnieje taka macierz odwracalna , że . Wtedy
oraz
Przykład 2.28 (Macierze o śladzie równym ).
Definiujemy zbiór
Jest to grupa abelowa z działaniem dodawania macierzy.
Przykład 2.29 (Macierze hamiltonowskie).
Rozważmy zbiór
Ponieważ więc wtedy i tylko wtedy, gdy
Takie macierze są nazywane macierzami hamiltonowskimi. Pełnią one ważną rolę w teorii równań różniczkowych i mechanice klasycznej. Uzasadnimy, że jest grupą z dodawaniem macierzy. Zamiast sprawdzać warunki z definicji grupy zauważmy, że
Oznacza to, że , czyli jest grupą.
Przykład 2.30 (Macierze unitarne).
Dla macierzy zespolonej definiujemy
Sprawdzamy łatwo, że
-
•
,
-
•
,
-
•
,
-
•
,
-
•
.
Rozważmy zbiór macierzy unitarnych
Warunek oznacza, że oraz . stanowi grupę z mnożeniem macierzy.
Jeśli , to
Z równości otrzymujemy, że
Macierz ma więc w tym przypadku postać
dla pewnych takich liczb zespolonych , że
Grupa
składa się więc z macierzy postaci
Przykład 2.31 (Macierze hermitowskie).
Zbiór zespolonych macierzy hermitowskich
jest grupą z działaniem dodawania macierzy. Przyglądniemy się jej bliżej. Niech . Ponieważ
więc
Wynika stąd, że jeśli ma postać
Przykład 2.32 (Macierze hermitowskie).
Zbiór zespolonych macierzy hermitowskich
jest grupą z działaniem dodawania macierzy. Przyglądniemy się jej bliżej. Niech . Ponieważ
więc
Wynika stąd, że jeśli ma postać
2.5 Pewne ważne macierze
Rozważymy pewne specjalne macierze, które będą pojawiały się w dalszym ciągu wykładu. Zaczniemy od pewnego ogólnego rezultatu zwanego Twierdzeniem Cayleya–Hamiltona.
Lemat 2.2 (Twierdzenie Cayleya–Hamiltona).
Dla macierzy zachodzi równość
Dowód.
Zastosujemy brutalną siłę, czyli bezpośredni rachunek. Niech Mamy
∎
-
Twierdzenie Cayleya–Hamiltona pozwala wyznaczyć macierz odwrotną do macierzy nieosobliwej . Mnożąc równość przez otrzymujemy, że
Ponadto, .
-
Wzory Viete’a
Dla macierzy rozważmy równanie kwadratowe
Ma ono dwa pierwiastki zespolone , czyli
Wynika stąd, że
Liczby będziemy nazywać wartościami własnymi macierzy .
Z twierdzenia Cayleya–Hamiltona mamy
czyli
Przykład 2.33.
Niech . Korzystając z Twierdzenia Cayleya–Hamiltona obliczymy . Rozważmy wielomian . Dzieląc go przez wielomian charakterystyczny macierzy otrzymujemy, że
Z Twierdzenia Cayleya–Hamiltona mamy
czyli
Przykład 2.34.
Korzystając z Twierdzenia Cayleya–Hamiltona obliczymy , gdzie . Wielomian charakterystyczny ma dwa pierwiastki i . Dzieląc wielomian przez otrzymujemy, że
gdzie jest resztą z dzielenia. Współczynniki i możemy wyznaczyć podstawiając i za . Otrzymujemy, że
Rozwiązaniem układu są
Z Twierdzenia Cayleya–Hamiltona wynika, że
Przykład 2.35 (Wartości własne macierzy symetrycznych i hermitowskich).
Jeśli jest macierzą symetryczną, to ma rzeczywiste wartości własne. Rzeczywiście, dla równania
mamy
Również, jeśli
jest macierzą hermitowską, to ma rzeczywiste wartości własne. Dla równania
mamy
-
Twierdzenie Cayleya–Hamiltona pozwala łatwo obliczać potęgi macierzy . Rozważmy macierz . Wtedy . Powiedzmy, że chcemy znaleźć . Mamy
oraz
Analogicznie pokazuje się, że dla pewnych
Przykład 2.36 (Macierz nilpotentna).
Powiemy, że macierz jest nilpotentna, jeśli dla pewnego . Pokażemy najpierw, że . Możemy założyć, że , bo dla . Zauważmy, że
czyli . Niech . Wtedy
Ponieważ, , więc
Stąd
czyli . Z twierdzenia Cayleya–Hamiltona wynika, że
Warunek ten oznacza, że
Wiemy, że , czyli . Przyglądnijmy się równaniu . Mamy dwa przypadki ze względu na :
-
•
jeśli , to i dla .
-
•
jeśli , to oraz
Przykład 2.37 (Inwolucja).
Powiemy, że jest inwolucją, jeśli . Wynika stąd, że , czyli . Ponadto, . Ze wzoru na mamy, że
Jeśli , to oraz . Ponadto, czyli . Stąd, lub .
Jeśli , to i , czyli . Mamy dwa przypadki względem :
-
•
jeśli , to i jest dowolne; wtedy
-
•
jeśli , to oraz
Przykład 2.38 (Macierz idempotentna).
Macierz nazywamy idempotentną, jeśli . Ponieważ , więc lub . Jeśli , to oznacza, że
Jeśli , to , i . Wtedy lub .
Jeśli , to warunki redukują się do .
Mamy dwa przypadki względem :
-
•
jeśli , to oraz
-
•
jeśli , to albo albo i wtedy
Przykład 2.39 (Macierz Grama).
Dla macierzy rzeczywistej jej macierz Grama jest zdefiniowana jako . Stąd
Zauważmy, że
-
•
jest symetryczna,
-
•
ma rzeczywiste wartości własne,
-
•
,
-
•
wtedy i tylko wtedy, gdy .
Przyglądnijmy się wyznacznikowi macierzy . Mamy
Przykład 2.40 (Rzeczywista macierz normalna).
Rozważmy taką macierz rzeczywistą , że
Nazywamy ją macierzą normalną. Oznacza to, że
czyli
Mamy dwie możliwości:
-
•
jeśli , to jest symetryczna,
-
•
jeśli , to ; wtedy albo i jest symetryczna albo i wtedy oraz ma postać
Rozdział 3 Przestrzeń wektorowa
SŁOWA KLUCZOWE ROZDZIAŁU przestrzenie wektorowe i przestrzeń wektorowa kombinacja liniowa liniowa niezależność baza baza standardowa iloczyn skalarny w norma w nierówność Cauchy’ego–Schwarza wektory ortogonalne proste i płaszczyzny w iloczyn hermitowski |
3.1 Płaszczyzna jako przestrzeń wektorowa
Punkt na płaszczyźnie utożsamiamy z jego współrzędnymi kartezjańskimi , czyli liczbą zespoloną . Wprowadzimy teraz w zbiorze pewną nową strukturę algebraiczną, strukturę przestrzeni wektorowej. Geometrycznie punkt na płaszczyźnie będziemy interpretowali jako wektor będący strzałką o początku w punkcie i o końcu w punkcie . W tej interpretacji będzie dla nas wygodne zastosowanie nieco innej konwencji zapisu współrzędnych punktu. Zamiast pisać będziemy stosować zapis kolumnowy , czyli pierwsza współrzędna nad drugą. Dla oszczędności papieru wprowadzamy oznaczenie
Napis oznacza, że mamy na myśli liczbę zespoloną, a napis sugeruje , że myślimy o wektorze na płaszczyźnie.
Definicja 3.1.
Płaszczyzna
Płaszczyzną rzeczywistą nazywamy zbiór
Jego elementy będziemy nazywać wektorami.
Zbiór możemy łatwo wyposażyć w dodatkową strukturę algebraiczną. Wektory będziemy dodawać i mnożyć je przez liczbę rzeczywistą.
Definicja 3.2.
Dodawanie wektorów i mnożenie ich przez skalar
Niech . Definiujemy ich sumę przez
W zapisie kolumnowym mamy
Powyższy wzór określa dodawanie punktów (wektorów) na płaszczyźnie. Przypisuje ono dwóm punktom płaszczyzny pewien punkt na płaszczyźnie.
Niech i . Definiujemy mnożenie wektora przez liczbę rzeczywistą wzorem
Równoważnie,
Zdefiniowane powyżej mnożenie definiuje odwzorowanie . Przypisuje ono liczbie rzeczywistej i punktowi na płaszczyźnie pewien punkt na płaszczyźnie.
3.2 Definicja przestrzeni wektorowej
Naturalne jest pytanie: dlaczego mielibyśmy się ograniczać wyłącznie do płaszczyzny ? Przecież podobną konstrukcję możemy powtórzyć w przestrzeni , gdzie położenie punktu jest opisane trzema współrzędnymi w miejsce dwóch. A może rozważyć pięć współrzędnych? Lepiej zróbmy to od razu ogólnie dla dowolnej liczby naturalnej .
Definicja 3.3.
Przestrzeń wektorowa Niech . Definiujemy zbiór
gdzie
Analogicznie do płaszczyzny definiujemy działanie dodawania wektorów oraz ich mnożenie przez liczbę rzeczywistą wzorami
-
Początek układu współrzędnych, czyli wektor zerowy będziemy oznaczać przez . Zazwyczaj nie prowadzi to do nieporozumień – z kontekstu wynika czy oznacza zero jako liczbę rzeczywistą czy raczej wektor zerowy w .
- AKSJOMATY PRZESTRZENI WEKTOROWEJ
Lemat 3.1.Dla dowolnych wektorów i liczb rzeczywistych mamy (1) (łączność dodawania wektorów) (2) (przemienność dodawania wektorów) (3) (4) istnieje (jedyny) taki wektor , że () (5) (rozdzielność) (6) (rozdzielność) (7) (łączność) (8) . |
Dowód.
Dowód jest bardzo prosty. Jak się dobrze przyglądniemy to zauważymy, że wszystkie własności (1)-(8) wynikają bezpośrednio z własności działań w zbiorze liczb rzeczywistych. Wystarczy je zastosować do każdej współrzędnej z osobna. ∎
Początki teorii przestrzeni wektorowych związane są z Williamem Rowanem Hamiltonem (1805–1865) oraz Hermannem Guntherem Grassmannem (1809–1877)
Mamy więc do czynienia z pewnym zbiorem i dwoma działaniami
spełniającymi warunki (1)-(8).
Definicja 3.4.
Przestrzeń wektorowa nad ciałem
Rozważmy trójkę z opisanymi powyżej działaniami
Powiemy, że jest przestrzenią wektorową nad ciałem , (bo mnożymy elementy zbiory przez liczby rzeczywiste) jeśli zachodzą powyższe warunki (1)-(8).
-
Z powyższych rozważań wynika, że jest przykładem przestrzeni wektorowej nad ciałem . Możecie zapytać po co nam jakieś przestrzenie wektorowe. Przecież mamy już wektory w , które dodajemy i mnożymy przez liczbę rzeczywistą. Czy to nie wystarczy? Otóż nie. Popatrzcie na funkcję (przepraszam ortodoksyjnych matematyków za ten zapis funkcji bez podania dziedziny i przeciwdziedziny). Przecież to też jest suma pewnych obiektów (w tym wypadku funkcji), tylko teraz dodajemy funkcje zamiast liczb lub wektorów z . Funkcje, podobnie jak wektory możemy mnożyć przez liczby. Pewnie zetknęliście się z funkcjami typu lub .
Przykład 3.1 (Przestrzeń funkcji ).
Niech będzie zbiorem wszystkich funkcji . W zbiorze mamy naturalne dodawanie dane wzorem
oraz mnożenie przez skalar zdefiniowane formułą
Trójka spełnia warunki (1)-(8), więc jest przestrzenią wektorową nad ciałem liczb rzeczywistych.
Przykład 3.2 (Przestrzeń wielomianów).
Niech będzie zbiorem wszystkich wielomianów o współczynnikach rzeczywistych. Z naturalnymi działaniami dodawania i mnożenia przez liczbą , trójka jest przestrzenią wektorową nad ciałem liczb rzeczywistych.
-
Jak pewnie zauważyliście, przez cały czas podkreślam, że rozważane dotąd przestrzenie wektorowe są przestrzeniami wektorowymi nad ciałem . Może moglibyśmy rozważać przestrzenie wektorowe nad innymi ciałami? Poniższy przykład pokazuje, że możemy to robić. Co więcej jest to bardzo naturalne, a naturalne konstrukcje bardzo w matematyce lubimy.
Przykład 3.3 (Przestrzeń wektorowa ).
Przez analogię do zbioru możemy zdefiniować zbiór jako
gdzie
W zbiorze mamy naturalnie zdefiniowane działanie dodawania
oraz ich mnożenie przez liczbę zespoloną
Są one dane wzorami
Łatwo sprawdzamy, że tak określona trójka spełnia warunki (1)-(8). Jedyna różnica polega na tym, że wektory (elementy zbioru ) mnożymy teraz przez liczby zespolone, a nie liczby rzeczywiste. Możemy, więc stwierdzić, że jest przestrzenią wektorową nad ciałem liczb zespolonych. Możecie powiedzieć, że przecież to nie koniec. Taką samą konstrukcje możemy przeprowadzić rozważając zbiór i jego elementy mnożyć przez liczby wymierne. Otrzymamy przestrzeń wektorową nad ciałem liczb wymiernych . Prowadzi nas to do ogólnej definicji przestrzeni wektorowej nad dowolnym ciałem .
Definicja 3.5 (Przestrzeń wektorowa nad ciałem ).
Niech będzie zbiorem i niech będzie ciałem. Załóżmy, że określone są działania: (dodawanie wektorów) oraz (mnożenie przez skalar). Powiemy, że trójka jest przestrzenią wektorową nad ciałem , jeśli dla dowolnych wektorów oraz skalarów zachodzą warunki:
-
(1)
-
(2)
-
(3)
istnieje taki wektor , że
-
(4)
istnieje taki wektor , że
-
(5)
-
(6)
-
(7)
-
(8)
.
Zauważmy, że pierwsze cztery warunki dotyczą wyłącznie dodawania wektorów i oznaczają, że jest grupą abelową W dalszym ciągu napis będzie oznaczał, że jest przestrzenią wektorową nad ciałem .
-
Wektor zerowy jest wyznaczony jednoznacznie. Jeśli spełniają warunek (3), to .
-
Rozważmy przestrzeń wektorową nad ciałem . Uzasadnimy, że dla oraz (elementu neutralnego dodawania w ciele ) zachodzi równość
Możecie powiedzieć, że to przesada aby uzasadnić takie rzeczy. Przecież pomnożone przez ,,cokolwiek’’ daje . Tak jest, gdy ,,cokolwiek’’ jest elementem ciała . W naszym przypadku oznacza, że mnożymy przez wektor , natomiast po prawej stronie jest wektorem, a nie elementem ciała .
Z własności (6) i definicji jako elementu neutralnego dla dodawania w ciele wynika, że
więc .
-
Niech . Wektor spełniający warunek jest wyznaczony jednoznacznie. Rzeczywiście, jeśli , to
Wektor nazywamy wektorem przeciwnym do i oznaczamy przez . Uzasadnimy, że .
czyli .
Analogicznie pokazujemy, że
oraz
Przykład 3.4 (Przestrzeń wektorowa ).
Jeśli jest dowolnym ciałem, to naturalnie określona trójka jest przestrzenią wektorową nad ciałem . W szczególności, jest przestrzenią wektorową nad ciałem .
Przykład 3.5 (O co chodzi z tymi ciałami?).
Rozważmy ponownie przestrzeń wektorową . Mnożenie jest mnożeniem wektora przez liczbę zespoloną. Oznaczmy je chwilowo przez . Zauważmy, że w zbiorze mamy też dobrze określone mnożenie przez liczbę rzeczywistą. Trójki oraz są różnymi obiektami matematycznymi. jest przestrzenią wektorową nad ciałem , a jest przestrzenią wektorową nad ciałem . Co za różnica? Otóż zasadnicza. Pierwsze dwa elementy trójek są identyczne tzn. zbiór i określone w nim działanie dodawania wektorów . Aby dostrzec różnicę rozważmy wektor . Zauważmy, że w przestrzeni nad ciałem zachodzi równość
W przestrzeni nad ciałem taka równość nie zachodzi. Co więcej, napis
nie ma sensu w tej przestrzeni, bo dopuszczamy tylko mnożenie wektorów z przez liczby rzeczywiste.
Przykład 3.6.
Rozważmy przestrzeń wektorową
oraz wektory
Wtedy
-
Uważny czytelnik zauważył z pewnością, że działania w przestrzeni funkcyjnej są zdefiniowane dzięki temu, że potrafimy dodawać wartości dwóch funkcji z oraz mnożyć wartości funkcji z . Jest to możliwe, bo przeciwdziedzina funkcji z , czyli jest ciałem. Nie jest natomiast ważne, że ich dziedzina ma strukturę ciała. Możemy więc rozważać bardziej ogólne funkcyjne przestrzenie wektorowe. Dokładniej, jeśli jest dowolnym niepustym zbiorem i jest ciałem, to zbiór
wszystkich funkcji jest przestrzenią wektorową z działaniami
Przykładowo, jest rzeczywistą przestrzenią wektorową. Zwróćcie uwagę, że powyżej zdefiniowane działania, nie są działaniami wewnętrznymi w zbiorze , bo , ale oraz .
Niech będzie ciałem. W przestrzeni wektorowej wyróżniamy wektorów danych przez
Zauważmy, że każdy wektor możemy zapisać jako
Oznacza to, że zachodzi równość
Mówimy wtedy, że wektor jest kombinacją liniową wektorów . Zdefiniujemy to pojęcie bardziej ogólnie, co przyda nam się w przyszłości.
Definicja 3.6.
Kombinacja liniowa wektorów
Niech będzie przestrzenią wektorową nad ciałem . Dla wektorów oraz skalarów , wektor
nazywamy kombinacją liniową wektorów .
Przykład 3.7.
Niech będzie przestrzenią wektorową nad ciałem . Ustalmy wektory i rozważmy zbiór
wszystkich możliwych kombinacji liniowych wektorów . Działania oraz są działaniami wewnętrznymi w zbiorze oraz jest przestrzenią wektorową nad ciałem .
Załóżmy, że . Mamy
-
(a)
,
-
(b)
jeśli , to jest prostą przechodzącą przez i równoległą do wektora .
Lemat 3.2.
Rozważmy przestrzeń wektorową . Wtedy każdy wektor można jednoznacznie zapisać w postaci kombinacji liniowej
Dowód.
Wiemy już, że dla dowolnego wektora istnieją takie skalary , że . Pokażemy, że takie przedstawienie wektora w postaci kombinacji liniowej wektorów jest wyznaczone jednoznacznie. Przypuśćmy, że
Wtedy
czyli . ∎
Definicja 3.7.
Baza standardowa
Wektory nazywamy bazą standardową przestrzeni .
-
Zauważmy, że jednoznaczność przedstawienia wektora jako kombinacji liniowej wektorów wynika z prawdziwości następującej implikacji:
Jest to więc ważna własność wektorów . Warto więc ją jakoś nazwać i zbadać.
Definicja 3.8.
Liniowa niezależność
Niech będzie przestrzenią wektorową nad ciałem . Wektory nazywamy liniowo niezależnymi, jeśli dla zachodzi implikacja
Przykład 3.8.
Niech . Przypuśćmy, że wektory są liniowo zależne. Wtedy istnieją takie liczby rzeczywiste , że lub oraz . Jeśli , to , czyli wektor leży na prostej .
Przykład 3.9.
Wektory
są liniowo niezależne w . Przypuśćmy bowiem, że dla pewnych . Ponieważ , więc
czyli i są liniowo niezależne.
Definicja 3.9.
Baza przestrzeni wektorowej
Niech będzie przestrzenią wektorową nad ciałem . Wektory nazywamy bazą przestrzeni wektorowej , jeśli dla dowolnego wektora istnieją jednoznacznie wyznaczone takie skalary , że
Przykład 3.10.
Podmieńmy wektor w bazie dla przez wektor . Pokażemy, że wektory , , tworzą bazę . Rozważmy dowolny wektor . Musimy uzasadnić, że istnieją jedyne takie skalary , , , że . Zwróćmy uwagę, że
Równość jest więc równoważna z układem równań
Ma on jednoznaczne rozwiązanie
czyli , , są bazą .
Przykład 3.11.
Wektory , są liniowo niezależne, bo równość
oznacza, że . Nie tworzą one jednak bazy , bo ich kombinacje liniowe mają postać , więc przykładowo, wektor nie jest kombinacją liniową i .
Każdy wektor jest kombinacją liniową wektorów , , , , bo
Wektory , , , nie tworzą jednak bazy , bo przykładowo
czyli przedstawienie nie jest jednoznaczne. Wynika to z faktu, że wektory , , , są liniowo zależne, bo
Przykład 3.12 (Przestrzeń wektorowa macierzy ).
Rozważmy zbiór macierzy . Jest w nim określone działanie dodawania macierzy
dane wzorem
oraz mnożenie macierzy przez skalar
zdefiniowane wzorem
Trójka jest przestrzenią wektorową nad ciałem . Ponadto, dla mamy
Powyższym przedstawienie jest jednoznacznie wyznaczone przez macierz , czyli macierze
tworzą bazę przestrzeni .
3.3 Iloczyn skalarny i norma w
Wprowadzimy teraz w przestrzeni wektorowej pewną dodatkową geometryczną strukturę, zadaną przez euklidesowy iloczyn skalarny.
Definicja 3.10.
Euklidesowy iloczyn skalarny w
Iloczynem skalarnym wektorów nazywamy liczbę rzeczywistą
Analogicznie, iloczyn skalarny wektorów
definiujemy jako liczbę rzeczywistą
-
Iloczyn skalarny jest też często oznaczany symbolem . My będziemy używali oznaczenia , bo w tej konwencji nierówność jest czytelniejsza niż napis .
Iloczyn skalarny jest więc odwzorowaniem
Przypisuje ono parze wektorów liczbę rzeczywistą .
Lemat 3.3.
Dla dowolnych wektorów i skalarów zachodzą następujące własności
-
(1)
(dwuliniowość)
-
(2)
(symetryczność)
-
(3)
(dodatnia określoność)
przy czym wtedy i tylko wtedy, gdy .
Definicja 3.11.
Norma euklidesowa w
Normą (długością) wektora nazywamy liczbę
-
Zauważmy, że wektor ma normę jeden i każdy wektor o normie jeden można zapisać w tej postaci dla pewnego . W szczególności, dowolny wektor można zapisać w postaci
Lemat 3.4 (Tożsamość równoległoboku).
Dla dowolnych wektorów zachodzi równość
Dowód.
Bezpośredni rachunek pokazuje, że
∎
Lemat 3.5 (Wzór polaryzacyjny).
Zachodzi wzór polaryzacyjny
.
Dowód.
Mamy
∎
Lemat 3.6.
Niech będą wektorami. Wówczas,
Dowód.
Zauważmy, że
czyli teza zachodzi. ∎
Twierdzenie 3.1 (Nierówność Cauchy’ego–Schwarza).
Dla dowolnych wektorów i zachodzi nierówność
Dowód.
Możemy założyć że wektory i są niezerowe. Dla dowolnego mamy
czyli z własności funkcji kwadratowych wynika, że | ||||
co kończy dowód. ∎
Wniosek 3.1 (Własności normy).
Dla dowolnych i mamy
-
(1)
oraz wtedy i tylko wtedy, gdy ;
-
(2)
;
-
(3)
(nierówność trójkąta)
Dowód.
Pierwsza własność wynika bezpośrednio z definicji normy. Dla dowodu drugiej zauważamy, że
Uzasadnimy nierówność trójkąta. Stosując nierówność Cauchy’ego–Schwarza mamy
co kończy dowód. ∎
Definicja 3.12.
Wektory ortogonalne
Wektory są ortogonalne (prostopadłe) wtedy i tylko wtedy, gdy
W szczególności, wektor zerowy jest prostopadły do każdego wektora, więc również do samego siebie.
-
Pokażemy, że dla dowolnych wektorów zachodzi równość
gdzie jest kątem między wektorami i . W szczególności,
Jeśli któryś z wektorów lub jest zerowy to powyższa równość jest prawdziwa. Załóżmy więc, że wektory i są niezerowe. Niech wektor będzie rzutem prostopadłym wektora na prostą rozpiętą przez wektor . Wtedy dla pewnego . Stąd wektor jest prostopadły do wektora . Gdy kąt jest ostry, to oraz
Jeśli kąt jest rozwarty, to oraz
W obydwu przypadkach
Ponieważ wektor jest prostopadły do , więc
czyli
Stąd
co kończy dowód.
Możemy na to spojrzeć jeszcze inaczej. Wektory i możemy zapisać w postaci trygonometrycznej:
Wtedy
Z nierówności Cauchy’ego–Schwarza wynika, że dla niezerowych wektorów mamy
Istnieje więc jednoznacznie wyznaczony taki kąt , że
Definicja 3.13.
Kąt między wektorami
Kątem pomiędzy niezerowymi wektorami nazywamy jedyny taki kąt , że
Definicja 3.14.
Wektor jednostkowy
Wektor nazywamy jednostkowym, gdy .
Przykład 3.13.
Jeśli wektor jest niezerowy, to wektor jest wektorem jednostkowym.
Przykład 3.14.
Niech . Niech i będą wektorami utworzonymi z kolumn macierzy . Macierz Grama ma postać
W szczególności, jest ortogonalna tzn. wtedy i tylko wtedy, gdy
czyli kolumny są wektorami jednostkowymi i są ortogonalne do siebie.
-
METRYKA EUKLIDESOWA
Korzystając z normy możemy zdefiniować funkcję
wzorem
Z własności normy, dla dowolnych mamy
-
(i)
oraz wtedy i tylko wtedy, gdy ,
-
(ii)
,
-
(iii)
.
Przykładowo,
Funkcję nazywamy metryką euklidesową w . Liczbę nazywamy odległością między i .
-
(i)
3.4 Proste i płaszczyzny
Rozważmy niezerowy wektor . Jak wiemy zbiór wszystkich wektorów postaci dla jest prostą równoległą do wektora i przechodzącą przez punkt . Prostą równoległą do i przechodzącą przez punkt możemy opisać jako zbiór punktów postaci ().
Definicja 3.15.
Równanie parametryczne prostej
Równanie parametryczne prostej przechodzącej przez i równoległej do niezerowego wektora ma postać
W skrócie, .
-
Definicja oznacza, że współrzędne punktu leżącego na prostej spełniają, dla pewnego skalara , układ równań
Ponieważ wektor jest niezerowy, więc któraś z jego współrzędnych lub jest różna od zera. Załóżmy przykładowo, że . Możemy wtedy z pierwszego równania wyliczyć otrzymując, że . Wstawiając do drugiego równania otrzymujemy, że
czyli
Jest to równanie ogólne prostej przechodzącej przez punkt i równoległej do wektora .
Definicja 3.16.
Równanie ogólne prostej
Równanie ogólne prostej na płaszczyźnie ma postać
-
Zauważmy, że prosta o równaniu ogólnym
przechodzi przez początek układu współrzędnych wtedy i tylko wtedy, gdy . Ma ona wtedy równanie , które możemy zapisać przy pomocy iloczynu skalarnego następująco:
Oznacza to, że składa się ona ze wszystkich wektorów prostopadłych do wektora .
Wniosek 3.2.
Prosta o równaniu ogólnym
przechodzi przez punkt i jest prostopadła do wektora .
Analogicznie, dla niezerowego wektora i punktu równanie parametryczne prostej równoległej do i przechodzącej przez ma postać
Przyglądnijmy się przypadkowi , czyli prostym w przestrzeni . W postaci parametrycznej jest ona zadana układem równań
Jeżeli wszystkie liczby dla , to eliminując z powyższego układu otrzymujemy dwa równania
nazywane równaniami kanonicznymi prostej w przestrzeni. Jeżeli np. a , , to równania przyjmują postać
Gdy np. i , to równanie ma postać
Przykład 3.15.
Zastanówmy się jaki podzbiór przestrzeni jest opisany przez równanie
Możemy je zapisać równoważnie wykorzystując iloczyn skalarny jako
czyli zbiór składa się z wszystkich wektorów w prostopadłych do wektora . Oznacza to, że jest płaszczyzną prostopadłą do wektora i zawierającą początek układu .
Definicja 3.17.
Równanie ogólne płaszczyzny w
Równanie ogólne płaszczyzny w przestrzeni ma postać
W szczególności, równanie
opisuje płaszczyznę przechodzącą przez punkt i prostopadłą do wektora .
![]() |
![]() |
Przykład 3.16.
Rozważmy układ równań liniowych
Równania układu opisują dwie nierównoległe płaszczyzny. Zbiorem rozwiązań układu jest prosta będąca ich częścią wspólną.
Wyznaczymy dokładniej prostą . Odejmując pierwsze równanie od drugiego otrzymujemy układ równoważny
Stąd
Zbiór rozwiązań układu jest dany jako zbiór
Zauważmy, że
Rozwiązaniem układu jest prosta o równaniu parametrycznym
Rozdział 4 Układy równań liniowych
SŁOWA KLUCZOWE ROZDZIAŁU układ równań liniowych dozwolone operacje macierz rozszerzona układu eliminacja Gaussa postać schodkowa podprzestrzeń układy jednorodne wyznacznik wzory Cramera |
Rozważmy układ równań
Każde z równań układu opisuje pewną płaszczyznę w . Szukamy więc punktów leżących na obydwu płaszczyznach. Obydwie płaszczyzny zawierają punkt . Pierwsza z nich jest prostopadła do wektora , a druga jest prostopadła do wektora . Nie są one równoległe, więc ich przecięciem jest pewna prosta w . Naszym najbliższym celem będzie nauczenie się wyznaczania zbioru rozwiązań układu równań liniowych.
Definicja 4.1.
Układ równań liniowychł Niech będzie ciałem. Układem równań liniowych nazywamy układ równań postaci:
(4.1) |
Skalary nazywamy współczynnikami układu, a wyrazami wolnymi. Jest to układ równań z niewiadomymi . Zbiór rozwiązań układu składa się ze wszystkich wektorów , których współrzędne spełniają wszystkie równania tego układu. Mówimy, że układ
-
•
jest sprzeczny, gdy zbiór rozwiązań jest pusty;
-
•
ma rozwiązanie, jeśli zbiór rozwiązań jest niepusty;
-
•
ma nieskończenie wiele rozwiązań, gdy zbiór rozwiązań jest nieskończony;
-
•
ma dokładnie jedno rozwiązanie, jeśli zbiór rozwiązań jest jednoelementowy.
-
Dwa układy równań są równoważne, jeżeli mają takie same zbiory rozwiązań.
Istnieją pewne operacje, które możemy wykonać na układzie równań (4.1) otrzymując układ równoważny.
DOZWOLONE OPERACJE NA RÓWNANIACH UKŁADU (I) możemy dwa równania układu zamienić miejscami; (II) możemy obydwie strony któregoś z równań pomnożyć przez dowolny niezerowy skalar; (III) możemy równanie pomnożone przez dowolny skalar dodać do innego równania. Punkty (I) i (II) są oczywiste. Punkt (III) wynika z faktu, że spełnia
wtedy i tylko wtedy, gdy spełnia
Definicja 4.2.
Dozwolone operacje
Operacje (I)-(III) nazywamy dozwolonymi operacjami na równaniach układu równań liniowych.
Przykład 4.1.
Szczególnie łatwe do rozwiązania są układu w postaci ,,schodkowej’’. Przykładowo, w układzie równań (w ciele )
ostatnie równanie oznacza, że . Wtedy z drugiego równania . W konsekwencji, z pierwszego równania otrzymujemy, że . Zbiór rozwiązań układu składa się z jednego wektora .
4.1 Eliminacja Gaussa
Opiszemy na przykładzie metodę eliminacji Gaussa pozwalającą sprowadzić dowolny układ do postaci schodkowej. Rozważmy układ równań (w ciele )
Wszystkie informacje o rozważanym układzie możemy wygodnie zakodować przy pomocy macierzy (tabeli):
W wierszach macierzy wypisujemy współczynniki i wyrazy wolne poszczególnych równań. Macierz nazywamy macierzą układu, a macierz jego macierzą rozszerzoną. Dozwolone operacje (I)-(III) mają swój odpowiednik w postaci dozwolonych operacji na wierszach macierzy:
DOZWOLONE OPERACJE NA WIERSZACH MACIERZY UKŁADU RÓWNAŃ LINIOWYCH (I) możemy dwa wiersze macierzy zamienić miejscami (permutacja); (II) możemy wiersz pomnożyć przez dowolną niezerową liczbę rzeczywistą (skalowanie); (III) możemy wiersz pomnożony przez dowolną liczbę rzeczywistą dodać do innego wiersza. |
Zaczynamy od tego, że szukamy wiersza w którym pierwszy wyraz jest niezerowy. W naszym przypadku jest to wiersz pierwszy. Jeśli pierwszy niezerowy wyraz jest różny od , to używamy skalowania (II), aby uzyskać na pierwszej pozycji.
-
Jeżeli w pierwszym wierszu na pierwszej pozycji jest zero, to szukamy innego wiersza z niezerowym wyrazem na pierwszej pozycji. Jeśli taki istnieje, to używamy pierwszej operacji (I) i zamieniamy go miejscami z wierszem pierwszym. Może się zdarzyć, że wszystkie wiersze mają na pierwszej pozycji . Wtedy powtarzamy procedurę szukając wiersza z niezerowym wyrazem na drugiej pozycji i iterujemy poprzednią procedurę.
W pierwszym kroku, używamy pierwszego wiersza i operacji (III) do wprowadzenia zer w pierwszej kolumnie pod jedynką w pierwszym wierszu. Dodając pierwszy wiersz do drugiego otrzymujemy macierz:
Następnie, pomnożony przez 2 pierwszy wiersz dodajemy do wiersza trzeciego
Kończymy ten krok odejmując pierwszy wiersz od wiersza piątego
W drugim kroku używamy analogicznie drugiego wiersza do eliminacji niezerowych elementów w trzeciej kolumnie i wierszach od trzeciego do piątego. W efekcie otrzymujemy
W ostatnim kroku używamy trzeciego wiersza do eliminacji jedynek w piątej kolumnie oraz czwartym i piątym wierszu. Otrzymujemy macierz:
Ostatnie dwa wiersze nie niosą ze sobą żadnej informacji, więc możemy je pominąć otrzymując w efekcie macierz
której odpowiada układ równań
Wstawiamy teraz do trzeciego równania i wyliczamy w nim otrzymując
Cofamy się teraz do pierwszego równania i wyliczamy po wstawieniu wartości za i otrzymując
i pełnią tu rolę parametrów. Zbiór rozwiązań jest dany przez
Przykładowo, dla jednym z rozwiązań jest . Zbiór rozwiązań jest nieskończony, bo dowolnie wybranym i odpowiada jakieś rozwiązanie.
Przykład 4.2.
Przyglądnijmy się układom równań z niewiadomymi. Dla macierzy z niezerową pierwszą kolumną postać schodkowa musi być wtedy jednej z postaci:
W pierwszym przypadku układ ma dokładnie jedno rozwiązanie. W przypadku drugim, i możemy uzależnić od , które pełni rolę parametru. Zbiór rozwiązań jest nieskończony, bo może być dowolne. W trzecim przypadku, jest jednoznacznie wyznaczone i możemy uzależnić od pełniącego rolę parametru. Ponownie zbiór rozwiązań jest nieskończony. W czwartym, piątym i szóstym przypadku układ jest sprzeczny. W ostatnim układzie zbiorem rozwiązań jest płaszczyzna.
-
Zredukowana postać schodkowa macierzy jest wyznaczona jednoznacznie. Uzasadnimy ten fakt stosując indukcję względem , czyli liczby kolumn macierzy . Dla jest to oczywiste. Niech . Rozważmy macierz otrzymaną z przez skreślenie ostatniej kolumny. Każdy ciąg operacji elementarnych, który sprowadza do zredukowanej postaci schodkowej, sprowadza również macierz do zredukowanej postaci schodkowej. Z założenia indukcyjnego wynika więc, że jeśli i są zredukowanymi postaciami schodkowymi macierzy , to i mogą się różnić jedynie ostatnią kolumną. Przypuśćmy, że . Z definicji zredukowanej postaci schodkowej wynika, że na przykład -ta kolumna jest niezerowa, a -ta kolumna jest zerowa. Rozważmy taki wektor , że . Równoważnie , bo dozwolone operacje nie zmieniają zbioru rozwiązań. Stąd również , czyli , bo -pierwszych kolumn macierzy jest zerowych, a -ta jest niezerowa. Prowadzi to do sprzeczności, bo -ta kolumna macierzy jest zerowa, więc w takim wektorze , że może być dowolne.
Przykład 4.3.
Znajdziemy wielomian stopnia przechodzący przez punkty
Szukany wielomian ma postać
Jego współczynniki muszą spełniać układ równań
o macierzy rozszerzonej
Stąd
czyli
Przykład 4.4.
Rozważmy system skrzyżowań dwóch zbiorów dróg jednokierunkowych pokazany na Rys. 4.1. Liczby przy strzałkach oznaczają godzinną średnią liczbę pojazdów wkraczających i opuszczających skrzyżowanie w godzinach szczytu. Ponieważ liczba pojazdów wjeżdżających na skrzyżowanie jest równa liczbie pojazdów z niego wyjeżdżających, więc otrzymujemy układ równań
Przykład 4.5.
Rozwiążemy następujący układ równań nad :
Jest on równoważny z układem
czyli
Stąd , więc , czyli oraz .
ELIMINACJA GAUSSA – PODSUMOWANIE Jest to proces sprowadzania macierzy do postaci schodkowej. Możemy używać trzech dozwolonych operacji na wierszach: Permutacja wierszy – Skalowanie wierszy – Dodawanie wiersza do innego wiersza |
POSTAĆ SCHODKOWA MACIERZY • jeśli wiersz jest niezerowy, to pierwszym wyrazem niezerowym (liderem) jest • jeśli wiersz -ty jest niezerowy, to liczba wiodących wyrazów zerowych w wierszu jest większa niż w wierszu -tym, • jeśli są wiersze zerowe, to są one poniżej wierszy niezerowych. |
ZREDUKOWANA POSTAĆ SCHODKOWA MACIERZY • macierz ma postać schodkową, • pierwszy niezerowy element w wierszu jest jedynym niezerowym elementem w jego kolumnie. |
Rząd macierzy: liczba niezerowych wierszy w postaci schodkowej macierzy = liczba kolumna zawierających lidera. |
ZBIÓR ROZWIĄZAŃ Dla -macierzy oraz mamy • układ ma dokładnie jedno rozwiązanie • układ jest sprzeczny • układ ma nieskończenie wiele rozwiązań |
4.2 Kilka ważnych obserwacji
Dla układu równań (4.1) wprowadzamy następujące oznaczenia: macierz
(4.2) |
nazywamy macierzą główną układu, natomiast macierz
macierzą rozszerzoną układu. Macierz ma wierszy i kolumn. Przez oznaczamy zbiór wszystkich macierzy postaci (4.2), gdzie wszystkie wyrazy macierzy (, ) są elementami ciała .
Kolumny macierzy oraz prawą stronę układu możemy interpretować jako wektory w :
Będziemy wtedy pisali, że
Zauważmy, że wektor jest rozwiązaniem układu (4.1) wtedy i tylko wtedy, gdy
czyli
KONWENCJE MACIERZOWE ZAPISU UKŁADU RÓWNAŃ W konwencji wierszy W konwencji kolumn |
UKŁAD RÓWNAŃ W ZAPISIE MACIERZOWYM |
Układ równań (4.1) będziemy zapisywać w skrócie jako . Będziemy mówili, że układ ma rozwiązanie, jeśli zbiór jego rozwiązań jest niepusty. Powiemy, że ma on jednoznaczne rozwiązanie, jeśli zbiór jego rozwiązań składa się z jednego wektora.
Wniosek 4.1.
Układ równań ma rozwiązanie wtedy i tylko wtedy, gdy wektor jest kombinacją liniową kolumn macierzy .
Dla wektorów naturalnym więc jest rozważenie zbioru
wszystkich możliwych kombinacji liniowych wektorów .
Wniosek 4.2.
Układ równań liniowych ma rozwiązanie wtedy i tylko wtedy, gdy .
Wniosek 4.3.
Jeżeli układ (4.1) jest jednorodny, to jest jednym z jego rozwiązań.
Wektor zerowy jest zawsze jednym z rozwiązań układu jednorodnego . Ciekawe jest pytanie o to kiedy układ jednorodny nie ma innych rozwiązań. Kiedy ma jednoznaczne rozwiązanie? Aby tak było musi zachodzić implikacja: jeśli dla pewnych , to . Innymi słowy, jeśli kombinacja liniowa wektorów jest wektorem zerowym, to wszystkie jej współczynniki skalarne są równe . Oznacza to liniową niezależność wektorów .
Wniosek 4.4.
Układ jednorodny ma jednoznaczne rozwiązanie wtedy i tylko wtedy, gdy kolumny macierzy są liniowo niezależne.
Wniosek 4.5.
Układ ma co najwyżej jedno rozwiązanie wtedy i tylko wtedy, gdy kolumny macierzy są liniowo niezależne.
Dowód.
Zauważmy, że wektory są rozwiązaniami układu wtedy i tylko wtedy, gdy wektor jest rozwiązaniem układu jednorodnego . ∎
4.3 Układy dwóch równań z dwoma niewiadomymi
Zajmiemy się teraz dokładniej układem dwóch równań liniowych (w ciele ) z dwoma niewiadomymi
(4.3) |
Skojarzone z nim macierze: główna i rozszerzona to odpowiednio
Przyglądnijmy się możliwym przypadkom.
Przypadek 1. Zakładamy, że
jest macierzą zerową. Układ (4.3) przyjmuje postać
Jeżeli któraś z liczb lub jest różna od zera, to układ jest sprzeczny, czyli jego zbiór rozwiązań jest zbiorem pustym. Jeśli , to zbiorem rozwiązań jest cała płaszczyzna .
Przypadek 2. Zakładamy, że któryś z wierszy macierzy , powiedzmy drugi jest zerowy (czyli ), a pierwszy jest niezerowy. Układ (4.3) ma wtedy postać
Jeśli , to układ jest sprzeczny. Dla redukuje się on do jednego równania
opisującego prostą na płaszczyźnie, bo założyliśmy, że . W tym przypadku zbiorem rozwiązań układu jest więc prosta na płaszczyźnie.
Przypadek 3. Zakładamy, że obydwa wiersze macierzy są niezerowe. Wtedy obydwa równania opisują proste na płaszczyźnie. Szukamy więc punktów wspólnych dwóch prostych i na płaszczyźnie. Zachodzi jedna z trzech możliwości:
-
(i)
Proste są równe (). Wtedy zbiorem rozwiązań jest prosta .
-
(ii)
Proste i są równoległe, ale różne. Wtedy układ jest sprzeczny.
-
(iii)
Proste i nie są równoległe. Wtedy przecinają się w jednym punkcie. Zbiór rozwiązań układu jest jednoelementowy, czyli układ ma dokładnie jedno rozwiązanie.
Definicja 4.4.
Wyznacznik
Wyznacznik macierzy
definiujemy jako skalar
-
Dla niezerowego skalara przez będziemy oznaczać element odwrotny do względem mnożenia w ciele .
Twierdzenie 4.1 (Wzory Cramera).
Układ równań (4.3) ma dokładnie jedno rozwiązanie wtedy i tylko wtedy, gdy . Jest ono wtedy dane wzorami Cramera
Dowód.
Załóżmy, że . Wtedy lub tzn. wektor nie może być zerowy. Załóżmy, że . Dowód w przypadku jest analogiczny. Z pierwszego równania . Po podstawieniu do drugiego równania otrzymujemy równoważny z (4.3) układ równań
(4.4) |
Jego rozwiązaniem jest jeden punkt
co kończy dowód tej implikacji.
Zakończymy dowód pokazując, że jeżeli , to układ (4.3) jest albo sprzeczny albo jego zbiór rozwiązań jest nieskończony. Zachodzi jedna z dwóch moźliwości
-
(a)
;
-
(b)
.
W przypadku (a) układ (4.3) przyjmuje postać
Jest on albo sprzeczny (nie istnieje rozwiązanie ) albo ma nieskończenie wiele rozwiązań (istnieje rozwiązanie i wtedy jest dowolną liczbą rzeczywistą).
Twierdzenie 4.2.
Wektory są liniowo niezależne wtedy i tylko wtedy, gdy
Wówczas, dla dowolnego istnieją jednoznacznie wyznaczone takie skalary , że
Dowód.
Liniowa niezależność wektorów i jest z definicji równoważna z faktem, że równość implikuje, że , czyli układ równań
ma dokładnie jedno rozwiązanie . Ponieważ jest pewnym rozwiązaniem tego układu, więc teza wynika z Twierdzenia 4.1.
∎
Wniosek 4.6.
Niech . Wtedy wektory są liniowo zależne.
Dowód.
Przeprowadzimy dowód niewprost. Przypuśćmy, że wektory , , są liniowo niezależne. Z definicji liniowej niezależności wynika, że wtedy również wektory są liniowo niezależne. Z Twierdzenia 4.2 istnieją takie skalary , że
co prowadzi do sprzeczności z liniową niezależnością wektorów , , , bo
∎
-
Podamy pewną geometryczną interpretację wyznacznika na płaszczyźnie . Załóżmy, że wektory i są liniowo niezależne. Wtedy . Zauważmy, że
-
–
wtedy i tylko wtedy, gdy wtedy i tylko wtedy, gdy najkrótszy kąt obrotu od wektora do wektora jest skierowany przeciwnie do ruchu wskazówek zegara;
-
–
wtedy i tylko wtedy, gdy wtedy i tylko wtedy, gdy najkrótszy kąt obrotu od wektora do wektora jest skierowany zgodnie z ruchem wskazówek zegara.
-
–
PO CO NAM WYZNACZNIK? Dla macierzy poniższe warunki są równoważne: • , • kolumny , są liniowo niezależne, • każdy wektor można jednoznacznie zapisać w postaci kombinacji liniowej , • dla każdego wektora układ równań ma dokładnie jedno rozwiązanie. |
Rozdział 5 Baza i wymiar
SŁOWA KLUCZOWE ROZDZIAŁU generowanie liniowa niezależność baza wymiar postać schodkowa podprzestrzeń przestrzeń wektorowa podprzestrzeń wektorowa |
5.1 Generowanie i liniowa niezależność
Definicja 5.1.
Podprzestrzeń generowana przez wektory
Niech będzie przestrzenią wektorową nad ciałem . Kombinacją liniową wektorów nazywamy dowolny wektor postaci
Zbiór oznacza zbiór wszystkich wektorów będących kombinacjami liniowymi wektorów , czyli
Nazywamy go podprzestrzenią generowaną przez wektory . Powiemy, że wektory generują przestrzeń wektorową , jeśli
Przykład 5.1.
Niech . Wyznaczymy . Mamy możliwe kombinacje liniowe:
-
•
,
-
•
,
-
•
,
-
•
.
Stąd
Definicja 5.2.
Liniowa niezależność wektorów
Wektory są liniowo niezależne, jeśli dla skalarów zachodzi implikacja
Oznacza to, że jeśli kombinacja liniowa wektorów jest wektorem zerowym, to wszystkie jej skalarne współczynniki są równe zero.
Przykład 5.2.
Rozważmy przestrzeń wektorową wszystkich funkcji . Pokażemy, że funkcje i są liniowo niezależne. Przypuśćmy, że dla pewnych . Oznacza to, że dla dowolnego mamy
Podstawiając w tej równości otrzymujemy, że . Wstawiając dostajemy, że .
Przykład 5.3.
Pokażemy, że wektory
są liniowo zależne w . Zauważmy, że
oraz
czyli jest kombinacją liniową wektorów .
Z drugiej strony, wektory są liniowo niezależne nad . Rzeczywiście, równość
oznacza, że
więc .
Definicja 5.3.
Baza przestrzeni wektorowej
Niech będzie przestrzenią wektorową nad ciałem . Wektory stanowią bazę przestrzeni wektorowej , jeśli spełnione są warunki:
-
(B1)
wektory generują przestrzeń , czyli
-
(B2)
wektory są liniowo niezależne.
Warunek (B1) oznacza, że każdy wektor można przedstawić jako kombinację liniową wektorów , a warunek (B2) gwarantuje, że takie przedstawienie jest jednoznaczne.
Przykład 5.4.
Wektory
stanowią bazę przestrzeni wektorowej . Rzeczywiście, są one liniowo niezależne, bo jeśli
to . Sprawdzimy warunek (B2). Niech będzie dowolnym wektorem. Wtedy
czyli .
Wniosek 5.1.
Wektory stanowią bazę dla wtedy i tylko wtedy, gdy dla każdego wektora istnieją jednoznacznie wyznaczone takie skalary , że
Dowód.
Załóżmy najpierw, że tworzą bazę . Niech będzie dowolnym wektorem. Z warunku (B2) wynika, że istnieją takie skalary , że . Musimy pokazać, że są one wyznaczone jednoznacznie. Przypuśćmy więc, że
gdzie . Wtedy
Ponieważ wektory są liniowo niezależne, więc | ||||
co kończy dowód pierwszej implikacji.
Załóżmy teraz, że dla każdego wektora istnieją jednoznacznie wyznaczone takie skalary , że
Wtedy oczywiście zachodzi warunek (B2). Pokażemy liniową niezależność wektorów . Przypuśćmy, że dla pewnych skalarów . Ponieważ
więc z założonej jednoznaczności skalarów wynika, że .
∎
Lemat 5.1.
Niech . Jeśli , to
Dowód.
Oczywiście . Niech . Wtedy
dla pewnych skalarów . Ponieważ , więc dla pewnych skalarów . Stąd
∎
Lemat 5.2.
Załóżmy, że wektory są liniowo niezależne. Jeśli , to
są liniowo niezależne.
Dowód.
Załóżmy, że
dla pewnych skalarów . Zauważmy, że , bo w przeciwnym razie
W konsekwencji, również , bo są liniowo niezależne. ∎
Twierdzenie 5.1.
Załóżmy, że . Wtedy istnieje
baza dla .
Dowód.
Bez straty ogólności, na podstawie Lematu 5.1, możemy założyć, że wektory są niezerowe. Jeżeli , to dowód jest zakończony. Jeśli , to któryś z wektorów nie należy do . Powiedzmy, że jest to . Wtedy są liniowo niezależne z Lematu 5.2. Możemy ten proces kontynuować rozważając teraz . W skończonej liczbie kroków wybierzemy bazę ze zbioru . ∎
Twierdzenie 5.2 (Steinitz).
Załóżmy, że dla pewnych wektorów (). Jeśli wektory są liniowo niezależne, to
-
•
-
•
po ewentualnym przenumerowaniu wektorów mamy
Dowód.
Zastosujemy indukcję względem . Niech . Oczywiście . Rozważmy wektor . Ponieważ , więc
dla pewnych skalarów . Ponieważ z założenia , więc któryś ze skalarów jest różny od zera. Przenumerowując wektory i skalary możemy założyć, że . Uzasadnimy, że . Ponieważ , więc z Lematu 5.1 wynika, że
Z drugiej strony , więc , czyli
Zakładamy teraz, że teza zachodzi dla pewnego . Pokażemy, że zachodzi dla . Z założenia indukcyjnego oraz
Istnieją więc takie skalary , że
Zauważmy, że istnieje takie , że , bo w przeciwnym razie co jest sprzeczne z ich liniową zależnością. Po ewentualnym przenumerowaniu możemy założyć, że . W szczególności, . Mamy
Ponieważ , więc
∎
Twierdzenie 5.3.
Załóżmy, że wektory stanowią bazę przestrzeni wektorowej . Jeśli wektory są liniowo niezależne, to .
Dowód.
Przypuśćmy, że . Pokażemy, że wektory są bazą . Prowadzi to do sprzeczności, bo wtedy jest kombinacją liniową wektorów , a z założenia wektory są liniowo niezależne.
Rozważmy wektor . Ponieważ są bazą , więc
dla jednoznacznie wyznaczonych skalarów . Ponieważ z założenia , więc któryś ze skalarów jest różny od zera. Przenumerowując wektory i skalary możemy założyć, że . Uzasadnimy, że są bazą dla . Przypuśćmy, że
dla pewnych skalarów . Jeśli , to również bo wektory są liniowo niezależne. Jeśli , to
co jest sprzeczne z jednoznacznością zapisu w bazie , bo .
Uzasadnimy, że możemy ten proces iterować. Przypuśćmy, że dla pewnego wektory
tworzą bazę . Istnieją więc jedyne takie skalary , że
Zauważmy, że istnieje takie , że , bo w przeciwnym razie co jest sprzeczne z liniową zależnością. Z dokładnością do permutacji możemy założyć, że i możemy podmienić wektor na otrzymując bazę
∎
Wniosek 5.2.
Załóżmy, że jest bazą . Wtedy każda baza w ma elementów.
Definicja 5.4.
Przestrzeń skończenie wymiarowa
Niech będzie przestrzenią wektorową nad ciałem . Powiemy, że przestrzeń jest skończenie wymiarowa, jeśli posiada bazę skończoną. Wymiarem przestrzeni skończenie wymiarowej nazywamy liczbę elementów jej dowolnej bazy i oznaczamy przez lub . Przyjmujemy z definicji, że , gdy . Jeśli przestrzeń nie jest skończenie wymiarowa, to mówimy, że jest nieskończenie wymiarowa.
-
Istnienie bazy skończonej w przestrzeni wektorowej bardzo ułatwia analizę jej własności, bo pozwala ograniczyć się do rozważania kombinacji liniowych skończonej liczby wektorów. Z drugiej strony musimy być świadomi w jaki sposób, jeśli w ogóle, rozważane przez nas pojęcia lub przeprowadzane rozumowania zależą od wyboru bazy w przestrzeni . Przykładowo definiując wymiar przestrzeni wektorowej musieliśmy uzasadnić, że wszystkie bazy mają tyle samo elementów.
Wniosek 5.3.
dla .
Dowód.
Wektory stanowią bazę dla złożoną z -wektorów. ∎
Przykład 5.5.
W przestrzeni wektorowej nad istnieje tylko jedna baza, bo w mamy tylko jeden niezerowy wektor.
Przykład 5.6 (Przestrzeń nad ciałami i ).
Rozważmy przestrzenie wektorowe oraz . Pierwsza jest przestrzenią zespoloną oraz
Bazą dla są przykładowo wektory . Druga przestrzeń, jest przestrzenią rzeczywistą oraz
Bazą dla są na przykład wektory:
Rzeczywiście, dla i mamy
i to przedstawienie jest jednoznaczne.
Przykład 5.7 (Przestrzeń wektorowa macierzy ).
Wprowadzimy strukturę przestrzeni wektorowej w zbiorze . W tym celu określimy działania
oraz
Dla i definiujemy
Sprawdzamy łatwo, że trójka jest przestrzenią wektorową nad ciałem . Znajdziemy bazę dla przestrzeni . Zauważmy, że dla dowolnej macierzy mamy
Ponieważ współczynniki są w tym przedstawieniu wyznaczone jednoznacznie przez macierz , więc macierze
są bazą , więc .
Z powyższego wynika, że . Przestrzeń możemy również traktować jako przestrzeń wektorową nad . Zastanówmy się jaki jest wymiar . Każdy ze współczynników macierzy jest liczbą zespoloną. Macierz możemy teraz mnożyć tylko przez liczby rzeczywiste. Mamy
Wynika stąd, że .
Przykład 5.8.
Pokażemy, że rozważanie przestrzeni wektorowych nad może być użyteczne w rozwiązywaniu problemów kombinatorycznych.
W pewnym mieście mieszka osób i działa klubów dyskusyjnych. Każda z nich ma nieparzystą liczbę członków oraz każde dwa kluby mają parzystą liczbę wspólnych członków. Pokażemy, że .
Dla , przez oznaczamy wektor przynależności mieszkańców do klubu . Oznacza to, że , gdy -ty mieszkaniec należy do klubu . W przeciwnym razie . Wtedy jest liczbą członków klubu . Wiemy, że jest to liczba nieparzysta. W mamy więc, że . Analogicznie dla , jest liczbą osób będących w klubach oraz . Z założenia wynika, że dla . Wystarczy pokazać, że są liniowo niezależne w . Przypuśćmy, że dla pewnych mamy
Ponieważ , więc .
Lemat 5.3.
Niech będzie przestrzenią wektorową. Następujące warunki są równoważne
-
(i)
jest nieskończenie wymiarowa,
-
(ii)
istnieje taki nieskończony ciąg wektorów , że dla każdego wektory są liniowo niezależne.
Dowód.
Załóżmy, że jest nieskończenie wymiarowa. Niech będzie niezerowym wektorem. Ponieważ , więc istnieje wektor . Wtedy są liniowo niezależne. Analogicznie, , więc istnieje wektor . Wtedy są liniowo niezależne. Możemy ten proces kontynuować dla każdego , co kończy dowód punktu (ii).
Załóżmy, że zachodzi warunek (ii). Gdyby miała wymiar skończony , to wektory byłyby liniowo zależne. ∎
-
Pojęcie bazy w przestrzeni nieskończenie wymiarowej możemy zdefiniować następująco. Powiemy, że podzbiór jest liniowo niezależny, jeżeli dla dla każdego dowolne różne wektory są liniowo niezależne. Podzbiór generuje , gdy dla każdego wektora istnieją takie wektory oraz skalary , że . Podzbiór jest bazą, jeśli jest liniowo niezależny i generuje . W oparciu o Lemat Kuratowskiego-Zorna można udowodnić, że w każdej przestrzeni wektorowej istnieje baza. Dokładniej, jeśli jest liniowo niezależny, generuje oraz , to istnieje taka baza , że .
Przykład 5.9 (Przestrzeń wektorowa ciągów rzeczywistych).
Rozważmy przestrzeń wektorową
wszystkich ciągów nieskończonych o wyrazach rzeczywistych z naturalnie określonymi działaniami. Sprawdzamy łatwo, że ciąg wektorów
tworzy zbiór liniowo niezależny , więc jest nieskończenie wymiarowa. nie generuje przestrzeni , bo na przykład ciąg
nie jest skończoną kombinacją liniową wektorów .
Przykład 5.10 (Przestrzeń wektorowa wielomianów).
Niech będzie przestrzenią wektorową wszystkich wielomianów o współczynnikach rzeczywistych. Nie jest to przestrzeń skończonego wymiaru, bo wielomiany
są liniowo niezależne.
Niech będzie zbiorem wielomianów stopnia co najwyżej . Wtedy, jest podprzestrzenią wektorową oraz
Bazą dla są wielomiany .
Jeśli jest zbiorem wielomianów stopnia , to nie jest podprzestrzenią wektorową, bo wielomian zerowy nie należy do .
Twierdzenie 5.4.
Niech i . Dla wektorów następujące warunki są równoważne:
-
(1)
są liniowo niezależne;
-
(2)
;
-
(3)
stanowią bazę .
Dowód.
(1) (2). Zakładamy, że są liniowo niezależne. Przypuśćmy, że
Istnieje wtedy wektor . Z Lematu 5.2 wynika, że wektory są liniowo niezależne. Jest to sprzeczne z Twierdzeniem 5.3.
(3) (1) Jest konsekwencją definicji bazy. ∎
Wniosek 5.4.
Wektory tworzą bazę wtedy i tylko wtedy, gdy
Wniosek 5.5.
Niech . Następujące warunki są równoważne
-
(1)
układ ma jednoznaczne rozwiązanie zerowe,
-
(2)
układ ma rozwiązanie dla każdego ,
-
(3)
kolumny tworzą bazę .
Dowód.
Punkt (1) oznacza, że wektory są liniowo niezależne, a punkt (2) mówi, że . ∎
Wniosek 5.6.
Załóżmy, że , i wektory są liniowo niezależne. Wtedy istnieją takie wektory , że wektory tworzą bazę .
Dowód.
Ponieważ , więc nie jest bazą. Istnieje więc wektor
Z Lematu 5.2 wektory są liniowo niezależne. Iterujemy tę procedurę i zakończy się ona po skończonej liczbie kroków. ∎
5.2 Podprzestrzenie wektorowe
Definicja 5.5.
Podprzestrzeń wektorowa
Niech będzie przestrzenią wektorową nad ciałem i niech . Powiemy, że jest podprzestrzenią wektorową przestrzeni , jeśli zachodzą warunki
-
(P1)
tzn. wektor zerowy należy do ;
-
(P2)
dla dowolnych tzn. dodawanie wektorów nie wyprowadza nas ze zbioru ;
-
(P3)
dla dowolnych i tzn. mnożenie przez skalar nie wyprowadza nas ze zbioru .
-
Czasami (P1) zastępuje się warunkiem, że . Te dwie definicje są równoważne. Rzeczywiście, załóżmy, że i zachodzą warunki (P2) i (P3). Niech . Wtedy z warunku (P3) i z warunku (P2).
Wniosek 5.7.
Jeśli , to jest podprzestrzenią przestrzeni wektorowej .
Wniosek 5.8.
Zbiór rozwiązań równania jednorodnego jest podprzestrzenią wektorową przestrzeni dla .
Przykład 5.11.
Rozważmy płaszczyznę . Zauważmy, że wtedy , więc
Stąd , czyli jest to podprzestrzeń wektorowa w .
Przykład 5.12.
Pokażemy, że zbiór jest podprzestrzenią wektorową w . Zauważmy, że
Oznacza to, że , więc jest to podprzestrzeń wektorowa.
Przykład 5.13.
Okrąg nie spełnia ani jednego z warunków (P1)-(P3). Nie jest więc podprzestrzenią wektorową.
Przykład 5.14.
Zbiór spełnia warunki (P1) i (P3), ale nie spełnia (P2). Nie jest więc podprzestrzenią wektorową.
Przykład 5.15.
Zbiór spełnia warunki (P1) i (P2), ale nie spełnia (P3). Nie jest więc podprzestrzenią wektorową.
Przykład 5.16.
Zbiór pusty spełnia warunki (P2) i (P3), ale nie spełnia (P1). Nie jest więc podprzestrzenią wektorową.
Przykład 5.17.
Rozważmy podprzestrzeń daną przez
W ciele równość oznacza, że , czyli wektory z mają postać
Wektory są liniowo niezależne, więc . Sprawdzamy łatwo rozważając wszystkie możliwości wyboru i , że
Przykład 5.18.
Zastanówmy się ile -wymiarowych podprzestrzeni ma przestrzeń wektorowa ? Niech będzie niezerowym wektorem. Wtedy
więc jeśli są różnymi niezerowymi wektorami, to są one liniowo niezależne w . Ponadto,
składa się z różnych wektorów. W przestrzeni mamy wektorów i wektorów niezerowych. Par liniowo niezależnych wektorów mamy więc . Ponieważ
więc różnych podprzestrzeni wymiarowych jest .
-
Oceń prawdziwość zdań:
-
–
Jeśli tworzą bazę i jest niezerowym wektorem, to również tworzy bazę .
-
–
Istnieją takie -wymiarowe podprzestrzenie wektorowe i w , że .
-
–
Istnieją takie -wymiarowe podprzestrzenie wektorowe i w , że .
-
–
Jeśli są podprzestrzeniami wektorowymi , to jest również podprzestrzenią wektorową.
-
–
Jeśli wektory generują , to są liniowo niezależne.
-
–
Jeśli wektory generują przestrzeń wektorową , to są liniowo niezależne.
-
–
Jeśli wektory są liniowo zależne, to któryś z nich jest wektorem zerowym.
-
–
Jeśli wektory są liniowo zależne w , to .
-
–
Jeśli , to .
-
–
Jeśli , to dla dowolnego .
-
–
Przestrzenie i mają ten sam wymiar nad ciałem liczb rzeczywistych .
-
–
Jeśli , to któreś dwa wektory spośród są liniowo niezależne.
-
–
Dla dowolnej macierzy macierze są liniowo zależne w przestrzeni wektorowej .
-
–
Dla dowolnej macierzy niezerowej macierze
generują przestrzeń wektorową .
-
–
Zbiór wszystkich takich funkcji , że jest przestrzenią wektorową z naturalnymi działaniami.
-
–
Funkcje i są liniowo niezależne w przestrzeni funkcji .
-
–
Funkcje i generują przestrzeń funkcji .
-
–
Jeśli jest dowolnym wektorem, to
jest podprzestrzenią wektorową .
-
–
Jeśli są takie, że , to są liniowo niezależne.
-
–
-
Oceń które z poniższych podzbiorów przestrzeni wektorowej są jej podprzestrzeniami wektorowymi:
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
, gdzie ,
-
–
, gdzie jest ustaloną macierzą.
-
–
-
Oceń które z poniższych podzbiorów przestrzeni wektorowej funkcji są jej podprzestrzeniami wektorowymi:
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
,
-
–
.
-
–
NIE ZA DUŻO NIE ZA MAŁO TYLKO W SAM RAZ Niech . • jeśli są liniowo niezależne, to ; wtedy da się uzupełnić do bazy, • jeśli , to ; wtedy ze zbioru da się wybrać bazę. Poniższe warunki są równoważne • są bazą , • są liniowo niezależne, • . |
Rozdział 6 Odwzorowania liniowe
SŁOWA KLUCZOWE ROZDZIAŁU odwzorowanie liniowe macierz jako odwzorowanie liniowe rzut prostopadły na prostą symetria względem prostej obrót przestrzeń wektorowa odwzorowań liniowych jądro i obraz mono-epi-izo formuła wymiaru Dwie podstawowe podprzestrzenie: jądro i obraz. |
Definicja 6.1.
Odwzorowanie liniowe
Niech , będą przestrzeniami wektorowymi nad tym samym ciałem . Odwzorowanie nazywamy odwzorowaniem liniowym, jeśli zachodzą warunki
-
(L1)
(addytywność)
-
(L2)
(jednorodność)
Wniosek 6.1.
Jeśli jest odwzorowaniem liniowym, to .
Dowód.
Teza zachodzi, bo , więc . ∎
Przykład 6.1.
Odwzorowanie nie jest odwzorowaniem liniowym, bo .
Przykład 6.2.
Odwzorowanie nie jest odwzorowaniem liniowym pomimo, że . Nie spełnia ono żadnego z warunków (L1)-(L2). Rzeczywiście, oraz i równość nie zachodzi dla wszystkich liczb rzeczywistych. Podobnie, , a .
Przykład 6.3.
Pokażemy, że jeśli jest liniowe, to istnieje taka liczba rzeczywista , że . Rzeczywiście,
więc wystarczy przyjąć, że .
ODWZOROWANIE LINIOWE ZADANE MACIERZĄ Rozważmy macierz i wektor . Definiujemy Możemy określić odwzorowanie przez Jest to odwzorowanie liniowe, bo jak łatwo sprawdzamy |
Przykład 6.4.
Odwzorowanie
jest liniowe, bo (jest ono zadane macierzą ) dla
Zauważmy, że .
Przykład 6.5 (Rzut prostopadły na prostą w ).
Niech będzie niezerowym wektorem. Rozważmy odwzorowanie dane wzorem
Jest to rzut prostopadły na prostą generowaną przez wektor . Zauważmy, że
Rozważmy macierz
Wtedy . Zauważmy, że dla wektora jednostkowego mamy
Przykład 6.6 (Symetria względem prostej na płaszczyźnie).
Załóżmy, że prosta tworzy z osią kąt . Znajdziemy macierz symetrii względem prostej . Wektor jest wektorem jednostkowym na prostej . Niech będzie macierzą rzutu prostopadłego na prostą . Sprawdzamy łatwo, że
czyli . Stąd
-
Rysunek 6.2 przedstawia obrazy kwadratu jednostkowego rozpiętego na wektorach bazowych pod wpływem działania macierzy . Dopasować poniższe macierze z odpowiednim obrazkiem:
-
–
z ,
-
–
z ,
-
–
jednokładność: z ,
-
–
jednokładność: z ,
-
–
symetria względem osi : ,
-
–
obrót:
-
–
symetria względem punktu : ,
-
–
symetria względem prostej nachylonej do osi pod kątem : ,
-
–
z ,
-
–
rzutowanie na oś : ,
-
–
rzutowanie na oś : ,
Przeanalizować jak zmienia się pole obrazu kwadratu jednostkowego przez w zależności od wyznacznika macierzy .
-
–
6.1 Przestrzeń wektorowa odwzorowań liniowych
Definicja 6.2.
Przestrzeń wektorowa odwzorowań liniowych
Niech . Definiujemy zbiór
Wprowadzimy w zbiorze strukturę przestrzeni wektorowej nad cialem . Dla oraz definiujemy:
Tak określona trójka jest przestrzenią wektorową nad ciałem .
-
Załóżmy, że jest bazą przestrzeni wektorowej i jest odwzorowaniem liniowym. Dla dowolnego istnieją jednoznacznie wyznaczone takie skalary , że . Wtedy z liniowości otrzymujemy, że
czyli
(6.1) Równość (6.1) oznacza, że odwzorowanie jest jednoznacznie wyznaczone przez swoje wartości na dowolnej bazie przestrzeni . Jest to bardzo przyjemna własność odwzorowań liniowych: wystarczy znać skończoną liczbę wartości, aby znać całe odwzorowanie.
Wniosek 6.2.
Niech będzie bazą przestrzeni wektorowej . Dla dowolnych wektorów istnieje dokładnie jedno takie odwzorowanie liniowe , że
W szczególności, jeśli są takie, że
to .
Dowód.
Pokażemy najpierw, że takie odwzorowanie liniowe istnieje. Wektor zapisujemy jednoznacznie w bazie jako kombinację liniową . Definiujemy odwzorowanie przez
Tak zdefiniowane jest oczywiście liniowe. Jeśli, jest innym odwzorowaniem liniowym spełniającym tezę, to
∎
Lemat 6.1.
Jeśli i są odwzorowaniami liniowymi, to jest również liniowe.
Dowód.
Warunek (L1) zachodzi, bo dla mamy
Podobnie, | ||||
∎
6.2 Jądro i obraz odwzorowania liniowego
Definicja 6.3.
Jądro odwzorowania liniowego
Jądro odwzorowania liniowego definiujemy jako
Wniosek 6.3.
Jeśli jest odwzorowaniem liniowym, to jest podprzestrzenią przestrzeni wektorowej .
Dowód.
Ponieważ , więc , czyli zachodzi warunek (P1). Jeśli , to
więc , czyli spełniony jest warunek (P2). Dla i , to
czyli zachodzi warunek (P3). ∎
Przykład 6.7.
Rozważmy płaszczyznę o równaniu w . Ponieważ odwzorowanie
jest liniowe oraz , więc jest podprzestrzenią wektorową w .
Definicja 6.4.
Obraz odwzorowania liniowego
Obraz odwzorowania liniowego to zbiór
Wniosek 6.4.
Jeśli jest odwzorowaniem liniowym, to jego obraz jest podprzestrzenią wektorową w .
Dowód.
Ponieważ , więc . Niech . Wtedy istnieją takie , że
Stąd
czyli . Jeśli i , to istnieje taki wektor , że . Stąd
czyli . ∎
Przykład 6.8.
Zbiór
jest podprzestrzenią wektorową w , bo jest on obrazem odwzorowania liniowego
6.3 Mono-Epi-Izo. Formuła wymiaru
Definicja 6.5.
Monomorfizm-epimorfizm-izomorfizm
Niech będzie odwzorowaniem liniowy. Mówimy, że
-
(i)
jest monomorfizmem, gdy jest różnowartościowe (injekcją),
-
(ii)
jest epimorfizmem, gdy , czyli jest surjekcją,
-
(iii)
jest izomorfizmem, gdy jest bijekcją, czyli jest zarówno monomorfizmem jak i epimorfizmem.
-
Możecie zapytać dlaczego wprowadzamy nowe nazwy monomorfizm, epimorfizm, izomorfizm na znane nam z teorii mnogości pojęcia injekcja, surjekcja, bijekcja. Odpowiedź jest prosta. Robimy to dla wygody. Przykładowo, stwierdzenie jest monomorfizmem niesie w sobie więcej treści niże samo stwierdzenie, że jest odwzorowaniem różnowartościowym. Zamiast krótkiego jest monomorfizmem powinniśmy powiedzieć: jest odwzorowaniem liniowym przestrzeni wektorowych i jest różnowartościowe. Monomorfizm oznacza więc różnowartościowość, ale jednocześnie liniowość odwzorowania.
Wiele problemów matematycznych da się sprowadzić do zagadnienia istnienia i jednoznaczności rozwiązań równania
gdzie jest odwzorowaniem i . Różnowartościowość oznacza, że przy ustalonym istnieje co najwyżej jedno rozwiązanie . Z drugiej strony, surjektywność gwarantuje, że dla dowolnego istnieje pewne rozwiązanie . Połączenie tych warunków, czyli bijektywność oznacza, że dla dowolnego istnieje dokładnie jeden taki , że .
Lemat 6.2.
jest monomorfizmem wtedy i tylko wtedy, gdy .
Dowód.
Niech będzie monomorfizmem. Jeśli , to , czyli . Oznacza to, że . Załóżmy teraz, że . Jeśli oraz , to z liniowości mamy
czyli , więc . ∎
Lemat 6.3.
Jeśli jest monomorfizmem i są liniowo niezależne, to wektory
są liniowo niezależne.
Dowód.
Załóżmy, że dla pewnych skalarów . Wtedy
czyli | ||||
więc | ||||
Ponieważ są liniowo niezależne, więc . ∎
Lemat 6.4.
Jeśli jest epimorfizmem i , to .
Dowód.
Niech . Ponieważ jest epimorfizmem, więc istnieje taki wektor , że . Z założenia , więc dla pewnych . Wtedy
czyli . ∎
Wniosek 6.5.
Jeśli jest izomorfizmem liniowym i jest bazą , to jest bazą .
Wniosek 6.6.
Niech będzie odwzorowaniem liniowym i . Następujące warunki są równoważne:
-
(i)
jest izomorfizmem,
-
(ii)
dla każdej bazy w , wektory tworzą bazę w ,
-
(iii)
istnieje taka baza w , że wektory tworzą bazę w .
Wniosek 6.7.
Jeśli odwzorowanie jest liniowe i , to .
Dowód.
Zauważmy, że odwzorowanie liniowe
jest epimorfizmem, więc jeśli jest bazą dla , to
∎
-
Jeśli jest izomorfizmem liniowym, to odwzorowanie odwrotne jest również liniowe. Rzeczywiście, niech . Musimy uzasadnić, że . Niech i . Z liniowości mamy
czyli .
Analogicznie uzasadniamy, że . Niech . Wtedy
czyli .
Wniosek 6.8.
Niech będzie odwzorowaniem liniowym i . Wtedy następujące warunki są równoważne
-
(1)
jest monomorfizmem,
-
(2)
jest epimorfizmem,
-
(3)
jest izomorfizmem.
Twierdzenie 6.1.
Niech . Jeśli , to jest izomorficzna z .
Dowód.
Niech będzie bazą dla , a bazą standardową w . Definiujemy odwzorowanie liniowe zadając jego wartości na bazie:
∎
Wniosek 6.9.
Jeśli są skończenie wymiarowe, to jest izomorficzna z wtedy i tylko wtedy, gdy .
Dowód.
Jeśli , to i są izomorficzne, gdyż obydwie są izomorficzne z . Z drugiej strony, jeśli i są izomorficzne, to mają taki sam wymiar, bo izomorfizm przekształca bijektywnie bazę na bazę. ∎
Twierdzenie 6.2 (Formuła wymiaru).
Załóżmy, że odwzorowanie jest liniowe i . Wtedy
Dowód.
Wybieramy bazę dla i rozszerzamy ją do bazy
dla . Wtedy
Mamy udowodnić, że . Wystarczy pokazać, że wektory tworzą bazę . Pokażemy najpierw, że wektory generują . Niech . Istnieje więc taki wektor
że . Stąd | ||||
czyli .
Pokażemy teraz, że wektory są liniowo niezależne. Przypuśćmy, że
dla pewnych skalarów . Musimy pokazać, że | ||||
Z liniowości otrzymujemy, że | ||||
czyli Stąd | ||||
jest kombinacją liniową wektorów , czyli | ||||
dla pewnych skalarów . Wtedy | ||||
więc , bo tworzą bazę .
∎
Przykład 6.9.
Rozważmy odwzorowanie liniowe dane przez
Przestrzeń składa się tylko z wektorów, więc możemy wypisać wszystkie wartości :
Stąd,
Rozdział 7 Działania na macierzach
SŁOWA KLUCZOWE ROZDZIAŁU transponowanie macierz symetryczna i antysymetryczna macierz identycznościowa macierz nieosobliwa odwrotność iloczynu transpozycja iloczynu jądro i obraz rząd macierzy formuła wymiaru rząd macierzy transponowanej macierz diagonalna macierz trójkątna ślad macierzy grafy rekurencje liniowe macierze elementarne macierze wierszowo równoważne rozkład zmiana bazy macierz przejścia |
7.1 Transponowanie
W zbiorze macierzy zdefiniowaliśmy dodawanie
oraz mnożenie macierzy przez skalar
Otrzymaliśmy w ten sposób przestrzeń wektorową . Przypomnijmy, że przyjęliśmy konwencję
Wektor możemy interpretować jako macierz o -wierszach i jednej kolumnie, czyli element . Z drugiej strony jest w naturalny sposób macierzą o jednym wierszu i -kolumnach, czyli elementem .
Definicja 7.1.
Macierz transponowana
Niech będzie macierzą o wierszach . Macierz transponowana jest zdefiniowana jako
Oznacza to, że wiersze macierzy stają się kolumnami macierzy transponowanej . Wynika stąd, że jeśli oraz , to
Przykładowo,
MACIERZ TRANSPONOWANA gdzie |
Wniosek 7.1.
Dla macierzy i zachodzą warunki
-
(i)
,
-
(ii)
,
-
(iii)
.
-
Warunki (ii) i (iii) oznaczają, że transponowanie macierzy
jest odwzorowaniem liniowym i jest to izomorfizm. Warunek (i) gwarantuje dla , że .
Definicja 7.2.
Macierz symetryczna i antysymetryczna
Macierz kwadratową nazywamy symetryczną, gdy
Powiemy, że jest skośnie symetryczna (antysymetryczna), gdy
Wniosek 7.2.
Niech . Dla dowolnej macierzy macierz jest symetryczna, a macierz jest skośnie symetryczna. W szczególności, każda macierz jest sumą macierzy symetrycznej i skośnie symetrycznej:
Podamy teraz geometryczną interpretację rzeczywistej macierzy transponowanej.
Lemat 7.1.
Niech oraz . Następujące warunki są równoważne
-
(i)
dla wszystkich , ,
-
(ii)
.
Dowód.
Dla , mamy
oraz | ||||
Wynika stąd, że dla wszystkich i wtedy i tylko wtedy, gdy dla wszystkich oraz , czyli gdy . ∎
Wniosek 7.3.
Dla dowolnej macierzy mamy
Ponadto, jest symetryczna wtedy i tylko wtedy, gdy
7.2 Iloczyn macierzy
Rozważmy macierze
Definiujemy iloczyn
Dla macierzy o wierszach oraz macierzy (wektora) przyjmujemy, że
Definicja 7.3.
Iloczyn macierzy
Niech i . Definiujemy iloczyn macierzy wzorem
Z definicji wynika, że jeśli , i , to
Wyraz o numerze macierzy jest iloczynem skalarnym -tego wiersza oraz -tej kolumny macierzy .
Przykład 7.1.
Dla macierzy
mamy
Czasami stosuje się poniższą konwencję:
Przykład 7.2.
Uzupełnić pozostałe miejsca .
-
Dla macierzy kwadratowych zdefiniowane są obydwa iloczyny i , ale nie muszą one być równe. Mnożenie macierzy w zbiorze nie jest przemienne dla . Przykładowo, dla
mamy
Lemat 7.2 (Mnożenie macierzy jest łączne).
Załóżmy, że , i . Wtedy
Dowód.
Z definicji iloczynu macierzy mamy
∎
Lemat 7.3.
Niech i . Wtedy
Dowód.
Wystarczy pokazać, że odwzorowania liniowe oraz przyjmują takie same wartości na bazie . Mamy
∎
Definicja 7.4.
Macierz identycznościowa
Macierz identycznościowa to macierz o współczynnikach zdefiniowanych symbolem Kroneckera:
Innymi słowy, . Przykładowo,
Wniosek 7.4.
Dla dowolnej macierzy mamy
Definicja 7.5.
Macierz nieosobliwa
Macierz jest nieosobliwa (odwracalna) wtedy i tylko wtedy, gdy istnieje taka macierz , że
Macierz nazywamy wtedy macierzą odwrotną do macierzy i oznaczamy przez .
-
Jeżeli jest nieosobliwa, to macierz odwrotna do jest wyznaczona jednoznacznie. Rzeczywiście, jeśli i są odwrotne do , to
Wniosek 7.5 (Odwrotność iloczynu).
Jeśli są nieosobliwe, to macierz jest nieosobliwa oraz
Dowód.
Sprawdzamy, że
Analogicznie pokazujemy, że . ∎
Lemat 7.4.
Dla macierzy kwadratowej następujące warunki są równoważne:
-
(i)
jest nieosobliwa,
-
(ii)
jest izomorfizmem.
Dowód.
Jeśli jest nieosobliwa, to , więc
czyli jest izomorfizmem liniowym o odwrotnym .
Załóżmy, że jest izomorfizmem liniowym. Istnieje więc odwzorowanie odwrotne . Definiujemy macierz
Wtedy , bo . Ponadto,
więc , czyli jest nieosobliwa i . ∎
Lemat 7.5 (Transpozycja iloczynu).
Dla macierzy i mamy
Dowód.
Porównamy elementy na pozycji po obu stronach równości. Dla macierzy na pozycji stoi element . Dla macierz jest to element . ∎
Wprowadzimy jeszcze kilka pojęć związanych z macierzami kwadratowymi.
Definicja 7.6.
Macierz diagonalna
Macierz nazywamy diagonalną, jeśli dla . Będziemy wtedy czasem pisać .
Definicja 7.7.
Macierz górnie/dolnie trójkątna
Macierz nazywamy górnie trójkątną, gdy dla . Analogicznie, jest dolnie trójkątna, jeśli dla .
Przykład 7.3.
Macierz diagonalna, górnie trójkątna i dolnie trójkątna:
-
Macierze górnie trójkątne mają użyteczną charakteryzację geometryczną. Niech będzie bazą standardową . Dla rozważamy podprzestrzeń
generowaną przez pierwszych wektorów bazowych. Bezpośrednio z definicji, wynika, że macierz jest górnie trójkątna wtedy i tylko wtedy, gdy dla każdego podprzestrzeń jest niezmiennicza dla tzn. jeśli , to . Wynika, to z faktu, że dla każdego dokładnie wtedy, gdy jest górnie trójkątna.
Wniosek 7.6.
Macierz jest diagonalna wtedy i tylko wtedy, gdy jest dolnie i górnie trójkątna.
Definicja 7.8.
Ślad macierzy
Ślad macierzy definiujemy jako liczbę
7.3 Rząd i jądro macierzy
Rozważmy macierz i skojarzone odwzorowanie liniowe dla . Przypomnijmy, że jeśli , to
Wynika stąd, że obraz jest generowany przez kolumny macierzy , czyli
Definicja 7.9.
Rząd macierzy
Rząd macierzy definiujemy jako wymiar obrazu
czyli jest (maksymalną) liczbą liniowo niezależnych kolumn macierzy .
Rząd macierzy został wprowadzony w 1878 przez Georga Frobeniusa (1849–1917).
Definicja 7.10.
Jądro macierzy
Jądro macierzy definiujemy jako jądro odwzorowania . Jest to więc zbiór takich wektorów , że .
Jądro macierzy został wprowadzony w 1884 przez Jamesa Josepha Sylvestera (1814–1887).
Wniosek 7.7 (Formuła wymiaru dla macierzy).
Dla mamy
Wniosek 7.8.
Dla macierzy kwadratowej następujące warunki są równoważne
-
(1)
jest nieosobliwa,
-
(2)
,
-
(3)
.
W szczególności, macierz jest odwracalna wtedy i tylko wtedy, gdy jej kolumny są liniowo niezależne.
Lemat 7.6.
Dla dowolnej macierzy maksymalna liczba liniowo niezależnych kolumn macierzy jest większa bądź równa od maksymalnej liczby liniowo niezależnych wierszy macierzy . W szczególności,
Dowód.
Niech będzie maksymalną liczbą liniowo niezależnych wierszy macierzy . Niech będą takimi wierszami , że wektory są liniowo niezależne. Pokażemy, że są liniowo niezależne. Przypuśćmy, że
dla pewnych skalarów . Wtedy dla mamy
Z definicji iloczynu oznacza to, że dla . Ponieważ , więc . Stąd , czyli . Oznacza to, że są liniowo niezależne. Ponieważ należą one do , więc z definicji rzędu wynika teza. ∎
Twierdzenie 7.1 (Rząd macierzy transponowanej).
Dla dowolnej macierzy zachodzi równość
Dowód.
Stosujemy Lemat 7.6 do macierzy i . ∎
Wniosek 7.9.
Dla dowolnej macierzy maksymalna liczba liniowo niezależnych kolumn jest równa maksymalnej liczbie liniowo niezależnych wierszy.
Przykład 7.4 (Macierze elementarne).
Wprowadzimy teraz pojęcie macierzy elementarnych. Będą to macierze nieosobliwe , które zastosowane do układu (7.1) skutkują operacjami elementarnymi na wierszach macierzy . Zrobimy to przykładowo dla .
Startujemy z macierzy identycznościowej
Macierze elementarne powstają z macierzy przez zastosowanie do operacji elementarnych na wierszach macierzy. Będziemy więc mieć do czynienia z trzema typami macierzy elementarnych.
Typ I. Macierze elementarne odpowiadające zamianie miejscami wierszy w macierzy . Rozważmy przykładowo macierz
powstałą z przez zamianę pierwszego i drugiego wiersza. Zauważmy, że dla mamy
czyli iloczyn odpowiada wykonanej operacji na wierszach macierzy . Iloczyn permutuje pierwszą i drugą kolumnę.
Typ II. Są to macierze elementarne otrzymane z przez przemnożenie jej wiersza przez niezerową liczbę rzeczywistą. Przykładowo,
Wtedy
Typ III. Macierze elementarne powstałe z przez dodanie do pewnego jej wiersza innego wiersza pomnożonego przez liczbę rzeczywistą. Dla przykładu,
Mamy
Wniosek 7.10.
Jeśli jest macierzą elementarną, to jest nieosobliwa i jest macierzą elementarną tego samego typu.
Definicja 7.11.
Macierze wierszowo równoważne
Niech , . Powiemy, że jest wierszowo równoważna z , jeśli istnieje taki ciąg macierzy elementarnych , że
Jest to relacja równoważności w zbiorze .
Wniosek 7.11.
Jeśli , są wierszowo równoważne, to .
Wniosek 7.12.
Macierz jest wierszowo równoważna ze swoją postacią schodkową i zredukowaną postacią schodkową otrzymanymi metodą eliminacji Gaussa.
Wniosek 7.13.
Niech będzie macierzą kwadratową. Następujące warunki są równoważne:
-
(1)
jest nieosobliwa,
-
(2)
jest wierszowo równoważna z macierzą identycznościową.
Dowód.
Załóżmy, że zachodzi warunek (1). Wtedy układ ma tylko zerowe rozwiązanie. Stosując metodę eliminacji Gaussa możemy sprowadzić macierz do postaci schodkowej . Oczywiście, jest wierszowo równoważna z . Jeśli któryś z elementów diagonalnych jest zerem, to ostatni wiersz macierzy jest zerowy. Wtedy , więc ma niezerowe rozwiązania. Otrzymujemy sprzeczność, bo i mają takie same zbiory rozwiązań. Macierz jest więc macierzą górnie trójkątną ze wszystkimi elementami na przekątnej równymi . Taka macierz jest oczywiście wierszowo równoważna z macierzą , bo jest jej zredukowaną postacią schodkową.
Jeśli zachodzi warunek (2), to istnieje taki ciąg macierzy elementarnych , że
Stąd . ∎
-
W dowodzie powyższym skorzystaliśmy z następującego faktu: jeśli są macierzami kwadratowymi i , to jest nieosobliwa i . Musimy tu być trochę ostrożni. Jak wiemy mnożenie macierzy nie jest przemienne. Potencjalnie mogłoby się więc zdarzyć, że . Pokażemy, że jednak . Uzasadnimy najpierw, że jest nieosobliwa. Wystarczy pokazać, że . Jeśli , to
więc . Istnieje więc macierz odwrotna . Wtedy
-
Jak wiemy, macierz jest nieosobliwa wtedy i tylko wtedy, gdy jest wierszowo równoważna z . Ponadto, dla pewnych macierzy elementarnych. Wynika stąd, że macierz możemy z pomocą operacji elementarnych sprowadzić do postaci . Pozwala to na wyznaczenie macierzy odwrotnej .
Przykład 7.5.
Znajdziemy macierz odwrotną do macierzy
wykorzystując elementarne operacje na jej wierszach. Tworzymy macierz . Jeżeli przekształcimy ją w macierz , to wtedy . W naszym przypadku
więc
Przykład 7.6 (Macierze i grafy).
Teoria grafów pełni bardzo ważną rolę dla zastosowań matematyki. Graf jest zdefiniowany jako skończony zbiór wierzchołków, czyli pewien -elementowy zbiór skończony oraz zbiór krawędzi, czyli pewien zbiór par wierzchołków. Przykładowo, na Rys. (7.3) przedstawiono graf o pięciu wierzchołkach oraz krawędziach
Z grafem o wierzchołkach możemy skojarzyć pewną macierz , zwaną macierzą połączeń w grafie . Jest ona zdefiniowana regułą:
Dla grafu z Rys. (7.3) mamy
Możemy myśleć o ścieżce w grafie jako o skończonym ciągu krawędzi od jednego wierzchołka do drugiego. Przykładowo, krawędzie , są pewną ścieżką od wierzchołka do . Prostym sposobem określenia ścieżki jest jest opisanie ruchu używając wierzchołków. Powyższa ścieżka ma opis
i ma długość . Podobnie,
jest ścieżką długości z do .
Niech . Uzasadnimy, że jest liczbą ścieżek długości z wierzchołka do wierzchołka . Zastosujemy indukcję względem . Dla teza zachodzi z definicji macierzy . Załóżmy, że teza zachodzi dla pewnej liczby naturalnej , czyli jest liczbą ścieżek długości z wierzchołka do wierzchołka . Jeśli istnieje krawędź , to jest liczbą ścieżek długości z do postaci
Ogólna liczba ścieżek długości z do jest równa,
ale ta liczba to z definicji iloczynu macierzy.
W przypadku grafu z Rys. 7.3 mamy
Przykładowo, liczba ścieżek długości z do jest więc równa . Zauważmy, że macierz (podobnie jak ) jest symetryczna. Odzwierciedla to fakt, że liczba ścieżek długości z do jest równa liczbie ścieżek długości z do .
Powyższe rozważania pozostają prawdziwe dla grafów skierowanych w których krawędzie mają kierunek. Oznacza to, że może istnieć krawędź z wierzchołka do , ale nie koniecznie również z do . Macierz nie musi być wtedy symetryczna.
Przykład 7.7.
Pięć reprezentacji siatkarskich: Polska, Brazylia, Stany Zjednoczone, Rosja i Włochy rozgrywają turniej grając mecze każdy z każdym. Chcemy ustalić ranking drużyn w którym liczą się tylko zwycięstwa – nieważne jakim stosunkiem setów. Tworzymy macierz w której wierszach kodujemy wyniki kolejnych reprezentacji: piszemy jeśli reprezentacja wygrała mecz i jeśli nie wygrała (na przekątnej są zera, bo reprezentacje nie grają ze sobą). Załóżmy, że ma postać
Jest to macierz skojarzona z grafem skierowanym, którego wierzchołkami jest pięć reprezentacji, a krawędzie są zadane zwycięstwami. Przykładowo, z wierzchołka Polska wychodzą krawędzie do wierzchołków Brazylia, Rosja i Włochy. Z kolei, Polska jest końcem krawędzi o początku w wierzchołku Stany Zjednoczone. Przykładowo, pierwszy wiersz oznacza, że Polska wygrała z Brazylią, Rosją i Włochami, a przegrała ze Stanami Zjednoczonymi. Rosja (czwarty wiersz) wygrała tylko z Włochami. Liczbę zwycięstw poszczególnych drużyn otrzymujemy obliczając
Oznacza to, że najlepsze w takim rankingu są Polska i Brazylia z trzema zwycięstwami. Następne są Stany Zjednoczone, a ostanie są Rosja i Włochy z jednym zwycięstwem.
Zauważmy, że Polska może argumentować, że jest najlepszą drużyną bo wygrała z Brazylią. Rosja wygrała z Włochami, ale Włochy mogą powiedzieć, że pokonali Stany Zjednoczone, które wygrały z Polską i Rosją. Włochy mają dwa ,,niebezpośrednie’’ zwycięstwa. Spróbujmy więc policzyć zwycięstwa reprezentacji łącznie z ich ,,niebezpośrednimi’’ zwycięstwami. Odpowiada to sumie
Przykład 7.8 (Łańcuchy Markowa).
W badaniach preferencji rynkowych dotyczących dwóch marek pasty do zębów i bierze udział osób. Z badań wynika, że każdego miesiąca procent użytkowników marki używa jej w następnym miesiącu, a procent dokonuje zmiany na markę . Wśród użytkowników marki te proporcje są odpowiednio równe i procent. Załóżmy, że na początku było użytkowników marki i marki . Zbadamy jak wiele osób będzie używać poszczególnych marek w kolejnych miesiącach. Po miesiącu marki będzie używać
osób, a marki
osób. Rozważmy macierz
Wtedy
Po miesiącach liczbę osób otrzymujemy jako wektor
Czasami wygodniej zamiast posługiwania się liczbą użytkowników marek i wygodniej jest użyć ich procentowego udziału, czyli zamiast wektora używamy wtedy wektora . Wtedy
Przykład 7.9 (Macierze Leslie’go).
Pewien gatunek żuka żyje co najwyżej lata. Podzielimy populację jego samic na trzy grupy:
-
•
młode: wiek ,
-
•
dojrzałe: wiek ,
-
•
dorosłe: wiek .
Młode z prawdopodobieństwem staną się dojrzałe, dojrzałe z prawdopodobieństwem staną się dorosłymi. Młode nie znoszą jajek, dojrzałe produkują średnio samice, a dorosłe średnio samice. Przypuśćmy, że wśród populacji samic jest młodych, dojrzałych, dorosłych. Spróbujemy przewidzieć populację po latach. Zobaczmy jak populacja będzie wyglądała po roku. Młodych będzie
Dojrzałych będzie tyle ile młodych, które przetrwały, czyli
a dorosłych tyle ile dojrzałych które przetrwały, czyli
Rozważmy macierz
Zauważmy, że
Możemy ten proces iterować otrzymując po dwóch latach
po trzech latach
-
Oceń prawdziwość zadań
-
–
Jeśli macierze są nieosobliwe, to macierz jest nieosobliwa i .
-
–
Dla dowolnych zachodzi równość .
-
–
Jeśli są macierzami diagonalnymi, to .
-
–
Jeśli i , to .
-
–
Jeśli są symetryczne, to wtedy i tylko wtedy, gdy jest symetryczna.
-
–
Jeśli jest skośnie symetryczna, to .
-
–
Iloczyn macierzy górnie trójkątnych jest macierzą górnie trójkątną.
-
–
Macierz górnie trójkątna jest nieosobliwa wtedy i tylko wtedy, gdy wszystkie jej wyrazy diagonalne są niezerowe.
-
–
Jeśli są takimi -macierzami, że , to .
-
–
7.4 Układy równań liniowych raz jeszcze
Wniosek 7.14.
Niech i . Następujące warunki są równoważne:
-
(i)
zbiór rozwiązań układu jest niepusty,
-
(ii)
,
-
(iii)
.
Wniosek 7.15.
Niech . Wektor zerowy jest jedynym rozwiązaniem układu jednorodnego wtedy i tylko wtedy, gdy wektory są liniowo niezależne. Wtedy oraz .
Twierdzenie 7.2.
Niech . Następujące warunki są równoważne:
-
(i)
Dla każdego wektora układ ma dokładnie jedno rozwiązanie ,
-
(ii)
i macierz jest nieosobliwa.
Dowód.
Załóżmy najpierw, że zachodzi warunek (ii). Ustalmy wektor . Mamy pokazać, że istnieje dokładnie jeden taki wektor , że . Z warunku (ii) istnieje . Wtedy dla mamy
czyli wektor jest rozwiązaniem układu . Takie rozwiązanie jest jedyne, bo jeśli , to
Niech teraz zachodzi warunek (i). Wystarczy pokazać, że wektory są bazą . Zauważmy, że warunek (i) implkuje, że
Z drugiej strony, stosując (i) do wektora otrzymujemy, że wektory są liniowo niezależne. Stąd tworzą bazę , czyli . ∎
-
Dla i rozważmy ponownie układ
(7.1) Dla macierzy nieosobliwej rozważmy układ
(7.2) Sprawdzamy łatwo, że układy (7.1) i (7.2) są równoważne tzn. mają równe zbiory rozwiązań. Zamiast więc rozwiązywać układ (7.1) możemy rozwiązać układ (7.2), który przy odpowiednim wyborze macierzy nieosobliwej może okazać się układem prostszym do analizy.
7.5 Zmiana bazy
7.5.1 Zmiana bazy w
Dla dowolnego wektora zachodzi równość
gdzie jest bazą standardową. Skalary i nazywamy współrzędnymi wektora w bazie standardowej. Możemy to pojęcie uogólnić. Załóżmy, że , jest ustaloną bazą . Dla dowolnego wektora istnieją jednoznacznie wyznaczone takie skalary , że
Wektor będziemy nazywali współrzędnymi wektora w bazie , .
-
Zwróćcie uwagę, że mówiąc o bazie , mamy tu na myśli bazę uporządkowaną tzn. ciąg wektorów . Podając wektor współrzędnych w bazie istotne jest który wektor bazowy jest pierwszy, a który drugi.
Przykład 7.10.
Rozważmy bazę , w . Łatwo sprawdzamy, że dla wektora mamy
Współrzędne wektora w bazie są dane wektorem .
Niech , będzie dowolną bazą . Zajmiemy się teraz następującymi problemami:
(I) Dla danego wektora (znamy jego współrzędne w bazie standardowej , ) znajdziemy jego współrzędne w bazie , . (II) Dla danego wektora (znamy jego współrzędne w bazie , ) znajdziemy jego współrzędne w bazie , . |
Zaczniemy od problemu (II) bo jest on łatwiejszy. Załóżmy, że
Znamy więc współrzędne wektorów bazowych , w bazie , . Zauważmy, że
Wynika stąd, że współrzędne wektora w bazie standardowej , są dane wektorem | ||||
Prowadzi nas to do następującej konkluzji. Jeśli są współrzędnymi wektora w bazie , oraz są współrzędnymi wektora w bazie , , to
Definicja 7.12.
Macierz przejścia do bazy standardowej
Macierz nazywamy macierzą przejścia od bazy do bazy standardowej .
Możemy teraz łatwo rozwiązać problem (I). Ponieważ macierz jest nieosobliwa, więc
Przypuśćmy teraz, że mamy dwie dowolne bazy oraz w . Rozważmy wektor
Znajdziemy związek pomiędzy współrzędnymi wektora w bazie , a jego współrzędnymi w bazie . Niech będą współrzędnymi wektora w bazie standardowej, czyli . Jak wiemy dla macierzy oraz mamy
Stąd
Macierz możemy zinterpretować jeszcze inaczej. Niech . Zobaczymy jak wyglądają kolumny i macierzy . Oczywiście
Dla wektora mamy , bo , czyli są współrzędnymi wektora w bazie , więc
Analogicznie, , czyli
Nazywamy ją macierzą przejścia od bazy do bazy .
7.5.2 Zmiana bazy w
Definicja 7.13.
Współrzędne wektora w bazie
Niech będzie przestrzenią wektorową wymiaru (nad ciałem ) i pewną bazą w . Dowolny wektor możemy jednoznacznie zapisać jako kombinację liniową
Wektor nazywamy współrzędnymi wektora w bazie (uporządkowanej) .
Definicja 7.14.
Macierz przejścia - zmiana bazy
Niech oraz będą bazami . Istnieją jednoznacznie wyznaczone takie skalary , że
Macierz daną przez
nazywamy macierzą przejścia od bazy do bazy . Oznacza to, że -ta kolumna macierzy jest wektorem współrzędnych wektora w bazie .
Lemat 7.7.
Niech . Równość
zachodzi wtedy i tylko wtedy, gdy .
Dowód.
Zauważmy, że
więc teza zachodzi. ∎
Wniosek 7.16.
Macierz przejścia jest nieosobliwa.
Dowód.
Wystarczy pokazać, że jedynym rozwiązaniem jest . Jeśli , to , czyli
więc , bo są liniowo niezależne. ∎
Przykład 7.11.
Znajdziemy macierz przejścia od bazy , , dla do bazy , , . Wygodnie jest znaleźć najpierw macierz przejścia od bazy , , do bazy , , . Ponieważ
więc
Macierz przejścia od bazy , , dla do bazy , , jest równa
ZMIANA BAZY: OD DOWOLNEJ DO STANDARDOWEJ Niech będzie bazą . jest nieosobliwa. Jeśli to |
ZMIANA BAZY. PODSUMOWANIE Niech oraz będą bazami . Macierz jest nieosobliwa. Jeśli to |
-
Oceń które ze zdań jest prawdziwe:
-
–
Transpozycja macierzy górnie trójkątnej jest macierzą górnie trójkątną.
-
–
Odwrotność nieosobliwej macierzy górnie trójkątnej jest macierzą dolnie trójkątną.
-
–
Macierz górnie trójkątna i symetryczna jest diagonalna.
-
–
Jeśli jest górnie trójkątna, to i są górnie trójkątne.
-
–
Jeśli jest symetryczna, to jest symetryczna.
-
–
Jeśli jest nieosobliwa, to i są nieosobliwe.
-
–
Jeśli , są nieosobliwe, to jest nieosobliwa.
-
–
Jeśli , są nieosobliwe, to jest nieosobliwa.
-
–
Dla dowolnych macierzy kwadratowych zachodzi .
-
–
Dla dowolnej macierzy kwadratowej .
-
–
Istnieją takie macierze nieosobliwe, że .
-
–
Istnieje taka macierz , że .
-
–
Istnieje taka macierz , że .
-
–
Rozdział 8 Reprezentacja macierzowa
SŁOWA KLUCZOWE ROZDZIAŁU macierz odwzorowania liniowego macierze podobne ślad iloczynu ślad macierzy podobnych Reprezentacja odwzorowania liniowego. |
8.1 Macierz odwzorowania liniowego
Lemat 8.1.
Niech będzie odwzorowaniem liniowym. Istnieje taka macierz , że
Ponadto,
Dowód.
Definiujemy wektory
oraz macierz . Niech będzie dowolnym wektorem w . Wtedy
∎
Definicja 8.1.
Macierz standardowa odwzorowania liniowego
Niech będzie odwzorowaniem liniowym. Macierz
nazywamy macierzą odwzorowania liniowego w bazach standardowych lub macierzą standardową .
Przykład 8.1.
Niech będzie odwzorowaniem liniowym danym przez
Wtedy
czyli macierz standardowa odwzorowania jest równa
-
Załóżmy, że , . Niech będzie standardową reprezentacją macierzową dla , a dla . Wtedy jest reprezentacją macierzową dla . Rzeczywiście niech będzie macierzową reprezentacją odwzorowania . Z definicji, , gdzie dla . Zauważmy, że
czyli jest -tą kolumną macierzy .
Uogólnimy powyższą konstrukcję macierzy skojarzonej z odwzorowaniem liniowym. Niech będzie przestrzenią wektorową wymiaru i niech będzie przestrzenią wektorową wymiaru . Ustalmy bazę
dla przestrzeni oraz bazę
dla przestrzeni . Dla wektora
wektor
zadaje współrzędne wektora w bazie . Pokażemy, że istnieje (jedyna) taka macierz , że
wtedy i tylko wtedy, gdy
dla każdego , czyli jest wektorem współrzędnych w bazie .
Istnieją wyznaczone jednoznacznie takie skalary , że
Wektor
zadaje współrzędne wektora w bazie dla .
Definicja 8.2.
Macierz odwzorowania liniowego
Macierz nazywamy macierzą odwzorowania liniowego w bazach dla oraz dla , jeśli
gdzie
Wniosek 8.1.
Niech , . Następujące warunki są równoważne:
-
(1)
i ,
-
(2)
.
Dowód.
Wystarczy zauważyć, że
∎
Wniosek 8.2.
Załóżmy, że jest bazą i jest odwzorowaniem liniowym. Niech będzie macierzą odwzorowania w bazie . Następujące warunki są równoważne
-
(1)
i ,
-
(2)
.
Oznacza to, że macierz przekształca współrzędne wektora w bazie na współrzędne wektora w tej bazie.
-
Zauważmy, że jeżeli oraz są bazami przestrzeni , to macierz przejścia od bazy do bazy jest macierzą odwzorowania identycznościowego na w tych bazach.
-
Popatrzmy na konstrukcję macierzy odwzorowania liniowego jeszcze trochę inaczej. Niech będzie bazą dla oraz bazą dla . Rozważmy izomorfizmy
czyli przykładowo jest wektorem współrzędnych w bazie .
Dla odwzorowania liniowego możemy rozważyć odwzorowanie liniowe
Zobaczmy jak wygląda jego macierz w bazach standardowych. Mamy
czyli -ta kolumna tej macierzy to współrzędne wektora w bazie .
Przykład 8.2.
Niech będzie przestrzenią wielomianów stopnia co najwyżej . Rozważmy odwzorowanie liniowe
Znajdziemy jego macierz w bazie . Ponieważ
więc
Lemat 8.2.
Niech będzie odwzorowaniem liniowym. Jeśli
jest macierzą w bazach dla i dla , to
gdzie .
Dowód.
Z definicji
∎
Wniosek 8.3.
Niech będzie odwzorowaniem liniowym. Jeśli
jest macierzą w bazach dla i dla oraz , to macierze i są wierszowo równoważne.
Dowód.
Macierze
są wierszowo równoważne. Teza zachodzi, bo
∎
Przykład 8.3.
Rozważmy odwzorowanie liniowe dane wzorem
Znajdziemy jego reprezentację macierzową w bazach , oraz
Ponieważ i , więc rozważamy macierz
Sprowadzamy ją łatwo (poprzez dozwolone operacje na wierszach) do postaci
czyli
8.2 Macierze podobne
Rozważmy odwzorowanie liniowe Reprezentacja macierzowa dla w bazie standardowej (w dziedzinie i przeciwdziedzinie) ma postać
Rozważmy teraz inną bazę w . Znajdziemy reprezentację odwzorowania w tej bazie. W tym celu musimy znaleźć współrzędne wektorów i w bazie , , bo z definicji są zadane przez równości
Współrzędne wektora w bazie standardowej są równe
Jak już wiemy jego współrzędne w bazie są dane przez
Analogicznie współrzędne wektora w bazie są równe . Z definicji reprezentacji macierzowej mamy
Z kolei z definicji mnożenia macierzy, więc
Twierdzenie 8.1 (Reprezentacja macierzowa w różnych bazach).
Załóżmy, że jest przestrzenią wektorową wymiaru oraz i są bazami . Niech
-
•
będzie odwzorowaniem liniowym,
-
•
będzie macierzą przejścia od bazy do bazy ,
-
•
będzie reprezentacją w bazie ,
-
•
będzie reprezentacją w bazie .
Wtedy
Dowód.
Dla wektora rozważmy wektor
Z definicji macierzy przejścia dla wektora mamy
Ponadto, zadaje współrzędne w bazie oraz zadaje współrzędne w bazie . Stąd
czyli dla każdego , więc .
∎
Definicja 8.3.
Macierze podobne
Niech . Mówimy, że jest podobna do , jeśli istnieje taka macierz nieosobliwa , że
Podobieństwo macierzy jest relacją równoważności w .
Wniosek 8.4 (Ślad iloczynu macierzy).
Dla dowolnych macierzy i mamy
W szczególności,
dla dowolnej macierzy nieosobliwej i .
Dowód.
Ślad macierzy kwadratowej jest sumą wyrazów na głównej przekątnej. Z definicji iloczynu macierzy mamy
Jeśli , to
∎
Pozwala to nam zdefiniować ślad odwzorowania liniowego przestrzeni skończenie wymiarowej jako ślad macierzy odwzorowania w dowolnej bazie dla .
-
Przypuśćmy, że jest takim odwzorowaniem liniowym, że
Pokażemy, że istnieje taka , że
Niech () będzie bazą standardową , czyli na przecięciu -tego wiersza oraz -tej kolumny jest , a pozostałe wyrazy są równe . Zauważmy, że
Stąd dla mamy
oraz
Dla mamy więc
Ponieważ dla mamy , więc
Dowód poniższego twierdzenia jest bardzo podobny do dowodu Twierdzenia 8.1.
Twierdzenie 8.2.
Załóżmy, że
-
•
i są bazami przestrzeni wektorowej ,
-
•
i są bazami przestrzeni wektorowej ,
-
•
jest odwzorowaniem liniowym,
-
•
jest macierzą w bazach i ,
-
•
jest macierzą w bazach i ,
-
•
jest macierzą przejścia od bazy do bazy ,
-
•
jest macierzą przejścia od bazy do bazy .
Wtedy
-
Oceń prawdziwość zdań:
-
–
Jeśli i są reprezentacjami odwzorowań liniowych w bazie standardowej, to istnieje taka macierz nieosobliwa , że .
-
–
Reprezentacją macierzową odwzorowania identycznościowego jest w dowolnej bazie macierz identycznościowa.
-
–
Odwzorowanie , to ma w pewnej bazie reprezentację
-
–
Jeśli jest izomorfizmem i jest jego reprezentacją w pewnej bazie, to jest nieosobliwa.
-
–
8.3 Pouczający przykład
Zobrazujemy wprowadzone pojęcia na przykładzie przestrzeni i pewnej jej podprzestrzeni. Przypomnijmy, że
jest przestrzenią wektorową wszystkich ciągów o wyrazach rzeczywistych z działaniami
Dla liczby naturalnej definiujemy
Są to podprzestrzenie wektorowe przestrzeni oraz
Odwzorowanie liniowe
jest izomorfizmem. W szczególności, , czyli przestrzeń zawiera podprzestrzeń wymiaru dla dowolnej liczby naturalnej.
Zbiór
jest również podprzestrzenią wektorową przestrzeni . Składa się ona z wszystkich ciągów, które mają tylko skończenie wiele niezerowych wyrazów. Naturalnie zdefiniowany nieskończony zbiór wektorów
składa się z wektorów liniowo niezależnych. Jest on bazą dla , ale nie jest bazą dla . Przestrzeń nie ma przeliczalnej bazy.
Dla niezerowej liczby rzeczywistej definiujemy ciąg przez
Uzasadnimy, że każdy skończony podzbiór zbioru (równolicznego z )
jest zbiorem wektorów liniowo niezależnych.
Rozważmy odwzorowanie liniowe (przesunięcie) zdefiniowane wzorem
Zauważmy, że
Niech będą różnymi liczbami rzeczywistymi. Pokażemy, że wektory są liniowo niezależne. Przypuśćmy, że maksymalna liczba wektorów liniowo niezależnych spośród nich jest równa . Możemy założyć, że są liniowo niezależne. Z określenia wynika, że są liniowo zależne, czyli
dla pewnych . Stąd
więc
Ponieważ są liniowo niezależne oraz , więc . Prowadzi to do sprzeczności, bo .
Przyglądnijmy się jeszcze odwzorowaniu .
Rozważmy odwzorowanie liniowe zdefiniowane wzorem
Zauważmy, że
czyli
W szczególności, jest epimorfizmem i jest monomorfizmem. Żadne z nich nie jest izomorfizmem. Jądro jest -wymiarowe, bo
Z drugiej strony, nie jest epimorfizmem, bo
Zbadamy teraz jeszcze jedną podprzestrzeń wektorową przestrzeni . Powiemy, że ciąg
jest typu Fibonacciego, gdy
Przypomnijmy, że klasyczny ciąg Fibonacciego
otrzymujemy przyjmując i .
Niech będzie zbiorem wszystkich ciągów typu Fibonacciego. Jest to podprzestrzeń wektorowa przestrzeni . Pokażemy, że jest ona izomorficzna z . Szukanym izomorfizmem jest odwzorowanie dane przez
Odwzorowanie odwrotne przypisuje wektorowi ciąg Fibonacciego o dwóch pierwszych wyrazach .
Bazie standardowej , odpowiada przez izomorfizm baza złożona z ciągów
Ponadto, dla ciągu mamy
Zauważmy, że
czyli
dla dowolnego ciągu . Rozważmy ciąg dla . Z definicji odwzorowania przesunięcia wynika, że -ty wyraz ciągu jest równy
Ponieważ
więc
czyli otrzymujemy równość
Zastanówmy się teraz, czy w przestrzeni leży jakiś ciąg geometryczny ? Sprawdzamy, że musi zachodzić warunek , czyli jest tak dla
Ponieważ wektory , są liniowo niezależne, więc ciągi
tworzą bazę dla . Zapiszmy ciąg Fibonacciego w tej bazie. Szukamy takich liczb rzeczywistych , że
Liczby spełniają układ równań
Jego jedynym rozwiązaniem są
Ostatecznie
Rozdział 9 Suma prosta
SŁOWA KLUCZOWE ROZDZIAŁU suma algebraiczna podprzestrzeni suma prosta macierze blokowe podprzestrzenie niezmiennicze . |
Definicja 9.1.
Suma algebraiczna i suma prosta
Załóżmy, że jest przestrzenią wektorową nad ciałem . Niech będą podprzestrzeniami wektorowymi . Definiujemy sumę algebraiczną jako
Wtedy jest podprzestrzenią wektorową . Mówimy, że jest sumą prostą oraz , jeśli zachodzą warunki
Piszemy wtedy, że .
Wniosek 9.1.
Dla podprzestrzeni przestrzeni wektorowej następujące warunki są równoważne
-
(i)
,
-
(ii)
Dowolny wektor można jednoznacznie przedstawić w postaci
gdzie dla .
Dowód.
Załóżmy, że i niech . Ponieważ , więc istnieją takie wektory (), że . Pokażemy, że takie przedstawienie jest jednoznaczne. Przypuśćmy, że
dla pewnych . Wtedy
czyli oraz .
Załóżmy teraz, że zachodzi warunek (ii). Wtedy oczywiście . Pokażemy, że . Niech . Wtedy
czyli z jednoznaczności w warunku (ii) wynika, że . ∎
Przykład 9.1.
Rozważmy przestrzeń wektorową i jej dwie podprzestrzenie wektorowe
Wtedy
czyli
Przykład 9.2.
Niech będzie przestrzenią wektorową funkcji . Rozważmy podprzestrzeń funkcji nieparzystych i podprzestrzeń funkcji parzystych. Sprawdzimy, że
Jeśli , to
czyli
Jeśli , to dla mamy
więc . W konsekwencji,
Możemy to pojęcie uogólnić na większą liczbę podprzestrzeni .
Definicja 9.2.
Niech będą podprzestrzeniami wektorowymi . Mówimy, że jest sumą prostą podprzestrzeni tzn.
jeśli każdy wektor można jednoznacznie przedstawić w postaci sumy
gdzie dla .
Wniosek 9.2.
Niech będą podprzestrzeniami przestrzeni wektorowej . Załóżmy, że jest bazą oraz jest bazą . Następujące warunki są równoważne
-
(1)
,
-
(2)
jest bazą .
W szczególności, jeśli , to wtedy i tylko wtedy, gdy
Dowód.
Załóżmy, że . Wtedy , bo . Wektory są liniowo niezależne, bo jeśli
to
czyli z założenia o bazach dla i mamy, że oraz .
Jeśli jest bazą dla , to każdy wektor da się jednoznacznie zapisać w postaci , gdzie i , czyli . ∎
-
MACIERZE BLOKOWE
Niech i niech będzie taką bazą , że tworzą bazę oraz tworzą bazę . Odwzorowanie liniowe ma w tej bazie macierz postać blokową
Przykładowo, jeśli oraz oraz jest macierzą odwzorowania liniowego w bazie , to
Zauważmy, że wtedy i tylko wtedy, gdy , czyli jest niezmiennicza dla . Analogicznie, wtedy i tylko wtedy, gdy . Jeśli i są niezmiennicze dla , to ma postać
-
Rozważmy macierz . Jak wiemy
Zazwyczaj jednak nie jest prawdą, że jest sumą prostą podprzestrzeni oraz . Może się nawet zdarzyć, że . Przykładowo, rozważmy niezerowy wektor i macierz . Wtedy niezależenie do wyboru wektora . Przyjmując, że otrzymujemy, że
Z drugiej strony, jeśli jest liniowo niezależny z , to
Ponadto, gdy , to proste i są prostopadłe.
Rozdział 10 Wyznacznik
SŁOWA KLUCZOWE ROZDZIAŁU
wyznacznik jako funkcja kolumn permutacje wyznacznik iloczynu
wyznacznik macierzy odwrotnej wyznacznik macierzy transponowanej wyznacznik
a liniowa niezależność dopełnienie algebraiczne rozwinięcie Laplace’a
macierz odwrotna wzory Cramera rozkład Schura orientacja
iloczyn wektorowy iloczyn mieszany objętość równoległościanu
10.1 Grupa permutacji
Definicja 10.1.
Permutacja
Rozważmy zbiór skończony dla . Permutacją zbioru nazywamy dowolną bijekcję
Przez oznaczamy zbiór wszystkich permutacji zbioru tzn.
Ponieważ złożenie bijekcji jest bijekcją, więc składanie odwzorowań określa strukturę grupy w zbiorze . Jej elementem neutralnym jest odwzorowanie identycznościowe na zbiorze . Elementem odwrotnym do permutacji jest odwzorowanie odwrotne do (istnieje ono, bo jest bijekcją).
Przykład 10.1.
Permutację zapisujemy często w postaci tabeli
Przykładowo,
są pewnymi permutacjami zbioru -elementowego . Ich iloczyn jest równy
Istnieje bardziej zwarty sposób zapisu permutacji . Pochodzi on od Cauchy’ego. Niech będą różnymi elementami zbioru . W szczególności, . Przez oznaczamy taką permutację z , że
oraz
Permutację nazywamy -cyklem. Jeśli , to -cykl nazywamy transpozycją. Dwa cykle z nazywamy rozłącznymi, jeśli nie mają wspólnych wyrazów.
Przykład 10.2.
Dla permutacji
mamy (opuszczamy w zapisie -cykle):
Przykład 10.3.
Niech . Wtedy , bo
Ponadto, oraz jest najmniejszą taką liczbą naturalną , że .
-
Jeśli , to grupa nie jest abelowa. Przykładowo,
oraz
Dla definiujemy zbiór
Zauważmy, że jeśli , to . Jeśli jest cyklem, to . Cykle i są rozłączne, gdy .
Lemat 10.1.
Jeśli i , to .
Dowód.
Niech będzie ustalone. Sprawdzimy, że . Ponieważ cykle i są rozłączne, więc mamy trzy możliwości:
-
(1)
,
-
(2)
oraz ,
-
(3)
oraz .
Przypadek (1) jest oczywisty, a (2) i (3) są symetryczne, więc można założyć, że zachodzi (2). Ponieważ cykle są rozłączne, więc również , czyli teza zachodzi. ∎
Lemat 10.2.
Każda permutacja jest iloczynem rozłącznych cykli. Taki rozkład jest jednoznaczny z dokładnością do kolejności czynników.
Dowód.
Jeśli , to , więc teza zachodzi. Niech i . Rozważmy zbiór
Ponieważ jest on skończony, więc dla pewnych liczb naturalnych . Wtedy . Istnieje więc najmniejsza liczba naturalna taka, że . Wtedy liczby są różne z definicji oraz jest -cyklem. Dla mamy oraz nie rusza punktów . Stosujemy teraz powyższą procedurę do . Zauważmy, że jest istotnym podzbiorem , więc procedura skończy się po skończonej liczbie kroków, bo jest zbiorem skończonym. Dowodzi to rozkładu na rozłączne cykle.
Przypuśćmy, że
są dwoma rozkładami na rozłączne cykle. Przypuśćmy, że . Wtedy również dla pewnego . Z rozłączności cykli mamy . Rozważmy teraz . Z tych samych względów mamy . Kontynuując dostajemy, że i teza wynika poprzez indukcję. ∎
Lemat 10.3.
Dowolną permutację można przedstawić jako złożenie skończonej liczby transpozycji. Ponadto, jeśli jest złożeniem parzystej liczby pewnych transpozycji, to każde jej przedstawienie jako złożenie transpozycji (nie jest ono jednoznacznie wyznaczone) składa się z parzystej liczby transpozycji. Takie permutacje nazywamy parzystymi. Jeśli jest złożeniem nieparzystej liczby transpozycji, to nazywamy ją nieparzystą.
Dowód.
Wiemy, że możemy rozłożyć na iloczyn rozłącznych cykli. Każdy cykl jest iloczynem transpozycji, bo
Przypuśćmy, że mamy dwa rozkłady na iloczyny transpozycji:
Pokażemy, że . Ponieważ
więc wystarczy pokazać, że może być iloczynem tylko parzystej liczby transpozycji. Przypuśćmy, że
(10.1) |
gdzie oraz dla . Pokażemy, że jest parzyste. Zauważmy, że nie może być , bo . Dla teza zachodzi. Załóżmy, że i teza zachodzi dla wszystkich iloczynów mniejszej liczby transpozycji. Jedna z transpozycji dla musi ruszać , bo inaczej (10.1) nie może zachodzić. Stąd musi być jednym z dla pewnego (zmieniając ewentualnie rolami z ). Zauważmy, że jeśli różne litery oznaczają różne liczby to zachodzą równości
więc możemy założyć, że .
Jeśli , to iloczyn jest identycznością i możemy go pominąć otrzymując jako iloczyn transpozycji. Z założenia indukcyjnego jest parzyste, więc jest parzyste.
Jeśli , to iloczyn jest równy , czyli (10.1) przyjmuje postać
(10.2) |
Zauważmy, że w formule (10.2) jest mniej transpozycji które ruszają niż w (10.1). Rozumujemy teraz analogicznie. Pewna transpozycja w iloczynie (10.2) inna niż musi ruszać . Mamy znowu dwie możliwości albo możemy zredukować liczbę transpozycji o i zastosować indukcję albo możemy zmniejszyć o liczbę transpozycji ruszających w formule (10.2). Ponieważ nie może być iloczynem transpozycji w którym tylko jedna rusza , więc w skończonej liczbie kroków musi zajść sytuacja, że iloczyn pierwszych dwóch transpozycji będzie identycznością, więc teza wynika poprzez indukcję. ∎
Przykład 10.4.
Rozważmy permutację
Powyższy napis oznacza, że
Sprawdzamy łatwo, że
Widzimy, że przedstawienie permutacji jako złożenie transpozycji nie jest jednoznaczne, ale parzystość liczby transpozycji w przedstawieniu nie zmienia się. Permutacja jest nieparzysta.
Definicja 10.2.
Znak permutacji
Znak permutacji definiujemy jako liczbę:
Sprawdzamy łatwo, że
10.2 Definicja wyznacznika i jego własności
Pojęcie wyznacznika pojawiło się pod koniec wieku w pracach Gottfrieda Wilhelma Leibnitza oraz japońskiego matematyka Seki Kova znanego również jako Takakazu (1642–1708). Systematyczna teoria wyznacznika pochodzi od Cauchy’ego (1789–1857) oraz Jacobiego (1804–1851).
Dla macierzy kwadratowej zdefiniowaliśmy wyznacznik wzorem
Wniosek 10.1.
Dla dowolnych wektorów i liczb rzeczywistych zachodzą warunki:
-
(1)
dwuliniowość wyznacznika jako funkcji kolumn macierzy
-
(2)
-
(3)
.
Dowód.
Wystarczy przeprowadzić bezpośredni rachunek. Uzasadnimy dla przykładu warunek (1). Niech , oraz . Wtedy
więc
∎
-
Pokażemy, że każde odwzorowanie spełniające warunki (1)-(3) musi być dane wzorem:
Oznacza to, że wyznacznik jest jednoznacznie wyznaczony przez warunki (1)-(3) i musi być zadany powyższym wzorem.
Lemat 10.4.
Jeśli spełnia warunki (1)-(2), to dla dowolnych macierzy zachodzi wzór
(10.3) Dowód.
Niech
Wtedy
Z warunku (1) zastosowanego dwukrotnie mamy
Z warunku (2) wynika, że dla dowolnego wektora oraz
Stąd
∎
Twierdzenie 10.1.
Istnieje dokładnie jedno odwzorowanie spełniające warunki (1)-(3). Ponadto,
Dowód.
Przyjmując w Lemacie 10.4 i korzystając z warunku (3) otrzymujemy, że dla dowolnej macierzy mamy
co kończy dowód. ∎
Uogólnimy ten rezultat na dowolny wymiar i zdefiniujemy wyznacznik dowolnej macierzy kwadratowej . Będziemy w tym celu potrzebowali pewnych faktów dotyczących permutacji zbiorów skończonych.
Będziemy potrzebowali jeszcze jednego pojęcia. Odwzorowanie
będziemy traktowali jako funkcję zależną od kolumn macierzy , czyli jest funkcją zależną od wektorów.
Definicja 10.3.
Odwzorowanie -liniowe
Odwzorowanie nazywamy -liniowym, jeśli jest ono liniowe ze względu na każdą zmienną. Oznacza to, że dla dowolnie ustalonego oraz wektorów i skalarów zachodzi równość
Przykład 10.5.
Iloczyn skalarny
jest odwzorowaniem dwuliniowym.
Twierdzenie 10.2 (Definicja wyznacznika).
Istnieje dokładnie jedno odwzorowanie
spełniające warunki
-
(1)
jest -liniowe (jako funkcja kolumn macierzy ,
-
(2)
jeśli ma dwie identyczne kolumny tzn., dla pewnych , to ,
-
(3)
.
Ponadto, dla dowolnej macierzy zachodzi
(10.4) |
Nazywamy ją wyznacznikiem i oznaczamy przez . Czasami będziemy również stosować oznaczenie .
-
Z warunków (1) i (2) wynika, że jeśli oraz , to
Wniosek 10.2.
Jeśli spełnia warunki (1)-(2), to (2’) jest antysymetryczne tzn. jeśli , to
Dowód.
Niech . Wtedy z warunków (1)-(2) mamy
∎
-
Jeśli spełnia (2’), to
więc jeśli jest takim ciałem, że , to warunek (2’) implikuje (2).
-
Jeśli spełnia (1) oraz dla macierzy które mają takie same dwie sąsiadujące kolumny, to spełnia (2). Rzeczywiście, z dowodu Wniosku 10.2 wynika wtedy, że zmienia znak, gdy zmienimy miejscami dwie sąsiadujące kolumny.
Przykład 10.6.
Załóżmy, że . Wtedy składa się z dwóch permutacji: (parzysta) oraz transpozycji (nieparzysta). Wynika stąd, że dla mamy
Przykład 10.7.
Zobaczmy jakie są konsekwencje warunków (1)-(2) dla . Rozważmy macierz oraz
Wtedy
Z warunku (1) tzn. -liniowości i warunku (2) otrzymujemy, że
W efekcie
Z warunku (2) tzn. antysymetryczności otrzymujemy, że
Wzór na możemy zapisać w bardziej zwartej formie korzystając z grupy permutacji . Składa się ona z permutacji:
Transpozycje są nieparzyste, a permutacje , i są parzyste. Stąd
Z warunku (3) dla mamy
Lemat 10.5.
Załóżmy, że spełnia warunki (1)-(2). Dla dowolnych mamy
Dowód.
Niech i . Dla , z definicji iloczynu macierzy wynika, że
Z warunku (1) wynika, że
Użyjemy teraz warunku (2). Wynika z niego, że jeśli dla pewnych , to . Stąd zamiast sumy
możemy rozważać sumę
Teraz wystarczy tylko zauważyć, że warunek (2) gwarantuje, że
∎
Dowód.
Dowód Twierdzenia 10.2: Stosujemy Lemat 10.5 dla i warunek (3) otrzymując, że dla dowolnej macierzy zachodzi
co dowodzi jednoznaczności funkcji spełniającej (1)-(3). Dla dowodu istnienia, definiujemy odwzorowanie wzorem (10.4). Sprawdzamy łatwo, że tak określone odwzorowanie spełnia warunki (1) i (3). Uzasadnimy, że zachodzi również warunek (2). Załóżmy, że dwie kolumny macierzy są równe tzn. dla pewnych . Wtedy
więc wystarczy pokazać, że dla mamy
Jeśli , to , więc . Ponadto, ponieważ , więc
oraz
co kończy dowód. ∎
Wniosek 10.3 (Wyznacznik iloczynu macierzy).
Dla dowolnych macierzy zachodzi wzór Cauchy’ego
W szczególności, jeśli jest nieosobliwa, to
Lemat 10.6.
Niech . Kolumny macierzy są liniowo zależne wtedy i tylko wtedy, gdy .
Dowód.
Jeśli kolumny są liniowo zależne, to z warunków (1) i (2) wynika, że jest równy wyznacznikowi macierzy z pewną kolumną zerową, więc . Załóżmy, że i przypuśćmy, że kolumny macierzy są liniowo niezależne. Wtedy , czyli jest nieosobliwa. Istnieje więc taka macierz , że . Wtedy
co prowadzi do sprzeczności. ∎
Przykład 10.8.
Uzasadnimy, że
Ponieważ
więc trzecia kolumna jest kombinacją liniową dwóch pierwszych kolumn.
Wniosek 10.4.
Niech . Kolumny macierzy są liniowo niezależne wtedy i tylko wtedy, gdy . W szczególności, jest nieosobliwa wtedy i tylko wtedy, gdy .
Twierdzenie 10.3 (Wyznacznik transpozycji macierzy).
Dla dowolnej macierzy mamy
Dowód.
Z definicji wyznacznika i macierzy transponowanej wystarczy zaobserwować, że
Niech będzie permutacją odwrotną do . Wtedy oraz
co kończy dowód. ∎
Wniosek 10.5.
Kolumny (wiersze) macierzy kwadratowej są liniowo zależne wtedy i tylko wtedy, gdy .
Definicja 10.4.
Dopełnienie algebraiczne wyrazu macierzy
Dla macierzy oraz definiujemy macierz
otrzymaną z macierzy przez wykreślenie -tego wiersza oraz -tej kolumny. Dopełnieniem algebraicznym wyrazu nazywamy liczbę
Przykład 10.9.
Rozważmy macierz
Przykładowo, dla oraz w macierzy
wykreślamy drugi wiersz i trzecią kolumnę otrzymując macierz
Znaki w zależności od pozycji wyrazu mają następujący rozkład
Twierdzenie 10.4 (Rozwinięcie względem pierwszego wiersza).
Załóżmy, że . Wtedy
Dowód.
Wystarczy sprawdzić, że odwzorowanie zdefiniowane dla macierzy wzorem
spełnia warunki (1)-(3) z Twierdzenia 10.2. Są one łatwe do weryfikacji bezpośrednim rachunkiem. W warunku (1) sprawdzimy przykładowo liniowość względem pierwszej zmiennej. Dla mamy
Dla mamy
Dla sprawdzenia warunku (2) zobaczmy przykładowo co się stanie, gdy z pierwsza i trzecia kolumna są identyczne. Mamy
Warunek (3) zachodzi, bo
∎
-
Analogiczny jak w Twierdzeniu 10.4 wzór na wyznacznik zachodzi dla rozwinięcia względem dowolnego wiersza i dowolnej kolumny. Dowód jest ideologicznie taki sam jak dowód Twierdzenia 10.4. Przykładowo, dla rozwinięcia względem drugiej kolumny przyjmuje on postać
Analogiczne rozumowanie prowadzi nas do wzoru na wyznacznik dla macierzy dla dowolnego . Pozwala on zredukowć wyznaczenie wyznacznika macierzy do obliczenia wyznaczników macierzy o rozmiarze .
Wniosek 10.6 (Rozwinięcie Laplace’a).
Niech z . Dla dowolnych i zachodzą równości
(10.5) |
Dowód.
Ponieważ , więc wystarczy udowodnić, że
czyli zachodzi wzór na rozwinięcie Laplace’a względem -tego wiersza. Wystarczy sprawdzić, że funkcja spełnia warunki (1)-(3). Warunki (1) i (3) są łatwe do sprawdzenia. Dla dowodu (2) wystarczy zauważyć, że , gdy ma dwie sąsiadujące kolumny identyczne. ∎
-
Stosując wzór Laplace’a mamy swobodę wyboru wiersza lub kolumny względem której zastosujemy rozwinięcie. Oczywiście korzystnie jest wybrać kolumnę (wiersz) z największą liczbą zer. Zanim zastosujemy wzór Lapalce’a możemy najpierw użyć operacji na kolumnach (wierszach) nie zmieniających wyznacznika, aby wprowadzić możliwie dużo wyrazów zerowych w danej kolumnie (wierszu). Możemy więc, do ustalonej kolumny (wiersza) dodać kombinację liniową innych kolumn (wierszy).
Przykład 10.10.
Odejmując pierwszy wiersz od pozostałych wierszy i stosując rozwinięcie względem pierwszej kolumny mamy:
Wniosek 10.7 (Własności wyznacznika).
-
(i)
Jeśli ma dwa identyczne wiersze (kolumny), to .
-
(ii)
Jeśli ma zerowy wiersz (kolumnę), to .
-
(iii)
jest nieosobliwa wtedy i tylko wtedy, gdy wtedy i tylko wtedy, gdy kolumny (wiersze) są liniowo niezależne.
-
(iv)
Jeśli jest górnie (dolnie) trójkątna, to
-
(v)
Jeśli , to
-
(vi)
Jeśli jest nieosobliwa, to
Przykład 10.11.
Rozważmy macierz Vandermonde’a
Uzasadnimy formułę rekurencyjną
łączącą wyznacznik macierzy Vandermonde’a rozmiaru z wyznacznikiem macierzy Vandermonde’a rozmiaru . W tym celu stosujemy najpierw operacje nie zmieniające wyznacznika, aby wprowadzić zerowe wyrazy w pierwszym wierszu macierzy :
Z rozwinięcia Lapalce’a względem pierwszego wiersza mamy
Przykład 10.12.
Niech
będzie wyznacznikiem powyższej macierzy rozmiaru . Przykładowo,
Stosując rozwinięcie względem pierwszej kolumny i dokonując dalszej redukcji otrzymujemy, że
Indukcyjnie dostajemy, że .
Przykład 10.13.
Odejmując ostatni wiersz od pozostałych wierszy otrzymujemy, że
Przykład 10.14.
Pokażemy, że
Dla od -tej kolumny odejmujemy pierwszą kolumnę pomnożoną przez otrzymując macierz dolnie trójkątną:
Wniosek 10.8.
Dla dowolnej macierzy zachodzi równość
(10.6) |
Dowód.
Definicja 10.5.
Dla macierzy definiujemy macierz dołączoną jako macierz
Wniosek 10.9 (Macierz odwrotna).
Jeśli macierz jest nieosobliwa, to
(10.7) |
Dowód.
Przykład 10.15.
Zobaczmy jak wzór na macierz odwrotną wygląda w niskich wymiarach. Dla i mamy
czyli otrzymujemy znany nam wzór
Niech teraz i Wtedy
gdzie
Przykładowo, dla otrzymujemy, że
Twierdzenie 10.5 (Wzory Cramera).
Załóżmy, że macierz jest nieosobliwa. Niech oznacza macierz otrzymaną z przez zastąpienie -tej kolumny w przez wektor . Jedyne rozwiązanie równania jest dane przez
Dowód.
Ponieważ , więc
∎
Przykład 10.16.
Rozwiążemy układ równań
Macierz układu jest nieosobliwa (), więc
Przykład 10.17 (Rozkład Schura).
Przy obliczaniu wyznacznika często stosuje się metodę rozkładu pochodzącą od Schura. Rozważmy macierz blokową
gdzie i są macierzami kwadratowymi. Spróbujmy znaleźć takie macierze i , że
Jeśli nam się to uda, to . Taki rozkład jest zawsze możliwy, gdy macierz jest nieosobliwa. Możemy wtedy przyjąć, że
Zauważmy, że
więc możemy również użyć rozkładu
Jeśli macierz jest nieosobliwa, to mamy analogiczny rozkład
Ponieważ
więc powyższe rozkłady pozwalają łatwo wyznaczyć .
-
Oceń prawdziwość zdań
-
–
Dla dowolnych macierzy zachodzi równość .
-
–
Dla dowolnych macierzy zachodzi równość .
-
–
Dla dowolnych macierzy równość implikuje, że .
-
–
Niech . Jeśli ma niezerowe rozwiązanie, to .
-
–
Jeśli jest macierzą kwadratową i dla pewnego , to .
-
–
Jeśli jest skośnie symetryczna (tzn. ), to .
-
–
Jeśli jest skośnie symetryczna i jest nieparzyste, to .
-
–
Dla dowolnej macierzy kwadratowej .
-
–
Jeśli jest nieosobliwa i górnie trójkątna, to
-
–
Jeśli , i , to .
-
–
Dla macierzy kwadratowej mamy .
-
–
Definicja 10.6.
Wyznacznik odwzorowania liniowego
Niech będzie przestrzenią wektorową wymiaru . Wyznacznik odwzorowania liniowego definiujemy jako , gdzie jest macierzową reprezentacją w pewnej bazie dla .
-
Definicja wyznacznika nie zależy od wyboru reprezentacji macierzowej dla . Rzeczywiście, jeśli jest inną reprezentacją macierzową , to jest podobna do , więc .
Wniosek 10.10.
Niech będzie odwzorowaniem liniowym i . Wyznacznik wtedy i tylko wtedy, gdy jest izomorfizmem liniowym.
Wniosek 10.11.
Jeśli są odwzorowaniami liniowymi, to .
10.3 Geometryczna interpretacja wyznacznika
Definicja 10.7.
Iloczyn wektorowy w
Iloczynem wektorowym wektorów nazywamy wektor
Przez analogię do wzoru Laplace’a będziemy stosować następujące niezbyt formalne oznaczenie:
Wniosek 10.12 (Własności iloczynu wektorowego).
Iloczyn wektorowy
ma dla dowolnych i następujące własności:
-
(1)
(dwuliniowość)
-
(2)
(antysymetryczność)
-
(3)
(reguła śruby prawoskrętnej)
W szczególności, dla dowolnego wektora .
Wniosek 10.13.
Wektor jest prostopadły do wektorów i .
Dowód.
Sprawdzamy łatwo, że
∎
-
Iloczyn wektorowy możemy zapisać w konwencji macierzowej. Niech , . Bezpośredni rachunek pokazuje, że
Stąd
Z drugiej strony, sprawdzamy łatwo, że
Jeśli jest wektorem jednostkowym, to otrzymujemy, że
Odwzorowanie jest rzutem ortogonalnym na płaszczyznę ortogonalną do wektora jednostkowego .
Lemat 10.7.
Dla dowolnych wektorów zachodzi równość
Dowód.
Bezpośredni rachunek pokazuje, że zachodzi tożsamość Lagrange’a:
Rzeczywiście, dla i mamy
Stąd
∎
Wniosek 10.14 (Pole równoległoboku).
Niech . Wtedy jest polem równoległoboku rozpiętego na wektorach i . W szczególności, jeśli i są liniowo niezależne, to .
Wniosek 10.15.
Niech . Wtedy
jest polem równoległoboku rozpiętego na wektorach i .
Dowód.
Rozważmy wektory . Zauważmy, że
więc
∎
Definicja 10.8.
Iloczyn mieszany w
Dla wektorów definiujemy ich iloczyn mieszany jako liczbę
Zauważmy, że
Wniosek 10.16 (Objętość równoległościanu).
Objętość równoległościanu rozpiętego na wektorach jest równa
Dowód.
Objętość równoległościanu rozpiętego na wektorach jest równa iloczynowi pola równoległoboku rozpiętego na wektorach , (jest ono równe ) i odległości punktu od płaszczyzny rozpiętej na wektorach , . Wysokość jest długościom rzutu prostopadłego wektora na wektor prostopadły do . Wtedy , czyli
∎
Wniosek 10.17.
Niech . Objętość równoległościanu rozpiętego na wektorach jest równa
Wniosek 10.18 (Iloczyn wektorowy i mieszany – podsumowanie).
Niech . Zachodzą równości
-
(1)
.
-
(3)
.
-
(4)
Zachodzi tożsamość Jacobiego
-
(5)
Zachodzi toṡamość Lagrange’a
-
(6)
-
(8)
.
-
(9)
jest objętością równoległościanu rozpiętego na wektorach .
-
(10)
Iloczyn wektorowy nie jest przemienny ani łączny.
Lemat 10.8.
Jeśli i , to
W szczególności, jeśli , to
Jeśli tzn. i , to
Dowód.
Dla dowolnego zachodzą równości
oraz
Stąd
∎
10.4 Orientacja
Niech będzie przestrzenią wektorową nad ciałem o wymiarze skończonym . Dla dwóch uporządkowanych baz oraz przez oznaczamy macierz przejścia od bazy do , czyli
Niech oznacza zbiór wszystkich baz . W zbiorze definiujemy relację równoważności przez: wtedy i tylko wtedy, gdy
Definicja 10.9.
Orientacja
Powiemy, że bazy i zadają taką samą orientację jeśli . Przez wybór orientacji w rozumiemy wybór dowolnej uporządkowanej bazy (jej klasy abstrakcji w relacji ) .
Przykład 10.18 (Standardowa orientacja ).
Dla standardowa orientacja jest zadana przez bazę standardową .
-
(1)
Przypomnijmy, że macierz przejścia od bazy do bazy standardowej jest równa . W szczególności, zadaje standardową orientację , gdy .
-
(2)
Baza , dla zadaje standardową orientację wtedy i tylko wtedy, gdy najkrótszy kąt od do jest skierowany przeciwnie do ruchu wskazówek zegara. Rzeczywiście, możemy założyć, że . Niech będzie takim obrotem, że . Zauważmy, że
Ponieważ , więc zadaje standardową orientację wtedy i tylko wtedy, gdy zadaje standardową orientację . Możemy więc założyć, że . Niech . Wtedy wtedy i tylko wtedy, gdy najkrótszy kąt między i jest skierowany przeciwnie do ruchu wskazówek zegara.
-
(3)
Jeśli są liniowo niezależne, to zadaje standardową orientację . Rzeczywiście,
Wniosek 10.19.
Niech będzie izomorfizmem liniowym. Następujące warunki są równoważne
-
(1)
baza zadaje standardową orientację ,
-
(2)
,
-
(3)
jeśli zadaje standardową orientację , to zadaje standardową orientację .
Rozdział 11 Do czego zmierzamy?
SŁOWA KLUCZOWE ROZDZIAŁU wektor własny wartość własna diagonalizacja baza wektorów własnych diagonalizacja ortogonalna macierz stochastyczna dominująca wartość własna wielomian charakterystyczny zespolona postać Jordana rzeczywista postać Jordana krotność geometryczna i algebraiczna twierdzenie Cayleya–Hamiltona diagonalizacja ortogonalna macierzy symetrycznej |
Przedstawimy teraz motywację dla naszych dalszych rozważań. Jak już pewnie zauważyliście szczególnie łatwe do analizy są macierze diagonalne
Przykładowo,
Jeśli jest nieosobliwa, to .
Załóżmy, że macierz jest podobna do macierzy diagonalnej , czyli istnieje taka macierz nieosobliwa
że
Wtedy , więc
czyli jest równie prosta do analizy jak macierz diagonalna .
PROBLEM 1 Scharakteryzować macierze , które są diagonalizowalne tzn. istnieje taka macierz nieosobliwa , że |
Załóżmy, że . Wtedy , czyli
Stąd | ||||
Z powyższych rozważań wynika następujące:
Twierdzenie 11.1 (Diagonalizacja).
Dla macierzy poniższe warunki są równoważne
-
(i)
istnieje taka macierz nieosobliwa , że jest diagonalna,
-
(ii)
istnieje baza dla oraz takie skalary , że
Warto jakoś nazwać własność jaką spełniają wektory w punkcie (ii). Będą one pełniły podstawową rolę w naszych dalszych rozważaniach.
Definicja 11.1.
Wektor własny i wartość własna
Powiemy, że niezerowy wektor jest wektorem własnym macierzy rzeczywistej , jeśli istnieje taka liczba rzeczywista , że
Liczbę nazywamy wartością własną macierzy dla wektora własnego .
Twierdzenie 11.1 możemy sformułować następująco:
Twierdzenie 11.2 (Diagonalizacja=baza wektorów własnych).
Dla macierzy poniższe warunki są równoważne
-
(i)
istnieje taka macierz nieosobliwa , że jest diagonalna,
-
(ii)
istnieje baza dla złożona z wektorów własnych .
Podamy geometryczną interpretację wektora własnego.
Wniosek 11.1.
Dla niezerowego wektora i macierzy poniższe warunki są równoważne
-
(1)
jest wektorem własnym ,
-
(2)
prosta generowana przez jest niezmiennicza dla tzn.
-
Nie każda macierz rzeczywista ma jakiś wektor własny. Wystarczy znaleźć macierz rzeczywistą , która nie ma prostych niezmienniczych. Przykładowo, macierz obrotu o kąt , czyli
nie ma żadnej prostej niezmienniczej.
Możemy na to spojrzeć jeszcze trochę inaczej. Wektor jest wektorem własnym , gdy dla pewnej liczby rzeczywistej zachodzi warunek
czyli , więc dla pewnej liczby rzeczywistej . Zauważmy, że w naszym przykładzie
dla .
Macierz rzeczywistą możemy traktować w naturalny sposób jako macierz zespoloną. Możemy, więc spytać o istnienie zespolonych wektorów własnych . Zauważmy, że dla . Rozważmy macierz
i znajdźmy taki niezerowy wektor , że . Mamy
czyli
Wektor ma więc postać
Wynika stąd, że
czyli jest zespolonym wektorem własnym z wartością własną . Analogicznie sprawdzamy, że jest zespolonym wektorem własnym dla wartości własnej . Macierz jest diagonalizowalna jako macierz zespolona. Dla
mamy
-
Pojęcie wektora własnego możemy też zdefiniować w bardziej ogólnym kontekście. Niech będzie odwzorowaniem liniowym. Powiemy, że niezerowy wektor jest wektorem własnym jeśli
Przestrzeń nie musi być skończenie wymiarowa. Przykładowo, niech będzie przestrzenią wszystkich funkcji mających ciągłą pochodną dowolnego rzędu. Wtedy odwzorowanie (operator różniczkowania)
jest liniowe. Ponadto, dla mamy
czyli jest wektorem własnym dla wartości własnej .
Uzasadnimy teraz, że jeśli , to dla pewnego . Rzeczywiście, równość oznacza, że , czyli również
czyli jest funkcją stałą, więc .
Wynika stąd, że jądro ma wymiar oraz
-
Niech będzie odwzorowaniem liniowym i niech będzie bazą . Rozważmy macierz odwzorowania w tej bazie. Wektor jest wektorem własnym dla wartości własnej wtedy i tylko wtedy, gdy wektor współrzędnych jest wektorem własnym macierzy dla wartości własnej .
Możemy pójść jeszcze krok dalej. Wektory własne macierzy diagonalnej to wektory bazy standardowej . Ma ona własność
Takie bazy będziemy nazywać ortonormalnymi. Wektory oraz są ortogonalne i mają normę .
PROBLEM 2 Scharakteryzować macierze , które są ortogonalnie diagonalizowalne tzn. istnieje taka macierz nieosobliwa , że oraz |
Zaczniemy od przyglądnięcia się takim macierzom
że . Bezpośrednio z definicji iloczynu macierzy i definicji macierzy transponowanej wynika, że wtedy
Takie macierze będziemy nazywać ortogonalnymi. W Problemie 2 pytamy więc o istnienie takiej macierzy ortogonalnej , że
jest diagonalna. Zauważmy, że wtedy oraz
czyli musi być symetryczna. Jest to warunek konieczny, aby zaszła sytuacja opisana w Problemie 2. W następnych rozdziałach pokażemy, że macierze symetryczne to jedyne macierze rzeczywiste rozwiązujące Problem 2.
11.1 Rozkład Jordana w wymiarze
Spróbujmy nabrać intuicji w przypadku wymiaru . Zakładamy, że ciało jest równe lub . Rozważmy macierz .
Definicja 11.2.
Wektor własny i wartość własna
Liczbę nazywamy wartością własną macierzy , jeśli istnieje taki niezerowy wektor , że
Każdy taki wektor nazywamy wektorem własnym odpowiadającym wartości własnej .
-
Niech . Interpretacja geometryczna jest następująca. Jeśli jest wektorem własnym dla wartości własnej , to prosta jest niezmiennicza dla tzn. jeśli , to .
Jeśli jest wektorem własnym dla wartości własnej , to . Oznacza to, że , czyli . Odwrotnie, jeśli dla pewnego skalara , to macierz jest osobliwa. W szczególności, , czyli istnieje wektor własny .
Wniosek 11.2.
Dla i następujące warunki są równoważne
-
(1)
jest wartością własną ;
-
(2)
;
-
(3)
jest osobliwa;
-
(4)
.
Warunek (4) oznacza, że wartość własna jest pierwiastkiem wielomianu
Wielomian nazywamy wielomianem charakterystycznym macierzy . Bezpośredni rachunek pokazuje, że
-
Macierze podobne mają takie same wielomiany charakterystyczne. Rzeczywiście, jeśli , to
Jeśli macierze i mają takie same wielomiany charakterystyczne, to nie muszą być podobne. Przykładowo, oraz mają taki sam wielomian charakterystyczny , ale nie są podobne, bo macierz zerowa jest podobna tylko do siebie samej.
Dla zasadnicze twierdzenie algebry gwarantuje, że wielomian ma dwa (niekoniecznie różne) pierwiastki zespolone , . Są one wtedy wartościami własnymi macierzy . Macierz zespolona ma więc zawsze dwie wartości własne. Nie oznacza to, że ma ona dwa liniowo niezależne wektory własne. Przykładowo, wartościami własnymi macierzy
są . Mamy więc dwukrotną wartość własną . Zobaczmy jak wyglądają wektory własne. Niezerowy wektor jest wektorem własnym dla jeśli , czyli
Stąd , czyli wektor własny ma postać
W przypadku , z algebraicznego punktu widzenia dla wielomianu charakterystycznego mamy trzy możliwości:
-
(i)
ma dwa różne pierwiastki rzeczywiste;
-
(ii)
ma dwukrotny pierwiastek rzeczywisty;
-
(iii)
ma dwa sprzężone (nierzeczywiste) pierwiastki zespolone.
W przypadku (iii) macierz rzeczywista nie ma rzeczywistych wartości własnych.
Wniosek 11.3.
Niech . Jeśli są pierwiastkami równania charakterystycznego
to zachodzą wzory Viete’a
Dowód.
Z założenia mamy
wystarczy więc porównać współczynniki wielomianów po obu stronach równości. ∎
-
Dla dowolnych macierzy macierze i mają takie same wielomiany charakterystyczne. Wynika, to z faktu, że
Lemat 11.1.
Jeśli ma dwie różne rzeczywiste wartości własne oraz są wektorami własnymi odpowiadającymi , to , są liniowo niezależne. W szczególności, tworzą bazę .
Dowód.
W przeciwnym razie dla pewnego skalara . Wtedy
czyli , co prowadzi do sprzeczności. Skorzystaliśmy tu z faktu, że . ∎
Twierdzenie 11.3.
Jeśli ma dwa liniowo niezależne wektory własne odpowiadające wartościom własnym , (niekoniecznie różnym), to dla macierzy mamy
Dowód.
Z definicji mamy, że dla . Oczywiście jest odwracalna oraz dla mamy
∎
-
Twierdzenie 11.3 orzeka, że jeśli ma bazę złożoną z wektorów własnych, to ma w tej bazie postać diagonalną . Macierz nazywamy postacią Jordana macierzy .
Przykład 11.1.
Znajdziemy postać Jordana macierzy
Szukamy najpierw wartości własnych czyli pierwiastków równania charakterystycznego
Są nimi liczby oraz . Aby znaleźć wektor własny dla znajdujemy jądro macierzy
Rozwiązując równanie otrzymujemy, że . Jednym z wektorów własnych jest . Analogicznie, jest wektorem własnym dla . W bazie , macierz ma postać diagonalną
-
Macierz zespolona może mieć rzeczywistą wartość własną, ale może nie mieć odpowiadającego jej rzeczywistego wektora własnego w . Dla przykładu rozważmy macierz
Wielomian charakterystyczny ma postać
więc ma wartości własne oraz . Wektor własny dla jest niezerowym rozwiązaniem równania
czyli
Stąd, oraz każdy wektor własny jest postaci
Nie może on być wektorem z .
Zajmiemy się teraz przypadkiem, gdy jest dwukrotnym pierwiastkiem wielomianu charakterystycznego . Mogą zachodzić dwie możliwości:
-
•
. Mówimy wtedy, że krotność geometryczna wartości własnej jest równa jej krotności algebraicznej. Wówczas ma dwa liniowo niezależne wektory własne odpowiadające i jesteśmy w sytuacji opisanej Twierdzeniem 11.3. Wtedy postać Jordana macierzy jest diagonalna:
Z powyższej równości wynika, że wtedy .
-
•
. Istnieje wtedy tylko jeden liniowo niezależny wektor własny dla .
Wniosek 11.4.
Jeśli jest dwukrotnym pierwiastkiem charakterystycznym macierzy i , to i ma tylko jeden liniowo niezależny wektor własny.
Lemat 11.2 (Twierdzenie Cayleya–Hamiltona).
Dla macierzy zachodzi równość
Dowód.
Zastosujemy brutalną siłę, czyli bezpośredni rachunek. Niech Ponieważ , więc
∎
Przykład 11.2.
Niech . Twierdzenie Cayleya–Hamiltona pozwala łatwo wyznaczyć dla . Niech , będą wartościami własnymi . Wtedy
czyli
Jeśli , to rozważamy macierze
Wtedy
Środkowa równość wynika bezpośrednio z Twierdzenia Cayleya–Hamiltona. Sprawdzimy równość . Mamy
Stąd dla mamy
Dla rozważamy
Wtedy dla . Mamy więc
Wniosek 11.5.
Jeśli jest nieosobliwa, to
Ponadto,
Dowód.
Z twierdzenia Cayleya–Hamiltona mamy
Mnożąc powyższą równość przez otrzymujemy, że
Biorąc ślady obu stron w tej równości dostajemy, że . Wzór na otrzymujemy obliczając ślady macierzy po obu stronach w równości Cayleya–Hamiltona. ∎
Wniosek 11.6.
Niech . Jeśli oraz dla pewnych , to
Dowód.
Z założenia i twierdzenia Cayleya–Hamiltona wynika, że
Zauważmy, że , bo inaczej , co jest sprzeczne z założeniem. Stąd również . ∎
-
Macierz jest nilpotentna, jeśli dla pewnego . Pokażemy, że wtedy jest jedyną wartością własną oraz . Zauważmy, że jeśli jest wartością własną dla wektora własnego , to , czyli . W szczególności, i , czyli . Z twierdzenia Cayleya–Hamiltona wynika, że .
Lemat 11.3.
Jeśli jest dwukrotnym pierwiastkiem wielomianu charakterystycznego , to
Dowód.
Ze wzorów Viete’a mamy i . Z Lematu Cayleya–Hamiltona wynika, że
Ponieważ macierze i komutują ze sobą, więc
∎
Twierdzenie 11.4.
Jeśli jest dwukrotną wartością własną macierzy i , to istnieje taka baza dla , że
W szczególności, dla macierzy mamy następującą postać Jordana dla :
Dowód.
Niech będzie dowolnym wektorem własnym dla . Każdy wektor własny jest postaci , gdzie jest pewnym wektorem własnym dla oraz . Niech będzie dowolnym wektorem liniowo niezależnym z . W szczególności, nie jest wektorem własnym odpowiadającym , więc . Ponieważ,
więc jest wektorem własnym odpowiadającym . Stąd
dla pewnego . Dla wektora otrzymujemy, że , czyli . ∎
POSTAĆ JORDANA MACIERZY ZESPOLONEJ Macierz zespolona ma jedną z dwóch postaci Jordana |
Wniosek 11.7.
-
(i)
Jeśli jest macierzą nilpotentną, to
dla pewnej macierzy nieosobliwej .
-
(ii)
Jeśli jest taka, że , to lub lub
dla pewnej macierzy nieosobliwej .
-
(iii)
Jeśli jest taka, że , to lub
dla pewnej macierzy nieosobliwej .
-
(iv)
Jeśli jest taka, że , to lub
dla pewnej macierzy nieosobliwej .
Wniosek 11.8.
Dla dowolnej macierzy mamy
-
(i)
jest podobna do .
-
(ii)
jest podobna do macierzy symetrycznej.
-
(iii)
jest iloczynem macierzy symetrycznych.
Dowód.
Punkt (i). Możemy założyć, że jest w postaci Jordana. Jeśli jest ona diagonalna, to nie ma czego dowodzić. Załóżmy więc, że
Wtedy dla mamy .
Punkt (ii). Ponownie możemy założyć, że . Szukamy takiej macierzy nieosobliwej , że jest symetryczna. Dla mamy
Ponieważ szukamy macierzy symetrycznej, więc musi zachodzić warunek . Wystarczy więc przyjąć takie , że i . Zwróćmy uwagę, że nie może być rzeczywista. Przykładowo, dla , i mamy
Punkt (iii). Zauważmy najpierw, że możemy założyć, że jest w postaci Jordana , bo jeśli jest iloczynem macierzy symetrycznych, to
jest również iloczynem macierzy symetrycznych. Dla wystarczy przyjąć
Jeśli , to przyjmujemy
∎
-
Rozważmy macierz w postaci bloku Jordana
Dla macierzy
mamy oraz
Naturalne jest pytanie o postać macierzy , gdy jej wielomian charakterystyczny ma dwie zespolone wartości własne , oraz . Macierz możemy traktować jako element przestrzeni . Istnieje więc wektor własny odpowiadający wartości własnej . Wektor wygodnie jest zapisać w postaci
Wówczas
Ponadto,
czyli wektor jest wektorem własnym odpowiadającym wartości własnej .
Pokażemy, że wektory są liniowo niezależne. Rzeczywiście, przypuśćmy, że dla pewnej liczby rzeczywistej . Wtedy
oraz
więc , co prowadzi do sprzeczności z warunkiem .
Zauważmy, że
więc
Dla macierzy otrzymujemy równość
Dla mamy
Wniosek 11.9 (Rzeczywista postać Jordana).
Jeśli , z są pierwiastkami wielomianu charakterystycznego dla macierzy , to istnieje taka nieosobliwa macierz , że
Ponadto, dla dowolnego takiego niezerowego wektora , że
Przykład 11.3 (Ciąg Fibonacciego).
Ciąg Fibonacciego jest zdefiniowany rekurencyjnie wzorem
Dla macierzy
mamy więc
Wynika stąd, że
Wielomian charakterystyczny ma postać , więc wartościami własnymi są
Wektory własne mają postać
Ponieważ
więc
czyli otrzymujemy formułę Bineta
Przykład 11.4.
Rozważmy macierz
Jej wielomian charakterystyczny ma postać
Stąd jest dwukrotną wartością własną macierzy . Ponieważ
więc jeśli , czyli
Wektor jest wektorem własnym i każdy inny wektor własny jest liniowo zależny z .
Szukamy teraz takiego wektora , że
Musimy więc rozwiązać układ równań
Rozwiązaniami są wektory postaci . Możemy więc przyjąć, że
Dla macierzy
mamy
Przykład 11.5.
Macierz
ma zespolone wartości własne oraz . Znajdziemy wektor własny dla . Szukamy niezerowych rozwiązań równania
Stąd oraz . Możemy więc przyjąć, że
Dla wartości własnej wektorem własnym jest więc . Dla macierzy
mamy
Aby znaleźć rzeczywistą postać Jordana rozważamy macierz
której kolumnami są część rzeczywista i urojona wektora . Wtedy
11.2 Rozkład Jordana w wymiarze
Podamy dowód Twierdzenia Jordana dla macierzy zespolonej . Zastosujemy podejście, które uogólnia się na wyższe wymiary.
Twierdzenie 11.5 (Rozkład Jordana macierzy zespolonej).
Niech . Istnieje taka macierz nieosobliwa , że jest jednej z poniższych postaci:
Ponadto, są wartościami własnymi macierzy .
Lemat 11.4.
Załóżmy, że wartości własne macierzy są różne. Wtedy odpowiadające im wektory własne są liniowo niezależne oraz dla mamy
Dowód.
Zauważmy najpierw, że i są liniowo niezależne. Przypuśćmy, że dla pewnego . Wtedy , bo . Mamy
czyli , sprzeczność.
Przypuśćmy, że . Wtedy dla pewnych . Przynajmniej jedna z liczb , jest różna od zera, bo . Otrzymujemy, że
czyli
W efekcie
co jest sprzeczne z liniową niezależnością i . ∎
Lemat 11.5.
Niech . Istnieje taka macierz nieosobliwa , że macierz jest górnie trójkątna.
Dowód.
Niech będzie wartością własną i niech będzie odpowiadającym jej wektorem własnym. Uzupełniamy do bazy , , dla . Rozważmy macierz . Macierz ma postać blokową
Z rozkładu Jordana w wymiarze istnieje taka macierz nieosobliwa , że
jest górnie trójkątna. Definiujemy macierz nieosobliwą
Wtedy
jest górnie trójkątna i teza zachodzi dla . ∎
Lemat 11.6.
Rozważmy macierz górnie trójkątną z jako jedyną wartością własną
Wtedy zachodzi jeden z warunków
-
(i)
,
-
(ii)
i jest podobna do macierzy
-
(iii)
oraz jest podobna do macierzy
Dowód.
Sprawdzamy, że
Mamy trzy możliwości
-
(i)
,
-
(ii)
, ,
-
(iii)
, .
W przypadku (ii) lub , bo i macierz jest jednej z postaci
We wszystkich przypadkach oraz
Inkluzja wynika stąd, że . Niech będzie niezerowym wektorem. Istnieje więc taki (niezerowy) wektor , że . Wybieramy teraz wektor liniowo niezależny z . Rozważmy macierz
Ponieważ , więc są liniowo niezależne, czyli jest nieosobliwa. Ponadto,
W przypadku (iii) mamy i , więc
Ponadto,
Niech będzie wektorem własnym dla wartości własnej . Ponieważ
więc istnieje taki wektor , że . Wektory
są liniowo niezależne. Rzeczywiście, przypuśćmy, że dla pewnych . Wtedy
czyli , bo . W konsekwencji,
czyli . Z równości również . Dla
mamy
∎
Wniosek 11.10.
Załóżmy, że jest -krotną wartością własną macierzy . Wtedy
-
(i)
jeśli , to ,
-
(ii)
jeśli , to jest podobna do macierzy
-
(iii)
jeśli , to jest podobna do macierzy
Lemat 11.7.
Załóżmy, że jest macierzą górnie trójkątną postaci
Wtedy
-
(i)
,
-
(ii)
jeśli , to dla pewnej macierzy nieosobliwej ,
-
(iii)
jeśli , to dla pewnej macierzy nieosobliwej .
Dowód.
Zauważmy, że
czyli
Załóżmy, że . Niech będą bazą dla jądra. Jeśli jest wektorem własnym dla , to są liniowo niezależne. Przypuśćmy bowiem, że . Wtedy
sprzeczność. Dla macierzy nieosobliwej mamy
Niech teraz , czyli . Zauważmy, że teza zajdzie, gdy znajdziemy taką bazę , że
Z wyborem i nie mamy problemu: bierzemy wektory własne dla i . Musimy dobrać wektor , aby . W tym celu wystarczy zauważyć, że
Rzeczywiście, , czyli , gdy i , czyli jądro jest generowane przez wektor . Sprawdzamy łatwo, że jest on w obrazie generowanym przez wektory i .
Pozostaje sprawdzić, że są liniowo niezależne. Wiemy, że i są liniowo niezależne. Przypuśćmy, że . Wtedy
co jest sprzeczne z liniową niezależnością i . ∎
Wniosek 11.11.
Załóżmy, że są różnymi wartościami własnymi macierzy oraz ma krotność . Wtedy
-
(i)
,
-
(ii)
jeśli , to jest podobna do macierzy
-
(iii)
jeśli , to jest podobna do macierzy
Dowód.
Zajmiemy się teraz macierzami rzeczywistymi . Wtedy wielomian charakterystyczny jest stopnia i ma współczynniki rzeczywiste. Jeśli liczba zespolona jest pierwiastkiem , to jest nim również . Wynika stąd, że istnieje co najmniej jeden pierwiastek rzeczywisty . Jest on oczywiście wartością własną . Jeśli ma trzy (liczone z krotnościami) rzeczywiste wartości własne, to ma taką samą postać Jordana jak w przypadku zespolonym.
Pozostaje nam rozważyć przypadek, gdy ma rzeczywisty pierwiastek i parę pierwiastków oraz z .
Wniosek 11.12 (Rzeczywista postać Jordana).
Jeśli dla ma rzeczywisty pierwiastek i parę pierwiastków sprzężonych oraz z , to istnieje taka nieosobliwa macierz , że
Dowód.
Niech będzie wektorem własnym dla , a zespolonym wektorem własnym dla . Wtedy jest wektorem własnym dla . Z naszych rozważań w wymiarze wystarczy pokazać, że są liniowo niezależne nad , bo wtedy teza zachodzi dla . Wiemy już, że i są liniowo niezależne. Przypuśćmy, że
dla pewnych . Ponieważ
więc
czyli są liniowo zależne nad . Prowadzi to do sprzeczności, bo wektory te odpowiadają różnym wartościom własnym. ∎
Przykład 11.6.
Macierz
ma wartości własne , , . Odpowiadającymi im wektorami własnymi są przykładowo
Dla
mamy
Aby otrzymać postać rzeczywistą rozważamy macierz
której druga i trzecia kolumna, to odpowiednio, część rzeczywista i urojona wektora własnego . Otrzymujemy, że
Przykład 11.7.
Wartości własne macierzy
to i . Sprawdzamy łatwo, że odpowiadające im wektory własne, to
Krotność algebraiczna wartości własnej jest równa , ale jej krotność geometryczna jest równa . Macierz nie ma więc bazy wektorów własnych, czyli nie jest diagonalizowalna. Aby wyznaczyć postać Jordana szukamy takiego wektora , że
Ponieważ
więc możemy przyjąć, że . Dla macierzy
mamy
Przykład 11.8.
Macierz
ma tylko jedną wartość własną o krotności algebraicznej . Zauważmy, że
więc
Ponadto,
Szukamy teraz takiego wektora , że
Łatwo sprawdzamy, że możemy przyjąć . Dla bazy
Dla
mamy
Przykład 11.9.
Przyglądniemy się teraz macierzom antysymetrycznym . Ponieważ , więc ma postać
Zakładamy, że jest niezerowa, czyli . Ponieważ jest antysymetryczna i wymiar jest nieparzysty, więc . W szczególności, jest zawsze wartością własną. Ma ona krotność , bo jak łatwo sprawdzić pozostałe wartości własne, to . Wektor własny dla wartości własnej jest równy
Ponadto, jeśli są antysymetryczne, to
Co więcej, macierz
jest antysymetryczna oraz
11.3 Diagonalizacja w wymiarach i
Niech
będzie rzeczywistą macierzą symetryczną. Równanie charakterystyczne dla ma postać
Ponieważ
więc wartości własne , macierzy są rzeczywiste oraz
Twierdzenie 11.6.
Dla macierzy rzeczywistej następujące warunki są równoważne
-
(i)
,
-
(ii)
ma bazę ortonormalną złożoną z wektorów własnych ,
-
(iii)
Istnieje taka macierz ortogonalna , że
gdzie jest diagonalna z wartościami własnymi na przekątnej.
Dowód.
Załóżmy, że jest symetryczna. Jeśli , to , jest bazą ortonormalną złożoną z wektorów własnych macierzy .
Jeśli , to i ma dwie różne rzeczywiste wartości własne , . Niech , będą odpowiadającymi im wektorami własnymi o normie . Pokażemy, że wektory , są ortogonalne. Mamy
więc , bo .
Wystarczy przyjąć dla bazy ortonormalnej , złożonej z wektorów własnych.
Wiemy, że . Wtedy
∎
Rozważmy teraz macierz symetryczną . Istnieje rzeczywista wartość własna dla . Niech będzie odpowiadającym jej wektorem własnym o normie . Niech będzie płaszczyzną prostopadłą do wektora . Wybierzmy bazę ortonormalną , dla . Wtedy , , jest bazą ortonormalną dla .
Pokażemy, że , , czyli . Ze względu na symetrię wystarczy pokazać, że . Ponieważ jest symetryczna, więc
Rozważmy macierz ortogonalną . Wtedy
Ponieważ jest symetryczna, więc , czyli
Wiemy już, że istnieje taka macierz ortogonalna , że
Dla macierzy ortogonalnej
mamy
Macierz jest ortogonalna i jej kolumny są bazą ortonormalną złożoną z wektorów własnych.
Wniosek 11.13.
Dla macierzy rzeczywistej następujące warunki są równoważne
-
(i)
,
-
(ii)
ma bazę ortonormalną złożoną z wektorów własnych ,
-
(iii)
Istnieje taka macierz ortogonalna , że
gdzie jest diagonalna z wartościami własnymi na przekątnej.
11.4 Twierdzenie Cayleya–Hamiltona w wymiarze
Twierdzenie 11.7 (Twierdzenie Cayleya–Hamiltona).
Niech będą wartościami własnymi macierzy . Wtedy
Dowód.
Z Lematu 11.5 istnieje taka macierz nieosobliwa , że jest górnie trójkątna. Zauważmy, że
Wynika stąd, że teza zachodzi dla wtedy i tylko wtedy, gdy zachodzi dla . Możemy więc założyć, że jest górnie trójkątna postaci
Niech będzie dowolnym wektorem. Zauważmy, że
dla pewnych . Następnie,
dla pewnego . Ostatecznie,
czyli
∎
-
Z pewnością zauważyliście, że dokładnie te same argumenty pokazują, że dla macierzy górnie trójkątnej zachodzi
Dowód opiera się na obserwacji, że dla macierzy górnie trójkątnej podprzestrzenie są niezmiennicze dla . Pokażemy później, że każda macierz jest podobna do macierzy górnie trójkątnej, więc Twierdzenie Cayleya–Hamiltona zachodzi dla dowolnej macierzy .
-
Niech . Oceń prawdziwość poniższych zdań:
-
–
Jeśli , to jest wektorem własnym .
-
–
Jeśli ma prostą niezmienniczą, to ma rzeczywiste wartości własne.
-
–
ma rzeczywisty wektor własny.
-
–
Jeśli jest górnie trójkątna tzn. , to jest diagonalizowalna.
-
–
Jeśli , to jest diagonalizowalna.
-
–
Jeśli , to jest ortogonalnie diagonalizowalna.
-
–
Jeśli , to .
-
–
Jeśli ma bazę złożoną z wektorów własnych , to jest nieosobliwa.
-
–
jest jedyną wartością własną wtedy i tylko wtedy, gdy .
-
–
Jeśli , to jest diagonalizowalna lub .
-
–
Jeśli , to ma prostą niezmienniczą.
-
–
i mają takie same wartości własne.
-
–
i mają takie same wektory własne.
-
–
Jeśli jest nieosobliwa, to i mają takie same wartości własne.
-
–
Jeśli jest nieosobliwa, to i mają takie same wektory własne.
-
–
i mają takie same wartości własne.
-
–
i mają takie same wektory własne.
-
–
Jeśli jest nieosobliwa, to i mają takie same wartości własne.
-
–
Jeśli jest nieosobliwa, to i mają takie same wektory własne.
-
–
Jeśli jest nieosobliwa i diagonalizowalna, to jest diagonalizowalna.
-
–
Jeśli macierz kwadratowa jest diagonalizowalna, to jest również diagonalizowalna.
-
–
Jeśli macierz kwadratowa ma dwa identyczne wiersze (kolumny), to jest jej wartością własną.
-
–
Indeks pojęć
- baza Definicja 3.9
- baza standardowa Definicja 3.7
- ciało Definicja 2.7
- ciało liczb rzeczywistych 2.1
- ciało liczb zespolonych Twierdzenie 2.1
- dopełnienie algebraiczne wyrazu macierzy Definicja 10.4
- działanie wewnętrzne w zbiorze Definicja 2.5
- grupa Definicja 2.6
- grupa abelowa Definicja 2.6
- iloczyn macierzy Definicja 7.3
- iloczyn mieszany Definicja 10.8
- iloczyn skalarny w Definicja 3.10
- iloczyn wektorowy w Definicja 10.7
- jądro macierzy Definicja 7.10
- jednorodny układ równań Definicja 4.3
- kąt między wektorami Definicja 3.13
- kombinacja liniowa wektorów Definicja 3.6
-
liczby zespolone
- argument 2.2
- część rzeczywista i urojona 2.2
- liczba sprzężona Definicja 2.2
- moduł Definicja 2.2
- pierwiastkowanie Definicja 2.4
- postać algebraiczna 2.2
- postać trygonometryczna 2.2
- suma i iloczyn Definicja 2.1
- liniowa niezależność wektorów Definicja 3.8
-
macierz
- elementarna Przykład 7.4
- identycznościowa Definicja 7.4
- nieosobliwa Definicja 7.5
- odwrotna Definicja 7.5
- odwzorowania liniowego Rozdział 6
- odwzorowania liniowego w bazach standardowych Definicja 8.1
- odwzorowania liniowego w dowolnych bazach Definicja 8.2
- przejścia, zmiana bazy Definicja 7.14
- rzutu prostopadłego na prostą w Przykład 6.5
- symetrii względem prostej w Przykład 6.6
- symetryczna Definicja 7.2
- transponowana Definicja 7.1
- macierze podobne Definicja 8.3
- macierze wierszowo równoważne Definicja 7.11
- macierzowy zapis układu równań liniowych 4.2
- metoda eliminacji Gaussa 4.1
- nierówność trójkąta Wniosek 3.1
- norma euklidesowa w Definicja 3.11
- objętość równoległościanu Wniosek 10.16
-
odwzorowanie liniowe
- epimorfizm Definicja 6.5
- izomorfizm Definicja 6.5
- jądro Definicja 6.3
- monomorfizm Definicja 6.5
- obraz Definicja 6.4
- odwzorowanie liniowe Definicja 6.1
- odwzorowanie -liniowe Definicja 10.3
- operacje dozwolone na wierszach macierzy 4.1
- orientacja Definicja 10.9
- permutacje Definicja 10.1
- podprzestrzeń generowana Definicja 5.1
- podprzestrzeń wektorowa Definicja 5.5
- pole równoległoboku Wniosek 10.14
- postać schodkowa macierzy 4.1
- przestrzeń wektorowa Przykład 3.3
- przestrzeń wektorowa nad ciałem Definicja 3.5
- przestrzeń wektorowa odwzorowań liniowych Definicja 6.2
- przestrzeń wektorowa Lemat 3.1
- przestrzeń wektorowa ze skończoną bazą, wymiar Wniosek 5.2
- reprezentacja macierzowa odwzorowania liniowego Twierdzenie 8.1
- rozkład Jordana macierzy rzeczywistej Wniosek 11.12
- rozkład Jordana macierzy zespolonej Twierdzenie 11.5
- równanie ogólne płaszczyzny w Definicja 3.17
- równanie ogólne prostej na płaszczyźnie Definicja 3.16
- równanie parametryczne prostej Definicja 3.15
- rząd macierzy Definicja 7.9
- rząd macierzy transponowanej Twierdzenie 7.1
- suma algebraiczna podprzestrzeni Definicja 9.1
- suma prosta Definicja 9.1
- ślad iloczynu macierzy Wniosek 8.4
- ślad macierzy Definicja 7.8
- tożsamość równoległoboku Lemat 3.4
- transpozycja iloczynu macierzy Lemat 7.5
-
twierdzenie
- Cayleya–Hamiltona Lemat 11.2, Twierdzenie 11.7
- diagonalizacja przez bazę wektorów własnych Twierdzenie 11.3
- formuła wymiaru Twierdzenie 6.2
- formuła wymiaru dla macierzy Wniosek 7.7
- nierówność Cauchy’ego–Schwarza Twierdzenie 3.1
- Steinitza Twierdzenie 5.2
- wzory Cramera Twierdzenie 10.5
- zasadnicze twierdzenie algebry Twierdzenie 2.3
- układ równań liniowych Definicja 4.1
- wartość własna Definicja 11.2
- wektor jednostkowy Definicja 3.14
- wektor własny Definicja 11.2
- wektory ortogonalne Definicja 3.12
- wielomian charakterystyczny 11.1
-
wyznacznik
- iloczynu macierzy Wniosek 10.3
- macierzy odwrotnej Wniosek 10.3
- macierzy transponowanej Twierdzenie 10.3
- odwzorowania liniowego Definicja 10.6
- ogólna definicja wyznacznika Twierdzenie 10.2
- rozwinięcie Laplace’a Wniosek 10.6
- wyznacznik macierzy Definicja 4.4
- wzory Cramera w wymiarze Twierdzenie 4.1
- wzór de Moivre’a Twierdzenie 2.2
- wzór na macierz odwrotną Wniosek 10.9
- wzór polaryzacyjny Lemat 3.5
- zbiory liczbowe Przykład 2.1
- zmiana bazy Definicja 7.13
- znak permutacji Definicja 10.2
Literatura
- 1 S. Axler Linear Algebra Done Right Springer, 1997
- 2 J. Komorowski Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk PWN, 1978
- 3 S. J. Leon Linear Algebra with Applications Pearson 2015
- 4 C. D. Meyer Matrix Analysis and Applied Linear Algebra SIAM,
- 5 D. Poole Linear Algebra: A Modern Introduction Cengage Learning, 2015
- 6 B. Solomon Linear Algebra, Geometry and Transformations CRC Press, 2015
- 7 K. Tapp Matrix Groups for Undergraduates. AMS, 1971.