I Algebra liniowa z geometrią 1

Rozdział 7 Działania na macierzach

SŁOWA KLUCZOWE ROZDZIAŁU transponowanie macierz symetryczna i antysymetryczna macierz identycznościowa macierz nieosobliwa odwrotność iloczynu transpozycja iloczynu jądro i obraz rząd macierzy formuła wymiaru rząd macierzy transponowanej macierz diagonalna macierz trójkątna ślad macierzy grafy rekurencje liniowe macierze elementarne macierze wierszowo równoważne rozkład LU zmiana bazy macierz przejścia

7.1 Transponowanie

W zbiorze macierzy Mk×n(𝔽) zdefiniowaliśmy dodawanie

+:Mk×n(𝔽)×Mk×n(𝔽)Mk×n(𝔽)

oraz mnożenie macierzy przez skalar

:𝔽×Mk×n(𝔽)Mk×n(𝔽).

Otrzymaliśmy w ten sposób przestrzeń wektorową (Mk×n(𝔽),+,). Przypomnijmy, że przyjęliśmy konwencję

[x1,,xn]T=[x1xn].

Wektor [x1,,xn]T𝔽n możemy interpretować jako macierz o n-wierszach i jednej kolumnie, czyli element Mn×1(𝔽). Z drugiej strony [x1,,xn] jest w naturalny sposób macierzą o jednym wierszu i n-kolumnach, czyli elementem M1×n(𝔽).

Definicja 7.1.

Macierz transponowana

Niech AMn×k(𝔽) będzie macierzą o wierszach a(1),,a(n)M1×k(𝔽). Macierz transponowana ATMk×n(𝔽) jest zdefiniowana jako

AT=[a(1)Ta(n)T].

Oznacza to, że wiersze macierzy A stają się kolumnami macierzy transponowanej AT. Wynika stąd, że jeśli A=[aij] oraz AT=[aijT], to

aijT=aji.

Przykładowo,

[3-2241-3]T=[321-24-3].
MACIERZ TRANSPONOWANA A=[-a(1)--a(2)--a(k)-]Mk×n(𝔽),AT=[a(1)Ta(k)T]Mn×k(𝔽) gdzie a(i)=[ai1,,ain]M1×n(𝔽),a(i)T=[ai1ain]Mn×1(𝔽)
Wniosek 7.1.

Dla macierzy A,BMk×n(F) i tF zachodzą warunki

  • (i)

    (AT)T=A,

  • (ii)

    (tA)T=tAT,

  • (iii)

    (A+B)T=AT+BT.

  • U

    Warunki (ii) i (iii) oznaczają, że transponowanie macierzy

    L:Mk×n(𝔽)AATMn×k(𝔽)

    jest odwzorowaniem liniowym i jest to izomorfizm. Warunek (i) gwarantuje dla k=n, że LL=id.

Definicja 7.2.

Macierz symetryczna i antysymetryczna

Macierz kwadratową AMn×n(𝔽) nazywamy symetryczną, gdy

AT=A.

Powiemy, że A jest skośnie symetryczna (antysymetryczna), gdy

AT=-A.
Wniosek 7.2.

Niech F=C. Dla dowolnej macierzy AMn×n(C) macierz A+AT jest symetryczna, a macierz A-AT jest skośnie symetryczna. W szczególności, każda macierz AMn×n jest sumą macierzy symetrycznej i skośnie symetrycznej:

A=12(A+AT)+12(A-AT).

Podamy teraz geometryczną interpretację rzeczywistej macierzy transponowanej.

Lemat 7.1.

Niech AMn×k(R) oraz BMk×n(R). Następujące warunki są równoważne

  • (i)

    (Ax|y)=(x|By) dla wszystkich xk, yn,

  • (ii)

    B=AT.

Dowód.

Dla x=[x1,,xk]Tk, y=[y1,,yn]Tn mamy

(Ax|y) =i=1kj=1nxiyj(Aei|ej)
=i=1kj=1nxiyj(ai|ej)
=i=1kj=1nxiyjaji
oraz
(x|By) =i=1kj=1nxiyj(ei|Bej)
=i=1kj=1nxiyj(ei|bj)
=i=1kj=1nxiyjbij.

Wynika stąd, że (Ax|y)=(x|By) dla wszystkich xk i yn wtedy i tylko wtedy, gdy bij=aji dla wszystkich i=1,,k oraz j=1,n, czyli gdy B=AT. ∎

Wniosek 7.3.

Dla dowolnej macierzy A=[aij]Mn×n(R) mamy

(Ax|y)=(x|ATy),x,yn.

Ponadto, AMn×n(R) jest symetryczna wtedy i tylko wtedy, gdy

(Ax|y)=(x|Ay),x,yn.

7.2 Iloczyn macierzy

Rozważmy macierze

a=[a11a1k]M1×k(𝔽),b=[b11bk1]Mk×1(𝔽).

Definiujemy iloczyn

(aT|b)=[a11a1k][b11bk1]=a11b11+a12b21++a1kbk1.

Dla macierzy A=[a1ak]Mn×k(𝔽) o wierszach a(1),,a(n)M1×k(F) oraz macierzy (wektora) b=[b1,,bk]TMk×1() przyjmujemy, że

Ab=[(a(1)T|b)(a(n)T|b)]=b1a1++bkakn.
Rysunek 7.1: Macierz mnoży wektor – wersja kolumnowa.
Definicja 7.3.

Iloczyn macierzy

Niech AMk×n(𝔽) i B=[b1bm]Mn×m(𝔽). Definiujemy iloczyn macierzy ABMk×m(𝔽) wzorem

AB:=[Ab1Abm]Mk×m(𝔽).

Z definicji wynika, że jeśli A=[aij]Mk×n(𝔽), B=[bjl]Mn×m(𝔽) i AB=[cil]Mk×m(𝔽), to

cil =(a(i)T|bl)
=ai1b1l++ainbnl
AB =[-w1--w2--wk-][||a1an||]
=[(w1T|a1)(w1T|a2)(w1T|an)(w2T|a1)(w2T|a2)(w2T|an)(wkT|a1)(wkT|a2)(wkT|an)]

Wyraz o numerze ij macierzy AB jest iloczynem skalarnym i-tego wiersza A oraz j-tej kolumny macierzy B.

Rysunek 7.2: Macierz mnoży macierz w wersji kolumnowej.
Przykład 7.1.

Dla macierzy

A=[3-2241-3],B=[-213416]

mamy

AB =[3-2241-3][-213416]
=[3(-2)-2431-2133-262(-2)+4421+4123+461(-2)-3411-3113-36].

Czasami stosuje się poniższą konwencję:

[-213416]B
[3-2241-3]A [-161-312630-14-2-15]AB
Przykład 7.2.

Uzupełnić pozostałe miejsca ?.

[124𝟐𝟔][41𝟒30-1𝟑127𝟓2]=[??????26?]
  • !

    Dla macierzy kwadratowych A,BMn×n() zdefiniowane są obydwa iloczyny AB i BA, ale nie muszą one być równe. Mnożenie macierzy w zbiorze Mn×n() nie jest przemienne dla n2. Przykładowo, dla

    A=[1100],B=[1122],

    mamy

    AB=[1100][1122]=[3300],
    BA=[1122][1100]=[1122].
Lemat 7.2 (Mnożenie macierzy jest łączne).

Załóżmy, że AMm×n(F), BMn×r(F) i CMr×s(F). Wtedy

(AB)C=A(BC)

Dowód.

Z definicji iloczynu macierzy mamy

(AB)C =[ABc1ABcs]
=A[Bc1Bcs]
=A(BC).

Lemat 7.3.

Niech AMk×n(F) i BMn×m(F). Wtedy

LAB=LALB

Dowód.

Wystarczy pokazać, że odwzorowania liniowe LAB oraz LALB:𝔽m𝔽k przyjmują takie same wartości na bazie e1,,em. Mamy

LAB(ei) =ABei=Abi
=LA(bi)=LA(LB(ei))
=(LALB)ei.

Definicja 7.4.

Macierz identycznościowa

Macierz identycznościowa I=In=[δij]Mn×n(𝔽) to macierz o współczynnikach zdefiniowanych symbolem Kroneckera:

δij:={1,gdy i=j,0,gdy ij

Innymi słowy, In=[e1en]. Przykładowo,

I2=[1001],I3=[100010001].
Wniosek 7.4.

Dla dowolnej macierzy AMk×n(F) mamy

IkA=A=AIn.
Definicja 7.5.

Macierz nieosobliwa

Macierz AMn×n(𝔽) jest nieosobliwa (odwracalna) wtedy i tylko wtedy, gdy istnieje taka macierz BMn×n(𝔽), że

BA=AB=In

Macierz B nazywamy wtedy macierzą odwrotną do macierzy A i oznaczamy przez A-1.

  • U

    Jeżeli A jest nieosobliwa, to macierz odwrotna do A jest wyznaczona jednoznacznie. Rzeczywiście, jeśli B i C są odwrotne do A, to

    B=BI=B(AC)=(BA)C=IC=C.
Wniosek 7.5 (Odwrotność iloczynu).

Jeśli A,BMn×n(F) są nieosobliwe, to macierz AB jest nieosobliwa oraz

(AB)-1=B-1A-1.

Dowód.

Sprawdzamy, że

(B-1A-1)(AB) =B-1(A-1A)B
=B-1IB
=B-1B
=I.

Analogicznie pokazujemy, że (AB)(B-1A-1)=I. ∎

Lemat 7.4.

Dla macierzy kwadratowej AMn×n(F) następujące warunki są równoważne:

  • (i)

    A jest nieosobliwa,

  • (ii)

    LA:nxAxn jest izomorfizmem.

Dowód.

Jeśli A jest nieosobliwa, to AA-1=A-1A=I, więc

I=LI=LAA-1=LALA-1,I=LI=LA-1A=LA-1LA,

czyli LA jest izomorfizmem liniowym o odwrotnym LA-1.

Załóżmy, że LA:nn jest izomorfizmem liniowym. Istnieje więc odwzorowanie odwrotne L-1. Definiujemy macierz

B=[L-1e1L-1en].

Wtedy L-1=LB, bo L-1ei=Bei=LB(ei). Ponadto,

I=L-1L=LBLA=LBA,I=LL-1=LALB=LAB,

więc BA=I=AB, czyli A jest nieosobliwa i B=A-1. ∎

Lemat 7.5 (Transpozycja iloczynu).

Dla macierzy A,BMk×n(F) i BMn×k(F) mamy

(AB)T=BTAT.

Dowód.

Porównamy elementy na pozycji il po obu stronach równości. Dla macierzy (AB)T na pozycji il stoi element j=1naljbji. Dla macierz BTAT jest to element j=1nbjialj. ∎

Wprowadzimy jeszcze kilka pojęć związanych z macierzami kwadratowymi.

Definicja 7.6.

Macierz diagonalna

Macierz AMn×n(𝔽) nazywamy diagonalną, jeśli aij=0 dla ij. Będziemy wtedy czasem pisać A=diag(a11,,ann).

Definicja 7.7.

Macierz górnie/dolnie trójkątna

Macierz AMn×n(𝔽) nazywamy górnie trójkątną, gdy aij=0 dla i>j. Analogicznie, A jest dolnie trójkątna, jeśli aij=0 dla i<j.

Przykład 7.3.

Macierz diagonalna, górnie trójkątna i dolnie trójkątna:

[𝐚𝟏𝟏000𝐚𝟐𝟐000𝐚𝟑𝟑]  [𝐚𝟏𝟏𝐚𝟏𝟐𝐚𝟏𝟑0𝐚𝟐𝟐𝐚𝟐𝟑00𝐚𝟑𝟑]  [𝐚𝟏𝟏00𝐚𝟐𝟏𝐚𝟐𝟐0𝐚𝟑𝟏𝐚𝟑𝟐𝐚𝟑𝟑].
  • U

    Macierze górnie trójkątne mają użyteczną charakteryzację geometryczną. Niech e1,,en będzie bazą standardową 𝔽n. Dla i=1,,n rozważamy podprzestrzeń

    Vi=span{e1,,ei}

    generowaną przez pierwszych i wektorów bazowych. Bezpośrednio z definicji, wynika, że macierz A jest górnie trójkątna wtedy i tylko wtedy, gdy dla każdego i=1,,n podprzestrzeń Vi jest niezmiennicza dla A tzn. jeśli vVi, to AvVi. Wynika, to z faktu, że Ae1,,AeiVi dla każdego i dokładnie wtedy, gdy A jest górnie trójkątna.

Wniosek 7.6.

Macierz AMn×n(F) jest diagonalna wtedy i tylko wtedy, gdy A jest dolnie i górnie trójkątna.

Definicja 7.8.

Ślad macierzy

Ślad tr(A) macierzy AMn×n(𝔽) definiujemy jako liczbę

tr(A)=a11++ann

7.3 Rząd i jądro macierzy

Rozważmy macierz AMk×n(𝔽) i skojarzone odwzorowanie liniowe LA(v)=Av dla v𝔽n. Przypomnijmy, że jeśli v=[x1,,xn]T=x1e1++xnen, to

LA(v) =Av
=[a11a12a1nak1ak2akn][x1xn]
=[x1a11++xna1nx1ak1++xnakn]
=x1a1++xnan.

Wynika stąd, że obraz LA(𝔽n) jest generowany przez kolumny macierzy A, czyli

LA(𝔽n)=span{a1,,an}.
Definicja 7.9.

Rząd macierzy

Rząd rankA macierzy A definiujemy jako wymiar obrazu

LA(𝔽n)=span{a1,,an},

czyli rankA jest (maksymalną) liczbą liniowo niezależnych kolumn macierzy A.

Rząd macierzy został wprowadzony w 1878 przez Georga Frobeniusa (1849–1917).

Definicja 7.10.

Jądro macierzy

Jądro kerA macierzy A definiujemy jako jądro odwzorowania LA. Jest to więc zbiór takich wektorów v𝔽n, że Av=0.

Jądro macierzy został wprowadzony w 1884 przez Jamesa Josepha Sylvestera (1814–1887).

Wniosek 7.7 (Formuła wymiaru dla macierzy).

Dla AMk×n(F) mamy

n=dimkerA+rankA.

Wniosek 7.8.

Dla macierzy kwadratowej AMn×n(F) następujące warunki są równoważne

  • (1)

    A jest nieosobliwa,

  • (2)

    kerA={0},

  • (3)

    rankA=n.

W szczególności, macierz AMn×n(F) jest odwracalna wtedy i tylko wtedy, gdy jej kolumny są liniowo niezależne.

Lemat 7.6.

Dla dowolnej macierzy AMk×n(F) maksymalna liczba liniowo niezależnych kolumn macierzy A jest większa bądź równa od maksymalnej liczby liniowo niezależnych wierszy macierzy A. W szczególności,

rankArankAT.
Dowód.

Niech 1rk będzie maksymalną liczbą liniowo niezależnych wierszy macierzy A. Niech v1,,vr będą takimi wierszami A, że wektory v1T,,vrTsą liniowo niezależne. Pokażemy, że Av1T,,AvrT są liniowo niezależne. Przypuśćmy, że

x1Av1T++xrAvrT=0,

dla pewnych skalarów xi𝔽. Wtedy dla v=x1v1T++xrvrT mamy

Av =A(x1v1T++xrvrT)
=x1Av1T++xrAvrT
=0.

Z definicji iloczynu Av oznacza to, że (viT|v)=0 dla i=1,,r. Ponieważ vspan{v1T,,vrT}, więc (v|v)=0. Stąd v=0, czyli x1==xr=0. Oznacza to, że Av1T,,AvrT są liniowo niezależne. Ponieważ należą one do LA(𝔽n), więc z definicji rzędu wynika teza. ∎

Twierdzenie 7.1 (Rząd macierzy transponowanej).

Dla dowolnej macierzy AMk×n(F) zachodzi równość

rankA=rankAT.

Dowód.

Stosujemy Lemat 7.6 do macierzy A i AT. ∎

Wniosek 7.9.

Dla dowolnej macierzy AMk×n(F) maksymalna liczba liniowo niezależnych kolumn jest równa maksymalnej liczbie liniowo niezależnych wierszy.

Przykład 7.4 (Macierze elementarne).

Wprowadzimy teraz pojęcie macierzy elementarnych. Będą to macierze nieosobliwe M, które zastosowane do układu (7.1) skutkują operacjami elementarnymi na wierszach macierzy A. Zrobimy to przykładowo dla k=n=3.

Startujemy z macierzy identycznościowej

I=[100010001].

Macierze elementarne powstają z macierzy I przez zastosowanie do I operacji elementarnych na wierszach macierzy. Będziemy więc mieć do czynienia z trzema typami macierzy elementarnych.

Typ I. Macierze elementarne odpowiadające zamianie miejscami wierszy w macierzy I. Rozważmy przykładowo macierz

E1=[010100001]

powstałą z I przez zamianę pierwszego i drugiego wiersza. Zauważmy, że dla AM3×3() mamy

E1A=[010100001][a11a12a13a21a22a23a31a32a33]=[a21a22a23a11a12a13a31a32a33].
AE1=[a11a12a13a21a22a23a31a32a33][010100001]=[a𝟏𝟐a𝟏𝟏a13a𝟐𝟐a𝟐𝟏a23a𝟑𝟐a𝟑𝟏a33],

czyli iloczyn E1A odpowiada wykonanej operacji na wierszach macierzy I. Iloczyn AE1 permutuje pierwszą i drugą kolumnę.

Typ II. Są to macierze elementarne otrzymane z I przez przemnożenie jej wiersza przez niezerową liczbę rzeczywistą. Przykładowo,

E2=[100010003].

Wtedy

E2A=[10001000𝟑][a11a12a13a21a22a23a31a32a33]=[a11a12a13a21a22a23𝟑a31𝟑a32𝟑a33].
AE2=[a11a12a13a21a22a23a31a32a33][10001000𝟑]=[a12a11𝟑a13a22a21𝟑a23a32a31𝟑a33].

Typ III. Macierze elementarne powstałe z I przez dodanie do pewnego jej wiersza innego wiersza pomnożonego przez liczbę rzeczywistą. Dla przykładu,

E3=[103010001].

Mamy

E3A=[10𝟑010001][a11a12a13a21a22a23a31a32a33]=[a11+𝟑a31a12+𝟑a32a13+𝟑a33a21a22a23a31a32a33].
AE3=[a11a12a13a21a22a23a31a32a33][10𝟑010001]=[a12a11𝟑a11+a13a22a21𝟑a21+a23a32a31𝟑a31+a33].
Wniosek 7.10.

Jeśli E jest macierzą elementarną, to E jest nieosobliwa i E-1 jest macierzą elementarną tego samego typu.

Definicja 7.11.

Macierze wierszowo równoważne

Niech A, BMk×n(𝔽). Powiemy, że A jest wierszowo równoważna z B, jeśli istnieje taki ciąg macierzy elementarnych E1,E2,,Ek, że

B=EkE1A

Jest to relacja równoważności w zbiorze Mk×n(𝔽).

Wniosek 7.11.

Jeśli A, BMk×n(F) są wierszowo równoważne, to rankA=rankB.

Wniosek 7.12.

Macierz AMk×n(F) jest wierszowo równoważna ze swoją postacią schodkową i zredukowaną postacią schodkową otrzymanymi metodą eliminacji Gaussa.

Wniosek 7.13.

Niech AMn×n(R) będzie macierzą kwadratową. Następujące warunki są równoważne:

  • (1)

    A jest nieosobliwa,

  • (2)

    A jest wierszowo równoważna z macierzą identycznościową.

Dowód.

Załóżmy, że zachodzi warunek (1). Wtedy układ Ax=0 ma tylko zerowe rozwiązanie. Stosując metodę eliminacji Gaussa możemy sprowadzić macierz A do postaci schodkowej U. Oczywiście, U jest wierszowo równoważna z A. Jeśli któryś z elementów diagonalnych U jest zerem, to ostatni wiersz macierzy U jest zerowy. Wtedy kerU{0}, więc Ux=0 ma niezerowe rozwiązania. Otrzymujemy sprzeczność, bo Ax=0 i Ux=0 mają takie same zbiory rozwiązań. Macierz U jest więc macierzą górnie trójkątną ze wszystkimi elementami na przekątnej równymi 1. Taka macierz jest oczywiście wierszowo równoważna z macierzą I, bo I jest jej zredukowaną postacią schodkową.

Jeśli zachodzi warunek (2), to istnieje taki ciąg macierzy elementarnych E1,E2,,Ek, że

I=EkE1A.

Stąd A-1=EkE1. ∎

  • U

    W dowodzie powyższym skorzystaliśmy z następującego faktu: jeśli A,BMn×n() są macierzami kwadratowymi i BA=I, to A jest nieosobliwa i A-1=B. Musimy tu być trochę ostrożni. Jak wiemy mnożenie macierzy nie jest przemienne. Potencjalnie mogłoby się więc zdarzyć, że ABI. Pokażemy, że jednak AB=I. Uzasadnimy najpierw, że A jest nieosobliwa. Wystarczy pokazać, że kerA={0}. Jeśli vkerA, to

    v=Iv=BAv=B0=0,

    więc v=0. Istnieje więc macierz odwrotna A-1. Wtedy

    BA=I(BA)A-1=A-1B=B(AA-1)=A-1.
  • U

    Jak wiemy, macierz AMn×n() jest nieosobliwa wtedy i tylko wtedy, gdy A jest wierszowo równoważna z I. Ponadto, A-1=EkE1 dla pewnych macierzy elementarnych. Wynika stąd, że macierz [AI] możemy z pomocą operacji elementarnych sprowadzić do postaci [IA-1]. Pozwala to na wyznaczenie macierzy odwrotnej A-1.

Przykład 7.5.

Znajdziemy macierz odwrotną do macierzy

[143-1-20223]

wykorzystując elementarne operacje na jej wierszach. Tworzymy macierz [AI]. Jeżeli przekształcimy ją w macierz [IB], to wtedy B=A-1. W naszym przypadku

[143100-1-20010223001] [1431000231100-6-3-201]
[143100023110006131]
[14012-32-1202012-12-12006131]
[100-12-121202012-12-12006131]
[100-12-121201014-14-14001161216]

więc

A-1=[-12-121214-14-14161216].
Rysunek 7.3: Przykładowy graf o pięciu wierzchołkach.
Przykład 7.6 (Macierze i grafy).

Teoria grafów pełni bardzo ważną rolę dla zastosowań matematyki. Graf G jest zdefiniowany jako skończony zbiór wierzchołków, czyli pewien n-elementowy zbiór skończony {v1,,vn} oraz zbiór krawędzi, czyli pewien zbiór par wierzchołków. Przykładowo, na Rys. (7.3) przedstawiono graf o pięciu wierzchołkach v1,v2,v3,v4,v5 oraz krawędziach

{v1,v2},{v2,v5},{v3,v4},{v3,v5},{v4,v5}.

Z grafem G o n wierzchołkach możemy skojarzyć pewną macierz A=[aij]Mn×n(), zwaną macierzą połączeń w grafie G. Jest ona zdefiniowana regułą:

aij={1,gdy {vi,vj} jest krawędzią,0,w przeciwnym razie.

Dla grafu z Rys. (7.3) mamy

A=[0100010001000110010101110].

Możemy myśleć o ścieżce w grafie G jako o skończonym ciągu krawędzi od jednego wierzchołka do drugiego. Przykładowo, krawędzie {v1,v2}, {v2,v5} są pewną ścieżką od wierzchołka v1 do v5. Prostym sposobem określenia ścieżki jest jest opisanie ruchu używając wierzchołków. Powyższa ścieżka ma opis

v1v2v5

i ma długość 2. Podobnie,

v5v3v5v3

jest ścieżką długości 3 z v5 do v3.

Niech Ak=[aij(k)]Mn×n. Uzasadnimy, że aij(k) jest liczbą ścieżek długości k z wierzchołka vi do wierzchołka vj. Zastosujemy indukcję względem k. Dla k=1 teza zachodzi z definicji macierzy A. Załóżmy, że teza zachodzi dla pewnej liczby naturalnej m, czyli ail(m) jest liczbą ścieżek długości m z wierzchołka vi do wierzchołka vl. Jeśli istnieje krawędź {vl,vj}, to ail(m)alj=ail(m) jest liczbą ścieżek długości m+1 z vi do vj postaci

v1vlvj.

Ogólna liczba ścieżek długości m+1 z vi do vj jest równa,

ai1(m)a1j++ain(m)anj,

ale ta liczba to aij(m+1) z definicji iloczynu macierzy.

W przypadku grafu z Rys. 7.3 mamy

A3=[0211020114112341132404442].

Przykładowo, liczba ścieżek długości 3 z v3 do v5 jest więc równa a35(3)=4. Zauważmy, że macierz A3 (podobnie jak Ak) jest symetryczna. Odzwierciedla to fakt, że liczba ścieżek długości 3 z vi do vj jest równa liczbie ścieżek długości 3 z vj do vi.

Powyższe rozważania pozostają prawdziwe dla grafów skierowanych w których krawędzie mają kierunek. Oznacza to, że może istnieć krawędź z wierzchołka vi do vj, ale nie koniecznie również z vj do vi. Macierz A nie musi być wtedy symetryczna.

Rysunek 7.4: Graf skierowany opisujący zwycięstwa drużyn w turnieju.
Przykład 7.7.

Pięć reprezentacji siatkarskich: Polska, Brazylia, Stany Zjednoczone, Rosja i Włochy rozgrywają turniej grając mecze każdy z każdym. Chcemy ustalić ranking drużyn w którym liczą się tylko zwycięstwa – nieważne jakim stosunkiem setów. Tworzymy macierz A w której wierszach kodujemy wyniki kolejnych reprezentacji: piszemy 1 jeśli reprezentacja wygrała mecz i 0 jeśli nie wygrała (na przekątnej są zera, bo reprezentacje nie grają ze sobą). Załóżmy, że A ma postać

A=[0101100111100100000100100]

Jest to macierz skojarzona z grafem skierowanym, którego wierzchołkami jest pięć reprezentacji, a krawędzie są zadane zwycięstwami. Przykładowo, z wierzchołka Polska wychodzą krawędzie do wierzchołków Brazylia, Rosja i Włochy. Z kolei, Polska jest końcem krawędzi o początku w wierzchołku Stany Zjednoczone. Przykładowo, pierwszy wiersz oznacza, że Polska wygrała z Brazylią, Rosją i Włochami, a przegrała ze Stanami Zjednoczonymi. Rosja (czwarty wiersz) wygrała tylko z Włochami. Liczbę zwycięstw poszczególnych drużyn otrzymujemy obliczając

[0101100111100100000100100][11111]=[33211].

Oznacza to, że najlepsze w takim rankingu są Polska i Brazylia z trzema zwycięstwami. Następne są Stany Zjednoczone, a ostanie są Rosja i Włochy z jednym zwycięstwem.

Zauważmy, że Polska może argumentować, że jest najlepszą drużyną bo wygrała z Brazylią. Rosja wygrała z Włochami, ale Włochy mogą powiedzieć, że pokonali Stany Zjednoczone, które wygrały z Polską i Rosją. Włochy mają dwa ,,niebezpośrednie’’ zwycięstwa. Spróbujmy więc policzyć zwycięstwa reprezentacji łącznie z ich ,,niebezpośrednimi’’ zwycięstwami. Odpowiada to sumie

[0101100111100100000100100][11111]+[0101100111100100000100100]2[11111]=
[0122310222110220010110110][11111]=[87623].
Rysunek 7.5: Łańcuch Markowa.
Przykład 7.8 (Łańcuchy Markowa).

W badaniach preferencji rynkowych dotyczących dwóch marek pasty do zębów A i B bierze udział 200 osób. Z badań wynika, że każdego miesiąca 70 procent użytkowników marki A używa jej w następnym miesiącu, a 30 procent dokonuje zmiany na markę B. Wśród użytkowników marki B te proporcje są odpowiednio równe 80 i 20 procent. Załóżmy, że na początku było 120 użytkowników marki A i 80 marki B. Zbadamy jak wiele osób będzie używać poszczególnych marek w kolejnych miesiącach. Po miesiącu marki A będzie używać

0.7120+0.280=100

osób, a marki B

0.3120+0.880=100

osób. Rozważmy macierz

A=[0.70.20.30.8].

Wtedy

[0.70.20.30.8][12080]=[100100].

Po n miesiącach liczbę osób otrzymujemy jako wektor

[0.70.20.30.8]n[12080].

Czasami wygodniej zamiast posługiwania się liczbą użytkowników marek 120 i 80 wygodniej jest użyć ich procentowego udziału, czyli zamiast wektora [120,80]T używamy wtedy wektora [0.6,0.4]T. Wtedy

[0.70.20.30.8][0.60.4]=[0.50.5],
[0.70.20.30.8]2[0.60.4]=[0.70.20.30.8][0.50.5]=[0.450.55].
Przykład 7.9 (Macierze Leslie’go).

Pewien gatunek żuka żyje co najwyżej 3 lata. Podzielimy populację jego samic na trzy grupy:

  • młode: wiek 0-1,

  • dojrzałe: wiek 1-2,

  • dorosłe: wiek 2-3.

Młode z prawdopodobieństwem 1/2 staną się dojrzałe, dojrzałe z prawdopodobieństwem 1/4 staną się dorosłymi. Młode nie znoszą jajek, dojrzałe produkują średnio 4 samice, a dorosłe średnio 3 samice. Przypuśćmy, że wśród populacji 100 samic jest 40 młodych, 40 dojrzałych, 20 dorosłych. Spróbujemy przewidzieć populację po 3 latach. Zobaczmy jak populacja będzie wyglądała po roku. Młodych będzie

404+203=220.

Dojrzałych będzie tyle ile młodych, które przetrwały, czyli

400.5=20,

a dorosłych tyle ile dojrzałych które przetrwały, czyli

400.25=10.

Rozważmy macierz

L=[0430.50000.250]

Zauważmy, że

[0430.50000.250][404020]=[2202010]

Możemy ten proces iterować otrzymując po dwóch latach

[0430.50000.250][2202010]=[1101105],

po trzech latach

[0430.50000.250][1101105]=[4555527.5].
  • 𝗧𝗘𝗦𝗧

    Oceń prawdziwość zadań

    • Jeśli macierze A,BM2×2() są nieosobliwe, to macierz A+B jest nieosobliwa i (A+B)-1=A-1+B-1.

    • Dla dowolnych A,BM2×2() zachodzi równość (A-B)2=A2-2AB+B2.

    • Jeśli D1,D2Mn×n() są macierzami diagonalnymi, to D1D2=D2D1.

    • Jeśli AMn×n() i B=3A4-5A3+A2+7A+I, to AB=BA.

    • Jeśli A,BMn×n() są symetryczne, to AB=BA wtedy i tylko wtedy, gdy AB jest symetryczna.

    • Jeśli A=[aij]Mn×n() jest skośnie symetryczna, to a11==ann=0.

    • Iloczyn macierzy górnie trójkątnych jest macierzą górnie trójkątną.

    • Macierz górnie trójkątna jest nieosobliwa wtedy i tylko wtedy, gdy wszystkie jej wyrazy diagonalne aii są niezerowe.

    • Jeśli A,B,C są takimi 2×2-macierzami, że AB=AC, to B=C.

7.4 Układy równań liniowych raz jeszcze

Wniosek 7.14.

Niech A=[a1an]Mk×n(F) i bFk. Następujące warunki są równoważne:

  • (i)

    zbiór rozwiązań układu Ax=b jest niepusty,

  • (ii)

    bspan{a1,,an},

  • (iii)

    rankA=rank[Ab].

Wniosek 7.15.

Niech AMk×n(R). Wektor zerowy 0Fn jest jedynym rozwiązaniem układu jednorodnego Ax=0Fk wtedy i tylko wtedy, gdy wektory a1,,an są liniowo niezależne. Wtedy rank(A)=n oraz kn.

Twierdzenie 7.2.

Niech A=[a1an]Mk×n(F). Następujące warunki są równoważne:

  • (i)

    Dla każdego wektora b𝔽k układ Ax=b ma dokładnie jedno rozwiązanie x𝔽n,

  • (ii)

    k=n i macierz A jest nieosobliwa.

Dowód.

Załóżmy najpierw, że zachodzi warunek (ii). Ustalmy wektor b𝔽k=𝔽n. Mamy pokazać, że istnieje dokładnie jeden taki wektor x𝔽n, że Ax=b. Z warunku (ii) istnieje A-1Mn×n(𝔽). Wtedy dla x=A-1b mamy

Ax=AA-1b=Ib=b,

czyli wektor x=A-1b jest rozwiązaniem układu Ax=b. Takie rozwiązanie jest jedyne, bo jeśli Av=b, to

A-1Av=A-1bv=A-1b.

Niech teraz zachodzi warunek (i). Wystarczy pokazać, że wektory a1,,an są bazą 𝔽k. Zauważmy, że warunek (i) implkuje, że

span{a1,,an}=𝔽k.

Z drugiej strony, stosując (i) do wektora b=0𝔽k otrzymujemy, że wektory a1,,an są liniowo niezależne. Stąd a1,,an tworzą bazę 𝔽k, czyli k=n. ∎

  • U

    Dla A=[a1an]Mk×n(𝔽) i b𝔽k rozważmy ponownie układ

    Ax=b. (7.1)

    Dla macierzy nieosobliwej MMk×k(𝔽) rozważmy układ

    MAx=Mb. (7.2)

    Sprawdzamy łatwo, że układy (7.1) i (7.2) są równoważne tzn. mają równe zbiory rozwiązań. Zamiast więc rozwiązywać układ (7.1) możemy rozwiązać układ (7.2), który przy odpowiednim wyborze macierzy nieosobliwej M może okazać się układem prostszym do analizy.

7.5 Zmiana bazy

Rysunek 7.6: Zmiana bazy. Baza w1=[2,1]T, w2=[1,4]T zadaje nowy układ współrzędnych na płaszczyźnie. Wektor x=[7,7]T ma w bazie standardowej współrzędne x1=7, x2=7, bo w=7e1+7e2. W bazie w1, w2 wektor w ma współrzędne c1=3, c2=1, bo w=3w1+1w2.

7.5.1 Zmiana bazy w 𝔽2

Dla dowolnego wektora x=[x1,x2]T𝔽2 zachodzi równość

x=x1e1+x2e2,

gdzie e1,e2 jest bazą standardową. Skalary x1 i x2 nazywamy współrzędnymi wektora x w bazie standardowej. Możemy to pojęcie uogólnić. Załóżmy, że w1, w2 jest ustaloną bazą 𝔽2. Dla dowolnego wektora w𝔽2 istnieją jednoznacznie wyznaczone takie skalary c1,c2𝔽, że

w=c1w1+c2w2.

Wektor c=[c1,c2]T𝔽2 będziemy nazywali współrzędnymi wektora w w bazie w1, w2.

  • U

    Zwróćcie uwagę, że mówiąc o bazie w1, w2 mamy tu na myśli bazę uporządkowaną tzn. ciąg wektorów (w1,w2). Podając wektor współrzędnych w bazie c=[c1,c2]T istotne jest który wektor bazowy jest pierwszy, a który drugi.

Przykład 7.10.

Rozważmy bazę w1=[2,1]T, w2=[1,4]T w 2. Łatwo sprawdzamy, że dla wektora w=[7,7]T mamy

w=3w1+1w2.

Współrzędne wektora w=[7,7]T w bazie w1,w2 są dane wektorem c=[3,1]T.

Niech w1, w2 będzie dowolną bazą 𝔽2. Zajmiemy się teraz następującymi problemami:

(I) Dla danego wektora x=[x1,x2]T=x1e1+x2e2 (znamy jego współrzędne w bazie standardowej e1, e2) znajdziemy jego współrzędne c=[c1,c2]T w bazie w1, w2. (II) Dla danego wektora c1w1+c2w2 (znamy jego współrzędne w bazie w1, w2) znajdziemy jego współrzędne x=[x1,x2]T w bazie e1, e2.

Zaczniemy od problemu (II) bo jest on łatwiejszy. Załóżmy, że

w1=[a11,a21]T=a11e1+a21e2,w2=[a12,a22]T=a12e1+a22e2.

Znamy więc współrzędne wektorów bazowych w1, w2 w bazie e1, e2. Zauważmy, że

c1w1+c2w2 =(a11c1e1+a21c1e2)+(a12c2e1+a22c2e2)
=(a11c1+a12c2)e1+(a21c1+a22c2)e2.
Wynika stąd, że współrzędne wektora c1w1+c2w2 w bazie standardowej e1, e2 są dane wektorem
x =[a11c1+a12c2,a21c1+a22c2]T
=[a11c1+a12c2a21c1+a22c2]
=[a11a12a21a22][c1c2].

Prowadzi nas to do następującej konkluzji. Jeśli c=[c1,c2]T są współrzędnymi wektora w w bazie w1, w2 oraz x=[x1,x2]T są współrzędnymi wektora w w bazie e1, e2, to

x=Wc,gdzieW=[w1w2]M2×2(𝔽).
Definicja 7.12.

Macierz przejścia do bazy standardowej

Macierz W=[w1w2] nazywamy macierzą przejścia od bazy w1,w2 do bazy standardowej e1,e2.

Możemy teraz łatwo rozwiązać problem (I). Ponieważ macierz W=[w1w2] jest nieosobliwa, więc

c=W-1x.

Przypuśćmy teraz, że mamy dwie dowolne bazy w1,w2 oraz u1,u2 w 𝔽2. Rozważmy wektor

w=c1w1+c2w2=c1*u1+c2*u2.

Znajdziemy związek pomiędzy współrzędnymi c=[c1,c2]T wektora w w bazie w1,w2, a jego współrzędnymi c*=[c1*,c2*]T w bazie u1,u2. Niech [x1,x2]T będą współrzędnymi wektora w w bazie standardowej, czyli w=x1e1+x2e2. Jak wiemy dla macierzy W=[w1w2] oraz U=[u1u2] mamy

Wc=[x1,x2]T=Uc*.

Stąd

c=W-1Uc*,c*=U-1Wc.

Macierz S:=U-1W możemy zinterpretować jeszcze inaczej. Niech S=[s1s2]. Zobaczymy jak wyglądają kolumny s1 i s2 macierzy S. Oczywiście

s1=Se1,s2=Se2.

Dla wektora w=w1 mamy c=e1, bo w1=1w1+0w2, czyli s1=c* są współrzędnymi wektora w1 w bazie u1,u2, więc

w1=s11u1+s21u2.

Analogicznie, w2=s12u1+s22u2, czyli

S=U-1W=[s11s12s21s22].

Nazywamy ją macierzą przejścia od bazy w1,w2 do bazy u1,u2.

7.5.2 Zmiana bazy w 𝔽n

Definicja 7.13.

Współrzędne wektora w bazie

Niech V będzie przestrzenią wektorową wymiaru n (nad ciałem 𝔽) i w1,,wn pewną bazą w V. Dowolny wektor wV możemy jednoznacznie zapisać jako kombinację liniową

w=c1w1++cnwn.

Wektor c=[c1,,cn]T𝔽n nazywamy współrzędnymi wektora w w bazie (uporządkowanej) w1,,wn.

Definicja 7.14.

Macierz przejścia - zmiana bazy

Niech w1,,wn oraz u1,,un będą bazami V. Istnieją jednoznacznie wyznaczone takie skalary sij, że

w1 =s11u1+s21u2++sn1un,
wn =s1nu1+s2nu2++snnun.

Macierz SMn×n(𝔽) daną przez

S=[s1sn]=[s11s12s1ns21s22s2nsn1sn2snn]

nazywamy macierzą przejścia od bazy w1,,wn do bazy u1,,un. Oznacza to, że i-ta kolumna si macierzy S jest wektorem współrzędnych wektora wi w bazie u1,,un.

Lemat 7.7.

Niech c=[c1,,cn]T,c*=[c1*,,cn*]TFn. Równość

c1w1++cnwn=c1*u1++cn*un

zachodzi wtedy i tylko wtedy, gdy c*=Sc.

Dowód.

Zauważmy, że

c1w1++cnwn=(j=1ns1jcj)u1++(j=1nsnjcj)un,

więc teza zachodzi. ∎

Wniosek 7.16.

Macierz przejścia SMn×n(F) jest nieosobliwa.

Dowód.

Wystarczy pokazać, że jedynym rozwiązaniem Sc=0 jest c=0. Jeśli Sc=0, to c*=0, czyli

c1w1++cnwn=0u1++0un=0,

więc c1==cn=0, bo w1,,wn są liniowo niezależne. ∎

Przykład 7.11.

Znajdziemy macierz przejścia od bazy 1, x, x2 dla P2 do bazy 1, 2x, 4x2-2. Wygodnie jest znaleźć najpierw macierz przejścia S od bazy 1, 2x, 4x2-2 do bazy 1, x, x2. Ponieważ

1 =11+0x+0x2
2x =01+2x+0x2
4x2 =-21+0x+4x2

więc

S=[10-2020004].

Macierz przejścia od bazy 1, x, x2 dla P2 do bazy 1, 2x, 4x2-2 jest równa

S-1=[101/201/20001/4].
ZMIANA BAZY: OD DOWOLNEJ DO STANDARDOWEJ Niech v1,,vn będzie bazą 𝔽n. S=[v1vn] jest nieosobliwa. Jeśli v=x1e1++xnen=c1v1++cnvn, to S[c1,,cn]T=[x1,,xn]T,[c1,,cn]T=S-1[x1,,xn]T.
ZMIANA BAZY. PODSUMOWANIE Niech v1,,vn oraz w1,,wn będą bazami 𝔽n. vi=s1iw1++sniwn,i=1,,n. Macierz S=[s1sn],si=[s1i,,sni]T jest nieosobliwa. Jeśli v=x1w1++xnwn=c1v1++cnvn, to S[c1,,cn]T=[x1,,xn]T.
  • 𝗧𝗘𝗦𝗧

    Oceń które ze zdań jest prawdziwe:

    • Transpozycja macierzy górnie trójkątnej jest macierzą górnie trójkątną.

    • Odwrotność nieosobliwej macierzy górnie trójkątnej jest macierzą dolnie trójkątną.

    • Macierz górnie trójkątna i symetryczna jest diagonalna.

    • Jeśli A+B jest górnie trójkątna, to A i B są górnie trójkątne.

    • Jeśli A2 jest symetryczna, to A jest symetryczna.

    • Jeśli A jest nieosobliwa, to ATA i AAT są nieosobliwe.

    • Jeśli A, BMn×n(𝔽) są nieosobliwe, to AB jest nieosobliwa.

    • Jeśli A, BMn×n(𝔽) są nieosobliwe, to A+B jest nieosobliwa.

    • Dla dowolnych n×n macierzy kwadratowych zachodzi A2-B2=(A-B)(A+B).

    • Dla dowolnej macierzy kwadratowej I-A2=(I-A)(I+A).

    • Istnieją takie macierze nieosobliwe, że (AB)-1=A-1B-1.

    • Istnieje taka macierz AM2×2(), że kerA=imA.

    • Istnieje taka macierz AM3×3(), że kerA=imA.