I Algebra liniowa z geometrią 1

Rozdział 10 Wyznacznik

SŁOWA KLUCZOWE ROZDZIAŁU
wyznacznik jako funkcja kolumn permutacje wyznacznik iloczynu wyznacznik macierzy odwrotnej wyznacznik macierzy transponowanej wyznacznik a liniowa niezależność dopełnienie algebraiczne rozwinięcie Laplace’a macierz odwrotna wzory Cramera rozkład Schura orientacja iloczyn wektorowy iloczyn mieszany objętość równoległościanu

10.1 Grupa permutacji

Definicja 10.1.

Permutacja

Rozważmy zbiór skończony {1,,n} dla n. Permutacją zbioru {1,,n} nazywamy dowolną bijekcję

σ:{1,,n}{1,,n}.

Przez Sn oznaczamy zbiór wszystkich permutacji zbioru {1,,n} tzn.

Sn={σ|σ:{1,,n}{1,,n}jest bijekcją}

Ponieważ złożenie bijekcji jest bijekcją, więc składanie odwzorowań określa strukturę grupy w zbiorze Sn. Jej elementem neutralnym jest odwzorowanie identycznościowe id na zbiorze {1,,n}. Elementem odwrotnym do permutacji σ jest odwzorowanie odwrotne do σ (istnieje ono, bo σ jest bijekcją).

Przykład 10.1.

Permutację σ:{1,,n}{1,,n} zapisujemy często w postaci tabeli

σ=(123nσ(1)σ(2)σ(3)σ(n))

Przykładowo,

σ=(1234532415),τ=(1234524531)

są pewnymi permutacjami zbioru 5-elementowego {1,2,3,4,5}. Ich iloczyn jest równy

τσ=(1234554321).

Istnieje bardziej zwarty sposób zapisu permutacji σSn. Pochodzi on od Cauchy’ego. Niech x1,,xr będą różnymi elementami zbioru {1,,n}. W szczególności, 2rn. Przez (x1,,xr) oznaczamy taką permutację z Sn, że

x1x2x3xrx1

oraz

xx,dlax{1,,n}{x1,,xr}.

Permutację (x1,,xr)Sn nazywamy r-cyklem. Jeśli r=2, to 2-cykl nazywamy transpozycją. Dwa cykle z Sn nazywamy rozłącznymi, jeśli nie mają wspólnych wyrazów.

Przykład 10.2.

Dla permutacji

σ=(1234521354),τ=(1234554123)

mamy (opuszczamy w zapisie 1-cykle):

σ=(1,2)(3)(4,5)=(1,2)(4,5),τ=(1,5,3)(2,4).
Przykład 10.3.

Niech σ=(1,2,3)Sn. Wtedy σ-1=(3,2,1), bo

(1,2,3)(3,2,1)=id.

Ponadto, (1,2,3)3=(1,2,3)(1,2,3)(1,2,3)=id oraz 3 jest najmniejszą taką liczbą naturalną n, że (1,2,3)n=id.

  • U

    Jeśli n>2, to grupa (Sn,) nie jest abelowa. Przykładowo,

    (2,3)(1,2)=(123312)=(1,3,2)

    oraz

    (1,2)(2,3)=(123231)=(1,2,3).

Dla σSn definiujemy zbiór

σ*={i{1,,n}:σ(i)i}.

Zauważmy, że jeśli iσ*, to σ(i)σ*. Jeśli σ=(x1,,xr)Sn jest cyklem, to σ*={x1,,xr}. Cykle σ i τrozłączne, gdy σ*τ*=.

Lemat 10.1.

Jeśli σ,τSn i σ*τ*=, to στ=τσ.

Dowód.

Niech i{1,,n} będzie ustalone. Sprawdzimy, że στ(i)=τσ(i). Ponieważ cykle τ i σ są rozłączne, więc mamy trzy możliwości:

  • (1)

    τ(i)=i=σ(i),

  • (2)

    τ(i)i oraz σ(i)=i,

  • (3)

    σ(i)i oraz τ(i)=i.

Przypadek (1) jest oczywisty, a (2) i (3) są symetryczne, więc można założyć, że zachodzi (2). Ponieważ cykle są rozłączne, więc również σ(τ(i))=τ(i), czyli teza zachodzi. ∎

Lemat 10.2.

Każda permutacja σSn{id} jest iloczynem rozłącznych cykli. Taki rozkład jest jednoznaczny z dokładnością do kolejności czynników.

Dowód.

Jeśli σ*=, to σ=id=(1)(2)(n), więc teza zachodzi. Niech σ* i sσ*. Rozważmy zbiór

{σk(s):k}.

Ponieważ jest on skończony, więc σi(s)=σj(s) dla pewnych liczb naturalnych i<j. Wtedy σj-i(s)=s. Istnieje więc najmniejsza liczba naturalna l2 taka, że σl(s)=s. Wtedy liczby s,,σl-1(s) są różne z definicji l oraz τ=(s,σ(s),,σl-1(s)) jest l-cyklem. Dla ρ=στ-1 mamy σ=ρτ oraz ρ nie rusza punktów s,σ(s),,σl-1(s). Stosujemy teraz powyższą procedurę do ρ. Zauważmy, że ρ* jest istotnym podzbiorem σ*, więc procedura skończy się po skończonej liczbie kroków, bo σ* jest zbiorem skończonym. Dowodzi to rozkładu σ na rozłączne cykle.

Przypuśćmy, że

σ=σ1σk=τ1τl

są dwoma rozkładami σ na rozłączne cykle. Przypuśćmy, że σ1(i)=ji. Wtedy również τp(i)i dla pewnego p. Z rozłączności cykli mamy τp(i)=j=σ1(i). Rozważmy teraz σ1(j). Z tych samych względów mamy τp(j)=σ1(j). Kontynuując dostajemy, że σ1=τp i teza wynika poprzez indukcję. ∎

Lemat 10.3.

Dowolną permutację σSn można przedstawić jako złożenie skończonej liczby transpozycji. Ponadto, jeśli σ jest złożeniem parzystej liczby pewnych transpozycji, to każde jej przedstawienie jako złożenie transpozycji (nie jest ono jednoznacznie wyznaczone) składa się z parzystej liczby transpozycji. Takie permutacje σ nazywamy parzystymi. Jeśli σ jest złożeniem nieparzystej liczby transpozycji, to nazywamy ją nieparzystą.

Dowód.

Wiemy, że σ możemy rozłożyć na iloczyn rozłącznych cykli. Każdy cykl (a1,,ak) jest iloczynem transpozycji, bo

(a1,,ak)=(a1,ak)(a1,a2).

Przypuśćmy, że mamy dwa rozkłady σ na iloczyny transpozycji:

σ=τ1τr=ρ1ρp.

Pokażemy, że rp(mod2). Ponieważ

id=τ1τrρp-1ρ1-1,

więc wystarczy pokazać, że id może być iloczynem tylko parzystej liczby transpozycji. Przypuśćmy, że

id=(a1b1)(a2b2)(akbk) (10.1)

gdzie k1 oraz aibi dla i=1,,k. Pokażemy, że k jest parzyste. Zauważmy, że nie może być k=1, bo id(a1,b1). Dla k=2 teza zachodzi. Załóżmy, że k3 i teza zachodzi dla wszystkich iloczynów mniejszej liczby transpozycji. Jedna z transpozycji (aibi) dla i{2,,k} musi ruszać a1, bo inaczej (10.1) nie może zachodzić. Stąd a1 musi być jednym z ai dla pewnego i2 (zmieniając ewentualnie rolami ai z bi). Zauważmy, że jeśli różne litery oznaczają różne liczby to zachodzą równości

(cd)(ab)=(ab)(cd),(bc)(ab)=(ab)(bc),

więc możemy założyć, że a2=a1.

Jeśli b2=b1, to iloczyn (a1b1)(a1b2) jest identycznością i możemy go pominąć otrzymując id jako iloczyn k-2 transpozycji. Z założenia indukcyjnego k-2 jest parzyste, więc k jest parzyste.

Jeśli b2b1, to iloczyn (a1b1)(a1b2) jest równy (a1b2)(b1b2), czyli (10.1) przyjmuje postać

id=(a1b2)(b1b2)(akbk). (10.2)

Zauważmy, że w formule (10.2) jest mniej transpozycji które ruszają a1 niż w (10.1). Rozumujemy teraz analogicznie. Pewna transpozycja w iloczynie (10.2) inna niż (a1b1) musi ruszać a1. Mamy znowu dwie możliwości albo możemy zredukować liczbę transpozycji o 2 i zastosować indukcję albo możemy zmniejszyć o 1 liczbę transpozycji ruszających a1 w formule (10.2). Ponieważ id nie może być iloczynem transpozycji w którym tylko jedna rusza a1, więc w skończonej liczbie kroków musi zajść sytuacja, że iloczyn pierwszych dwóch transpozycji będzie identycznością, więc teza wynika poprzez indukcję. ∎

Przykład 10.4.

Rozważmy permutację

σ=(123456156432)S6.

Powyższy napis oznacza, że

σ(1)=1,σ(2)=5,σ(3)=6,σ(4)=4,σ(5)=3,σ(6)=2.

Sprawdzamy łatwo, że

σ =(2,6)(2,3)(2,5)
=(5,2)(3,5)(6,3)
=(1,3)(3,1)(2,6)(2,3)(2,5).

Widzimy, że przedstawienie permutacji σ jako złożenie transpozycji nie jest jednoznaczne, ale parzystość liczby transpozycji w przedstawieniu nie zmienia się. Permutacja σ jest nieparzysta.

Definicja 10.2.

Znak permutacji

Znak permutacji σSn definiujemy jako liczbę:

sgn(σ)={1,gdy σ jest parzysta,-1,gdy σ jest nieparzysta. 

Sprawdzamy łatwo, że

sgn(στ)=sgn(σ)sgn(τ),sgn(σ-1)=sgn(σ).

10.2 Definicja wyznacznika i jego własności

Pojęcie wyznacznika pojawiło się pod koniec XVII wieku w pracach Gottfrieda Wilhelma Leibnitza oraz japońskiego matematyka Seki Kova znanego również jako Takakazu (1642–1708). Systematyczna teoria wyznacznika pochodzi od Cauchy’ego (1789–1857) oraz Jacobiego (1804–1851).

Dla macierzy kwadratowej AM2×2(𝔽) zdefiniowaliśmy wyznacznik wzorem

det(A)=a11a22-a12a21.
Wniosek 10.1.

Dla dowolnych wektorów u,v,wF2 i liczb rzeczywistych a,bF zachodzą warunki:

  • (1)

    dwuliniowość wyznacznika jako funkcji kolumn macierzy

    (i)det[au+bvw]=adet[uw]+bdet[vw],
    (ii)det[uav+bw]=adet[uv]+bdet[uw];
  • (2)
    det[uu]=0,
  • (3)

    detI2=1.

Dowód.

Wystarczy przeprowadzić bezpośredni rachunek. Uzasadnimy dla przykładu warunek (1). Niech u=[u1,u2]T, v=[v1,v2]t oraz w=[w1,w2]T. Wtedy

[au+bvw]=[au1+bv1w1au2+bv2w2],

więc

det[au+bvw] =(au1+bv1)w2-(au2+bv2)w1
=a(u1w2-u2w1)+b(v1w2-v2w1)
=adet[uw]+bdet[vw].

  • U

    Pokażemy, że każde odwzorowanie F:M2×2(𝔽)𝔽 spełniające warunki (1)-(3) musi być dane wzorem:

    F(A)=a11a22-a12a21.

    Oznacza to, że wyznacznik jest jednoznacznie wyznaczony przez warunki (1)-(3) i musi być zadany powyższym wzorem.

    Lemat 10.4.

    Jeśli F:M2×2(F)F spełnia warunki (1)-(2), to dla dowolnych macierzy A,BM2×2(F) zachodzi wzór

    F(AB)=F(A)(b11b22-b12b21). (10.3)
    Dowód.

    Niech

    A=[a1a2]=[a11a12a21a22],B=[b11b12b21b22].

    Wtedy

    AB =[a11b11+a12b21a11b12+a12b22a21b11+a22b21a21b12+a22b22]
    =[b11a1+b21a2b12a1+b22a2].

    Z warunku (1) zastosowanego dwukrotnie mamy

    F(AB) =F(b11a1+b21a2,b12a1+b22a2)
    =b11F(a1,b12a1+b22a2)+b21F(a2,b12a1+b22a2)
    =b11b12F(a1,a1)+b11b22F(a1,a2)
    +b21b12F(a2,a1)+b21b22F(a2,a2).

    Z warunku (2) wynika, że F(v,v)=0 dla dowolnego wektora v𝔽2 oraz

    F(a2,a1)=-F(a1,a2).

    Stąd

    F(AB) =F(a1,a2)(b11b22-b12b21)
    =F(A)(b11b22-b12b21).

    Twierdzenie 10.1.

    Istnieje dokładnie jedno odwzorowanie F:M2×2(F)F spełniające warunki (1)-(3). Ponadto,

    F(B)=b11b22-b12b21,BM2×2(𝔽).
    Dowód.

    Przyjmując A=I w Lemacie 10.4 i korzystając z warunku (3) otrzymujemy, że dla dowolnej macierzy BM2×2(𝔽) mamy

    F(B) =F(IB)
    =F(I)(b11b22-b12b21)
    =b11b22-b12b21,

    co kończy dowód. ∎

    Uogólnimy ten rezultat na dowolny wymiar i zdefiniujemy wyznacznik dowolnej macierzy kwadratowej AMn×n(𝔽). Będziemy w tym celu potrzebowali pewnych faktów dotyczących permutacji zbiorów skończonych.

Będziemy potrzebowali jeszcze jednego pojęcia. Odwzorowanie

F:Mn×n(𝔽)𝔽

będziemy traktowali jako funkcję zależną od n kolumn macierzy A=[a1an]Mn×n(𝔽), czyli F=F(a1,,an) jest funkcją zależną od n wektorów.

Definicja 10.3.

Odwzorowanie n-liniowe

Odwzorowanie F:Mn×n(𝔽)𝔽 nazywamy n-liniowym, jeśli jest ono liniowe ze względu na każdą zmienną. Oznacza to, że dla dowolnie ustalonego i{1,,n} oraz wektorów ai,bi𝔽n i skalarów α,β𝔽 zachodzi równość

F(a1,,αai+βbii,an)=αF(a1,,aii,an)+βF(a1,,bii,an).
Przykład 10.5.

Iloczyn skalarny

n×n(x,y)(x|y)𝔽

jest odwzorowaniem dwuliniowym.

Twierdzenie 10.2 (Definicja wyznacznika).

Istnieje dokładnie jedno odwzorowanie

F:Mn×n(𝔽)𝔽

spełniające warunki

  • (1)

    F jest n-liniowe (jako funkcja kolumn macierzy AMn×n(𝔽)),

  • (2)

    jeśli A ma dwie identyczne kolumny tzn., ai=aj dla pewnych ij, to F(A)=0,

  • (3)

    F(I)=1.

Ponadto, dla dowolnej macierzy B=[bij]Mn×n(F) zachodzi

F(B)=σSnsgn(σ)bσ(1)1bσ(n)n. (10.4)

Nazywamy ją wyznacznikiem i oznaczamy przez det. Czasami będziemy również stosować oznaczenie |B|:=detB.

  • U

    Z warunków (1) i (2) wynika, że jeśli c𝔽 oraz ij, to

    F(a1,,ai+caj,,an)=F(a1,,ai,,an).
Wniosek 10.2.

Jeśli F spełnia warunki (1)-(2), to (2’) F jest antysymetryczne tzn. jeśli ij, to F(a1,,aii,,ajj,an)=-F(a1,,aji,,aij,an).

Dowód.

Niech ij. Wtedy z warunków (1)-(2) mamy

0 =F(a1,,ai+aji,,ai+ajj,an)
=F(a1,,aii,,aij,an)+F(a1,,aii,,ajj,an)
+F(a1,,aji,,aij,an)+F(a1,,aji,,ajj,an)
=F(a1,,aii,,ajj,an)+F(a1,,aji,,aij,an).

  • U

    Jeśli F spełnia (2’), to

    F(a1,,aii,,aij,an)=-F(a1,,aii,,aij,an),

    więc jeśli 𝔽 jest takim ciałem, że 1+10, to warunek (2’) implikuje (2).

  • U

    Jeśli F spełnia (1) oraz F(A)=0 dla macierzy które mają takie same dwie sąsiadujące kolumny, to F spełnia (2). Rzeczywiście, z dowodu Wniosku 10.2 wynika wtedy, że F zmienia znak, gdy zmienimy miejscami dwie sąsiadujące kolumny.

Przykład 10.6.

Załóżmy, że n=2. Wtedy S2 składa się z dwóch permutacji: id (parzysta) oraz transpozycji (12) (nieparzysta). Wynika stąd, że dla BM2×2(𝔽) mamy

det(B)=F(B)=b11b22-b12b21.
Przykład 10.7.

Zobaczmy jakie są konsekwencje warunków (1)-(2) dla n=3. Rozważmy macierz A=[a1a2a3]M3×3(𝔽) oraz

B=[b11b12b13b21b22b23b31b32b33].

Wtedy

AB=[b11a1+b21a2+b31a3b12a1+b22a2+b32a3b13a1+b23a2+b33a3].

Z warunku (1) tzn. 3-liniowości F i warunku (2) otrzymujemy, że

F(AB) =b11b12b13F(a1,a1,a1)=0+b11b12b23F(a1,a1,a2)=0+b11b12b33F(a1,a1,a3)=0
+b11b22b13F(a1,a2,a1)=0+b11b22b23F(a1,a2,a2)=0+b11b22b33F(a1,a2,a3)
+b11b32b13F(a1,a3,a1)=0+b11b32b23F(a1,a3,a2)+b11b32b33F(a1,a3,a3)=0
+b21b12b13F(a2,a1,a1)=0+b21b12b23F(a2,a1,a2)=0+b21b12b33F(a2,a1,a3)
+b21b22b13F(a2,a2,a1)=0+b21b22b23F(a2,a2,a2)=0+b21b22b33F(a2,a2,a3)=0
+b21b32b13F(a2,a3,a1)+b21b32b23F(a2,a3,a2)=0+b21b32b33F(a2,a3,a3)=0
+b31b12b13F(a3,a1,a1)=0+b31b12b23F(a3,a1,a2)+b31b12b33F(a3,a1,a3)=0
+b31b22b13F(a3,a2,a1)+b31b22b23F(a3,a2,a2)=0+b31b22b33F(a3,a2,a3)=0
+b31b32b13F(a3,a3,a1)=0+b31b32b23F(a3,a3,a2)=0+b31b32b33F(a3,a3,a3)=0

W efekcie

F(AB) =b11b22b33F(a1,a2,a3)+b11b32b23F(a1,a3,a2)
+b21b12b33F(a2,a1,a3)+b21b32b13F(a2,a3,a1)
+b31b12b23F(a3,a1,a2)+b31b22b13F(a3,a2,a1).

Z warunku (2) tzn. antysymetryczności F otrzymujemy, że

F(AB) =b11b22b33F(a1,a2,a3)-b11b32b23F(a1,a2,a3)
-b21b12b33F(a1,a2,a3)+b21b32b13F(a1,a2,a3)
+b31b12b23F(a1,a2,a3)-b31b22b13F(a1,a2,a3).

Wzór na F(AB) możemy zapisać w bardziej zwartej formie korzystając z grupy permutacji S3. Składa się ona z 3!=6 permutacji:

S3={id,(12),(13),(23),(123),(132)}.

Transpozycje są nieparzyste, a permutacje id=(12)(21), (123)=(13)(12) i (132)=(12)(13) są parzyste. Stąd

F(AB) =sgnidb11b22b33F(a1,a2,a3)+sgn(23)b11b32b23F(a1,a2,a3)
+sgn(12)b21b12b33F(a1,a2,a3)+sgn(123)b21b32b13F(a1,a2,a3)
+sgn(132)b31b12b23F(a1,a2,a3)+sgn(13)b31b22b13F(a1,a2,a3)
=(σS3sgn(σ)bσ(1)1bσ(2)2bσ(3)3)F(A).

Z warunku (3) dla A=I mamy

F(B)=σS3sgn(σ)bσ(1)1bσ(2)2bσ(3)3.
Lemat 10.5.

Załóżmy, że F:Mn×n(F)F spełnia warunki (1)-(2). Dla dowolnych A,BMn×n(F) mamy

F(AB)=F(A)(σSnsgn(σ)bσ(1)1bσ(n)n).
Dowód.

Niech A=[a1an] i B=[bij]. Dla AB=[c1cn], z definicji iloczynu macierzy wynika, że

ck=i=1nbikai=b1ka1++bnkan.

Z warunku (1) wynika, że

F(AB) =i1,,in=1nF(bi11ai1,,binnain)
=i1,,in=1nbi11binnF(ai1,,ain).

Użyjemy teraz warunku (2). Wynika z niego, że jeśli ik=ij dla pewnych kj, to F(ai1,,ain)=0. Stąd zamiast sumy

i1,,in=1nbi11binnF(ai1,,ain)

możemy rozważać sumę

σSnbσ(1)1bσ(n)nF(aσ(1),,aσ(n)).

Teraz wystarczy tylko zauważyć, że warunek (2) gwarantuje, że

F(aσ(1),,aσ(n))=sgn(σ)F(a1,,an).

Dowód.

Dowód Twierdzenia 10.2: Stosujemy Lemat 10.5 dla A=I i warunek (3) otrzymując, że dla dowolnej macierzy BMn×n(𝔽) zachodzi

F(B)=σSnsgn(σ)bσ(1)1bσ(n)n

co dowodzi jednoznaczności funkcji F spełniającej (1)-(3). Dla dowodu istnienia, definiujemy odwzorowanie F wzorem (10.4). Sprawdzamy łatwo, że tak określone odwzorowanie F spełnia warunki (1) i (3). Uzasadnimy, że zachodzi również warunek (2). Załóżmy, że dwie kolumny macierzy B są równe tzn. bj=bk dla pewnych jk. Wtedy

F(B)=σAnbσ(1)1bσ(n)n-σAnbστ(1)1bστ(n)n,

więc wystarczy pokazać, że dla σAn mamy

bσ(1)1bσ(n)n=bστ(1)1bστ(n)n.

Jeśli i{j,k}, to στ(i)=σ(i), więc bσ(i)i=bστ(i)i. Ponadto, ponieważ bj=bk, więc

bστ(j)j=bσ(k)j=bσ(k)k,

oraz

bστ(k)k=bσ(j)k=bσ(j)j,

co kończy dowód. ∎

Wniosek 10.3 (Wyznacznik iloczynu macierzy).

Dla dowolnych macierzy A,BMn×n(F) zachodzi wzór Cauchy’ego

det(AB)=det(A)det(B).

W szczególności, jeśli A jest nieosobliwa, to

det(A-1)=1det(A).
Lemat 10.6.

Niech AMn×n(F). Kolumny macierzy A są liniowo zależne wtedy i tylko wtedy, gdy det(A)=0.

Dowód.

Jeśli kolumny A są liniowo zależne, to z warunków (1) i (2) wynika, że det(A) jest równy wyznacznikowi macierzy z pewną kolumną zerową, więc det(A)=0. Załóżmy, że det(A)=0 i przypuśćmy, że kolumny macierzy A są liniowo niezależne. Wtedy kerA={0}, czyli A jest nieosobliwa. Istnieje więc taka macierz BMn×n(𝔽), że I=AB. Wtedy

1=det(I)=det(A)det(B)=0,

co prowadzi do sprzeczności. ∎

Przykład 10.8.

Uzasadnimy, że

|sinαcosαsin(α+δ)sinβcosβsin(β+δ)sinγcosγsin(γ+δ)|=0.

Ponieważ

sin(x+δ)=sinxcosδ+cosxsinδ,

więc trzecia kolumna jest kombinacją liniową dwóch pierwszych kolumn.

Wniosek 10.4.

Niech AMn×n(F). Kolumny macierzy A są liniowo niezależne wtedy i tylko wtedy, gdy det(A)0. W szczególności, A jest nieosobliwa wtedy i tylko wtedy, gdy detA0.

Twierdzenie 10.3 (Wyznacznik transpozycji macierzy).

Dla dowolnej macierzy AMn×n(F) mamy

det(AT)=det(A)

Dowód.

Z definicji wyznacznika i macierzy transponowanej wystarczy zaobserwować, że

σSnsgn(σ)aσ(1)1aσ(n)n=σSnsgn(σ)a1σ(1)anσ(n).

Niech σ-1 będzie permutacją odwrotną do σ. Wtedy sgn(σ)=sgn(σ-1) oraz

aσ(1)1aσ(n)n =aσ(1)σ-1(σ(1))aσ(n)σ-1(σ(n))
=a1σ-1(1)anσ-1(n),

co kończy dowód. ∎

Wniosek 10.5.

Kolumny (wiersze) macierzy kwadratowej A są liniowo zależne wtedy i tylko wtedy, gdy det(A)=0.

Definicja 10.4.

Dopełnienie algebraiczne wyrazu macierzy

Dla macierzy AMn×n(𝔽) oraz i,j{1,,n} definiujemy macierz

A(i,j)M(n-1)×(n-1)(𝔽)

otrzymaną z macierzy A przez wykreślenie i-tego wiersza oraz j-tej kolumny. Dopełnieniem algebraicznym wyrazu aij nazywamy liczbę

Aij=(-1)i+jdetA(i,j).

Przykład 10.9.

Rozważmy macierz

A=[a11a12a13a21a22a23a31a32a33]M3×3().

Przykładowo, dla i=2 oraz j=3 w macierzy

[a11a12𝐚𝟏𝟑𝐚𝟐𝟏𝐚𝟐𝟐𝐚𝟐𝟑a31a32𝐚𝟑𝟑]

wykreślamy drugi wiersz i trzecią kolumnę otrzymując macierz

A(2,3)=[a11a12a31a32].

Znaki (-1)i+j w zależności od pozycji wyrazu aij mają następujący rozkład

[+-+-+-+-+].
Twierdzenie 10.4 (Rozwinięcie względem pierwszego wiersza).

Załóżmy, że AM3×3(F). Wtedy

det(A) =i=13a1iA1i=a11A11+a12A12+a13A13
=a11|a22a23a32a33|-a12|a21a23a31a33|+a13|a21a22a31a32|.
Dowód.

Wystarczy sprawdzić, że odwzorowanie F:M3×3(𝔽)𝔽 zdefiniowane dla macierzy A=[a1a2a3] wzorem

F(A)=a11|a22a23a32a33|-a12|a21a23a31a33|+a13|a21a22a31a32|

spełnia warunki (1)-(3) z Twierdzenia 10.2. Są one łatwe do weryfikacji bezpośrednim rachunkiem. W warunku (1) sprawdzimy przykładowo liniowość F względem pierwszej zmiennej. Dla b1=[b11,b21,b31]T mamy

F(a1+b1,a2,a3) =(a11+b11)|a22a23a32a33|-a12|a21+b21a23a31+b31a33|+a13|a21+b21a22a31+b31a32|
=a11|a22a23a32a33|-a12|a21a23a31a33|+a13|a21a22a31a32|
+b11|a22a23a32a33|-a12|b21a23b31a33|+a13|b21a22b31a32|
=F(a1,a2,a3)+F(b1,a2,a3).

Dla c𝔽 mamy

F(ca1,a2,a3) =ca11|a22a23a32a33|-a12|ca21a23ca31a33|+a13|ca21a22ca31a32|
=ca11|a22a23a32a33|-ca12|a21a23a31a33|+ca13|a21a22a31a32|
=cF(a1,a2,a3).

Dla sprawdzenia warunku (2) zobaczmy przykładowo co się stanie, gdy z pierwsza i trzecia kolumna są identyczne. Mamy

F(a1,a2,a1)=a11|a22a21a32a31|-a12|a21a21a31a31|+a11|a21a22a31a32|=0.

Warunek (3) zachodzi, bo

F(I)=1|1001|-0|0001|+0|0100|=1.

  • U

    Analogiczny jak w Twierdzeniu 10.4 wzór na wyznacznik zachodzi dla rozwinięcia względem dowolnego wiersza i dowolnej kolumny. Dowód jest ideologicznie taki sam jak dowód Twierdzenia 10.4. Przykładowo, dla rozwinięcia względem drugiej kolumny przyjmuje on postać

    det(A)=-a12|a21a23a31a33|+a22|a11a13a31a33|-a32|a11a13a21a23|.

    Analogiczne rozumowanie prowadzi nas do wzoru na wyznacznik dla macierzy n×n dla dowolnego n. Pozwala on zredukowć wyznaczenie wyznacznika macierzy AMn×n(𝔽) do obliczenia n wyznaczników macierzy o rozmiarze (n-1)×(n-1).

Wniosek 10.6 (Rozwinięcie Laplace’a).

Niech AMn×n(F) z n2. Dla dowolnych i=1,,n i j=1,,n zachodzą równości

det(A)=ai1Ai1++ainAin=a1jA1j++anjAnj. (10.5)
Dowód.

Ponieważ det(A)=det(AT), więc wystarczy udowodnić, że

det(A)=ai1Ai1++ainAin,

czyli zachodzi wzór na rozwinięcie Laplace’a względem i-tego wiersza. Wystarczy sprawdzić, że funkcja F(A)=ai1Ai1++ainAin spełnia warunki (1)-(3). Warunki (1) i (3) są łatwe do sprawdzenia. Dla dowodu (2) wystarczy zauważyć, że F(A)=0, gdy A ma dwie sąsiadujące kolumny identyczne. ∎

  • U

    Stosując wzór Laplace’a mamy swobodę wyboru wiersza lub kolumny względem której zastosujemy rozwinięcie. Oczywiście korzystnie jest wybrać kolumnę (wiersz) z największą liczbą zer. Zanim zastosujemy wzór Lapalce’a możemy najpierw użyć operacji na kolumnach (wierszach) nie zmieniających wyznacznika, aby wprowadzić możliwie dużo wyrazów zerowych w danej kolumnie (wierszu). Możemy więc, do ustalonej kolumny (wiersza) dodać kombinację liniową innych kolumn (wierszy).

Przykład 10.10.

Odejmując pierwszy wiersz od pozostałych wierszy i stosując rozwinięcie względem pierwszej kolumny mamy:

|1aa21bb21cc2| =|1aa20b-ab2-a20c-ac2-a2|
=|b-ab2-a2c-ac2-a2|
=(b-a)(c2-a2)-(c-a)(b2-a2)
=(b-a)(c-a)(c-b)
Wniosek 10.7 (Własności wyznacznika).
  • (i)

    Jeśli A ma dwa identyczne wiersze (kolumny), to det(A)=0.

  • (ii)

    Jeśli A ma zerowy wiersz (kolumnę), to det(A)=0.

  • (iii)

    A jest nieosobliwa wtedy i tylko wtedy, gdy det(A)0 wtedy i tylko wtedy, gdy kolumny (wiersze) A są liniowo niezależne.

  • (iv)

    Jeśli A jest górnie (dolnie) trójkątna, to

    det(A)=a11a22ann.
  • (v)

    Jeśli σSn, to

    det[aσ(1)||aσ(n)]=sgn(σ)det[a1||an].
  • (vi)

    Jeśli S jest nieosobliwa, to

    det(A)=det(S-1AS).
Przykład 10.11.

Rozważmy macierz Vandermonde’a

A=[1aa2a31bb2b31cc2c31dd2d3].

Uzasadnimy formułę rekurencyjną

|1aa2a31bb2b31cc2c31dd2d3|=(b-a)(c-a)(d-a)|1bb21cc21dd2|

łączącą wyznacznik macierzy Vandermonde’a rozmiaru 4 z wyznacznikiem macierzy Vandermonde’a rozmiaru 3. W tym celu stosujemy najpierw operacje nie zmieniające wyznacznika, aby wprowadzić zerowe wyrazy w pierwszym wierszu macierzy A:

[1aa2a31bb2b31cc2c31dd2d3] [1aa201bb2b2(b-a)1cc2c2(c-a)1dd2d2(d-a)]operacjak4-ak3
[1a001bb(b-a)b2(b-a)1cc(c-a)c2(c-a)1dd(d-a)d2(d-a)]operacjak3-ak2
[10001b-ab(b-a)b2(b-a)1c-ac(c-a)c2(c-a)1d-ad(d-a)d2(d-a)]operacjak2-ak1.

Z rozwinięcia Lapalce’a względem pierwszego wiersza mamy

|1aa2a31bb2b31cc2c31dd2d3| =|b-ab(b-a)b2(b-a)c-ac(c-a)c2(c-a)d-ad(d-a)d2(d-a)|
=(b-a)(c-a)(d-a)|1bb21cc21dd2|.
Przykład 10.12.

Niech

Δn=|a0000b0a00b000ab0000ba000b00a0b0000a|

będzie wyznacznikiem powyższej macierzy rozmiaru 2n. Przykładowo,

Δ1=|abba|=a2-b2,
Δ2 =|a00b0ab00ba0b00a|
=a|ab0ba000a|-b|00bab0ba0|
=a2Δ1-b2Δ1=(a2-b2)Δ1
=(a2-b2)2.

Stosując rozwinięcie względem pierwszej kolumny i dokonując dalszej redukcji otrzymujemy, że

Δn =a|a00b00ab000ba00b00a00000a|-b|0000ba00b00ab000ba00b00a0|
=a2Δn-1-b2Δn-1=(a2-b2)Δn-1.

Indukcyjnie dostajemy, że Δn=(a2-b2)n.

Przykład 10.13.

Odejmując ostatni wiersz od pozostałych wierszy otrzymujemy, że

|1-n111111-n111111-n111111-n111111-n| =|-n000n0-n00n00-n0n000-nn11111-n|
=nn-1|-100010-100100-101000-1111111-n|
=nn-1|-100010-100100-101000-1100000|=0.
Przykład 10.14.

Pokażemy, że

|1234561334561254561237561234961234511|=5!=120.

Dla j=2,3,4,5,6 od j-tej kolumny odejmujemy pierwszą kolumnę pomnożoną przez j otrzymując macierz dolnie trójkątną:

|1234561334561254561237561234961234511|=|100000110000102000100300100040100005|=5!.
Wniosek 10.8.

Dla dowolnej macierzy AMn×n(F) zachodzi równość

ai1Aj1++ainAjn={det(A),gdy i=j,0,gdy ij (10.6)
Dowód.

Dla i=j jest to równość (10.5). Załóżmy, że ij. Niech A* będzie macierzą powstałą z macierzy A poprzez wstawienie w miejsce j-tego wiersza i-tego wiersza macierzy A. Wtedy det(A*)=0, bo A* ma dwa takie same wiersze. Ze wzoru (10.5) wynika, że

0=det(A*)=ai1Aj1++ainAjn.

Definicja 10.5.

Dla macierzy AMn×n(𝔽) definiujemy macierz dołączoną adjAMn×n(𝔽) jako macierz

adjA=[A11A21An1A12A22An2A1nA2nAnn].
Wniosek 10.9 (Macierz odwrotna).

Jeśli macierz AMn×n(F) jest nieosobliwa, to

A-1=1det(A)adjA. (10.7)
Dowód.

Ze wzoru (10.6) wynika, że

A(adjA) =[a11a12a1na21a22a2nan1an2ann][A11A21An1A12A22An2A1nA2nAnn]
=det(A)I.

Przykład 10.15.

Zobaczmy jak wzór na macierz odwrotną wygląda w niskich wymiarach. Dla n=2 i A=[a11a12a21a22] mamy

A11=a22,A21=-a12,A12=-a21,A22=a22,

czyli otrzymujemy znany nam wzór

A-1=1det(A)[a22-a12-a21a11].

Niech teraz n=3 i A=[a11a12a13a21a22a23a31a32a33]. Wtedy

A-1=1det(A)[A11A21A31A12A22A32A13A23A33],

gdzie

A11=|a22a23a32a33|,A21=-|a21a23a31a33|,A31=|a21a22a31a32|,
A12=-|a12a13a32a33|,A22=|a11a13a31a33|,A32=-|a11a12a31a32|,
A13=|a12a13a22a23|,A23=-|a11a13a21a23|,A33=|a11a12a21a22|.

Przykładowo, dla A=[242311101] otrzymujemy, że

A-1=-18[1-42-204-14-10].
Twierdzenie 10.5 (Wzory Cramera).

Załóżmy, że macierz AMn×n(F) jest nieosobliwa. Niech Ai oznacza macierz otrzymaną z A przez zastąpienie i-tej kolumny w A przez wektor bRn. Jedyne rozwiązanie x=[x1,,xn]TFn równania Ax=b jest dane przez

xi=det(Ai)det(A),dlai=1,,n.
Dowód.

Ponieważ x=A-1b, więc

xi=b1A1i++bnAnidet(A)=det(Ai)det(A).

Przykład 10.16.

Rozwiążemy układ równań

[521320102][xyz]=[853].

Macierz układu A=[521320102] jest nieosobliwa (det(A)=6), więc

x=|821520302|det(A)=66=1,y=|581350132|det(A)=66=1,z=|528325103|det(A)=66=1.
Przykład 10.17 (Rozkład Schura).

Przy obliczaniu wyznacznika często stosuje się metodę rozkładu pochodzącą od Schura. Rozważmy macierz blokową

P=[ABCD],

gdzie A i D są macierzami kwadratowymi. Spróbujmy znaleźć takie macierze X i Y, że

P=[ABCD] =[A0CI][IY0X]
=[AAYCCY+X].

Jeśli nam się to uda, to detP=detAdetX. Taki rozkład jest zawsze możliwy, gdy macierz A jest nieosobliwa. Możemy wtedy przyjąć, że

Y=A-1B,X=D-CA-1B.

Zauważmy, że

[AAYCCY+X]=[A0CX][IY0I],

więc możemy również użyć rozkładu

P =[A0CX][IY0I]
=[I0CA-1I][A00X][IY0I].

Jeśli macierz D jest nieosobliwa, to mamy analogiczny rozkład

P=[IBD-10I][A-BD-1C00D][I0D-1CI].

Ponieważ

[IY0I]-1=[I-Y0I],

więc powyższe rozkłady pozwalają łatwo wyznaczyć P-1.

  • 𝗧𝗘𝗦𝗧

    Oceń prawdziwość zdań

    • Dla dowolnych macierzy A,BM2×2() zachodzi równość det(A+B)=det(A)+det(B).

    • Dla dowolnych macierzy A,BM2×2() zachodzi równość det(AB)=det(BA).

    • Dla dowolnych macierzy A,BM2×2() równość det(A)=det(B) implikuje, że A=B.

    • Niech AM2×2(). Jeśli Ax=0 ma niezerowe rozwiązanie, to det(A)=0.

    • Jeśli A jest macierzą kwadratową i Ak=0 dla pewnego k, to det(A)=0.

    • Jeśli AMn×n() jest skośnie symetryczna (tzn. AT=-A), to det(A)=0.

    • Jeśli AMn×n() jest skośnie symetryczna i n jest nieparzyste, to det(A)=0.

    • Dla dowolnej macierzy kwadratowej detA2=(detA)2.

    • Jeśli A jest nieosobliwa i górnie trójkątna, to

      detA-1=1a111ann.
    • Jeśli A, BMn×n(𝔽) i detA=detB, to det(A+B)=2detA.

    • Dla macierzy kwadratowej A mamy detATA=detAAT.

Definicja 10.6.

Wyznacznik odwzorowania liniowego

Niech V będzie przestrzenią wektorową wymiaru n. Wyznacznik detL odwzorowania liniowego L:VV definiujemy jako det(A), gdzie A jest macierzową reprezentacją L w pewnej bazie v1,,vn dla V.

  • U

    Definicja wyznacznika detL nie zależy od wyboru reprezentacji macierzowej A dla L. Rzeczywiście, jeśli B jest inną reprezentacją macierzową L, to B jest podobna do A, więc det(A)=det(B).

Wniosek 10.10.

Niech L:VV będzie odwzorowaniem liniowym i dim(V)<. Wyznacznik detL0 wtedy i tylko wtedy, gdy L jest izomorfizmem liniowym.

Wniosek 10.11.

Jeśli L,G:VV są odwzorowaniami liniowymi, to detGL=detGdetL.

10.3 Geometryczna interpretacja wyznacznika

Definicja 10.7.

Iloczyn wektorowy w R3

Iloczynem wektorowym wektorów u=[u1,u2,u3]T,v=[v1,v2,v3]T3 nazywamy wektor

u×v:=|u2u3v2v3|e1-|u1u3v1v3|e2+|u1u2v1v2|e33.

Przez analogię do wzoru Laplace’a będziemy stosować następujące niezbyt formalne oznaczenie:

u×v=|𝐞𝟏𝐞𝟐𝐞𝟑u1u2u3v1v2v3|.
Wniosek 10.12 (Własności iloczynu wektorowego).

Iloczyn wektorowy

×:3×33

ma dla dowolnych u,v,wR3 i a,bR następujące własności:

  • (1)

    (dwuliniowość)

    (au+bv)×w=a(u×w)+b(v×w)
    u×(av+bw)=a(u×v)+b(u×w)
  • (2)

    (antysymetryczność)

    u×v=-v×u

  • (3)

    (reguła śruby prawoskrętnej)

    e1×e2=e3,e2×e3=e1,e3×e1=e2

W szczególności, u×u=0 dla dowolnego wektora uR3.

Wniosek 10.13.

Wektor u×v jest prostopadły do wektorów u i v.

Dowód.

Sprawdzamy łatwo, że

(u×v|u)=det[uuv]=0.

Rysunek 10.1: Iloczyn wektorowy.
  • U

    Iloczyn wektorowy możemy zapisać w konwencji macierzowej. Niech u=[a,b,c]T, v=[x,y,z]T3. Bezpośredni rachunek pokazuje, że

    u×v=[0-cbc0-a-ba0]:=Au[xyz]=Au(v).

    Stąd

    u×(u×v)=Au(u×v)=Au2(v).

    Z drugiej strony, sprawdzamy łatwo, że

    u×(u×v)=(u|v)u-(u|u)v.

    Jeśli u jest wektorem jednostkowym, to otrzymujemy, że

    v-(v|u)u=-Au2(v)=[-b2-c2abacab-a2-c2bcacba-a2-b2][xyz].

    Odwzorowanie vv-(v|u)u jest rzutem ortogonalnym na płaszczyznę ortogonalną do wektora jednostkowego u.

Lemat 10.7.

Dla dowolnych wektorów 0u,vR3 zachodzi równość

u×v=uvsin(u,v).
Dowód.

Bezpośredni rachunek pokazuje, że zachodzi tożsamość Lagrange’a:

u×v2=u2v2-((u|v))2.

Rzeczywiście, dla u=[u1,u2,u3]T i v=[v1,v2,v3]T mamy

u×v2 =|u2u3v2v3|2+|u1u3v1v3|2+|u1u2v1v2|2
=(u2v3-v2u3)2+(u1v3-u3v1)2+(u1v2-v1u2)2
=(u12+u22+u32)(v12+v22+v32)-(u1v1+u2v2+u3v3)2
=u2v2-((u|v))2.

Stąd

u×v2=u2v2(1-cos2(u,v))=u2v2sin2(u,v)

Wniosek 10.14 (Pole równoległoboku).

Niech u,vR3. Wtedy u×v jest polem równoległoboku rozpiętego na wektorach u i v. W szczególności, jeśli u i v są liniowo niezależne, to u×v0.

Wniosek 10.15.

Niech u=[u1,u2]T,v=[v1,v2]TR2. Wtedy

|det[uv]|

jest polem równoległoboku rozpiętego na wektorach u i v.

Dowód.

Rozważmy wektory u*=[u1,u2,0]T,v*=[v1,v2,0]T3. Zauważmy, że

u*×v*=|u1u2v1v2|e3,

więc

u*×v*=|u1u2v1v2|2=|det[uv]|.

Rysunek 10.2: Wyznacznik i pole
Definicja 10.8.

Iloczyn mieszany w R3

Dla wektorów u,v,w3 definiujemy ich iloczyn mieszany jako liczbę

(u×v|w).

Zauważmy, że

det[wuv] =det[wuv]T
=|w1w2w3u1u2u3v1v2v3|
=|u2u3v2v3|w1-|u1u3v1v3|w2+|u1u2v1v2|w3
=(u×v|w).
Wniosek 10.16 (Objętość równoległościanu).

Objętość równoległościanu rozpiętego na wektorach u,v,w jest równa

|(u×v|w)|.
Dowód.

Objętość równoległościanu rozpiętego na wektorach u,v,w jest równa iloczynowi pola równoległoboku rozpiętego na wektorach u, v (jest ono równe u×v) i odległości h punktu w od płaszczyzny P rozpiętej na wektorach u, v. Wysokość h jest długościom rzutu prostopadłego wektora w na wektor u×v prostopadły do P. Wtedy h=(w|u×v)u×v2(u×v), czyli

hu×v=(w|u×v)u×v2(u×v)u×v=|(u×v|w)|.

Wniosek 10.17.

Niech u,v,wR3. Objętość równoległościanu rozpiętego na wektorach u,v,w jest równa

|det[uvw]|.
Wniosek 10.18 (Iloczyn wektorowy i mieszany – podsumowanie).

Niech u,v,w,qR3. Zachodzą równości

  • (1)

    u×v=-v×u.

  • (3)

    (u|v×w)=(u×v|w).

  • (4)

    Zachodzi tożsamość Jacobiego

    u×(v×w)+v×(w×u)+w×(u×v)=0.
  • (5)

    Zachodzi toṡamość Lagrange’a

    u2v2=u×v2+((u|v))2.
  • (6)
    (u×v|w×q)=|(u|w)(v|w)(u|q)(v|q)|.
  • (8)

    det[u|v|w]=(u×v|w).

  • (9)

    |det[u|v|w]|=|(u×v|w)| jest objętością równoległościanu rozpiętego na wektorach u,v,w.

  • (10)

    Iloczyn wektorowy nie jest przemienny ani łączny.

Lemat 10.8.

Jeśli AM3×3(R) i u,vR3, to

AT((Au)×(Av))=det(A)(u×v).

W szczególności, jeśli ATA=I, to

(Au)×(Av)=det(A)A(u×v).

Jeśli ASO(3) tzn. AAT=I i det(A)=1, to

(Au)×(Av)=A(u×v).
Dowód.

Dla dowolnego w3 zachodzą równości

((Au)×(Av)|Aw) =det[Au|Av|Aw]
=det(A[u|v|w])
=det(A)det([u|v|w])
=(det(A)(u×v)|w),

oraz

((Au)×(Av)|Aw)=(AT((Au)×(Av))|w).

Stąd

AT((Au)×(Av))=det(A)(u×v).

10.4 Orientacja n

Niech V będzie przestrzenią wektorową nad ciałem o wymiarze skończonym n1. Dla dwóch uporządkowanych baz B=b1,,bn oraz B=b1,,bn przez SB,B=[sij] oznaczamy macierz przejścia od bazy B do B, czyli

bi=j=1nsjibj,i=1,,n.

Niech oznacza zbiór wszystkich baz V. W zbiorze definiujemy relację równoważności R przez: BRB wtedy i tylko wtedy, gdy

detSB,B>0.
Definicja 10.9.

Orientacja

Powiemy, że bazy B i B zadają taką samą orientację V jeśli BRB. Przez wybór orientacji w V rozumiemy wybór dowolnej uporządkowanej bazy (jej klasy abstrakcji w relacji R) B=b1,b2,,bn.

Przykład 10.18 (Standardowa orientacja Rn).

Dla n1 standardowa orientacja n jest zadana przez bazę standardową e1,,en.

  • (1)

    Przypomnijmy, że macierz przejścia od bazy B=b1,,bn do bazy standardowej jest równa S=[b1||bn]. W szczególności, B zadaje standardową orientację n, gdy det[b1||bn]>0.

  • (2)

    Baza b1, b2 dla 2 zadaje standardową orientację 2 wtedy i tylko wtedy, gdy najkrótszy kąt od b1 do b2 jest skierowany przeciwnie do ruchu wskazówek zegara. Rzeczywiście, możemy założyć, że b1=b2=1. Niech R będzie takim obrotem, że R(b1)=e1. Zauważmy, że

    det[R(b1),R(b2)]=detR[b1|b2]=det(R)det[b1,b2].

    Ponieważ det(R)=1, więc b1,b2 zadaje standardową orientację wtedy i tylko wtedy, gdy R(b1),R(b2) zadaje standardową orientację 2. Możemy więc założyć, że b1=e1. Niech b2=[a,b]T. Wtedy det[e1|b2]=b>0 wtedy i tylko wtedy, gdy najkrótszy kąt między e1 i [a,b]T jest skierowany przeciwnie do ruchu wskazówek zegara.

  • (3)

    Jeśli b1,b23 są liniowo niezależne, to b1,b2,b1×b2 zadaje standardową orientację 3. Rzeczywiście,

    det[b1|b2|b1×b2]=(b1×b2|b1×b2)>0.
Wniosek 10.19.

Niech L:RnRn będzie izomorfizmem liniowym. Następujące warunki są równoważne

  • (1)

    baza L(e1),,L(en) zadaje standardową orientację n,

  • (2)

    detL>0,

  • (3)

    jeśli b1,,bn zadaje standardową orientację n, to L(b1),,L(bn) zadaje standardową orientację n.