I Algebra liniowa z geometrią 1

Rozdział 3 Przestrzeń wektorowa

SŁOWA KLUCZOWE ROZDZIAŁU przestrzenie wektorowe n i n przestrzeń wektorowa 𝔽n kombinacja liniowa liniowa niezależność baza baza standardowa 𝔽n iloczyn skalarny w n norma w n nierówność Cauchy’ego–Schwarza wektory ortogonalne proste i płaszczyzny w 3 iloczyn hermitowski

3.1 Płaszczyzna 2 jako przestrzeń wektorowa

Punkt na płaszczyźnie 2 utożsamiamy z jego współrzędnymi kartezjańskimi (x1,x2), czyli liczbą zespoloną z=x1+ix2. Wprowadzimy teraz w zbiorze 2 pewną nową strukturę algebraiczną, strukturę przestrzeni wektorowej. Geometrycznie punkt P=(x1,x2) na płaszczyźnie będziemy interpretowali jako wektor będący strzałką o początku w punkcie 0=(0,0) i o końcu w punkcie P. W tej interpretacji będzie dla nas wygodne zastosowanie nieco innej konwencji zapisu współrzędnych punktu. Zamiast pisać (x1,x2) będziemy stosować zapis kolumnowy [x1x2], czyli pierwsza współrzędna nad drugą. Dla oszczędności papieru wprowadzamy oznaczenie

[x1,x2]T:=[x1x2].

Napis (x1,x2) oznacza, że mamy na myśli liczbę zespoloną, a napis sugeruje [x1,x2]T, że myślimy o wektorze na płaszczyźnie.

Definicja 3.1.

Płaszczyzna R2

Płaszczyzną rzeczywistą nazywamy zbiór

2:={[x1,x2]T:x1,x2}.

Jego elementy będziemy nazywać wektorami.

Zbiór 2 możemy łatwo wyposażyć w dodatkową strukturę algebraiczną. Wektory będziemy dodawać i mnożyć je przez liczbę rzeczywistą.

Definicja 3.2.

Dodawanie wektorów i mnożenie ich przez skalar

Niech x=[x1,x2]T,y=[y1,y2]T2. Definiujemy ich sumę przez

x+y=[x1,x2]T+[y1,y2]T=[x1+y1,x2+y2]T.

W zapisie kolumnowym mamy

[x1x2]+[y1y2]=[x1+y1x2+y2]

Powyższy wzór określa dodawanie +:2×22 punktów (wektorów) na płaszczyźnie. Przypisuje ono dwóm punktom płaszczyzny pewien punkt na płaszczyźnie.

Niech a i x=[x1,x2]T2. Definiujemy mnożenie wektora przez liczbę rzeczywistą a wzorem

a[x1,x2]T=[ax1,ax2]T.

Równoważnie,

a[x1x2]=[ax1ax2]

Zdefiniowane powyżej mnożenie definiuje odwzorowanie :×22. Przypisuje ono liczbie rzeczywistej i punktowi na płaszczyźnie pewien punkt na płaszczyźnie.

Rysunek 3.1: Dodawanie wektorów i mnożenie ich przez liczbę rzeczywistą. Suma wektorów u+v jest przekątną równoległoboku R rozpiętego na wektorach u i v. Różnicę wektorów u-v otrzymujemy dodając do wektora u wektor v pomnożony przez liczbę -1 tzn. u-v=u+(-1)v. Długość wektora u-v jest równa długości drugiej przekątnej równoległoboku R. Mnożąc niezerowy wektor v przez wszystkie liczby rzeczywiste otrzymujemy prostą na płaszczyźnie. Dokładniej, zbiór {tv:t} jest prostą przechodzącą przez 0 i równoległą do wektora v.

3.2 Definicja przestrzeni wektorowej

Naturalne jest pytanie: dlaczego mielibyśmy się ograniczać wyłącznie do płaszczyzny 2? Przecież podobną konstrukcję możemy powtórzyć w przestrzeni 3, gdzie położenie punktu jest opisane trzema współrzędnymi w miejsce dwóch. A może rozważyć pięć współrzędnych? Lepiej zróbmy to od razu ogólnie dla dowolnej liczby naturalnej n.

Definicja 3.3.

Przestrzeń wektorowa RnNiech n. Definiujemy zbiór

n:={[x1,,xn]T:x1,,xn},

gdzie

[x1,,xn]T=[x1x2xn].

Analogicznie do płaszczyzny 2 definiujemy działanie dodawania wektorów +:n×nn oraz ich mnożenie przez liczbę rzeczywistą :×nn wzorami

x+y=[x1,,xn]T+[y1,,yn]T=[x1+y1,,xn+yn]T

t[x1,,xn]T=[tx1,,txn]T,t

  • U

    Początek układu współrzędnych, czyli wektor zerowy [0,,0]T będziemy oznaczać przez 0. Zazwyczaj nie prowadzi to do nieporozumień – z kontekstu wynika czy 0 oznacza zero jako liczbę rzeczywistą czy raczej wektor zerowy w n.

n - AKSJOMATY PRZESTRZENI WEKTOROWEJ
Lemat 3.1.
Dla dowolnych wektorów x,y,zRn i liczb rzeczywistych a,bR mamy (1) (x+y)+z=x+(y+z)     (łączność dodawania wektorów) (2) x+y=y+x     (przemienność dodawania wektorów) (3) x+0=x (4) istnieje (jedyny) taki wektor x, że x+x=0     (x=(-1)x) (5) a(x+y)=ax+ay     (rozdzielność) (6) (a+b)x=ax+bx     (rozdzielność) (7) (ab)x=a(bx)     (łączność) (8) 1x=x.
Dowód.

Dowód jest bardzo prosty. Jak się dobrze przyglądniemy to zauważymy, że wszystkie własności (1)-(8) wynikają bezpośrednio z własności działań w zbiorze liczb rzeczywistych. Wystarczy je zastosować do każdej współrzędnej z osobna. ∎

Początki teorii przestrzeni wektorowych związane są z Williamem Rowanem Hamiltonem (1805–1865) oraz Hermannem Guntherem Grassmannem (1809–1877)

Mamy więc do czynienia z pewnym zbiorem V(=n) i dwoma działaniami

+:V×VV,:×VV

spełniającymi warunki (1)-(8).

Definicja 3.4.

Przestrzeń wektorowa nad ciałem R

Rozważmy trójkę (V,+,) z opisanymi powyżej działaniami

+:V×VV,:×VV.

Powiemy, że (V,+,) jest przestrzenią wektorową nad ciałem , (bo mnożymy elementy zbiory V przez liczby rzeczywiste) jeśli zachodzą powyższe warunki (1)-(8).

  • U

    Z powyższych rozważań wynika, że (n,+,) jest przykładem przestrzeni wektorowej nad ciałem . Możecie zapytać po co nam jakieś przestrzenie wektorowe. Przecież mamy już wektory w n, które dodajemy i mnożymy przez liczbę rzeczywistą. Czy to nie wystarczy? Otóż nie. Popatrzcie na funkcję x2+sin(x) (przepraszam ortodoksyjnych matematyków za ten zapis funkcji bez podania dziedziny i przeciwdziedziny). Przecież to też jest suma pewnych obiektów (w tym wypadku funkcji), tylko teraz dodajemy funkcje zamiast liczb lub wektorów z n. Funkcje, podobnie jak wektory możemy mnożyć przez liczby. Pewnie zetknęliście się z funkcjami typu 3x4 lub -2cos(x).

Przykład 3.1 (Przestrzeń F(R,R) funkcji f:RR).

Niech F(,) będzie zbiorem wszystkich funkcji f:. W zbiorze F(,) mamy naturalne dodawanie +:F(,)×F(,)F(,) dane wzorem

(f+g)(x)=f(x)+g(x),

oraz mnożenie przez skalar :×F(,)F(,) zdefiniowane formułą

(af)(x)=af(x).

Trójka (F(,),+,) spełnia warunki (1)-(8), więc jest przestrzenią wektorową nad ciałem liczb rzeczywistych.

Przykład 3.2 (Przestrzeń wielomianów).

Niech P będzie zbiorem wszystkich wielomianów o współczynnikach rzeczywistych. Z naturalnymi działaniami dodawania + i mnożenia przez liczbą , trójka (P,+,) jest przestrzenią wektorową nad ciałem liczb rzeczywistych.

  • U

    Jak pewnie zauważyliście, przez cały czas podkreślam, że rozważane dotąd przestrzenie wektorowe V są przestrzeniami wektorowymi nad ciałem . Może moglibyśmy rozważać przestrzenie wektorowe nad innymi ciałami? Poniższy przykład pokazuje, że możemy to robić. Co więcej jest to bardzo naturalne, a naturalne konstrukcje bardzo w matematyce lubimy.

Przykład 3.3 (Przestrzeń wektorowa Cn).

Przez analogię do zbioru n możemy zdefiniować zbiór n jako

n:={[z1,,zn]T:z1,,zn},

gdzie

[z1,,zn]T=[z1z2zn].

W zbiorze n mamy naturalnie zdefiniowane działanie dodawania

+:n×nn

oraz ich mnożenie przez liczbę zespoloną

:×nn.

Są one dane wzorami

z+w=[z1,,zn]T+[w1,,wn]T=[z1+w1,,zn+wn]T,

t[z1,,zn]T=[tz1,,tzn]T,t.

Łatwo sprawdzamy, że tak określona trójka (n,+,) spełnia warunki (1)-(8). Jedyna różnica polega na tym, że wektory (elementy zbioru n) mnożymy teraz przez liczby zespolone, a nie liczby rzeczywiste. Możemy, więc stwierdzić, że (n,+,) jest przestrzenią wektorową nad ciałem liczb zespolonych. Możecie powiedzieć, że przecież to nie koniec. Taką samą konstrukcje możemy przeprowadzić rozważając zbiór n i jego elementy mnożyć przez liczby wymierne. Otrzymamy przestrzeń wektorową nad ciałem liczb wymiernych . Prowadzi nas to do ogólnej definicji przestrzeni wektorowej nad dowolnym ciałem 𝔽.

Definicja 3.5 (Przestrzeń wektorowa nad ciałem F).

Niech V będzie zbiorem i niech 𝔽 będzie ciałem. Załóżmy, że określone są działania: +:V×VV (dodawanie wektorów) oraz :𝔽×VV (mnożenie przez skalar). Powiemy, że trójka (V,+,) jest przestrzenią wektorową nad ciałem 𝔽, jeśli dla dowolnych wektorów x,y,zV oraz skalarów a,b𝔽 zachodzą warunki:

  • (1)

    (x+y)+z=x+(y+z)

  • (2)

    x+y=y+x

  • (3)

    istnieje taki wektor 0V, że x+0=x

  • (4)

    istnieje taki wektor x, że x+x=0

  • (5)

    a(x+y)=ax+ay

  • (6)

    (a+b)x=ax+bx

  • (7)

    (ab)x=a(bx)

  • (8)

    1x=x.

Zauważmy, że pierwsze cztery warunki dotyczą wyłącznie dodawania wektorów i oznaczają, że (V,+) jest grupą abelową W dalszym ciągu napis VVekt𝔽 będzie oznaczał, że V jest przestrzenią wektorową nad ciałem 𝔽.

  • U

    Wektor zerowy 0V jest wyznaczony jednoznacznie. Jeśli 01,02V spełniają warunek (3), to 01=01+02=02.

  • U

    Rozważmy przestrzeń wektorową VVekt𝔽 nad ciałem 𝔽. Uzasadnimy, że dla vV oraz 0𝔽 (elementu neutralnego dodawania w ciele 𝔽) zachodzi równość

    0v=0V.

    Możecie powiedzieć, że to przesada aby uzasadnić takie rzeczy. Przecież 0𝔽 pomnożone przez ,,cokolwiek’’ daje 0. Tak jest, gdy ,,cokolwiek’’ jest elementem ciała 𝔽. W naszym przypadku 0v oznacza, że mnożymy 0𝔽 przez wektor vV, natomiast 0 po prawej stronie jest wektorem, a nie elementem ciała 𝔽.

    Z własności (6) i definicji 0 jako elementu neutralnego dla dodawania w ciele 𝔽 wynika, że

    0v =(0+0)v
    =0v+0v,

    więc 0v=0.

  • U

    Niech xV. Wektor x spełniający warunek x+x=0 jest wyznaczony jednoznacznie. Rzeczywiście, jeśli x+x=0=x+x′′, to

    x =x+0
    =x+(x+x′′)
    =(x+x)+x′′
    =0+x′′
    =x′′

    Wektor x nazywamy wektorem przeciwnym do x i oznaczamy przez -x. Uzasadnimy, że -x=(-1)x.

    x+(-1)x =(1+(-1))x
    =0x
    =0,

    czyli x=-x=(-1)x.

    Analogicznie pokazujemy, że
    a0=0 oraz -av=(-a)v

Przykład 3.4 (Przestrzeń wektorowa (Fn,+,)).

Jeśli 𝔽 jest dowolnym ciałem, to naturalnie określona trójka (𝔽n,+,) jest przestrzenią wektorową nad ciałem 𝔽. W szczególności, (𝔽,+,) jest przestrzenią wektorową nad ciałem 𝔽.

Przykład 3.5 (O co chodzi z tymi ciałami?).

Rozważmy ponownie przestrzeń wektorową (n,+,). Mnożenie jest mnożeniem wektora przez liczbę zespoloną. Oznaczmy je chwilowo przez . Zauważmy, że w zbiorze n mamy też dobrze określone mnożenie przez liczbę rzeczywistą. Trójki (n,+,) oraz (n,+,) są różnymi obiektami matematycznymi. (n,+,) jest przestrzenią wektorową nad ciałem , a (n,+,) jest przestrzenią wektorową nad ciałem . Co za różnica? Otóż zasadnicza. Pierwsze dwa elementy trójek są identyczne tzn. zbiór n i określone w nim działanie dodawania wektorów +. Aby dostrzec różnicę rozważmy wektor v=[1+2i,1+2i]T2. Zauważmy, że w przestrzeni (n,+,) nad ciałem zachodzi równość

[1+2i1+2i]=(1+2i)[11].

W przestrzeni (n,+,) nad ciałem taka równość nie zachodzi. Co więcej, napis

(1+2i)[11]

nie ma sensu w tej przestrzeni, bo dopuszczamy tylko mnożenie wektorów z 2 przez liczby rzeczywiste.

Przykład 3.6.

Rozważmy przestrzeń wektorową

35=3×3×3×3×3

oraz wektory

u=[2,2,0,1,2]T,v=[1,2,2,2,1]T.

Wtedy

u+v=[0,1,2,0,0]T,2u=[1,1,0,2,1]T.
  • U

    Uważny czytelnik zauważył z pewnością, że działania w przestrzeni funkcyjnej F(,) są zdefiniowane dzięki temu, że potrafimy dodawać wartości dwóch funkcji z F(,) oraz mnożyć wartości funkcji z F(,). Jest to możliwe, bo przeciwdziedzina funkcji z F(,), czyli jest ciałem. Nie jest natomiast ważne, że ich dziedzina ma strukturę ciała. Możemy więc rozważać bardziej ogólne funkcyjne przestrzenie wektorowe. Dokładniej, jeśli X jest dowolnym niepustym zbiorem i 𝔽 jest ciałem, to zbiór

    F(X,𝔽)

    wszystkich funkcji f:X𝔽 jest przestrzenią wektorową z działaniami

    (f+g)(x)=f(x)+g(x),(af)(x)=af(x),a𝔽.

    Przykładowo, F([-1,1],) jest rzeczywistą przestrzenią wektorową. Zwróćcie uwagę, że powyżej zdefiniowane działania, nie są działaniami wewnętrznymi w zbiorze F(,[-1,1]), bo sin,cosF(,[-1,1]), ale sin+cosF(,[-1,1]) oraz 2sinF(,[-1,1]).

Niech 𝔽 będzie ciałem. W przestrzeni wektorowej (𝔽n,+,) wyróżniamy n wektorów danych przez

e1=[1,0,,0]T,e2=[0,1,,0]T,,en=[0,,0,1]T

Zauważmy, że każdy wektor v=[v1,,vn]T𝔽n możemy zapisać jako

[v1,,vn]T =[v1,,0]T++[0,,vn]T
=v1[1,,0]T++vn[0,,1]T
=v1e1++vnen.

Oznacza to, że zachodzi równość

v=v1e1++vnen,vi𝔽.

Mówimy wtedy, że wektor v jest kombinacją liniową wektorów e1,,en. Zdefiniujemy to pojęcie bardziej ogólnie, co przyda nam się w przyszłości.

Definicja 3.6.

Kombinacja liniowa wektorów

Niech (V,+.) będzie przestrzenią wektorową nad ciałem 𝔽. Dla wektorów v1,,vkV oraz skalarów a1,,ak𝔽, wektor

a1v1++akvkV

nazywamy kombinacją liniową wektorów v1,,vkV.

Przykład 3.7.

Niech (V,+,) będzie przestrzenią wektorową nad ciałem 𝔽. Ustalmy wektory v1,,vkV i rozważmy zbiór

span{v1,,vk}={a1v1++akvk:a1,,ak𝔽}

wszystkich możliwych kombinacji liniowych wektorów v1,,vk. Działania + oraz są działaniami wewnętrznymi w zbiorze span{v1,,vk} oraz (span{v1,,vk},+,) jest przestrzenią wektorową nad ciałem 𝔽.

Załóżmy, że V=2. Mamy

  • (a)

    span{0}={0},

  • (b)

    jeśli 0v2, to span{v}={av:a} jest prostą przechodzącą przez 0 i równoległą do wektora v.

Lemat 3.2.

Rozważmy przestrzeń wektorową (Fn,+,). Wtedy każdy wektor vFn można jednoznacznie zapisać w postaci kombinacji liniowej

v=v1e1++vnen,vi𝔽.
Dowód.

Wiemy już, że dla dowolnego wektora v𝔽n istnieją takie skalary v1,,vn𝔽, że v=v1e1++vnen. Pokażemy, że takie przedstawienie wektora v w postaci kombinacji liniowej wektorów e1,,en jest wyznaczone jednoznacznie. Przypuśćmy, że

v=v1e1++vnen=x1e1++xnen.

Wtedy

0=[0,,0]T =v+(-1)v
=(v1-x1)e1++(vn-xn)en
=[v1-x1,,vn-xn]T,

czyli v1=x1,,vn=xn. ∎

Rysunek 3.2: Przykładowa kombinacja liniowa wektorów [2,1]T i [-1,1]T.
Definicja 3.7.

Baza standardowa Fn

Wektory e1,,en nazywamy bazą standardową przestrzeni 𝔽n.

  • U

    Zauważmy, że jednoznaczność przedstawienia wektora v jako kombinacji liniowej wektorów e1,,en wynika z prawdziwości następującej implikacji:

    x1e1++xnen=0x1==xn=0.

    Jest to więc ważna własność wektorów e1,,en. Warto więc ją jakoś nazwać i zbadać.

Definicja 3.8.

Liniowa niezależność

Niech V będzie przestrzenią wektorową nad ciałem 𝔽. Wektory v1,,vkV nazywamy liniowo niezależnymi, jeśli dla x1,,xk𝔽 zachodzi implikacja

x1v1++xkvk=0x1==xk=0.
Przykład 3.8.

Niech v,w2. Przypuśćmy, że wektory v,w są liniowo zależne. Wtedy istnieją takie liczby rzeczywiste a,b, że a0 lub b0 oraz av+bw=0. Jeśli a0, to v=-baw, czyli wektor v leży na prostej {tw:t}.

Przykład 3.9.

Wektory

v1=[1,1,0]T,v2=[1,0,1]T

są liniowo niezależne w 𝔽. Przypuśćmy bowiem, że x1v1+x2v2=0 dla pewnych x1,x2𝔽. Ponieważ x1v1+x2v2=[x1+x2,x1,x2]T, więc

x1+x2=0,x1=0,x2=0,

czyli v1 i v2 są liniowo niezależne.

Definicja 3.9.

Baza przestrzeni wektorowej

Niech V będzie przestrzenią wektorową nad ciałem 𝔽. Wektory v1,,vkv nazywamy bazą przestrzeni wektorowej V, jeśli dla dowolnego wektora vV istnieją jednoznacznie wyznaczone takie skalary x1,,xk𝔽, że

v=x1v1++xkvk.
Przykład 3.10.

Podmieńmy wektor e3=[0,0,1]T w bazie dla 𝔽3 przez wektor u=[0,1,1]T. Pokażemy, że wektory e1, e2, u tworzą bazę 𝔽3. Rozważmy dowolny wektor [a,b,c]T𝔽3. Musimy uzasadnić, że istnieją jedyne takie skalary x1, x2, x3𝔽3, że x1e1+x2e2+x3u=[a,b,c]T. Zwróćmy uwagę, że

x1e1+x2e2+x3u=[x1,x2+x3,x3]T.

Równość [x1,x2+x3,x3]T=x1e1+x2e2+x3u=[a,b,c]T jest więc równoważna z układem równań

x1=a,x2+x3=b,x3=c.

Ma on jednoznaczne rozwiązanie

x1=a,x2=b-c,x3=c,

czyli e1, e2, u są bazą 𝔽3.

Przykład 3.11.

Wektory v1=[1,0,0]T, v2=[0,1,1]T są liniowo niezależne, bo równość

[0,0,0]T =x1v1+x2v2
=x1[1,0,0]T+x2[0,1,1]T
=[x1,x2,x2]T,

oznacza, że x1=x2=0. Nie tworzą one jednak bazy 𝔽3, bo ich kombinacje liniowe x1v1+x2v2 mają postać [x1,x2,x2]T, więc przykładowo, wektor [1,2,3]T nie jest kombinacją liniową v1 i v2.

Każdy wektor [x1,x2,x3]T𝔽3 jest kombinacją liniową wektorów e1, e2, e3, [0,1,1]T, bo

[x1,x2,x3]T=x1e1+x2e2+x3e3+0[0,1,1]T.

Wektory e1, e2, e3, [0,1,1]T nie tworzą jednak bazy 𝔽3, bo przykładowo

[0,1,1]T =0e1+1e2+1e3+0[0,1,1]T
=0e1+0e2+0e3+1[0,1,1]T,

czyli przedstawienie nie jest jednoznaczne. Wynika to z faktu, że wektory e1, e2, e3, [0,1,1]T są liniowo zależne, bo

0e1+1e2+1e3-1u=0.
Rysunek 3.3: Baza standardowa e1, e2 na płaszczyźnie. Każdy wektor na płaszczyźnie można jednoznacznie zapisać jako kombinację liniową wektorów e1, e2.
Przykład 3.12 (Przestrzeń wektorowa macierzy M2×2(F)).

Rozważmy zbiór macierzy M2×2(𝔽). Jest w nim określone działanie dodawania macierzy

+:M2×2(𝔽)×M2×2(𝔽)M2×2(𝔽)

dane wzorem

[abcd]+[efgh]=[a+eb+fc+gd+h]

oraz mnożenie macierzy przez skalar

:𝔽×M2×2(𝔽)M2×2(𝔽)

zdefiniowane wzorem

t[abcd]=[tatbtctd],t𝔽.

Trójka (M2×2(𝔽),+,) jest przestrzenią wektorową nad ciałem 𝔽. Ponadto, dla A=[abcd]M2×2(𝔽) mamy

[abcd]=a[1000]+b[0100]+c[0010]+d[0001].

Powyższym przedstawienie jest jednoznacznie wyznaczone przez macierz A, czyli macierze

[1000],[0100],[0010],[0001]

tworzą bazę przestrzeni M2×2(𝔽).

3.3 Iloczyn skalarny i norma w n

Wprowadzimy teraz w przestrzeni wektorowej (n,+,) pewną dodatkową geometryczną strukturę, zadaną przez euklidesowy iloczyn skalarny.

Definicja 3.10.

Euklidesowy iloczyn skalarny w Rn

Iloczynem skalarnym wektorów v=[v1,v2]T,u=[u1,u2]T2 nazywamy liczbę rzeczywistą

(v|u):=v1u1+v2u2.

Analogicznie, iloczyn skalarny wektorów

v=[v1,,vn]T,u=[u1,,un]Tn

definiujemy jako liczbę rzeczywistą

(v|u):=v1u1++vnun

  • U

    Iloczyn skalarny jest też często oznaczany symbolem <v,u>. My będziemy używali oznaczenia (v|u), bo w tej konwencji nierówność (v|u)>0 jest czytelniejsza niż napis <v,u0.

Iloczyn skalarny jest więc odwzorowaniem

(|):n×n(v,u)(v|u).

Przypisuje ono parze wektorów (v,u) liczbę rzeczywistą (v|u).

Lemat 3.3.

Dla dowolnych wektorów u,v,wRn i skalarów a,bR zachodzą następujące własności

  • (1)

    (dwuliniowość)

    (au+bv|w)=a(u|w)+b(v|w),
    (u|av+bw)=a(u|v)+b(u|w).
  • (2)

    (symetryczność)

    (u|v)=(v|u)

  • (3)

    (dodatnia określoność)

    (u|u)0

    przy czym (u|u)=0 wtedy i tylko wtedy, gdy u=0.

Definicja 3.11.

Norma euklidesowa w Rn

Normą (długością) wektora u=[u1,,un]Tn nazywamy liczbę

u:=(u|u)=u12++un20

  • U

    Zauważmy, że wektor [cosθ,sinθ]T ma normę jeden i każdy wektor o normie jeden można zapisać w tej postaci dla pewnego θ. W szczególności, dowolny wektor v2 można zapisać w postaci

    v=v[cosθ,sinθ]T.
Lemat 3.4 (Tożsamość równoległoboku).

Dla dowolnych wektorów u,vRn zachodzi równość

u+v2+u-v2=2(u2+v2)

Dowód.

Bezpośredni rachunek pokazuje, że

u+v2+u-v2 =(u+v|u+v)+(u-v|u-v)
=(u|u)+(u|v)+(v|u)+(v|v)
+(u|u)-(u|v)-(v|u)+(v|v)
=2(u|u)+2(v|v)=2(u2+v2).

Lemat 3.5 (Wzór polaryzacyjny).

Zachodzi wzór polaryzacyjny

(u|v)=14(u+v2-u-v2).

Dowód.

Mamy

u+v2-u-v2 =(u+v|u+v)-(u-v|u-v)
=(u|u)+(u|v)+(v|u)+(v|v)
-((u|u)-(u|v)-(v|u)+(v|v))
=4(u|v).

Lemat 3.6.

Niech u,vRn będą wektorami. Wówczas,

(u,v)=0u-v2=u2+v2.
Dowód.

Zauważmy, że

u-v2 =(u-v|u-v)
=u2-2(u|v)+v2,

czyli teza zachodzi. ∎

Twierdzenie 3.1 (Nierówność Cauchy’ego–Schwarza).

Dla dowolnych wektorów u i vRn zachodzi nierówność

|(u|v)|uv.

Dowód.

Możemy założyć że wektory u i v są niezerowe. Dla dowolnego t mamy

0 u+tv2
=(u+tv|u+tv)
=u2+2t(u|v)+t2v2,
czyli z własności funkcji kwadratowych wynika, że
4((u|v))2-4u2v20,

co kończy dowód. ∎

Wniosek 3.1 (Własności normy).

Dla dowolnych u,vRn i aR mamy

  • (1)

    u0 oraz u=0 wtedy i tylko wtedy, gdy u=0;

  • (2)

    au=|a|u;

  • (3)

    (nierówność trójkąta)

    u+vu+v

Dowód.

Pierwsza własność wynika bezpośrednio z definicji normy. Dla dowodu drugiej zauważamy, że

au2 =(au|au)
=a2(u|u)
=a2u2.

Uzasadnimy nierówność trójkąta. Stosując nierówność Cauchy’ego–Schwarza mamy

u+v2 =u2+2(u|v)+v2
u2+2uv+v2
=(u+v)2,

co kończy dowód. ∎

Definicja 3.12.

Wektory ortogonalne

Wektory u,vn są ortogonalne (prostopadłe) wtedy i tylko wtedy, gdy

(u|v)=0.

W szczególności, wektor zerowy jest prostopadły do każdego wektora, więc również do samego siebie.

  • U

    Pokażemy, że dla dowolnych wektorów u,v2 zachodzi równość

    (u|v)=uvcos(u,v),

    gdzie (u,v) jest kątem między wektorami u i v. W szczególności,

    |(u|v)|uv.

    Jeśli któryś z wektorów u lub v jest zerowy to powyższa równość jest prawdziwa. Załóżmy więc, że wektory u i v są niezerowe. Niech wektor q będzie rzutem prostopadłym wektora u na prostą rozpiętą przez wektor v. Wtedy q=cv dla pewnego c. Stąd wektor w=u-cv jest prostopadły do wektora v. Gdy kąt (u,v) jest ostry, to c0 oraz

    cos(u,v)=cvu=|c|vu.

    Jeśli kąt (u,v) jest rozwarty, to c<0 oraz

    cos(u,v)=cos(π-(u,-v))=-cos(u,-v)=-|c|vu.

    W obydwu przypadkach

    cos(u,v)=cvu.

    Ponieważ wektor w=u-cv jest prostopadły do v, więc

    0=(u-cv,v)=(u|v)-cv2,

    czyli

    c=(u|v)v2.

    Stąd

    cos(u,v)=(u|v)v2vu=(u|v)vu,

    co kończy dowód.

    Możemy na to spojrzeć jeszcze inaczej. Wektory u i v możemy zapisać w postaci trygonometrycznej:

    u=|u|(cosθ,sinθ)T,v=|v|(cosψ,sinψ)T.

    Wtedy

    (u|v)=|u||v|(cosθcosψ+sinθsinψ)=|u||v|cos(θ-ψ).

Z nierówności Cauchy’ego–Schwarza wynika, że dla niezerowych wektorów u,vn mamy

-1(u|v)uv1,u,v0.

Istnieje więc jednoznacznie wyznaczony taki kąt 0(u,v)π, że

cos(u,v)=(u|v)uv.
Definicja 3.13.

Kąt między wektorami

Kątem (u,v) pomiędzy niezerowymi wektorami u,vn nazywamy jedyny taki kąt 0(u,v)π, że

cos(u,v)=(u|v)uv.
Definicja 3.14.

Wektor jednostkowy

Wektor un nazywamy jednostkowym, gdy u=1.

Rysunek 3.4: Normalizacja niezerowego wektora v. Wektor u=vv leży na okręgu jednostkowym.
Przykład 3.13.

Jeśli wektor vn jest niezerowy, to wektor u=vv jest wektorem jednostkowym.

Przykład 3.14.

Niech A=[abcd]M2×2(). Niech a1=[a,c]T i a2=[b,d]T2 będą wektorami utworzonymi z kolumn macierzy A. Macierz Grama ma postać

ATA=[acbd][abcd]=[(a1|a1)(a1|a2)(a1|a2)(a2|a2)].

W szczególności, AO(2) jest ortogonalna tzn. ATA=I wtedy i tylko wtedy, gdy

a1=a2=1,(a1|a2)=0,

czyli kolumny A są wektorami jednostkowymi i są ortogonalne do siebie.

  • U

    METRYKA EUKLIDESOWA

    Korzystając z normy możemy zdefiniować funkcję

    d:n×n,

    wzorem

    d(v,w)=v-w=(v1-w1)2++(vn-wn)2.

    Z własności normy, dla dowolnych v,w,un mamy

    • (i)

      d(v,w)0 oraz d(v,w)=0 wtedy i tylko wtedy, gdy v=w,

    • (ii)

      d(v,w)=d(w,v),

    • (iii)

      d(v,w)d(v,u)+d(u,w).

    Przykładowo,

    d(v,w) =v-w
    =(v-u)+(u-w)
    v-u+u-w
    =d(v,u)+d(u,w)

    Funkcję d nazywamy metryką euklidesową w n. Liczbę d(v,w) nazywamy odległością między v i w.

3.4 Proste i płaszczyzny

Rozważmy niezerowy wektor v=[v1,v2]T2. Jak wiemy zbiór wszystkich wektorów postaci tv dla t jest prostą równoległą do wektora v i przechodzącą przez punkt 0. Prostą równoległą do v i przechodzącą przez punkt [a1,a2]T możemy opisać jako zbiór punktów postaci [a1,a2]T+tv (t).

Definicja 3.15.

Równanie parametryczne prostej

Równanie parametryczne prostej l przechodzącej przez [a1,a2]T i równoległej do niezerowego wektora v=[v1,v2]T ma postać

[x1,x2]T=[a1,a2]T+t[v1,v2]T,t2

W skrócie, x=a+tv.

Rysunek 3.5: Mnożąc niezerowy wektor v przez wszystkie liczby rzeczywiste t otrzymujemy prostą.
  • U

    Definicja oznacza, że współrzędne punktu [x1,x2]T leżącego na prostej l spełniają, dla pewnego skalara t, układ równań

    {x1=a1+tv1x2=a2+tv2

    Ponieważ wektor v jest niezerowy, więc któraś z jego współrzędnych v1 lub v2 jest różna od zera. Załóżmy przykładowo, że v10. Możemy wtedy z pierwszego równania wyliczyć t otrzymując, że t=x1-a1v1. Wstawiając do drugiego równania otrzymujemy, że

    x2-a2-x1-a1v1v2=0,

    czyli

    -v2(x1-a1)+v1(x2-a2)=0.

    Jest to równanie ogólne prostej l przechodzącej przez punkt [a1,a2]T i równoległej do wektora v.

Definicja 3.16.

Równanie ogólne prostej

Równanie ogólne prostej na płaszczyźnie ma postać

Ax1+Bx2+C=0,A2+B2>0.
  • U

    Zauważmy, że prosta o równaniu ogólnym

    Ax1+Bx2+C=0

    przechodzi przez początek układu współrzędnych 0=[0,0]T wtedy i tylko wtedy, gdy C=0. Ma ona wtedy równanie Ax1+Bx2=0, które możemy zapisać przy pomocy iloczynu skalarnego następująco:

    ([A,B]T|[x1,x2]T)=0.

    Oznacza to, że składa się ona ze wszystkich wektorów [x1,x2]T prostopadłych do wektora [A,B]T.

Wniosek 3.2.

Prosta o równaniu ogólnym

A(x1-a1)+B(x2-a2)=0,A2+B2>0

przechodzi przez punkt [a1,a2]T i jest prostopadła do wektora [A,B]T.

Analogicznie, dla niezerowego wektora v=[v1,,vn]Tn i punktu a=[a1,,an]T równanie parametryczne prostej równoległej do v i przechodzącej przez a ma postać

x=a+tv,t.

Przyglądnijmy się przypadkowi n=3, czyli prostym w przestrzeni 3. W postaci parametrycznej jest ona zadana układem równań

{x1=a1+tv1x2=a2+tv2x3=a3+tv3
Rysunek 3.6: Prosta 2x+y=0 jest prostopadła do wektora [2,1]T.

Jeżeli wszystkie liczby v10 dla i=1,2,3, to eliminując t z powyższego układu otrzymujemy dwa równania

x-a1v1=x-a2v2=x-a3v3,

nazywane równaniami kanonicznymi prostej w przestrzeni. Jeżeli np. v3=0 a v1, V20, to równania przyjmują postać

x-a1v1=x-a2v2,x3=a3.

Gdy np. v2=v3=0 i v10, to równanie ma postać

x2=a2,x3=a3.
Przykład 3.15.

Zastanówmy się jaki podzbiór P przestrzeni 3 jest opisany przez równanie

2x1-x2+3x3=0.

Możemy je zapisać równoważnie wykorzystując iloczyn skalarny jako

([2,-1,3]T|[x1,x2,x3]T)=0,

czyli zbiór P składa się z wszystkich wektorów [x1,x2,x3]T w 3 prostopadłych do wektora [2,-1,3]T. Oznacza to, że P jest płaszczyzną prostopadłą do wektora [2,-1,3]T i zawierającą początek układu 0=[0,0,0]T.

Definicja 3.17.

Równanie ogólne płaszczyzny w R3

Równanie ogólne płaszczyzny w przestrzeni 3 ma postać

Ax1+Bx2+Cx3+D=0,A2+B2+C2>0.

W szczególności, równanie

A(x1-a1)+B(x2-a2)+C(x3-a3)=0

opisuje płaszczyznę przechodzącą przez punkt [a1,a2,a3]T i prostopadłą do wektora [A,B,C]T.

Rysunek 3.7: Płaszczyzna x+y-z=0.
Rysunek 3.8: Płaszczyzny x-2y+3z=1, x+y+z=1 i ich przecięcie będące prostą w 3.
Przykład 3.16.

Rozważmy układ równań liniowych

{x-2y+3z=1x+y+z=1

Równania układu opisują dwie nierównoległe płaszczyzny. Zbiorem rozwiązań układu jest prosta L będąca ich częścią wspólną.

Wyznaczymy dokładniej prostą L. Odejmując pierwsze równanie od drugiego otrzymujemy układ równoważny

{x-2y+3z=13y-2z=0{x-2y+3z=1y=23z

Stąd

{x=1-53zy=23z

Zbiór rozwiązań układu jest dany jako zbiór

{[1-5/3z,2/3z,z]T:z}.

Zauważmy, że

[1-5/3z,2/3z,z]T=[-5/3,2/3,1]Tz+[1,0,0]T.

Rozwiązaniem układu jest prosta L o równaniu parametrycznym

[-5/3,2/3,1]Tz+[1,0,0]T,z.