Geometria metryczna w przestrzeni i na płaszczyźnie

Transkrypt

Geometria metryczna w przestrzeni i na płaszczyźnie
Wykład 2 (23 II 2010)
Geometria metryczna w przestrzeni i na
płaszczyźnie
Treść wykładu. Układy współrzędnych, w szczególności układy prostokątne, zamiana współrzędnych.
Norma, iloczyn skalarny i odległość euklidesowa w Rn .
Algebraiczne własności iloczynu skalarnego i normy
Kąty, ortogonalność, wogólnione twierdzenie Pitagorasa
Rzutowanie prostopadłe na kierunek wektora
Układy współrzędnych — zamiana kartezjańskich układów współrzędnych;
2.1
Iloczyn skalarny w przestrzeni kartezjańskiej Rn
Definicja 2.1 (Norma, odległość i iloczyn skalarny w Rn )
Normą lub długością wektora x = (x1 , . . . , xn ) ∈ Rn nazywamy liczbę nieujemną oznaczaną |x| i określoną
wzorem
|x| =
q
x21 + . . . + x2n =
n
X
j=1
x2j
21
.
(2.1)
Iloczynem skalarnym wektorów x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) z przestrzeni Rn nazywamy liczbę oznaczaną
x · y i określoną wzorem
x·y =
n
X
xj yj .
(2.2)
j=1
Odległością punktów x, y przestrzeni Rn nazywamy liczbę
d(x, y) = |x − y| =
n
X
(xj − yj )2
j=1
12
.
(2.3)
Pierwsze z powyższych określeń wprowadza funkcję Rn ∋ x → |x| ∈ R, którą będziemy nazywać normą
(euklidesową) w przestrzeni Rn .
Dwa pozostałe określenia dotyczą uporządkowanych par punktów (x, y) ∈ Rn × Rn i dlatego należy je
traktować jako definicje pewnych funkcji określonych na zbiorze Rn × Rn Obie te funkcje przyjmuja wartości
w ciele skalarów (liczb rzeczywistych R). Są to:
Rn × Rn ∋ (x, y) 7→ d(x, y) ∈ R :
n
metryka euklidesowa w przestrzeni Rn ,
n
n
R × R ∋ (x, y) 7→ x · y ∈ R :
iloczyn skalarny w przestrzeni R .
(2.4)
(2.5)
Między tymi pojęciami istnieją bezpośrednie zależności, pozwalające na wyrażenie jednej z nich przez pozostałe,
na co zwróciliśmy już uwagę w dyskusji odnoszącej się do przypadku płaszczyzny. W bardziej systematyczny
sposób ujmuje to następujące Stwierdzenie.
11
12
ALiGA — Wykład 2.
Stwierdzenie 1 Dla dowolnych x, y ∈ Rn zachodzą równości
2
|x| = x · x,
1
x·y =
|x + y|2 − |x − y|2 .
4
(2.6)
Dodajmy jeszcze, że iloczyn skalarny wektorów bardzo wygodnie zapisywać za pomocą iloczynu macierzowego:

Jeżeli

x1
 
 x2 

x=
 ..  ,
 . 
xn


y1
 
 y2 

y=
 ..  ,
 .
t
to x y =
yn



x1 , x2 , . . . , xn 


y1
y2
..
.
yn

 X
n

=
xi yi = x · y.

 i=1
W następujących bezpośrednio poniżej twierdzeniach opisane są najważniejsze własności dwóch pierwszych
z tych podstawowych dla geometrii funkcji, a omówienie własności odległości odłożymy do następnego wykładu.
Twierdzenie 2 (Algebraiczne własności iloczynu skalarnego w Rn )
a) Odwzorowanie
Rn × Rn ∋ (x, y) 7→ x · y =
n
X
j=1
xj yj ∈ R,
(2.7)
spełnia dla każdych x, y, v ∈ Rn i α, β ∈ R warunki:
i)
ii)
iii)
x · y = y · x,
(symetria)
(αx + βy) · v = α(x · v) + β(y · v),
v · (αx + βy) = α(v · x) + β(v · y),
(liniowość wzg. każdego argumentu z osobna)
n
oraz x · x = 0 ⇐⇒ x = 0,
(dodatnia określoność).
x·x ­0 ∀ x∈R
(2.8)
b) Dla dowolnych wektorów x, y ∈ Rn jest spełniona nierówność Schwarza
|x · y| ¬ |x||y|,
(2.9)
przy czym równość zachodzi w (2.9) wtedy i tylko wtedy, gdy wektory x i y są współliniowe.
Własności i)–iii) określa się sumarycznie mówiąc, że odwzorowanie (2.7) jest symetryczną i dodatnio
określoną formą dwuliniową na przestrzeni Rn .
Nierówność Schwarza można też jawnie wyrazić za pomocą współrzędnych wektorów x i y. Przybierze ona
wówczas postać klasycznej nierówności nazywanej nierównością Cauchy’ego–Buniakowskiego–Schwarza.
Wniosek 1 Dla dowolnych układów liczb rzeczywistych x1 , . . . , xn , y1 , . . . , yn zachodzą nierówności
v
v
u n
uX
n
n
X
X
X
u
u n 2
2
t
xj yj ¬
|xj yj | ¬
xi t
yj .
j=1
j=1
i=1
(2.10)
j=1
Twierdzenie 3 (Własności normy w Rn )
Norma Rn ∋ x 7→ |x| ∈ R określona wzorem (2.1) ma własności:
i)
ii)
iii)
|0| = 0, oraz |x| > 0 dla każdego x 6= 0, x ∈ Rn
(dodatnia określoność)
n
|ax| = |a| |x|, dla każdych a ∈ R, x ∈ R ,
(bezwzględna jednorodność)
n
|x + y| ¬ |x| + |y|, dla każdych x, y ∈ R ,
(nierówność trójkąta).
(2.11)
Dla zwięzłości wypowiedzi będziemy używać określenia n-wymiarowa przestrzeń euklidesowa dla oznaczenia
przestrzeni kartezjańskiej Rn wyposażonej w normę (2.1) i wyznaczoną przez nią metrykę euklidesową (2.3)
A. Strasburger — Konspekt wykładów ALiGA (przygotowany 16 marca 2010 roku)
2.1.1
13
Kąt między wektorami w przestrzeni euklidesowej
Nierówność Schwarza dla pary niezerowych wektorów v, w ∈ Rn można zapisać w postaci następującej nierówności
v·w
−1 ¬
¬ 1,
(2.12)
|v| |w|
Jak stwierdziliśmy, wyrażenia po obu stronach nierówności Schwarza (2.9) są równe wtedy i tylko wtedy, gdy
wektory v i w są proporcjonalne. To oznacza, że wyrażenie pomiędzy znakami nierówności w (2.12) przyjmuje
największą wartość równą 1 wtedy i tylko wtedy, gdy wektory v i w mają ten sam kierunek i zwrot (tj. różnią
się dodatnim czynnikiem proporcjonalności, v = λw i λ > 0). Wartość najmniejsza równa −1 przyjmowana
jest w przypadku, gdy v = λw i λ < 0, a więc v i w mają ten sam kierunek a zwrot przeciwny.
Geometryczna interpretacja nierówności Schwarza opiera się na pojęciu kąta między wektorami.
Definicja 2.2 (Kąt między wektorami w Rn ) Niech będą dane różne od zera wektory v, w ∈ Rn . Kątem
między wektorami v, w nazywamy (jednoznacznie wyznaczoną) liczbę Θ z odcinka [ 0, π ], że
v · w = cos Θ |v| |w|.
(2.13)
Przypomnijmy, że prostopadłość wektorów w płaszczyźnie oznacza, że kąt między nimi jest równy π/2, a
to na mocy wzoru (1.9) oznacza, że iloczyn skalarny tych wektorów jest równy zeru. Sformułowana powyżej
definicja pozwala wprowadzić pojęcie ortogonalności wektorów(1 ) również w przypadku przestrzeni o dowolnie
wysokim wymiarze.
Definicja 2.3 (Ortogonalność wektorów w Rn ) Będziemy mówić, że wektory v, w ∈ Rn są ortogonalne
(prostopadłe), gdy v · w = 0. Ortogonalność wektorów v, w wyrażamy zapisem v ⊥ w.
Zauważmy, że relacja ortogonalności jest symetryczna, to jest
v⊥w
⇐⇒
w ⊥ v,
a wektor zerowy (i tylko on) jest ortogonalny do każdego wektora w Rn .
Bezpośrednio z określenia (2.2) iloczynu skalarnego wynika, że wektory bazy standardowej ej , j = 1, . . . , n
są parami ortogonalne, tj. ej · ek = 0 gdy j 6= k.
Z powyższego (por. wzór (2.6)) wynika natychmiast następujący ważny
Lemat 1 (Uogólniony wzór Pitagorasa) Jeśli wektory v, w ∈ Rn są ortogonalne, to
|v + w|2 = |v|2 + |w|2 .
(2.14)
Dla dowodu wystarczy zauważyć, że wobec v · w = 0 i symetrii iloczynu skalarnego mamy w · v = 0, a zatem
|v + w|2 = (v + w) · (v + w) = v · v + v · w + w · v + w · w = |v|2 + |w|2 .
2.1.2
Rzut ortogonalny na kierunek wektora
Jeśli wektor w ∈ Rn jest różny od zera, to jednowymiarową przestrzeń lin w = { λw | λ ∈ R } będziemy nazywać
kierunkiem wyznaczonym przez wektor w. Zauważmy dalej, że dla dowolnego wektora v ∈ Rn wektor
v·w
v′ = v −
w
jest ortogonalny do wektora w.
|w|2
Rzeczywiście,
v·w
v·w
v·w 2
v ·w = v−
w ·w =v·w−
w·w =v·w−
|w| = 0.
2
2
|w|
|w|
|w|2
A zatem dowolny wektor v ∈ Rn można zapisać w postaci sumy o wzajemnie ortogonalnych składnikach
v·w
v·w
v·w
v=
w+v−
w=
w + v′ ,
(2.15)
|w|2
|w|2
|w|2
′
przy czym jeden z tych składników ma kierunek wektora w.
1
W przypadku przestrzeni dowolnego wymiaru wolimy określać tę relację słowem „ortogonalność” niż „prostopadłość”
14
ALiGA — Wykład 2.
Definicja 2.4 (Rzut ortogonalny wektora) Niech w ∈ Rn będzie wektorem niezerowym, w 6= 0. Rzutem
ortogonalnym wektora v ∈ Rn na kierunek wektora w nazywamy wektor Pw (v) określony wzorem
Pw (v) =
v·w
w = cos Θ |v| uw ,
|w|2
gdzie
uw =
1
w
|w|
(2.16)
jest wektorem o jednostkowej długości należącym do kierunku wektora w.
Odwzorowanie Rn ∋ v 7→ Pw (v) ∈ Rn nazywamy rzutowaniem prostopadłym (ortogonalnym) przestrzeni Rn na
kierunek wektora w.
Podkreślmy raz jeszcze — rzut wektora v ∈ Rn na kierunek wektora w jest takim wektorem postaci λw, dla
którego różnica v − λw jest ortogonalna do w.
Przykład 2.1.1 Czytelnik może łatwo sprawdzić, że w przestrzeni R3 rzutami wektora x = (x1 , x2 , x3 ) na kierunki wektorów
bazy standardowej e1 , e2 , e3 są odpowiednio wektory
P1 (x) = x1 e1 ,
P2 (x) = x2 e2 ,
P3 (x) = x3 e3 .
Wyznaczmy teraz na przykład rzut wektora x na kierunek wektora u = (1, 1, 1). Po zastosowaniu wzoru (2.16) otrzymamy
Pu (x) =
2.2
x1 + x2 + x3
x1 + x2 + x3
x·u
u=
u=
(1, 1, 1).
|u|2
3
3
Nowe spojrzenie na równanie płaszczyzny
Wykorzystamy pojęcie iloczynu skalarnego aby poszerzyć interpretację geometryczną równania płaszczyzny w
R3 . Ponieważ jednak ogólny przypadek przestrzeni n-wymiarowej nie jest bardziej skomplikowany niż przypadek
trójwymiarowy, podamy najpierw sformułowanie ogólne uzupełniając je na końcu uwagami odnoszącymi się
do przestrzeni (fizykalnej) R3 . Dla uniknięcia skojarzeń odnoszących się do „dwuwymiarowości” płaszczyzny w
R3 , w przypadku ogólnym będziemy używać terminu „hiperpłaszczyzna” dla odpowiednika w Rn płaszczyzny
w R3 .
2.2.1
Przypadek n-wymiarowy
Definicja 2.5 (Hiperpłaszczyzna w Rn ) Zbiór punktów przestrzeni Rn spełniających równanie
a1 x1 + a2 x2 + . . . + an xn = b,
gdzie a1 , a2 , . . . , an , b ∈ R
(2.17)
i przynajmniej jeden ze współczynników ai 6= 0, nazywamy hiperpłaszczyzną w Rn . Tak jak w przypadku trójwymiarowym, przestrzenią kierunkową tej hiperpłaszczyzny nazywamy zbiór rozwiązań równania jednorodnego
odpowiadającego (2.17), to jest zbiór
K = { x = (x1 , . . . , xn ) | a1 x1 + a2 x2 + . . . + an xn = 0 }.
Współczynniki a1 , a2 , . . . , an równania hiperpłaszczyzny możemy potraktować jak współrzędne wektora A =
(a1 , . . . , an ) ∈ Rn (na mocy założenia mamy A 6= 0). Dzięki temu lewą stronę równania a1 x1 +a2 x2 +. . .+an xn =
b zapisujemy w postaci A · x i otrzymujemy wektorowy zapis równania hiperpłaszczyzny w postaci
A · x = b,
x = (x1 , . . . , xn ) ∈ Rn .
(2.18)
Dla dwóch dowolnych (różnych) punktów p, q należących do zadanej hiperpłaszczyzny wektor v łączący p z q
(wektor przesunięcia z p do q) jest ortogonalny do A
A · v = A · (q − p) = A · q − A · p = 0.
Odwrotnie, jeśli v należy do przestrzeni kierunkowej hiperpłaszczyzny, to na mocy samej definicji A · v = 0.
Lemat 2 Przestrzeń kierunkowa hiperpłaszczyzny o równaniu A · x = b jest dokładnie zbiorem wektorów ortogonalnych do wektora A.
A. Strasburger — Konspekt wykładów ALiGA (przygotowany 16 marca 2010 roku)
15
Kierunek wyznaczony przez wektor A nazywamy kierunkiem normalnym do hiperpłaszczyzny, a wektor
1
A — jednostkowym wektorem normalnym do hiperpłaszczyzny (2.18). Mówimy też, że hiperpłaszczyzna
|A|
wyznaczona przez to równanie jest ortogonalna (lub częściej prostopadła, gdy n ¬ 3) do wektora A.
Podsumowując powyższą dyskusję możemy uważać hiperpłaszczyznę za zbiór tych punktów przestrzeni,
które można osiągnąć z wybranego punktu hiperpłaszczyzny poruszając się w kierunkach prostopadłych do
wektora A.
Zbadamy teraz, jaką interpretację ma wyraz wolny, b, w równaniu hiperplaszczyzny. Niech p0 będzie ustalonym punktem hiperpłaszczyzny. Oznaczając przez Θ kąt między A i p0 mamy
b = A · p0 = |A| |p0 | cos Θ.
Zapiszemy teraz równość (2.15) biorąc w = A i v = p0 i uwzględniając, że b = A · p0 . To daje
p0 =
b
A + k,
|A|2
gdzie k ⊥ A jest wektorem kierunkowym hiperpłaszczyzny.
(2.19)
Dla dowolnego p z tej hiperpłaszczyzny mamy p = p0 + v, gdzie v ⊥ A, a więc ostatecznie
p = p0 + v =
b
A + k + v,
|A|2
a więc
|p|2 =
|b|2
+ |k + v|2 ,
|A|2
gdyż (k + v) ⊥ A. A zatem dla każdego punktu p tej hiperpłaszczyzny zachodzi
|p| ­
|b|
|b|
=q
.
|A|
a21 + . . . + a2n
Jest naturalne, aby najmniejszą długość wektora leżącego w danym zbiorze traktować jako odległość początku układu współrzędnych do tego zbioru. W ogólności przyjmujemy następującą definicję.
Definicja 2.6 (Odległość punktu od zbioru) Dla p ∈ Rn i dowolnego niepustego zbioru F ⊂ Rn określamy
d(p, F ) — odległość punktu p od zbioru F — wzorem
d(p, F ) = inf{ d(p, z) | z ∈ F }.
(2.20)
Powyższe rozważania prowadzą zatem do następującego wniosku.
Wniosek 2 Jeśli hiperpłaszczyzna H jest dana równaniem (2.17) i wektor A jest określony jak wyżej, to |b|/|A|
jest najmniejszą długością wektora, którego koniec leży na tej hiperpłaszczyźnie. Inaczej mówiąc
d(p, H) =
|b|
|b|
=q
.
|A|
a21 + . . . + a2n
W szczególności, jeśli wektor współczynników równania hiperpłaszczyzny jest unormowany (|A| = 1) — w takim
przypadku mówimy, że równanie płaszczyzny jest zadane w postaci normalnej — to d(p, H) = |b|.
Warto podkreślić, że w ogólnym przypadku w zbiorze F może wcale nie być takiego punktu, który leżałby w
najmniejszej odległości od danego punktu p — takiego, w którym infimum funkcji z 7→ d(p, z) byłoby osiągane.
W rozważanym przypadku hiperpłaszczyzny z wektorem normalnym A taki punkt istnieje i, jak to wynika z
równania (2.19), jest równy rzutowi prostopadłemu dowolnego punktu hiperpłaszczyzny na kierunek normalny
do niej.
2.2.2
Położenie wektora względem osi układu prostokątnego
Przypadek R2
Niech x = (x1 , x2 ) ∈ R2 będzie danym wektorem. Rzuty tego wektora na osie układu kartezjańskiego są dane
przez
P1 (x) = x1 e1 = |x| cos Θ1 e1 ,
P2 (x) = x2 e2 = |x| cos Θ2 e2 ,
gdzie Θ1 i Θ2 są kątami, jakie tworzy wektor x z osiami (prostokątnego) układu współrzędnych. Ponieważ
Θ1 + Θ2 = π/2, to cos Θ2 = sin Θ1 . Pisząc dla prostoty Θ1 = Θ otrzymujemy znane skądinąd wyrażenie
x = |x|(cos Θ e1 + sin Θ e2 )
16
ALiGA — Wykład 2.
Przypadek R3
Dla danego wektora x = (x1 , x2 , x3 ) w przestrzeni R3 ilorazy (x · ej )/|x| są jednakowe dla wszystkich niezerowych wektorów z kierunku wektora x, można więc ich użyć jako miary położenia tego kierunku względem osi
Oxj wyznaczonej przez wektor ej . Zgodnie z określeniem kąta podanym w Definicji 2.2 iloraz ten jest równy
kosinusowi kąta tworzonego przez wektory tego kierunku z dodatnim kierunkiem osi Oxj . Przyjmujemy zatem
definicję.
Definicja 2.7 (Kosinusy kierunkowe) Jeśli x ∈ R3 jest różny od 0, to wielkości
cos Θ1 =
x · e1
,
|x|
cos Θ2 =
x · e2
,
|x|
cos Θ3 =
x · e3
|x|
(2.21)
nazywamy kosinusami kierunkowymi wektora x.
Jak zauważyliśmy powyżej, kosinusy kierunkowe w istocie zależą tylko od kierunku wektora x, a nie zależą od
jego długości.
Wniosek 3 Kosinusy kierunkowe niezerowego wektora x ∈ R3 spełniają związek
cos2 Θ1 + cos2 Θ2 + cos2 Θ3 = 1
Ponadto zachodzi równość
x = |x|(cos Θ1 e1 + cos Θ2 e2 + cos Θ3 e3 ).
2.2.3
Odległość punktu od prostej na płaszczyźnie lub od płaszczyzny w przestrzeni
Ustaliliśmy powyżej, w jaki sposób z pojęcia odległości między punktami przestrzeni Rn wyprowadzić sensowne
określenie odległości punktu od zbioru zawartego w tej przestrzeni. W poniższych stwierdzeniach podamy wzory,
które umożliwiają obliczenie tak rozumianej odległości w przypadku gdy rozpatrywanym zbiorem jest prosta
lub płaszczyzna.
Stwierdzenie 2 Niech l będzie prostą na płaszczyźnie R2 zadaną równaniem ax1 + bx2 + c = 0 i niech p =
1
(p1 , p2 ) będzie punktem R2 . Oznaczmy przez n = √
(a, b) jednostkowy wektor normalny do prostej.
2
a + b2
Wowczas zachodzi
ap1 + bp2 + c = inf{ d(z, p) | z ∈ l }.
√
a2 + b2
Jeśli oznaczyć δ = inf{ d(z, p) | z ∈ l } tę liczbę, to punkt q, dla którego spełniony jest warunek d(q, p) = δ,
wyraża się wzorem
q = ±δn + p,
gdzie znak wybrany jest tak, aby wektor ±δn był skierowany od p do prostej l.
Analogiczny problem dla płaszczyzny w przestrzeni trójwymiarowej R3 rozwiązany jest przez następujące
stwierdzenie.
Stwierdzenie 3 Niech Π będzie płaszczyzną w przestrzeni R3 zadaną równaniem ax1 +bx2 +cx3 +d = 0 i niech
1
p = (p1 , p2 , p3 ) będzie punktem R3 . Oznaczmy przez n = √
(a, b, c) jednostkowy wektor normalny
2
a + b2 + c2
do płaszczyzny Π. Wowczas zachodzi
ap1 + bp2 + cp3 + d √
= inf{ d(z, p) | z ∈ Π }.
2
2
2
a +b +c
Jeśli oznaczyć δ = inf{ d(z, p) | z ∈ Π } tę liczbę, to punkt q, dla którego spełniony jest warunek d(q, p) = δ,
wyraża się wzorem
q = ±δn + p,
gdzie znak wybrany jest tak, aby wektor ±δn był skierowany od p do płaszczyzny Π.