1. Wprowadzenie. Funkcja n
Transkrypt
1. Wprowadzenie. Funkcja n
13. Funkcje wielu zmiennych – pochodne, gradient, Jacobian, ekstrema lokalne.
1. Wprowadzenie.
Dotąd rozważaliśmy funkcje działające z podzbioru liczb rzeczywistych w zbiór liczb
rzeczywistych, zatem funkcje jednej zmiennej rzeczywistej. Istnieją jednak również inne
funkcje:
1. f : ℝ ∋ 𝑥 ↦ (𝑓1 (𝑥), . . . ,𝑓n (𝑥))∈ ℝ𝑛 ;
przykład: f(x) = (𝑥 2 , 𝑥 3 )
2. f : ℝ𝒏 ∋ (𝑥1 , . . . , 𝑥𝑛 ) ↦ 𝑓(𝑥1 , . . . , 𝑥𝑛 ) ∈ ℝ;
przykład: f(x,y,z) = xyz
𝒌
3. f : ℝ ∋ (𝑥1 , . . . , 𝑥𝑘 ) ↦ (𝑓(𝑥1 , . . . , 𝑥𝑘 ), . . . , 𝑓𝑛 (𝑥1 , . . . , 𝑥𝑘 )) ∈ ℝ𝑛 ;
przykład: f(x,y) = (x+y, x-y, xy)
Funkcje pierwszego typu nazywane są zwykle funkcjami wektorowymi i nie są w istocie funkcjami
jednej zmiennej, choć mają wartości wielowymiarowe. Funkcje drugiego i trzeciego typu są już
funkcjami wielu zmiennych. Funkcję przedstawioną w punkcie drugim określa się często jako
funkcję skalarną, zaś funkcję najogólniejszej, trzeciej postaci nazywa się czasem polem
wektorowy.
Funkcja n-zmiennych
Niech ℝ𝑛 ≝ {(𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ): 𝑥1 ∈ ℝ ∧ 𝑥2 ∈ ℝ ∧ . .. ∧ 𝑥𝑛 ∈ ℝ }
Funkcją n-zmiennych określoną na zbiorze 𝐷 ⊆ ℝ𝑛 o wartościach w ℝ, nazywamy
przyporządkowanie każdemu punktowi ze zbioru D dokładnie jednej liczby rzeczywistej.
Funkcję taką oznaczamy przez:
𝑓: 𝐷 → ℝ
lub
𝑤 = 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 ), gdzie (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) ∈ D
Wartość funkcji f w punkcie (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) , oznaczamy przez 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 ).
Dla n=2 mamy funkcję dwóch zmiennych 𝑧 = 𝑓(𝑥, 𝑦)
ℝ2 ∋ (𝑥, 𝑦) ↦ 𝑧 = 𝑓(𝑥, 𝑦) ∈ ℝ
1
Dla n=3 mamy funkcje trzech zmiennych 𝑤 = 𝑓(𝑥, 𝑦, 𝑧)
ℝ3 ∋ (𝑥, 𝑦, 𝑧) ↦ 𝑤 = 𝑓(𝑥, 𝑦, 𝑧) ∈ ℝ
Dziedzina funkcji
Zbiór wszystkich punktów przestrzeni ℝ𝑛 , dla których funkcja 𝑓 jest określona nazywamy
dziedziną funkcji 𝒇, i oznaczamy 𝐷𝑓 .
Wykres funkcji
Wykresem funkcji n-zmiennych nazywamy zbiór
{(𝑥1 , … , 𝑥𝑛 , w) ∶ (𝑥1 , … , 𝑥𝑛 ) ∈ 𝐷𝑓 ∧ 𝑤 = 𝑓(𝑥1 , … , 𝑥𝑛 )} ⊂ ℝ𝑛 × ℝ.
2. Funkcja dwóch zmiennych.
Definicja
Funkcją f dwóch zmiennych określoną na zbiorze 𝐷 ⊆ ℝ2 o wartościach w ℝ nazywamy
przyporządkowanie każdemu punktowi (𝑥, 𝑦) ∈ 𝐷 dokładnie jednej liczby 𝑧 = 𝑓(𝑥, 𝑦) ∈ ℝ .
Dziedzina funkcji
Dziedziną funkcji f dwóch zmiennych nazywamy zbiór:
𝐷𝑓 = {(𝑥, 𝑦) 𝜖 ℝ𝑛 : ∃𝑧∈ℝ 𝑧 = 𝑓(𝑥, 𝑦)}.
Wykres
Wykresem funkcji f dwóch zmiennych nazywamy zbiór:
𝑤𝑓 = {(𝑥, 𝑦, 𝑧) ∶ (𝑥, 𝑦) ∈ 𝐷𝑓 ∧ 𝑧 = 𝑓(𝑥, 𝑦)}.
2
Przykłady 1:
𝑎) 𝑓(𝑥, 𝑦) = ln(1 − 𝑥 2 − 𝑦 2 ), 𝐷𝑓 =
𝑏) 𝑔(𝑥, 𝑦) = √𝑥𝑦,
𝐷𝑔 = {(𝑥, 𝑦) ∈ ℝ2 ∶ 𝑥𝑦 ≥ 0}
(𝑥−2)(𝑦+1)
𝑐) ℎ(𝑥, 𝑦) = (𝑥−2)2
2
{(𝑥, 𝑦) ∈ ℝ ∶ 𝑥 2 + 𝑦 2 < 1},
+(𝑦+1)2
,
𝐷ℎ = ℝ2 \{(2, −1)}
Przykład 2:
Dla funkcji dwóch zmiennych.
𝑎) 𝑓(𝑥, 𝑦) = 𝑥 2 + 𝑦 2 , 𝐷𝑓 = ℝ2
𝑏)𝑓(𝑥, 𝑦) = √4 − 𝑥2 −𝑦2 , 𝐷𝑓 = {(𝑥, 𝑦) ∈ ℝ2 ∶ 𝑥 2 + 𝑦 2 ≤ 4},
Dla funkcji trzech zmiennych.
𝑐) 𝑓(𝑥, 𝑦, 𝑧) = √1 − 𝑥 2 − 𝑦 2 −𝑧 2 ,
𝐷𝑓 = {(𝑥, 𝑦, 𝑧) ∶ 𝑥 2 + 𝑦 2 + 𝑧 2 ≤ 1},
3. Pochodna kierunkowa w punkcie.
Niech dana będzie funkcja 𝑓: 𝐷 ⊆ ℝ𝑛 → ℝ , punkt 𝑃0 = (𝑥01 , … , 𝑥0𝑛 ) ∈ 𝐷, oraz wektor
𝑢 = [𝑢𝑥1 , … , 𝑢𝑥𝑛 ] ∈ ℝ𝑛 . Pochodna kierunkową funkcji 𝒇 w punkcie 𝑃0 w kierunku wektora 𝑢
nazywamy granicę:
𝑓(𝑃0 + 𝑡𝑢) − 𝑓(𝑃0 )
𝑡→0
𝑡
lim
o ile granica ta istnieje i jest liczbą skończoną.
Wyrażenie pod znakiem granicy rozważamy w zbiorze tych 𝑡 ∈ ℝ, 𝑡 ≠ 0, dla których 𝑃0 + 𝑡𝑢 ∈ 𝐷
Pochodną kierunkową funkcji 𝑓 w punkcie 𝑃0 w kierunku wektora 𝑢 będziemy oznaczać symbolem
𝒇′𝒖 (𝑷𝟎 ) . Stosuje się również oznaczenia 𝑫𝒖 𝒇(𝑷𝟎 ) albo
𝝏𝒇
𝝏𝒖
(𝑷𝟎 )
Gdy 𝑃0 jest punktem o współrzędnych 𝑥01 , … , 𝑥0𝑛 , wówczas zamiast 𝑓𝑢′ (𝑃0 ) piszemy także
𝑓𝑢′ (𝑥01 , … , 𝑥0𝑛 )
3
Przykład:
𝑓(𝑥, 𝑦) = 𝑥 2 − 2𝑦 2
𝑃0 = (1,1)
u=[2,3]
𝑓((1,1) + 𝑡[2,3]) − 𝑓(1,1)
𝑓(2𝑡 + 1 , 3𝑡 + 1) − 𝑓(1,1)
= lim
=
𝑡→0
𝑡→0
𝑡
𝑡
𝑓𝑢′ (1,1) = lim
(2𝑡 + 1)2 − 2(3𝑡 + 1)2 + 1
4𝑡 2 + 4𝑡 + 1 − 18𝑡 2 − 12𝑡 − 2 + 1
= lim
= lim
=
𝑡→0
𝑡→0
𝑡
𝑡
−14𝑡 2 − 8𝑡
𝑡(−14𝑡 − 8)
= lim
= lim(−14𝑡 − 8) = −8
𝑡→0
𝑡→0
𝑡→0
𝑡
𝑡
= lim
4. Pochodne cząstkowe w punkcie.
Niech 𝑓 oznacza funkcję n-zmiennych określoną w otoczeniu 𝑈 punktu 𝑃0 = (𝑥01 , … , 𝑥0𝑛 ) .
Symbolem ∆𝑥𝑖 oznaczamy przyrost zmiennej niezależnej 𝑥𝑖 , 1 ≤ 𝑖 ≤ 𝑛 rożny od zera i taki żeby
punkt 𝑃 = (𝑥01 , … , 𝑥0𝑖−1 , 𝑥0𝑖 + ∆𝑥𝑖 , 𝑥0𝑖+1 , … , 𝑥0𝑛 ) należał do otoczenia U.
Granicę właściwą:
lim∆𝑥 →0
𝑖
𝑓(𝑃)−𝑓(𝑃0 )
,
∆𝑥𝑖
nazywamy pochodna cząstkową rzędu pierwszego funkcji 𝑓 względem zmiennej 𝑥𝑖 w punkcie 𝑃0 i
𝜕𝑓
oznaczamy symbolem 𝜕 (𝑃0 ) lub 𝑓𝑖′ (𝑃0 ).
𝑥𝑖
Dla n=2
Dla funkcji dwóch zmiennych 𝑓(𝑥, 𝑦), definicje pochodnych cząstkowych rzędu pierwszego
względem zmiennych 𝑥 i 𝑦 w punkcie 𝑃0 = (𝑥0 , y0 ) są następujące:
𝜕𝑓
𝑓(𝑥0 + ∆𝑥 , 𝑦0 ) − 𝑓(𝑥0 , 𝑦0 )
(𝑃0 ): ≝ lim
∆𝑥 →0
𝜕𝑥
∆𝑥
oraz
𝑓(𝑥0 , 𝑦0 + ∆𝑦 ) − 𝑓(𝑥0 , 𝑦0 )
𝜕𝑓
(𝑃0 ): ≝ lim
∆𝑦 →0
𝜕𝑦
∆𝑦
Przykład:
Funkcja 𝑓(𝑥, 𝑦) = 𝑥 − 𝑦 ma pochodne cząstkowe:
𝜕𝑓
𝜕𝑥
= lim∆𝑥 →0
𝑓(𝑥0 +∆𝑥 ,𝑦0 )−𝑓(𝑥0 ,𝑦0 )
∆𝑥
= lim∆𝑥 →0
𝑥0 +∆𝑥 −𝑦0 −𝑥0 +𝑦0
∆𝑥
∆
= lim∆𝑥 →0 ∆𝑥 = 1
𝑥
oraz
𝜕𝑓
𝜕𝑦
= lim∆𝑦 →0
𝑓(𝑥0 ,𝑦0 +∆𝑦 )−𝑓(𝑥0 ,𝑦0 )
∆𝑦
= lim∆𝑦 →0
𝑥0 −𝑦0 −∆𝑦 −𝑥0 +𝑦0
∆𝑦
= lim∆𝑦 →0
−∆𝑦
∆𝑦
= −1
4
5. Gradient.
Niech 𝑓: 𝐷 ⊆ ℝ𝑛 → ℝ Gradientem funkcji f w punkcie 𝑃0 = (𝑥01 , … , 𝑥0𝑛 ) nazywamy wektor
określony wzorem:
𝜕𝑓
𝜕𝑓
𝜕𝑓
𝛁𝑓(𝑃0 ) = [𝜕𝑥 (𝑃0 ), 𝜕𝑥 (𝑃0 ), … , 𝜕𝑥 (𝑃0 )].
1
2
𝑛
Gradient funkcji f oznacza się także symbolem grad f(P0).
Przykład 1:
Gradient funkcji f(x, y)=𝑥 3 − 𝑦 3 w punkcie 𝑃0 = (𝑥, 𝑦) jest równy:
grad f(x,y)=[3𝑥 2 , −3𝑦 2 ]
Gradient funkcji f(x, y)=𝑥 3 − 𝑦 3 w punkcie 𝑃0 = (1,1) jest równy
grad f(1,1)=[3,-3]
Przykład 2:
Gradient funkcji 𝑓(𝑥, 𝑦) = 𝑥 2 − 2𝑦 2 w punkcie 𝑃0 = (1,1) jest równy:
𝜕𝑓
𝜕𝑥
= 2𝑥,
𝜕𝑓
(1,1)
𝜕𝑥
=2 ,
𝜕𝑓
𝜕𝑦
= −4𝑦,
𝜕𝑓
(1,1)
𝜕𝑦
= −4,
∇𝑓(1,1) = [
𝜕𝑓
𝜕𝑓
(1,1) , (1,1) ]
𝜕𝑥
𝜕𝑦
= [2, −4].
6. Jakobian.
Niech f :ℝ𝑘 ↄ 𝑈 ↦ ℝ𝑛 , 𝑓(𝑥1 , . . . , 𝑥𝑘 ) = (𝑓1 (𝑥1 , . . . , 𝑥𝑘 ), . . . , 𝑓𝑛 (𝑥1 , . . . , 𝑥𝑘 )).
Dla ustalonego punktu 𝑥𝑜 macierz pochodnej A jest postaci:
𝜕𝑓1
(𝑥 ) ⋯
𝜕𝑥1 0
⋮
⋱
𝜕𝑓𝑛
(𝑥 ) ⋯
[𝜕𝑥1 0
𝜕𝑓1
(𝑥 )
𝜕𝑥𝑘 0
⋮
𝜕𝑓𝑛
(𝑥 )
𝜕𝑥𝑘 0 ]
co, przyjmując zapis pochodnych cząstkowych w postaci wektorów kolumnowych, można także
zapisać:
[𝑓𝑥′1 (𝑥0 ), 𝑓𝑥′2 (𝑥0 ), . . ., 𝑓𝑥′𝑘 (𝑥0 )].
Pominięcie ustalonego argumentu powoduje uogólnienie macierzy na cały zbiór, w którym funkcja
f jest różniczkowalna. Macierz ta nazywana jest macierzą Jacobiego, a jej wyznacznik, o ile
istniej, nazywany jest jakobianem. Dla macierzy Jacobiego stosuję się oznaczenie J lub po prostu
A. W zapisie ogólnym najczęściej pomija się argument x, zaś dla zaznaczenia, iż chodzi o pochodną
w ustalonym punkcie 𝒙𝟎 stosuje się zapis 𝑱(𝒙𝟎 ) lub A(𝒙𝟎 ), ewentualnie 𝑱𝒙𝟎 lub 𝑨𝒙𝟎 .
5
Przykład:
𝑓 = (𝑓1 , 𝑓2 ),
gdzie
𝑓1 = 𝑥 2 − 𝑦 2
𝑓2 = 2𝑥𝑦 w punkcie 𝑃0 = (2,1)
Macierz Jacobiego wygląda następująco:
𝜕𝑓1
𝜕𝑓1
(𝑥, 𝑦)
(𝑥, 𝑦)
𝜕𝑥
𝜕𝑦
2𝑥
𝐽𝑓 (𝑥, 𝑦) =
=[
2𝑦
𝜕𝑓2
𝜕𝑓2
(𝑥, 𝑦)
(𝑥, 𝑦)
[ 𝜕𝑥
𝜕𝑦
]
Jakobian wynosi:
−2𝑦
]
2𝑥
𝑑𝑒𝑡 𝐽𝑓 = 4𝑥 2 + 4𝑦 2
Dla punktu 𝑃0 = (2,1) otrzymamy zatem
𝐽𝑓 (2,1) = [
4 −2
]
2 4
oraz
4 −2
𝑑𝑒𝑡 𝐽𝑓 (2,1) = |
| = 16 + 4 = 20
2 4
7. Ekstrema funkcji.
Niech 𝑓 ∶ 𝐷𝑓 ↦ ℝ, 𝐷𝑓 ⊆ ℝ𝑛 będzie funkcją n-zmiennych. Niech 𝑈 ⊂ 𝐷𝑓 będzie zbiorem
otwartym i 𝑃0 =( 𝑥01 , . . . , 𝑥0𝑛 ) ∈ 𝑈
Definicja 1: Funkcja f ma w punkcie 𝑃0 minimum lokalne, jeżeli istnieje otoczenie 𝑈 ⊂ 𝐷𝑓 punktu
𝑃0 takie że dla każdego punktu 𝑃 ∈ 𝑈 i 𝑃 ≠ 𝑃0 spełniona jest nierówność:
𝑓(𝑃) ≥ 𝑓(𝑃0 ).
Funkcja 𝑓 posiada w punkcie 𝑃0 minimum lokalne właściwe, jeżeli istnieje otoczenie 𝑈 ⊂ 𝐷𝑓
punktu 𝑃0 ,takie że dla każdego punktu 𝑃 ∈ 𝑈 i 𝑃 ≠ 𝑃0 spełniona jest nierówność
𝑓(𝑃) > 𝑓(𝑃0 ).
Definicja 2: Funkcja 𝑓 ma w punkcie 𝑃0 maksimum lokalne, jeżeli istnieje otoczenie 𝑈 ⊂ 𝐷𝑓
punktu 𝑃0 , takie że dla każdego punktu 𝑃 ∈ 𝑈 i 𝑃 ≠ 𝑃0 spełniona jest nierówność
𝑓(𝑃) ≤ 𝑓(𝑃0 )
Funkcja 𝑓 ma w punkcie 𝑃0 maksimum lokalne właściwe, jeżeli istnieje otoczenie 𝑈 ⊂ 𝐷𝑓 punktu
𝑃0 , takie że dla każdego punktu 𝑃 ∈ 𝑈 i 𝑃 ≠ 𝑃0 spełniona jest nierówność
𝑓(𝑃) < 𝑓(𝑃0 )
MINIMA I MAKSIMA LOKALNE NAZYWAMY EKSTREMAMI LOKALNYMI.
Definicja 3: Liczba 𝑚 jest najmniejszą wartością funkcji 𝒇 na zbiorze 𝑨 ⊆ 𝑫𝒇 , jeżeli istnieje punkt
𝑃0 ∈ 𝐴 , taki że
𝑓(𝑃0 ) = 𝑚
6
I dla każdego 𝑃 ∈ 𝐴
𝑓(𝑃) ≥ 𝑓(𝑃0 ) = 𝑚
Liczbę 𝑚 nazywamy minimum globalnym funkcji 𝒇 na zbiorze 𝑨.
Definicja 4: Liczba 𝑀 jest największą wartością funkcji 𝒇 na zbiorze 𝑨 ⊆ 𝑫𝒇 , jeżeli istnieje punkt
𝑃0 ∈ 𝐴 , taki że:
𝑓(𝑃0 ) = 𝑀
I dla każdego punktu 𝑃 ∈ 𝐴
𝑓(𝑃) ≤ 𝑓(𝑃0 ) = 𝑀
Liczbę M nazywamy maksimum globalnym funkcji 𝒇 na zbiorze A.
MINIMUM I MAKSIMUM GLOBALNE NAZYWAMY EKSTEMAMI GLOBALNYMI.
Twierdzenie: (Warunek konieczny istnienia ekstremum)
𝜕𝑓
Jeżeli f ma ekstremum w punkcie 𝑃0 oraz istnieją pochodne cząstkowe 𝜕𝑥 , 𝑖 = 1, … , 𝑛 w punkcie
𝑖
𝑃0 , to ∇𝑓(𝑃0 ) = 0.
Punkt 𝑃0 , w którym przynajmniej jedna pochodna cząstkowa nie istnieje lub w którym wszystkie
pochodne cząstkowe są równe 0 nazywamy punktem krytycznym funkcji f.
Punkt krytyczny 𝑃0 , w którym spełniony jest warunek ∇𝑓(𝑃0 ) = 0 nazywamy punktem
stacjonarnym funkcji f.
Twierdzenie: (Warunek dostateczny istnienia ekstremum)
Załóżmy, że funkcja f ∶ U ↦ ℝ jest dwukrotnie różniczkowalna w punkcie 𝑃0 ∈ 𝑈, przy czym
𝑓 ′ (𝑃0 ) = 0. Jeżeli 𝑓 ′′ (𝑃0 ) jest formą dodatnio określoną (odpowiednio ujemnie określoną), to
funkcja f ma w punkcie a minimum lokalne właściwe ( odpowiednio maksimum lokalne właściwe).
Jeżeli natomiast 𝑓 ′′ (𝑃0 ) jest formą nieokreśloną, to funkcja f nie ma w punkcie 𝑃0 ekstremum
lokalnego.
7