Konrad Łukaszewski

Transkrypt

Konrad Łukaszewski
Konrad Łukaszewski
Wstęp do elektroniki kwantowej i optyki nieliniowej
Łódź 1999 
3
Spis treści
Przedmowa...............................................................................................................................................................4
Część 1.
Wstęp do elektroniki kwantowej i podstawy działania laserów
Wprowadzenie.........................................................................................................................................................5
1.1. Zjawisko emisji wymuszonej jako podstawa elektroniki kwantowej. Opis przejść w układach
kwantowych za pomocą współczynników Einsteina........................................................................................6
1.2. Związek współczynników Einsteina z budową cząsteczek emitujących i pochłaniających światło.................8
1.3. Kształt linii emisyjnych i wpływ poszerzenia linii na prawdopodobieństwo przejść.....................................10
1.4. Inwersja obsady jako warunek wzmocnienia promieniowania ......................................................................17
1.5. Rezonator optyczny jako element generatora laserowego..............................................................................20
1.6. Badanie stabilnościrezonatorów.....................................................................................................................23
1.7. Własności wiązki gaussowskiej......................................................................................................................29
1.8. Interferometr Fabry’ego - Perota w spektroskopii laserowej..........................................................................31
1.9. Otrzymywanie inwersji obsady w laserach różnych typów............................................................................34
1.10. Metody modyfikacji przestrzenno-czasowych charakterystyk promieniowania laserowego........................39
Część 2
Podstawowe pojęcia i zjawiska optyki nieliniowej
Wprowadzenie..................................................................................................................................................................44
2.1. Równania Maxwella i nieliniowe procesy................................................................................................................45
2.2. Dyspersja nieliniowej polaryzacji.............................................................................................................................46
2.3. Zastosowanie klasycznego modelu oddziaływania światła z materią dla wyjaśnienia efektów
nieliniowych...................................................................................................................................................47
2.4. Warunek dopasowania fazowego w nieliniowych oddziaływaniach......................................................................51
2.4. Wpływ symetrii kryształu na tensor polaryzowalności kwadratowej.....................................................................54
2.6. Równanie falowe w ośrodku nieliniowym i przepływ energii pomiędzy oddziaływującymi falami
świetlnymi.................................................................................................................................................................58
2.7. Realizacja warunku dopasowania fazowego w kryształach....................................................................................61
2.8. Efektywna polaryzowalność kwadratowa w zjawisku generacji drugiej harmonicznej.................................64
2.9. Procesy parametryczne w nieliniowym oddziaływaniu fal świetlnych..........................................................66
Literatura................................................................................................................................................................70
4
Przedmowa
Materiał prezentowany w tym skrypcie odpowiada treści wykładu o tej samej nazwie: „Wstęp do
elektroniki kwantowej i optyki nieliniowej”, który prowadzę dla studentów szóstego semestru fizyki technicznej
na Wydziale Fizyki Technicznej, Informatyki i Matematyki Stosowanej.
W zamyśle autora miało to być spójne i zwięzłe opisanie podstawowych pojęć i zjawisk, z którymi
spotykamy się w fizyce laserów oraz w optyce nieliniowej obejmującej szczególną klasę oddziaływań światła
laserowego z materią. Problemy konstrukcji i własności konkretnych typów laserów występują tu więc raczej
jako ilustracja ogólniejszych zagadnień takich jak wybór ośrodka czynnego i sposobu wzbudzania, warunki
wystąpienia akcji laserowej, sposoby wpływania na jej przebieg. Zastosowania laserów porusza się tu w jeszcze
bardziej ograniczonym zakresie.
Mam jednak nadzieję, że to co przedstawiam w trwającym jeden semestr wykładzie (i w niniejszym
skrypcie) może stanowić podstawę do czytania specjalistycznej literatury dotyczącej działania i wykorzystania
laserów oraz do studiowania obszerniejszych opracowań z tej dziedziny.
Dla studentów niektórych specjalności okazją do poszerzenia wiadomości i pracy z laserami będą
laboratoria elektroniki kwantowej i optyki nieliniowej oraz fizyki laserowych procesów materiałowych,
znajdujące się w programie następnych semestrów. Zachęcam też do wysłuchania wykładu „Elektronika
kwantowa” gdzie poruszane będą już tyko wybrane, ale bardzo ciekawe i aktualne zagadnienia związane z
oddziaływaniem światła laserowego z materią i konstrukcją najnowszych typów laserów
Zrozumienie treści wykładu będzie znacznie łatwiejsze dla studentów wcześniej zapoznanych
z elektrodynamika klasyczną i podstawami mechaniki kwantowej.
Konrad Łukaszewski
5
Część 1.
Wstęp do elektroniki kwantowej i podstawy działania laserów
Wprowadzenie
Elektronika kwantowa to dział fizyki zajmujący się metodami wzmacniania i generacji promieniowania
elektromagnetycznego poprzez wykorzystanie zjawiska emisji wymuszonej w termodynamicznie
niezrównoważonych układach kwantowych. Elektronika kwantowa zajmuje się też własnościami otrzymanych w
ten sposób wzmacniaczy i generatorów oraz ich zastosowaniami.
W dziale techniki zwanym elektroniką również mamy do czynienia z generacją fal
elektromagnetycznych. Odbywa się to tylko w innym zakresie częstości i nie z wykorzystaniem elementarnych
oscylatorów atomowych ale poprzez wywoływanie oscylacyjnych prądów w pewnych specjalnych obwodach,
które nawet w przypadku układów scalonych są obiektami makroskopowymi.
Nie powinno więc dziwić, że w elektronice kwantowej i optyce nieliniowej występuje szereg pojęć
i zjawisk mających swoje odpowiedniki w elektronice technicznej i że zapożyczono z niej szereg terminów i
pojęć.
6
Zjawisko emisji wymuszonej jako podstawa elektroniki kwantowej. Opis przejść
w układach kwantowych za pomocą współczynników Einsteina
1.1.
Fala elektromagnetyczna (będziemy mówić krótko  światło) przechodząc przez układ kwantowy
(atomów, cząsteczek o odpowiednich różnicach energii poziomów energetycznych) może podlegać absorpcji i w
rezultacie przenosić cząstki do stanu wzbudzonego. Fala ta może jednak oddziaływać również z cząstkami już
wzbudzonymi. Zachodzi wtedy zjawisko emisji wymuszonej  cząstka przechodzi do stanu podstawowego, a
emitowany foton jest pod każdym względem identyczny jak fotony fali padającej.
Jeśli fala padająca jest idealnie monochromatyczna i spójna to dołączające do niej fotony
promieniowania wymuszonego nie psują tej spójności w żadnym stopniu. W odpowiednich warunkach nawet
pojedynczy foton mógłby więc wywołać prawdziwą lawinę identycznych fotonów, razem stanowiących wiązkę
światła o wyjątkowej spójności. Należy tu przypomnieć, że identyczne fotony to takie, które charakteryzują się
jednym wektorem pędu i takim samym znakiem rzutu spinowego momentu pędu na kierunek propagacji (czyli
mające tą samą skrętność).
Rozpatrzmy pewne dwa poziomy energetyczne atomu lub cząsteczki ( umownie nazwiemy ten obiekt
cząstką) i oddziaływującą z układem takich cząstek falę elektromagnetyczną o energii fotonów odpowiadającej
różnicy energii tych wybranych poziomów.
Na rysunku zaznaczono możliwe w takiej sytuacji przejścia.
1
(a)
(b)
(c)
(d)
(a)-absorpcja
(b)-emisja spontaniczna
(c)-emisja wymuszona
(d)-relaksacja bezpromienista
2
Rys.1.1.1. Przejścia w dwupoziomowym układzie w obecności fali elektromagnetycznej.
Prawdopodobieństwa dW przejść cząstki pomiędzy stanami 1 i 2 , z którymi związane są emisja lub absorpcja
promieniowania, dla czasu dt, określa się za pomocą współczynników wprowadzonych przez Einsteina w sposób
następujący:
absorpcja
emisja wymuszona
emisja spontaniczna
dW12  B12   dt
dW21  B 21  dt
spont
dW21
 A 21dt
W odróżnieniu od emisji spontanicznej absorpcja i emisja wymuszona, jako procesy oddziaływania fali
elektromagnetycznej z cząstkami układu, są tym bardziej intensywne im większa jest gęstość promieniowania ν
obecnego w układzie.
Zakładając, że prawdopodobieństwo przejść bezpromienistych jest zaniedbywalne, w warunkach
równowagi termodynamicznej obsada poziomów ( ilość cząstek układu o energii stanu podstawowego lub
wzbudzonego ) musi być ustalona. Zapiszmy dla tej sytuacji bilans przejść zwiększających i zmniejszających
obsadę np. poziomu 2.
spont
n1dW12  n 2 dW21
 n 2 dW21
n1B12    n 2 A 21  n 2 B 21 
Współczynniki Einsteina są więc od siebie zależne. Wykorzystując w powyższym równaniu rozkład
Boltzmana, który opisuje obsadę poziomów energetycznych dla coraz wyższych energii w warunkach równowagi
termodynamicznej i wyliczając następnie wyrażenie na gęstość energii można po porównaniu go ze wzorem
Plancka otrzymać bliższe związki między współczynnikami Einsteina.
Zgodnie z rozkładem Boltzmana obsada przypadająca na jedną składową zdegenerowanego poziomu
maleje wraz z wartością energii:
7
n 2  (g 2 / g1 )n1 exp[(E 2  E1 ) / kT ]
gdzie g1, g2 oznaczają stopień degeneracji poziomów.
Degeneracja oznacza, że daną wartość energii cząstka może posiadać będąc w kilku różnych (np. ze względu na
zestaw liczb kwantowych) stanach.
Stąd
n1B12    (g 2 g1 )n1 exp (E 2  E1 ) / kT (B 21   A 21 )
Otrzymane po przekształceniach powyższego wyrażenie na gęstość energii v ma postać :
  A 21
B12
1
(g 2 /g 1 )exp[ (E 2  E1 )/kT]
A 21

B12 g1
exp( E 2  E1 ) / kT  1
 (g 2 / g1 )B21exp[ (E 2  E1 )/kT] B21
B21g 2
porównując ze wzorem Plancka
  (8 2 / c 3 ) h
1
exp[ h / kT]  1
otrzymuje się zależności :
B12 g1  B 21g 2
oraz
A 21  (8 2 / c 3 )hB 21
W paśmie optycznym fal elektromagnetycznych   61014Hz więc A21  1,3410-12B21 . Z tego
oszacowania nie należy wyciągać wniosku, że układ cząstek pozostający w równowadze termodynamicznej z
promieniowaniem elektromagnetycznym wysyła głównie promieniowanie wymuszone. Prawdopodobieństwo
emisji wymuszonej zależy bowiem dodatkowo od gęstości energii pola elektromagnetycznego v. Jeśli więc
porównywać A21 z iloczynem vB21 to dopiero dla temperatury 41500K wartości te zrównają się i w
termodynamicznie zrównoważonym promieniowaniu ciała doskonale czarnego emisja spontaniczna i wymuszona
miałyby taki sam wkład.
Powyższe związki między współczynnikami Einsteina wyprowadzono rozważając pole
elektromagnetyczne pozostające w równowadze termodynamicznej z układem cząstek, który to układ pochłania
promieniowanie i jednocześnie jest jego źródłem. Obowiązują one jednak również wtedy, gdy promieniowanie
jest pochodzenia zewnętrznego, gdyż pojedyncza cząstka absorbując bądź emitując światło nie rozróżnia czy
oddziaływujące z nią promieniowanie wysyłane jest przez inne cząstki, czy też jest ono zewnętrzne w stosunku
do całego układu.
A21 można także nazwać szybkością spontanicznego zaniku obsady poziomu wzbudzonego, bowiem
stąd
dn 2  n 2 A 21dt
n 2  n 2 (0) exp( A 21 t )  n 2 (0) exp( t / )
Jeśli  jest czasem, po którym obsada poziomu 2 (ilość cząstek w stanie wzbudzonym) maleje e razy
(amplituda natężenia pola elektrycznego emitowanego spontanicznie światła maleje tak samo) to odwrotność
tego czasu, czyli A21 należy nazwać szybkością spontanicznego zaniku obsady.
Trzeba podkreślić, że dany zestaw współczynników Einsteina dotyczy tylko dwóch konkretnych
poziomów konkretnego atomu. Dla dwóch innych poziomów, w tym samym bądź w innym atomie, wartości tych
współczynników są oczywiście inne.
8
1.2.
Związek współczynników Einsteina z budową cząsteczek emitujących i
pochłaniających światło.
Związki te znajdziemy badając oddziaływanie światła z atomem w tzw. podejściu półklasycznym, co
znaczy, że pole promieniowania opisywane będzie klasycznie a atom za pomocą mechaniki kwantowej.
Promieniowanie elektromagnetyczne będzie się traktować jako źródło zaburzenia, które uwzględnione w postaci
hamiltonianu prowadzi do rozwiązań równania Schrödingera innych niż w przypadku stacjonarnym, gdy nie ma
zaburzenia.
W równaniu Schrödingera
H  i

t
gdzie hamiltonian jest sumą części niezaburzonej Ho i części HP zwanej hamiltonianem zaburzenia H=Ho+HP,
HP ma postać zależną od energii oddziaływania atomu z polem i zakłada się, że jest małą poprawką względem
zasadniczej części Ho - operatora energii elektronu dla sytuacji niezaburzonej (stacjonarnej).
Zakłada się rozwiązanie tego równania jako następującą funkcję falową:
 ( x, t )   c n ( t ) exp[ iE n t /  ]n ( x )
n
gdzie n są rozwiązaniami stacjonarnego równania Schrödingera
H o   E
En to energie własne odpowiadające funkcjom własnym n , zaś cn(t) to współczynniki, których wartości należy
wyznaczyć.
Powyższe rozwinięcie funkcji falowej Ψ(x,t) w szereg względem funkcji n(x), czy też
n(x,t)=exp[iEnt / ћ]n (x) jest możliwe, gdyż zbiór funkcji n (n) jest tzw. zbiorem zupełnym. Funkcje
n i n są ponadto ortogonalne, co znaczy, że

 m  n dV   mn
V
Całkowanie dotyczy objętości nie mniejszej niż zajmowana przez cząstkę, której stany opisują funkcje .
Funkcję falową stanu zaburzonego można więc traktować jako mieszankę funkcji falowych stanów
stacjonarnych, wziętych z odpowiednimi wagami cn(t).
Twierdzi się, że w momencie wyłączenia zaburzenia elektron znajdzie się najprawdopodobniej w stanie
stacjonarnym o numerze odpowiadającym temu wyrazowi szeregu, którego waga w chwili ustania zaburzenia
była największa. Prawdopodobieństwa przejścia, po wyłączeniu zaburzenia, do innych stanów są mniejsze, ale
dalej zależne od odpowiednich współczynników cn. Ponieważ waga cn(t) jest wielkością zespoloną, zaś
prawdopodobieństwo przejścia jest liczbą rzeczywistą nieujemną to związek między nimi należy przyjąć w
postaci:
Wn 0 m  c m ( t )
2
Prawdopodobieństwo
Wn 0 m przejścia ze stanu początkowego n0 do końcowego m jest bezpośrednio
B n o m . Tak więc wartości współczynników Einsteina B n o m można
znaleźć wyznaczając współczynniki cn(t) w rozwinięciu funkcji falowej stanu zaburzonego względem funkcji
związane ze współczynnikiem Einsteina
falowych stanów niezaburzonych. Odbywa się to w następujący sposób.
9
Funkcję Ψ(x,t) w postaci szeregu wstawiamy do ogólnego równania Schrödingera.

 (H o  H p )c n (t) exp[iE n t /  ] n (x )  i  t c n ( t) exp[iE n t /  ] n ( x )
n
n
Następnie różniczkujemy po czasie i redukujemy występujące po lewej i prawej stronie fragmenty
odpowiadające stacjonarnemu równaniu Schrödingera.
Przy założeniu, że operator HP działa tylko na funkcje zależne od współrzędnej przestrzennej x
otrzymuje się :
d
 c n (t ) exp[iE n t /  ]H p  n (x )  i dt [c n (t )] exp[iE n t /  ] n (x )
n
n
Po lewostronnym pomnożeniu przez *m całkujemy po objętości i korzystając z warunku ortogonalności
funkcji n otrzymujemy równanie:
d

i  c m ( t )    c n (t ) exp[i mn t ]H pmn
 dt
 n
(*)
gdzie element macierzowy operatora zaburzenia Hpmn to :
H mn  m H p n    m H p  n dV
p
V
oraz
 mn  (E m  E n ) / 
t0 cząstka znajdowała się w stanie opisywanym funkcją  n 0
można dla tego momentu określić współczynnik cn jako:
Zakładając, że w chwili początkowej
( 0)
c n ( t 0 )  c n   n ,n 0
a następnie wykorzystać to po prawej stronie równania (*) jako punkt wyjścia do iteracyjnej metody obliczania
coraz to dokładniejszych wartości współczynników cm(t). W rezultacie otrzymuje się następujące wzory na te
współczynniki w pierwszym i drugim przybliżeniu :
t
t
c (m1) ( t )  ( i / )  c (n0 ) exp[ i mn 0 ]H pmn d  const ( i /  )  exp[i  mn0 ]H pmn d   m ,n 0
0
t0
t
t0
0
c m ( t )  (i /  )   c n exp[ i mn ]H mn d
( 2)
(1)
p
t0 n
W ten sposób znane są więc również wartości prawdopodobieństw przejść i współczynniki Einsteina.
Przy okazji powyższych rachunków można zwrócić uwagę na to, że dla pewnych par indeksów n i m (czyli dla
pewnych par funkcji falowych) element macierzowy operatora zaburzenia Hpmn może się zerować. Fakt ten jest,
obok zasad zachowania momentu pędu, przyczyną obowiązywania tzw. reguł wyboru, na które będziemy się
10
powoływać w następnych wykładach rozważając przejścia kwantowe w ośrodkach czynnych konkretnych
laserów.
11
1.3.
Kształt linii emisyjnych i wpływ poszerzenia linii na prawdopodobieństwo przejść
Badając przy pomocy spektrografu promieniowanie emitowane przez jakiekolwiek ciało otrzymuje się
na kliszy fotograficznej naświetlone linie odpowiadające składowym o różnych częstotliwościach. Linie te
zawsze mają pewną szerokość. Związane jest to nie tyle z własnościami kliszy lub ze zbyt niską rozdzielczością
spektrografu, co z faktem, że każda linia powstaje w wyniku naświetlenia promieniowaniem o częstotliwości z
pewnego ciągłego przedziału. Dodatkowo w obrębie linii natężenie światła zmienia się. Można więc mówić o
widmowej gęstości mocy odpowiadającej tzw. kształtowi linii.
Poszerzenie naturalne.
Podstawową przyczyną warunkującą niezerową szerokość linii jest zasada nieoznaczoności
Heisenberga. Jeden z wariantów tej zasady ma bowiem postać:
E    
Jeżeli ∆τ określa czas życia cząstki w stanie wzbudzonym to ∆E jest dokładnością określenia jej
energii w tym stanie. Rozmycie wartości energii poziomu wzbudzonego przenosi się bezpośrednio na rozmycie
wartości częstotliwości promieniowania emitowanego przy przejściu do stanu podstawowego. Dlatego każda
linia spektralna ma pewną szerokość ∆.
 
1
, bo przecież energia fotonu E=h.
2
Ten rodzaj poszerzenia jest zawsze obecny i nazywa się poszerzeniem naturalnym.
Dla określenia kształtu linii, czy też widmowej gęstości mocy należy odwołać się do jakiegoś modelu
opisującego proces emisji.
W najprostszym klasycznym modelu przyjmuje się, że elementarnym źródłem promieniowania jest
oscylator elektronowy tłumiony wysyłający falę elektromagnetyczną o takiej częstotliwości z jaką odbywają się
jego drgania. Natężenie pola elektrycznego emitowanej fali zmienia się w konkretnym punkcie przestrzeni w
rytm drgań oscylatora. Czyli mając rozwiązanie równania ruchu oscylatora x(t) możemy powiedzieć, że zmiany
E(t) są opisane funkcją o takim samym przebiegu.
Natężenie fali, czyli energia padająca na jednostkową powierzchnię w jednostce czasu, jest
proporcjonalne do kwadratu natężenia pola elektrycznego rozumianego jako E(t)E*(t).
Całkowita ilość energii wyemitowanej przez oscylator jest ostatecznie proporcjonalna do wartości całki :


 E t   E  tdt .

Twierdzenie Parsevala pozwala na zapisanie następującego związku:


 t dt  1

E

t


E

 E  E d
2


gdzie E() i E*() są transformatami Fouriera odpowiednio funkcji E(t) i E*(t), np.:
E  

 Et  exp it dt .

12
Wyrażenie G()=E()E*() można nazwać widmową gęstością mocy. Ze względu na uzasadnioną
wyżej odpowiedniość funkcji E(t) i X(t), widmowa gęstość mocy promieniowania po unormowaniu musi
odpowiadać charakterystyce częstotliwościowej g() oscylatora emitującego falę:
g  
E E 
X   X 



 d

E




E

 X   X d


X() jest tu transformatą Fouriera funkcji x(t) opisującej drganie elektronu.
Problemem znalezienia funkcji opisującej kształt linii naturalnie poszerzonej sprowadza się więc do
rozwiązania równania ruchu oscylatora elektronowego:
x  x   x o2  0
gdzie  jest stałą tłumienia zaś o częstością drgań własnych.
Rozwiązaniem może być funkcja postaci exp(t). Po podstawieniu jej do równania otrzymuje się
warunek na parametr :

    i  2o  (  / 2) 2
2
Rozwiązanie ogólne, jako kombinacja liniowa rozwiązań szczególnych, jest następujące:
 

 

X( t )  C  exp (   i 2o  (  / 2) 2 ) t   C exp (  i 2o  (  / 2) 2 ) t 
 2

 2

Przedstawia ono zmiany położenia elektronu w czasie, powinno więc przyjmować wartości rzeczywiste. Dlatego
C+=C-=C/2. Przy tym warunku
Xt   C exp[ t / 2] cos 1 t , gdzie (ω1)2=( ωo)2 – (γ/2)2.
Znajdujemy teraz transformatę Fouriera funkcji X(t)
X t 



o
 i t
 X t  e dt 
Całka liczona jest w granicach
Ostatecznie:



C  t / 2 i1t
e
e  e i 1t  e i t dt
2
0, gdyż zakłada się, że dla t<0 X(t)=0.


C
1
1

X 




2 


i






i





1
1 
 2
2

Dla znalezienia charakterystyki widmowej oscylatora a jednocześnie, jak wyżej uzasadniono, widmowej
gęstości mocy trzeba znormalizować wyrażenie G()=X()X*().
G() ma być znormalizowane w takim zakresie wartości argumentu jakie może przyjmować
częstotliwość emitowanego światła, czyli co najwyżej w przedziale od 0 do  . Wyrażenie na X() jest sumą
dwóch składników, z których pierwszy ma maksimum dla częstotliwości dodatnich, drugi zaś dla ujemnych.
13
W zakresie częstości dodatnich dominuje więc pierwszy składnik i w związku z tym przy normalizacji w
przedziale (0,) drugi składnik można pominąć.
Przy dodatkowym założeniu małego tłumienia otrzymujemy:


0
1
G  C2
4


0

 2
2



1 21
o

d  C
arctang




arctang



4


 (  o ) 2


2
 2
1

 C 2 
 
2




bo założono o>>.
Ostatecznie:
1
g  



 2
2
2
 (   o ) 2

1
 l / 2

 l / 2 2  (  o ) 2
Linię o takim kształcie nazywa się lorentzowską. Wartość maksymalna g(o)=2/, natomiast g
(o2)=g(o)/2. Tak więc  wyznacza szerokość linii widmowej w połowie jej wysokości.
Przy przejściu od częstości kołowych  do częstotliwości  kształt linii określa funkcja g(), związana
oczywiście z g() ale nieco inna, gdyż .


gd  g  d otrzymuje się: g ()  2  g () .
Z warunku


0
0
Wystarczy następnie wyrazić  przez
g   
1

 
 2
4
 i wtedy:

4
 (   o ) 2

1
 l / 2

 g l ( )
   l / 2 2  (    o ) 2
Teraz wartość maksymalna g(o)=4/, a szerokość połówkowa jest l.
Rys1.3.1. Wykres gęstości widmowej mocy dla naturalnie poszerzonej linii emisyjnej.
14
Omówione powyżej poszerzenie linii emisyjnej jest zawsze obecne i wiąże się ze skończonym czasem
życia cząstki w stanie wzbudzonym.
Obserwowane linie emisyjne są na ogół szersze niż wynikałoby to z poszerzenia naturalnego. Powodem
tego mogą być, między innymi, ruch źródła podczas emisji lub zderzanie się cząstek. Okoliczności te prowadzą
do poszerzenia zwanego dopplerowskim i do poszerzenia zderzeniowego.
Poszerzenie dopplerowskie.
Ze względu na zjawisko Dopplera częstotliwość światła emitowanego przez poruszające się źródło różni
się od częstotliwości o z jaką promieniuje źródło stacjonarne:
 u
   o 1  
 c
gdzie c=3108 m/s , zaś u to składowa prędkości źródła w kierunku do obserwatora.
Jeśli w układzie emitującym światło znajduje się wiele cząstek poruszających się z różnymi
prędkościami, to w widmie promieniowania pojawi się wiele różnych częstotliwości. W przypadku ciągłego
rozkładu prędkości cząstek otrzymamy ciągły rozkład natężenia emitowanego światła względem częstotliwości.
To jaka część mocy emitowana jest w przedziale częstotliwości d wokół  zależy od tego, jaka część cząstek
porusza się z prędkościami dającymi takie właśnie częstotliwości emitowanego światła. Temu stwierdzeniu
odpowiada równanie:
g ( )  d  p( u )  du
gdzie g() to poszukiwana widmowa gęstość mocy natomiast p(u) to gęstość rozkładu prędkości cząstek:
p (u ) 
N( u )
N
( N - całkowita ilość cząstek w jednostce objętości, N(u) ilość cząstek o prędkości u ).
Poszerzenie dopplerowskie występuje w zasadzie tylko w sytuacji gdy źródłem promieniowania jest
ośrodek gazowy. Rozkład prędkości cząstek gazu to znany rozkład Maxwella. Należy jednak zwrócić uwagę, że
dla znalezienia widmowej gęstości mocy wykorzystamy mniej znaną, choć podstawową postać rozkładu
Maxwella , a mianowicie:
  u 2 
 
p u  
exp  
  u o  
uo 


1
u jest tu składową prędkości cząstek w pewnym ustalonym kierunku ( kierunku, w którym rozchodzi się badane
promieniowanie ) , a stała uo=(2kT/m)1/2 to tzw. średnia prędkość termiczna.
Ze wzoru Dopplera wynikają ponad to związki:
   o
u  c  
 o
c

 oraz du 
d .

o

W rezultacie widmowa gęstość mocy dla poszerzenia dopplerowskiego ma gaussowską postać:
 c2
c
g d ( ) 
exp  2
 uo
uo o 

   o

 o



2
 
1
o

exp  




  T
T

 



2



15
T jest przesunięciem częstotliwości dla cząstki poruszającej się ze średnią prędkością termiczną uo a
jednocześnie określa szerokość krzywej rozkładu, gdyż w odległości T od środka linii natężenie zmniejsza się
e razy.
Maksimum natężenia dla linii dopplerowsko poszerzonej wypada dla =o czyli dla częstotliwości
emisji atomu nieruchomego. Stąd też gdyby na podstawie kształtu linii wnioskować o ruchu atomów gazu
(procedura jak gdyby odwrotna do wykorzystywanej powyżej) to mogło by się wydawać, że większość atomów
się nie porusza. Byłoby to sprzeczne z podstawowym założeniem kinetycznej teorii gazów o nieustannym ruchu
cząstek. Naprawdę nie ma tu jednak żadnej sprzeczności. Jeśli bowiem założyć, że 1/2 całkowitej ilości cząstek
porusza się mniej więcej w kierunku obserwatora (co trzeba rozumieć w ten sposób, że w ich wektorze prędkości
dominuje np.: składowa ux równoległa do kierunku obserwacji) to 2/3 cząstek porusza się mniej więcej w
płaszczyźnie prostopadłej (w ich wektorach prędkości dominują składowe uy i uz). Promieniowanie tych 2/3
całkowitej liczby cząstek odpowiada centralnej części linii emisyjnej. Nie są to jednak cząstki nieruchome - one
tylko poruszają się raczej prostopadle niż równolegle do kierunku obserwacji promieniowania.
Gdyby rozpatrywać emisję grupy atomów o jednej tylko wartości prędkości u to byłaby to linia
lorenzowska przesunięta w bok od punktu uo o wartość proporcjonalną do prędkości tych cząstek. Natężenie tej
linii byłoby coraz mniejsze dla większych bezwzględnych wartości u gdyż ilość cząstek o takich prędkościach
jest coraz mniejsza. Linię poszerzoną dopplerowsko można więc traktować jako obwiednię wielu linii
lorenzowskich odpowiadających atomom o różnych prędkościach, a więc przesuniętych względem częstotliwości
centralnej, których wysokość maleje wraz z przesunięciem od centrum. Ilustruje to poniższy rysunek.
Rys.1.3.2. Wykres gęstości mocy dla linii poszerzonej dopplerowsko.
Poszerzenie zderzeniowe.
Ze względu na złożoność aktu zderzenia (przenikanie się pól atomowych, chwilowo nie ustalone
wartości energii) należy przyjąć, że nawet jeśli zderzenie jest doskonale sprężyste w tym znaczeniu, że cząstka
nie zmienia swej energii (np. dalej jest w stanie wzbudzonym) to jej “życie” w danym stanie zaczyna się jak
gdyby na nowo, w chwili zderzenia. Jeśli gaz emitujących cząstek znajduje się pod dostatecznie dużym
ciśnieniem, to średni czas pomiędzy kolejnymi zderzeniami dla statystycznej cząstki może być krótszy niż czas
życia w stanie wzbudzonym cząstki, która nie podlega zderzeniom. Wykorzystując zasadę nieoznaczoności z
czasem zd (średnim czasem pomiędzy kolejnymi zderzeniami cząstki) otrzymuje się wtedy większe rozmycie
energii poziomu wzbudzonego i w związku z tym szerszą linię widmową w porównaniu do linii naturalnie
poszerzonej.
16
Poszerzenia jednorodne i niejednorodne.
Kryterium pozwalające na stwierdzenie czy dana linia emisyjna jest jednorodnie czy niejednorodnie
poszerzona jest następujące. Jeśli ma miejsce zróżnicowanie warunków emisji dla różnych cząstek (grup cząstek)
to dają one różne wkłady do całkowitego poszerzenia, które nazywa się wtedy niejednorodnym. Tak jest np. w
przypadku poszerzenia dopplerowskiego, gdy każdy fragment krzywej emisyjnej jest wynikiem promieniowania
cząstek o prędkościach z konkretnego przedziału wartości. Dla poszerzenia naturalnego i zderzeniowego nie da
się przypisać fragmentów krzywej emisyjnej określonym grupom cząstek, są to więc poszerzenia jednorodne.
Wpływ poszerzenia linii na prawdopodobieństwa przejść.
Współczynnik A21 będący szybkością spontanicznego zaniku obsady stanu wzbudzonego charakteryzuje
ten proces globalnie, czyli zależy od ilości przejść emisyjnych spontanicznych w jednostce czasu w obrębie całej
linii. Jednak prawdopodobieństwo emisji spontanicznej dla różnych częstości wewnątrz poszerzonej linii jest
inne. Można więc mówić o gęstości spektralnej prawdopodobieństwa emisji spontanicznej (w jednostce czasu ):
Wspont  g ( )  W spont
Naturalnie, przy takim zdefiniowaniu Wspont spełniony jest warunek:
spont
 W
d  W spont  A 21

Rozważmy teraz emisję wymuszoną monochromatyczną falą o częstotliwości . Można powiedzieć, że
w momencie przechodzenia obok wzbudzonej cząstki kwantu o energii h istnieje jedynie pewne
prawdopodobieństwo, że jej energia wzbudzenia jest równa akurat h i że w związku z tą zbieżnością zajdzie
emisja wymuszona. To prawdopodobieństwo musi zależeć od częstotliwości  podobnie jak
prawdopodobieństwo emisji spontanicznej. Stąd też definiujemy gęstość spektralną prawdopodobieństwa emisji
wymuszonej (dla monochromatycznego wymuszania) jako:
Wwym  g()  B 21   
Prawdopodobieństwo emisji wymuszonej w obrębie całej linii jest:
wym
W wym   W

d   g( )  B 21     d

Jeżeli częstotliwość fali wymuszającej odpowiada częstotliwości o środka linii emisyjnej, to
uwzględniając np. poszerzenie naturalne z powyższych dwóch wzorów otrzymujemy (dla (-o) ):
wym
W21
 g(  o )  B21   
2B 21
 l
gdzie  jest gęstością mocy fali wymuszającej natomiast l szerokością połówkową linii emisyjnej.
W układzie termodynamicznie zrównoważonym absorpcja promieniowania bilansuje się z emisją
spontaniczną i wymuszoną zarówno ogólnie jak i w każdym małym przedziale częstotliwości. W konsekwencji
również prawdopodobieństwo absorpcji musi zależeć od kształtu linii:
W12 
2B12
  l
17
Najważniejszy wniosek z powyższych rozważań jest taki, że skończona szerokość linii (choćby tylko
naturalnie poszerzonej) zmniejsza prawdopodobieństwo emisji wymuszonej. Nie można jednak powiedzieć, że
poszerzenie linii jest czynnikiem niekorzystnym jeśli chodzi o działanie laserów. Należy sobie jedynie zdawać
sprawę z istnienia takiej okoliczności, tym bardziej, że poszerzenie linii ma wpływ na działanie laserów również
z innych powodów, które ujawnią się w dalszych wykładach.
Ze względu na różnorodność ośrodków wykorzystywanych w elektronice kwantowej jako ośrodki
laserujące (od rozrzedzonych gazów do ciał stałych krystalicznych i anizotropowych) natura poszerzenia może
być różna, ale poszerzenie występuje zawsze i jest większe od naturalnej szerokości linii.
18
1.4.
Inwersja obsady jako warunek wzmocnienia promieniowania
Natężenie promieniowania przechodzącego przez oddziałujący z nim ośrodek (najczęściej absorpcyjny)
zmienia się zgodnie z prawem Bouguera:
dI    I  dx
lub
I  I 0 exp(x )
gdzie x jest drogą przebytą w ośrodku, dx różniczką tej wielkości zaś parametr  zwany jest współczynnikiem
absorpcji.
Pokażemy od czego zależy wartość tego współczynnika w sytuacji gdy energia fotonów fali wpadającej
do układu kwantowego odpowiada różnicy energii pewnych dwóch poziomów energetycznych dla jego cząstek.
Gęstość energii fali w ośrodku zmienia się na skutek absorpcji oraz emisji promieniowania. Założymy,
że mimo nieustannie zachodzących przejść obsady poziomu dolnego n1 i górnego n2 nie zmieniają się. Jest to
możliwe przy odpowiednio dużej szybkości procesów relaksacyjnych, do których zaliczymy zarówno relaksację
bezpromienistą jak i promieniowanie spontaniczne, które ze względu na swą izotropowość nie przyczynia się
bezpośrednio do zmiany natężenia fali rozchodzącej się w konkretnym kierunku.
Szybkość zmiany gęstości energii fali można w związku z tym określić następująco :
d  n 2 n 1  2B12g 1h



dt  g 2 g1     l
Wzór ten otrzymano przy uwzględnieniu lorentzowskiego poszerzenia linii emisyjnej i zależności
prawdopodobieństw emisji i absorpcji od kształtu linii, co było omawiane w poprzednim wykładzie.
Natężenie fali związane jest z gęstością energii wzorem :
I  c (c=3108 m/s)
Dlatego współczynnik absorpcji można wyrazić poprzez prędkość zmian gęstości fali świetlnej:

1 dI
1 c  d
1 d


I dx
c  c  dt
c dt
Ostatecznie
n
n
   1  2
 g1 g 2
 2B12 g1h

 c  
l

Widać, że dla uzyskania ujemnej wartości tego współczynnika, a w konsekwencji wzmocnienia zamiast
absorpcji, musi być spełniona nierówność :
n 2 n1

g 2 g1
Znaczy to, że obsada górnego poziomu przeliczona na jedną niezdegenerowaną składową musi być
większa niż podobnie rozumiana obsada poziomu dolnego. W takiej sytuacji mówi się , że ma miejsce inwersja
obsady dla danej pary poziomów.
Uzyskanie inwersji obsady jest możliwe tylko przy odpowiednio wydajnym dostarczaniu energii
z zewnątrz do układu. Ten proces nazywa się pompowaniem i może być realizowany na różne sposoby np.
poprzez absorpcję promieniowania zewnętrznego źródła (pompowanie optyczne), wyładowanie elektryczne
w gazach, reakcje chemiczne. Najpopularniejsze sposoby pompowania będą omawiane w innym wykładzie.
Możliwość uzyskiwania inwersji obsady poprzez określony sposób pompowania ściśle wiąże się
z układem poziomów energetycznych istotnych ze względu na działanie lasera. Dla cząstek jakiegokolwiek
19
ośrodka używanego jako wzmacniacz lub generator promieniowania daje się zawsze wyróżnić poziom
podstawowy (0), poziom wzbudzania (3), dolny poziom laserowy (1) i górny poziom laserowy (2).
Czasem jeden poziom może łączyć dwie z wymienionych funkcji. Krańcowym przypadkiem byłby tu
układ dwupoziomowy z pompowaniem optycznym falą o częstotliwości odpowiadającej różnicy energii
poziomów górnego i dolnego :
3,2
0,1
Rys.1.4.1. Schemat układu dwupoziomowego.
Uzyskanie inwersji obsady , a więc i wzmocnienia nie jest jednak możliwe w tym przypadku.
Odpowiednio intensywne promieniowanie pompujące będzie początkowo zwiększać obsadę poziomu górnego,
jednak od chwili gdy zrówna się ona z obsadą dolnego poziomu to emisja wymuszona zacznie równoważyć
absorpcję uniemożliwiając wystąpienie inwersji. Nastąpić jednak może tzw. wybielenie optyczne ośrodka
odpowiadające zerowej wartości współczynnika absorpcji.
Przy innych sposobach dostarczania energii do układu niż pompowanie optyczne nie ma tak
zasadniczych powodów niemożności wykorzystania układu dwupoziomowego. Tym niemniej w praktyce nie ma
ośrodka, w którym układ dwóch tylko poziomów charakteryzowałby się efektywnym pochłanianiem energii
pompowania przy jak najwęższym górnym poziomie, małą relaksacją bezpromienistą, i dużą wartością
współczynnika Einsteina B12 . Szukanie takiego ośrodka w sytuacji gdy jest tyle ośrodków o tróji czteropoziomowych układach poziomów, których zalet układ dwupoziomowy mieć nigdy nie może, wydaje się
niecelowe.
Zalety układów trój- i czteropoziomowych wynikają z rozdzielenia tych zasadniczych czterech funkcji ,
o których była wyżej mowa, między różne poziomy. Przy rozdzieleniu np. poziomów 2 i 3 można wybrać
ośrodek o szerokim poziomie wzbudzanym (3) co bardzo ułatwia pompowanie optyczne i jednocześnie wąskim
górnym poziomie laserowym (2), co daje wąską linię emisyjną.
3
2
0,1
Rys.1.4.2. Schemat układu trójpoziomowego.
W prezentowanych tu rysunkach cienką linią zaznaczono wzbudzanie pod wpływem pompowania, linią
kropkowaną szybką bezpromienistą relaksację z poziomu wzbudzanego na górny laserowy, natomiast grubą
strzałką przejście laserowe.
20
W układzie trójpoziomowym poziomy podstawowy i dolny laserowy są dalej połączone, stąd inwersja
nastąpi dopiero gdy co najmniej połowa cząstek zostanie wzbudzona.
Wady tej nie ma układ czteropoziomowy, w którym wszystkie funkcje są rozdzielone między różne
poziomy i który przedstawia kolejny rysunek.
3
2
1
0
:
Rys.1.4.3. Schemat układu czteropoziomowego.
Inwersja dla poziomów 2 i 1 wystąpi natychmiast po włączeniu pompowania, ale utrzyma się pod
warunkiem, że poziom dolny laserowy będzie się dostatecznie szybko opróżniał poprzez relaksację do poziomu
podstawowego.
Przykłady laserów reprezentujących wyżej omówione typy układów poziomów przedstawione będą w
jednym z dalszych wykładów.
21
1.5.
Rezonator optyczny jako element generatora laserowego
Załóżmy, że w układzie z inwersją obsady dla pewnych dwóch poziomów rozchodzi się promieniowanie
o takiej częstości, że może wywoływać emisję wymuszoną związaną z przejściami między tymi poziomami.
Gęstość energii promieniowania będzie wzrastać – nastąpi wzmocnienie. Gdyby możliwe było skierowanie
części wychodzącego z układu promieniowania z powrotem na jego wejście, to nastąpiłoby dalsze wzmocnienie,
ponieważ zwiększyłaby się liczba fotonów zdolnych wywołać emisję wymuszoną.
Używając terminów z teorii sterowania można by część wzmocnionego sygnału skierowaną z wyjścia
układu na wejście (w celu zwiększenia efektu wzmocnienia) nazwać dodatnim sprzężeniem zwrotnym.
W pewnych warunkach, których określeniem zajmiemy się poniżej, może dojść do samowzbudzenia
układu z dodatnim sprzężeniem zwrotnym. Samowzbudzenie polega na tym, że układ zaczyna wytwarzać sygnał
wyjściowy przy zerowym zewnętrznym sygnale wejściowym. Ośrodek zdolny wzmacniać promieniowanie może,
po zapewnieniu odpowiedniego sprzężenia zwrotnego, stać się źródłem promieniowania – generatorem
laserowym.
W przypadku wzmacniania i generacji promieniowania sprzężenie zwrotne jest realizowane poprzez
umieszczenie ośrodka aktywnego (z inwersją obsady) wewnątrz układu zwierciadeł zwanego rezonatorem
optycznym.
Warunek samowzbudzenia ośrodka aktywnego w rezonatorze Fabry’ego–Perota.
Najprostszym do analizy rezonatorem jest układ Fabry’ego – Perota, który tworzą dwie równoległe do
siebie powierzchnie odbijające – zwierciadła.
Rys.1.5.1. Przechodzenie promienia świetlnego przez układ Fabry’ego – Perota.
Rozpatrzmy przechodzenie przez taki układ fali płaskiej, a dokładniej jednego należącego do niej promienia
świetlnego. Współczynniki odbicia i transmisji dla amplitudy pola elektrycznego przy przechodzeniu z zewnątrz
do środka układu są r i t natomiast dla kierunku przeciwnego r’ i t’. Stosując zasadę odwracalności biegu
promieni w układach optycznych do najprostszego przypadku przechodzenia przez płaską powierzchnię
rozgraniczającą dwa ośrodki można wykazać, że:
r’= -r
,
tt’=1-r2.
Zakładając, że promień pada na układ pod niewielkim kątem (prawie prostopadle) zależność
współczynników odbicia i transmisji od kierunku polaryzacji można zaniedbać.
Jeśli między zwierciadłami znajduje się ośrodek aktywny (wzmacniający) to przy jednym przejściu
przez ten ośrodek moc światła rośnie K razy, a amplituda natężenia pola (K)1/2 razy. Promień, który wejdzie do
środka układu F – P doznaje kolejnych odbić od zwierciadeł, ale przy każdym odbiciu część jego energii
wydostaje się na zewnątrz. Wiązki wychodzące na zewnątrz są coraz słabsze wraz ze wzrostem liczby
wewnętrznych przebiegów lecz zebrane razem mogą interferować.
22
Uwzględniając te wszystkie wkłady otrzymuje się wyrażenie na natężenie pola elektrycznego fali
przepuszczonej przez układ F – P w postaci następującego szeregu:

2  
E t  K  E 0 exp i t 
 l    tt  
 


 K 3  E 0 exp i t  2  3l   tt   r'2 


 K 5  E 0 exp i t  2  5l   tt  r'4  ...


gdzie l jest drogą przebytą przez promień w ośrodku pomiędzy kolejnymi odbiciami.
W powyższym wzorze zastosowano konwencję zapisu pola fali w postaci zespolonej.
Znajdując sumę tego szeregu geometrycznego można otrzymać wyrażenie na zespolony współczynnik
wzmocnienia natężenia pola:


Et
 1 r2
E0

 2 
exp  i  l
  
K
2 
1  r 2 K exp   i
 2l 



Teraz można także znaleźć wzór określający współczynnik wzmocnienia mocy dla całego układu, równy
współczynnikowi transmisji:


2
I
E  E
1  R 2 K
1 r2 K
2
G  t  t t   

I0 E 0  E 0
1  2 r 2 K cos 4 l    r 4 K 2 1  2RK cos4 l   R 2 K 2
Parametr R=r2 jest współczynnikiem odbicia (pojedynczego) dla natężenia światła. Dla danych
wartości R i K współczynnik wzmocnienia mocy ma największą wartość gdy:
4l

 q  2  czyli l  q 

2
gdzie q jest liczbą całkowitą (o dużej wartości, ze względu na znaczną różnicę grubości ośrodka i
długości fali).
Oznacza to, że grubość ośrodka (odległość zwierciadeł) spełnia warunek na powstanie fali stojącej dla
promieniowania o długości fali λ, czyli układ jest w rezonansie z takim właśnie promieniowaniem.
W tych warunkach, określanych jako dostrojenie rezonatora, mamy:
G0
1  R 2 K

1  RK 2
Zwróćmy uwagę, że dla R=0: G0=K (całe promieniowanie padające przechodzi i jest wzmocnione
tylko przy jednym przejściu ośrodka aktywnego) a dla R=1: G0=0 (ponieważ wszystko odbija się i nic nie
przechodzi przez układ). Świadczy to o poprawności powyższego wzoru.
Gdy RK1, to współczynnik wzmocnienia mocy dąży do nieskończoności. Znaczy to, że dla dowolnie
małego sygnału wejściowego otrzymuje się na wyjściu sygnał o bardzo dużej mocy. Co więcej, zewnętrznego
sygnału wejściowego może wtedy w ogóle nie być, gdyż może go zastąpić jakaś składowa tzw. "szumu
optycznego” lub spontanicznie wyemitowany foton o odpowiedniej długości fali i o odpowiednim kierunku
obecny w samym układzie.
Dlatego warunek RK=1 nazwano warunkiem samowzbudzenia układu Fabry’ego-Perota z ośrodkiem
aktywnym. Przy jego spełnieniu zdolny do wzmocnienia układ staje się generatorem – źródłem promieniowania.
Długość fali generowanego promieniowania spełnia warunek rezonansu:
23
l  q

2
Wynika stąd możliwość wzbudzania się w rezonatorze wielu fal o nieco różnych częstotliwościach,
zwanych modami podłużnymi. Różnica częstotliwości dla dwóch sąsiednich modów jest:
   q 1   q 
c
2l
Wartość tej różnicy jest na tyle mała, że w obrębie poszerzonej linii emisyjnej zawsze mieści się pewna
ilość modów podłużnych.
Można więc powiedzieć, że w obrębie linii emisyjnej szansę na wzmocnienie ma tylko dyskretny zbiór
częstotliwości odpowiadających modom podłużnym. Współczynnik wzmocnienia dla fal o tych częstościach jest
większy niż gdyby wzbudzała się cała linia ze względu na mniejszą konkurencję wśród fotonów zdolnych
wywołać emisję wymuszoną. Z kolei konkurencja pomiędzy różnymi modami podłużnymi prowadzi do
znaczącego zwężenia linii emisyjnej.
24
1.6.
Badanie stabilności rezonatorów
Warunek samowzbudzenia rezonatora Fabry’ego-Perota wypełnionego ośrodkiem aktywnym jest
następujący:
RK=1 lub (1-T)K=1
gdzie R oraz T to odpowiednio współczynniki odbicia i transmisji dla natężenia fali przy padaniu na
odbijającą płaszczyznę (zwierciadło) rezonatora, natomiast K jest wzmocnieniem mocy przy jednokrotnym
przejściu ośrodka aktywnego.
Z powyższego równania wynika, że im większe wzmocnienie ośrodka tym większy (bliższy jedności)
może być współczynnik transmisji, a układ dalej będzie generatorem.
Tak więc warunek samowzbudzenia określa jaką część energii można wyprowadzić na zewnątrz
rezonatora nie zrywając przy tym generacji. Tę część energii można by nazwać stratami użytecznymi, bo co
prawda rezonator ją traci ale to właśnie ona stanowi promieniowanie, które można wykorzystać.
W każdym rzeczywistym rezonatorze istnieją jednak również prawdziwe straty, związane z zamianą
części energii promienistej w ciepło bądź z wychodzeniem promieniowania poza ośrodek na skutek dyfrakcji
przy odbiciu od zwierciadeł lub rozpraszaniu na niejednorodnościach. Obecność tych dodatkowych strat może
być zrównoważona większym wzmocnieniem K ośrodka. Jeśli wszystkie straty razem wzięte są za duże to układ
nie będzie generatorem mimo iż RK=1.
Tematem tego wykładu jest określenie zależności jakie muszą spełniać parametry charakteryzujące
rezonator (promienie krzywizn zwierciadeł R1 i R2, odległość między zwierciadłami L) aby straty dyfrakcyjne
były jak najmniejsze. Nazywa się to badaniem stabilności rezonatora. Im bardziej stabilny rezonator tym łatwiej
można go wykorzystać jako element generatora laserowego.
Istnieją dwa sposoby badania stabilności rezonatorów. Pierwszy metodami optyki geometrycznej bada
przechodzenie reprezentujących falę promieni świetlnych w przestrzeni między zwierciadłami. Stratom
dyfrakcyjnym odpowiada w tym podejściu wychodzenie promienia, po serii kolejnych odbić, poza aperturę
zwierciadeł. Efektem tego podejścia jest tzw. warunek stabilności rezonatorów.
Drugi sposób, oparty na teorii dyfrakcji i zwany metodą Foxa-Li, również pozwala na określenie czy
dany rezonator jest stabilny, a jeśli tak jest to dodatkowo daje rozkład amplitudy pola elektrycznego i natężenia
fali świetlnej w poprzecznym przekroju rezonatora (na zwierciadłach).
Warunek stabilności rezonatora w przybliżeniu optyki geometrycznej.
Przechodzenie promienia świetlnego przez soczewki, zwierciadła i przestrzenie między nimi można
opisać wykorzystując macierzową metodę analizy układów optycznych. Jeżeli dla promienia przechodzącego
przez dany element układu określić odległość od osi optycznej r i tangens kąta tworzonego z tą osią r’ to
wartości tych parametrów przed (na wejściu) i za badanym elementem (na wyjściu) można powiązać równaniem
macierzowym:
 r wyj   A B   rwej 
r '   


 wyj   C D   r ' wej 
Macierz transformacji:
A B
 C D


dla najprostszych elementów ma następującą postać:
 1
 1 / f

0
1
cienka soczewka o ogniskowej f,
25
1 L 
0 1 


pustka powietrzna o grubości L.
Dla układów optycznych składających się z kilku elementów macierz transformacji znajduje się mnożąc
jednokolumnową macierz promienia wejściowego przez macierze transformacji dla elementów składowych w
takiej kolejności, w jakiej napotykał je promień przechodzący z wejścia układu na jego wyjście.
Układem równoważnym rezonatorowi o długości L i zwierciadłach z promieniami krzywizn R1 i R2
(pod względem wpływu na parametry promienia świetlnego) jest falowód soczewkowy składający się z szeregu
soczewek o ogniskowych f1=R1/2 i f2=R2/2 oddzielonych pustką powietrzną o grubości L.
Rys.1.6.1. Fragment falowodu soczewkowego równoważnego rezonatorowi laserowemu.
Przejściu promienia w rezonatorze od zwierciadła 1 do 2 i z powrotem odpowiada w równoważnym mu
falowodzie przejście na przykład od płaszczyzny S do S+1 i od S+1 do S+2. Ze względu na to, że w
falowodzie soczewkowym promień nie wraca do płaszczyzny wyjściowej rysunek jest bardziej czytelny a analiza
łatwiejsza niż gdyby rozpatrywać zmiany parametrów przy kolejnych odbiciach od zwierciadeł.
Dla płaszczyzn S+1 i S mamy:
 rs 1   1
r '    1 / f
1
 s1  
0 1 L  1
1 0 1    1 / f 2
0 1 L  rs 
1 0 1  r 's 
przy czym równanie to powinno się w zasadzie zapisywać od prawej do lewej strony.
Wymnożenie macierzy we właściwej kolejności daje:
 rs 1   A B   rs 
r '    C D r ' 
 s
 s1  
gdzie
A = 1 - L/f2
B = L ( 2 - L/f2 )
C = - [ 1/f1 + ( 1 - L/f1 ) / f2 ]
D = - [ L/f1 - ( 1 - L/f1 ) ( 1 - L/f2 ) ]
26
Powyższe równanie macierzowe jest równoznaczne układowi równań:
rs+1=Ars+Br’s
r’s+1=Crs+Dr’s
Można z niego uzyskać następujący wzór rekurencyjny:
rs+2 – (A+D) rs+1 + (AD-BC) rs = 0
który po wprowadzeniu wielkości
przyjmuje postać:
b = ( A + D ) / 2 i wykorzystaniu faktu, że AD – BC = 1 ostatecznie
rs+2 – 2 b rs+1 + rs = 0
Odległość promienia r od osi zmienia się wraz z liczbą S, która odpowiada kolejnym płaszczyznom
falowodu soczewkowego i kolejnym cyklom odbić w rezonatorze. Dlatego można traktować r jako funkcję S :
rr(S).
Jeżeli rezonator ma być stabilny to r nie może rosnąć wraz z każdym kolejnym cyklem S, bo musiałoby
się to skończyć wyjściem promienia poza falowód (rezonator). Sprawdzimy kiedy rozwiązanie ostatniego
równania spełnia ten warunek.
Zakłada się, że rozwiązanie ma postać:
rS = exp (qS )
Po podstawieniu do równania otrzymujemy:
exp(qS) [ ( exp q )2 – 2 b (exp q ) + 1] = 0
Stąd:
exp q  b  b 2  1
,
a rozwiązanie ogólne jest następujące:
s
rs  C   b  b 2  1  C   b  b 2  1 




s
Niezależnie od doboru stałych C+ , C- (zależą one od wyboru promienia początkowego) dla b2>1
odległość promienia od osi  rS  będzie ze wzrostem S dążyć do nieskończoności. Natomiast dla b2  1 można
znaleźć takie promienie, które po kolejnych odbiciach będą ciągle wewnątrz falowodu (rezonatora). Ich
odległość od osi będzie zmieniać się oscylacyjnie, ze względu na obecność potęg liczb zespolonych.
Uwzględniając zależność stałej b od parametrów rezonatora z warunku  b   1 otrzymuje się:
- 1  1 – L / f1 – L / f2 + (L 2) / (2f1f2)  1
Dodając +1 do wszystkich części tej nierówności i dzieląc przez 2 przekształcamy ją do postaci:
0  ( 1 – L / R 1 ) ( 1 – L / R2 )  1
To właśnie jest poszukiwanym warunkiem stabilności rezonatora (w przybliżeniu optyki
geometrycznej). Warunkowi temu odpowiada tak zwany diagram stabilności przedstawiony na Rys.1.6.2.
Współrzędne każdego punktu na tym diagramie odpowiadają parametrom konkretnego rezonatora gdyż:
27
g1 = 1 – (L / R1)
i
g2 = 1 – (L / R2)
Na rysunku zaznaczono punkty odpowiadające kilku szczególnym konfiguracjom rezonatora:
A – rezonator płasko-równoległy (R1 = R2 =  ),
B – rezonator konfokalny ( f1 = f2 = L / 2 ),
C – rezonator koncentryczny ( R1 = R2 = L / 2 ).
Obszar zacieniowany odpowiada rezonatorom stabilnym.
Rys.1.6.2. Diagram stabilności rezonatorów.
Badanie stabilności rezonatora z wykorzystaniem tego diagramu polega na znalezieniu punktu
odpowiadającego parametrom R1, R2, L i stwierdzeniu, w którym obszarze jest położony. Zwróćmy uwagę, że
modelowy rezonator Fabry’ego-Perota (punkt A) znajduje się na granicy stabilności. Dlatego w praktyce nie
wykorzystuje się dwóch płaskich zwierciadeł. Rysując rezonatory odpowiadające konkretnym punktom diagramu
stabilności należy pamiętać, że R1 i R2 dodatnie odpowiadają zwierciadłom wklęsłym a ujemne wypukłym
(względem wnętrza rezonatora).
Metoda Foxa i Li badania rezonatorów.
W metodzie tej, zakładając określony rozkład pola elektrycznego fali świetlnej na jednym ze
zwierciadeł rezonatora U1(x1,y1), liczy się, na podstawie teorii dyfrakcji, rozkład pola na zwierciadle drugim U2
(x2,y2). Następnie na podstawie U2(x2,y2) znajduje się nowy rozkład pola na zwierciadle pierwszym i
rozpoczyna następny cykl obliczeń. Wykorzystując komputer można stwierdzić, że dla pewnych rezonatorów po
wykonaniu kilkuset takich cykli ustala się określony rozkład amplitudy pola na zwierciadłach i dalsze
powtarzanie rachunków w zasadzie go nie zmienia. Te rezonatory (o określonych parametrach R1, R2, L) to
rezonatory stabilne.
Jeśli natomiast wraz ze wzrostem liczby powtórzeń amplituda pola na zwierciadłach zanika to rezonator
ma duże straty dyfrakcyjne - jest niestabilny i nie nadaje się do wykorzystania w laserze (istnieją jednak wyjątki
od tej reguły).
Posługując się więc tą metodą można ustalić czy konkretny rezonator jest stabilny, chociaż jest to
znacznie trudniejsze niż przy wykorzystaniu poprzednio przedstawionego diagramu stabilności.
Metoda Foxa- Li pozwala jednak dodatkowo znaleźć rozkład pola elektrycznego i przez to rozkład
natężenia światła na zwierciadłach rezonatora, który okazał się stabilny. Przy liczeniu rozkładu pola dla światła
odbitego od zwierciadeł w kolejnych cyklach wykorzystuje się wzór zwany całką Fresnela - Kirchhoffa:
28
U2 (x 2 , y 2 ) 
ik
4

U1( x 1 , y1)
x 1 , y1
exp[ ikr ]
(1  cos  )dx1 dy1
r
Jest ona wynikiem teorii dyfrakcji Helmholtza- Kirchhoffa, ale można też ją traktować jako analityczny
zapis zasady Huygensa z uwzględnieniem pewnej anizotropii promieniowania elementarnych źródeł fal kulistych.
W powyższym wzorze k=2/ , r jest odległością do punktu (x1,y1) do punktu (x2,y2),  - kątem
pomiędzy wektorem r i normalną do zwierciadła w punkcie (x1,y1).
Otrzymany dla rezonatora stabilnego ostateczny rozkład natężenia światła na zwierciadłach wykazuje
szczególne cechy, które będą poniżej omówione. Przedtem jednak zobaczymy jak ten rozkład może być w
pewnych przypadkach znaleziony analitycznie, a nie numerycznie.
Jeżeli rezonator ma być stabilny , to po dużej liczbie odbić rozkład pola na zwierciadłach musi być
ustalony z dokładnością do zespolonego czynnika  odpowiedzialnego za zmianę fazy światła powstającą przy
przejściu pomiędzy zwierciadłami. Z tego wymagania, przy wykorzystaniu całki Fresnela- Kirchhoffa wynika
następujące równanie:
U    U  K dx dy
()
x, y
K
gdzie
ik
exp[ ikr ]
.
(1  cos )
4
r
W równaniu tym, przynajmniej dla niektórych rezonatorów stabilnych, daje się rozdzielić zmienne
i otrzymać analityczne rozwiązanie.
Dla rezonatora konfokalnego ( L = R1 = R2 = 2f ) o prostokątnych zwierciadłach ma ono postać:
  (x 2  y 2 ) 
x y
E ( x, y, z )  H m   H n   exp 

w w
w2


w 2  w o2  (z / kw o ) 2 określa promień rozkładu, dla którego czynnik
wykładniczy powoduje zmniejszenie amplitudy pola e razy; z = 0 przyjmuje się w punkcie środkowym
rezonatora; Hm, Hn oznaczają wielomiany Hermita ;
w o  L / 2k (dla rezonatora konfokalnego).
We wzorze tym
Postać wielomianów Hermita o najniższych stopniach jest następująca:
Ho(x) = 1
H1(x) = 2x
H2(x) = 4x2 - 2
H3(x) = 8x3 - 12x
H4(x) = 16x4 - 48x2 + 12
Natężenie fali świetlnej w przekroju rezonatora odpowiadające kwadratowi amplitudy pola E(x,y,z)
jest więc iloczynem czynnika wykładniczego i kwadratów wielomianów Hermita różnych stopni. Rozkład pola
na zwierciadle przenosi się oczywiście na wiązkę wyprowadzoną z rezonatora na zewnątrz co prowadzi do
rozkładów natężenia wiązki laserowej zilustrowanych na poniższych rysunkach.
29
Rys.1.6.3. Rozkłady natężenia światła odpowiadające kilku modom poprzecznym niższego rzędu dla rezonatora
o symetrii cylindrycznej.
Czarne miejsca w przekroju wiązki tworzące pierścienie i krzyże odpowiadają zerowaniu się
wielomianów Hermita. Rozkłady te nazywa się modami poprzecznymi i oznacza symbolem TEMmn (transverse
electro-magnetic) gdyż związane z nimi fale są w zasadzie poprzeczne (co też jest jednym z rezultatów metody
Foxa-Li). Przedstawione rysunki odpowiadają rezonatorowi o symetrii cylindrycznej, kiedy równanie całkowe
() rozwiązuje się we współrzędnych biegunowych. Dlatego indeksy m i n oznaczają liczbę miejsc zerowych
(ciemnych ) rozkładu natężenia fali przy przejściu wzdłuż promienia od środka na zewnątrz i wzdłuż połowy
obwodu (dla współrzędnych prostokątnych odpowiednio: wzdłuż osi x i osi y).
Z teorii Foxa-Li oprócz omówionych powyżej wniosków płyną jeszcze dalsze:
- modom wyższych rzędów odpowiadają większe straty dyfrakcyjne;
- mod podstawowy TEM00 jest najbardziej przestrzennie ograniczony.
Rozkład natężenia światła w rzeczywistych rezonatorach bywa często mieszaniną wielu modów. Można
jednak doprowadzić do wzbudzenia się jednego tylko modu poprzecznego np. TEM00, który w wielu
zastosowaniach lasera jest najkorzystniejszy (najlepsza spójność wiązki i najmniejsza rozbieżność).
30
1.7.
Własności wiązki gaussowskiej
W poprzednim wykładzie zaznaczono, że w wielu zastosowaniach najkorzystniej jest zapewnić takie
warunki, w których w rezonatorze lasera będzie się wzbudzał mod podstawowy TEM00. Otrzymuje się wtedy
światło o najlepszej spójności i najmniejszej rozbieżności oraz o gaussowskim rozkładzie natężenia w przekroju
wiązki. To ostatnie stwierdzenie zakłada, że rozkład natężenia w przekroju wiązki wychodzącej z rezonatora
musi odpowiadać rozkładowi natężenia fali w jego wnętrzu i można by je przyjąć nawet bez ścisłego dowodu.
Okazuje się jednak, że tzw. wiązka gaussowska związana z modem TEM00 ma jeszcze inne szczególne
własności, które nie są już tak oczywiste. Aby to wyjaśnić należy znaleźć równanie fali w pewnej płaszczyźnie
poza rezonatorem dla warunków początkowych (brzegowych) określonych przez rozkład amplitudy pola
elektrycznego wewnątrz rezonatora dla modu TEM00.
Można to zrobić korzystając z całki Fresnela — Kirchhoffa bądź rozwiązując wynikające z równań
Maxwella skalarne równanie falowe Hemholtza. W rezultacie otrzymuje się następujące wyrażenie na natężenie
pola elektrycznego wiązki gaussowskiej w odległości z od płaszczyzny wyjściowej (np. od środka rezonatora
konfokalnego) i w odległości r od osi wiązki:
E (r , z)  E 0 
  r 2 


k  r2
 exp      exp  i   k  z   

w
2R
  w  


w0
gdzie: 2w0 jest średnicą wiązki w płaszczyźnie z=0;
 
2z
2
2 
w (z )  w 0  1  

2
  k  w 0




2




2w jest średnicą wiązki poza rezonatorem;
2
 
2 
k

w
 R  z  1  
0 
;
  2 z   ;

 
 
tg  
2 z
k  w 20
.
Pierwszy z dwu czynników wykładniczych występujących w powyższym równaniu odpowiada za
zmniejszanie się pola przy odchodzeniu od osi wiązki zgodnie z funkcją Gaussa. Drugi określa zmiany fazy fali
zarówno wzdłuż kierunku propagacji z jak i w poprzek, dla różnych r. Tych właśnie zmian fazy nie dało się po
prostu odgadnąć i wymagały one wyprowadzenia wskazaną wyżej metodą.
Zinterpretujemy teraz sens poszczególnych składników w wyrażeniu na fazę:
  k z   
k r 2 .
2 R
Przede wszystkim zauważamy, że dla z=0 (w miejscu maksymalnego przewężenia wiązki) faza nie
zmienia się przy odchodzeniu od osi, czyli płaszczyzna z=0 jest powierzchnią stałej fazy, tak jak byłoby dla fali
płaskiej rozchodzącej się w kierunku z.
Dla z→0 płaszczyzny prostopadłe do osi z nie są już powierzchniami stałej fazy, która zmienia się
wraz ze zmianą odległości od środka wiązki. Charakter tych zmian jest taki jak w przypadku fali sferycznej
o promieniu krzywizny R, co można ustalić korzystając z Rys.1.7.1 przedstawiającego wiązkę gaussowską.
Załóżmy, że źródłem zaburzenia w punkcie P jest fala o promieniu krzywizny R wychodząca ze źródła
S. Zobaczmy jak zmienia się faza przy przejściu od punktu Po na osi wiązki do punktu P1 w odległości r od osi.
Punkt P1 leży na innej powierzchni stałej fazy niż punkt P0. Odpowiadające tym punktom powierzchnie
fazowe zaznaczono linią przerywaną i ciągłą. Ich różnica fazy wynika z długości odcinka zr, który zaznaczono
zarówno na promieniu przyosiowym SP1, jak i na promieniu SP0 wzdłuż osi z. Trójkąt SP0P1 jest prostokątny,
dlatego długość odcinka zr jest:
r2
z r  SP1  SP2  R  r  R 
2 R
2
2
31
gdzie wykorzystano rozwinięcie pierwiastka kwadratowego w szereg Taylora przy założeniu
promieni rozchodzących się pod niewielkim kątem.
r
 1 , czyli dla
R
Rys.1.7.1. Ilustracja wiązki gaussowskiej. Zaznaczono wielkości pozwalające na interpretację sensu parametrów
występujących w opisującym ją równaniu.
Faza w punkcie P1 nie jest taka jak w punkcie P0 odległym od źródła o z, ale jak w punkcie P3, którego
odległość od źródła jest z 
r2 .
2R
W tych rozważaniach R było długością promienia krzywizny, a więc wielkością dodatnią. Parametr R
dla wiązki gaussowskiej dla dodatnich z należy przyjąć jako ujemny, bo wtedy w wyrażeniu na fazę  , gdzie
uwzględniony jest poprzez wielkość 
r 2 , daje dodatnią zmianę przy odchodzeniu od osi wiązki. Wartość
2 R
parametru R zależy jednak od współrzędnej z, podczas gdy dla fali kulistej promień krzywizny jest stały.
W miejscu największego przewężenia, z=0 R= i pod względem kształtu powierzchni fazowej
wiązka gaussowska odpowiada wtedy fali płaskiej.


Kąt rozbieżności wiązki gaussowskiej zdefiniowany jako: 2  lim 2(z ) jest równy:
z 
4
2  w 
2  lim 

, stąd

z   z  k  w 0
2  2 w 0   4  

Iloczyn kąta rozbieżności i średnicy przewężenia zależy tylko od długości fali, w związku z czym mówi
się, że jest niezmiennikiem wiązki.
Wiązka gaussowska zachowuje swoje podstawowe własności przy przechodzeniu przez elementy układu
optycznego np. soczewki, a ich wpływ na parametry wiązki można uwzględnić wykorzystując macierz
transformacji
A B
 C D , z którą zetknęliśmy się już wcześniej.


32
1.8.
Interferometr Fabry’ego - Perota w spektroskopii laserowej
Układ Fabry’ego - Perota, tworzony przez dwie równoległe do siebie i częściowo odbijające
powierzchnie, omawiany był wcześniej jako modelowy rezonator lasera. Układ ten może być również
wykorzystywany do badania widma promieniowania laserowego wychodzącego z rezonatora bądź zmienionego
przez oddziaływanie z materią a także widma innych źródeł promieniowania, czyli w spektroskopii. Nazywa się
go wtedy interferometrem Fabry’ego - Perota. Pokażemy teraz w jaki sposób interferometr ten może rozdzielać
bardzo blisko siebie położone linie widmowe.
Pomiędzy zwierciadłami interferometru znajduje się nie ośrodek aktywny, jak poprzednio zakładano, ale
powietrze. Wzór na współczynnik transmisji otrzymany dla układu Fabry’ego - Perota z ośrodkiem aktywnym da
się jednak wykorzystać zakładając jedynie, że nie ma wzmocnienia czyli K=1.
Stąd:
2r 2 1 cos
2
 2r
Po wprowadzeniu stałej F  

1  r 2



4l 

 
Ir  1  It 

I0
I 0 1 r 4  2r 2 cos 4l


1  r 2 
It 
I0 1 r 4  2r 2 cos 4l

oraz
2
oraz zmiennej
.
 2 l 
  2

  
współczynniki transmisji i odbicia dla interferometru F-P mają następującą postać:
It 
I0
1

1  F sin  
 2
2
 A 
Wyrażenie określające stosunek

F sin 2  
Ir
2 .

I0
 
1  F sin 2  
 2
It
zwane jest funkcją Airy A   i pojawia się również w innych
I0
przypadkach interferencji wielu wiązek, których natężenie maleje w postępie geometrycznym, a faza rożni się o
stałą wartość.
Zależność funkcji Airy od  dla różnych wartości współczynnika odbicia dla natężenia światła
przedstawiono na Rys.1.8.1.
Wartość zmiany fazy  przy określonym kierunku promienia padającego na układ F-P decyduje o tym,
czy promienie powstałe z promienia wejściowego na skutek wielokrotnych odbić we wnętrzu będą, po zebraniu
w jeden punkt w płaszczyźnie ogniskowej soczewki umieszczonej za zwierciadłami, interferować konstruktywnie
dając jasną plamkę czy też nie.
Załóżmy, że rezultatem interferencji jest właśnie maksimum. Następnie wyobraźmy sobie na wejściu
układu wiele promieni tworzących wraz z tym powyżej rozważanym powierzchnię boczną stożka o osi
prostopadłej do zwierciadeł. Każdy z nich da początek całej rodzinie promieni wyjściowych, a każda rodzina
będzie spełniać warunki interferencji konstruktywnej tworząc następnie jasne punkty w płaszczyźnie ogniskowej
soczewki. Punkty te ułożą się w okrąg. Będzie on odpowiadał pewnemu maksimum funkcji Airy przedstawionej
na rysunku. Promienie o większym nachyleniu względem normalnej do zwierciadeł (osi optycznej) dadzą, jeśli 
dla tych promieni będzie miało odpowiednią wartość, następne jasne pierścienie. Odpowiadające im maksima
funkcji Airy będą leżały, na rysunku przedstawiającym wykres funkcji, na prawo od maksimum związanego z
grupą promieni uwzględnionych na początku rozważań. Z kolei promienie mniej nachylone utworzą pierścienie
interferencyjne o mniejszych średnicach (maksima funkcji Airy leżące bardziej na lewo).
33
Rys.1.7.1. Zależność funkcji Airy (współczynnika transmisji interferometru F-P) od zmiany fazy
promienia wynikającej z dwukrotnego przejścia między zwierciadłami we wnętrzu interferometru. Krzywe a), b),
c) odpowiadają wartościom współczynnika r2 równym odpowiednio 0.04, 0.18, 0.8.
Promienie padające na układ prostopadle dadzą jasny punkt w centrum układu pierścieni (na osi) tylko
wtedy gdy baza L interferometru (odległość płaszczyzn odbijających) odpowiada całkowitej wielokrotności /2.
Przy oświetleniu interferometru punktowym źródłem wysyłającym promienie w różnych kierunkach dla
składowej monochromatycznej promieniowania otrzyma się w płaszczyźnie ogniskowej soczewki ustawionej za
interferometrem układ koncentrycznych pierścieni. Ich szerokość jest bezpośrednio związana z szerokością
maksimów funkcji Airy A  . Jak pokazuje wykres, są one tym ostrzejsze im większa jest wartość
współczynnika odbicia dla płaszczyzn interferometru. Dla składowej o innej długości powstanie drugi układ
pierścieni, bowiem przy ustalonej wartości bazy L (czyli odległości zwierciadeł) różne, ze względu na długość
fali, składowe promieniowania mogą doznawać przy przejściu przestrzeni między zwierciadłami takiej samej
zmiany fazy  tylko wtedy, gdy będą się rozchodzić pod innymi kątami. Dlatego również wyjdą z interferometru
pod innym kątem i będą skupiane przez soczewkę w innych miejscach.
Wynika stąd możliwość wykorzystania interferometru Fabry’ego - Perota do badania subtelnej struktury
widma promieniowania. Zdolność rozdzielcza zdefiniowana jako

  
R  0 
 
  0  min
dla 0=500nm, L=10 mm i współczynnika odbicia r2=90%, jest większa niż 10 6 co jest wartością
osiąganą jedynie przez najlepsze siatki dyfrakcyjne.
Jeśli badaniu podlega widmo nie źródła punktowego, ale o pewnej rozciągłości przestrzennej, to dla
uzyskania ostrych, regularnych pierścieni należy zabezpieczyć się przed niepożądanymi skutkami interferencji
promieni rozchodzących się pod tym samym kątem, ale z różnych miejsc w obrębie źródła. Dlatego poszerzony
soczewką strumień światła ze źródła kieruje się najpierw na matówkę. Chociaż światło wychodzące z dwóch
konkretnych punktów matówki mogłoby interferować, to wszystkie punkty matówki razem wzięte można
traktować jako zbiór niekoherentnych źródeł (ponieważ różnica faz między parami tych punktów przyjmuje
najróżniejsze, przypadkowe wartości). W płaszczyźnie ogniskowej soczewki na wyjściu interferometru
powstanie wtedy taki sam układ prążków jak dla pojedynczego punktu świecącego, ale oczywiście o dużo
większej jasności.
Opisany właśnie układ do badania, za pomocą interferometru Fabry’ego – Perota, widma źródła
rozciągłego i niespójnego przestrzennie przedstawiono na Rys.1.8.2. Powierzchnie odbijające, które w praktyce
są cienkimi warstwami metalicznymi nanosi się na powierzchnie szklanych klinów, co eliminuje szkodzący
jakości prążków wpływ odbić od zewnętrznych powierzchni płytek.
34
Rys.1.8.2. Interferometr Fabry’ego-Perota w układzie do badania widma źródła rozciągłego,
niespójnego przestrzennie.
35
1.9.
Otrzymywanie inwersji obsady w laserach różnych typów
Inwersją obsady w elektronice kwantowej określa się sytuację, w której dla pary poziomów
energetycznych związanych z absorpcją lub emisją promieniowania o pewnej częstości obsada górnego poziomu
jest większa niż poziomu dolnego. Przez obsadę rozumie się oczywiście ilość cząstek pozostających w stanie o
energii odpowiadającej danemu poziomowi energetycznemu.
To odwrócenie obsady względem rozkładu Boltzmana obowiązującego dla układu termodynamicznie
zrównoważonego odpowiada tzw. rozkładowi antyboltzmanowskiemu lub „ujemnej temperaturze” układu.
Warunkiem takiego szczególnego zaburzenia równowagi termodynamicznej jest dostarczanie energii z zewnątrz
do układu. Proces otrzymywania inwersji obsady może przebiegać w różny sposób w zależności od rodzaju
ośrodka, który tworzą, lub w którym znajdują się cząstki aktywne, to znaczy te odpowiedzialne za absorpcję i
emisję promieniowania. Na przykład sposoby właściwe dla ośrodka gazowego nie mogą być wykorzystane w
ciałach stałych i odwrotnie. Wzbudzanie ośrodka (pompowanie) do stanu z inwersją obsady jest również zależne
od charakteru i własności poziomów energetycznych odpowiadających optycznym przejściom.
Informacji o czasie życia poziomów i możliwościach przejść między nimi dostarcza spektroskopia,
która ma zupełnie podstawowe znaczenie przy poszukiwaniu ośrodków nadających się do ewentualnego
wykorzystania w laserach.
Najważniejsze sposoby wzbudzania ośrodka w celu uzyskania inwersji to: przepływ prądu i wzbudzanie
termiczne w gazach, pompowanie optyczne w ciałach stałych i cieczach oraz przepływ prądu przez złącze p-n w
półprzewodnikach. Zostaną one omówione w powiązaniu z najpopularniejszymi typami laserów.
W laserach gazowych ośrodek wewnątrz rezonatora jest gazem ale cząstki aktywne mogą być
obojętnymi elektrycznie atomami - neon w laserze He-Ne, jonami - Ar+ w laserze argonowym lub cząsteczkami CO2 w laserze na dwutlenku węgla. Układ poziomów energetycznych atomów Ne, jonów Ar+ i cząsteczek CO2,
między którymi zachodzi wzbudzanie i może mieć miejsce emisja laserowa przedstawiają Rys.1.9.1 oraz 1.9. 2.
2S0
2S1
3,39m
5s
4s
3p44d
4p
1,15m
0,63m
3p44p
3p
3p43d
3s
3p44s
3p5
Hel
Neon
Ar+
Rys.1.9.1. Schemat poziomów energetycznych w laserach helowo-neonowym i argonowym.
36
Zaznaczone poziomy energetyczne dla neonu i jonów argonu odpowiadają różnym konfiguracjom
elektronowym, czyli coraz to wyższym wzbudzeniom jednego z elektronów z najbardziej zewnętrznej powłoki tzw. elektronu optycznego. Oznaczenia poziomów wzbudzonego atomu neonu i jonu argonu pokazują, na jakiej
powłoce znajduje się ten elektron dla poszczególnych stanów.
Oznaczenie poziomów wzbudzonych atomu helu, których położenie umożliwia wymianę energii z
neonem, w zasadzie odpowiada klasycznej notacji spektroskopowej określającej moment pędu atomu. Cyfra 2
dodana z przodu symbolu to wartość głównej liczby kwantowej wzbudzonego elektronu.
(001)
10.6m
(100)
9.6m
(020)
(010)
Dwutlenek
węgla
Azot
Rys.1.9.2. Schemat oscylacyjnych poziomów energetycznych dla cząsteczek dwutlenku węgla i azotu w laserze
CO2.
Poziomy energetyczne cząsteczek CO2 odpowiadają niezmiennej konfiguracji elektronowej cząsteczki
ale różnym drganiom jakie może ona wykonywać ze względu na swoją przestrzenną budowę. Trzy cyfry
występujące w oznaczeniu poziomu określają wkład trzech podstawowych modów oscylacyjnych cząsteczki do
energii danego drgania. Podstawowe drgania cząsteczki dwutlenku węgla: rozciągające symetryczne, poprzeczne
deformacyjne i podłużne niesymetryczne mają odpowiednio oznaczenia (100), (010), (001). Stan (020) to
druga harmoniczna drgania poprzecznego deformacyjnego.
Poziomy oscylacyjne są nałożone na strukturę poziomów elektronowych i przejścia między nimi
odpowiadają o wiele mniejszym zmianom energii niż przejścia między poziomami elektronowymi. Stąd emisja
lasera na dwutlenku węgla wypada w podczerwieni (10,5m) podczas gdy lasery argonowy i helowo-neonowy
świecą w zakresie widzialnym.
Źródłem energii wzbudzenia cząstek aktywnych są w laserach gazowych elektrony przyspieszane w polu
elektrycznym wytworzonym wewnątrz rury wyładowczej.
Możliwość uzyskania inwersji obsady nie jest tu wcale oczywista, gdyż w bezpośrednich zderzeniach
z elektronami efektywność wzbudzania poziomów bardziej odległych od wyjściowego maleje ze wzrostem
energii poziomu. Liczba elektronów o energiach przekraczających wartość średnią jest bowiem funkcją malejącą.
Wzbudzanie kaskadowe do stanów o dużych energiach w kilku kolejnych zderzeniach z różnymi elektronami też
jest mniej prawdopodobne od słabszych, bezpośrednich wzbudzeń prowadzących do zasiedlania dolnych stanów
wzbudzonych.
Mimo to dla jonów Ar+ uzyskanie inwersji obsady poprzez zderzenia z elektronami biorącymi udział w
przewodnictwie jest możliwe gdyż okazuje się, że czas relaksacji górnego poziomu (4p) jest o wiele dłuższy niż
dolnego (4s), który szybko opróżnia się poprzez emisję spontaniczną w nadfiolecie.
Ta okoliczność nie występuje już dla odpowiednich poziomów neonu i dwutlenku węgla. Potrzebna jest
więc w tych ośrodkach dodatkowa droga wzbudzania górnych poziomów z pominięciem poziomów o mniejszych
energiach. Prostym sposobem takiego wzbudzania są zderzenia z atomami lub cząsteczkami innego gazu
dodanego do rury wyładowczej.
Domieszką pozwalającą na bezpośrednie wzbudzanie (zasiedlanie) odpowiednich poziomów neonu jest
hel. Pierwsze dwa poziomy atomów helu wzbudzanego w zderzeniach z elektronami są metastabilne - ponieważ
37
radiacyjne przejścia do poziomu podstawowego są zabronione regułami wyboru. Jednocześnie energie tych
poziomów odpowiadają energiom górnych poziomów laserowych neonu. Okazuje się, że przy takiej
koincydencji podczas zderzenia wzbudzonego atomu helu z atomem neonu w stanie podstawowym bardzo
prawdopodobne jest przekazanie energii temu ostatniemu. Stąd przy odpowiednim stosunku ciśnień parcjalnych
obu gazów (więcej helu) zderzenia wzbudzonych atomów helu z neonem prowadzą do zasiedlania górnych
poziomów neonu, co jest warunkiem uzyskania inwersji obsady.
W laserze molekularnym na dwutlenku węgla funkcję przekaźnika energii wprost na górne poziomy
wzbudzane CO2 pełnią cząsteczki azotu N2 .
Dlatego na schematach poziomów energetycznych lasera neonowego i na dwutlenku węgla zaznaczono
także pierwsze wzbudzane poziomy odpowiednio He i N2 oraz dodatkowy kanał wzbudzania górnych poziomów
atomów neonu i cząsteczek dwutlenku węgla.
Odpowiednio szybka relaksacja z dolnego poziomu laserowego do poziomu podstawowego, konieczna
dla utrzymania inwersji obsady, ma miejsce w przypadku lasera He-Ne przez zderzenia ze ściankami, dlatego
rura wyładowcza jest tu cienką kapilarą. W laserze na CO2 depopulacja dolnego poziomu laserowego (100) lub
(020) następuje przez zderzenia z cząsteczkami jeszcze nie wzbudzonymi a powstające w ten sposób dwie
cząsteczki w stanie (010) tracą następnie energię w zderzeniach z atomami kolejnej domieszki, którą jest hel.
Należy podkreślić, że nie każde wyładowanie elektryczne w gazie może doprowadzić do stworzenia
warunków odpowiednich dla pracy lasera i to lasera o działaniu ciągłym (impulsowa praca lasera gazowego jest
możliwa, choć prowadziłoby to do utraty wielu z jego szczególnych własności - np. pogorszyłaby się spójność bez uzyskania znaczących korzyści). Wyładowanie nie może mieć np. postaci iskier ślizgających się po
ściankach rury. Przebieg takiego wyładowania jest nieprzewidywalny, chaotyczny. Wzbudzeniu podlegałaby
jedynie niewielka część gazu a warunki wewnątrz ośrodka byłyby wysoce niejednorodne. Z kolei powstanie
wyładowania łukowego prowadziłoby do wytworzenia plazmy i zupełnej zmiany układu poziomów
energetycznych.
Dla zapewnienia ciągłego, samopodtrzymującego się wyładowania w ośrodku musi znajdować się
odpowiednia ilość elektronów. Również energia, którą elektrony uzyskują przyspieszając w polu elektrycznym
pomiędzy kolejnymi zderzeniami musi być taka by zachodziło wzbudzanie cząstek aktywnych.
Dlatego zasadnicze znaczenie dla działania laserów gazowych ma dobranie ciśnienia gazu i natężenia
pola elektrycznego tak by wyładowanie odbywało się w optymalnych warunkach.
Zwrócimy teraz uwagę na pewne dodatkowe okoliczności, które musiały być uwzględnione przy
projektowaniu laserów gazowych.
W laserze CO2 , którego cząsteczki w odróżnieniu od atomów neonu czy jonów argonu mogą podlegać
dysocjacji należy albo zastosować domieszkę spowalniającą ten proces a więc i degradację ośrodka - w laserach
z odciętą rurą, bądź w sposób ciągły wymieniać mieszaninę gazów - co ma miejsce w tzw. laserach
przepływowych.
W laserze argonowym cząstki aktywne - jony podlegają tym samym siłom, które działają na elektrony
przewodnictwa i w rezultacie przemieszczają się w kierunku katody. Prowadziłoby to do powstania gradientu
ciśnienia, zmian natężenia pola i niejednorodnych warunków wzdłuż rury. Dlatego dla wyrównania ciśnień w
laserze argonowym obok rury wyładowczej znajduje się kanał, którym jony dyfundują z okolic katody na drugi
koniec rury. Dla ograniczenia zderzeń jonów ze ściankami, co pomimo zastosowania płaszcza wodnego
prowadziłoby do ich nadmiernego rozgrzania, rura wyładowcza umieszczona jest w cewce wytwarzającej pole
magnetyczne ukierunkowujące ruch jonów wzdłuż osi. Pole to zwiększa również gęstość jonów w okolicy środka
rury, co daje większe wzmocnienie.
To zaledwie zasygnalizowanie niektórych zagadnień związanych z konstrukcją i działaniem laserów
gazowych z wyładowaniem elektrycznym wskazuje na wielość i różnorodność problemów, które należy
rozwiązać dla uzyskania stabilnej generacji, jak najlepszej sprawności, dużych mocy i trwałości. Celem tego
wykładu jest jednak jedynie przedstawienie różnych mechanizmów otrzymywania inwersji obsady. Dlatego
zwrócimy teraz uwagę na pewien szczególny typ lasera na dwutlenku węgla - laser gazodynamiczny.
W laserze gazodynamicznym nie ma wyładowania prądowego a źródłem energii wzbudzania cząstek
CO2 jest energia cieplna. Ogrzewanie zamkniętego naczynia z dwutlenkiem węgla do temperatury rzędu 15000
prowadzi do intensywnego wzbudzania cząstek do różnych stanów oscylacyjnych, ale dla ustalonej temperatury
obowiązuje rozkład Boltzmana - liczba cząstek maleje wraz ze wzrostem energii wzbudzenia. Ogrzany gaz w
stanie równowagi termodynamicznej nie wykazuje więc inwersji obsady. Okazuje się jednak, że ze względu na
różnicę czasów życia poziomów (020) i (001) przy ochładzaniu gazu w strudze gwałtownie wypływającej
z podgrzanego naczynia można otrzymać inwersję obsady dla tych poziomów. Liczba cząstek w stanie bardziej
energetycznym (020) maleje bowiem wolniej niż liczba cząstek w stanie (001). Niezbędne w laserze sprzężenie
zwrotne zapewnić mogą zwierciadła umieszczone po bokach odpowiednio ukształtowanej strugi gazu.
Ten mechanizm otrzymywania inwersji obsady pozwala na bezpośrednią zamianę energii cieplnej
w energię promieniowania laserowego.
38
Kolejnym sposobem otrzymywania inwersji obsady jest tak zwane pompowanie optyczne. Absorbowana
przez ośrodek energia zewnętrznego źródła światła jest w części emitowana z powrotem w postaci
promieniowania laserowego o niższej częstości. Różnica między zaabsorbowaną energią pompowania i energią
wyemitowaną rozprasza się w ośrodku w postaci ciepła podczas różnego rodzaju relaksacyjnych procesów
przeprowadzających cząstki aktywne ze stanu wzbudzanego na górny poziom laserowy.
O ogólnej sprawności lasera z pompowaniem optycznym decyduje jednak w zasadniczym stopniu
skuteczność samego pochłaniania promieniowania pompującego. Dlatego w laserach z pompowaniem optycznym
wykorzystuje się ośrodki stałe - laser rubinowy i neodymowy , bądź ciekłe -lasery barwnikowe. Gazy, ze
względu na niewielką gęstość, miałyby przy tym sposobie pompowania sprawność mniejszą o kilka rzędów
wielkości.
Z drugiej strony gęstość cząstek aktywnych w laserze na ciele stałym nie może być zbyt duża, tj. taka przy której
na skutek ich wzajemnego oddziaływania poziomy energetyczne rozszczepiłyby się w pasma energetyczne.
Dlatego cząstki aktywne stanowią jedynie niewielką domieszkę (~1%) w sieci krystalicznej (laser rubinowy) lub
w matrycy z amorficznego materiału (laser neodymowy szklany).
Zachowaniu stosunkowo dobrze określonych poziomów energetycznych, szczególnie tych
odpowiadających górnemu i dolnemu poziomowi laserowemu, sprzyja wykorzystanie jako domieszek
pierwiastków z pewnych szczególnych miejsc układu okresowego. Mianowicie pierwiastki ziem rzadkich
i pierwiastki z grupy żelaza charakteryzują się tym, że elektrony biorące udział w przejściach optycznych
(związanych z emisją i absorpcją światła) znajdują się na niezupełnie zapełnionych orbitach leżących bliżej jądra
atomu niż zewnętrzne orbity z kompletną obsadą. Elektrony z tych zewnętrznych orbit zapewniają ekranowanie
od wpływu innych cząstek, które zawsze prowadzi do poszerzania poziomów energetycznych i ostatecznie do
powstania pasm energetycznych.
Tak więc w laserze rubinowym wykorzystuje się kryształ tlenku glinu Al2O3 domieszkowany jonami
chromu Cr+3 a w laserze neodymowym szkło lub kryształ granatu itrowo-aluminiowego, z domieszką jonów
neodymu Nd+3.
W laserze barwnikowym ośrodek aktywny stanowią ciekłe roztwory związków organicznych o
skomplikowanej budowie zwane barwnikami ze względu na silną absorpcję światła w pewnych przedziałach
widma widzialnego. Przejścia absorpcyjne odbywają się pomiędzy poziomami oscylacyjno-rotacyjnymi
skupionymi wokół sąsiednich poziomów odpowiadających różnym konfiguracjom elektronowym cząsteczki. Jej
złożona budowa umożliwia mnogość różnych drgań i obrotów, co sprawia że te zgrupowania poziomów
oscylacyjno-rotacyjnych można traktować jako pasma.
Przy absorpcji światła pompującego cząstka może przejść z dowolnego miejsca dolnego pasma w
odpowiednie miejsce górnego. Natomiast emisja promieniowania laserowego odbywa się z okolic dolnej
krawędzi górnego pasma na poziom pasma dolnego, określony energią fotonów fali, dla której stworzono
najkorzystniejsze warunki generacji. Na tym właśnie polega możliwość zmiany częstotliwości generowanego
promieniowania poprzez strojenie rezonatora. Przejścia w obrębie górnego pasma, z różnych jego poziomów do
stanu o minimalnej energii odbywają się na drodze naturalnej relaksacji z zamianą różnicy energii w ciepło.
Układ poziomów w laserze barwnikowym odpowiada więc schematowi czteropoziomowemu.
Czteropoziomowy jest również układ poziomów w laserze neodymowym. Laser rubinowy natomiast reprezentuje
układ trójpoziomowy. Schematy poziomów energetycznych dla dwóch ostatnich laserów przedstawiono na
Rys.1.9.3.
Większa gęstość centrów aktywnych w porównaniu do laserów gazowych, to większy współczynnik
wzmocnienia. Stąd w laserach wykorzystujących bardziej skondensowane ośrodki można pozwolić sobie na
wyprowadzanie większej, niż w przypadku laserów gazowych, części promieniowania na zewnątrz (tzw. straty
użyteczne) bez zerwania generacji.
Zamiana części energii promieniowania pompującego w ciepło na drodze procesów relaksacyjnych przy
przechodzeniu cząstek ze stanów wzbudzanych na górny poziom laserowy wymaga chłodzenia ośrodka, dla
uniknięcia jego zniszczenia lub degradacji. W laserach rubinowym i neodymowym pręty ośrodka aktywnego
chłodzone są przepływającą wodą natomiast w laserze barwnikowym cały roztwór krąży w obiegu zamkniętym.
Źródłem promieniowania pompującego są lampy błyskowe lub inne lasery jak w przypadku lasera
barwnikowego pompowanego laserem argonowym.
39
4
F1
4
F2
4
2A
3a2
F3/2
Od
1.052m
do
1.1225m
E
0.6929m
0.6943
mm
4
4
A2
Cr+3 w rubinie
I11/2
Nd+3 w krysztale YAG
Rys.1.9.3. Układ poziomów energetycznych i najważniejsze przejścia w centrach aktywnych laserów rubinowego
i neodymowego na krysztale YAG. Cienkimi strzałkami oznaczono wzbudzanie poprzez pompowanie optyczne.
Zupełnie inny od omówionych powyżej sposób pompowania ośrodka ma miejsce w laserach
półprzewodnikowych. Centrum aktywne nie jest tu oddzielnym obiektem, jak atom, jon czy cząsteczka, który
następnie podlega wzbudzaniu i wracając do stanu podstawowego emituje światło. Energia emitowanego
promieniowania pochodzi z rekombinacji pary elektron - dziura w półprzewodniku. Tej pary nie można
zlokalizować tak jak cząstki w ciele stałym, czy nawet w gazie bowiem elektron i dziura nie pochodzą z tego
samego obszaru - są wstrzykiwane w obszar złącza p-n na skutek przepływu prądu. Prąd jest w przypadku tego
sposobu otrzymywania inwersji nośnikiem cząstek, które spotykając się w obszarze złącza mogą ulec
rekombinacji promienistej. Ważna jest sama obecność elektronów i dziur w obszarze złącza, bo to jest
podstawowym warunkiem rekombinacji i świecenia. Energia emitowanych fotonów określona jest szerokością
przerwy energetycznej a nie natężeniem prądu.
Sprzężenie zwrotne realizowane na ogół przez odpowiednie oszlifowanie ścian elementu
półprzewodnikowego sprawia, że akty rekombinacji a więc i emisji promieniowania mają charakter wymuszony.
Zmiany natężenia prądu zmieniając ilość wstrzykiwanych nośników przekładają się na modulację
natężenia emitowanego światła. Natężenie prądu płynącego przez złącze decyduje też o współczynniku
wzmocnienia lasera półprzewodnikowego.
W pierwszych konstrukcjach laserów złączowych emisja odbywała się w płaszczyźnie złącza. W
późniejszych laserach z emisją powierzchniową światło wysyłane jest w kierunku prostopadłym do złącza. Dla
zwiększenia prawdopodobieństwa rekombinacji promienistej stosuje się wiele warstw odpowiednio
domieszkowanych Dodatkowe bariery potencjału wytworzone dzięki temu na drodze elektronów i dziur
odpływających od złącza zwiększają czas przebywania nośników w okolicy złącza a przez to rośnie
prawdopodobieństwo rekombinacji. Obecność warstw o większym współczynniku załamania niż okolice złącza
p-n ogranicza przestrzennie powstającą wiązkę, tak jak ma to miejsce w falowodzie. Jeszcze inne warstwy
dopasowują stałą sieciową materiału właściwej diody laserowej do stałej sieciowej podłoża, co ma zasadnicze
znaczenie dla ograniczenia ilości defektów powstających w czasie wytwarzania struktury.
Lasery półprzewodnikowe, ciągle udoskonalane, obejmujące coraz szerszy zakres widma częstości i
generujące promieniowanie nawet o znacznych mocach stanowią prawdziwy przełom w technice laserowej. Są
produkowane masowo i stosowane w wielu powszechnie używanych urządzeniach.
40
1.10. Metody modyfikacji przestrzenno-czasowych charakterystyk promieniowania
laserowego
Przez pojęcie przestrzenno-czasowych charakterystyk będziemy tu rozumieć takie własności światła
laserowego jak przebieg akcji laserowej w czasie, rozkład natężenia wiązki w przekroju (kształt wiązki), skład
widmowy emitowanego światła, stabilność takich parametrów jak częstotliwość i moc emisji.
W zależności od konkretnego zastosowania i wykorzystywanego w nim typu lasera szczególną uwagę
przykłada się do niektórych tylko z wymienionych własności. Tak np. spójność czasowa i przestrzenna są ważne
przede wszystkim dla laserów gazowych o pracy ciągłej wykorzystywanych w interferometrii, holografii czy
metrologii (jako np. wzorce częstotliwości) natomiast problemy rozwoju akcji laserowej w czasie dotyczą w
zasadzie laserów impulsowych.
Przypomnę, że dla wystąpienia akcji laserowej konieczne jest by wzbudzanie ośrodka przewyższało
występujące w nim i w rezonatorze straty (stąd występowanie tzw. progu akcji laserowej). Natomiast dla
świecenia w sposób ciągły dodatkowym wymaganiem jest by prędkość zasiedlania górnego poziomu laserowego
nadążała za jego opróżnianiem zachodzącym podczas świecenia. Takie warunki można bez specjalnych
zabiegów osiągnąć w laserach gazowych: helowo-neonowym, argonowym czy na dwutlenku węgla.
Laser rubinowy i szklany neodymowy będące klasycznymi przykładami laserów na ciele stałym pracują
impulsowo. Ważną tego przyczyną, choć nie jedyną, jest pompowanie lampą błyskową. Pozwala ona na tak
intensywne wzbudzanie centrów aktywnych, że przy danych czasach życia na górnych poziomach laserowych
można uzyskać stan inwersji obsady. Ze względu na nieuniknioną niejednorodność oświetlenia lampą
i niedoskonałości ośrodka akcja laserowa pojawia się nie w całej objętości pręta (taki jest zazwyczaj kształt
aktywowanego materiału) ale w jego określonych punktach. Na wyznaczonych przez geometrię rezonatora
kierunkach zawierających te punkty, ze względu na dużą gęstość centrów aktywnych następuje lawinowy
przyrost ilości fotonów uwalnianych w zjawisku emisji wymuszonej i gwałtowny spadek obsady górnego
poziomu. Dochodzi do tego intensywne grzanie wzdłuż tych właśnie kierunków prowadzące do zmian
współczynnika załamania, powstawania naprężeń, zwiększenia roli procesów relaksacyjnych. W efekcie akcja
laserowa rozwijająca się wzdłuż tych właśnie kierunków zostaje przerwana. W międzyczasie zaczynają jednak
świecić (i za chwilę gasnąć) następne miejsca. Duża część energii lampy błyskowej po prostu grzeje cały pręt,
psując warunki rozwoju akcji laserowej. Konkurencja pomiędzy modami przy tak zmiennych warunkach
sprawia, że coraz to inny z nich dominuje w emisji. Ostateczny efekt jest taki, że impuls lasera rubinowego, czy
szklanego neodymowego, oglądany na oscyloskopie wykazuje gwałtowny wzrost mocy a następnie o wiele
wolniejszy spadek, przy czym na zarys impulsu nałożona jest wielka ilość wąskich maksimów (ang.: spike’s)
związanych z tymi pojedynczymi „rozbłyskami”, z których składa się świecenie pręta jako całości.
Taki charakter akcji bardzo pogarsza spójność promieniowania. Już samo ograniczenie emisji do czasu
rzędu kilku milisekund ma oczywisty wpływ na spójność czasową, bo przecież jak pokazuje analiza fourierowska
nawet dla sygnału prawie harmonicznego, ale o skończonym czasie trwania widmo zawiera o wiele więcej niż
jeden składnik. Przebieg czasowy akcji laserów impulsowych z sygnałem harmonicznym nie ma wiele
wspólnego, dlatego monochromatyczność emisji takich laserów jest nieporównywalnie gorsza niż laserów
gazowych. Dodatkowo poziomy laserowe nie mogą być tak wąskie jak dla atomów gazu. Spójność czasowa na
ogół maleje z poszerzaniem widma, czyli z pogarszaniem monochromatyczności, jednak głównym czynnikiem ją
determinującym jest stabilność warunków w źródle światła. Bez tej stabilności nie jest możliwe zachowanie w
dłuższym przedziale czasu zdolności do interferencji fal wysyłanych ze źródła w różnych chwilach, czy z
różnych punktów wyjściowej apretury. Z wcześniejszego opisu tego co dzieje się np. w pręcie lasera rubinowego
jest oczywiste, że nie jest to stabilne świecenie.
Współczesne lasery na ciele stałym, w tym również laser neodymowy ale na krysztale YAG (granat
itrowo-glinowy) ze względu na lepsze odprowadzanie ciepła przez ich krystaliczne matryce i inny sposób
działania lamp pompujących mogą pracować z dużą częstością repetycji (rzędu kiloherców) lub nawet w sposób
ciągły. Porządkuje to i wygładza przebieg akcji laserowej. Lokalne różnice w warunkach emisji i przestrzennoczasowe zmiany poziomu inwersji są jednak nadal obecne i wpływają na pogorszenie spójności.
Lasery gazowe, a w szczególności laser He-Ne, świecą naprawdę stabilnie. Przy wykorzystaniu
specjalnych układów zasilających można otrzymać stałość długości fali  rzędu 10-12 i to w długim
przedziale czasu. Takie lasery konstruuje się jako wzorce częstotliwości. Zwykły laser He-Ne ma ten parametr
kilka rzędów wielkości gorszy, ale i tak jego monochromatycznośc i spójność są bardzo duże. Można to jeszcze
poprawić wstawiając do rezonatora etalony Fabry’ego-Perota uniemożliwiające rozchodzenie się większej liczby
modów podłużnych. Diafragmy kołowe umieszczane na osi rezonatora wprowadzając dodatkowe straty dla
modów poprzecznych wyższych rzędów sprawiają, że laser świeci w modzie podstawowym TEM00 o
gaussowskim rozkładzie natężenia w przekroju wiązki. Ten sposób pracy lasera jest najlepszy do zastosowań w
41
interferometrii gdyż efekty interferencyjne uzyskane dla takiego światła są najbardziej czytelne i ich interpretacja
najłatwiejsza.
Rozkład poprzeczny natężenia można poprawiać także na zewnątrz rezonatora stosując tzw. filtrację
przestrzenną polegającą na wstawieniu w ognisko soczewki skupiającej bardzo małego otworu wycinającego
światło ugięte na zanieczyszczeniach różnych elementów, np. na większych drobinach kurzu, które ogniskowane
jest dalej od osi optycznej. Ta metoda stosuje się do światła dowolnego lasera ale ceną jest oczywiście
zmniejszenie dostępnego natężenia promieniowania.
Istnieje szeroka klasa zastosowań laserów, związana z ich, nazwijmy to ogólnie – energetycznym
oddziaływaniem z różnego rodzaju materiałami, w których spójność nie jest cechą istotną a parametrem
najważniejszym jest moc dla pojedynczego impulsu, lub kolejnych impulsów w serii. Metody określane jako
przełączanie dobroci rezonatora (Q switching) pozwalają na zwiększenie mocy o kilka rzędów wielkości. Mimo
wprowadzenia w okresie od pierwszych zastosowań tej techniki wielkiej liczby nowych laserów jest ona dalej
stosowana z tym, że niektóre jej warianty są mniej popularne niż kiedyś.
Dobroć rezonatora definiuje się jako stosunek energii w nim zgromadzonej do energii traconej w czasie
jednego obiegu światła:
E
Q  2 calkowita
E tracona
Utrzymywanie rezonatora w stanie dużych strat przy jednoczesnym wzbudzaniu cząstek aktywnych
pozwala na uzyskanie dużo większej inwersji niż gdyby straty były przez cały czas umiarkowane. Jeśli przy tak
dużym wzbudzeniu ośrodka straty rezonatora raptownie się zmniejszą to nastąpi akcja laserowa i bardzo szybkie
uwolnienie zmagazynowanej poprzednio energii.
W poglądowy sposób przełączanie dobroci rezonatora można sobie wyobrazić po prostu jako wyjęcie
zwierciadła i włożenie go z powrotem w odpowiednim momencie podczas pompowania. Brak zwierciadła to
brak sprzężenia zwrotnego a we wnętrzu ośrodka mała ilość fotonów, które mogłyby zapoczątkować emisję
wymuszoną. Wstawione na miejsce zwierciadło przywracając sprzężenie zawraca fotony do ośrodka, gdzie
wywołują one lawinę emisji wymuszonej ze wzbudzonych przez pompowanie stanów.
Praktyczna realizacja tego pomysłu to tzw. modulacja mechaniczna, gdy jedno ze zwierciadeł zastępuje
odbijający pryzmat, który wiruje z dużą częstością. Odchylenie od prostopadłego ustawienia względem osi
rezonatora nawet o minuty kątowe zwiększa straty tak znacznie, że warunek odpowiednio niskich strat jest
spełniony jedynie przez ułamek okresu wirowania. Jeśli długość błysku lampy jest porównywalna z tym okresem
to w czasie gdy pryzmat jest skręcony następuje kumulacja inwersji obsady i magazynowanie energii a w
momencie przechodzenia przez położenie małych strat wygenerowany zostaje tzw. impuls gigantyczny.
Energia impulsu gigantycznego jest nieco mniejsza niż w reżimie generacji swobodnej ale przy
skróceniu czasu trwania następuje wielokrotny wzrost mocy promieniowania. Oscylogram takiego impulsu nie
wykazuje już pików charakterystycznych dla generacji swobodnej, o których wspominano powyżej.
Szybkość przełączania w modulatorach wykorzystujących elementy ruchome jest ograniczona ich
mechaniczną bezwładnością. Krótsze czasy przełączania dobroci i co za tym idzie krótsze impulsy światła o
większej mocy otrzymuje się stosując modulator elektrooptyczny. Jego głównym elementem jest kryształ
wykazujący tzw. indukowaną dwójłomność optyczną. Kryształ z odpowiednio wykonanymi elektrodami
wstawiony jest do rezonatora i zorientowany w taki sposób, że przy braku napięcia przechodząca przez niego
fala ma ten sam współczynnik załamania bez względu na polaryzację. Po włączeniu pola elektrycznego
(przyłożeniu napięcia do elektrod) współczynnik załamania jest różny dla dwóch ortogonalnych polaryzacji.
n 1  n 0  n 02 rE/2
n 2  n 0  n 20 rE/2
Czynnik r to stała elektrooptyczna kryształu, E – natężenie pola elektrycznego sterującego komórką.
Jeśli więc do kryształu modulatora wchodzi światło już spolaryzowane, to w rezultacie tej różnicy
współczynników załamania wychodząc z niego ma zmieniony kierunek drgań wektora natężenia pola
elektrycznego. Kąt o jaki obróci się wektor E fali świetlnej jest proporcjonalny do napięcia sterującego komórką
elektrooptyczną.
  2l n1  n 2    2n 30 rV / 
42
Zjawisko to nazywa się efektem Pockelsa. Stosując drugi polaryzator umieszczony za kryształem
i ustawiony dokładnie tak jak pierwszy można po przyłożeniu odpowiednio dużego napięcia osiągnąć stan
zamknięcia (nieprzezroczystości) migawki. Fotony nie wracają wtedy do pręta laserowego, brak jest sprzężenia
zwrotnego i przez to akcja laserowa nie rozwija się natomiast narasta inwersja obsady. Zanik napięcia na
elektrodach komórki sprawia, że światło przechodzi przez nią bez przeszkód i generowany jest impuls
gigantyczny. Przy wykorzystaniu odpowiednich układów zasilających można osiągnąć czasy przełączania rzędu
10-9 sek. Schemat układu modulacji dobroci metodą elektrooptyczną przedstawia Rys.1.10.1.
Zwierciadło
wyjściowe
Polaryzator
Komórka Pockelsa
Polaryzator
Pręt
laserowy
Zwierciadło
Rys.1.10.1. Zasadnicze elementy lasera na ciele stałym z elektrooptyczną modulacją dobroci.
Stosuje się również modulatory elektrooptyczne z efektem Kerra, w którym różnica współczynników
załamania zależy od kwadratu natężenia pola elektrycznego.
W modulatorach akustooptycznych do chwilowego zmniejszenia dobroci (czyli do powstrzymywania
generacji) wykorzystuje się dyfrakcję fali w ośrodku o przestrzennej modulacji współczynnika załamania.
Związane jest to z wytworzeniem we wstawionym do rezonatora ośrodku (przeważnie ciekłym) fali
ultradźwiękowej, która lokalnie zmieniając gęstość ośrodka zmienia również jego współczynnik załamania
i kieruje znaczną część energii fali pod pewnym kątem do osi rezonatora. Wyłączenie generatora likwiduje tego
typu straty i przywraca warunki wystąpienia akcji laserowej.
Bardzo popularną, bo nie wymagającą żadnych elektrycznych czy elektromechanicznych układów jest
metoda modulacji dobroci za pomocą specjalnych absorbentów. Kuweta z barwnikiem umieszczona w
rezonatorze początkowo pochłania światło, a przy pewnej gęstości energii i odpowiednio długim czasie relaksacji
z poziomów wzbudzonych staje się przezroczysta. Ta nieliniowa absorpcja zwana jest też wybieleniem
optycznym. Ten sposób modulacji zwany jest modulacją pasywną w odróżnieniu od powyżej opisanych metod
modulacji aktywnej.
Wykorzystując modulatory aktywne w laserach z ciągłym pompowaniem można uzyskać regularne ciągi
impulsów o częstości repetycji kilkudziesięciu kHz, mocy poszczególnych impulsów rzędu 1kW i średniej mocy
rzędu kilku watów. Taki sposób emisji jest bardzo korzystny przy wielu zastosowaniach.
Ciągi nawet pikosekundowych (10-12sek) impulsów o równych odstępach otrzymuje się stosując metodę
zwaną synchronizacją modów. Tu również, nieprzypadkowo, rozróżnia się synchronizację aktywną i pasywną.
W pierwszej odmianie używając takich elementów jak omawiane powyżej w związku z generacją
impulsów gigantycznych zmieniane są okresowo straty w rezonatorze bądź poziom inwersji obsady. Prowadzi to
do amplitudowej modulacji natężenia pola fali świetlnej w rezonatorze. Zastosowanie np. drgającego zwierciadła
daje modulację częstotliwościową. W obydwu przypadkach istotne jest, że gdy modulacja odbywa się z
częstotliwością odpowiadającą różnicy między modami podłużnymi (czyli =c/2L) to dochodzi do swego
rodzaju sprzężenia tych modów, normalnie będących w zasadzie niezależnymi falami. Zostanie to w poglądowy
sposób wyjaśnione poniżej dla przykładzie modulacji amplitudowej.
Jeśli pole elektryczne n-tego modu jest:
E n ( t )  E n cos n t
43
To dla modulacji amplitudy na częstości
modu pole:
=2c/2L i głębokości modulacji M otrzymuje się z tego
E n (1  M cos t ) cos t  M E n cos(n  ) t  E n cos t  M E n cos(n  ) t
2
2
Jak widać oprócz składowej na częstości  pojawiły się pasma boczne o częstościach + oraz
. Fazy wszystkich trzech składowych są w tej nieco uproszczonej argumentacji jednakowe. Tak więc
dzięki modulacji rozpatrywany mod zaczyna dawać wkład do generacji w modach sąsiednich i odwrotnie. Mody
przestają drgać niezależnie. Sumowanie ich pól (przy założeniu jednakowych faz) przebiega następująco:

N
sin ( N  1 ) t
N
sin( 1 t )
E ( t )   E 0 cos( 0  n) t  E 0
2
 cos  t
0
2
gdzie 0 jest częstością odpowiadającą środkowi linii emisyjnej a ilość sprzężonych modów to 2N+1.
Maksymalna wartość natężenia światła I(t) wypadkowej fali (co odpowiada średniej z kwadratu
natężenia pola elektrycznego) jest (2N+1)2E02 i powtarza się z okresem T=2/.
I(t) 
E 20

sin 2 ( N  1 ) t
2

sin 2 ( 12 t )
Przebieg tej funkcji odpowiadający emisji lasera z synchronizacją modów przedstawia rysunek poniżej.
I(t)
T=2L/c
t
Rys.1.10.2. Wykres funkcji natężenia światłą I(t) dla synchronizacji siedmiu modów (2N+1=7).
W rzeczywistości amplitudy modów nie są jednakowe, może też między nimi występować stałe
przesunięcie fazy. Jednakże końcowy efekt, potwierdzany przez doświadczenie, ma te same istotne cechy jak w
powyższym wyprowadzeniu. Generowany jest mianowicie ciąg bardzo wąskich impulsów w odstępach
określonych przez odległość międzymodową o amplitudzie zależnej od ilości obecnych w rezonatorze modów
podłużnych.
Dla pasywnej synchronizacji modów wykorzystywane są, jak nie trudno zgadnąć, wybielające się
barwniki. Teraz jednak czas relaksacji cząsteczek ze stanu wzbudzonego musi być krótszy od czasu przejścia
światła przez rezonator, zwanego okresem rezonatora.
Wycinek z zależności energii promieniowania laserowego od czasu o szerokości odpowiadającej
okresowi rezonatora nie jest ciągły, można w nim wyróżnić szereg zlewających się fluktuacji. O przyczynach
tego była mowa wcześniej. Przypuśćmy, że największa z tych fluktuacji może wybielić komórkę z barwnikiem i
44
wtedy światło z nią związane przechodzi w kierunku zwierciadła. Jeśli czas relaksacji jest odpowiednio krótki to
tuż po przejściu tej części fali barwnik znów absorbuje – komórka jest zamknięta. Otwiera ją ponownie
wracający po odbiciu od zwierciadła impuls, który wcześniej przedostał się przez barwnik. Trafia on do ośrodka
aktywnego gdzie podlega wzmocnieniu, odbija się od drugiego zwierciadła, przechodzi przez ośrodek aktywny w
drugą stronę i rozpoczyna następny cykl. W ten sposób najsilniejsze fluktuacje rosną najszybciej.
Przy dobraniu barwnika o odpowiednim czasie relaksacji sytuacja wygląda wreszcie tak jak gdyby
pomiędzy zwierciadłami odbijał się w tę i z powrotem jeden krótki impuls o wielkiej mocy. Przy każdym
spotkaniu ze zwierciadłem wyjściowym część energii wypromieniowywana jest na zewnątrz. Odstępy czasowe
tych błysków są oczywiście równe okresowi rezonatora T=2L/c, czyli takie jak uzyskane przy aktywnej
synchronizacji fazy.
45
Część 2
Podstawowe pojęcia i zjawiska optyki nieliniowej
Wprowadzenie
Optyka nieliniowa zajmuje się tymi zjawiskami optyki fizycznej, w których własności optyczne materii
zależą od natężenia światła padającej fali. Wiele z tych efektów zaobserwowano dopiero po odkryciu laserów, a
niektóre jeszcze czekają na potwierdzenie eksperymentalne. W tym krótkim przedstawieniu optyki nieliniowej autor
nie próbuje opisać, czy choćby wspomnieć o wszystkich jej przejawach. Uwagę skupiono na procesach
prowadzących do zmian częstotliwości przechodzącej przez ośrodek fali świetlnej, które dają się spójnie opisać w
obrębie jednej teorii. Przy opisie tych procesów wykorzystane będą dwa podejścia.
W pierwszym, tzw. fenomenologicznym efekty nieliniowe próbuje się wyjaśniać wychodząc od równań
Maxwella. Jest to możliwe jedynie poprzez wprowadzenie polaryzacji nieliniowo zależnej od natężenia pola
elektrycznego fali. Spektakularną konsekwencją tego kroku jest naruszenie zasady superpozycji, która w klasycznej
teorii falowej ma fundamentalne znaczenie.
W drugim podejściu poszukiwanie przyczyn niezwykłych, nieliniowych efektów opiera się na stwierdzeniu,
że silne pole elektryczne fali świetlnej, o natężeniu porównywalnym z wielkością pola wewnątrz atomu, zmienia do
pewnego stopnia charakter oddziaływania światła i materii, co prowadzi do nowych zjawisk. Dla otrzymania nawet
jakościowych rezultatów konieczne jest w tym przypadku zastosowanie jakiegoś modelu oddziaływania światła z
materią. Oddziaływanie pola elektromagnetycznego fali świetlnej z ośrodkiem w tym zakresie długości fal opisuje się
zakładając, że pole elektryczne światła indukuje elektryczną polaryzację dipolową, a oscylujące elementarne dipole
(atomy, cząsteczki) z powrotem emitują energię, co prowadzi do powstania wtórnej fali świetlnej.
W następnych wykładach przedstawione zostaną obydwa podejścia, z podkreśleniem zbieżności rezultatów.
46
2.1.
Równania Maxwella i nieliniowe procesy
Równania Maxwella opisujące rozchodzenie się fali elektromagnetycznej w ośrodku mają następującą
formę:
B
t
div D  
rot E  
rot H 
div B  0
D
j
t
Równania te są liniowe ze względu na natężenie pola elektrycznego E. Znaczy to, że jeśli pola E1 i E2 są
rozwiązaniami równań to spełnia je również liniowa kombinacja tych pól. Z tej własności równań Maxwella
bezpośrednio wynika bardzo ważna zasada superpozycji. Innym przejawem liniowości równań Maxwella jest
praktyczna metoda ich rozwiązywania w przypadku gdy pole elektromagnetyczne w ośrodku ma dwa lub więcej
spektralnych składników. Należy wtedy znaleźć rozwiązania oddzielnie dla każdej składowej a następnie je dodać.
Żadna z tych dwóch konsekwencji liniowych równań Maxwella nie jest prawdziwa w przypadku
nieliniowym. Efektownym przykładem jest generacja fal o nowych częstościach (np. drugiej harmonicznej) gdy dwie
fale wpadają do nieliniowego ośrodka. Tak więc, jeżeli równania Maxwella mają obowiązywać również w takich
sytuacjach, to należy do któregoś z nich wprowadzić człon nieliniowy ze względu na natężenie pola elektrycznego.
Jest to możliwe poprzez wielkość zwaną polaryzacją P, która w sposób jawny wystąpi w równaniach
Maxwella gdy indukcję elektryczną D wyrazi się w następujący sposób:
D = E =  o E + P
Polaryzacja powstaje z reakcji ośrodka na pole elektryczne – pole to indukuje w jednostkowej objętości
ośrodka pewną globalną polaryzację, zawiązaną z redystrybucja ładunków na poziomie mikroskopowym. Tak
rozumiana reakcja ośrodka nie musi być w ogólności proporcjonalna do E, chociaż jest to przypadek
najpowszechniejszy. Współczynnik proporcjonalności  pomiędzy polaryzacją i natężeniem pola elektrycznego
nazywa się polaryzowalnością. Ogólna zależność polaryzacji P od natężenia pola elektrycznego E jest następująca:
Pi =
  ik E k +  ijk E j E k +   ijkl E j E k E l +   
k
jk
jkl
Wyrażenie to jest rezultatem formalnego rozwinięcia polaryzowalności  w szereg potęgowy względem natężenia
pola elektrycznego E.
Pierwsze trzy wyrazy ostatniego wyrażenia to liniowy, kwadratowy i sześcienny wkład do polaryzacji.
Tensory o składowych ij, ijk, ijkl to odpowiednio polaryzowalności: liniowa, kwadratowa i sześcienna (nazywa
się je też podatnościami elektrycznymi).
Wprowadzenie polaryzacji kwadratowej i wyższego rzędu do równań Maxwella pozwala na stosowanie ich
również do opisu efektów nieliniowych.
Dla wyprowadzenia powyższego wyrażenia na polaryzację nie jest potrzebne rozważanie żadnych
fizycznych mechanizmów (chociaż problem jest bardzo interesujący). Jego użyteczność do opisu znanych i
przewidywanych efektów pozwoliła rozwinąć fenomenologiczną teorię procesów nieliniowych, która będzie
stosowana w następnych wykładach. Można na przykład udowodnić, że generacja sumarycznej bądź różnicowej
częstotliwości jest konsekwencją powyżej przedstawionego wyrażenia na nieliniową polaryzację.
47
2.2.
Dyspersja nieliniowej polaryzacji
Zależność polaryzacji kwadratowej od częstotliwości oddziałującego z nieliniowym ośrodkiem pola
elektrycznego wynika z istotnego fizycznego faktu skończonej szybkości jakichkolwiek oddziaływań. W świetle tego
faktu związek pomiędzy polaryzacją kwadratową P(2) i natężeniem pola elektrycznego E musi być zapisany jak
następuje:
(2)
P i (t) =
   ijk (' , " ) E j (t - ' ) E k (t - '-" )d' d"
jk
Zależność tę należy interpretować następująco: polaryzacja w danym momencie zależy od wartości
natężenia pola elektrycznego w chwilach poprzednich, oczywiście uwzględnionych z odpowiednimi wagami.
Stosując transformację Fouriera do tego podwójnego splotu funkcji reprezentujących natężenie pola elektrycznego i
polaryzowalność kwadratową można otrzymać równania wiążące widmowe składowe polaryzacji kwadratowej z
widmem fali elektromagnetycznej rozchodzącej się w nieliniowym ośrodku:
P (2)
i (1 + 2 ) =  ijk (1 +  2) E j (1) E k ( 2 )
jk
Pi(2) (1 - 2 ) =  ijk (1 - 2) E j (1) Ek ( 2 )
jk
Równania te pokazują, że dwie składowe widmowe pola elektromagnetycznego mogą generować fale
polaryzacji o częstotliwościach 1+2 i 1-2 oraz o podwojonych częstotliwościach 21 i 22. Z kolei fale
polaryzacji mogą wywoływać fale elektromagnetyczne o takich częstościach, Tak więc nawet dla dwóch częstości
pierwotnej fali elektromagnetycznej jej widmo w ośrodku nieliniowym może się znacznie wzbogacić. Istnieje także
możliwość powstania fali polaryzacji o zerowej częstości (prostowanie optyczne)
Z powodów, które zostaną dalej wyjaśnione efektywnie generować można falę świetlną o jednej tylko nowej
częstotliwości. W związku z tym można się ograniczyć do rozważania jedynie trzech fal oddziaływujących w
ośrodku nieliniowym.
48
2.3.
Zastosowanie klasycznego modelu oddziaływania światła z materią dla wyjaśnienia
efektów nieliniowych
Fenomenologiczne podejście do optyki nieliniowej nie zaspokaja naszej potrzeby zrozumienia fizycznych
podstaw nieliniowych efektów. Chcemy wiedzieć co dzieje się w ośrodku na poziomie atomowym, jakie są pierwotne
przyczyny tych efektów.
Rozważanie tego problemu wymaga przyjęcia jakiegoś modelu oddziaływania światła z materią. Modelu
uważanego obecnie za najwłaściwszy dostarcza teoria kwantowa ale w tym wykładzie przedstawione będzie jedynie
podejście klasyczne.
Klasyczny model okazał się bardzo użyteczny przy wyjaśnianiu większości zjawisk tak zwanej optyki
fizycznej, na przykład odbicia i załamania, dwójłomności, dichroizmu. Zakłada się w nim, że zewnętrzne elektrony
atomu związane są z nim siłą sprężystą, proporcjonalną do wychylenia elektronów z położenia równowagi. Pod
koniec dziewiętnastego wieku, kiedy wprowadzono ten model, struktura atomu nie była jeszcze do końca zbadana i
dlatego nie było powodów by podważać jego prawdziwość w sytuacji gdy tak dobrze się sprawdzał.
Występującej w klasycznym modelu siły kierującej nie daje się jednak uzgodnić z obecnie obowiązującymi
poglądami na budowę atomu. Model oscylatorów elektronowych, bo tak nazywa się ten klasyczny opis
oddziaływania światła z materia, jest jednak ciągle spotykany ze względu na prostotę i wspomnianą wyżej
użyteczność. Świadomość, nazwijmy to, umowności tego modelu pozwala podejrzewać, że ostatecznie prawdziwych
modeli nie ma i że dotyczy to również opisu kwantowego.
Równanie ruchu elementarnego dipola elektrycznego (ruchu elektronu lub, jak byśmy to dziś rozumieli,
chmury elektronowej względem dodatniego jądra) ma w przypadku nieliniowym następującą postać:
2
d r
dt 2
 2
dr
e
  20 r  r 2   E
dt
m
gdzie trzeci człon po lewej stronie związany jest z harmoniczną siłą kierującą (0 jest częstością drgań własnych
układu), człon drugi odpowiada za tłumienie a siła wymuszająca po prawej stronie wywierana jest przez oscylujące
pole elektryczne fali świetlnej. Za nieliniowość odpowiada człon r2.
Obecność członu nieliniowego uniemożliwia otrzymanie rozwiązania metodą stosowaną do oscylatora
harmonicznego. Dlatego stosuje się przybliżoną metodę rozwiązania, która przedstawiono poniżej.
Przede wszystkim zakłada się, że człon nieliniowy jest mały w porównaniu z członem harmonicznym i że w
konsekwencji jego wpływ na rozwiązanie jest mały w porównaniu do liniowej zależności r od E (taki charakter ma
rozwiązanie w przypadku oscylatora harmonicznego). Dlatego też poszukuje się rozwiązania w postaci szeregu
potęgowego względem E, w którym kolejne składniki są coraz to mniejszymi poprawkami:
r  r1  r2  ... gdzie rk  a k E k
Podstawienie tego, wyrażenia ograniczonego jedynie do dwóch pierwszych członów, do równania
oscylatora nieliniowego i pogrupowanie fragmentów o tym samym rzędzie wielkości daje dwa równania:
d 2 r1
dt 2
d 2 r2
dt 2
 2
d r1
e
 02 r1   E
dt
m
 2
d r2
  20 r2  r12
dt
Rozwiązanie pierwszego z nich jest takie samo jak w przypadku harmonicznym ale wykorzystane po prawej
stronie drugiego równania umożliwia policzenie poprawek pierwszego rzędu względem przypadku liniowego. Tak
więc procedura ta może być uważana za pewnego rodzaju iterację.
Natężenie pola elektrycznego, które określa siłę wymuszającą można w ogólności zapisać jak następuje:
49
E  E( 1 ) e  i 1t  E  ( 1) e i 1 t  E( 2 ) e  i 2 t  E ( 2 ) e i  2 t 
     E ( p ) e
i p t
 E (p ) e
i p t
W tej zespolonej reprezentacji oscylującego pola elektrycznego fala świetlna posiada p widmowych
składników o częstotliwościach 1,2,...p. Gwiazdka oznacza wielkości zespolone sprzężone. Wyrażenie to
można w sposób zwarty zapisać jako:
E   E( m ) e  i  m t
m
gdzie indeks m przyjmuje wartości 1,2,...,p; -m=-m, i E ( m )  E  (m ) .
Dla tej ogólnej postaci pola elektrycznego fali świetlnej o wielu spektralnych składowych zakładane
rozwiązanie nieliniowego równania ciągle jest r  r1  r2 ale teraz r1 powinno być rozumiane jako suma:
r1   a1m E( m ) e  i  m t
m
Poprawka nieliniowa r2 również musi być określona inaczej niż dla monochromatycznej siły wymuszającej
(zawiązanej z monochromatyczną falą świetlną). Powrócimy do tego nieco dalej.
Pochodne r1 są :
d r1
  i  a1m  m E ( m ) e  i m t
dt
m
d 2 r1
dt
2
  a1m  2m E ( m ) e
 i m t
m
Po podstawieniu tych pochodnych do równania oscylatora otrzymuje się ostatecznie wzór na r1 :
E ( m ) e  i  m t
e
r1   
m m  20  2im   2m
Generowana przez tę liniową część rozwiązania polaryzacja to:
P1   Ner1
Ze wzoru tego można na przykład uzyskać znaną w optyce klasycznej zależność współczynnika
załamania od częstotliwości światła.
Ponieważ tutaj interesują nas efekty nieliniowe to przechodzimy do znalezienia i zbadania wielkości r2,
będącej pierwszą nieliniową poprawką do r. Dla monochromatycznej fali świetlnej byłaby ona, jak założono,
określona przez
a2E2. Jednak w rozważanym ogólnym przypadku, gdy pole fali świetlnej ma wiele składowych
widmowych, w równaniu na
r2 zamiast E występuje wyrażenie proporcjonalne do r12. W konsekwencji widmo
częstotliwości rozwiązania będzie określone przez widmowe składowe tego wyrażenia kwadratowego a nie przez
widmo samego pola elektrycznego.
Kwadrat r1 jest:
50
r12   a1m a 1n
mn
E (m ) E( n ) exp i m   n t 
20  2im   2m  20  2in  2n 
Dlatego będziemy poszukiwać
r2 o podobnej formie jak szereg na r1 ale z uwzględnieniem nowych
częstotliwości:
r2   a 2mn E( m )E ( n ) exp i m  n  t 
mn
To podstawienie prowadzi do ostatecznego rozwiązania w postaci:
r2  
E(  m )E ( n ) exp i  m  n t 
F( 0 , m ,  n , )
m2 mn
e2 

gdzie



F(0 , m , n ,  )  02  2im  2m  02  2in  2n  02  2i m  n   m  n 2
Jeżeli w jednostkowej objętości znajduje się N elementarnych dipoli drgających w opisany wyżej
sposób, wtedy makroskopowa polaryzacja jest:
P  P 1  P 2   Ner1  Ner2    1 ( m ) E( n ) e - i m t 
m
- i( m +  n )t
’
   2  ( m , n ) E( m )E (n )e
mn
gdzie
Ne2

1
 m  
m
1
20
 2im  2m
oraz
 2   m , n   
m
2 3
N e
           
1
m
1
n
1
m
 n 

to polaryzowalności liniowa i kwadratowa. Przy braku tłumienia dla fal o częstotliwościach m,n,n+m
oba te współczynniki są wielkościami rzeczywistymi. Podatności liniowe są związane ze współczynnikiem
załamania
(n2=1+0). Pozwala to na ocenę przydatności materiału w optyce nieliniowej na podstawie
pomiarów współczynnika załamania. Wniosek ten pozostaje słuszny również w rzeczywistym, trójwymiarowym
przypadku.

51
Uogólnienie otrzymanych powyżej rezultatów na przypadek trójwymiarowy prowadzi do następującego
wzoru na kartezjańskie składowe kwadratowej polaryzacji:
(2)
Pi
  ijk ( m  n ,  m , n ) E j ( m ) E k ( n )e - i(  m +  n )t
(2)
mn jk
gdzie wyraźnie zaznaczono zależność nieliniowej polaryzowalności
 od częstotliwości generowanej
polaryzacji i częstości składowych fali świetlnej. Wzór ten przypomina wyrażenie na kwadratową polaryzację
otrzymane w teorii fenomenologicznej. Zgadza się również z wnioskami co do dyspersyjnych własności
nieliniowej polaryzowalności wyprowadzonymi ze stwierdzenia skończonej prędkości fizycznych oddziaływań.
52
2.4.
Warunek dopasowania fazowego w nieliniowych oddziaływaniach
Wyrażenia na nieliniową polaryzację przedstawione w poprzednich wykładach w kilku wariantach
prowadzą do znacznego skomplikowania widma fali polaryzacji w ośrodku, w stosunku do fali świetlnej
wpadającej do ośrodka. Warunek dopasowania fazowego pozwala na rozważanie tylko trzech fal świetlnych
o różnych częstotliwościach efektywnie oddziaływujących w ośrodku nieliniowym, pomimo wielości fal, które
mogłyby być generowane przez różne widmowe składowe polaryzacji.
Warunek dopasowania fazowego zostanie wprowadzony i wyjaśniony dla prostego przypadku generacji
drugiej harmonicznej w ośrodku jednowymiarowym (wszystkie rozważane fale rozchodzą się w tym samym
kierunku, wzdłuż osi z ). Pierwotna fala świetlna o częstotliwości  generuje falę polaryzacji o częstotliwości
2. Pole elektryczne pierwotnej fali świetlnej i polaryzacja o częstości drugiej harmonicznej są opisane tak:
E   A cos(t - kz )
2
P2  A 
cos(2t  2kz)
Natężenie pola elektrycznego drugiej harmonicznej światła generowanego przez falę polaryzacji
przyjmuje się jako:
P2
E 2  A 2cos(2t - Kz)
( 2) n 2
n
 2k  2  , ze względu na dyspersję współczynnika załamania.
c
c
Współrzędne granic ośrodka nieliniowego są 0 i z i elementarne fale drugiej harmonicznej światła (SH)
powstają we wszystkich punktach z’ z tego przedziału. Dla znalezienia sygnału wyjściowego SH w punkcie z
gdzie, w ogólności K 
należy dodać przyczynki od tych wszystkich fal wzięte z odpowiednimi fazami. Prowadzi to do następującej
całki:
z
E 2   A cos ( z' )dz '
0
A jest pewnym czynnikiem niezależnym od z’ i od liczb falowych k, K.
Faza (z’) elementarnej fali SH powstałej w punkcie z’, gdy dociera ona do punktu z wynika z fazy 
(z’) generującej ja fali polaryzacji w punkcie z’ i z przebytej następnie odległości (z-z’):
(z' )   (z' )  K (z  z ' )  2t  2kz'K (z  z ' )  2t  Kz  kz '
gdzie tzw. odstrojenie fazowe jest k  K  2k .
Całkowanie przebiega jak następuje:
wychodząc od
po wprowadzeniu wielkości
z
z
0
0
E 2  A cos ( z' )dz '  A cos 2t  Kz  kz'dz ' ,
u=2t-Kz i podstawieniu u+kz’=w otrzymuje się:
53
E 2 
A
k
A sin u  kz   sin u 

k
u  kz
 cos(w) dw 
u

2A
kz
kz 

sin
cos u 

k
2
2 


2A
kz
kz 

sin
cos 2t  Kz 

k
2
2 

Człon z cosinusem opisuje falę o częstości
człony to jej amplituda:
A 2 
2 rozchodzącą się wzdłuż osi z natomiast dwa pierwsze
2A
kz
sin
k
2
Natężenie fali drugiej harmonicznej jest proporcjonalne do kwadratu tej amplitudy. Przebieg takiej
funkcji jest dobrze znany, jest to typowa krzywa interferencyjna. Ma jedno duże maksimum dla k=0 i o wiele
mniejsze boczne maksima dla k równego nieparzystym krotnościom /z. (Rys.2.4.1).
A 22 
(Az)2
4  / z -2 / z
0
2 / z
4 / z
k
Rys.2.4.1. Natężenie światła drugiej harmonicznej w modelu jednowymiarowym.
Warunek zapewniający największe natężenie drugiej harmonicznej światła nazywany jest warunkiem
dopasowania fazowego. W rozpatrzonej wyżej sytuacji jego znaczenie i nazwa są zupełnie jasne: fazy (z’)
elementarnych fal SH interferujących w punkcie z muszą być takie same (a więc niezależne od z’). Jest to po
prostu warunek konstruktywnej interferencji. Przy jego spełnieniu konstruktywna interferencja zachodziłaby bez
względu na grubość ośrodka.
Ze względu na wspomnianą wyżej dyspersję współczynnika załamania, nie jest możliwe spełnienie
warunku dopasowania fazowego w ośrodku izotropowym. Dla takiego ośrodka lub gdy warunek k=0 nie jest
spełniony z innych powodów, maksymalne do uzyskania natężenie fali drugiej harmonicznej musi być związane
z mniejszym, bocznym maksimum funkcji A22. Dostroić się do tego maksimum można zmieniając drogę fali w

.
k
Warunek dopasowania fazowego: k=0 lub K=2k może być zapisany jako:
próbce poprzez jej obrót do momentu gdy
z3
k 3  k1  k 2
gdzie
k3 jest liczbą falową fali generowanej w nieliniowym procesie z fal o liczbach falowych k1 i k2. Dla
54
uzasadnienia trzeba przypomnieć, że 2k jest liczbą falową fali polaryzacji o nowej częstości (w naszym
przykładzie o częstości drugiej harmonicznej), która to liczba, jak wynika ze wzorów prezentowanych w
poprzednich wykładach, jest sumą liczb falowych dla pierwotnych fal świetlnych.
Gdy rozpatruje się ośrodki trójwymiarowe, powyższy warunek zamienia się w równanie wektorowe a
k1, k2, k3 oznaczają wtedy odpowiednie wektory falowe. Dla danych wektorów k1, k2, istnieje tylko jeden
wektor k3 spełniający to równanie.
Jest to powód, dla którego w procesach nieliniowych zazwyczaj obserwuje się efektywne oddziaływanie
jedynie trzech fal.
Warunek dopasowania fazowego można tez traktować jako przejaw zasady zachowania pędu ponieważ
pęd fotonu jest równy  k.
55
2.5.
Wpływ symetrii kryształu na tensor polaryzowalności kwadratowej
Rozważania przedstawiane poniżej dotyczą nie tylko tensora polaryzowalności kwadratowej, obowiązują
dla każdego tensora opisującego fizyczne własności ośrodka.
Podstawową własnością tensora, zawartą już w jego definicji, jest że jego składowe podczas transformacji
układu współrzędnych zachowują się tak jak iloczyny odpowiednich współrzędnych. Jeśli apostrofem oznaczymy
współrzędne oraz składowe tensora w układzie współrzędnych po jego transformacji wtedy można zapisać
następujące związki:
x i  c ij x j
x i x j x k  c il c jm c kn x l x m x n
  c il c jm c km Tlmn
Tijk
Powyżej, tak jak i w całym tym wykładzie, zastosowano konwencję sumacyjną Einsteina.
Rozważmy ośrodek posiadający dwukrotną oś symetrii i zbadajmy związki pomiędzy składowymi tensora
trzeciego rzędu na początku i po obróceniu kryształu o kąt . Ponieważ kryształ po obrocie jest identyczny jak na
początku (dlatego właśnie posiada taką oś symetrii) to można od razu przyjąć, ze składowe tensora opisującego jego
własności (np. polaryzowalność) nie mogą się zmienić przy takiej operacji.
Niezależnie od takiego fizycznego podejścia można zadanie znalezienia związków miedzy składowymi
tensora dla kryształu przed i po obrocie potraktować bardziej formalnie. W tym „formalnym” podejściu by zbadać
składowe tensora dla obróconego kryształu rozważa się w pełni równoważną sytuację, gdy to układ współrzędnych
jest obracany, a nie kryształ. Równoważność tych sytuacji wynika stąd, że w obydwu otrzymuje się na końcu takie
samo rozłożenie węzłów struktury względem osi układu. Po takim obrocie o kąt  x   x , y   y, z  z .
W związku z tym wszystkie iloczyny współrzędnych z jednym lub trzema x i y (razem) zmieniają znak w czasie
takiej transformacji.
Na mocy definicji tensora wszystkie jego składowe Tijk o takich właśnie kombinacjach indeksów
przechodzą w Tijk’ o tych samych wartościach ale o przeciwnych znakach (ponieważ iloczyn xi xj xk zamienia się w
-xi xj xk).
Z drugiej strony, wracając do poprzednio rozważanej sytuacji, dla kryształu podlegającego obrotowi, który
go wcale nie zmienia trzeba uznać, że Tijk jest równe T'ijk. Pogodzenie tych dwóch wymagań jest możliwe tylko
wtedy gdy składowe tensora, których jeden lub trzy indeksy są x lub y, równają się zeru.
Poprzez takie badanie zmian jakich doznają, po transformacji układu współrzędnych, iloczyny
współrzędnych odpowiadające trójkom indeksów składowych tensora można bezpośrednio określić zerujące się
składowe tensora polaryzowalności kwadratowej również dla kryształów posiadających czterokrotną rotacyjną oś
symetrii.
Powyższe wyjaśnienia nie budzą zastrzeżeń tylko wtedy gdy rozważana operacja symetrii jest dla danego
kryształu fizycznie wykonalna. Tak właśnie jest dla obrotów o  lub /2 co odpowiada dwu- i czterokrotnej osi. Nie
można jednak fizycznie zrealizować inwersji względem punktu, czy przekształcenia względem płaszczyzny symetrii.
Dlatego poniżej przedstawione jest ogólniejsze ale nieco bardziej abstrakcyjne rozumowanie. Przykładowy
kryształ będzie posiadał właśnie środek symetrii.
Pole elektryczne padającej fali jednoznacznie określa składowe wywoływanej polaryzacji. Załóżmy, że
układ współrzędnych podlega zmianie odpowiadającej inwersji względem środka a jednocześnie przyjmijmy, że
zmieniono też geometrię eksperymentu tak, że w nowej sytuacji pole elektryczne ma te same składowe jakie miało w
starym układzie współrzędnych.
Nie następuje tu żadna fizyczna zmiana dla kryształu. Przypomnijmy, że struktura kryształu
niezmienniczego względem danej operacji symetrii jest identyczna gdy rozważa się ją w dwóch układach
współrzędnych związanych za sobą poprzez taką właśnie operację (w naszym przykładzie – inwersję). Kryształ jest
więc również taki jaki był.
Z powyższych stwierdzeń wynika, że wytwarzana polaryzacja musi mieć te same składowe w starym
i nowym układzie współrzędnych. W konsekwencji składowe tensora polaryzowalności nie powinny się zmienić.
Z drugiej strony, ze względu na przejście xi xj xk   xi xj xk powinny jednak zmienić znak.
Ostateczny wniosek jest więc taki, że dla ośrodka ze środkiem inwersji (a więc również izotropowego)
tensor polaryzowalności kwadratowej ma tylko zerowe składowe. Występowanie nieliniowych efektów w takim
ośrodku musi być więc związane z polaryzacją sześcienną.
Powyższa metoda znajdowania zerowych składowych tensora opisującego własności fizyczne kryształu ma
zastosowanie dla kryształów posiadających środek inwersji, płaszczyznę symetrii, oś symetrii 2 lub 4 krotną. .
56
W tych przypadkach każda składowa tensora w pierwotnym układzie współrzędnych („stary tensor”)
przechodzi w jedną tylko składową „nowego tensora” (w układzie współrzędnych otrzymanym z układu pierwotnego
poprzez transformację odpowiadającą danej operacji symetrii).
Jest tak z tego względu, że jak wyżej wspomniano każda składowa tensora transformuje się tak jak iloczyn
współrzędnych odpowiadających indeksom tej składowej.
Ta w zasadzie prosta metoda nie może być stosowana gdy nie ma tak bezpośredniej odpowiedniości
pomiędzy składowymi starego i nowego tensora. Takim właśnie przypadkiem jest kryształ z trzykrotna osią symetrii.
Trzeba wtedy zastosować inną metodę badania tensora, którą przedstawiono poniżej.
Transformacja wektorów bazowych układu kartezjańskiego przy obrocie o kąt  ma następującą postać:
e1  e1 cos   e 2 sin 
e2  e1 sin   e 2 cos 
e3  e3
Można to wykazać wychodząc od równania:


x  ( x  e j )e j

gdy w miejsce wektora położenia x wstawiać się będzie kolejno wersory e1 , e 2 , e3 (kropka oznacza tu iloczyn
skalarny wektorów).
Związki pomiędzy starymi i nowymi współrzędnymi są oczywiście takie same jak pomiędzy starymi i
nowymi wersorami ale mogą być znacznie uproszczone po wprowadzeniu tzw. współrzędnych cyklicznych.
Bazę cyklicznego układu współrzędnych definiuje się w sposób następujący:
j
1
e1  ie 2  j  1 e1  ie 2  e  e 3
2
2
Zależności odwrotne dla wersorów bazowych są:
e1   j  j e 2  i j  j e 3  e
Wynikają stąd związki pomiędzy kartezjańskimi
x, y, z  i cyklicznymi , , z 
współrzędnymi:
  x  iy
  x  iy
x      2 y      2
Nie jest trudno wykazać, że gdy rozważa się transformacje układu współrzędnych cyklicznych podczas
obrotu o kąt  to związki pomiędzy nowymi i starymi „wektorami” bazowymi oraz pomiędzy współrzędnymi są
następujące:
j  exp(  i ) j
  exp(i ) 
j  exp(i ) j e   e
  exp(i ) 
z  z
Ostatnie trzy równania można zapisać w zwartej i jak się zaraz okaże bardzo wygodnej postaci jako:
Al  c lk A k  exp(ik)lk A k
gdzie Al to współrzędna cykliczna, lk jest funkcją delta Diraca oraz indeks współrzędnej obecny w wykładniku
ma wartość liczbową, przypisaną mu zgodnie z następującą umową:
  1   1 z  0
57
Teraz, dla przejścia od starych do nowych składowych tensora rzędu r można zapisać zależności:
Tl1l 2 ...l r  c l1 k 1 ...c l r k r Tk 1 k 2 ...k r  exp(ik1 ) l1 k 1 ... exp(ik r ) l r k r Tk 1 k 2 ...k r
Niezmienniczość kryształu i jego własności względem operacji symetrii oznacza, że:
Tl1l2 ...lr  Tl1l2 ...lr
co po zastosowaniu poprzedniego równania prowadzi do warunku:

 2i
 
( l1  l 2  ...  l r )   1Tl1l2 ...l r  0
exp 
 N
 

gdzie 2i/N=
Składowe tensora o wskaźnikach l1,l2,...lr mogą być niezerowe jedynie wtedy, gdy suma wartości
liczbowych przypisanych do tych indeksów jest całkowitą krotnością (N jest krotnością osi symetrii).
Dla trzykrotnej osi obrotowej i dla tensora trzeciego rzędu daje to warunek:
l1  l 2  l 3  3,0,3
podczas gdy dla osi sześciokrotnej jedyna możliwość to:
l1  l 2  l 3  0
Wracając do pierwszego przypadku (oś 3-krotna), z powyższego warunku wynika, że niezerowe składowe
tensora trzeciego muszą posiadać zestaw indeksów z następującego zbioru:
z, z, z; , , , , , 
; , , z
, , , z
; z, , , z,  , 
; , z, 
, , z, 
Te niezerowe, czy też raczej nie muszące się zerować, składowe o zestawach indeksów zawartych w
powyższej liście są, jak nietrudno udowodnić, wielkościami zespolonymi.
Teraz trzeba wrócić do tensora „kartezjańskiego”. Przejście od niezerowych składowych tensora we
współrzędnych cyklicznych do niezerowych składowych w układzie kartezjańskim wymaga specjalnego
potraktowania, czy też niekonwencjonalnego przedstawienia tensora.
W tym przedstawieniu tensor będzie się rozumieć i zapisywać, jako sumę jego składowych. Jest to
oczywiście specjalna suma. Nie ma nic wspólnego z algebraicznym sumowaniem wartości składowych. Pomysł może
wydawać się dziwny w pierwszym momencie ale nie jest nowy. Przedstawianie wektora jako sumy jego składowych
mnożonych przez wersory bazowe wydaje się być całkiem naturalne tylko dlatego, że jest tak powszechne i dlatego,
że taka suma ma geometryczną (nie algebraiczną  ) interpretację. Jeśli przypomnieć, że wektor jest tensorem
pierwszego rzędu to okaże się, że bardzo często, choć nieświadomie, stosujemy pojęcie tensora jako sumy
składowych.
Dla tensorów rzędu wyższego niż pierwszy nie ma takiej prostej geometrycznej interpretacji. Tym niemniej
samą koncepcję można stosować, choć wymagana jest pewna ostrożność.
Załóżmy, że liczbowe wartości wyżej znalezionych, niezerowych składowych tensora trzeciego rzędu mają
następujące wartości:
a; b, b; c, c; d, d; f , f ;
wypisane w takiej samej kolejności (kreska oznacza wartość sprzężoną). Tensor można więc zapisać jako:
T  a z , z , z  b, ,   b, ,  c, , z  c , , z dz, ,   dz , , 
 f , z,  f , z, 
58
Taka jest postać końcowa badanego tensora, której uprościć już się nie da. Indeksy w nawiasach klamrowych
pozwalają identyfikować towarzyszące im liczby jako wartości różnych składowych tensora. Te trójki indeksów
decydują też o transformacji tensora przy zmianie układu współrzędnych np. z cyklicznego na kartezjański.
Chcąc znaleźć podobną formę tensora T w kartezjańskim układzie należy jedynie zbadać zmiany iloczynów
współrzędnych odpowiadających trójkom indeksów w kolejnych nawiasach przy zastąpieniu współrzędnych
cyklicznych kombinacjami współrzędnych kartezjańskich. Po rozwinięciu tych wyrażeń i pomnożeniu każdego z nich
przez odpowiednią liczbę ze zbioru (a,b......f) należy je wszystkie dodać oraz pogrupować składniki o tych samych
kombinacjach x,y,z (składniki różniące się kolejnością współrzędnych nie mogą być zgrupowane razem  ).
Przechodząc od iloczynów kartezjańskich już teraz współrzędnych do zbiorów indeksów w klamrach
otrzymuje się ostateczny rezultat w postaci:
T  gx , x, x  hx , y, y  ...
gdzie pewne permutacje indeksów nie występują a pewne liczby g,h... mogą być sobie równe lub mogą różnić się
tylko znakiem. Tak więc na podstawie powyższego wyrażenia można stwierdzić, które składowe tensora mają
niezerowe wartości i które z nich są niezależne.
Całkowita liczba niezerowych składowych tensora trzeciego rzędu, dla kryształu posiadającego 3-krotną oś
symetrii wynosi 21 ale niezależnych jest tylko 9.
59
2.6.
Równanie falowe w ośrodku nieliniowym i przepływ energii pomiędzy
oddziaływującymi falami świetlnymi
W poprzednich wykładach omawiając nieliniowe zjawiska optyczne podkreślano, że są one
konsekwencją nieliniowej polaryzacji. Zakładano, że taka polaryzacja może wytwarzać fale świetlne o tej samej
częstotliwości, które w pewnych sytuacjach razem z falami wejściowymi spełniają warunek dopasowania
fazowego. Natomiast ścisłe wyrażenia opisujące oddziałujące ze sobą fale świetlne, uwzględniające np. zmiany
ich natężeń podczas propagacji w ośrodku nie były w zasadzie dotąd poszukiwane.
W tym wykładzie przedstawione będzie równanie falowe w przypadku nieliniowym a na jego podstawie
zostaną wyprowadzone zależności pomiędzy amplitudami trzech fal biorących udział w nieliniowym
oddziaływaniu i spełniających warunek dopasowania fazowego.
Równanie falowe zwyczajowo uzyskuje się poprzez połączenie równań Maxwella zawierających
operatory rotacji:
rot E  
B
t
rot H 
D
t
gdzie w naszym przypadku dodatkowo założono, że ośrodek jest niemagnetycznym dielektrykiem. Indukcja
elektryczna zostanie zastąpiona przez:
D   0 E  Plinear  Pnonliner    0 E  Pnonlinear
gdzie  jest stałą dielektryczną dla przypadku liniowego. Otrzymuje się wtedy równanie falowe w następującej
postaci:
2
 E
1 2
c 2 t 2
E    0
 2 Pnl
t 2
Poszukamy związków pomiędzy amplitudami pola elektrycznego trzech fal rozchodzących się w
ośrodku nieliniowym wzdłuż osi z i podlegających warunkowi dopasowania fazowego. Pola te można zapisać
jako:
E1 ( z, t )  E1 ( z) exp i (1t  k 1z)   c.c.
E 2 (z , t )  E 2 ( z) exp i ( 2 t  k 2 z)   c.c
E 3 ( z, t )  E 3 ( z ) exp i ( 3 t  k 3 z )   c.c..
przy
1   2  3 . Konsekwentnie, polaryzacje dla odpowiednich częstości są:
P1 ( z, t )  2E 2 ( z) E 3 (z ) exp i( 3   2 ) t  ( k 3  k 2 )z )  c.c.
P2 ( z, t )  2E 3 ( z) E1 ( z) exp i (3  1 ) t  ( k 3  k1 ) z)   c.c.
P3 ( z, t )  2E1 ( z )E 2 (z ) exp i( 1   2 ) t  (k 1  k 2 )z )   c.c.
Zastosowanie tej samej polaryzowalności  dla wszystkich trzech polaryzacji znaczy, że zakłada się
przezroczystość ośrodka dla fal optycznych o częstościach 1,2,3. Człony zespolone sprzężone (c.c.) w
powyższych równaniach można formalnie traktować jako człony z trzema dodatkowymi częstościami -1, -2,
-3. Jednowymiarowe równanie falowe rozdziela się wtedy na sześć równań, każde dla innej częstości:
Z obliczenia pochodnych polaryzacji po czasie mamy:
60
 2 P1
t
2
 ( 3  2 ) 2E 2 ( z) E 3 ( z ) exp i (3  2 ) t  (k 3  k 2 ) z )

2
Z kolei pochodna przestrzenna natężenia pola elektrycznego jest:
 2E1 (z , t )
z
2
dE ( z) 

  k12 E1 ( z)  2ik 1 1  exp i (1 t  k1z )
dz 

co otrzymuje się przy założeniu wolnych zmian zespolonej amplitudy wzdłuż osi z. To wymaganie oznacza, że
1 dE
dE d 2 E .
i konsekwentnie k
E

2
k dz
dz
dz
Po podstawieniu pochodnych do równania falowego otrzymuje się następujący związek:
 0 12
dE 1 ( z )
 i
E 2 ( z) E 3 (z )
dz
k1
Analogiczne postępowanie dla dwóch pozostałych częstości prowadzi do:
 0 22
dE 2 (z )
 i
E1 ( z )E 3 (z )
dz
k2
 0 23
dE 3 ( z)
 i
E1 (z ) E 2 ( z)
dz
k3
Zależności te wiążą amplitudy trzech pól optycznych oddziaływujących w ośrodku nieliniowym w
warunkach dopasowania fazowego.
Dodatkowe trzy równania dla zmian sprzężonych zespolonych amplitud można formalnie wyprowadzić
z równań falowych dla członów z ujemnymi częstościami (można je też łatwo odgadnąć na podstawie trzech
ostatnich wzorów prezentowanych powyżej):
2
 0 1
dE 1 ( z)
i
E 2 ( z )E 3 ( z)
dz
k1

2
0  2
dE 2 ( z)
i
E1 (z ) E3 ( z)
dz
k2
2
 0 3
dE 3 ( z)
i
E1 ( z )E 2 ( z)
dz
k3
Korzystając z powyższych dwóch zestawów równań można zbudować trzy wyrażenia następującej postaci:
dE ( z) 
dE  ( z) d[E(z)E  (z )]
E ( z )  E( z)

dz
dz
dz
Strumień energii fali elektromagnetycznej jest:
S  EE 
61
Dlatego ostateczny rezultat powyższych rachunków może być zapisany jako:
d  S1  d  S 2 
d S 
   
    3 
dz  1  dz   2 
dz  3 
Jest to tak zwane prawo Manleya-Rowa dla wymiany energii pomiędzy oddziaływującymi falami
w czasie gdy przemieszczają się w ośrodku nieliniowym wzdłuż osi z. Jeśli przypomnieć, że energia fotonu jest
 to prawo Manleya-Rowa można interpretować jako przejaw ścisłego związku między liczbami fotonów fal
sprzężonych ze sobą poprzez oddziaływanie z ośrodkiem nieliniowym.
Prawo to ma oczywistą praktyczną wartość, można je bowiem wykorzystać do określania natężenia
generowanego promieniowania jeśli zna się częstotliwości oddziaływujących fal i natężenia fal pierwotnych
(wzbudzających).
Należy podkreślić, że w czasie gdy w ośrodku rozchodzą się trzy oddziaływujące fale rozróżnienie
pomiędzy falą wzbudzaną i falami wzbudzającymi nie jest niezmienne. Fale mogą zamieniać się rolami
począwszy od pewnego punktu ośrodka. Na przykład zamiast generacji fali o częstotliwości sumarycznej
3  1   2 , po wyczerpaniu się jednego ze składników tej „reakcji” może rozpocząć się generacja dla
częstotliwości różnicowej 1  3  2 .Warunek dopasowania fazowego będzie w dalszym ciągu spełniony.
Jeden z prezentowanych wyżej wniosków sugeruje, że nieliniowe procesy można rozumieć jako
przemianę fotonów umożliwioną przez obecność ośrodka nieliniowego. Takie przemiany reprezentują tak zwane
diagramy Feynmana, które wykorzystuje się w niektórych opracowaniach z optyki nieliniowej. Jednak w tych
wykładach podejście to nie będzie rozwijane.
62
2.7.
Realizacja warunku dopasowania fazowego w kryształach
Ze względu na dyspersję współczynnika załamania nie jest możliwe spełnienie warunku dopasowania
fazowego w ośrodku izotropowym. Jednak w ośrodkach anizotropowych światło rozchodzi się w szczególny sposób i
okazuje się, że warunek dopasowania fazowego można w nich, w pewnych okolicznościach, zrealizować.
W tym wykładzie będzie wyjaśnione jak to zrobić ale przedtem należy przypomnieć pewne podstawowe
informacje z optyki kryształów.
Fala świetlna padając na anizotropowy kryształ zazwyczaj rozszczepia się na dwie fale (wyjątki od tej
zasady dotyczą szczególnego kierunku rozchodzenia się względem struktury kryształu i szczególnego stanu
polaryzacji). Nazywa się je falą zwyczajną i nadzwyczajną. Ta druga nazwa jest w pełni uzasadniona ponieważ
prędkość fazowa i prędkość promienia dla fali nadzwyczajnej zależą od kierunku propagacji podczas gdy własności
fali zwyczajnej nie zależą od kierunku. Obie fale są liniowo spolaryzowane w kierunkach wzajemnie prostopadłych i
ze względu na różne prędkości fazowe mają różne wartości współczynnika załamania. Wykorzystanie tych dwóch
rodzajów fal w procesach nieliniowych pozwala na spełnienie warunku dopasowania fazowego. Indeksy „o” i „e”,
które pojawią się poniżej będą oznaczać wektory i inne wielkości związane odpowiednio z falą zwyczajną i
nadzwyczajną.
Własności optyczne anizotropowych kryształów graficznie przedstawia się za pomocą kilku rodzajów
trójwymiarowych powierzchni (sferoid, elipsoid i owaloid). Dla naszych potrzeb wprowadzimy tylko dwie z nich a
mianowicie indykatrysę optyczną i dwupowłokową powierzchnię współczynników załamania. Ograniczymy również
rozważania do kryształów jednoosiowych, o symetrii struktury warunkującej istnienie kierunku wzdłuż którego
promień zwyczajny i nadzwyczajny podróżują z tą samą prędkością (tzw. oś optyczna). Kryształy dwuosiowe tej
cechy nie posiadają i na ogół nie stosuje się ich w optyce nieliniowej z powodu trudności z analizą rozchodzenia się
wielu sprzężonych wzajemnie fal w takich kryształach.
W kryształach jednoosiowych indykatrysa optyczna jest elipsoidą obrotową (dwie z jej osi są równe a
trzecia pokrywa się z osią optyczną kryształu). Z definicji ta sferoida jest powierzchnią w przestrzeni indukcji
elektrycznej D, dla której punktów gęstość energii elektrycznej (E ) fali świetlnej jest ta sama. Rysuje się ją w
układzie osi głównych kryształu (wtedy równanie ją opisujące ma najprostszą postać). Pomimo tak dziwnej definicji
z badania indykatrysy optycznej można uzyskać zupełnie praktyczne informacje o rozchodzeniu się światła w
krysztale.
Równanie indykatrysy optycznej jest następujące:
x2
y2 z2


1
n 2x n 2y n 2z
gdzie x,y,z są znormalizowanymi niemianowanymi wielkościami związanymi z kartezjańskimi składowymi indukcji
D (na przykład x  D x
2 0 E ). Dla jednoosiowych kryształów stałe nx, ny są równe i dlatego powierzchnia
opisana przez powyższe równanie jest elipsoidą obrotową (sferoidą).
W tym samym układzie osi można teraz narysować kierunek propagacji fali płaskiej o wektorze falowym


k
. Przekrój sferoidy płaszczyzną prostopadłą do k , przechodzącą przez punkt O jest elipsą. Jedna z jej półosi leży
zawsze w płaszczyźnie OXY i jej długość nie zależy od kierunku rozchodzenia się fali, podczas gdy długość i

orientacja w przestrzeni drugiej półosi zmieniają się razem z kierunkiem wektora k . Można wykazać, choć nie jest
to trywialne, że te półosie określają kierunki oscylacji elektrycznych (dokładniej: oscylacji indukcji elektrycznej D)
fali zwyczajnej i nadzwyczajnej oraz, że ich długości dają wartości współczynników załamania tych dwóch fal (no i
ne). Oczywiście fala zwyczajna związana jest z półosią o stałej długości.
n e  n o (typ ujemny) a dla innych n e  n o (typ
dodatni). Jedynym kierunkiem propagacji, dla którego n e  n o jest oś OZ, zwana osią optyczną kryształu.

Odkładając dla każdego kierunku wektora k długości półosi, o których wyżej była mowa, można znaleźć
punkty odległe od środka układu współrzędnych o odległości odpowiadające wartościom ne i no .W ten sposób
Dla jednych kryształów zawsze stwierdza się, że
uzyskuje się dwupowłokową powierzchnię współczynnika załamania. Powłoka związana z falą zwyczajną jest sferą a
druga, odpowiadająca fali nadzwyczajnej – elipsoidą obrotową. Powłoki te stykają się jedynie w dwu punktach na osi
63
optycznej. Dla kryształów optycznie ujemnych, zazwyczaj stosowanych w optyce nieliniowej, powłoka elipsoidalna
leży wewnątrz sferycznej. Poniżej będzie rozpatrywany przypadek takich właśnie kryształów.
Ponieważ długość wektora falowego

 n
można teraz łatwo uzyskać dwupowłokową powierzchnię
k 
c
wektora k dla fali zwyczajnej i nadzwyczajnej. Ma ona podobne cechy jak odpowiednia dwupowłokowa
powierzchnia współczynników załamania.
Powierzchnie wektorów falowych mają zasadnicze znaczenie przy badaniu jak spełnić warunek
dopasowania fazowego w anizotropowych (dwójłomnych) kryształach ponieważ wektory falowe występujące w
równaniu



k1  k 2  k 3 muszą mieć swoje końce na tych powierzchniach, generalnie dla różnych częstotliwości.
Generacja drugiej harmonicznej (SHG) jest najprostszym ale wystarczająco poglądowym przykładem
k1 , k 2 reprezentują fale pierwotne o częstości podstawowej ,

podczas gdy k 3 reprezentuje generowaną falę o podwojonej częstotliwości 2. Fale mogą być zarówno zwyczajne
nieliniowego procesu. W tym przypadku wektory
jak i nadzwyczajne, ale nie wszystkie kombinacje są możliwe.


n o 
i w
k e  wynosi k o  
c
n o 
, bez względu na kierunek i typ fal
2
c
Dla kryształów ujemnych maksymalna długość wektora


konsekwencji zawsze prawdziwa jest nierówność k1  k 2
reprezentowanych przez
 
k1 i k 2 .
Jest również prawdą, że ze względu na dyspersję współczynnika załamania długość sumy wektorów



2n o 2 . To wyjaśnia dlaczego  nie może być związane
k3
k 1  k 2 jest zawsze mniejsza niż k o 2 
c
z falą zwyczajną (dla kryształów ujemnych).
Równanie




 
k1  k 2  k 3 nie będzie również spełnione, gdy k1 , k 2 i k 3 reprezentują fale
nadzwyczajne. Powodem znowu jest dyspersja współczynnika załamania.
Ostatecznie możliwe są dwie kombinacje fal w procesie SHG: oo-e oraz oe-e (pierwsze dwie litery
określają typ fal początkowych a ostatnia typ generowanej fali drugiej harmonicznej; „o” oznacza falę zwyczajną,
„e” nadzwyczajną). Dodatkowo dla każdego z tych przypadków możliwe są dwa warianty: fale początkowe mogą
rozchodzić się wzdłuż tej samej prostej lub mogą mieć różne kierunki. Tak więc rozróżnia się pomiędzy
synchronizmami liniowymi i wektorowymi.
Wszystkie cztery sytuacje, w których możliwe jest spełnienie warunku dopasowania fazowego w krysztale
jednoosiowym, ujemnym przedstawia Rys.2.7.1.
Synchronizmy liniowe mają miejsce dla określonych wartości kąta s pomiędzy kierunkiem propagacji
oddziałujących fal i osią OZ, podczas gdy synchronizmy wektorowe są możliwe w pewnym zakresie kątów .
Wartość kąta s można obliczyć korzystając z odpowiednich równań dwupowłokowej powierzchni współczynników
załamania. Dla synchronizmu liniowego typu oo-e otrzymuje się:

cos s(1)  n o 2 n o1  n o21  n e22
 n o22  n e22 
gdzie parametry no1, no2, ne2 mają wartości współczynników załamania dla fal rozchodzących się w kierunku
prostopadłym do osi optycznej:
no1=no(), no2=no(2), ne2=ne(2).....(dla =/2)
Jeżeli kąt  ma być określony, co oznacza możliwość spełnienia warunku dopasowania fazowego, to no1
musi być większe niż ne2. Kryształy takie jak KDP mają tę właściwość nawet w temperaturze pokojowej. Dla
pewnych kryształów no1ne2 w temperaturach pokojowych, ale przez odpowiednie dostrojenie temperaturowe
można osiągnąć sytuację gdy no1=ne2. Nazywa się to synchronizmem dziewięćdziesięciostopniowym a jego
interesującą cechą jest, że wykazuje większą niż dla innych wartości s tolerancję na niewielkie odchylenia kierunku
64
fal od kierunku ścisłego dopasowania. Jest to korzystne bowiem w praktyce takie odchylenia zawsze istnieją, choćby
ze względu na rozbieżność wiązek światła.
a)
b)
c)
Rys.2.7.1. Liniowe i wektorowe synchronizmy w krysztale dwójłomnym ujemnym. Liniowe synchronizmy
zaznaczono na tym samym rysunku a) podczas gdy synchronizmy wektorowe przedstawione są oddzielnie: b) oo-e,
c) oe-e. Mała litera k z indeksami odnosi się do fal o częstotliwości podstawowej natomiast duża litera K dotyczy
fal o częstotliwości drugiej harmonicznej
Chociaż generacja drugiej harmonicznej jest specjalnym przypadkiem nieliniowego procesu, to realizacja
warunku dopasowania fazowego w innych nieliniowych zjawiskach konwersji częstotliwości przebiega w podobny
sposób. Główna różnica polega na tym, że wszystkie trzy fale mają różne częstości i trzeba uwzględniać nie dwa ale
trzy zestawy charakteryzujących je powierzchni.
65
2.8.
Efektywna polaryzowalność
harmonicznej
kwadratowa
w
zjawisku
generacji
drugiej
Wpływ symetrii kryształu na tensor polaryzowalności kwadratowej i sposoby realizacji warunku
dopasowania fazowego w kryształach były już dyskutowane w poprzednich wykładach.
W praktyce potrzebna jest dla danego kryształu i określonego typu synchronizmu znajomość zależności
pomiędzy amplitudami dwóch pierwotnych fal świetlnych i amplitudą polaryzacji generującej trzecią falę świetlną o
podwojonej częstotliwości. Można wtedy optymalizować geometrię eksperymentu, tak by uzyskać największą
użyteczną polaryzację o częstości 2 dla zadanych amplitud pola elektrycznego fal pierwotnych. Należy pamiętać,
że warunek dopasowania fazowego ustala jedynie kąt  pomiędzy wektorem falowym i osią OZ a nie nakłada
żadnych ograniczeń na kąt azymutalny  pomiędzy rzutem wektora falowego na płaszczyznę OXY i osią OX.
Poniżej pokazane będzie jak otrzymać poszukiwaną zależność.
Zacznijmy od znanego już wzoru:
Pi    ijk E jE k
jk
otrzymanego dla najprostszego przypadku tj. synchronizmu skalarnego typu oo-e.
W tej sytuacji należy wyrazić składowe Ej i Ek poprzez amplitudę natężenia pola elektrycznego fali
zwyczajnej o podstawowej częstotliwości. Wektor polaryzacji określony tym wzorem można rozłożyć na sumę
dwóch składowych, z których jedna jest równoległa a druga prostopadła do kierunku propagacji fali świetlnej
nadzwyczajnej o podwojonej częstotliwości. Jak wiadomo z własności promieniowania dipolowego jedynie druga z
tych składowych jest źródłem fali nadzwyczajnej. Można ją znaleźć jako rzut wektora [Px,Py,Pz] (określonego
powyższym wzorem) na kierunek oscylacji elektrycznych fali nadzwyczajnej. Jest to równoważne policzeniu
iloczynu skalarnego wektora [Px,Py,Pz] i wektora jednostkowego b równoległego do natężenia pola elektrycznego
E e2 dla fali nadzwyczajnej:

P2e  b  P  b i Pi
Następnie po zrobieniu podstawienia:


Pi   ijk E jE k   ijk E oa j  E o a k
jk
gdzie

jk
aj, ak są kosinusami kierunkowymi wektora jednostkowego a równoległego do pola E o fali zwyczajnej
(o podstawowej częstotliwości), ostatecznie otrzymuje się:



 2
P2e   b j ijk E o a j  E oa k   ijk b ia ja k E o
ijk
ijk
 ijk b i a ja k zwana jest efektywną polaryzowalnością  ef (dla rozważanego
synchronizmu oo-e) i jest funkcją łączącą użyteczną część generowanej polaryzacji o częstości 2 z amplitudą
Suma iloczynów
wektora natężenia pola elektrycznego fali pierwotnej.
Zależy ona od niezerowych składowych tensora polaryzowalności kwadratowej
 ijk i od geometrii
 ef pozwala na znalezienie takiego kierunku propagacji fal w
krysztale (określonego już nie tylko przez kąt synchronizmu s(1) ale również przez kat azymutalny ), dla którego
eksperymentu (która określa wektory a i b). Analiza
uzyska się najsilniejszą drugą harmoniczną światła.
66
Dla skalarnego synchronizmu typu oe-e otrzymuje się w podobny sposób nieco inne wyrażenie:
P2e   ijk b ia jb k E o E e
ijk
Poniższy rysunek
wyprowadzeniach.
pokazuje
przestrzenne
położenie
wektorów
występujących
w powyższych
Rys.2.8.1. Kąty i wersory występujące we wzorach na polaryzowalnośc efektywną. Kierunki wersorów a i b
odpowiadają oscylacjom elektrycznym fali zwyczajnej i nadzwyczajnej. Wektor a leży w płaszczyźnie OXY;
a,b,k są wzajemnie prostopadłe, a jest także prostopadły do rzutów bxy i kxy. s jest kątem synchronizmu
skalarnego, kąt  oznacza azymut.
67
2.9.
Procesy parametryczne w nieliniowym oddziaływaniu fal świetlnych
Prawo Manleya-Rowa opisujące przepływ energii między falami podczas nieliniowego procesu,
wyprowadzone w jednym z poprzednich wykładów, opiera się na następujących założeniach:
1) fale rozchodzą się w ośrodku nieliniowym
2) przynajmniej jedna z fal jest silną wiązką laserową
3) wektory falowe trzech fal spełniają warunek dopasowania fazowego.
Pierwsze założenie oznacza, że niezerowe składowe tensora polaryzowalności kwadratowej kryształu są
względnie duże.
Drugie założenie nie było jawnie sformułowane ale jest oczywiste, że nawet w ośrodku nieliniowym w
sensie właśnie wyjaśnionym, procesy nieliniowe mogą być obserwowane dopiero gdy pole elektryczne fali
świetlnej ma natężenie porównywalne z polem atomowym. Indukowane światłem oscylacje elementarnych dipoli
nie są już dłużej harmoniczne i pojawia się nieliniowa polaryzacja.
Warunek dopasowania fazowego wymieniony w trzecim punkcie można zapisać jako:



k1  k 2  k 3 i
określa on kierunki rozchodzenia się trzech oddziaływujących fal.
Jak wynika z postaci wyrażenia na kwadratową polaryzację częstotliwości tych fal są również ze sobą
powiązane. Zgadza się to z zasadą zachowania energii zastosowaną do procesu nieliniowego rozumianego jako
przemiana fotonów.
Załóżmy, że związek między częstościami ma postać: 1  2  3 .
W bieżącym wykładzie rozważanych będzie kilka szczególnych przypadków przekazywania energii od
silnej fali światła laserowego o częstości 3 do fal o częstościach 2 i 1. Dla fal tych używa się określeń:
pompująca, sygnałowa i bierna, a odpowiadające im częstości oznaczone będą jako: p3, s1, i2.
Trzy przypadki poniżej przedstawione to: parametryczne wzmocnienie, parametryczna luminescencja
i generacja parametryczna. Określenie „parametryczna” wprowadzone ze względu na analogie z efektami
znanymi z radiowego i mikrofalowego zakresu widma fal elektromagnetycznych oznacza, że procesy te można
rozumieć jako rezultat rozchodzenia się światła w ośrodku, którego jeden z parametrów (stała dielektryczna,
współczynnik załamania) podlega w tym czasie modulacji z częstotliwością innej fali świetlnej. Należy jednak
mieć świadomość, że jest to tylko usprawiedliwienie nazwy, a nie podstawa do pełnego wyjaśnienia tych
procesów.
Parametryczne wzmocnienie
Na kryształ nieliniowy padają fale pompująca i sygnałowa. Kryształ jest odpowiednio zorientowany, tak
że spełniony jest warunek dopasowania fazowego:




n ()
k s  k i  k p gdzie k( ) 
.
c
Nieliniowość oddziaływania jest wywołana silnym polem elektrycznym fali pompującej. W ośrodku
„przygotowanym” przez to silne pole powstaje polaryzacja kwadratowa i generowana przez nią fala świetlna o
i   p  s . Z kolei fala pompująca i bierna wytwarzają kwadratową polaryzację
i światło o częstości fali sygnałowej s  p  i . Ze względu na zasadę zachowania energii, którą jak
częstości na przykład:
założono zapisujemy tu w postaci związku:
p  s  i ( p  s ,i ) i obowiązywanie prawa Manley-
Rowa, w obu przypadkach energia fali pompującej zamienia się w energię fal sygnałowej i biernej. Inaczej
mówiąc foton p „rozszczepia się” na fotony s i i. Efekt ten zachodzi wzdłuż kierunku propagacji fal
(kierunku dopasowania fazowego). Można więc stwierdzić, że fala sygnałowa jest wzmacniana w czasie
przechodzenia przez kryształ.
Parametryczna luminescencja
Obecnie rozważymy przypadek gdy do kryształu wchodzi z zewnątrz jedynie fala pompująca. Kryształ
jest zorientowany względem kierunku tej fali dokładnie tak jak poprzednio (przy dyskusji parametrycznego
wzmocnienia).
Ze względu na fluktuacje pola elektromagnetycznego, zachodzące nawet wtedy gdy średnia wartość
pola jest zerowa, w krysztale obecny jest tzw. szum optyczny. W bogatym widmie tego szumu można zawsze
wyróżnić dwie fale identyczne z falami sygnałową i bierną, uwzględnianymi w rozpatrywanej powyżej sytuacji
parametrycznego wzmocnienia.
68
Fale te są teraz bardzo słabe ale ich wektory falowe i częstotliwości są takie jak poprzednio. Tak więc w


k s i k i można spodziewać się powstawania i wzrostu właśnie takiego promieniowania.
Zachodzi rozszczepienie fotonów p w fotony s i i . Wyjaśnia się to dokładnie tak jak poprzednio, a jedyna
kierunkach wektorów
różnica polega na tym, że nie ma zewnętrznego źródła fali sygnałowej.
p  s  i , gdzie jedynie p jest z góry zadane, może być spełniony także


przez inne pary s , i. Jednak dla tych nowych częstości kierunki wektorów k s i k i muszą się zmienić jeśli



ma dalej obowiązywać warunek k s  k i  k p . W konsekwencji częstotliwość obserwowanych fal sygnałowej i
W ogólności, warunek
biernej zależy od kierunku obserwacji.
Energia fali pompującej rozprasza się teraz na wiele nowych fal o różnych częstotliwościach, jest więc
oczywiste, że natężenie każdej z nich będzie bardzo małe. Pomimo to jest to efekt eksperymentalnie
obserwowany. Doświadczenie potwierdza również zależność częstotliwości od kierunku fali sygnałowej.
Przedstawione zjawisko nazywa się parametryczną luminescencją lub parametrycznym rozpraszaniem.
Generacja parametryczna
Wstawienie kryształu zdolnego do parametrycznej luminescencji do rezonatora i wprowadzenie tam fali
pompującej może prowadzić do tzw. parametrycznych oscylacji. W rezultacie można otrzymać sygnał wyjściowy
o znacznej mocy i przestrajanej częstotliwości.
Dyskutowana powyżej parametryczna luminescencja jest możliwa dla różnych par częstotliwości fali
sygnałowej i biernej i dla różnych kierunków tych fal. Obecność rezonatora sprawia, że korzystne warunki
rozwoju są zapewnione tylko dla fal rozchodzących się wzdłuż osi rezonatora, posiadających częstotliwości
określone przez jego długość i przez selektywność odbicia zastosowanych zwierciadeł. Zwierciadła są
przezroczyste dla fali pompującej (czasami tylko jedno z nich) i częściowo odbijające dla fali sygnałowej o
pewnej częstości. Wychodząca z rezonatora część fali sygnałowej stanowi falę wyjściową o nowej
częstotliwości, natomiast część odbijająca się pomiędzy lustrami wielokrotnie przechodzi przez kryształ
podlegając wzmocnieniu w rezultacie transferu energii od fali pompującej do sygnałowej i biernej (Rys.2.9.1).
Dodatnie sprzężenie zwrotne zrealizowane w rezonatorze dla fali sygnałowej nie tylko zwiększa jej
moc, ale także poprawia spójność.
Rys.2.9.1. Generator parametryczny z synchronizmem skalarnym.
W układzie z podwójnym rezonatorem (Rys.2.9.3) sprzężenie zapewnione jest także dla fali biernej,
przez co otrzymuje się dwie intensywne fale o dwu różnych częstościach. Inne typowe geometrie rezonatorów
wykorzystywanych do parametrycznej generacji przedstawiają Rys.2.9.2 oraz Rys.2.8.4.
69
Rys.2.9.2. Generator parametryczny ze skalarnym synchronizmem i pierścieniowym rezonatorem.
Rys.2.9.3. Generator parametryczny z podwójnym rezonatorem i synchronizmem wektorowym.
Rys.2.9.4. Przestrajalny generator parametryczny z wektorowym synchronizmem.
70
Parametryczna generacja to proces wymuszony i dlatego, jak można oczekiwać, występuje tu progowa
wartość mocy fali pompującej (zależna od współczynnika dobroci rezonatora oraz od nieliniowości kryształu),
która jest wymagana do zainicjowania tego zjawiska.
Częstotliwość fali sygnałowej można stroić poprzez zmianę długości rezonatora przy jednoczesnym
obrocie kryształu, koniecznym dla zachowania dopasowania fazowego dla fali o nowej częstotliwości.
W ten sposób generatory parametryczne mogą stanowić efektywne źródła światła spójnego
o przestrajanej częstotliwości.
71
Literatura:
Część 1.
1. Piekara A., Nowe oblicze optyki, (PWN, Warszawa, 1976).
2. Kaczmarek F., Wstęp do fizyki laserów, (PWN, Warszawa, 1986).
3. Karłow N.W., Wykłady z fizyki laserów, (WNT, Warszawa, 1989).
4. Shimoda K., Wstęp do fizyki laserów, (PWN, Warszawa, 1993)
Część 2.
1. Blombergen N., Nonlinear Optics, (W.A. Benjamin, New York, 1965).
2. Zernike F., Midwinter J., Applied Nonlinear Optics, (John Willey & Sons, New York, 1973).
3. Sirotin I., Szaskolskaja M., Osnowy kristałofiziki, (Izdatielstwo Nauka, Moskwa, 1975).
4. Yariv A., Quantum Electronics, (John Willey & Sons, New York, !975).
5. Dmitrejew W., Tarasow W., Prikładnaja nieliniejna optika, (Izdatielstwo Radio Swjaź, Moskwa, 1982).
6. Chmela P., Wprowadzenie do optyki nieliniowej, (PWN, Warszawa, 1987).