bic kryształu
Transkrypt
bic kryształu
Wykład I. Wiązania chemiczne.
Podstawowe pytanie, które wymaga odpowiedzi gdy zajmujemy się materia w
stałym stanie skupienia jest pytanie o naturę sił , które utrzymują atomy i cząsteczki w
określonym obszarze przestrzeni nadając ciału odpowiedni kształt a także określają inne
właściwości mechaniczne. Okazuje się, że od natury tych sił zalezą także przewodnictwo
elektryczne , podatności elektryczne i magnetyczne, zdolności pochłaniania i emisji światła a
także szereg innych właściwości materii.
W zasadzie nie mamy wątpliwości , że siły nadające ciału określony kształt w
większości przypadków mają naturę elektromagnetyczną i związane są ze specyficznym
rozkładem ładunków w atomach i cząsteczkach tworzących ciało stałe. Samo zaś
oddziaływanie powodujące utrzymanie się substancji w całości nazywamy wiązaniem
chemicznym. Rozróżnia szereg oddziaływań ( w trakcie wykładu omówionych zostanie pięć z
nich), które są odpowiedzialne za tworzenie się wiązań.
Definiujemy energię kohezji ( spójności ) jako energię , którą trzeba dostarczyć aby
rozłożyc kryształ na zbiór swobodnych atomów o tej samej konfiguracji elektronowej ,
znajdujących się w spoczynku nieskończenie daleko od siebie .
Energię sieci definiuje się dla kryształów jonowych jako energię , która jest potrzeban aby rozłożyć
kryształ na odpowiedni zbiór jonów.
Typ wiązań chemicznych zależy na ogół z właściwościami atomów tworzących ciała
stałe.
W przypadku gdy mamy do czynienia z atomami zamknięto powłokowymi
(zewnętrzna walencyjna powłoka elektronowa jest całkowicie zapełniona) , bardzo trudno jest
oderwać elektrony od atomów. Atomy nie posiadają wypadkowego ładunku elektrycznego.
Możliwa jest jednak polaryzacja poszczególnych atomów i kryształ utrzymuje się w całości
w skutek istnienia przyciągania pomiędzy momentami dipolowymi. Z wiązaniem tego typu,
nazywanym wiązaniem van der Waalsa – Londona mamy do czynienia w przypadku
kryształów pierwiastków szlachetnych, takich jak Ne, Ar, Kr, Xe.
Jeśli substancja zbudowana jest z atomów, które posiadają jeden lub co najwyżej dwa
elektrony walencyjne wówczas elektrony te, będąc słabo związane z poszczególnymi
1
atomami tworzą chmurę ładunku ujemnego wokół dodatnio naładowanych jonów. Takie
rozdzielone ładunki przyciągają się, utrzymując ciało stałe w całości Wiązanie to nosi nazwę
wiązania metalicznego. Typowymi przykładami są kryształy miedzi, srebra i złota, a także
innych metali. Wysoka przewodność elektryczna metali związana jest właśnie z istnieniem
swobodnych, lub prawie swobodnych elektronów.
Innym przykładem są kryształy związków chemicznych , w których jednemu ze
składników brakuje pojedynczego elektronu do zapełnienia powłoki walencyjnej , drugi zaś
posiada tylko jeden walencyjny elektron. Przykładem może tu być kryształ NaCl. Sód ma
jeden chlor zaś siedem elektronów walencyjnych. W krysztale NaCl elektron przechodzi od
Na do Cl, tworząc się parę przyciągających się wzajemnie jonów Na+ i Cl- . Wiązanie to nosi
nazwę wiązania jonowego.
Odrębny typ oddziaływań pojawia się gdy kryształ tworzony jest przez atomy
posiadające w połowie zapełnione powłoki walencyjne . Przykładami mogą być kryształ
diamentu, krzemu lub germanu. Atomy te posiadają po cztery elektrony walencyjne. Tworząc
kryształ każdy atom łączy się z czterema najbliższymi sąsiadami dostarczając do każdego z
tak powstałych wiązań po jednym elektronie. W ten sposób na każde pojedyncze wiązanie
pomiędzy dwoma jonami przypada po dwa elektrony . Tworzone w ten sposób wiązanie
nazywa się wiązaniem kowalencyjnym. Natura sił utrzymujących kryształ w całości tylko
częściowo ma tu charakter elektrostatyczny. Główny czynnik związany jest z kwantowym
efektem tworzenia się orbitali wiążący i antywiążących oraz faktem ich połowicznego
zapełnienia przez elektrony walencyjne.
Podobnie kwantowy charakter ma wiązanie wodorowe, występujące na ogół w
cząsteczkach związków organicznych. Atom wodoru podobnie jak metale może oddać swój
jedyny elektron walencyjny. Ponieważ to co pozostaje to tylko pojedynczy proton o znikomo
małej objętości może pojawiać się w praktycznie w każdym miejscu powodując pojawienie
się siły przyciągających ujemne jony lub grupy jonów.
W rzeczywistości na ogół nie mamy do czynienia ze ściśle określonym jednym
typem wiązania. Dotyczy to w zasadzie wszystkich typów wiązań, jednak w
największym stopniu wymieszane są wiązanie kowalencyjne i jonowe.
2
Aby lepiej zrozumieć naturę poszczególnych wiązań warto przeanalizować proces
powstawania kryształu w sposób ilościowy, czyli przedstawiając energię potencjalną układu
w funkcji odległości pomiędzy atomami. Gwałtowny rozwój technik obliczeniowych chemii
kwantowej oraz mocy obliczeniowej komputerów pozwalają przeprowadzić dla wielu
związków chemicznych bardzo precyzyjne obliczenia metodą z pierwszych zasad, nadal
jednak pożyteczna jest analiza prostych modeli fenomenologicznych, dla których wartości
parametrów opisujących energie potencjalną układu bierze się z doświadczenia.
Rozważając procesy prowadzące do utworzenia ciał stałych należy brać pod uwagę
dwa rodzaje sił . Pierwszy rodzaj oddziaływania to oddziaływanie przyciągające, które
powoduje, że atomy tworzące kryształ pozostają blisko siebie pomimo drgań termicznych.
Drugie oddziaływanie to oddziaływanie odpychające, które nadaje ciału sprężystość.
O ile oddziaływanie przyciągające powodujące pojawienie się sił spójności można
obliczyć na gruncie klasycznej elektrodynamiki rozważając ładunki w krysztale o tyle natura
oddziaływania prowadzącego do pojawienia się sił odpychających nie jest tak jednoznaczna.
W dużym stopniu oddziaływanie to wynika z kwantowej natury atomów i elektronów a także
jest konsekwencją zasady nieoznaczoności. Zbliżając do siebie atomy zmniejszamy rozmiary
układu . To z kolei powoduje wzrost nieoznaczoności pędu. Większa nieoznaczoność pędu to
większa energia kinetyczna . W konsekwencji, zupełnie niezależnie od oddziaływań
elektrostatycznych , gdy zbliżamy do siebie dwa atomy musimy podwyższyć ich energię. Z
kolei fakt, że każdy układ dąży do osiągnięcia jak najmniejszej energii powoduje w tym
przypadku pojawienie się siły odpychającej. Kwantowa natura oddziaływania odpychającego
powoduje, że jest ono w przybliżeniu takie same , niezależnie od rodzaju sił spójności.
Potencjał powodujący pojawienie się siły odpychającej wyraża się przy pomocy
wzorów empirycznych. Najczęściej stosuje się wyrażenia typu:
U ( R) = λ ⋅ e
+
−
R
ρ
(I.1)
lub
σ
U + ( R ) = 4ε ⋅ ( )12
R
(I.2)
3
Znak (+) pojawia się dlatego, że jest to potencjał dodatni. W obu przypadkach R jest
odległością pomiędzy atomami ( jonami ) , zaś pozostałe wielkości są parametrami
empirycznymi, których wartości bierze się z doświadczenia ( σ i ρ są pewnymi
charakterystycznymi odległościami , zaś ε i λ są stałymi określającymi wielkość potencjału.
)
Rozważając wyrażenia (I.1) i (I.2) zauważamy, że nie są one sobie równoważne. W
szczególności widzimy, że dla odległości pomiędzy najbliższymi sąsiadami dążącej do zera
energia dana przez zależność (I.2) dąży do nieskończoności podczas gdy energia dana przez
wyrażenie (I.1) pozostaje skończona. Wydaje się, że bardziej realne jest wyrażenie (I.1) ( na
ogół unika się teorii, które prowadzą do nieskończonych wartości wielkości fizycznych),
jednak w zakresie wartości R, które odpowiadają odległościom międzyatomowym w
kryształach obie zależności są bardzo podobne i dobrze opisują rzeczywistość. Na
przykładzie wzorów (I-1) i (I-2) widać, że modele ( teorie ) fizyczne mają na ogół
ograniczony zakres stosowania, w którym są prawdziwe.
Wiązanie jonowe:
Ważnym przykładem wiązania krystalicznego jest wiązanie jonowe. Wiązanie to jest
charakterystyczne dla szeregu związków chemicznych. Tworzy się ono wówczas gdy po
zbliżeniu do siebie atomy jednego pierwiastka oddają elektrony , drugiego zaś przyjmują. Są
to związki metali alkalicznych takich jak Li, Na, K, Rb wraz z F, Cl, Br, I. Przykładem
może być kryształ soli kuchennej NaCl. Jony metalu oddają swój jedyny elektron walencyjny
ns ( n to główna liczba kwantowa, s odpowiada orbitalowi atomowemu typu s) atomowi
fluoru, chloru bromu lub jodu, gdzie uzupełnia powlokę ms2mp5. W ten sposób powstają
jony dodatnie i ujemne pomiędzy którymi działa siła przyciągania elektrostatycznego.
Energia potencjalna dwóch jonów, oznaczonych indeksami ‘i’ i ’j’ jest równa
U ij− = −
q2
Rij
(I.3)
gdzie Rij jest odległość pomiędzy jonami, zaś q ładunkiem jonów.
Całkowita energia potencjalna i-tego jonu, wynikająca z istnienia wszystkich
pozostałych jonów w krysztale, Ui , jest równa sumie tych energii po wszystkich jonach.
4
U = ∑ U ij = q
−
i
j
2
∑
±
− q 2α
=
pij R
R
(I.4)
We wzorze (I.4) wykorzystano fakt, że odległość pomiędzy dwoma dowolnymi
jonami i i j można wyrazić przy pomocy odległości pomiędzy najbliższymi sąsiadami, R
Rij = R ⋅ pij
(I.5)
Współczynniki pij są zawsze większe od jedności, w ten sposób suma szeregu
α =∑
j
±1
pij
(I.6)
ma zawsze wartość skończoną . Stałą tą nazywamy stałą Madelunga.
Dodając dodatnia i ujemna energię układu daną przez wzory (I.1) i (I.4) otrzymuje się wyrażenie na zależność
całkowitej energii przypadającej na parę jonów od odległości pomiędzy jonami w krysztale.
U ( R ) = U ( R ) + U ( R ) = Z (λ ⋅ e
+
−
−
R
ρ
−
q 2α
)
R
(I.7)
Z jest ładunkiem jonów. Ze względu na to, że energia dowolnej pary jest taka sama we wzorze (I.7) pominięto
indeks i. Całkowitą energie spójności kryształu otrzymuje się mnożąc energię (I.7) przez ilość par jonów N.
Wartości stałej Madelunga oraz stałych λ i ρ dla poszczególnych kryształów można znaleźć w
podręcznikach( {1} C. Kittel , Wstęp do Fizyki Ciała Stałego, PWN W-wa 1974 , str 112)
Wiązanie van der Waalsa – Londona
Atomy gazów szlachetnych ( Ne, Ar ,Kr, Xe) mają całkowicie zapełniona powłokę
elektronów walencyjnych ns2np6 . Z ego powodu nie wchodzą one w reakcje chemicznie z
innymi substancjami. W niskich temperaturach gazy te ulegają skropleniu a w jeszcze
niższych przechodzą w stały stan skupienia tworząc kryształy. Atomy gazu szlachetnego
pozostają elektrycznie obojętnie tworząc ciało stałe. Skoro siły spójności takiego kryształy
nie mogą pochodzić od całkowitych ładunków jonów ani od wiązania kowalencyjnego
należy rozważyć inne oddziaływania. Najważniejsze to polaryzacja, która przesuwa ładunki
ujemne chmury elektorów i dodatnie jąder atomowych , nie zmieniając przy tym całkowitego
5
ładunku atomu. Przypadkowe drgania termiczne atomów mogą powodować ich
spontaniczną polaryzację. Dzięki rozsunięciu ładunków atom uzyskuje elektryczny moment
dipolowy. Podczas tego wykładu posłużymy się momentem dipolowym przypadającym na
objętość atomu , V0. Wielkość ta zdefiniowana jest następująco:
p=
q ⋅ ∆x
V0
(I.8)
gdzie q jest ładunkiem a ∆x jest przesunięciem ładunku.
Pole elektryczne w odległości R od tego dipola będzie w przybliżeniu dane przez relację:
E≈2
p
R3
(I.9)
Pole to z kolei będzie polaryzowało kolejne atomy ( indukcja elektryczna) . Tak więc
w odległości R od dipola p indukowany będzie elektryczny moment dipolowy p’.
pi ' = αE ≈ 2α
pj
(I.10)
Rij3
Należy zwrócić uwagę , że stała α występująca we wzorach (I.10) nie jest stałą Madelunga
lecz polaryzowalnością kryształu (polaryzowalność definiujemy jako współczynnik
proporcjonalności pomiędzy indukowanym elektrycznym momentem dipolowym a
natężeniem wywołującego go pola elektrycznego )
Rij jest odległością pomiędzy atomami. Można obliczyć energię momentu dipolowego
pi’ w polu elektrycznym pochodzącym od momentu dipolowego pj . Energia ta jest ujemna i
wynosi:
U ( − ) ( Rij ) = − pi ' E ≈ −
2 pi ' p j
3
ij
R
≈−
4αpi
Rij6
(I.11)
Często zamiast wielkość 4αp zastępuje się jedną stała C lub 4εσ 1 / 6 i wówczas
U ( − ) ( Rij ) = −
C
σ
= −4ε ( ) 6
6
Rij
Rij
(I.12)
6
Warto w tym miejscu zwrócić uwagę na szczególny przykład oddziaływania dwóch
obojętnych atomów. Biorąc pod uwagę energię dodatnią daną wzorem (I.2) i ujemną
energię daną wzorem (I.12) otrzymamy energię oddziaływania dwóch atomów w postaci :
U ( Rij ) = U ( + ) ( Rij ) + U ( − ) ( Rij ) = 4ε [(
σ
Rij
)12 − (
σ
Rij
)6 ]
(I.13)
znaną jako potencjał Lennarda –Jonesa. Wzór ma znaczenie historyczne i był używany
zarówno do opisu ciała stałego jak i zderzeń atomów w gazie.
Aby otrzymać energię przypadającą na dwa atomy w krysztale należy dodać wszystkie
przyczynki ( relacja I.9). Postępując podobnie jak w przypadku wiązań jonowych
otrzymamy
σ
σ
U ( R ) = 4ε [ A( )12 − B ( ) 6 ]
R
R
Gdzie A = ∑ (
j
(I.14)
1 12
1
) i B = ∑ ( )6 .
pij
pij
j
Należy podkreślić, że w przypadku wiązania van der Waalsa- Londona tak jak i w przypadku
wiązania jonowego potencjał dodatni odpowiedzialny za odpychanie jonów może być
wyrażony przez równanie (I.1) ( W praktyce potencjały (I.1) i (I.2) mogą być stosowane
zamiennie ). Wówczas wyrażenie (I.14) może być zastąpione przez
U ( R ) = Z [λ ⋅ e
−
R
ρ
σ
− b( ) 6 ]
R
(I.15)
We wzorze (I.15) współczynnik b może być łatwo obliczony b = 4εB / Z .
Wiązanie kowalencyjne.
Tak jak wspomniano wiązanie kowalencyjne ma charakter kwantowy i nie może być opisane przy pomocy
klasycznych sił przyciągania elektrostatycznego. Rozważmy najprostszy przypadek cząsteczki dwuatomowej
składającej się z dwóch identycznych atomów: atomu A i atomu B ( np cząsteczka wodoru). Schematycznie
7
cząsteczka jest przedstawiona na Rysunku I.1 Załóżmy dalej, że każdy atom wnosi jeden elektron do wiązania
(jest to oczywiste w przypadku cząsteczki wodoru). Jeśli atomy znajdują się daleko od siebie wówczas oba
elektrony mają taką samą energię E
E = E A = EB
(I.16)
Rys. I.1 schemat tworzenia się
wiązania kowalencyjnego
cząsteczki dwuatomowej.
elektron
RA
RB
A
R
B
Energia orbitala antywiążącego
E
W mechanice kwantowej energie te oblicza się jako wartości oczekiwane hamiltonianów ( operatorów
Hamiltona) HA i HB
E A = H AA = ∫ dRϕ *A H Aϕ A
E B = H BB = ∫ dRϕ B* H Bϕ B
(I.17)
gdzie odpowiednie hamiltioniany wyrażone są następująco
− η2 ∇ 2
+ U (RA )
2m
− η2 ∇ 2
HB =
+ U ( RB )
2m
HA =
a
ϕA i ϕB
(I.18)
są funkcjami falowymi elektronów w atomach A i B. Zbliżając atomy do siebie musimy
uwzględnić, że elektrony przestaną być przyporządkowane poszczególnym atomom. Inaczej mówiąc każdy z
elektronów porusza się w polu obu atomów .( Dla uproszczenia rachunków nie uwzględnimy dalej energii
odpychania obu elektronów i energii odpychania jąder).
W języku mechaniki kwantowej fakt ,że elektrony są wspólne dla obu atomów uwzględnia się wprowadzając
całkowity hamiltonian pojedynczego elektronu jako sumę energii kinetycznej oraz energii potencjalnej
pochodzącej od oddziaływania z atomami A i B . Hamiltonian taki ma następującą postać:
8
H =
− η2 ∇ 2
+ U (RA ) + U (R B )
2m
(I.24)
Obecnie nowe stany dozwolone układu dwu atomów będą opisywane przez funkcje falowe w postaci
kombinacji liniowych ( sumy lub różnicy funkcji falowych pojedynczych atomów
φ+ = ϕ A + ϕ B
φ− = ϕ A − ϕ B
(I.20)
Powyższe założenia implikują następujące równania Shrödingera
Hφ + = E +φ +
(I.21)
Hφ − = E −φ −
definiujące energie stanów (I.20) . Wartości liczbowe energii E + i E − można obliczyć korzystając z równań
(I.17) i (I.21). Otrzymuje się następujące równania:
*
*
*
∫ dRϕ A Hφ + = E + (1 + ∫ dRϕ Aϕ B ) = E A + ∫ dRϕ AU Bϕ B
*
*
*
∫ dRϕ B Hφ − = E − (−1 + ∫ dRϕ Bϕ A ) = − E B + ∫ dRϕ BU Aϕ A
(I.22)
Następnie po elementarnych przekształceniach otrzymuje się
E+ =
E A + ∫ dRϕ *AU Bϕ B
1 + ∫ dRϕ *Aϕ B
(I.23)
E − ∫ dRϕ B* U Aϕ A
E− = B
1 − ∫ dRϕ B* ϕ A
Widać, że choć energie E A i E B są sobie równe to na ogół energie E + i E − różnią się miedzy sobą . O ile
choć jedna z nich jest mniejsza niż E A lub E B atomy będą łączyć się w cząsteczki. Stan o niższej energii
nazywa się stanem wiążącym a stan o wyższej energii stanem antywiążącym. Odpowiednie funkcje falowe
noszą nazwę orbitalu więżącego i antywiążącego.
Stała sieci, energia spójności.
Porównując wzór (I.7) i (I.15) można otrzymać uogólnione wyrażenie na energię potencjalną
atomów ( jonów) w sieci krystalicznej
U ( R ) = Z [λ ⋅ e
−
R
ρ
σ
− b( ) n ]
R
(I.24)
gdzie wartość wykładnika potęgi zależy od rodzaju wiązania i wynosi 6 dla wiązania van der
Waalsa oraz 1 dla wiązania jonowego. W ogólności liczba ta może być dowolna i często jest
9
parametrem dopasowania teorii do eksperymentu. Stałe b i σ dla wiązania jonowego to
odpowiednio q2 i α.
Funkcja dana wzorem (I.24) ma minimum w punkcie R0 , który odpowiada rzeczywistej
energia potencjalna
odległości pomiędzy jonami.
U
Rysunek I-2 Krzywymi
przerywanymi potencjały
U+ i U-, krzywą ciągłą
przedstawiono potencjał
wypadkowy
(+)
U
U(-)
R0
R
Na rysunku (I-2) przedstawiono zależność energii potencjalnej od wzajemnej odległości
pomiędzy jonami.
Aby obliczy R0 należy wykorzystać warunek na minimum funkcji
dU ( R)
=0
dR
(I.25)
z warunku tego otrzymuje się
λ ⋅e
−
R0
ρ
=
nbρ σ n +1
( )
σ R0
(I.26)
Stąd wartość energii w minimum potencjału wynosi
U ( R0 ) = Zb(
σ
R0
)n[
nρ
− 1]
R0
(I.27)
10
Wracając do wcześniej zdefiniowanych wielkości opisujących wiązanie jonowe i van der Waalsa otrzymamy
odpowiednio
U ( R0 ) = Z (
q 2α
ρ
) [ − 1]
R0
R0
(I.28)
dla wiązania jonowego i
U ( R0 ) = 4εB(
σ
R0
)6[
6ρ
− 1]
R0
(I.29)
dla wiązania van der Waalsa – Londona.
Wartość stałej charakteryzującej potencjał odpychający , ρ, nie zależy od tego jaki jest typ wiązania i
wynosi ok 0.1 wartości R0 . Stąd i ze wzorów (I.25) i (I.26) wynika , że energia spójności wiązania jonowego
jest znacznie większa niż wiązania van der Waalsa. Następnym czynnikiem decydującym o tym , że wiązanie
van der Waalsa jest słabsze jest wartości stałych opisujących potencjały , ε , B i σ oraz Z q2 i α. W
rzeczywistości energia przypadająca na parę jonów w krysztale jonowym wynosi około 5eV podczas gdy w
krysztale van der Waalsa tylko ok około 0.1 eV. Konsekwencją małej energii spójności w kryształach van der
Waalsa jest ich niska temperatura topnienia. Kryształy gazów szlachetnych istnieją tylko w bardzo niskich
temperaturach , nie wyższych niż kilkadziesiąt kelwinów. Kryształy jonowe, w których energia spójności jest o
dwa rzędy większa mają bardzo wysokie temperatury topnienia ( rzędu 1000K).
Wykład II. Sieć krystaliczna.
Podstawowe definicje
Wiele z pośród ciał stałych ma budowę krystaliczną . To znaczy , że atomy z których się składają ułożone są w
określonym porządku. Porządek ten daje się stosunkowo prosto opisać przez podanie własności symetrii.
Symetrię kryształu definiuje się poprzez podanie operacji symetrii przekształcających kryształ sam w siebie.
Przekształceniami symetrii są translacje, obroty , inwersja , obroty inwersyjne i płaszczyzny odbicia.
Podstawową cechą kryształu jest jego niezmienniczość ze względu na przekształcenie translacji.
Dla danej sieci krystalicznej definiujemy 3 podstawowe ( prymitywne) wektory translacji a, b i c. Kryształ nie
zmienia się ( wygląda tak samo) jeśli przesuniemy go ( lub przesuniemy układ współrzędnych) o dowolny
wektor będący kombinacją liniowa wektorów translacji a, b i c. Tak więc w krysztale nic nie ulega zmianie
niezależnie od tego czy znajdujemy się w położeniu r czy tez r’
r’=r+n a +m b +l c
(II.1)
11
gdzie n,m,l są dowolnymi liczbami całkowitymi. Wektor R= n a +m b +l c nazywamy wektorem translacji.
Mówimy, że kryształ jest niezmienniczy ze względu na translacje. Operację translacji Tnml możemy określić
jako przekształcenie działające na wektor r w przestrzeni rzeczywistej, w ten sposób, że
Tnml(r)=r’
(II.2)
Wzór (II.2) jest więc skrótowym zapisem wzoru (II.1).
Zbiór wszystkich punktów określonych przez liczby n,m,l określa się mianem sieci krystalicznej.
Każdy punkt z osobna określany jest jako węzeł sieci. W praktyce węzłami sieci mogą być pojedyncze atomy
lub grupy atomów.
Struktura związana z pojedynczym węzłem nosi nazwę bazy.
Przez pojęcie struktury krystalicznej
rozumie się siec wraz z bazą . Baza może składać się z jednego, lub więcej atomów i jest identyczna w każdym
węźle sieci w całym krysztale. Przykład sieci z bazą dwuatomowa znajduje się na rysunku II-1.
Niezmienniczość ze względu na translacje jest cechą, która wyróżnia ciała krystaliczne spośród innych ciał
stałych.
Wybór wektorów prymitywnych w danej sieci krystalicznej nie jest jednoznaczny. Dla danej sieci definiuje
się je jako taki zespół wektorów, przy pomocy których można otrzymać wszystkie węzły danej sieci . Łatwo
sobie uzmysłowić, że istnieje wiele ( na ogół nieskończenie wiele) sposobów wyboru wektorów podstawowych.
Patrz rys III-2.
Rys. II-1 a) sieć
przestrzenna b) baza
c) struktura
krystaliczna
12
Rys II-2. Przykład sieci dwuwy
miarowej. Wektory a1 b1, a2 b2 i a3
b3 są prostymi ( podstawowymi)
wektorami translacji . Wektory a4 b4
nie są podstawowymi wektorami
translacji ponieważ nie można przy
ich pomocy otrzymać translacji T
przedstawionej na rysunku.
Definiuje się pojęcie komórki prostej lub komórki elementarnej. Jest to równoległościan opisany przez
wektory translacji a, b, c. Objętość komórki elementarnej wyraża się wzorem.
Vc=|(axb)c|
(II.3)
Ze względu na niejednoznaczną definicję wektorów a, b, c, również komórka elementarna nie jest
zdefiniowana w sposób jednoznaczny. Można jednak określić komórkę elementarną posiadającą najmniejsza
objętość . Komórka ta nosi nazwę komórki Wignera –Seitza, a sposób jej wyboru przedstawiony jest na rys. II3.
Rys. II-3 Komórka Wignera Seitza.
Wybieramy dowolny węzeł sieci i
łączymy go odcinakami z najbliższymi
węzłami . Komórka Wignera- Seitza
jest to objętość wewnątrz płaszczyzn
normalnych wystawionych w punktach
środkowych odcinków łączących
poszczególne węzły sieci.
13
Oprócz translacji elementami symetrii, czyli przekształceniemi, które nie zmieniają kryształu są obroty wokół
osi symetrii, odbicia względem płaszczyzn, środek inwersji i obroty inwersyjne. Symetria struktury
krystalicznej, a tym samym struktura sama w sobie, określona jest w sposób zupełny przez podanie wszystkich
przekształceń (elementów symetrii), po zastosowaniu których kryształ przechodzi sam w siebie. Definicje
operacji symetrii innych niż translacje są następujące:
1. Przekształcenie obrotu polega na obróceniu układu wokół wybranej osi o określony kąt ( na ogół przeciwnie
do ruchu wskazówek zegara) . W krysztale posiadającym symetrię translacyjną mogą istnieć obroty o kąty 2π,
2π/2, 2π/3, 2π/4 i 2π/6. Nie istnieje obrót o 2π/5.
2. Przekształcenie odbicia polega na odbiciu zwierciadlanym względem pewnej płaszczyzny, tak że po
wykonaniu operacji punkt znajdujący się w odległości r od płaszczyzny znajdzie się po jej przeciwnej stronie w
położeniu –r. Jeśli wybierzemy płaszczyznę x-y jako płaszczyznę odbicia to przekształcenie odbicia
zwierciadlanego nie zmieni współrzędnych x i y, a współrzędną z zamieni na –z.
3. Przekształcenie inwersji względem jakiegoś punktu polega na zamianie współrzędnych x,y i z na
odpowiednio –x,-y i –z
4. Obrót inwersyjny to zastosowanie kolejno operacji obrotu i operacji inwersji.
Zbiór elementów symetrii danego układu jest grupą.
Definicja grupy:
Grupą nazywamy zbiór elementów (A, B, ........ ) z określonym działaniem (*) taki, że
-Jeśli A i B należą do grupy to element A*B = C należy do grupy
-W każdej grupie istnieje element jednostkowy, E , taki, ze A*E= E*A=A
-Dla każdego elementu A istnieje element przeciwny ( odwrotny ) A-1 , taki że A*A-1=A-1*A=E
-Działanie jest łączne , to znaczy , że (A*B)*C=A*(B*C)
Cechą wspólna operacji symetrii (1-4) jest to, że wszystkie one pozostawiają niezmieniony co najmniej
jeden punkt przestrzeni. ( zazwyczaj w punkcie tym umieszcza się początek układu współrzędnych). Ta cecha
powoduje, że grupy takie nazywa się grupami punktowymi. Łatwo wykazać, że przekształcenia translacji
również tworzą grupę. Nie jest to jednak grupa punktowa. W odniesieniu do kryształów mamy więc do
czynienia z grupami punktowymi (złożonymi z operacji symetrii bez operacji translacji) oraz grupami
przestrzennymi, których elementami mogą być zarówno przekształcenia (1-4) jak i translacje
Teoria grup pozwala w sposób jednoznaczny klasyfikować rodzaje sieci krystalicznej . Mamy 32 różne
punktowe grupy krystalograficzne, jeśli do tych przekształceń dołączy się translacje to otrzymany 230
różnych grup przestrzennych. Jeśli rozważa się sieć krystaliczną ( bez bazy) mamy 14 różnych sieci
Bravais’a . Sieci Bravis’a przedstawione są na rysunku.II-4 Parametry komórek elementarnych podane są w
tabeli
14
Tabela II-1 Parametry komórek elementarnych 14 sieci przestrzennych
15
Rysunek 1I-4
14 trójwymiarowych
sieci Bravais’a
16
Przykłady struktur krystalicznych :
Jeśli baza w danej sieci ma więcej niż jeden atom wówczas pojawia się konieczność jednoznacznego określenia
położenia poszczególnych atomów w komórce elementarnej. W tym celu wybieramy układ współrzędnych tak,
że jego osie są równoległe do wektorów translacji prymitywnych a, b i c. Położenia poszczególnych atomów
będą określone przez podanie ich współrzędnych . Będą to zawsze liczby mniejsze od 1.
Przykłady
:Rys II-5
Struktura NaCl – to siec regularna
płasko –centrowana . Jon Na+ jest w
położeniu 0 0 0 , jon Cl- jest w
położeniu
1
00
2
Rys II-6
Struktura CsCl – sieć regularna
przestrzennie centrowana . Jon
Cs+ jest w położeniu 0 0 0 ,
a
jon Cl- jest w położeniu
111
. ( Kittel rys 1.26)
222
Rys. II-7 Struktura
heksagonalna o
największym
upakowaniu
(wurcyt) dwa jony
jeden w położeniu
000 drugi w
211
położeniu
332
17
Rys II –7 Struktura diamentu ( regularna
powierzchniowo centrowana , ale inna niż NaCl)
Atomy węgla mają położenia 000,
0
111
;
444
11 1 1 11
; 0 ;
0
22 2 2 22
a
Płaszczyzny sieciowe, wskaźniki Millera
W krystalografii, niezależnie od rodzaju sieci, bardzo ważnym pojęciem jest pojęcie płaszczyzny
sieciowej.
Płaszczyzną sieciową nazywamy każdą płaszczyznę w krysztale , na której leżą co najmniej 3 węzły sieci nie
leżące na jednej prostej. Praktycznie na tak zdefiniowanej płaszczyźnie, w nieskończonym krysztale , leży
zawsze nieskończona ilość węzłów sieci. Płaszczyznę definiujemy przez podanie parametrów odpowiedniego
równania płaszczyzny. Z elementarnej geometrii otrzymujemy następującą relację określającą położenia
punktów na płaszczyźnie.
1
x
y
z
=
+
+
f
f1 f 2 f 3
(II-4)
gdzie x, y, z są współrzędnymi a f1, f2 i f3 odpowiednimi współczynnikami. W przypadku kryształu odpowiednie
równanie musi zawierać warunek dotyczący węzłów sieci. Aby to osiągnąć wystarczy wybrać tak układ
współrzędnych aby jego osie pokrywały się z kierunkami wektorów translacji prymitywnych a, b i c oraz
założyć ,że f =1 oraz f1, f2, f3 są liczbami całkowitymi. Jeżeli równanie (II-4) pomnożymy przez najmniejszą
wspólną wielokrotność liczb f1, f2, f3 M otrzymamy:
M = hx + ky + lx
(II-5)
18
we wzorze (II-5) liczby h, k, i, l są liczbami naturalnymi. Zauważamy, że tak wybrana płaszczyzna przecina osie
w punktach x= f1a, y= f2,b, z= f3 c
( patrz rysunek II-8)
Rys II-8 Płaszczyzna
sieciowa
2 3 3, Najmniejsza wspólna
wielokrotność liczb 2 2 i 3
jest 6
Liczby h, k, l noszą nazwę wskaźników Millera i mogą przybierać liczby całkowite oraz zero ( zero pojawia
się w sytuacji gdy dana płaszczyzna jest równoległa do odpowiedniej osi współrzędnych ( wektora
prymitywnego). Wszystkie płaszczyzny równoległe do danej płaszczyzny są sobie równoważne. Często zapisuje
się równanie płaszczyzny w postaci :
1 = hx + ky + lz
( II-6)
Jest to równanie płaszczyzny najbliższej płaszczyźnie przechodzącej przez początek układu współrzędnych.
Wskaźniki Millera określają rodzinę płaszczyzn równoważnych względem siebie. Skrótowy zapis
wygląda następująco ( h k l). Łatwo zauważyć , że ponieważ odpowiednie płaszczyzny są równoległe
wskaźniki Millera ( 1 2 2) i (2 4 4) są sobie równoważne. W takiej sytuacji zawsze podajemy tylko zespół
wskaźników o mniejszych wartościach, w tym przypadku (1 2 2) .
Sieć odwrotna
W krystalografii wprowadza się pojęcie sieci odwrotnej. Siec odwrotna, a właściwie jej symetria
wpływa na wiele własności kryształów, takich jak struktura pasm energetycznych, dyfrakcja promieniowania
rentgenowskiego, rodzaje drgań sieci itp. Problem z siecią odwrotną polega na tym, że nie jest ona określona w
przestrzeni rzeczywistej, to znaczy w przestrzeni, w której możemy zobaczyć kryształ. Nie można więc wiązać
z siecią odwrotna, żadnych obiektów materialnych w takich jak atomy. Po za tym ma ona jednak wszystkie
inne cechy sieci krystalicznej, tzn możemy wyróżnić w niej węzły sieci ( pewne określone punkty) i
analizować jej symetrię identycznie jak to się robi w przypadku zwykłej sieci ( sieci prostej).
Sieć odwrotna określona jest w przestrzeni pędów, ściślej mówiąc w przestrzeni wektorów falowych k.
Ponieważ zgodnie z zasadami mechaniki kwantowej pęd wiąże się z wektorem falowym przy pomocy relacji
p=ħk
(II-7)
19
obie te przestrzenie, przestrzeń pędów i przestrzeń wektora falowego, są sobie całkowicie równoważne.
Z każdą funkcją określoną w przestrzeni rzeczywistej, o ile tylko jest zbieżna gdy r dąży do
nieskończoności, związana jest jednoznacznie odpowiednia funkcja określona w przestrzeni wektora falowego.
Relacja pomiędzy tymi funkcjami nazywana jest transformacją Fouriera.
Definicja : Transformata Fouriera funkcji f(r) , funkcja g(k) jest dana przez relację:
g(k)=
1
exp[-i kr] f(r)dr
(2π ) 3 / 2 ∫
(II-8)
Istnieje oczywiście transformacja odwrotna, tak, że
f(r) =
1
exp[i kr] g(k) dk
(2π ) 3 / 2 ∫
(II-9)
Jeśli f(r ) jest funkcją periodyczną z okresem sieci krystalicznej prostej, tzn niezmienniczą względem
odpowiednich operacji symetrii nie zmieniających danej sieci, to g(k) dana wzorem (II-8) jest odpowiadającą
jej funkcja określoną w przestrzeni pędów ( przestrzeni wektora falowego) , niezmienniczą względem operacji
symetrii odpowiedniej sieci odwrotnej.
W szczególności jeśli w przestrzeni rzeczywistej sieć krystaliczna jest niezmiennicza za względu na
przekształcenia translacji określone przez wektory translacji prymitywnych a1.a2 , a3 :
R= n a1 + ma2 + p a3
(II-10)
To odpowiadająca jej sieć odwrotna jest niezmiennicza ze względu na przekształcenia translacji o wektor G
zdefiniowany następująco
G= hg1 + kg2 + lg3
(II-11)
gdzie g1 g2 g3 są wektorami prymitywnymi sieci odwrotnej. Wektory prymitywne sieci odwrotnej i sieci
prostej powiązane są następującymi relacjami:
g1 =
2π
(a2×a3)
V
(II-12)
g2 =
2π
(a3×a1)
V
(II-13)
g3 =
2π
(a2×a1)
V
(II-14)
V =a1.(a2×a3) jest objętością komórki elementarnej sieci prostej. Wektory g1 g2 g3 , mają to samo znaczenie w
sieci odwrotnej jakie miały wektory a1.a2 a3 w sieci prostej. h, k, l są liczbami całkowitymi. Współczynniki te
20
nie przypadkowo zostały nazwane tymi samymi literami co wskaźniki Millera. Łatwo bowiem udowodnić, że
wektor G zdefiniowany równaniem (II-11) jest prostopadły do płaszczyzny sieci prostej określonej właśnie
przez wskaźniki Millera h, k, l. Wobec powyższego każdemu wektorowi translacji w sieci odwrotnej
odpowiada określona płaszczyzna w sieci prostej.
Jeśli chodzi o klasyfikację sieci odwrotnych to ze względu na odwracalność transformaty Fouriera
musi być ona taka sama jak w przypadku sieci prostej. Mamy wiec tu również 14 sieci Bravais’a , 32 grupy
punktowe i 230 grup przestrzennych.
Podobnie jak w sieci prostej , w sieci odwrotnej definiuje się komórkę elementarną. Warto w tym
miejscu zwrócić uwagę , że komórkę elementarną sieci odwrotnej mającą najmniejszą możliwą objętość
nazywamy pierwszą strefą Brillouina. Metoda konstruowania pierwszej strefy Brillouina w sieci odwrotnej
jest identyczna z konstrukcją komórki Wignera -Seitza w sieci prostej.
Wykład III. Dyfrakcja promieni Rentgena
Oddziaływanie fali elektromagnetycznej z kryształem zależy od długości fali. Odległości pomiędzy
atomami w sieci krystalicznej wynoszą ok. 2- 3 Ǻ. Tego samego rzędu są też odległości pomiędzy
płaszczyznami sieciowymi. Jest to znacznie mniej niż wynosi długość fali światła widzialnego 4000-8000 Ǻ.
Powoduje to, że oddziaływanie światła z kryształem nie powinno zależeć bezpośrednio od struktury
krystalicznej. Mówiąc inaczej, ponieważ długość fali światła jest dużo większa niż odległości międzyatomowe
większość efektów, które obserwujemy przy przejściu światła przez kryształ nie jest związana bezpośrednio z
jego strukturą (np załamanie światła czy odbicie w ośrodkach izotropowych), zaś wielkości fizyczne, które
opisują taki proces są wielkościami makroskopowymi.
Inaczej jest gdy mamy do czynienia z bardzo krótkimi falami elektromagnetycznymi. Wówczas
periodyczność kryształu powoduje, że w stosunku do fali elektromagnetycznej o długości krótszej niż odległości
pomiędzy płaszczyznami sieciowymi, działa on podobnie jak siatka dyfrakcyjna dla światła widzialnego. Gdy
oświetlimy kryształ promieniami Rentgena, których długość fali jest ok 0.1 do 1 Ǻ, promienie te będą
interferować pomiędzy sobą tworząc po przejściu przez kryształ obraz dyfrakcyjny. Zjawisko to zostało
szeroko wykorzystane w krystalografii do określania własności geometrycznych sieci krystalicznych.
Rozważmy strukturę regularną prymitywną, gdzie w jednym węźle sieci znajduje się jeden atom.
Padająca na kryształ wiązka promieni Rentgena będzie zachowywać się zgodnie z zasadą Huygensa, czyli
każdy węzeł sieci będzie źródłem nowej fali kulistej. Periodyczność sieci podobnie jak periodyczność siatki
dyfrakcyjnej powoduje, że rozproszona fala elektromagnetyczna w pewnych kierunkach ulegnie wzmocnieniu
wygaszeniu a w pewnych osłabieniu . Kierunek, w którym wiązka odbita zostanie wzmocniona określony jest
przez prawo Bragga. Sytuacja przedstawiona jest na rysunku III-1.
21
a
b
k
k’
k’
α
∆k=k-k’
d
k
d sin(α)
Rys. III-1
d sin(α)
Promienie Rentgena padające na kryształ pod kątem α ulegają odbiciu od poszczególnych płaszczyzn
sieciowych odległych od siebie o d. Jeśli różnica dróg optycznych będzie równa całkowitej wielokrotności
długości fali nastąpi wzmocnienie. Warunek ten można opisać wzorem, który nosi nazwę prawa Bargga:
2d sin α = nλ
(III-1)
d jest odległością pomiędzy płaszczyznami a λ długością fali.
Rys III-2 Różne
płaszczyzny sieciowe
22
Ze względów historycznych kąt ugięcia nie jest liczony względem normalnej a względem powierzchni
płaszczyzny sieciowej. Ponieważ w krysztale istnieje wiele płaszczyzn sieciowych rozpraszających
promieniowanie elektromagnetyczne wiązka padająca uginać się będzie pod różnymi kątami. Każdej wiązce
ugiętej odpowiadać będzie inna rodzina płaszczyzn. Ponieważ poszczególne wiązki są jednoznacznie
przyporządkowane płaszczyznom sieciowym można je identyfikować przy pomocy wskaźników Millera.
Prawo Bragga można przedstawić również w innej postaci. Rysunek III-1 b w sposób graficzny
przedstawia prawo zachowania pędu przy zjawisku odbicia promieniowania rentgenowskiego od kryształu.
Korzystając z faktu, że wektor falowy, k, jest związany z długością fali λ następującą relacją
k=
2π
(III-2)
λ
oraz z relacji (III-1) zauważamy :
∆k=|k-k’| = 2 k sinα =
2 ⋅ 2π
sinα
λ
(III-3)
Wobec powyższego musi być spełniony warunek
∆k =
2π
d
(III-4)
2π/d jest długością wektora sieci odwrotnej, G. Relacje (III-3) i (III-4) prowadzą bezpośrednio do
następującego równania:
k-k’=G
(III-5)
gdzie G jest wektorem sieci odwrotnej , prostopadłym do rodziny płaszczyzn od której odbija się wiązka
promieni Rentgena. Równanie (III-5) jest całkowicie równoważne równaniu (III-1).
Warunek Bragga wyrażony przy pomocy relacji (III-1) lub (III-5) pozwala wyłącznie na jakościową
analizę dyfrakcji promieni Rentgena na kryształach, czyli dla danej struktury pozwala na określenie możliwych
kątów ugięcia. W krystalografii do określania struktury krystalicznej ważne jest także przewidywanie natężeń
poszczególnych wiązek. W celu analizy natężenia wiązki odbitej rozważmy rysunek. (III-3).
Rysunek III-3
•
•
•
•
•
• k’
•
•
•
•
•
•
•
•
•
•
•
• ρ
•
•
•
•
• ϕ
•
•
•
•
•
r
•
R
•
k
23
Na rysunku każdy punkt odpowiada węzłowi sieci krystalicznej. Linie przerywane to czoło fali
promieniowania rentgenowskiego. Zgodnie z zasadą Huygensa każdy węzeł sieci staje się źródłem nowej fali
kulistej . Zgodnie z zasadami elektrodynamiki klasycznej amplituda promieniowania rozproszonego na węźle ρ,
mierzona w odległości r od węzła jest równa:
F(ρ)= F0 exp(-ikρ)
exp(−ik ' r )
r
(III-6)
W eksponencie, w mianowniku iloczyn skalarny k’r= k’r ponieważ fala ugięta jest fala kulistą. F0 jest amplitudą
fali padającej. Elementarne przekształcenia geometryczne ( patrz rysunek III-3) pozwalają na użycie
przybliżenia:
r = |R-ρ| = R 2 + ρ 2 − 2 Rρ cos ϕ ≈ R − ρ cos ϕ
(III-7)
Podstawiając (III-7) do (III-6)
F(ρ)=F0
exp(-ikR)
exp{-i [kρ-kρ cosϕ]}
R
(III-8)
Uwzględniając, że dla małych kryształów, gdy punkt obserwacji znajduje się daleko od kryształu, każdy wektor
r jest w przybliżeniu równoległy do R, definiuje się wektor k’, który jest wektorem falowym fali rozproszonej
(patrz rys III-3) taki że |k’|=k oraz
k ρ cosϕ = k’ρ
(III-9)
i
F (ρ)=F0
exp(-ikR)
exp(-ikR)
exp{-i ρ[∆k]}
exp{-i ρ[k-k’]} = F0
R
R
(III-10)
Tak jest w przypadku sieci z bazą jednoatomową. Jeśli baza składa się z więcej niż jednego atomu musimy brać
pod uwagę sumę amplitud od wszystkich atomów w komórce elementarnej. Odpowiednia sumaryczna
amplituda w położeniu R, fal wyemitowanych w komórce, w położeniu ρ, będzie równa;
F (ρ)= F0
= F0
exp(-ikR)
R
∑f
j
exp{-i [ρ+rj]∆k}
j
exp(-ikR)
exp{-i ρ[∆k]}
R
∑f
j
exp{-i rj∆k}
(III-11)
j
gdzie rj jest położeniem j-tego atomu w komórce elementarnej. Ostatnia suma we wzorze (III-11) nosi nazwę
czynnika struktury.
Dla każdego odbitego promienia czynnik strukturalny można obliczyć następująco.
24
Załóżmy , że odbicie następuje od płaszczyzny oznaczonej wskaźnikami Millera hkl. Wówczas
∆k=Ghkl=hg1+kg2+lg3. Położenie j-tego atomu w komórce jest określone przez wektor rj=uj a1+ vja2 +wja3,
gzie u ,v, w są zerami lub liczbami ułamkowymi. Łatwo obliczyć, że
rj*Ghkl=2π(ujh+vjk+wjl)
(III-12)
Korzystając z relacji (III-12) otrzymuje się następujące wyrażenie na czynnik struktury
Λ hkl = ∑ f j exp{−i 2π (u j h + v j k + w j l)}
(III-13)
j
We wzorach (III-11) i (III-13) fj jest czynnikiem atomowym, który zależy od zdolności rozpraszania
promieni rentgena przez dany atom. Zakładając, że to elektrony są odpowiedzialne za rozpraszanie promieni
rentgena jest on równy ilości elektronów w atomie. Istotna jest również gęstość atomów w danej płaszczyźnie
sieciowej. Czynnik atomowy powinien być proporcjonalny do tej wielkości.
Aby otrzymać całkowitą amplitudę w punkcie R należy posumować amplitudy (III-10) po wszystkich
komórkach elementarnych. Ponieważ czynnik struktury jest identyczny dla każdej komórki elementarnej
możemy wyłączyć go z sumowania. To samo dotyczy stałego czynnika zależnego od R.
Korzystając z faktu, że ρ jest wektorem translacji sieci prostej
ρ = na1+ma2 +pa3
(III-14)
sumowanie po komórkach elementarnych zastępujemy sumowaniem po n,m, p
F=
∑ρ F (ρ) =
exp(-ikR)
{ ∑ exp [-in(a1∆k)]} { ∑ exp [-im(a2∆k)]} { ∑ exp [-ip(a3∆k)]} (IIIR
n
m
p
15)
Dla skończonych kryształów zawierających np. M komórek elementarnych , każda z powyższych sum jest
równa
M
∑ exp [-in(a1∆k)]=
m =1
1 − exp[−iM (a1 ∆k )]
1 − exp[−i (a1 ∆k )]
(III-16)
Do tej pory obliczyliśmy wypadkowe amplitudy promieniowania rentgenowskiego rozproszonego na krysztale .
Pamiętać jednak należy, że to co na prawdę możemy zarejestrować to natężenie promieniowania, I.
Zgodnie z klasyczną definicją
I = F * ⋅F
(III-17)
gdzie F* jest amplitudą sprzężoną do F. Korzystając z równości
25
1
sin 2 [ M (a1∆k)]
1 − exp[−iM (a1 ∆k )] 1 − exp[iM (a1 ∆k )]
2
=
1
1 − exp[−i (a1 ∆k )] 1 − exp[i (a1 ∆k )]
sin 2 ( a1∆k)
2
(III-18)
otrzymamy następujące wyrażenie na natężenie promienia odbitego od danej płaszczyzny
Λ2
I (∆k ) = hkl2 ⋅
R
1
1
1
sin 2 [ M (a1∆k )] sin 2 [ M (a 2 ∆k )] sin 2 [ M (a3∆k )]
2
2
2
⋅
⋅
.
2 1
2 1
2 1
sin ( a3∆k )
sin ( a 2 ∆k )
sin ( a1∆k )
2
2
2
(III-19)
gdzie Λhkl jest czynnikiem struktury. Łatwo zauważyć, że poprzednie założenie że ∆k jest równe wektorowi
sieci odwrotnej, ∆k=Ghkl , pociągając za sobą :
aj Ghkl = n2π
(III-20)
8k
2 .
dla j=1,2,3 daje maksimum funkcji (III-19). Wykres (III-4) przedstawia funkcję
k
sin 2
2
sin 2
Łatwo zaważyć ,że główne maxima pojawiają się gdy wektor falowy jest wielokrotnością liczby π. Wielkość
bocznych maksimów zmniejsza się bardzo gdy mamy do czynienia z większą liczbą węzłów. W praktyce są one
niewidoczne dla M większych od 100. W warunkach normalnych mamy do czynienia z kryształami
składającymi się z 1020 atomów.
26
Rys III-4. Obraz dyfrakcyjny
otrzymany dla sieci
składającej się z 8 węzłów
Przykłady dyfrakcji.
Promieniowanie rentgenowskie jest promieniowaniem elektromagnetycznym o długości fal od 0.1 do kilku Å.
Do wytwarzania promieni rentgena służą specjalne lampy elektronowe, w których rozpędzone w polu
elektrostatycznym elektrony uderzają w metalową antykatodę. Podczas tych zderzeń elektron traci energię w
skutek dwóch niezależnych procesów. Pierwszy z nich to hamowanie w polu elektrycznym atomów antykatody .
Drugi to wzbudzenie elektronów rdzeni atomowych atomów antykatody. Oba procesy powodują pojawienie
się wysokoenergetycznych fotonów . Pierwszy to rodzaj promieniowania Czerenkowa dający ciągłe widmo
promieniowania ( promieniowanie hamowania). W drugim procesie pobudzone atomy wracając do stanu
podstawowego wysyłają kwanty promieniowania rentgenowskiego. Widmowy rozkład tych fotonów ma
charakter dyskretny i zależy od materiału antykatody. Promieniowanie to nosi nazwę promieniowania
charakterystycznego. Różne metody wykorzystują różne zakresy widma promieniowania rentgenowskiego.
1. Metoda Lauego
Wiązka promieniowania ciągłego pada na monokryształ. Ponieważ wiązka zawiera różne długości fal
otrzymamy wiele wiązek odbitych. Można założyć, że każda płaszczyzna znajdzie odpowiadającą jej długość
fali, która ulegnie wzmocnieniu dla danego kąta padania. Rysunek III. 5 a i III-5 b
27
Rys III.5
a
Każdemu odbiciu odpowiada
widmo ciągłe
inna długość fali
b
●
●
●
●
●
●
widmo ciągłe
●●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
(210)
●●
λ120
(120)
(110)
λ110
W ten sposób refleksy otrzymane na ekranie będą odpowiadały wszystkim płaszczyznom sieciowym.
Przykładowy obraz dyfrakcji Lauego przedstawiony jest na rysunku. III-6
Rysunek III-6. Lauerogram kryształu krzemu.
Obraz jest w przybliżeniu niezmieniony przy
obrocie o kąt 2π/4. Wynika to z istnieniem osi
obrotu o kąt 2π/4 kryształu krzemu.( oś [100]) .
Uwaga : osie krystalograficzne oznaczmy wskaźnikami Millera w nawiasach kwadratowych
28
λ210
2. Metoda obracanego kryształu
W metodzie Lauego uzyskiwaliśmy odbicia od więcej niż jednej płaszczyzny krystalograficznej ponieważ
oświetlaliśmy kryształu wiązką o widmie ciągłym. W metodzie obracanego kryształu oświetlamy kryształ
wiązką monochromatyczną. W układzie takim odbicie otrzymuje się tylko od określonej płaszczyzny ( h k l )
dla której spełniony jest warunek Bragga,
2d hkl sin α hkl = λ .
(III-21)
Dlatego też, aby otrzymać więcej odbić, oświetlana próbka wprawiana jest w ruch obrotowy wokół osi
prostopadłej do wiązki. W ten sposób zmieniając kąt nachylenia płaszczyzny α możemy dla tej samej długości
fali spełnić warunek (III-21) dla kilku różnych płaszczyzn i otrzymać kilka wiązek odbitych pod różnymi
kontami. Aparatura do badania kryształów metodą obracanego kryształu przedstawiona jest na rysunku
III -7.
Rys III-7 komora do dyfrakcji metodą obracanego kryształu
W metodzie tej podobnie jak w metodzie Lauego każdej płaszczyźnie odpowiada refleks punktowy.
3. Metoda proszkowa.
Bardziej uniwersalna jest metoda proszkowa. I w tym przypadku używamy wiązki monochromatycznej .
Zamiast monokryształu stosuje się jednak proszek krystaliczny, który umieszcza się w rurce kapilarnej. Ziarna
proszku ustawione są zupełnie przypadkowo. Padająca wiązka odbija się tylko od tych ziaren , których
płaszczyzny sieciowe ustawione osą pod odpowiednim kątem. Ze względu na całkowicie przypadkowe
ustawienie kryształów w proszku ( w odróżnieniu od metody obracanego kryształu układ nie ma symetrii
29
osiowej, związanej z kryształem ) wiązki odbite mają kształt stożków. Dla sieci regularnej kąty tych stożków
zależą od stałej sieci a, wartości wskaźników Millera hkl oraz długości fali, λ, w następujący sposób
sin Θ =
λ h2 + k 2 + l 2
(III-22
2a
Komora do badania kryształów metodą proszkową przedstawiona jest na rysunku III –8
Rys. III-8 a) Komora proszkowa.,
b) rysunek schematyczny
30
We wszystkich wyżej wspomnianych przypadkach detekcja promieniowania odbitego może odbywać się
poprzez zaczernienie kliszy fotograficznej. Bardziej nowoczesna metoda polega na bezpośredniej detekcji
promieniowania rentgenowskiego. Ze względu na dużą przenikliwość promieniowania rentgenowskiego , jego
bezpośrednia detekcja nie jest wcale sprawą prostą Na ogół używa się do tego celu specjalnych detektorów,
działających w oparciu o zjawisko scyntylacji. Przykład detektor przedstawiony jest na rysunku III-9
Rysunek III-9 Układ detektora promieniowania rentgenowskiego
Promieniowanie
scyntyl
ator
rentgenowskie
fotopowielac
z
Promieniowanie rentgena pochłaniane jest przez kryształ- scyntylator, który z kolei pod wpływem takiego
wzbudzenia emituje kwanty światła widzialnego ( proces ten nazywamy scyntylacją). Kwanty światła
rejestrowane są przez fotopowielacz lub inne urządzenie np. fotodiodę.
Inne metody analizy struktury krystalograficznej
Jak przedstawiono powyżej do badań struktury krystalograficznej można użyć promieniowania
elektromagnetycznego ( promieniowania rentgena). W ostatnich dziesięcioleciach rozwinęły się również inne
metody badań oparte na dyfrakcji elektronów , neutronów i lekkich atomów. Zjawisko dyfrakcji cząstek
materialnych na kryształach związane jest z falowa naturą materii. Zgodnie z zasadą pierwszej kwantyzacji
każdej cząstce przyporządkowuje się falę o długości:
λ =η
2π
p
(III.23)
gdzie p jest pędem cząstki a η stałą Plancka podzieloną przez 2
π.
Odpowiada to funkcji falowej cząstki
swobodnej będącej falą płaską daną wzorem:
φ = e ikr
(III.24)
gdzie wektor falowy k związany jest z pędem cząstki następującą relacją: p = ηk . Podobnie jak w przypadku
dyfrakcji promieni rentgena, aby zaszła dyfrakcja elektronów, neutronów lub atomów, fala materii musi spełniać
warunek Bragga (III.1) lub (III.5). Stosowane metody eksperymentalne są bardzo podobne lub analogiczne do
metod używanych w dyfrakcji promieni rentgena. Zależność długości fali od energii dla poszczególnych
cząstek przedstawia rysunek III.9
31
Rys III.9 Długość fali
deBroglie’a fotonów ,
elektronów , neutronów i
atomów helu w funkcji
energii. Strzałka wskazuje
energię termiczną cząstek
energia (keV)
1.
Dyfrakcja elektronów
. Technika doświadczalna dyfrakcji elektronów nosi skrótową nazwę LEED, od angielskiego terminu Low
Energy Electron Difraction. Do badania struktury krystalicznej używa się wiązki elektronów o energii od 10 do
1000 eV. Wiązka elektronów jest bardzo silnie rozpraszana przez ciało stałe, stąd głębokość penetracji nie
przekracza kilku lub kilkunastu stałych sieci. Ogranicza to stosowanie metody LEED tylko do badania wiązki
odbitej, zaś informacje uzyskane dotyczą tylko struktury warstwy powierzchniowej materiału. Duża trudność
doświadczalną stanowi konieczność uzyskania ultra wysokiej próżni, rzędu 10-9 Tr , niezbędnej do zachowania
odpowiednio długiej drogi swobodnej elektronów w całym układzie pomiarowym. Schemat układu
doświadczalnego przedstawiony jest na rysunku (III.10). Uzyskiwane obrazy dyfrakcyjne są bardzo podobne do
tych otrzymanych w metodzie Lauego.
Rys.III 10 Schemat
układu do badania
dyfrakcji elektronów o
niskiej energii (LEED).
32
2.
Wiązki neutronów
Skonstruowanie reaktorów jądrowych wytwarzających wiązki neutronów o dużym natężeniu pozwoliło na
ich wykorzystanie do badań struktury krystalicznej. Większość wytwarzanych w reaktorach neutronów to
tzw. neutrony termiczne, o energii kinetycznej odpowiadającej temperaturze T=400K Odpowiadająca im
długość fali wynosi kilka Å ( patrz rysunek III.9). Precyzyjne wyselekcjonowanie neutronów o dobrze
określonej energii odbywa się za pomocą monochromatora krystalicznego, którego działanie tak jest
analogiczne do działania siatki dyfrakcyjnej wobec promieniowania widzialnego. Otrzymane w ten sposób
monochromatyczne neutrony wykorzystuje się w neutronowej metodzie Debey’a -Sherrera lub w metodzie
obracanego kryształu. Wiązkę neutronów stosuje się przede wszystkim do badania uporządkowania
magnetycznego, badania przejść fazowych ( porządek- nieporządek) oraz położeń atomów wodoru w
ciałach stałych, cząsteczkach i układach biologicznych.
3.
Wiązki atomów.
Prowadzono również badania dyfrakcji atomów helu i cząsteczek wodoru na kryształach. Obiekty takie
praktycznie nie wchodzą do wnętrza materiału, dlatego też obrazy dyfrakcyjne otrzymywane metodą
wiązek atomowych odwzorowują strukturę powierzchni nie związaną z położeniami poszczególnych
atomów tylko z mniej lub bardziej regularnymi uskokami o wysokości jednej warstwy atomowej.
33
Wykład IV. Drgania sieci krystalicznej.
Drgania kryształu możemy rozważać z dwóch punktów widzenia. Pierwszy to makroskopowy, gdy długość fali
jest znacznie większa niż stała sieci. Wówczas struktura kryształu nie jest istotna a drganie opisywane jest
przez własności makroskopowe takie jak moduł sprężystości postaciowej i gęstość materiału. Drugi to
mikroskopowy, gdy długość fali związana z drganiami jest porównywalna ze stałą sieci. W drugim przypadku,
charakterystyka drgań zależy od struktury krystalicznej.
Każde ciało, o ile ma określone własności sprężyste może być wprowadzone w drgania mechaniczne. Często
towarzyszy temu emisja fal dźwiękowych. Już dawno zauważono , że ciała o określonej symetrii kształtu mogą
drgać tylko z określonymi częstościami ( częstościami rezonansowymi).
Podobnie jest w krysztale. Każde początkowo niezależne od siebie drganie pojedynczych atomów albo zostanie
szybko wytłumione albo zamieni się na kolektywne drganie całej sieci krystalicznej. Takie kolektywne
drgania sieci krystalicznej nazywane są fononami. Zgodnie z zasadami mechaniki kwantowej fonony mogą
być interpretowane jako pojedyncze paczki falowe o pędzie p = ηk ( k jest wektorem falowym ) i energii
ηω ( ω jest częstością kołową drgań). W przypadku każdego rodzaju fal ważne jest określenie ich prędkości
fazowych i grupowych w danym ośrodku. Wielkości te łatwo obliczyć gdy znana jest zależność częstości
drgań, lub energii fononu od wektora falowego. W najprostrzym przypadku sinusoidalnej fali płaskiej
rozchodzącej się wciągłym izotropowym ośrodku, dla której wychylenie z połóżenia równowagi opisane jest
wzorem
A = A0 e i (ωt − kx )
(V-1)
prędkości fazowa i grupowa dane są odpowiednio wzorami
υf =
x ω
=
t k
(IV-2)
dω
dk
(IV-4)
i
υg =
Funkcje
υ f (k )
i υ g ( k ) opisujące te zależności w konkretnych przypadkach nazywamy krzywymi
dyspersji , lub po prostu dyspersją.
Drgania sieci jednoatomowych
Rozważmy mechaniczną falę płaską rozchodzącą się w sieci regularnej prostej w kierunku [100].
Faktycznie rozważania nasze słuszne będą dla wszystkich sieci regularnych, dla fal rozchodzących się w
kierunkach [111], 100] i [110]. Gdy wychylenia atomów są prostopadłe do kierunku rozchodzenia się fali
mamy do czynienia z falą poprzeczną, gdy zaś kierunek drgań atomów jest równoległy do kierunku
rozchodzenia się fali mamy falę podłużną. Oba przypadki przedstawione są na rysunku IV 1
34
a
b
Rys IV-1 a ) drgania podłużne , b) drgania poprzeczne linie odpowiadają płaszczyznom sieciowym, kropki to
węzły sieci.
Zauważamy, że dla fal płaskich wychylenia atomów należących do odpowiednich płaszczyzn sieciowych
są takie same. Możemy więc ponumerować płaszczyzny i niezależnie czy mamy do czynienia z falą poprzeczną
czy podłużną nazwać wychylenie atomów s-tej płaszczyzny z położenia równowagi symbolem us.
Dalej zakładamy, że siła działająca na daną płaszczyznę pochodzi od sprężystej reakcji pozostałych płaszczyzn,
jest więc proporcjonalna do różnicy odpowiednich wychyleń. Dla dwóch płaszczyzn n i m otrzymamy :
Fnm = C nm (u m − u n )
(IV-4)
35
We wzorze powyższym Cnm jest ( mikroskopowym)współczynnikiem sprężystości kryształu. Współczynnik ten
może przybierać różne wartości dla fal podłużnych i poprzecznych. Korzystając z relacji (IV-4) można obliczyć
całkowitą siłę działającą na daną płaszczyznę . Zastępując m= n+p otrzymamy:
Fn = ∑ C nn + p (u n + p − u p )
(IV-5)
p
Korzystając z II prawa Newtona otrzymamy równanie ruchu n-tej płaszczyzny:
M
d 2un
= ∑ C p (u n + p − u n )
dt 2
p
(IV-6)
Zarówno równanie (IV-1 ) jak ( IV-5) opisuje ruch całych płaszczyzn. Zamiast płaszczyzn można rozważać
poszczególne atomy. Zależnie od tego co bierzemy pod uwagę wybieramy odpowiednią masę M (masa całej
płaszczyzny lub masa atomu)i odpowiedni współczynnik sprężystości C, który będzie makroskopowym
współczynnikiem sprężystości materiału, w przypadku całych płaszczyzn, lub mikroskopową stałą sprężystości,
w przypadku pojedynczego atomu.
Równanie (IV-6) można znacznie uprościć jeśli weźmie się pod uwagę oddziaływanie tylko pomiędzy
najbliższymi sąsiadami, czyli pomiędzy atomem n tym i n-1 oraz n –tym i n+1. Wówczas
M
d 2u n
= C[(un +1 − un ) + (un −1 − un )]
dt 2
(IV-7)
Szukamy rozwiązania równania (IV-7) w postaci fali płaskiej :
u n = u 0 ⋅ e inka −iωt
gdzie k jest wektorem falowym fali, k = 2π / λ a
(IV-8)
ω
jest częstością drgań. Odcinek ‘a’ jest odległością
pomiędzy płaszczyznami sieciowymi. W sieci jednoatomowej będzie to jednocześnie stała sieci. Po
podstawieniu (IV-8) do (IV-7) otrzymamy:
1
− Mω 2 = C[(e ika − 1) − (1 − e −ika )] = 2C[cos(ka) − 1] = −4C sin 2 [ ka]
2
(IV-9)
Z równana (IV-9) wynika specyficzna zależność częstości fali ( fononu) od wektora falowego, która nosi
nazwę dyspersji.
36
Rysunek IV-2 Krzywe
dyspersji fononów.
Symbol || i ⊥
odpowiada fononom
podłużnym i
−π
2a
ω =2
3π
2a
C
1
| sin[ ka] |
M
2
(IV-10)
Wykres tej zależności przedstawiony jest na rysunku (IV-2). Przedstawiono tu dwie krzywe dyspersji
obliczone przy założeniu , że stała sprężystości dla fotonu podłużnego C|| jest dwa razy większa niż stała
sprężystości dla drgań poprzecznych, C ⊥ .
Daje się zauważyć, że krzywa dyspersji jest funkcją periodyczną z okresem
2π
. W ogólnym przypadku
a
funkcja dyspersji jest periodyczna z okresem sieci odwrotnej. Powracając do definicji pierwszej strefy
Brillouina, w przypadku naszych drgań odpowiada ona odcinkowi
−π π
,
. Jak widać, ze względu na
a a
periodyczność wszystkie informacje o własnościach fononów znajdują się w obszarze pierwszej strefy
Brillouina. Powyższy wniosek pozostaje słuszny również dla bardziej skomplikowanych struktur.
Warto zastanowić się nad sensem fizycznym powyższych prawidłowości. Zastanówmy się co wynika z
zależności wektora falowego od długości fali, k =
Brillouina,
2π
λ
. Jeśli k byłoby poza zakresem pierwszej strefy
−π π
to odpowiadająca mu długość fali byłaby mniejsza niż 2 stałe sieci. Praktycznie w
a a
krysztale fale takie nie mogą istnieć, a jeśli mimo wszystko założymy, że istnieją to ruch atomów, czyli to co
obserwujemy byłby taki jak dla fali o większej długości. N.p. fala, poruszająca się w kierunku (+x), o wektorze
falowym
π
4
3π
, ( patrz rysunek IV-2) i
, (λ = a) obserwowana byłaby jako fala o wektorze falowym −
3
2a
2a
długości fali
λ = 4a . W dodatku, z ujemnej wartości wektora falowego wynika, że obserwowany ruch
odpowiadałby fali poruszającej się w kierunku przeciwnym (-x). Sytuacja gdy wektor falowy k = ±
37
π
a
odpowiada fali stojącej w krysztale. Zauważamy, że zakres możliwych energii fononów jest ograniczony. Z
rysunku IV-2 wynika ,że zmienia się on od 0 do ηω max . Zakres dozwolonych energii określany jest często
jako widmo fononów .
Oprócz informacji o dozwolonych energiach krzywa dyspersji pozwala na obliczenia prędkości fazowej, vf
i prędkości grupowej, vg . Poniższe wzory przedstawiają odpowiednie zależności :
1
| sin[ ka] |
C
ω
2
υf = = 2
k
M
k
υg =
dω
=
dk
(IV-11)
C
k
1
⋅a⋅
cos[ ka]
M
|k|
2
(IV-12)
Ze wzorów (IV-11) i (IV –9) wynika , że w przypadku fali stojącej , k =
±π
prędkość grupowa jest równa
a
zeru.
Warto rozpatrzyć przypadek fal długich, dla których k jest bliskie zeru. Prędkość grupowa i fazowa
wynoszą odpowiednio
ω
C
lim k →±0 υ f = lim k →±0 ( ) = ±
⋅a
k
M
lim k →±0 υ g = lim k →±0
(I-13)
dω
C
=±
⋅a
dk
M
(IV-14)
Znaki (+) i (–) odpowiadają kierunkom rozchodzenia się fali względem naszego układu współrzędnych.
Zauważamy, że prędkość grupowa jest równa prędkości fazowej, co więcej prędkości te mogą być określone
przez makroskopowe własności kryształu. Przyjmując, że M/a3 = ρ jest gęstością ,a C/a=E, jest modułem
sprężystości objętościowej, otrzymamy znaną zależność na prędkość fal akustycznych w materiale
υ=
E
(IV-15)
ρ
Sieć krystaliczna zawierająca 2 różne atomy w komórce elementarnej.
Jeśli z danym węzłem sieci związane są dwa atomy możemy wyobrazić sobie dwa rodzaje drgań. W pierwszym
przypadku atomy w węźle poruszają się w tym samym kierunku ( są w fazie), w drugim przypadku poruszają
się w kierunkach przeciwnych. Pierwsze drganie nosi nazwę drgań akustycznych ( fonony akustyczne) i do
pewnego stopnia jest ono tożsame z poprzednio omówionym przykładem drgań sieci z jednym atomem w
węźle. Drugie drganie ,gdy atomy poruszają się w kierunkach przeciwnych nosi nazwę drgania optycznego
38
(fonony optyczne). W zależności od tego czy atomy drgają w kierunku rozchodzenia się fali , czy też
prostopadle do tego kierunku mamy do czynienia z drganiami podłużnymi lub poprzecznymi. W sumie mamy
więc 4 rodzaje drgań, dwa akustyczne ( TA- transverse acoustical i LA-longitudinal acoustical) oraz dwa
optyczne ( LO – longitudinal optical i TO – transverse optical). W zasadzie każde z bardziej złożonych drgań
może być rozpatrywane jako superpozycja powyższych modów.
W dalszym ciągu skupimy się na modach podłużnych, jednak wszystkie otrzymane zależności , co za tym idzie
wnioski będą słuszne również dla fal poprzecznych.
Rozważmy układ dwóch atomów o masach M1 i M2 , znajdujących się w komórce elementarnej ( Rys IV-6).
A
B
☺
☻
☺
☻
☺
☺
☻
☺
☻
☺
☺
☻
☺
☻
☺
2a
u2s-2
M2
Rys . IV-3 ☻
. Drgania podłużne sieci z
komórka dwuatomową zawierającą
☻ B. Płaszczyzny
atom A i atom
parzyste odpowiadają atomom A ,
☻
nieparzyste atomom B. Często
zamiast atomów mamy do czynienia z
u2s-1
u2s
u2s+1
u2s+2
M1
M2
M1
M2
jonami ( np A – jony dodatnie , B-
u2s+3
jony ujemne)
M1
Ponieważ atomy ( jony) typu A i B mogą różnić się masą ( i ładunkiem) ruch każdego z nich powinien być
opisany innym równaniem ruchu. Dla wybranej pary A i B otrzymamy następujący układ równań:
d 2 u 2 s +1
M1
= C (u 2 s + 2 + u 2 s − 2u 2 s +1 )
dt 2
(IV-16)
d 2u2s
= C (u 2 s +1 + u 2 s −1 − 2u 2 s )
dt 2
(IV-17)
M2
Podobnie jak dla sieci z jednym atomem w komórce szukamy rozwiązań równań ruchu w postaci fal płaskich.
Szukamy rozwiązań dla atomów A i B, takich że
u 2 s +1 = ξ ⋅ exp{i[(2 s + 1)ka − ωt ]}
(IV-18)
u 2 s = η ⋅ exp{i[2ska − ωt ]}
(IV-
19)
gdzie
ξ iη
są amplitudami wychyleń atomów ( jonów) A i B. Wstawiając (IV-18) i (IV-19) do (IV-16) i (IV-
17) otrzymuje się następujący układ równań
39
[2C − ω 2 M 1 ]ξ − C{exp[ika] + exp[−ika]}η = 0
(IV-20)
− Cξ {exp[ika] + exp[−ika]} + [2C − ω 2 M 2 ]η = 0
(IV-21)
który posiada nietrywialne rozwiązania gdy znika jego wyznacznik utworzony ze współczynników przy
ξ iη .
Znikanie wyznacznika prowadzi do następującego wyrażenia na częstość fononów:
1
1
1
1 2 4 ⋅ sin 2 ka
+
+
ω ± = C(
) ± C [(
) −
]
M1 M 2
M1 M 2
M 1M 2
(IV-22).
Powyższe równanie otrzymano wykorzystując równość exp[ika ] + exp[−ika] = 2 cos ka .
ω+ i ω_
odpowiadają odpowiednio gałęzi fononów optycznych i akustycznych . Krzywe dyspersji dla tych
gałęzi przedstawione są na rysunku (IV-7)
2C
M2
2C
M1
Łatwo jest zauważyć ,że krzywa dyspersji jest periodyczna z okresem
π
a
Rysunek IV-4
Dyspersja
fononów. Na
rysunku
przedstawiono
gałąź fononów
optycznych i
akustycznych
, pomiędzy
−π π
i
, co
2a 2a
odpowiada stałej sieci równej 2a. Komórka elementarna składa się z dwóch atomów Ai B (Patrz rys. IV-3).
Można obliczyć energie fononów w pobliżu środka strefy Brillouina ( odpowiada to długim falom) . Zakładając
, że k jest bliskie zeru otrzymamy:
40
ω + ≈ 2C (
ω_ ≈
1
1
+
)
M1 M 2
(IV-23)
2C
ka
M1 + M 2
(IV-24)
Zauważyć można, że krzywa dyspersji fononów akustycznych (IV-24) odpowiada krzywej (IV-10) gdy założy
się , że atomy A i B mają takie same masy.
Można obliczyć wartość częstości fononów na granicy strefy Brillouina. Jeśli M1 > M2
ω+ (
ω− (
π
2a
π
2a
)=
2C
M2
(IV-25)
)=
2C
M1
(IV-56)
Z przebiegu krzywych dyspersji łatwo zauważyć, że w krysztale z dwuatomową komórką elementarną nie mogą
istnieć drgania o częstościach pomiędzy
2C
i
M2
2C
.
M1
Zasada zachowania pędu w krysztale.
Kwantowa natura fononów powoduje, że mogą być one traktowane tak jak cząstki materialne. To samo
dotyczy fotonów. W szczególności procesy które zachodzą między fononami , fononami i fotonami oraz
fononami i elektronami, takie jak zderzenia sprężyste i niesprężyste, procesy kreacji i anihilacji cząstek
podlegać muszą zasadom zachowania. Najważniejsze to zasada zachowania energii, zasada zachowania pędu i
momentu pędu.
Skupmy się na zasadzie zachowania pędu, która w periodycznym krysztale będzie miała inną postać niż
dla cząstek zupełnie swobodnych.
W jednym z poprzednich paragrafów pokazano , że w krysztale nie mogą istnieć fonony o pędzie
większym niż wektor prymitywny sieci odwrotnej. Odpowiada to ograniczeniu na długość fali ,która nie może
być krótsza niż podwójna stała sieci. Pokazano również , że periodyczność sieci odwrotnej pozwala
zobrazować ruch fali o dowolnym wektorze falowym przez odniesienie jej do pierwszej strefy Brillouina .
Takie zobrazowanie jest jednym wynika uogólnionej zasady zachowania pędu dla kryształu.
41
Wyobraźmy sobie dwa fonony o pędach k1 i k2 , oba z pierwszej strefy Brillouina, których suma jest jednak
większa niż wektor sieci odwrotnej. Fonon o wektorze falowym wypadkowym, który powstałby po
niesprężystym zderzeniu takich dwóch fononów miałby wektor falowy |k3 |= |k1 + k2 |> |G|. Zgodnie z tym co
powiedziano poprzednio wektor k3 , odniesiony do pierwszej strefy Brillouina będzie miał wartość
k3 = k1 + k2 – G
(IV-27)
Relacja (IV –24) jest zasadą zachowania pędu w krysztale. Zasada ta zobrazowana jest na rysunku ( IV-8) Ze
względu na fakt , że zasada zachowania pędu w krysztale jest określona z dokładnością do dowolnego wektora
sieci odwrotnej, aby odróżnić go od pędu klasycznej cząstki, określa się pęd w krysztale, mianem
pseudopędu.
kx
Rys (IV-5) Zasada
zachowania pseudopędu,
liniami przerywanymi
zaznaczono pierwszą ky
strefę Brillouina
k1
k2
Wykład V. Wybrane właściwości dielektryków
Wykład dotyczy izolatorów , czyli materiałów, które nie mają swobodnych nośników prądu.
Własności , które tu zostaną omówione wynikają z istnienia fononów.
I. Właściwości optyczne
Rozważmy wpływ fali elektromagnetycznej światła widzialnego i bliskiej
podczerwieni na kryształ izolatora. W materiale takim nie ma swobodnych nośników prądu ,
bierze się więc pod uwagę tylko oddziaływanie pola elektromagnetycznego z ładunkami
jonów sieci krystalicznej. Dla uproszczenia załóżmy, podobnie jak w poprzednim wykładzie,
że mamy do czynienia z kryształem, w którym komórkę elementarną tworzą dwa jony A i B o
ładunkach ± q.
Falę elektromagnetyczną można opisać funkcją:
E (k , ω ) = E 0 ⋅ exp[−i (ωt − kx)]
(V.1)
42
gdzie E0 jest natężeniem pola elektrycznego a ω częstością kołową fali. „k” – jest wektorem
falowym. „x” jest położeniem w krysztale.
rys (V.1) jony A i B są wychylane w przeciwnych kierunkach ponieważ mają przeciwne
ładunki
A
B
A
B
☺
☻
☺
☻
☺
☻
u2s-1
u2s
u2s+1
u2s+2
u2s+3
M1
M2
M1
M2
M1
E
k
a
u2s-2
M2
Ponieważ jony różnią się ładunkiem pole elektryczne będzie je wychylać w przeciwnych kierunkach. Mamy tu
do czynienia z poprzecznym fononem optycznym (TO). Dla atomów A i B otrzymamy następujące równania
ruchu:
M1
d 2 u 2 s +1
− C (u 2 s + 2 + u 2 s − 2u 2 s +1 ) = qE
dt 2
(V-2)
d 2u2s
M2
− C (u 2 s +1 + u 2 s −1 − 2u 2 s ) = − qE
dt 2
(V-3)
Podobnie jak dla sieci krystalicznej bez pola elektrycznego szukamy rozwiązań równań ruchu jonów w
postaci fal płaskich
u 2 s +1 = ξ ⋅ exp{i[(2s + 1)ka − ωt ]}
(V-4)
u 2 s = η ⋅ exp{i[2ska − ωt ]}
(V-5)
gdzie
ξ iη
są amplitudami wychyleń jonów A i B. Wstawiając (V-4) i (V-4) do (V-2) i (V-3) otrzymuje się
następujący układ równań
[2C − ω 2 M 1 ]ξ − 2C cos(ka)η = qE 0
(V-6)
− 2Cξ cos(ka) + [2C − ω 2 M 2 ]η = − qE 0
(V-7)
43
W równaniach tych wykorzystano zależność , że x=ma dla m tego jonu. Równania (V-6) i
(V-7) mają następujące rozwiązania:
η=
− qE 0 {2C[1 − cos(ka)] − ω 2 M 1 }
− qE 0 {2C[1 − cos(ka)] − ω 2 M 1 }
=
2
2
{( 2C − ω 2 M 1 )(2C − ω 2 M 2 ) − 4C 2 cos 2 (ka)}
M 1 M 2 (ω 2 − ω TO
)(ω 2 − ω TA
)
(V-8)
ξ=
qE 0 {2C[1 − cos(ka)] − ω 2 M 2 }
qE 0 {2C[1 − cos(ka)] − ω 2 M 2 }
=
2
2
{( 2C − ω 2 M 1 )(2C − ω 2 M 2 ) − 4C 2 cos 2 (ka)} M 1 M 2 (ω 2 − ω TO
)(ω 2 − ω TA
)
(V-9)
gdzie ω TO = ω + i ω TA = ω − są częstościami poprzecznych fonów optycznych zdefiniowanymi
przez relację (IV-23).
Ponieważ długość fali światła ( kilka tysięcy Å) jest duża w porównaniu z pojedynczą
komórką elementarną możemy założyć, że charakteryzujący ją wektor falowy k =
mały . Wówczas cos(ka)=1 ( bo
2πa
λ
λ
<< 1 )oraz ω − =0. Po spełnieniu tych warunków
równania (V-8) i (V-9) będą miały postać
η=
qE 0
2
M 2 (ω 2 − ω TO
)
(V-10)
ξ=
− qE 0
2
M 1 (ω 2 − ω TO
)
(V-11)
Można wprowadzić pojęcie polaryzacji, P, zdefiniowanej jako moment dipolowy
przypadający na komórkę elementarną. Dla naszej komórki będzie to:
Pj = q (ξ − η ) =
2π
q 2 E0
2
µ (ω TO
−ω 2)
(V-12)
gdzie masa efektywna jonów, µ , zdefiniowana jest następująco:
44
1
µ
=
1
1
+
M1 M 2
jest
W naszych uproszczonych rachunkach można przyjąć, że wielkość χ =
q2
jest
2
µ (ω TO
−ω2)
zależną od częstotliwości podatnością dielektryczną. Wprowadza się pojęcie indukcji
dielektrycznej D
D = E + 4π ( Pe + Pj )
(V-13)
które odpowiada natężeniu pola elektrycznego wewnątrz kryształu. We wzorze (V-13) Pj
jest polaryzacją jonową daną wzorem (V-12), Pe jest polaryzacją elektronową, wynikającą z
przesunięć ładunków chmury elektronowej i jądra w pojedynczych atomach.
Równania (V-12) i (V-13) pozwalają na analizę zależności stałej dielektrycznej (
tak na prawdę to jest funkcja dielektryczna) a co za tym idzie współczynnika załamania od
częstości padającego promieniowania. Definiując stałą ( funkcję ) dielektryczną ε
stosunek indukcji do natężenia pola elektrycznego , ε =
jako
D
otrzymamy ε = ε el + 4πχ , gdzie
E
ε el jest stałą dielektryczną wynikającą z polaryzacji pojedynczych jonów , Pe . Korzystając z
definicji podatności otrzymamy:
4πq 2
ε (ω ) = ε el +
.
2
µ (ω TO
−ω 2)
(v-14)
Z równania ( V- 14) widać ,że gdy częstość fali elektromagnetycznej rośnie to funkcja
dielektryczna dąży do ε (∞) = ε el . ε el często nazywa się ją elektronową stałą dielektryczną.
Z drugiej strony, gdy mamy do czynienia ze stałym polem elektrycznym funkcja
dielektryczna osiąga wartość ε (0) = ε (∞) +
4πq 2
2
µω TO
dielektryczną .
Zależność (V-14) przedstawiono na rysunku V-2
45
. ε (0) nazywa się często całkowitą stałą
Rys V-2 . Funkcja
dielektryczna
Łatwo zauważyć, że funkcja dielektryczna ma wartość ujemną dla częstości w przedziale
ω TO < ω < ω 0 , gdzie
2
ω 0 = {ω TO
+
4πq 2 1 / 2
} = ω LO
ε (∞ ) µ
(V-15)
jest częstością, przy której stała dielektryczna osiąga wartość zerową. Można dowieść, że
jest to częstość podłużnych fononów optycznych. Z zależności ( V- 15) wynika następująca
relacja pomiędzy stałymi dielektrycznymi a częstościami odpowiednich fononów:
2
ε (0) ω LO
= 2
ε (∞) ω TO
( V-16)
Można napisać równanie różniczkowe opisujące rozchodzenie się fali elektromagnetycznej
w krysztale ( równanie falowe) w postaci:
1 ∂ 2 D(t , x) ∂ 2 E (t , x)
[ 2
−
]=0
c
∂t 2
∂x 2
(V-16)
gdzie c jest prędkością światła w próżni. Podstawiając do równania (V-16) za indukcję
dielektryczną D = D0 exp{i[ωt − kx]} i za natężenie pola elektrycznego
46
E = E 0 exp{i[ωt − kx]} oraz wykonując różniczkowanie otrzymamy następującą zależność
dyspersyjną czyli zależność częstości fali elektromagnetycznej od wektora falowego:
ω=
c
k
ε (ω )
(V-17)
gdzie ε jest funkcją dielektryczną daną wzorem (V-14). Wielkość
υ=
c
c
=
ε (ω ) n(ω )
(V-18)
jest prędkością rozchodzenia się fali elektromagnetycznej w danym ośrodku , zaś
n(ω ) = ε (ω ) jest funkcją współczynnika załamania światła danego ośrodka. Zależność
współczynnika załamania światła od częstości fali elektromagnetycznej jest odpowiedzialna
za rozszczepienie światła w pryzmacie.
Korzystając z relacji (V-18) można wykazać, że po przejściu drogi ∆ w danym
ośrodku faza fali ulegnie przesunięciu o kąt ω ⋅ (n − 1)
∆
. W wyniku czego natężenie fali
c
elektronmagnetycznej po przejściu prze ośrodek będzie dane przez:
∆
E (∆) = E 0 exp{−iω (n − 1) } ⋅ exp{i[ωt − kx]}
c
(V-19)
Współczynnik załamania jest pierwiastkiem ze stałej dielektrycznej. Jeśli funkcja
dielektryczna przyjmowałaby wartości ujemne współczynnik załamania byłby urojony. W
rzeczywistości funkcja dielektryczna jest funkcją ciągła. Widać to kiedy uwzględni się efekt
tłumienia fali elektromagnetycznej przez drgania sieci krystalicznej. Po uwzględnieniu
tłumienia równanie (V-14) przyjmuje postać funkcji zespolonej :
ε (ω ) = ε el +
4πq 2
2
µ (ω TO
− ω 2 + iγω )
(V-20).
w którym γ jest stałą tłumienia.
Zespolona funkcja dielektryczna powoduje pojawienie się urojonej składowej funkcji
współczynnika załamania. Zakładając, że n=n’+in’’ otrzymujemy następująca postać
równania (V-19)
E (∆) = E 0 exp(−n' 'ω
∆
∆
) exp{−iω (n'−1) } ⋅ exp{i[ωt − kx]}
c
c
47
(V-21)
Pierwszy czynnik w równości (V-21) jest odpowiedzialny za tłumienie fali
elektromagnetycznej ( absorpcję fotonów). Wielkość β =
n' ' ω
często nazywa się
c
współczynnikiem absorpcji. Efekty ten powoduje ,że fale elektromagnetyczne częstościach
pomiędzy ω TO i ω LO nie mogą rozchodzić się w krysztale. W różnych kryształach będzie
to różny zakres energii. W praktyce energie fononów optycznych mieszczą się na ogół w
granicach 200 do 2000 cm-1 . Dla fal elektromagnetycznych odpowiada to falom o
długościach 50000 do 5000 nm . Jest to więc daleka podczerwień.
Pojęcie polaritonu.
Problem rozchodzenia się fali elektromagnetycznej w krysztale można odwrócić . Zamiast
pytać jak wpływa fala elektromagnetyczna na kryształ można zapytać jak kryształ wpływa na
falę elektromagnetyczną. Z rozważań poprzedniego paragrafu wynika, że fala
elektromagnetyczna światła widzialnego pobudza do drgań jony kryształu. Oddziaływanie
tego typu prowadzi do powstawania w krysztale modów mieszanych będących kombinacją
drgań mechanicznych i elektromagnetycznych . Sytuację można przedstawić posługując się
zależnościami dyspersyjnymi . Dla fotonów ( fal elektromagnetycznych rozchodzących się
w krysztale, w zależności od częstości otrzymuje się dla wysokich częstości :
ω=
c
ε∞
k
(V-22)
i dla niskich częstości
ω=
c
ε0
k
(V-23)
gdzie ε ∞ i ε 0 są odpowiednimi stałymi dielektrycznymi a c jest prędkością światła w próżni.
Z kolei krzywe dyspersji dla poszczególnych fononów dane są przez relację (IV-19).
Rozpatrując tylko fonony optyczne o małych wektorach falowych (z początku strefy
Brillouina) otrzymamy dla podłużnych i poprzecznych fononów stałe, niezależne od wektora
falowego częstości ω LO i ω TO . Krzywe dyspersji dla modów sprężonych, fotonowofononowych przedstawione są na rysunku V-3. Mody takie nazywamy polaritonami
48
ω=
ω=
kc
ε∞
kc
ε0
Rys. V-3 Zależności dyspersyjne polaritonów.
Dla małych wartości wektora falowego kc / ω TO << 2 obserwujemy fotony rozchodzące się
w krysztale z prędkością v = c / ε ∞ ( dolna gałąź) i podłużne fonony optyczne (górna gałąź).
Dla kc / ω TO > 6 obserwujemy poprzeczne fonony optyczne i fotony poruszające się z
prędkością v = c / ε 0 . Widać , że jak wspomniano w poprzednim paragrafie, fotony o
częstościach pomiędzy ω LO i ω TO nie mogą istnieć.
Efekt Ramana :
Innym przykładem oddziaływania fali elektromagnetycznej z fononami sieci krystalicznej
jest efekt Rmana. Efekt ten pojawia się gdy foton oddziaływując z fononami w sieci
krystalicznej oddaje część swojej energii kreując fonon lub pochłania energię istniejącego w
krysztale fononu . W rezultacie takich procesów w widmie światła rozproszonego
pojawiają się oprócz fotonów o niezmienionej energii fotony o energii mniejszej i większej o
energię oddziaływujących z nimi fononów. Istnieją dwa modele wyjaśniające zjawisko
49
Ramana model klasyczny i model kwantowy. Obecnie przedstawimy zostanie model
klasyczny.
Jak to dyskutowano w poprzednim paragrafie padająca fala elektromagnetyczna opisana
relacją (V-1) powodować będzie polaryzację ośrodka. Polaryzacja jonowa, Pj, opisana jest
relacją (V-12). Dla bieżących potrzeb przedstawimy tę relację następująco:
Pj = χE
(V-24)
gdzie χ podatnością dielektryczną. W poprzednim paragrafie zakładano, że to właśnie fala
elektromagnetyczna może pobudzać drgania sieci. Przy takim założeniu , jak to wykazano
poprzednio podatność nie zleży od wychyleń jonów. Rozważmy jednak co stanie się , jeśli
oprócz fali elektromagnetycznej istnieją w krysztale niezależne oscylacje sieci. Oscylacje te
poprzez drgania jonów wytworzą dodatkową polaryzację. Efekt ten można opisać
zakładając, że podatność dielektryczna składa się z dwóch części : składowej stałej i
składowej indukowanej przez istniejące w krysztale drgania sieci. Daje to następującą
relacje:
χ = χ0 +
dχ
dχ 1
u ⋅ cos(ω fon t ) = χ 0 +
u ⋅ {exp[iω fon t ] + exp[−iω fon t ]}
du
du 2
(V-25)
Zakładając, że natężenie pola elektrycznego fali elektromagnetycznej jest dane przez relację
E = E 0 exp[iω 0 t ]
(26)
otrzymamy następującą relację na polaryzację P
P = χ 0 E 0 exp[iω 0 ⋅ t ] +
1 dχ
1 dχ
uE 0 ⋅ exp[i (ω 0 + ω fon )t ] +
u ⋅ E 0 exp[i (ω 0 − ω fon )t ]}
2 du
2 du
(-27)
Z relacji (V-27) widać ,że oprócz fali o częstości ω 0 pojawiają się fale elektromagnetyczne
elektryczne o częstościach (ω 0 + ω
fon
) i (ω 0 − ω fon ) , których natężenia są wprost
proporcjonalne do pochodnej podatności dielektrycznej
dχ
.
du
Model kwantowy może być zilustrowany przy pomocy rysunku (V-4)
50
E+ ηω fon
Rys (V-4) Efekt Ramana
e
E
E- ηω fon
g
Zakłada się ,że rozproszenie światła polega na jego absorpcji do wirtualnego stanu
wzbudzonego , oznaczonego jako e i następnie natychmiastowej emisji do stanu
podstawowego. Ponieważ emisja jest natychmiastowa , zgodnie z zasadą nieoznaczoności
Heisenberga energia stanu może być dowolna. Istniejące w krysztale pole fononów może
powodować ,że układ będąc w stanie wzbudzonym zaabsorbuje lub wyemituje fonon o
energii ηω fon . Na skutek tych procesów znajdzie się w stanie E+ ηω fon lub E- ηω fon .
Ostatecznie powracając do stanu podstawowego układ może emitować 3 różne fotony o
energiach odpowiednio ηω fot = E, ηω fot = E+ ηω fon lub ηω fot = E- ηω fon . Pierwsza
energia jest energią rezonansową ( tzw. linia Rayleigh’a ) .Foton o energii mniejszej daje
linię Stokes’a. Foton o energii większej niż E daje linię antystokesowską.
ształu.
51
Wykład VI. Wybrane właściwości dielektryków
Własności cieplne
Już na zupełnie elementarnym poziomie wspomina się, że własności termiczne materiału ,
takie jak ciepło właściwe, przewodnictwo cieplne czy rozszerzalność termiczna określone są
przez drgania atomów danego ciała. W niniejszym paragrafie zajmiemy się bardziej
szczegółową analizą tych wielkości, a w szczególności ciepła właściwego w stałej objętości .
Naprawdę to co możemy zmierzyć w przypadku ciała stałego to ciepło właściwe w
stałym ciśnieniu Cp. Niestety nie możemy obliczyć bezpośrednio wartości ciepła właściwego
przy stałym ciśnieniu. To co można oszacować teoretycznie to ciepło właściwe w stałej
objętości. Wiemy jednak , że ciepło właściwe w stałej objętości i ciepło właściwe w stałym
ciśnieniu powiązane są relacją:
∆V (T )
C p − Cv =
∫ pdV
0
T
(VI-1)
gdzie p jest ciśnieniem a ∆V zmianą objętości pod wpływem temperatury. Znając
wartość ciepła właściwego w stałej objętości łatwo obliczyć wartość ciepła właściwego w
stałym ciśnieniu. Jeśli zauważy się , że p = 2 B∆V / V0 , gdzie B jest modułem odkształcenia
objętościowego a V0 objętością próbki, dV = d (∆V ) oraz ∆V (T ) = 3V0αT , gdzie α jest
współczynnikiem rozszerzalności liniowej, otrzymuje się następujący wzór
C p = C v + 9α 2 BV0T
(VI-2)
52
Ciepło właściwe w stałej objętości definiujemy jako pochodną energii wewnętrznej ciała w
stałej objętości
Cv = {
∂E
}V
∂T
(VI-3)
We wzorze użyto pochodnej cząstkowej aby podkreślić , że różniczkujemy tylko względem
jawnie pojawiającej się temperatury.
Jak widać ze wzoru (VI-3) problem obliczenia ciepła właściwego sprowadza się do
obliczenia energii wewnętrznej układu. Ta z kolei zależy od tego z czego zbudowany jest
dany materiał. W krysztale energia cieplna absorbowana jest przez drgania sieci krystalicznej
oraz ruch swobodnych nośników prądu ( powiedzmy elektronów) . Jeśli mamy do czynienia
z izolatorem jedynymi cząstkami absorbującymi energię termiczną są fonony. Aby obliczyć
energię całkowitą układu wystarczy więc dodać energię wszystkich istniejących w krysztale
fononów. Ponieważ fonony mają ciągłe widmo energii sumowanie zastępuje się na ogół
całkowaniem
Można stosunkowa łatwo uzasadnić, że całkowita energia dana jest wzorem:
E=
ω2
∫ D(ω ) ⋅ n(ω , T ) ⋅ ηω ⋅ dω
(VI-4)
ω1
gdzie ω1 , ω 2 minimalną i maksymalna częstością fononów, n(ω , T ) jest
prawdopodobieństwem, że zostanie wzbudzony fonon o częstości ω , zaś D(ω ) jest
gęstością stanów. W ten sposób wielkość D(ω ) ⋅ n(ω , T ) jest liczbą fononów o częstości ω
(energii ηω ) istniejących w krysztale.
Ze względu na to , że fonony są bozonami prawdopodobieństwo, że zostanie
wzbudzony fonon o energii ηω jest zawsze dane przez rozkład Bosego –Einsteina
n(ω , T ) = n(ηω , T ) =
1
exp(ηω / k B T ) − 1
(VI-5)
gdzie kB jest stałą Boltzmanna. Cały problem obliczenia energii wewnętrznej a więc i ciepła
właściwego sprowadza się więc do obliczenia gęstości stanów a następnie wykonaniu
całkowania. Z uwagi na fakt , że mamy na ogół do czynienia z wieloma różnymi modami
modami fononowymi (choćby LO, TO, TA, LA ), z których każdy wnosi osobny wkład do
53
gęstości stanów, obliczenia takie nie są proste. Z tego powodu często rozważa się sytuacje
modelowe, w których dokonuje się szeregu istotnych przybliżeń. Dwoma podstawowymi
modelami są model Einsteina i model Debye’a
Model Einsteina
Zakłada się tu, że mamy do czynienia z indywidualnymi, niezależnymi oscylatorami
harmonicznymi, każdy o takiej samej energii, ηω 0 . Model ten odpowiada sytuacji w której
każdy atom w krysztale drga niezależnie. Model ten opisuje również bardzo dobrze fonony
optyczne, zarówno poprzeczne jak i podłużne.
Ponieważ wszystkie oscylatory mają taką samą energię gęstość stanów będzie równa
zero poza tą energią i 3N dla tej energii, gdzie N jest ilością atomów . Można to zapisać
następująco:
D(ω ) = 3N ⋅ δ (ω − ω 0 )
(VI-6)
gdzie ⋅ δ (ω − ω 0 ) funkcją delta Diracka. Liczba 3 pojawiła się ze względu na to , że każdy
atom ma 3 stopnie swobody, wiążą się z nim więc 3 niezależne mody drgań.
Wstawiając (VI-6) i (VI-5) do wzoru (VI-4) otrzymujemy
E=
3 Nηω 0
exp( βηω 0 ) − 1
(VI-7)
zaś ciepło właściwe wynosi:
( βηω 0 ) 2 ⋅ exp( βηω 0 )
CV = 3 Nk B
[exp( βηω 0 ) − 1] 2
(VI-8)
We wzorach (VI-7) i (VI-8) wykorzystano zależność β =
1
.
k BT
Analiza wzoru (VI-8) prowadzi do wniosku , że dla wysokich temperatur,
k B T >> ηω 0 , ciepło właściwe jest stałe i wynosi : 3 Nk B . Dla niskich temperatur,
k B T << ηω 0 , ciepło właściwe maleje do zera zgodnie z zależnością
CV = 3 Nk B ( βηω 0 ) 2 e − βηω 0
(VI-9)
54
Model Debye’a
W modelu tym zakłada się, że widmo energetyczne fononów jest widmem ciągłym,
czyli że w pewnym zakresie energii każda energia fononu jest możliwa. Rozważmy na
przykład fonony akustyczne. Dla fonów o małych wektorach falowych ich prędkość jest
stała i równa się prędkości fali dźwiękowej, υ , danej wzorem ( IV-12). Powoduje następującą
zależność liniową zależność dyspersyjną :
ω (k ) = υ ⋅ k
(VI-10)
W przypadku, gdy rozważamy realne fonony relacja dyspersyjna jest bardziej skomplikowana
1
2
ω (k ) = ω max sin( ka)
(VI-11)
[ patrz tez relacja (IV-7)],
gdzie ω max jest maksymalną częstością a „ a” jest stałą sieci.
Aby obliczyć gęstość stanów rozważmy jednowymiarową sieć krystaliczną. Fonony
mają postać fal płaskich. Wychylenia poszczególnych węzłów sieci dane są przez równanie
(IV-5).
Tutaj analizować będziemy tylko zależność od położenia w krysztale.
u n = u 0 ⋅ e ikx
(VI-12)
Rozważmy dalej kryształ o skończonej długości . Jeśli w krysztale istnieją stabilne
drgania sieci to długość fali takiego drgania musi mieścić się całkowitą ilość razy w
krysztale. Jeśli nie to fale ulegną bardzo szybko wygaszeniu wskutek interferencji pomiędzy
falą padającą a falą odbitą od krawędzi kryształu. Korzystając z relacji pomiędzy długością
fali a wektorem falowym k =
2π
λ
możemy powyższy warunek zapisać następująco:
dozwolone są tylko takie wartości wektora falowego , że
k=±
2nπ
, n = 0,1,2.... ,
L
(VI-13)
gdzie L jest rozmiarem kryształu, n jest liczbą całkowitą, w tym również zerem. Pamiętać
przy tym należy ,że bezwzględna wartość wektora falowego nie może być większa niż π / a
( granica pierwszej strefy Brillouina). Ze wzoru (VI-13) widać ,że niezależnie od wielkości
wektor falowy przyjmuje tylko dyskretne wartości , które różnią się między sobą nie mniej
55
niż o
2π
2π
. Można powiedzieć, na jeden stan wektora k przypada
a
L
miejsca w przestrzeni
odwrotnej.
Definiuje się wielkość, która jest pędową gęstością stanów ρ (k ) jako ilość stanów
przypadających na pewną jednostkową objętość w przestrzeni pędów ( w jednowymiarowej
przestrzeni będzie to jednostkowa długość). W naszym przypadku
ρ (k ) =
L
1
=
2π 2π
L
(VI-14)
Energetyczną gęstość stanów , czyli ilość stanów przypadającą na jednostkę energii
otrzymamy z relacji:
D (ω ) = 2 ρ (k )
dk
dω
(VI-15)
Dwójka pojawiła się ponieważ mamy dwa wektory falowe o tej samej długości i
różnych zwrotach , ± k , którym odpowiada ta sama wartość energii (częstości fononów).
Pochodną
dk
otrzymujemy z zależności dyspersyjnych (VI-10) lub (VI-11).
dω
Wykorzystajmy tę prostszą zależność tzn ( VI-10). Otrzymany wówczas
dk 1
= oraz
dω υ
energetyczną gęstość stanów
D(ω ) =
L
(VI-16)
πυ
Należy w tym miejscu zauważyć, że wszystkie powyższe rozważania mają sens tylko gdy
mamy do czynienia z wektorami falowymi z pierwszej strefy Brillouina, czyli dla k
mniejszego niż π / a ( a jest stałą sieci ). Wartość k =
π
a
odpowiada granicznej częstości
zwanej częstością Debye'a ω max = ω D .
Powróćmy do obliczenia całkowitej energii fononów w układzie . Wstawiając
zależność (VI-16) i (VI-5) do (VI-4) otrzymamy
E=
ωD
∫
0
L ⋅ ηω
πυ
dω
L⋅
=
exp( βηω ) − 1 πυ
ωD
∫
0
ηω ⋅ dω
exp( βηω ) − 1
56
(VI-17)
Dokonując podstawień
x = βηω =
ηω
k BT
(VI-18)
ηω D Θ
xD =
=
k BT T
gdzie Θ =
ηω D
jest temperaturą Debye’a, otrzymuje się
kB
L ⋅ k B2T 2
E=
ηπυ
xD
L ⋅ ω D k BT T
xdx
=
⋅
exp x − 1
πυ
Θ
∫
0
xD
∫
0
xdx
exp x − 1
(VI-19)
ostatnią całkę w równaniu (VI-19) należy liczyć numeryczne. Ponieważ x zależy od
temperatury również i wartość całki jest zależna od temperatury. Stosunkowo łatwo można
oszacować jej wartość w przypadkach granicznych, bardzo niskich i bardzo wysokich
temperatur. Temperatury porównywać będziemy z temperaturą Debye’a. Zauważmy, że
energia fononu o częstości równej częstości Debye’a wynosi na ogół około 5 10-22 J a stałą
Boltzmanna kB= 1.381 10-23 J deg-1 Temperatura Debye’a jest więc raczej niską temperatura
wynoszącą nie więcej niż 50 K. Tak więc granica niskich temperatur to temperatury
pojedynczych kelwinów , zaś temperatura pokojowa należy z pewnością do temperatur
wysokich
Aby otrzymać konkretne wyniki zakładamy dla wysokich temperatur ( T >> Θ ), że x → 0 , i
całka
xD
∫
0
xdx
=
exp x − 1
xD
∫
0
x
D
Θ
xdx
= ∫ dx = x D =
1+ x −1 0
T
(VI-20)
Zaś energia dana będzie wzorem :
E=
L ⋅ω DkB
πυ
T=
Lk B T
= Nk B T
a
(VI-21)
We wzorze tym wykorzystano definicję częstości Debye’a oraz fakt, że ilość jonów w
krysztale N jest proporcjonalna do L/a. Wzór (VI-21) pokazuje, że w jednowymiarowym
57
krysztale dla wysokich temperaturach energia układu jest proporcjonalna do temperatury.
Oznacza to, że ciepło właściwe w wysokich temperaturach jest stałe :
C v = Nk B
(VI-22)
Jak pamiętamy taki sam wniosek otrzymano w przypadku modelu Einsteina. Tutaj nie pojawił
się czynnik 3 ponieważ w jednowymiarowym krysztale możliwy jest tylko jeden rodzaj
drgań.
Dla niskich temperatur (Θ >> T ) i wartość xD dąży do nieskończoności . Wówczas
równość (VI-19 ) przyjmuje postać.
E = Nk B T ⋅
T∞
xdx
∫
Θ 0 exp x − 1
(VI-23)
Całka we wzorze (VI-23) jest skończona i daje się policzyć i wynosi.
1 π2
∑n n 2 = 6
Ze wzoru (VI-23) wynika , że ciepło właściwe jest dla niskich temperatur proporcjonalne do
temperatury.
C v=
1
T π2
Nk B ⋅
3
Θ
(VI-24)
Aby obliczyć ciepło właściwe w dowolnej temperaturze wygodnie jest powrócić do wzoru
(VI-16) . Wówczas Cv jest przez relację
C v=
∂ L⋅
∂T πυ
ωD
L⋅
ηω ⋅ dω
=
exp( βηω ) − 1 πυk B T 2
∫
0
ωD
(ηω ⋅) 2 exp( βηω )dω
∫0 [exp( βηω ) − 1]2
(VI-24a)
Korzystając ponownie z relacji (VI-18) i definicji częstości Debye’a otrzymamy
T
C v = 2 Nk B
Θ
xD
x 2 e x dx
∫0 (e x − 1) 2
(VI-24b)
Wynik ten , w szczególności zależność ciepła właściwego od temperatury dla niskich
temperatur nie jest zgodny z doświadczeniem. W realnych trójwymiarowych kryształach
ciepło właściwe w niskich temperaturach jest wprost proporcjonalne do trzeciej potęgi
58
temperatury. Otrzymana tu zależność wynika z uproszczonego modelu jednowymiarowego
kryształu.
Wykład VI.
ciąg dalszy
Trójwymiarowy model Debye’a
Rozważmy sześcian o boku L, w którym powstają fonony opisane przez falę płaską :
u 0 exp{ikr}
(VI-25)
Zauważmy, że w odróżnieniu od wzoru (VI-12) mamy tu do czynienia z iloczynem
skalarnym wektorów k i r .
kr = k x x + k y y + k z z
(VI-26)
Rys (VI-1)
x
z
L
Warunek na to aby fonony nie ulegały wygaszeniu, czyli warunek wzmocnienia fali
padającej i odbitej powinien być spełniony równocześnie w kierunku x, y i z. Zgodnie z tym
możliwe są następujące wartości poszczególnych składowych wektora falowego.
kx =
ky =
2πn x
L
2πn y
(VI-27)
L
2πn z
kz =
L
gdzie n x , n y i n z są liczbami całkowitymi. Z zależności (VI-26) wynika, że objętość w
przestrzeni pędów przypadająca na jeden stan określony przez trójkę liczb k x , k y , k z wynosi
3
2π
zawsze . Stąd gęstość stanów w przestrzeni pędów jest równa
L
L
ρ (k ) =
2π
3
(VI-28)
59
Energetyczna gęstość stanów w modelu trójwymiarowym dana jest przez wzór bardzo
podobny do (VI-15).
D (ω ) = ρ (k )
dVk
dω
(VI-29)
We wzorze (VI-29) zamiast dk mamy wielkość dVk , która odpowiada małej objętości w
przestrzeni pędów, wewnątrz której wartość wektora falowego k jest stała. Jeżeli założymy,
że częstość fononów zależy od bezwzględnej wartości k objętość dVk jest objętością
powłoki kulistej o promieniach wewnętrznym - k i zewnętrznym k+dk. Schematyczne
sytuacja przedstawiona jest nas rysunku VI-2
Rys VI-2 przekrój powłoki kulistej w przestrzeni k
dk
k
dVk = 4πk 2 dk
kk
Wewnątrz powłoki wartość bezwzględna wektora falowego zmienia się w zakresie od k do
k+dk.
Zauważając , że
dVk
dk
dk
k 1
= 4πk 2
oraz że
= = z równania (VI-9) otrzymamy na
dω
dω
dω ω υ
następujące wyrażenie energetyczną gęstość stanów fononowych.
3
3
4 L 2
4 L 2
D(ω ) = π
k = 3 π
ω
υ 2π
υ 2π
(VI-30)
Podstawiając do wzoru (VI-4) za D(ω ) wartość daną wzorem (VI-30) otrzymamy
L
E = 3 π
υ 2π
4
3 ωD
ω 2 ηω ⋅ dω
∫0 exp(ηω / k BT ) − 1
(VI-31)
Korzystając tak jak poprzednio z podstawienia (VI-18) otrzymuje się :
60
3
4 4
L k BT
E = 3 π
υ 2π η3
4
xD
x 3 dx
∫0 exp x − 1
(VI-32)
Można obliczyć całkowitą liczbę stanów dla danego modu drgań, N . Wynosi ona
3
ω 3 L3
L ωD 2
N s = ∫ D(ω )dω = 3 π
∫ ω dω = D2 3
6π υ
υ 2π 0
0
ωD
4
(VI-33)
Spodziewać się należy ,że liczba stanów powinna być równa potrojonej liczbie atomów w
krysztale N s = 3N . Równość (VI-33) pozwala na wyrażenie całkowitej energii układu w
sposób następujący :
T
E = 9 Nk B T
Θ
3 xD
x 3 dx
∫0 e x − 1
(VI-34)
Analogicznie jak w przypadku jednowymiarowym można obliczyć ciepło właściwe
Cv =
d 4 L
π
dT υ 3 2π
3 ωD
4π L
ω 2 ηω ⋅ dω
∫0 exp(ηω / k BT ) − 1 = υ 3 k BT 2 2π
3 ωD
exp(ηω / k B T )ω 3 η2ω ⋅ dω
∫0 [exp(ηω / k BT ) − 1]2
(VI-35)
lub po wykorzystaniu relacji (VI-18) i (VI-34)
T
C v = 9 Nk B
Θ
3 xD
x 4 e x dx
∫0 (e x − 1) 2
(VI-36)
Podobnie jak dla jednowymiarowego modelu Debye’a możemy analizować przypadki
graniczne wysokiej i niskiej temperatury .
Dla temperatur wysokich (T >> Θ) x → 0 i relacja (VI-36) daje się zapisać następująco
T
C v ≈ 9 Nk B
Θ
3 xD
3
T 1 3
2
∫0 x dx = 9 Nk B Θ 3 x D = 3Nk B
(VI-37)
Widać, że w porównaniu z jednowymiarowym modelem trzykrotnie wzrosło ciepło
właściwe. Jest to związane z faktem, ze w trójwymiarowej przestrzeni każdy atom ma 3
61
stopnie swobody. Wartość ta jest całkowicie zgodna z otrzymaną przy analogicznych
założeniach wartością ciepła właściwego w modelu Einsteina.
W przypadku niskich temperatur, T << Θ x D → ∞ . Przy obliczaniu ciepła właściwego
wygodnie jest wówczas posłużyć się relacją (VI-34), która przyjmuje postać:
T
E = 9 Nk B T
Θ
3∞
x 3 dx
∫0 e x − 1
(VI-38)
Całka w równaniu (VI-38) daje się policzyć i wynosi
π4
15
, wobec powyższego
różniczkując względem temperatury równanie (VI-38) otrzymuje się
Cv =
12π 4
T
Nk B T
5
Θ
3
(VI-39)
Zależność, w której ciepło właściwe w niskich temperaturach jest proporcjonalne do trzeciej
potęgi temperatury jest zgodna a doświadczeniem dla wszystkich ciał stałych, które są
izolatorami.
Wykresy przedstawiające zależność ciepła właściwego od temperatury obliczone przy
pomocy trzech wyżej wspomnianych modeli przedstawione są na rysunku V-5
Cv
62
Rys VI-3 Ciepło
właściwe w funkcji
Bardziej zaawansowane modele
temperatury . Dla
Einsteina
Należy uwzględnić wszystkie gałęzie fononów optycznych modelu
i akustycznych
istniejące w
(krzywa ciągła ), i
krysztale oraz fakt ,że dyspersja w poszczególnych gałęziach zależy od kierunku wektora
modelu Debye’a (
przerywane);
pędu. W takiej sytuacji równość (VI-29) będzie miała w kakrzywe
żdej gałęzi
inną postać. Ogólna
kryształ
postać zależności pomiędzy odpowiednimi gęstościami stanów w każdej gałęzi będzie
jednowymiarowy (
krótkie przerwy ) i
następująca:
kryształ
D (ω ) = ρ (k ) ∫
dS k
grad k ω (k )
(VI-40)
gdzie dS k jest elementem powierzchni prostopadłym do wektora k
Należy tu zauważyć, że
gęstość stanów w przestrzeni pędów ( wektora falowego ) będzie zawsze taka sama i wynosi
n
L
w przestrzeni n wymiarowej.
2π
63
Fononowe przewodnictwo cieplne
W ciałach stałych energia cieplna przenoszona jest głównie przez swobodne
elektrony. W wyniku tego dobre przewodniki elektryczności są na ogół dobrymi
przewodnikami ciepła. Nie znaczy to jednak, że izolatory nie przewodzą ciepła w ogóle.
Niekiedy kryształy nie przewodzące elektryczności bywają dobrymi, a nawet bardzo
dobrymi przewodnikami ciepła. Takim dobrym przewodnikiem ciepła a jednocześnie
bardzo słabo przewodzącym elektryczność materiałem jest kryształ diamentu. To samo
dotyczy kryształów kwarcu i szafiru. We wszystkich tych przypadkach przewodnictwo
cieplne w niskich temperaturach jest lepsze niż przewodnictwo cieplne miedzi. Cząstkami ,
które są odpowiedzialne z przenoszenie energii cieplnej w izolatorach są fonony.
Zjawisko przewodzenia ciepła jest zjawiskiem nierównowagowym , to znaczy że
odbywać się może tylko przy zaistnieniu gradientu temperatury w próbce. Zjawisko
transportu energii cieplnej opisuje się równaniem:
dQ
= −η ⋅ gradT
dt
gdzie
(VI-41)
dQ
jest gęstością strumienia energii cieplnej ( Energia przechodząca przez jednostkę
dt
powierzchni w jednostce czasu) , η jest współczynnikiem przewodnictwa cieplnego lub po
prostu przewodnictwem cieplnym. Dla uproszczenia możemy rozważyć kryształ o stałym
przekroju , w którym temperatura zmienia się wzdłuż osi x . Wzór ( VI-41) przyjmie
wówczas postać:
dQ x / dt = −η
dT
dx
(VI-42)
Rozważmy obszary A i B odległe o odległość ∆ = ⋅υ xτ , gdzie υ x jest średnią prędkością (
prędkością grupową) fononów w kierunku x a τ jest średnim czasem życia fononu, czyli
okresem pomiędzy zderzeniami danego fononu z innym fononem lub defektem sieci
krystalicznej. υ xτ jest więc średnią drogą swobodną fononu. Rozważmy teraz tylko tę część
energii, która jest przenoszona przez fonony o częstości ηω , tzn q x . Wielkość
64
dq x
jest
dt
różnicą energii fononów, które przeszły w jednostce czasu A do B i od B do A przez
powierzchnię S rozgraniczającą te obszary. Patrz rysunek (VI-4)
Rys. (VI-4)
A ( T + ∆T )
B (T)
N(x-dx)
N(x-dx)-N(x)
S
⋅ υ xτ
N(x)
⋅ υ xτ
Energię tą można obliczyć z następującego wzoru
dq x / dt = ⋅υ xτ
d
{ηω ⋅ [ N ( x − dx) − N ( x)]}
dt
(VI-43)
gdzie N(x) i N(x-dx) są gęstościami fononów ( ilość fononów w jednostce objętości ) w obszarach A i B.
Bierzemy pod uwagę tylko fonony z obszarów bliższych powierzchni S niż średnia droga swobodna, czyli tylko
te, które po powstaniu ( kreacji) nie uległy zderzeniom. Fonony, które powstały w dalszej odległości od
powierzchni S niż średnia droga swobodna nie mogą brać udziału w transporcie energii cieplnej ponieważ nie
docierają do powierzchni S. Wykorzystując następujące zależności
[ N ( x − dx) − N ( x)] = −
dN
dx ,
dx
dN dN dT
=
⋅
,
dx dT dx
dx
= υx
dt
otrzymamy
dq x
dN 2 dT
dN 2
= −ηω
υ xτ ⋅
= −ηω
υ x τ ⋅ gradT
dt
dT
dx
dT
Liczba fononów o częstości
ω
(VI-44)
dana jest przez relację N = N (ω ) = D(ω ) ⋅ n(ω , T ) gdzie D jest gęstością
stanów a n jest prawdopodobieństwem obsadzenia stanu liczonym z rozkładu Bosego -Einsteina , danym przez
wzór (V-32).
n(ηω , T ) =
1
exp(ηω / k B T ) − 1
(VI-45)
65
W celu obliczenia całkowitej energii należy posumować energie wszystkich istniejących fononów . Zamiast
sumowania możemy wykonać całkowanie po częstości fononów, wówczas
ωD
dn(ω , T )
dQ ω D dq x
= ∫
dω ⋅ gradT
dω = −η ∫ υ x2 (ω ) ⋅ τ (ω ) ⋅ ω ⋅ D(ω )
dT
dt
0 dt
0
(VI-46)
gdzie całkowanie odbywa się od zera do częstości Debye’a, jeśli użyjemy tego modelu do opisu fononów . Aby
otrzymać wzór (VI-46) założono, że gęstość stanów fononowych nie zależy od temperatury. Założenie to jest
słuszne zarówno dla modelu Debye’a jak i Einsteina. Jeśli wykonamy różniczkowanie po temperaturze wór
(VI-46) przyjmie postać:
dQ
= −η2
dt
ωD
η2υ x2 ⋅ τ
−
k BT 2
ωD
exp(ηω / k B T )
⋅ω 2
2
∫0 k BT 2 [exp(ηω / k BT ) − 1]2 υ x (ω ) ⋅ τ (ω ) ⋅ D(ω )dω ⋅ gradT =
ω 2 exp(ηω / k B T )
∫0 [exp(ηω / k BT ) − 1]2 D(ω )dω ⋅ gradT
(VI-47)
Ostatnią równość otrzymano zakładając ,że prędkość fononów i ich średnia droga swobodna nie zależy od ich
częstości.
Ze wzoru (VI-47) widać, że przewodność cieplna może być wyrażona wzorem
η2 ⋅ υ 2τ
η=
3 ⋅ k BT 2
ωD
ω 2 exp(ηω / k B T )
∫0 [exp(ηω / k BT ) − 1]2 D(ω )dω
( VI-48)
Aby otrzymać powyższy wzór wykorzystano znaną ze statystyki zależność pomiędzy średnią prędkością
cząstek, υ , i jej rzutem na dany kierunek , υ x = υ y = υ z =
2
2
2
1 2
υ .
3
Przypomnijmy sobie wyrażenie na ciepło właściwe
ωD
d ωD
d
n(ω , T )dω =
∫ D(ω ) ⋅ n(ω , T )dω =, ∫ D(ω ) ⋅
dT 0
dT
0
(VI-49)
1⋅ ωD
(ηω ⋅) 2 exp( βηω )dω
∫ D(ω )
k BT 2 0
[exp( βηω ) − 1] 2
C v=
Porównując relacje (VI-48) i (VI-49) otrzymamy następującą relację wiążącą ciepło właściwe z
przewodnictwem cieplnym.
1
3
η = Cvυ 2τ
(VI-50)
66
. Wzór (VI-50) jest prawdziwy, gdy możemy założyć że prędkość grupowa fononów oraz ich średnia droga
swobodna nie zależy od temperatury. W takich warunkach wszystkie wnioski dotyczące zależności
przewodnictwa cieplnego od temperatury i ciepła właściwego od temperatury są takie same Istotne rożbieżności
pojawią się w wysokich temperaturach ze względu na temperaturową zależność procesów odpowiedzialnych za
rozpad fononów (procesy zderzeniowe). One to właśnie określają wartość średniego czasu życia i średniej
drogi swobodnej fononu w krysztale. Pośród nich bardzo interesujące są tzw. procesy umklapp (nazwa
pochodzi od niemieckiego terminu zawijać wokół) . Procesy te dotyczą zderzeń pomiędzy fononami o
wartościach pędów w pobliżu granicy pierwszej strefy Brillouina . Zasada zachowania pędu dana jest wówczas
wzorem (IV-27) : k3 = k1 + k2 – G.
Z przedstawionego poniżej rysunku widać, że wypadkowy pęd fononu , który powstał przez zderzenie dwóch
fononów pierwotnych jest skierowany przeciwnie niż pędy składowe. Gdy rozważa się transport ciepła w
krysztale procesy umklapp powodują pojawienie się pewnej składowej powrotnego transportu energii
zachodzącego od niższej do wyższej temperatury. Ponieważ w wyższych temperaturach fonony akustyczne
mają większy pęd efekt ten w bardzo istotny sposób zmniejsza wartość przewodnictwa cieplnego w wysokich
temperaturach.
k1
k2
k3
Wykład VII. Gaz elektronów Fermiego.
67
Rys (VI-5) Zasada
zachowania pseudopędu,
w procesach umklapp.
Liniami przerywanymi
zaznaczono pierwszą
strefę Brillouina
W rozdziale tym zajmować się będziemy swobodnymi elektronami istniejącymi w ciałach
stałych. Będą to na ogół metale. Do opisu własności elektronów w metalu posłużymy się
prostym modelem w którym zakłada się co następuje:
1. Elektrony mogą się swobodnie poruszać wewnątrz próbki
2. Elektrony nie mogą opuścić metalu.
3.
Elektrony nie oddziaływają pomiędzy sobą
W tej sytuacji ruch każdego elektronu można rozpatrywać niezależnie od pozostałych.
Zagadnienie analizować będziemy używając mechaniki kwantowej. W tym formalizmie
dozwolone energie pojedynczego elektronu oraz odpowiadające im funkcje falowe można
otrzymać rozwiązując niezależne od czasu równanie Schrödingera
η2 2
[−
∇ + V (r )]ϕ (r ) = Eϕ (r )
2m
(VII-1)
gdzie ϕ (r ) jest funkcją falową , V (r ) energią potencjalną elektronu, −
η2 2
∇ jest
2m
operatorem energii kinetycznej elektronu, E jest wartością własną energii. Zgodnie z
naszymi początkowymi założeniami możemy przyjąć ,że potencjał V (r ) jest równy zero
wewnątrz metalu oraz nieskończoność na zewnątrz . Dla uproszenia rozważań można przyjąć
, że mamy do czynienia z sześcianem o boku L . Wówczas
0, dla 0 ≤ x, y, z ≤ L,
V (r ) =
∞ poza tym
(VII-2)
Ponieważ elektrony nie mogą istnieć na zewnątrz metalu równanie (VII-1) ma sens tylko
wewnątrz metalu gdzie przyjmuje następującą postać:
η2 2
−
∇ ϕ (r ) = Eϕ (r )
2m
(VII-3)
68
Operator ∇ 2 =
∂2
∂2
∂2
. Widać, że równanie (VII-3) ma rozwiązanie w postaci fali
+
+
∂x 2 ∂y 2 ∂z 2
płaskiej
1
ϕ (r ) =
L
3/ 2
exp[ikr]
(VII-4)
gdzie stały czynnik przed eksponentem wynika z warunku normalizacji funkcji falowej :
∫ ϕ * (r)ϕ (r)dr
3
=1
(VII-5)
Po podstawieniu funkcji (VII-4) do równania (VII-3) i wykonaniu różniczkowania
otrzymujemy następującą zależność energii od wektora falowego:
2
η2 k 2 η (k x k x + k y k y + k z k z )
=
E (k ) =
2m
2m
(VII-6)
k x , k y , k z są odpowiednimi składowymi wektora falowego. Warto przypomnieć w
gdzie
tym miejscu związek pomiędzy wektorem falowym a pędem cząstki
p = ηk
(VII-7)
Wstawiając go do wzoru (VII-6) otrzymujemy klasyczną (znaną z klasycznej mechaniki)
zależność energii kinetycznej cząstki swobodnej od pędu.
E (k ) =
p2
η2 k 2
=
2m
2m
(VII-8)
Przedstawienie energii kinetycznej cząstki w postaci jej zależności od wektora falowego (
relacja VII-6) lub od pędu ( relacja VII-8) jest znacznie bardziej uniwersalne niż
przedstawienie jej w funkcji prędkości E =
mυ 2
. Po pierwsze mamy tu do czynienia z
2
dwoma wielkościami fizycznymi, wobec których obowiązują zasady zachowania (nie ma zaś
zasady zachowania prędkości). Po drugie przedstawienie w funkcji wektora falowego może
być użyte w jednolitej formie zarówno dla cząstek posiadających masę jak i dla cząstek o
zerowej lub bliżej nieokreślonej masie (fotony, fonony). W następnych wykładach zostanie
pokazane, że nośniki prądu w krysztale mogą nie mieć stałej masy.
Powróćmy do rozwiązań równania (VII-3). Z faktu, że elektrony nie mogą istnieć
poza kryształem wynika, że funkcja falowa musi znikać na brzegu kryształu i poza
kryształem. Sprowadza się to do warunku ϕ (r ) = ϕ ( x, y, z ) = 0 dla x,y i z równych 0 i L.
Funkcja w postaci (VII-4) spełnia ten warunek jeśli
69
kx =
ky =
π ⋅ nx
L
π ⋅ ny
(VII-9)
L
π ⋅ nz
kz =
L
gdzie n x , n y , n z liczbami całkowitymi a L jest bokiem naszego sześcianu.
W przypadku jednowymiarowym funkcje falowe kilku najniższych stanów przedstawione są
na rysunku (VII-1)
Rys VI-1.Funkcje falowe
trzech stanów o
najniższej energii
0
L
Mamy tu do pewnego stopnia sytuację analogiczną jak w przypadku fononów. Wynika to z
takich samych warunków kwantyzacji nałożonych na elektronową funkcję falową jakie w
przypadku fononów zostały nałożone na falę mechaniczną.
Druga analogia dotyczy kształtu potencjału. Łatwo zauważyć, że dla gazu
elektronów swobodnych w metalu otrzymujemy dyskretne wartości energii, które są
identyczne jak te otrzymane dla cząstki znajdującej się w trójwymiarowej studni potencjału o
nieskończenie wysokich ścianach. Różnica polega na tym, że studnia potencjału miała
zazwyczaj małe rozmiary, co powodowało że różnice energii pomiędzy poszczególnymi
stanami były stosunkowo duże. Obecnie zaś mamy do czynienia z dużymi rozmiarami
kryształu co powoduje, że stany energetyczne leżą bardzo blisko siebie. Stany a takim
potencjale analizuje się nieco inaczej niż stany cząstki w studni potencjału. Zamiast obliczać
poszczególne energie wygodnie się zapytać ile stanów energetycznych znajduje się w
przedziale energii pomiędzy energią E i E+dE. Wielkość tą nazywamy energetyczną
gęstością stanów. Spotkaliśmy się już z nią przy okazji analizy ciepła właściwego fononów.
70
Wracając do analogii z fononami. Podobnie jak i w tamtym przypadku zamiast
rozważać skończony kryształ można określić stany własne układu zakładając periodyczność
funkcji falowej z okresem L. Wówczas warunek periodyczności :
ϕ ( x + L , y + L , z + L ) = ϕ ( x, y , z )
(VII-10)
prowadzi do następujących warunków określających dozwolone wartości wektora falowego
:
kx =
ky =
2π ⋅ n x
L
2π ⋅ n y
(VII-11)
L
2π ⋅ n z
kz =
L
Interesujące jest to, że warunki (VII-9) i (VII-11) są sobie równoważne. Wynika to z faktu
,że zawsze możemy wybrać dowolną wartość boku L naszego podstawowego sześcianu. W
dalszym ciągu będziemy się posługiwali warunkiem (VII-11). Widać, że niezależnie od
3
2π
wartości wektora falowego jeden stan przypada na objętość
w przestrzeni pędów.
L
Wobec powyższego gęstość stanów w przestrzeni pędów jest równa
dn
L
= ρ (k ) =
dVk
2π
3
(VII-12)
Aby obliczyć energetyczną gęstość stanów postępujemy podobnie jak w przypadku
gęstości stanów fononowych . Odpowiednie równanie będzie miało teraz postać:
D( E ) =
dV
dn
dn dVk
=
= ρ (k ) k
dE dVk dE
dE
(VII-13)
Identycznie jak w przypadku fononów dVk jest objętością w przestrzeni pędów, w której
energia ( tym razem elektronu) ma stałą wartość. Zauważamy, że ponieważ zależność
energii od wektora falowego określona jest wzorem (VII-6) energia będzie stałą na
powierzchni kuli . Identycznie jak w przypadku fononów
dVk = 4πk 2 dk .
(VII-14)
Podstawiając (VII-14) do (VII-13) otrzymujemy
D( E ) = ρ (k )4πk 2
dk
dE
Z relacji dyspersyjnej (VII-6) otrzymujemy
(VII-15)
dk
m
= 2 i stąd
dE η k
71
3
L 4πkm
D(E ) =
2
2π η
(VII-16)
Korzystając dalej z zależności (VII-6) otrzymamy ostatecznie:
3
5/ 2
3/ 2
L 2 m
D( E ) =
E1/ 2
π
3
2
π
η
(VII-17).
W odróżnieniu od fononów elektrony, jako cząstki posiadające spin połówkowy są
fermionami. Oznacza to, że stosuje się do nich zakaz Pauliego oraz podlegają statystyce
Fermiego Diracka. Z zakazu Pauliego wynika, że w jednym stanie mogą znajdować się
co najwyżej dwa elektrony różniące się spinem ( jeden ma spin równy
1
1
a drugi − ) .
2
2
Oznacza to, że jeśli w metalu znajduje się wiele elektronów to zajmować one będą
kolejne stany energetyczne o coraz wyższej energii. W temperaturze 0K najwyższy
obsadzony stan ma energię równa energii Fermiego.
Statystyka Fermiego.
Prawdopodobieństwo , że elektron znajduje się w stanie o energii E dane jest wzorem:
f ( E, T ) =
1
exp{( E − µ ) / k B T } + 1
(VII-18).
Energia µ zwana jest potencjałem chemicznym i jest zdefiniowana jako energia stanu,
którego prawdopodobieństwo obsadzenia jest równe 0.5. Energia ta zależy od
temperatury . W temperaturze 0K energia potencjału chemicznego jest z definicji równa
energii poziomu Fermiego. To powoduje, że często zamiast potencjału chemicznego
używamy terminu energii Fermiego E F . Tak zdefiniowana energia Fermiego będzie zależała
od temperatury. Wykres funkcji Fermiego przedstawiony jest na rysunku (VII-2)
72
Fig .VI-2 a) funkcja rozkładu
Fermiego, Linia ciągła odpowiada
temperaturze 0K, krzywe
przerywane odpowiadają
a
temperaturom 0.1 i 0. 25
f (T , E )
EF
kB
b) funkcja obsadzenia stanów
trójwymiarowego gazu Fermiego dla
temperatury 0K i 0.25
EF
. Na
kB
rysunku zaznaczono również gęstość
stanów. Widać, że potencjał
chemiczny dla temperatury wyższej
niż 0K ma wartość mniejszą niż EF
EF ,µ
E n e rg ia
µ, EF
W zerowej temperaturze Funkcja (VII-18) ma postać schodkową:
1
f (E) =
0
dla
E ≤ EF
dla
E > EF
b
(VII-19)
Spróbujmy obliczyć energię Fermiego i potencjał chemiczny dla metalu, w którym w
jednostce objętości znajduje się N elektronów. Można to zrobić korzystając z równości :
N=
2
L3
3
3
EF
7/2
3/ 2
1 2 m
(
)
π
=
D
E
dE
∫0
η3
2π
3/ 2
1 2 m
π
η3
π
3/ 2
EF
∫E
1/ 2
dE =
0
(VII-20)
1 3/ 2
EF
3
We wzorze (VII-20) dodatkowy czynnik 2 pojawił się ze względu na to, że w jednym stanie
znajdują się dwa elektrony. Ze wzoru (VII-20) wynika następujący wzór na energię Fermiego
73
EF =
η2
η2
⋅ (3π 2 N ) 2 / 3 =
⋅ K F2
2m
2m
[
Wielkość K F = 3π 2 N
]
1/ 3
(VII-21)
nosi nazwę wektora Fermiego.
Potencjał chemiczny µ może być obliczony z równości :
EF
∞
0
0
1
∫ D( E )dE = ∫ D( E ) ⋅ exp{( E − µ ) / k
B
dE
T} + 1
(VII-22)
Dla niskich temperatur równanie to ma przybliżone rozwiązanie w postaci
µ = EF −
π2
∂
(k B T ) 2 ln[ D( E )]
6
∂E
E = EF
(VII-22a)
Zwróćmy raz jeszcze uwagę na konsekwencje faktu, że elektrony są fermionami. Wynika z
tego ,że nawet w temperaturze 0K gaz elektronów swobodnych posiada określoną energię.
Można zapytać jakiego rodzaju jest to energia i jakie są konsekwencje faktu , że nie jest ona
równa energii stanu podstawowego.
Po pierwsze zauważmy, że stanom o wyższej energii odpowiada większy wektor
falowy. W temperaturze zera bezwzględnego obsadzone są wszystkie stany leżące
wewnątrz kuli o promieniu K F - wektora Fermiego. Czasami nazywa się to kulą
Fermiego. Wektor falowy funkcji falowej elektronu jest związany z prędkością fazową
fali elektronu, υ faz =
E
. Prędkość pojedynczego elektronu jest prędkością grupową
ηk
fali elektronu, i wynosi υ gr =
dE
. Pomimo, że energia pojedynczego elektronu w
ηdk
krysztale liczona względem dna pasma przewodnictwa jest energią kinetyczną energia
elektronu w gazie elektronowym, wynikająca z istnienia zakazu Pauliego, ma charakter
energii potencjalnej. Dlatego mówimy o potencjale Fermiego i potencjale chemicznym.
74
Potencjał Fermiego może być wyznaczony jeśli znana jest praca wyjścia elektronów z
metalu . Sytuacja przedstawiona jest na rysunku. VII-3 .
Rys VII- 3 schemat pasm energetycznych w metalu . Stany obsadzone przez elektrony
Energia
zaznaczono przez cieniowanie.
φ
E
EF
poziom
Pasmo energetyczne częściowo
zapełnione
pasmo całkowicie zapełnione
Materiał
próżnia
Praca wyjścia φ określana jest jako różnica energii pomiędzy energią elektronu na zewnątrz
materiału (w próżni) a energią Fermiego.
Znaczenie potencjału Fermiego widać jeśli zetkniemy ze sobą dwa materiały o różnej
wartości energii Fermiego. Elektrony znajdujące się w materiale o wyższym poziomie
Fermiego mają większą energię potencjalną niż elektrony w materiale o niższej energii
Fermiego. Zetkniecie obu materiałów powoduje więc ruch elektronów, który ustanie dopiero
po wyrównaniu się poziomów Fermiego w obu materiałach. Kiedy to nastąpi elektrycznie
obojętne przed zetknięciem materiały ulegną po zetknięciu polaryzacji. Materiał, z którego
odeszły elektrony będzie miał ładunek dodatni , a materiał do którego przeniknęły elektrony
będzie miał ładunek ujemny. Sytuacja przedstawiona jest na rysunku (VII-4). Taki przepływ
elektronów dążących do wyrównania potencjałów chemicznych odpowiedzialny jest za
powstanie napięcia kontaktowego oraz zjawiska termoelektrycznego w metalach, a także
nieliniowych efektów w złączach półprzewodnikowych.
75
Rys VII-4 Poziom Fermiego w złączy dwóch metali. Grubą strzałką oznaczono kierunek
przepływu elektronów. Z rysunku widać, że ważna jest energia Fermiego liczona względem
poziomu próżni.
Poziom próżni
E FI
E FII
Energia
Poziom Fermiego po
Zetknięciu materiałów
Materiał I
Materiał II
Ciepło właściwe elektronów
Elektronowe ciepło właściwe definiujemy w ten sam sposób jak ciepło właściwe związane z
istnieniem fononów. Tak jak w przypadku fononów obowiązuje relacja:
Cv =
∂U
∂T
(VII-23)
Gdzie U jest całkowitą energią wewnętrzną układu , którą liczy się sumując energie
wszystkich elektronów swobodnych istniejących w metalu. Podobnie jak dla fononów
całkowitą energię otrzymuje się ze wzoru:
∞
U (T ) = ∫ D( E ) f ( E , T ) EdE
(VII_24).
0
gdzie D jest gęstością stanów , f, funkcją rozkładu Fermiego, E energią elektronu. W celu
uproszczenia obliczeń wykorzystuje się następującą zależność :
76
∞
∞
∂
∂
∂
Cv =
U (T ) = ∫ D( E ) E
f ( E , T )dE = ∫ D( E )( E − µ ) ⋅
f ( E , T )dE
∂T
∂T
∂T
0
0
(VII-25)
∞
Wzór powyższy jest prawdziwy ponieważ ilość elektronów N = 2 ∫ D( E ) f ( E , T )dE , nie
0
zależy od temperatury. Stąd:
∞
∫ D( E )
0
∞
∂
∂
∂
f ( E , T )dE =
D( E ) f ( E , T )dE =
N =0
∫
∂T
∂T 0
∂T
(VII-26)
Jeżeli mamy stosunkowo niską temperaturę to pochodna funkcji Fermiego jest różna od zera
w niewielkim zakresie energii w pobliżu energii Fermiego. Wówczas całkowanie we wzorze
(VII-25) można znacznie uprościć przyjmując, że w obszarze gdzie
∂f
≠ 0 mamy do
∂T
czynienia ze stałą gęstością stanów . Zakładając, że D ( E ) ≈ D( E F ) dostajemy
∞
C v = D( E F ) ∫ ( E − µ ) ⋅
0
∂
f ( E , T )dE
∂T
(VII-27)
Korzystając dalej ze wzoru ( VII-19) otrzymujemy
∞
( E − µ ) 2 exp{( E − µ ) / k B T }
1
Cv =
D( E F ) ⋅ ∫
dE
2
k BT 2
0 [exp{( E − µ ) / k B T } + 1]
(VII-28)
Całkowanie we wzorze (VII-28) może być wykonane po zamianie zmiennych .
Wprowadzając nową zmienną x = ( E − µ ) / k B T otrzymujemy
∞
C v = k B2T ⋅ D( E F ) ⋅
x 2 exp( x)
dx
2
∫
[exp(
x
)
+
1
]
− µ / k BT
(VII-29)
∞
≈ k B2T ⋅ D( E F ) ⋅
x 2 exp( x)
dx
2
∫
− ∞[exp( x ) + 1]
∞
Całkę we wzorze (VII-29) można policzyć ⋅
Cv ≈
π2
3
π2
x 2 exp( x)
dx
=
. Stąd ostatecznie
2
∫
3
− ∞[exp( x ) + 1]
k B2T ⋅ D( E F )
(VII-30)
Jeśli skorzystamy z zależności energii Fermiego od ilości elektronów N otrzymamy
77
Cv ≈
π 2 N ⋅ k B2T
2EF
=
π 2 N ⋅ kB T
2
⋅
(VII-31)
TF
Wprowadzono tu pojęcie temperatury Fermiego, TF =
EF
. Ze względu na fakt, że w
kB
metalu energia Fermiego jest znaczna temperatura Fermiego jest wynosi kilka tysięcy
Kelwinów. To powoduje ,że przybliżony wzór (VII-31) jest słuszny również w
temperaturach zbliżonych do temperatury pokojowej.
Możemy obecnie dokonać porównania wartości elektronowego i fononowego ciepła
właściwego dla metalu. Przypomnijmy w tym celu wzór na fononowe ciepło właściwe w
wysokich temperaturach (V-47)
C v = 3N a k B
(VII-32)
gdzie Na jest równe ilości atomów w jednostce objętości . W wzorze (VII-31 ) N było równe
gęstości elektronów swobodnych. Ponieważ w metalach mamy na ogół jeden elektron
swobodny przypadający na jeden atom sieci liczby te są takie same. Pozostałe własności są
stałymi liczbowymi. Widać, że pokojowej temperaturze dominuje fononowe ciepło właściwe.
Inaczej może być w temperaturach wysokich, gdzie obie wielkości mają porównywalne
wartości.
Przewodnictwo elektryczne metali
Model Drude’go
Aby otrzymać zależność prądu płynącego przez przewodnik od przyłożonego napięcia
rozważmy materiał , w którym mamy „N” swobodnych nośników prądu w jednostce
objętości. Załóżmy dalej ,że elektrony zderzają się ze sobą oraz z fononami i defektami sieci,
oraz że średni czas pomiędzy dwoma zderzeniami wynosi τ . Pod wpływem zewnętrznego
pola elektrycznego o natężeniu ε elektrony ulegają przyspieszeniu i w czasie pomiędzy
kolejnymi zderzeniami uzyskują dodatkową prędkość w kierunku pola υ u , zwaną
prędkością unoszenia. Odpowiednie równanie ruchu elektronów przyjmuje postać
m
τ
υ u = eε
(VII-33)
78
gdzie e jest ładunkiem a m masą elektronu. Zgodnie ze znaną definicją gęstość prądu daje
się obliczyć ze wzoru:
j = eNυ u =
e 2 Nτ
ε = Neµε
m
gdzie wielkość µ =
eτ
m
(VII-34)
nazywana jest ruchliwością elektronów. Ostatecznie otrzymuje
się następujący wzór na przewodnictwo elektryczne metalu :
e 2τ
N = Neµ
σ= =
m
ε
j
(VII-35)
Jeśli weźmie się pod uwagę kwantowy model gazu elektronów swobodnych to zauważymy
od razu, że nie wszystkie elektrony mogą brać udział w przewodnictwie. W szczególności do
przewodnictwa nie mogą przyczyniać się elektrony znajdujące się w stanach o energiach
mniejszych niż energia Fermiego. Faktycznie w przewodnictwie biorą udział tylko elektrony
o energii równej energii Fermiego, tylko one bowiem mogą zmienić swoją energię
przechodząc do wyższych nie obsadzonych stanów energetycznych. Elektrony o energiach
mniejszych niż energia Fermiego nie ulegają przyspieszeniu pod wpływem zewnętrznego
pola elektrycznego ponieważ stany o wyższych energiach, do których powinny przejść po
uzyskaniu dodatkowej prędkości unoszenia są już obsadzone. Wydawałoby się, że N we
wzorach (VII-33) – (VII-35) nie jest całkowitą ilością elektronów a tylko ilością elektronów
mających energię Fermiego. Z drugiej jednak strony, jak zostanie pokazane w
następnym paragrafie, kwantowy model gazu elektronów swobodnych Fermiegio daje
taką samą zależność przewodnictwa od gęstości elektronów w metalu jak klasyczny
model Drude’go.
Kwantowy model przewodnictwa elektrycznego
Aby otrzymać odpowiednie wyrażenie na przewodnictwo elektronowe w modelu kwantowym rozważmy
przewodnik o stałym przekroju S, przedstawiony na Rysunku VII-5
ε
N(k-dkx)
S
N(k-dkx)-N(k)
N(k)
79
⋅ υ xτ
⋅ υ xτ
Gęstość prądu będzie równa ilości elektronów przechodzących przez powierzchnie S. Podobnie jak w
przypadku transportu ciepła ilość ta będzie równa różnicy pomiędzy ilością elektronów przechodzących w
jednostce czasu z lewej na prawą i prawej na lewą. Rozważmy elektrony mające pęd k. Przyczynek do gęstości
prądu pochodzący od tych elektronów będzie równy ;
j k = eυ x ⋅ τ (k )[ N (k − dk x ) − N (k )] / dt = −
1
4π
3
eυ x (k )τ (k )
df (k ) dk x
dk x dt
(VII-36)
we wzorze (VII-36) wykorzystano fakt , że liczba elektronów o pędzie k jest dana przez iloczyn gęstości stanów
w przestrzeni pędów i funkcji rozkładu Fermiego : N ( k ) = 2
f (k )
1
ρ (k ) ⋅ f (k ) = 2 3 υ x = ηk x / m jest
3
L
8π
prędkością elektronu w kierunku x
Z zasady zachowania pędu otrzymujemy
dk x
ε
= e , zaś związek dyspersyjny dla elektronów daje nam
dt
η
df (k ) df dE
df η2 k x df
=
=
=
ηυ x . Wstawiając obydwie te zależności do wzoru (VII-35)
dk x
dE dk x dE m
dE
otrzymujemy:
jk = −
ε 2 2
df (k )
e υ x (k )τ (k )
3
dE
4π
(VII-37)
Aby otrzymać całkowitą gęstość prądu należy dokonać sumowania po wszystkich elektronach mających
dowolne pędy. Sprowadza się to do całkowania po wszystkich możliwych pędach:
j = ∫ j k dk 3 = − ∫
df (k ) 3
ε 2 2
e ⋅ υ x (k )τ (k )
dk
3
dE
4π
(VII-38)
Całkowanie odbywa się po objętości w przestrzeni pędów. Możemy wybrać wygodną dla nas objętość, w której
energia elektronów ma wartość stał dk = dVk = 4πk dk . Zastępując dalej całkowanie po wektorach
3
2
falowych dk całkowaniem po energii dE oraz korzystając z faktu, że dk =
bezwzględną wartością prędkości elektronu i k
j = −2
2
dE
, gdzie υ = ηk / m , gdzie jest
ηυ
= 2mE otrzymujemy
df ( E )
εme 2 υ x2 ( E )
Eτ ( E )
dE
2 3 ∫
dE
π η υ ( E)
(VII-39)
80
Dla niskich temperatur, gdy E F >> k B T można skorzystać z przybliżonego wzoru
df ( E )
≈ −δ ( E − E F ) ,
dE
(VII-40)
gdzie δ jest funkcją delta Diracka . Otrzymujemy wówczas
εme 2 υ x2 ( E F )
j= 2 3
2EFτ (EF )
π η υ (EF )
(VII-41)
Korzystając dalej z następujących zależności k F3 = 3π 2 N , E F =
η2 k F2
1
i υ x2 = υ 2
2m
3
otrzymujemy
j=
ε ⋅ e 2τ ( E F )
m
(VII-42)
N
Ostatecznie otrzymujemy następujący wzór określający przewodnictwo metali
σ=
j
ε
=
e 2τ ( E F )
N
m
(VII-43)
oraz ruchliwość elektronów
µ=
e 2τ ( E F )
m
(VII-44)
Granice zastosowania modelu gazu elektronów swobodnych.
Porównując model gazu Fermiego z realnymi elektronami w metalu zauważamy, że główne
uproszczenie teorii polega na zaniedbaniu potencjału krystalicznego. Jak wiadomo konsekwencją istnienia
periodycznego potencjału krystalicznego jest istnienie w przestrzeni pędów struktury periodycznej zwanej siecią
odwrotną. Jeśli rozważa się dynamikę cząstek pojawia się konieczność uwzględnienia istnienia pierwszej strefy
Brillouina i faktu, że nie może istnieć cząstka, której fala materii ma wektor falowy większy niż promień tej
strefy. Koncentrując się na elektronach w metalu, widzimy że jeśli wektor Fermiego jest mały w porównaniu
rozmiarami strefy Brillouina to istnienie granicy strefy nie wpływa w żaden sposób na dynamikę elektronów,
jeśli zaś wektor Fermiego jest porównywalny lub większy od promienia strefy wówczas teoria gazu elektronów
Fermiego może być nieprawdziwa. Należy wówczas uwzględnić istnienie struktury periodycznej kryształu
Przypomnijmy, wektor Fermiego jest dany przez:
K F = [3π 2
n 1/ 3
]
V
(VII-45)
gdzie n jest ilością elektronów walencyjnych w metalu a V jego objętością .
Zakładając, że mamy jeden elektron na jeden atom i jeden atom na jedną komórkę
81
elementarną, oraz że stała sieci równa się a otrzymamy:
n
1
1
= 3 i K F = [3π 2 ]1 / 3 . Promień
V a
a
pierwszej strefy Brillouina jest w tym przypadku równy G =
π
a
. Jak widać obie te wielkości
są porównywalne.
Wykład VIII. Pasma energetyczne.
Aby otrzymać strukturę elektronową kryształu możemy posłużyć się dwoma
modelami: modelem elektronów silnie zlokalizowanych ( model ciasnego wiązania ) i
modelem elektronów prawie swobodnych.
W modelu ciasnego wiązania w tzw. zerowym przybliżeniu zakładamy, że mamy
elektrony znajdujące się w stanach atomowych, określonych przez potencjał pojedynczego
jonu ( atomu) zaś efekt kryształu pojawia się jako zaburzenie pochodzące od pozostałych
jonów ( atomów) sieci krystalicznej. Elektron jest więc przede wszystkim elektronem
związanym z konkretnym atomem, a jego ruch jest dodatkowo zaburzony przez
pozostałe atomy sieci.
W modelu prawie swobodnych elektronów w zerowym przybliżeniu zakłada się, że
elektrony w krysztale są elektronami swobodnymi, nie związanymi z żadnym konkretnym
atomem , zaś periodyczny potencjał jonów ( wszystkich) może być traktowany jako
zaburzenie. Elektron jest więc przede wszystkim elektronem swobodnym , którego ruch
jest zaburzony przez atomy sieci.
Jeśli rozważa się bardziej zaawansowane wersje obu modeli i przeprowadza w ich
ramach obliczenia to otrzymuje się lepsze wyniki gdy używa się modelu ciasnego wiązania
do opisu elektronów w rdzeniach atomowych atomów sieci. Jednak, jeśli interesujemy się
elektronami walencyjnymi, odpowiedzialnymi za wiązania krystaliczne i własności
elektryczne kryształów to nieco lepsze wyniki otrzymuje się stosując model słabego
wiązania. Ogólnie trudno jest jednak przedstawić jednoznacznie kiedy jaki model będzie
poprawniej opisywał rzeczywistość. Fakt, że otrzymuje się taki sam lub prawie taki sam
wynik stosując różne modele, i że w obu przypadkach całkowicie poprawnie opisujemy
rzeczywistość jest jednym z bardziej interesujących przykładów zastosowania metod
przybliżonych do opisu zjawisk fizycznych . W naszym przypadku ta pozorna sprzeczność ma
stosunkowo proste wyjaśnienie. Kryształ stanowi dla elektronów walencyjnych środowisko ,
które jest czymś pośrednim pomiędzy atomem a próżnią (ze względu na osłabienie
82
oddziaływania atomu macierzystego przez pozostałe atomy sieci) . Nie znając ścisłych
rozwiązań musimy posługiwać się metodami przybliżonymi, biorąc za punkt wyjścia znane
nam układy ( atom lub jego brak). W gruncie rzeczy jest obojętne czy do wyniku, którym
jest struktura pasmowa dochodzimy od strony silnie zlokalizowanych elektronów,
zmniejszając potencjał atomu macierzystego na korzyść pozostałych atomów, czy od strony
swobodnych elektronów wprowadzając i zwiększając stopniowo potencjał sieci. W obu
przypadkach wynik powinien być w przybliżeniu taki sam. W trakcie tego wykładu zostanie
przedstawiony model prawie swobodnych elektronów.
Wprowadźmy potencjał krystaliczny , który jest dany przez funkcję V (r ) ,
periodyczną z okresem sieci , tzn. spełniającą warunek V (r + R ) = V (r ) , gdzie R jest
dowolnym wektorem translacji. Energię elektronu otrzymujemy rozwiązując następujące,
niezależne od czasu równanie Schrodingera:
{
− η2 ∇ 2
+ V (r )}ϕ k (r ) = E (k )ϕ k (r ) ,
2m
(VIII-1)
W przypadku tego równania skorzystaliśmy z wyniku otrzymanego już dla elektronów
swobodnych a mianowicie z faktu, że energia elektronu jest funkcją wektora falowego. Jeśli
potencjał krystaliczny nie jest zbyt silny energia elektronu w krysztale również powinna
zależeć od wektora falowego.
Tak jak to się na ogół zdarza i w tym przypadku nie potrafimy znaleźć ścisłych
rozwiązań równania (VIII-1). Istnieje co najmniej kilkanaście przybliżonych metod
rozwiązywania równania (VIII-1). We wszystkich przypadkach podstawowym zagadnieniem
jest właściwy wybór ogólnej postaci funkcji falowej, będącej jego rozwiązaniem.
Wydaje się oczywiste ,że ponieważ potencjał kryształu jest niezmienniczy
względem translacji sieci prostej, tę samą cechą powinna się charakteryzować każda
inna wielkość fizyczna, w szczególności gęstość elektronów, lub inaczej gęstość
prawdopodobieństwa znalezienia elektronu wewnątrz kryształu, dana przez
ϕ k* (r ) ⋅ ϕ k (r ) . Powyższe stwierdzenie jest jednym z możliwych sformułowań tzw.
twierdzenia Blocha.
Inne sformułowanie tego twierdzenia mówi, że rozwiązania równania
Schrődingera z potencjałem periodycznym mają postać fal płaskich modulowanych
przez funkcje periodyczne z okresem sieci krystalicznej. Zgodnie z tym przyjmuje się
następującą postać rozwiązań równania (VIII-1):
ϕ k (r ) = h(r ) ⋅ exp[i (kR)]
(VIII-2)
83
gdzie h(r ) jest funkcją periodyczną z okresem sieci prostej, czyli spełniającą warunek
niezmienniczości względem translacji sieci; R: h(r ) = h(r + R ) . Funkcja (VIII-2)
nazywana jest często funkcja Blocha. Przykład funkcji Blocha znajduje się na rysunku
VIII-1.
Rys.VIII-1
Konstrukcja funkcji
Blocha. Odległość
jest w jednostkach
stałych sieci
●
●
●
●
●
położenia atomów
Funkcja periodyczna h(r )
Obwiednia exp(kR)
Funkcja Blocha
84
Łatwo zauważyć, że funkcja taka będzie również niezmiennicza ze względu na
przekształcenia translacji w sieci odwrotnej ( przesunięcie o wektor G )
ϕ k +G (r ) = h(r ) ⋅ exp[i(k + G )R ] = h(r ) ⋅ exp[ikR] ⋅ exp[iGR ] =
h(r ) ⋅ exp[ikR] = ϕ k (r )
(VIII-3)
Skorzystano tu z faktu, że GR = n 2π , gdzie n jest dowolną liczbą całkowitą. Jeśli wektor r
zostanie przedstawiony przy pomocy sumy r = R + ρ , gdzie ρ jest położeniem wewnątrz
komórki elementarnej (patrz Rys VIII-2) to funkcję Blocha (VIII-2) daje się przedstawić
następująco:
ϕ k (r ) = h(ρ) ⋅ exp[−ikρ] ⋅ exp[ikρ] ⋅ exp[ikR] = u k (r ) ⋅ exp[ikr]
(VIII-4)
gdzie funkcja, u k (r ) = u k (ρ) = h(ρ) ⋅ exp[−ikρ] , ponieważ zależy tylko od ρ , jest z definicji
niezmiennicza ze względu na operację translacji. Wzór (VIII-4) jest najczęstszym
przedstawieniem funkcji Blocha.
Rysunek (VIII-2)
Przedstawienie
położenia sieci
krystalicznej,
kwadratami
zaznaczono
poszczególne
komórki
elementarne
r
ρ
R
Bardzo pouczające jest rozpoczęcie analizy elektronowej struktury pasmowej od
granicznego przypadku gdy potencjał krystaliczny jest równy lub bliski zeru. Dla zerowego
potencjału sieci zależność energii elektronów swobodnych od pędu (lub od wektora
falowego) dana jest przez zależność
E (k ) =
η2 k 2
,
2m
(VIII-5)
Dołączenie bardzo małego periodycznego potencjału sieci, nie powinno w istotny sposób
zmienić wartości energii, zmienia jednak w sposób jakościowy typ rozwiązań. Przede
wszystkim pojawienie się potencjału niezmienniczego ze względu na translację sieci prostej
85
powoduje konieczność niezmienniczości rozwiązań równania Schrődingera , ze względu na
translacje sieci odwrotnej.
Rozważmy przykład jednowymiarowej sieci o stałej a . Potencjał krystaliczny V (x)
musi spełniać warunek V ( x) = V ( x + a) . Stała sieci odwrotnej jest równa g =
2π
. Nawet w
a
granicy V ( x) → 0 wszystkie wielkości fizyczne zależne od wektora falowego muszą spełniać
warunek θ (k ) = θ (k + g ) . Dotyczy to również energii. Tak więc E (k ) = E (k + g ) ( patrz rys.
VIII-3).
86
Rys. VII-3. Zależność
energii od wektora
falowego dla
przypadku V(r) → 0.
Wektor falowy
wyrażony jest w
2π
jednostkach g =
a
Równanie Schrődingera dla naszego jednowymiarowego kryształu będzie maiło postać:
− η2 d 2
[
+ V ( x)]ϕ k ( x) = E (k ) ⋅ ϕ k ( x)
2m dx 2
(VIII-6)
Łatwo zauważyć, że każda funkcja w postaci ϕ k = exp[i (k − ng ) x] , gdzie n jest dowolną
liczbą całkowitą jest rozwiązaniem tego równania. Odpowiadająca jej wartość własna energii
jest dana przez wzór:
E (k − ng ) =
η2
(k − ng ) 2
2m
(VIII-7)
Odpowiedni wykres przedstawiający zależność energii od wektora falowego znajduje się na
rysunku (VIII-3). Na rysunku tym przedstawiono wartości własne energii dla
n = ±1,
i
n = ±2 . Łatwo zauważyć, że funkcja typu (VIII-7) reprezentuje wartości
własne równania (VIII-6) dla V (r ) = 0 dla dowolnych n i g. Jest to oczywiste bowiem stały
potencjał V=0 jest niezmienniczy względem dowolnej transformacji.
Powróćmy do krzywych dyspersji ( czyli zależności energii od wektora falowego, E(k)).
Możemy rozważać energię elektronu w układzie strefy rozwiniętej co odpowiada ciągłej linii
na rysunku VIII-3. Tę samą informację o energii uzyskamy gdy analizujemy dyspersję w
87
układzie strefy zredukowanej. Odpowiada to analizie krzywych dyspersji znajdujących w
pierwszej strefie Brillouina. Widzimy , że w pierwszej strefie E(k) nie jest określone
jednoznacznie , jednej wartości wektora falowego odpowiadają dwie wartości energii.
Pojawiły się pasma energetyczne. Zależność dyspersyjna w najniższym paśmie jest dana
przez funkcję E 0 (k ) =
η2 2
g
g
k , gdzie wektor falowy spełnia warunek − < k < . Energia
2m
2
2
elektronów w wyższych pasma dana jest przez E n (k ) =
spełniającego warunek
η2
(k ± ng ) 2 dla wektora k
2m
−g
g
<k< .
2
2
Powyższe rozważania dotyczyły szczególnego przypadku tzw. pustej sieci i miały na
celu pokazanie jak tworzą się pasma energetyczne. Obecnie zajmiemy się przypadkiem
bardziej realnym, gdzie potencjał krystaliczny jest różny od zera.
Pozostańmy nadal przy jednowymiarowym krysztale. Jeśli potencjał V (x) jest
periodyczny z okresem sieci prostej to w jego rozwinięciu w szereg Fouriera występować
będą tylko fale o wektorach falowych G równych wielokrotności stałej sieci odwrotnej
G = ± ng
V ( x) = ∑ U G ⋅ e − iGx
(VIII-8)
G
gdzie U G są współczynnikami rozwinięcia. W najprostszej postaci wystarczy wziąć tylko
jeden wektor G = g =
2π
. Potencjał będzie miał wówczas postać kosinusoidy
a
V ( x) = 2U g cos( gx) = U g {e − igx + e igx }
(VIII-9)
Widać ,że część rzeczywista ma postać kosinusoidy o okresie stałej sieci prostej . W dalszym
ciągu korzystać będziemy z potencjału wyrażonego przez funkcję zespoloną
V ( x) = U g [e − igx + e igx ] Równanie Schrődingera będzie miało postać
(
− η2 d 2
+ U g [e −igx + e igx ]ϕ k ( x) = E (k ) ⋅ ϕ k ( x)
2m dx 2
(VIII-10)
Funkcja Blocha będąca rozwiązaniem powyższego równania dana jest przez relację
ϕ k ( x) = u k ( x)e ikx . Periodyczna funkcja u k (x) daje się rozwinąć w szereg Fouriera. Co
więcej, jeśli potencjał krystaliczny jest dany przez (VIII-9) to przy rozwinięciu funkcji
88
u możemy uwzględnić tylko dwie składowe odpowiadające wektorom sieci odwrotnej 0 i g.
Ostatecznie więc mamy następującą postać funkcji Blocha :
ϕ k ( x) = u k ( x)e ikx = C (k )e ikx + C (k − g )e ikx e −igx
(VIII-11)
Podstawiamy funkcję (VIII-11) do równania (VIII-10) i wykonujemy różniczkowanie ;
η2 2
η2
k C (k )e ikx +
(k − g ) 2 C (k − g )e ikx e −igx + U g [e −igx + e igx ]{C (k )e ikx + C (k − g )e ikx e −igx } =
2m
2m
ikx
E (k ){C (k )e + C (k − g )e ikx e −igx }
(VIII-12)
Aby obliczyć wartości własne energii mnożymy lewostronnie powyższe równanie przez e −ikx
oraz przez e −ikx e igx i wykonujemy całkowanie po x . Korzystając z następującej równości
+∞
∫e
−i ( k − k ') x
dx = δ (k − k ' ) trzymuje się następujący układ równań:
−∞
η2 2
k − E (k )}C (k ) + U g C (k − g ) = 0
2m
η2
U g C (k ) + { (k − g ) 2 − E (k )}C (k − g ) = 0
2m
{
(VIII-13)
Układ ten ma nietrywialne rozwiązania jeśli znika jego wyznacznik. Ostatni warunek
pozwala na obliczenie wartości własnych energii:
{
η2 2
η2
k − E (k )}{ (k − g ) 2 − E (k )} − U g2 = 0
2m
2m
implikuje
η2 2
η2 2
2
{
[k − (k − g ) 2 ]}2 + 4U g2
[k + (k − g ) ]
2m
E ( k ) ± = 2m
±
2
2
(VIII-14)
Otrzymujemy dwa rozwiązania + i - . Wykresy zależności energii od wektora falowego w obu
przypadkach przedstawione są na rysunku VIII-4.
89
Rys (VII-4) Struktura
pasmowa. Wektor falowy k
przedstawiony jest w
jednostkach g
Eg= 2Ug
Łatwo zauważyć ,że gdy k zbliża się do
E(
g
2
g
2
energia przyjmuje odpowiednio wartości
) + = +U g i
g
E ( ) − = −U g . Pojawia się więc przerwa energetyczna, lub inaczej mówiąc pasmo energii
2
wzbronionej o szerokości 2U g .
W rzeczywistych kryształach potencjał krystaliczny nie może być przybliżony przez
pojedynczą sinusoidę, nadal jednak możemy rozwinąć go w szereg Fouriera:
V (r ) = ∑ U G e − iGr
(VIII-15)
G
i użyć funkcji Blocha w postaci analogicznego rozwinięcia :
ϕ k (r ) = ∑ C (k − G )e i (k −G )r
(VIII-16)
G
W rezultacie aby otrzymać wartości własne energii musimy diagonalizować układ równań ,
90
Rys.VII-5. Struktura pasmowa
Si i Ge. Na rysunku mamy
pasma o najniższej energii.
Należy zwrócić uwagę, że
dodatnia i ujemna oś odciętych
który ma wymiar równy ilości wziętych pod uwagę w rozwinięciu (VIII-15) i (VIII-16)
wektorów sieci odwrotnej. Kształt pasm energetycznych będzie bardziej skomplikowany niż
poprzednio. Wyniki obliczeń struktury pasmowej dla kryształów krzemu i germanu
przedstawione są na rysunku VIII-5. Przedstawiono tu najniższe pasma energetyczne.
Pomimo znacznych uproszczeń wiele spośród własności ciała stałego można
wytłumaczyć posługując się modelową strukturą przedstawioną na rysunku VIII-4. Mamy tu
do czynienia z dwoma pasmami energetycznymi. To o niższej energii zwane jest pasmem
walencyjnym , to o wyższej energii pasmem przewodnictwa. Istnienie pomiędzy nimi obszaru
energii wzbronionej ( przerwy energetycznej) decyduje w zasadniczy sposób o wielu
właściwościach, w szczególności o przewodnictwie materiału.
Elektrony jako fermiony zajmują kolejno stany energetyczne, od stanu o najniższej
energii do stanu o energii Fermiego. Jeśli elektronów walencyjnych jest tyle samo ile jest
stanów w paśmie walencyjnym , wówczas pasmo walencyjne zostaje całkowicie zapełnione a
pasmo przewodnictwa jest puste. Co stanie się, jeśli do takiego materiału przyłożymy
zewnętrzne napięcie. Rozpatrzmy elektrony z pasma walencyjnego. Dodatkowy ruch tych
elektronów w kierunku pola powodowałby wzrost ich prędkości , a co za tym idzie wzrost
energii. Nie jest to jednak możliwe bowiem ponad pasmem walencyjnym brak jest wolnych
stanów energetycznych. Z kolei pasmo przewodnictwa jest całkowicie puste. W rezultacie
przyłożone pole nie wywoła ruchu elektronów. Materiał taki nie będzie przewodził prądu.
Tak dzieje się w bardzo niskich temperaturach. W wyższych temperaturach elektrony z
pasma walencyjnego mogą być wzbudzane do pasma przewodnictwa gdzie zachowywać się
będą jak elektrony swobodne i będą mogły przyczyniać się do przewodnictwa.
91
Zależnie od wartości przerwy energetycznej mamy do czynienia z izolatorem lub
półprzewodnikiem. Jeśli E g >> k B T , (w temperaturze pokojowej) , wówczas nawet w
wysokich temperaturach wzbudzana będzie znikoma ilość elektronów i materiał będzie
izolatorem. Jeśli E g ≥ (≤)k B T wówczas mamy do czynienia z półprzewodnikiem. W
praktyce własności półprzewodnikowe mają materiały o przerwie energetycznej mniejszej niż
3 eV. Cechą charakterystyczną półprzewodników jest to ,że ich opór elektryczny maleje
exponencjalnie z temperaturą .
Przewodnictwo typu metalicznego pojawia się gdy pasmo walencyjne jest lub pasmo
przewodnictwa jest częściowo zapełnione przez elektrony. Sytuacja obrazowana jest na
rysunku VIII-6.
Rys VIII-6 Przykłady struktur pasmowej. Stany obsadzone są zacieniowane. a) izolator ( półprzewodnik), b)
metal powstały w wyniku nakładania się pasm, c) metal.
92
η2 2
η2 2
2
{ [k − (k − g ) 2 ]}2 + 4U g2
[k + (k − g ) ]
2m
E ( k ) ± = 2m
±
2
2
(VIII-14)
Rys (VII-4) Struktura
pasmowa. Wektor falowy k
przedstawiony jest w
jednostkach g
93
kryształów krzemu i germanu przedstawione są na rysunku VIII-5. Przedstawiono tu
najniższe pasma energetyczne.
Pomimo znacznych uproszczeń wiele spośród własności ciała stałego można
Eg= 2Ug
Rys.VII-5. Struktura pasmowa
Si i Ge. Na rysunku mamy
pasma o najniższej energii.
Należy zwrócić uwagę, że
dodatnia i ujemna oś odciętych
reprezentują różne kierunki
krystalograficzne Każda
krzywa odpowiada pasmu
energetycznemu.
Oba półprzewodniki są
półprzewodnikami o przerwie
skośnej, tzn. minimum pasma
przewodnictwa znajduje się w
innym punkcie
pierwszej
strefy
wytłumaczyć posługując się częściowo zapełnione przez elektrony.
Sytuacja
obrazowana
Brillouina niż maksimum
jest na rysunku VIII-6.
pasma walencyjnego.
94
Wykład IX. Półprzewodniki samoistne
Jak już wspomniano półprzewodnikami nazywamy materiały ( kryształy) , których
pasmo walencyjne jest całkowicie zapełnione przez elektrony a pasmo przewodnictwa
zupełnie puste. Materiały takie przewodzą prąd tylko pod warunkiem, że uprzednio
wprowadzone zostały do nich elektrony lub dziury.
Półprzewodnikiem samoistnym nazywamy materiał półprzewodnikowy nie zawierający defektów
sieci krystalicznej ani domieszek innych pierwiastków mogących wpływać na własności elektryczne
materiału.
W zasadzie półprzewodnik samoistny powinien być idealnym kryształem. Ze względu jednak na
istnienie niewielkich ilości domieszek innych pierwiastków , których stężenia nie można kontrolować w
procesie otrzymywania półprzewodników oraz istnienie naturalnych defektów sieci krystalicznej praktycznie
nigdy nie mamy do czynienia z idealnie czystym materiałem półprzewodnikowym. Niemniej jednak w wielu
przypadkach, jeśli rozważa się własności elektryczne materiału istnienie śladowych domieszek oraz naturalnych
defektów sieci jest do zaniedbania. Dlatego przyjęto uważać ,że mamy do czynienia z półprzewodnikiem
samoistnym o ile nie by ł on intencjonalnie domieszkowany.
Pojęcie masy efektywnej
Rozważmy dokładniej kształt pasm energetycznych otrzymanych w przybliżeniu prawie
swobodnych elektronów (rys. IX-1).
Rys. IX- 1. Pasma energetyczne.
Liniami przerywanymi
zaznaczono przybliżoną
paraboliczną zależność energii
od wektora falowego.
95
Przypomnijmy, że zależność energii od wektora falowego dana jest przez wzór ( VIII-14).
W półprzewodniku dolne pasmo ( pasmo walencyjne) jest całkowicie zapełnione przez
elektrony a górne ( pasmo przewodnictwa zupełnie puste. Rozważmy pojedynczy elektron
wzbudzony z pasma walencyjnego do pasma przewodnictwa. Aby analizować
przewodnictwo elektryczne materiału należy dokładniej opisać kinetykę elektronu w pasmie
przewodnictwa i kinetykę pozostałych elektronów w pasmie walencyjnym.
Skoncentrujmy się na początku na elektronie w pasmie przewodnictwa pozostawiając
na uboczu sprawę pustego miejsca w pasmie walencyjnym. Do tej pory twierdziliśmy dość
enigmatycznie, że pojedynczy elektron w pasmie będzie elektronem swobodnym. Bardziej
precyzyjny opis otrzymamy analizując jego dyspersję czyli zależność energii od wektora
falowego.
W niskich i normalnych temperaturach elektron będzie znajdował się w stanach w
pobliżu minimum pasma . Zauważamy, że w naszym przykładzie ( nie jest to ogólną regułą)
minimum energii pasma przewodnictwa odpowiada wektorowi falowemu równemu g/2,
czyli znajduje się na granicy pierwszej strefy Brillouina. W tym samym miejscu znajduje się
wierzchołek pasma walencyjnego.
Na marginesie trzeba tu dodać, że sposób wyboru pierwszej strefy Brillouina nie jest
jednoznaczny. Na ogół wybiera się ją jako komórkę Wignera –Seitza. W naszym przypadku
nie musi ona jednak rozciągać się pomiędzy −
g g
i . Jeśli wybierzemy obszar przesunięty
2 2
w prawo lub lewo o połowę wektora sieci odwrotnej g, to nowy obszar w przestrzeni
odwrotnej ( pomiędzy – g i 0 , lub 0 i g ) będzie nową równoważną, pierwszą strefą
Brillouina. Obszar pomiędzy 0 i g przedstawiony jest na rysunku IX-1. Obszar ten będzie
spełniał wszystkie warunki symetrii wymagane od pierwszej strefy Brillouina.
Wprowadźmy wektor falowy q = k −
g
. Po odpowiednim podstawieniu równość
2
(VIII-14) da się przedstawić jako zależność energii od wektora falowego q. Dla pasma
przewodnictwa otrzymujemy:
E (q) + =
≈
η2
2 m0
η2
2m0
2
2
η2 2
g
+
q +
2
2m0
4
η2 2 η2 2
g
q + 4U g2
2m0
2m0
η2 2
η2
g
+
+
+
U
q
(
1
2
g
2
2m0
2m0U g
2
(IX-1)
2
g
2 )
96
gdzie m0 jest masą swobodnego elektronu. Podobna zależność obowiązuje w dolnym
pasmie ( pasmie walencyjnym)
η2
E (q) − =
2m0
≈
2
η2 2
g
+
q −
2
2m0
2
4
η2 2 η2 2
g
q + 4U g2
2 m0
2m0
2
(IX-2)
2
η g
η
η
g
+Ug +
q 2 (1 − 2
)
2 m0 2
2m0
2m0U g 2
2
2
2
Zauważmy , że zarówno w pasmie przewodnictwa , w pobliżu dna pasma, jak i w
pasmie walencyjnym, w pobliżu wierzchołka pasma, energia jest w przybliżeniu kwadratową
funkcja wektora falowego q. Z drugiej strony w przypadku cząstki swobodnej zależność
energii od wektora falowego daje się przedstawić w postaci : E (q) =
η2 2
q . Korzystając z
2m
tej zależności i z relacji (IX-1) i (IX-2) można wprowadzić wielkość, którą nazywamy masą
efektywną nośników w paśmie, zdefiniowaną jako stosunek masy nośnika prądu w
pasmie m do masy swobodnego elektronu m0 . W naszym przypadku będzie to
m *± =
1
η2
(1 ± 2
2mU g
2
g
2 )
(IX-3)
Znak + i – odpowiada odpowiednio pasmu przewodnictwa i walencyjnemu . W realnych
trójwymiarowych kryształach dyspersja elektronów może być różna w różnych kierunkach
krystalograficznych ( w ogólności mamy E (k ) ,czyli energia jest funkcją wektora falowego
a nie jego bezwzględnej wartości ) . Odpowiada to sytuacji , w której wartość masy
efektywnej ( i masy elektronu w pasmie) zależeć będzie od kierunku , w którym porusza
się elektron. Efekt ten opisywany jest przez tensor odwrotności masy efektywnej.
Składowe tego tensora liczy się ze wzoru:
(
1
1 d 2E (q )
) ij = 2
m*
η dqi dq j
(IX-4)
gdzie wskaźniki „i” i „j” odpowiadają kierunkom x, y, z. Zależność dyspersyjna w takim
pasmie dana jest przez relację :
97
E (q) =
η2
2m0
∑∑
i
j
qi q j
mij*
(IX-5)
gdzie wektor q zdefiniowany jest jako q=K-k, a K jest wektorem położenia minimum pasma
przewodnictwa w pierwszej strefie Brillouina.
W przypadku trójwymiarowych kryształów nie potrafimy zobrazować zależności (IX5). Pewne przybliżenie ogólnej sytuacji otrzymuje się, gdy analizuje się przypadek
dwuwymiarowy. Załóżmy, że mamy tensor odwrotności masy efektywnej o następujących
składowych
1
1
1
1
= * = 0 oraz * = 1 i * = 10. Odpowiedni wykres zależności
*
m xx
m xy m yx
m yy
η2
dyspersyjnej dla tego przypadku, E (q) =
2m0
q x2
q y2
* + * przedstawiony jest na rysunku
m xx m yy
(IX-2)
.
98
Rys IX-2
Ze wzoru (IX-3) wynika, że w naszym jednowymiarowym przykładzie masa
efektywna elektronu jest mniejsza od masy elektronu swobodnego . W realnych kryształach
( krzem, german, GaAs i inne ) masy efektywne wynoszą ok. 0.1 masy swobodnego
elektronu.
Pojęcie dziury .
Rozważmy raz jeszcze sytuację jaka powstanie po wzbudzeniu elektronu z pasma
walencyjnego do pasma przewodnictwa. W paśmie walencyjnym pozostanie pusty nie
obsadzony przez elektron stan, którego energia zależy od wektora falowego wzbudzonego
elektronu ( tego , którego już tam nie ma) . Zależność ta opisywana jest wzorem (IX-2).
Takie pasmo z pojedynczym pustym stanem nazywamy dziurą . Przez dziurę
rozumie się wiec puste miejsce po elektronie w całkowicie zapełnionym pasmie
energetycznym.
Istnieje pełna analogia pomiędzy dynamiką elektronów w paśmie przewodnictwa a
dynamiką dziur w paśmie walencyjnym. Wystarczy traktować brak elektronu , czyli dziurę
jak cząstkę o ładunku dodatnim +e i ujemnej masie równej
99
m = m0 ⋅ m * − =
m0
η2
(1 − 2
2mU g
(IX-6)
2
g
2 )
Warto jednak pamiętać, że dziura nie jest realną cząstką tylko pewnym użytecznym sposobem
opisu prawie całkowicie zapełnionego pasma energetycznego i tak naprawdę w paśmie
walencyjnym odbywa się ruch elektronów. Aby sobie to uzmysłowić rozważmy sytuację na
dwa sposoby.
Pierwszy dotyczy realnej przestrzeni. Wygodnie jest posłużyć się tu modelem
ciasnego wiązania, w którym elektrony są przyporządkowane poszczególnym atomom. Brak
elektronu w paśmie walencyjnym odpowiadać będzie zawsze brakowi elektronu w pobliżu
któregoś z atomów. Zewnętrzne pole elektryczne powoduje ,że na każdy elektron będzie
działała siła F = −eε . W rezultacie tego elektron z atomu sąsiadującego z dziurą może się
przesunąć zajmując jej miejsce . Oczywiste , że pozostawi po sobie dziurę, która następnie
może być zajęta przez kolejny elektron . Całe to zdarzenie wygląda tak jakby to dziura
poruszała się pod wpływem siły F = +eε Patrz rysunek IX-3
☻●
☻○
☻●
ε
☻●
☻●
☻●
☻○
☻●
☻●
☻●
Rys IX-3
Przedstawienie ruchu
dziury w przybliżeniu
ciasnego wiązania .
Dziurę – brak
elektronu
Rozważmy teraz „ruch” dziury w przestrzeni pędów. Ze wzoru (IX-6) widać, że masa
efektywna dziury jest ujemna. Stąd dziury mające większy pęd przesuwają się w głąb pasma
walencyjnego. Wydaje się, że jest to równoważne sytuacji kiedy energia kinetyczna dziury
będzie ujemna. Ten ostatni wniosek z kolei jest sprzeczny z ogólną zasadą, że energia
kinetyczna realnych układów powinna być zawsze dodatnia.
Na rysunku IX-4. przedstawiona jest zależność energii od wektora falowego w
pobliżu wierzchołka pasma walencyjnego. Literami A-K zaznaczono stany energetyczne,
które mogą być obsadzane przez elektrony. Jeśli brak jest jednego elektronu w paśmie to bez
przyłożonego zewnętrznego pola elektrycznego nie obsadzony pozostanie tylko stan o
najwyższej energii. ( stan oznaczony literą F, patrz rysunek IX-4 a). Po włączeniu pola
elektrycznego o natężeniu ε x na wszystkie elektrony, znajdujące się w stanach A,B,C,D,E i
100
H,I,J,K zacznie działać siła Fx = −eε x . Wskutek działania tej siły po czasie ∆t każdy
elektron uzyska dodatkowy pęd ∆p x = η∆k x gdzie zmiana wektora falowego dana jest
wzorem ∆k x =
−1
eε x ⋅ ∆t . W rezultacie tych zmian obsadzenie stanów w pasmie zostanie
η
zmienione. Elektron ze stanu K przejdzie do stanu J, elektron ze stanu J przejdzie do stanu I
,itd. Widać, że teraz nie obsadzony pozostanie stan E. Sytuacja przestawiona jest na rysunku
IX-4 b. Sumując zmiany energii wszystkich elektronów zauważymy , że wskutek działania
pola elektrycznego cały układ uzyskał dodatkową energie równą
η2
[∆k x ] 2 , gdzie
2 | mh |
mh = mh* m0 masą dziury Energia ta jest oczywiście dodatnia. Jeśli pole będzie działało przez
kolejny okres czasu równy ∆t nastąpi kolejna zmiana obsadzeń stanów i stanem nie
obsadzonym będzie stan D ( rysunek IX-4 c). Nastąpi kolejny wzrost energii układu
η2
[2∆k x ] 2 . Widać, że o ile pod
elektronów, która teraz będzie miała wartość
2 | mh |
względem kinetyki taki kolektywny ruch elektronów, w kierunku przeciwnym do pola
elektrycznego może być doskonale opisany przez ruch pojedynczej dziury w kierunku
pola, o tyle „ujemna energia dziury” jest w rzeczywistości dodatnią energią kinetyczną
całego układu.,
101
Rys . IX-4 Kinetyka
dziury w pasmie
walencyjnym
ε
ε
Dziury i efekt Halla
Interesującym przyczynkiem do dyskusji na temat czym właściwie jest dziura jest
analiza efektu Halla. Zmiana znaku napięcia Halla w zależności od tego czy nośnikami
prądu są elektrony czy dziury dowodzi do istnienia dodatnich nośników prądu.
Przypomnijmy pokrótce najprostszą teorię zjawiska Halla. Rozważamy materiał w
którym płynie prąd elektryczny. Zakładamy, dla uproszczenia, że płynie on w kierunku x.
Jeśli prostopadle do kierunku przepływu prądu ( powiedzmy w kierunku y) działać będzie
pole magnetyczne o natężeniu Hy (patrz rys. IX-5) to poruszające się w krysztale ładunki ,
niezależnie od ich znaku, odchylane będą w kierunku z. Siła , która jest odpowiedzialna za
ruch ładunków w kierunku z jest siłą Lorentza daną wzorem
1
Fz = q ⋅ υ x ⋅ H y
c
(IX-7)
gdzie c jest prędkością światła w próżεni. Dodatkowe przesunięcie poruszających się
nośników prądu pod wpływem zewnętrznego pola magnetycznego powoduje gromadzenie
102
się ładunków z jednej strony materiału. Pojawia się pole elektryczne, ε z , którego
oddziaływanie będzie równoważyło siłę Lorentza (IX-7). W warunkach równowagi siła
elektryczna jest równa sile magnetycznej, stąd otrzymujemy:
εz =
Fz
1
= q ⋅ υx ⋅ H y
q
c
(IX-8)
Prędkość w kierunku x jest prędkością unoszenia nośników. Wykorzystując model Drude’go
( VII-33) możemy uzależnić ją od zewnętrznego pola elektrycznego wywołującego przepływ
prądu, ε x
υx =
qτε x
m
(IX-9)
We wzorze (IX-9) τ średnim czasem pomiędzy dwoma zderzeniami nośników.
Podstawiając (IX-9) do (IX-8) otrzymujemy :
εz =
qτε x
Hy
mc
(IX-10)
Korzystając następnie z faktu, że ε x =
nośników dana jest wzorem µ =
jx
, gdzie j x jest gęstością prądu a ruchliwość
nqµ
qτ
, otrzymuje się następującą zależność pomiędzy
m
natężeniem pola Halla , ε z , a polem magnetycznym H z ,
εz =
1
τ
jx H y =
jx H y
nµmc
nqc
(IX-11)
W powyższych wzorach n jest gęstością nośników prądu. Stała występująca we wzorze (IX11), R H =
1
τ
=
nosi nazwę stałej Halla. Ponieważ zależy ona od ładunku nośników
nqc nµmc
jest ona dodatnia dla dziur i ujemna dla elektronów. Odpowiada to przeciwnym
polaryzacjom materiału zależnie od tego czy nośnikami prądu są dziury czy elektrony.
Fig IX-5. Pod wpływem pola
elektrycznego ε x elektrony i dziury
poruszają się w przeciwnych
kierunkach . To powoduje , że pole
magnetyczne H y odchylać je będzie
Hz
Fz
_
Fz
+
w tę samą stronę . Dlatego
polaryzacja materiału i pole
elektryczne Halla , ε z będzie miało
w pr ypadku d iur i elektronów
εx
103
υ x (elektron)
υ x (dziura )
104
Wzbudzenie nośników prądu.
Cechą charakterystyczną wszystkich materiałów półprzewodnikowych jest to, że jeśli
nie są domieszkowane to w temperaturze 0 K wszystkie stany w pasmie walencyjnym są
zajęte przez elektrony, zaś wszystkie stany w pasmie przewodnictwa są puste. Wynika stąd,
że w przypadku braku wzbudzenia elektronów półprzewodniki są na ogół dobrymi
izolatorami. Z drugiej strony nawet niewielkie wzbudzenie, polegające na kreacji
swobodnych elektronów w pasmie przewodnictwa i dziur w pasmie walencyjnym powoduje
wzrost ich przewodnictwa o kilka rzędów wielkości. Właściwość ta jest wykorzystywana w
szeregu urządzeniach półprzewodnikowych.
Wspomnieć należy o dwóch podstawowych czynnikach wpływających na obsadzenie
stanów w półprzewodnikach. Pierwszym z nich jest temperatura, drugim promieniowanie
elektromagnetyczne. W warunkach równowagi termodynamicznej termiczna generacja
nośników prądu jest wynikiem zależności funkcji rozkładu Fermiego od temperatury. Proces
ten zostanie omówiony bardziej szczegółowo w następnym paragrafie.
Obecnie skoncentrujmy się na analizie procesu optycznego wzbudzenia par elektrondziura. W wyniku absorpcji fotonu elektron przechodzi do wyższego stanu
energetycznego, w praktyce na ogół przeniesiony zostaje do pasma przewodnictwa,
pozostawiając po sobie dziurę w paśmie walencyjnym. Zjawisko to nosi nazwę zjawiska
fotoelektrycznego wewnętrznego i opisywane jest przez układ równań wynikających z
zasad zachowania energii i pędu.
η2 qe2
η2 q h2
ηΩ = E g +
+
2me* 2 | mh* |
(IX-12)
k f = qe + qh
(IX-13)
We wzorach (IX-12) i (IX-13) Ω jest częstością fotonu a kf jego wektorem falowym.
Zasada zachowania pędu ( równanie (IX-13)) zasługuje na szczególną uwagę. Wektor falowy
fotonu którego wartość bezwzględna równa k f =
Ω
dla światła widzialnego lub bliskiej
c
podczerwieni jest bardzo mały w porównaniu z wektorem sieci odwrotnej. Wobec
powyższego warunek (IX-13) powoduje , że wektory qe i q h różnią się bardzo niewiele. Z
105
drugiej strony qe jak i q h powinny leżeć w pobliżu punktów w przestrzeni odwrotnej
odpowiadającym minimum pasma walencyjnego i wierzchołkowi pasma przewodnictwa.
Warunek ten jest łatwo spełniony gdy minimum pasma przewodnictwa znajduje
się w tym samym miejscu w pierwszej strefie Brillouina co wierzchołek pasma
walencyjnego (patrz rysunek IX-6a). Półprzewodnik taki nazywamy półprzewodnikiem
o przerwie prostej. Prostą przerwę energetyczną posiada wiele materiałów
półprzewodnikowych. Między innymi prostą przerwę ma arsenek galu (GaAs) oraz siarczki
( np. ZnS ), tellurki (np. CdTe) i selenki ( np. ZnSe) .
Wiele materiałów posiada jednak bardziej skomplikowaną strukturę energetyczną,
gdzie minimum pasma przewodnictwa i wierzchołek pasma walencyjnego nie pokrywają się.
Takie materiały to między innymi krzem i german , których pasma energetyczne
przedstawione są na rysunku VIII-5. Do spełnienia zasady zachowania pędu konieczny jest
udział fononu optycznego, który posiadając stosunkowo niewielką energię może być
scharakteryzowany przez dużą wartość pędu. Zasady zachowania opisywane będą teraz przez
równania
ηΩ = E g +
η2 qe2
η2 q h2
+
+ ηω
2me* 2 | mh* |
(IX-14)
k f = q e + q h + K fon
(IX-15)
Gdzie ω jest częstością fononu a Kfon jego wektorem falowym. Mówimy ,że półprzewodniki
tego typu mają przerwę skośną. Zasada w procesie absorpcji fotonu jest przedstawiona na
rysunku IX-6b.
Rys IX. –6 Absorpcja
w półprzewodniku(a)
o przerwie prostej, (b)
o przerwie skośnej.
Wartości wektora
falowego fotonu oraz
wektorów falowych
elektronu i dziury są
znikome w porównaniu
z wektorem ∆K oraz
wektorem falowym
fononu i dlatego
można je pominąć .
a
106
Pasmo
przewodnictwa
ηω
ηΩ ≈ E g
ηΩ + ηω ≈ E g
qe ≈ qh ≈ 0
K fot = ∆K
ηΩ
Pasmo
walencyjne
b
Fakt , że w materiałach o przerwie skośnej absorpcja i emisja fotonu wymaga
dodatkowo udziału fononu optycznego powoduje, że procesy te są znacznie mniej
prawdopodobne niż absorpcja i emisja w materiałach o przerwie prostej. Zjawisko generacji
par elektron -dziura przez fotony ( zjawisko fotoelektryczne wewnętrzne) wykorzystywane
jest w fotoopornikach. Bardziej zaawansowane urządzenia wykorzystujące wewnętrzny efekt
fotoelektryczny to fotodiody i fototranzystory.
Półprzewodnik samoistny w równowadze termodynamicznej – prawo działania mas.
Tak jak i w przypadku metalu w półprzewodniku prawdopodobieństwo ,że dany stan jest
obsadzony przez elektron opisywane jest przez funkcję rozkładu Fermiego.
107
f (E) =
1
(IX-16)
E−µ
+ 1
exp
k
T
B
gdzie µ jest potencjałem chemicznym, który w fizyce półprzewodników nazywany jest
poziomem Fermiego. Nietrudno przewidzieć ,że ponieważ w zerowej temperaturze pasmo
walencyjne jest całkowicie zapełnione a pasmo przewodnictwa zupełnie puste, poziom
Fermiego powinien znajdować się w przerwie energetycznej.
Fig IX-7 Rozkład gęstości
stanów D(E) -krzywe
przerywane i gęstości
obsadzenia, D(E)f(E)- krzywe
ciągłe, w półprzewodniku
samoistnym. Powyżej
przedstawiona jest Funkcja
Fermiego
Poziom
Fermiego
Znając gęstości stanów w pasmie walencyjnym i pasmie przewodnictwa można obliczyć ilość
elektronów i dziur w materiale.
∞
ne =
∫ D (E − E
e
g
) ⋅ f ( E )dE
(IX_17)
Eg
0
nh =
∫D
h
( E ) ⋅ f h ( E )dE
(IX-18)
−∞
Prawdopodobieństwo pojawienia się dziury w pasmie walencyjnym, f h (E ) , jest równe
prawdopodobieństwu , że dany stan jest pusty i wynosi
108
1
f h (E) = 1 − f (E) = 1 −
E−µ
+ 1
exp
k
T
B
=
1
µ−E
+ 1
exp
k
T
B
(IX-19)
Dla typowych półprzewodników przerwa energetyczna wynosi kilka eV. Wobec tego energia
Fermiego leży wystarczająco głęboko w przerwie energetycznej aby, dla temperatur o
wartościach w granicach temperatury pokojowej i niższych, spełniona była relacja
| E − µ |>> k B T . Prowadzi to następujących przybliżonych równości:
µ−E
f ( E ) ≈ exp
k BT
(IX-20)
E−µ
f h ( E ) = exp
k
T
B
(IX-21)
i
Podstawiając (IX-20) i (IX-21) odpowiednio do wzorów (IX-17) i (IX-18) otrzymujemy
µ
ne = e
∞
k BT
∫ D (E − E
e
g
)⋅e
−E
k BT
µ − Eg ∞
dE = e
k BT
nh = e
∫D
h
(E) ⋅ e
e
(IX-22)
dE
0
Eg
−µ 0
k BT
∫ D (E) ⋅ e
−E
k BT
E
k BT
dE
(IX-23)
−∞
Mnożąc stronami równania (IX-22) i (IX-23) otrzymamy
ne nh = e
− Eg ∞
k BT
∫ D (E) ⋅ e
e
−E
k BT
0
dE ⋅ ∫ Dh ( E ) ⋅ e
E
k BT
dE
(IX-24)
−∞
0
Zauważamy, że iloczyn gęstości elektronów i dziur zależy od szerokości przerwy
energetycznej, temperatury i gęstości stanów w pasmach, nie zależy zaś od położenia
poziomu Fermiego .
W półprzewodniku samoistnym ilość elektronów w pasmie przewodnictwa musi być
równa ilości elektronów w pasmie walencyjnym. Wykorzystanie zależności ne = nh ( wzory
IX-22) i (IX-23)) pozwala na obliczenie energii Fermiego. Relacja
0
e
2µ
k BT
Eg
=e
∫D
h
(E) ⋅ e
k BT − ∞
∞
∫ D (E) ⋅ e
e
E
k BT
−E
k BT
dE
(IX-25)
dE
0
prowadzi do następującej zależności :
109
E
0
k BT
∫ Dh ( E ) ⋅ e dE
1
µ = E g + k B T ⋅ ln −∞∞
−E
2
De ( E ) ⋅ e k BT dE
∫0
(IX-26)
Widzimy, że w niskich temperaturach, w półprzewodnikach samoistnych poziom Fermiego
znajduje się w przybliżeniu w połowie przerwy energetycznej.
Obliczanie całek z gęstości stanów w przypadku rzeczywistych półprzewodników jest
sprawą dość skomplikowaną. Na ogół mamy bowiem do czynienia z kilkoma pasmami
przewodnictwa i kilkoma pasmami walencyjnymi. ( Patrz rys. VIII-5). Jednakowosz w wielu
przypadkach , szczególnie w niskich temperaturach możemy uwzględnić tylko jedno
najniższe pasmo przewodnictwa i jedno najwyższe pasmo walencyjne. W przybliżenia masy
efektywnej można przyjąć ,że w pasmach mamy do czynienia z gazem Fermiego elektronów i
dziur, gdzie poszczególne nośniki prądu mają odpowiednie masy me = m0 me* i mh = m0 mh* .
Przy takim założeniu gęstości stanów w pasmach równają się odpowiednio ( aby
wyprowadzić poniższe wzory patrz wyprowadzenie relacji (VII-17))
1 2me
De ( E ) =
2π 2 η2
3/ 2
1 2m h
Dh ( E ) =
2π 2 η2
⋅ E1/ 2
(IX-27)
⋅ | E |1 / 2
(IX-28)
3/ 2
W przypadku elektronów energie liczy się o dna pasma przewodnictwa w kierunku
dodatnich energii, w przypadku dziur od wierzchołka pasma walencyjnego w kierunku
ujemnych energii. Dlatego też dla dziur bierzemy bezwzględną wartość energii. Po
podstawieniu relacji (IX-27) i (IX-28) do równości (IX-22) i (IX-23) otrzymujemy.
m k T
ne = 2 e B2
2πη
µ − Eg
3/ 2
m k T
nh = 2 h B2
2πη
⋅e
3/ 2
⋅e
k BT
(IX-29)
−µ
k BT
(IX-30)
Jeśli korzysta się z przybliżenia masy efektywnej również relacje (IX-24) i (IX-26) ulegną
znacznemu uproszczeniu i będą miały postać:
110
− Eg
3
k T
n e n h = 4 ⋅ B 2 ( me m h ) 3 / 2 ⋅ e k BT
2πη
µ=
(IX-31)
m
1
E g + k B T ⋅ ln h
2
me
(IX-32)
Równanie (IX- 31) nosi nazwę prawa działania mas. Pozwala ono na otrzymanie zależności
koncentracji nośników od temperatury, w półprzewodniku samoistnym
k T
ne = nh = 2 B 2
2πη
− Eg
3/ 2
( me m h )
3/ 4
⋅e
2 k BT
(IX-33)
Widać ,że koncentracja nośników w pasmie zmienia się eksponencjalnie z temperaturą.
Na koniec warto zauważyć , że prawo działania mas ( równanie (IX-25) lub w przybliżonej
postaci równanie (IX-31)) jest zupełnie ogólne i dlatego jest słuszne również w przypadku
półprzewodników domieszkowych.
Zależność przewodnictwa elektrycznego od temperatury.
Korzystając z modelu Drude’go możemy znaleźć policzyć wartość przewodnictwa
właściwego półprzewodników.
σ = [ q e ne µ e + q h n h µ h ] = 2 ⋅ ( q e µ e + q h µ h ) ⋅ ( me m h )
3/ 4
k BT
2
2πη
− Eg
3/ 2
e
2 k BT
( IX-34)
We wzorze (IX-34) przez q oznaczono ładunek ( indeks e- dla elektronu, h- dla dziury ) , µ e
i µ h są ruchliwościami dziur i elektronów. Ruchliwość definiuje się jako stosunek prędkości
przesunięcia w polu elektrycznym do natężenia tego pola. Powinna mieć więc wartość
dodatnią w przypadku dziur i ujemną w przypadku elektronów. Zależność znaku
ruchliwości rodzaju nośników uwzględniano przy wyprowadzeniu stałej Halla. Również
wzór (IX-34) jest poprawny jeśli uwzględni się znaki ruchliwości i ładunków nośników. Na
ogół jednak przy podawaniu wartości liczbowych zaniedbuje się znak i przyjmuje się że
ruchliwość dziur i elektronów ma wartości dodatnie.
111
Ze wzoru (IX-34) widać , że przewodnictwo samoistne silnie rośnie z temperaturą.
Zależność przewodnictwa od temperatury dla modelowego półprzewodnika o przerwie
energetycznej równej 1 eV i równych masach efektywnych elektronów i dziur została
przedstawiona na rysunku IX-8. Wartości przewodnictwa zostały znormalizowane do
wartości w przewodnictwa w temperaturze 300K. Widać ,że w zakresie od 100 (1/T=0.01) do
500K ( 1/T=0.002) wartość przewodnictwa typowego półprzewodnika zmienia się o
kilkadziesiąt rzędów wielkości.
Zmianę przewodnictwa wywołaną przez termiczne wzbudzenie par elektron -dziura
koncentracja nosnikow / przewodnictwo
wykorzystuje się w termistorach i termoopornikach
1E+4
1E+3
1E+2
1E+1
1E+0
1E-1
1E-2
1E-3
1E-4
1E-5
1E-6
1E-7
1E-8
1E-9
1E-10
1E-11
1E-12
1E-13
1E-14
1E-15
1E-16
1E-17
1E-18
Rys. (IX-8). Zależność
przewodnictwa
półprzewodnika
samoistnego od
odwrotności
temperatury. Na
wykresie zaznaczono
temperaturę pokojową
1/300 K
0.002
0.004
0.006
0.008
0.010
1/T (1/K)
Procesy rekombinacji nośników , ekscytony.
Wyobraźmy sobie półprzewodnik samoistny, w którym zostały wzbudzone pary elektron –
dziura. Jeśli pary zostały wzbudzone w procesie absorpcji światła układ taki nie jest w
112
równowadze termodynamicznej. Elektrony i dziury będą traciły swoją energię kinetyczną ,
aż znajdą się odpowiednio na dnie pasma przewodnictwa i na wierzchołku pasma
walencyjnego. Następnie nastąpi proces rekombinacji pary elektron -dziura połączony z
emisją fotonu ( w przypadku półprzewodników o przerwie prostej ) lub fotonu i fononu w
przypadku półprzewodników o przerwie skośnej. Zasada zachowania energii prowadzi do
równań
ηΩ = E g
(IX-35)
dla półprzewodników o przerwie prostej i
ηΩ = E g − ηω
(IX-36)
dla półprzewodników o przerwie skośnej. Ω i ω są częstotliwościami fotonu i fononu. Jak
widać proces emisji jest odwrotny do procesu absorpcji przedstawionego na rysunku IX-6.
W realnym półprzewodniku prawdopodobna jest również rekombinacja
bezpromienista , która odbywa się na powierzchni materiału lub z udziałem naturalnych
defektów sieci krystalicznej. Procesami bezpromienistymi nie będziemy się tu zajmować .
Obserwując fotoluminescencję półprzewodników o przewie prostej zauważono,
że często energia emitowanego fotonu jest nieco mniejsza niż energia przerwy
energetycznej. Spowodowane jest istnieniem stanów związanych elektronów i dziur
tzw. ekscytonów.
Zjawisko ekscytonu wynika z istnienia przyciągania elektrostatycznego pomiędzy
swobodnymi elektronami z pasma przewodnictwa a swobodnymi dziurami z pasma
walencyjnego. Rozważmy problem ekscytonu w sposób klasyczny. Potencjał
elektrostatyczny układu elektronu znajdującego się w położeniu re i dziury w położeniu rh
równa się V (| re − rh |) =
− e2
1
2
r&
. Energia kinetyczna wynosi odpowiednio me&
e +
∈| re − rh |
2
1
2
mh&
r&
h . Dwie kropli nad symbolem oznaczają drugą pochodną po czasie. Całkowita energia
2
układu jest sumą energii kinetycznej i potencjalnej . Możemy wprowadzić nowe zmienne
ρ = re − rh i R = (me re + mh rh ) /(me + mh ) Patrz ( rys (IX-9).
Rys IX-9 Układ elektron -dziura
rh -re
e
re
środek masy
R
113
h
rh
R jest współrzędną środka masy układu dziura elektron. Otrzymamy wówczas:
1
1
e2
1 &
1 2 e2
2
2
2
&
r&
r&
ρ& −
E = mh&
me &
= MR + µ&
h +
e −
2
2
∈| re − rh | 2
2
∈ρ
(IX-37)
gdzie M jest masą całkowitą układu M = me + mh a µ masą efektywną pary elektron dziura
.µ =
me m h
. Pojęcie masy efektywnej jest w tym przypadku użyte znaczeniu
me + m h
mechanicznym jako efektywna masa dwóch cząstek. Jak widać w równaniu (IX-37)
dokonano separacji zmiennych , w związku z czym możemy rozpatrywać oddzielnie energie
kinetyczną
1 &
MR&2 poruszającego się w przestrzeni ekscytonu jako całości i jego energię
2
wewnętrzną
E eksc =
1 2 e2
µρ
.
&
&−
2
∈ρ
(IX- 38)
Przechodząc do opisu kwantowego wprowadzamy następujący hamiltonian ekscytonu
H eksc =
− η2 ∇ 2ρ
2µ
−
e2
∈ρ
(IX-39)
Jak widać układ elektron –dziura w półprzewodniku jest formalnie identyczny z pozytonium
( układ związany elektron-pozyton) . Tak jak i w przypadku pozytonium układ krążących
wokół wspólnego środka masy dziury i elektronu ma stany związane o energiach ( poniższy
wzór otrzymać można w oparciu o kwantyzacje orbitalnego momentu pędu – analogicznie jak
to się robi w modelu atomu wodoru Bohra) :
E eksc = −
1 e4 µ
R µ*
=
−
n 2 2η2 ∈2
n 2 ∈2
(IX-40)
gdzie n jest główną liczbą kwantową. W równaniu (IX-40) wykorzystano zależność, że
µ=
me mh
m*m*
e 4 m0
= m 0 * e h * = m0 µ * . R =
jest stałą Rydberg . µ * jest masą
me + m h
me + m h
2η2
„efektywną efektywną” i mówi nam ile razy masa efektywna pary elektron dziura różni się od
masy efektywnej pozytonium. Wstawiając typowe wartości mas efektywnych nośników prądu
me* = mh* = 0.1 oraz stałej dielektrycznej ∈= 10 otrzymujemy E eksc = R ⋅ 0.005 ≈ 7.5meV . W
realnych półprzewodnikach masa efektywna dziur jest na ogół znacznie większa niż masa
efektywna elektronu , dlatego też energia wiązania ekscytonu również jest większa. Proces
114
rekombinacji pary elektron – dziura z udziałem ekscytonu jest znacznie bardziej
prawdopodobny niż bezpośrednia rekombinacja swobodnych nośników. Przebieg obu
procesów ilustrowany jest na rysunku IX- 10
Pasmo przewodnictwa
Rys .IX-10
Rekombinacja
promienista
swobodnych
nośników oraz
z udziałem
ekscytonu.
Eeksc
hΩ = E g
ηΩ = E g − E eksc
Eg
Pasmo walencyjne
Możemy obliczyć promień ekscytonu. W modelu Bohra będzie on równy promieniowi
pierwszej orbity Bohra układu dziury i elektronu krążących wokół wspólnego środka masy.
W naszym przypadku
a* =
η2 ∈
∈
= a0 *
2
*
e m0 µ
µ
(IX-41)
Dla typowych wartości stałej dielektrycznej i mas nośników w paśmie będzie on równy ok.
100 Å.
Wykład X. Półprzewodniki domieszkowane.
115
Wykres VIII-8 z poprzedniego rozdziału pokazuje jak silnie może zmieniać się
koncentracja nośników a co za tym idzie przewodnictwo półprzewodników od warunków
zewnętrznych ( temperatury). Równie silny efekt uzyskamy jeśli będziemy potrafili
kontrolować koncentrację nośników w pasmach w inny sposób . Przykładem takiego
działania jest intencjonalne domieszkowanie kryształów półprzewodnikowych atomami
innych pierwiastków. Np. przewodnictwo krzemu wzrasta 1000 razy po domieszkowaniu go
borem w stosunku 1 atom boru na 10000 atomów krzemu. Podobnie jest gdy domieszkujemy
krzem fosforem.
Atomy domieszki dostarczają do materiału dodatkowych nośników prądu. Jeśli
nośnikami są elektrony domieszki te nazywamy donorami, jeśli nośnikami są dziury
domieszki nazywamy akceptorami. W obu przypadkach przewodnictwo, jakie wówczas
występuje nazywamy przewodnictwem domieszkowym.
Stany domieszkowe.
Wszystkie półprzewodniki krystaliczne, które tu omawiamy posiadają wiązania
kowalencyjne, w których 8 elektronów przypada na parę ( dwa) atomów tworzących bazę
struktury krystalicznej. Rozważmy przykładowo: Si-Si, Ge-Ge (w obu przypadkach mamy 4
elektrony walencyjne od każdego atomu), Ga-As ( 3 elektrony Ga i 5 elektronów As) , Zn-Se
(2 elektrony od Zn i 6 elektronów od Se) itp. W stanie podstawowym wszystkie 8 elektronów
obsadza poziomy w pasmie walencyjnym, zapełniając je całkowicie. Pasmo przewodnictwa
pozostaje puste.
Wyobraźmy sobie teraz , że atom pierwiastka macierzystego został zastąpiony
atomem posiadającym o jeden elektron walencyjny więcej, np. azot lub fosfor
zastępujący atom krzemu, lub selen zastępujący atom arsenu w GaAs. We wszystkich
tych przypadkach nie ma już wolnych stanów w pasmie walencyjnym wobec czego
dodatkowy elektron powinien znaleźć się w pasmie przewodnictwa. Przewodnictwo, z
którym wówczas mamy do czynienia nazywa się przewodnictwem elektronowym ( lub
typu n) a sam półprzewodnik półprzewodnikiem typu n . Domieszki tego dostarczające
elektrony nazywamy donorami
Co stanie się gdy atom macierzysty zostaje zastąpiony przez atom pierwiastka ,
posiadającego mniej elektronów walencyjnych, np. bor i glin w krzemie, kadm
zastępujący gal w GaAs. Brak elektronu w wiązaniu krystalicznym atomu domieszki z
pozostałymi atomami sieci powoduje pojawienie się dziury w pasmie walencyjnym.
Przewodnictwo , z którym mamy tu do czynienia nazywamy przewodnictwem
116
dziurowym lub przewodnictwem typu p a sam półprzewodnik półprzewodnikiem typu
p. Domieszki dostarczające dziur nazywamy akceptorami.
Rozważmy dokładniej kinetykę dodatkowych nośników prądu. Elektron, dla którego
nie ma wolnego stanu w pasmie walencyjnym powinien znaleźć się w pasmie przewodnictwa.
W przestrzeni rzeczywistej może znajdować się więc w dowolnym miejscu w sieci.
Zauważmy jednak, że po utracie jednego elektronu atom donora będzie miał nie
skompensowany dodatni ładunek równy +e. W konsekwencji pojawi się siła przyciągająca
pomiędzy donorem i swobodnym elektronem. Do opisu takiego układu ( donor + swobodny
elektron) możemy użyć przybliżenia masy efektywnej, gdzie elektron traktowany jest jak
cząstka swobodna o masie me = me* ⋅ m0 i ładunku -e . Energia kinetyczna elektronu będzie
η2 2
η2 2
wówczas równa
k lub
∇ , potencjał donora jest równy odpowiednio
2me
2me
V (r ) =
− e2
∈r
, gdzie ∈ jest stałą dielektryczną materiału półprzewodnika. Zauważamy od
razu ,że mamy tu do czynienia z problemem analogicznym do problemu atomu wodoru .
Możemy użyć modelu Bohra lub bardziej ogólnego modelu kwantowego. W obu przypadkach
otrzymujemy następujące wartości energii stanów stacjonarnych układu.
En = −
R me*
1 e 4 m0 me*
R*
=
−
=
−
n 2 2η2 ∈2
n 2 ∈2
n2
(IX-1)
W powyższym wzorze R jest stałą Rydberga. Dla wygody wprowadzono pojęcie stałej
me*
efektywnego Rydberga R = R 2 . Ważnym parametrem jest promień Bohra , czyli promień
∈
*
orbity elektronu w stanie podstawowym
η2 ∈
∈
a = 2
= a0 *
*
e m 0 me
me
*
(IX-2)
Z powyższych rozważań wynika ,że wprowadzenie domieszek donorowych powoduje
pojawienie się dodatkowych stanów w przerwie energetycznej, których energie liczone od
dna pasma przewodnictwa dane są wzorem ( IX-1) . Parametrem , który określa głębokość
tych stanów jest Rydberg efektywny. Dla typowych półprzewodników , dla których masa
efektywna jest równa 0.1 m0 , zaś stała dielektryczna jest równa ok. 10, stała Rydberga
wynosi R=13.6 eV. Korzystając z (IX-1) otrzymamy R*=13.6meV. Jest to energia na tyle
niewielka, że w temperaturze pokojowej większość donorów będzie zjonizowana. Nie mniej
117
jednak w bardzo niskich temperaturach elektrony są związane z poszczególnymi donorami,
zajmując obszar przestrzeni o promieniu równym a * . Dla danych wartości masy efektywnej
i stałej dielektrycznej efektywny promień Bohra wynosi a * = 52.9 Å., czyli obejmuje wiele
stałych sieci krystalicznej.
Przypadek akceptorów jest prawie całkowicie symetryczny. W modelu prawie
swobodnych elektronów dziura znajdująca się w pasmie walencyjnym nie jest związana z
żadnym konkretnym atomem. Jeśli dziura nie znajduje się blisko akceptora to jon akceptora
ma efektywny ładunek równy –e. W rezultacie identycznie jak w przypadku elektronu i
donora pojawia się siła przyciągająca pomiędzy dziurą i akceptorem. To oddziaływanie
odpowiedzialne jest za pojawienie się stanów akceptorowych w przerwie energetycznej
powyżej wierzchołka pasma walencyjnego. Ich energie liczymy identyczne jak przypadku
donorów. O trzymujemy wartości energii
R mh* R *
1 e 4 m0 mh*
En = 2
=
= 2
n 2η2 ∈2 n 2 ∈2
n
(IX-3)
Energie są dodatnie ponieważ stany leżą powyżej wierzchołka pasma walencyjnego.
mh*
Podobnie jak poprzednio wprowadza się stałą efektywnego Rydberga R = R 2 . Ważnym
∈
*
parametrem jest promień Bohra , czyli promień orbity dziury w stanie podstawowym
a* =
η2 ∈
∈
= a0 *
2
*
e m0 m h
mh
(IX-3)
W obu przypadkach wprowadzenie domieszek powoduje pojawienie się dodatkowych
nośników ale i dodatkowych stanów w przerwie energetycznej. Schematycznie struktura
energetyczna przedstawiona jest na rysunku (IX-1)
Pasmo przewodnictwa
Stany donorowe
Ed
Eg
Stany akceptorowe
Ea
Pasmo walencyjne
118
Rys. IX-1 Struktura
pasmowa
obsadzone przez
elektrony jest pasmo
walencyjne
Położenie poziomu Fermiego w półprzewodnikach domieszkowych.
Niezależnie od tego skąd się tam wzięły liczba elektronów w pasmie przewodnictwa, ne , i
liczba dziur pasmie walencyjnym, nh dane są przez przybliżone wzory (VIII-29) i (VIII-30).
Relacje te są więc również prawdziwe w przypadku półprzewodników domieszkowanych .
Rozważmy półprzewodnik, w którym znajdują się donory i akceptory o
koncentracjach odpowiednio N d i N a oraz energiach liczonych względem dna pasma
przewodnictwa i wierzchołka pasma walencyjnego równych odpowiednio E d i E a . Liczbę
elektronów w pasmie przewodnictwa i dziur w pasmie walencyjnym możemy policzyć
następująco:
ne = N d+ + ne1
(IX-4)
nh = N a− + n1h
(IX-5)
W powyższych wzorach N d+ i N a− są odpowiednio liczbami zjonizowanych donorów i
akceptorów. ne1 i n1h są liczbami nośników mniejszościowych. Nośniki te genrowane są w
procesach termicznej kreacji par elektron -dziura. Nazwa mniejszościowe pojawia się aby
odróżnić je od nośników dostarczanych przez domieszki zwanych nośnikami
większościowymi . Zasada zachowania ładunku wymaga aby ne1 = n1h . Powyższa relacja
prowadzą do równania
ne − N
+
d
= nh − N
−
a
(IX-6)
Liczbę zjonizowanych donorów i akceptorów można wyznaczyć biorąc pod uwagę, że
obsadzenie stanów donorowych i akceptorowych dane jest przez statystykę Fermiego.
N
N d+ = N d ⋅ (1 − f ( E g − E d )) =
d
− ( E g − Ed − µ )
1+ e
(IX-7)
k BT
119
Na
N a− = N a f ( E a ) =
1+ e
(IX-8)
Ea − µ
k BT
Podstawiając relacje (IX-7), (iX-8) oraz (VIII-29) i (VIII-30) do równania (IX-6)
otrzymujemy wyrażenie , z którego można obliczyć energię Fermiego, µ . W ogólnym
przypadku ma ono mało czytelną postać:
m k T
2 e B2
2πη
µ − Eg
3/ 2
⋅e
Nd
−
k BT
− ( E g − Ed − µ )
1+ e
k BT
m k T
= 2 h B2
2πη
3/ 2
⋅e
−µ
k BT
−
Na
1+ e
(IX-9)
Ea − µ
k BT
Można przyjrzeć się bliżej dwóm granicznym przypadkom, półprzewodnika typu n,
domieszkowanego donorami i półprzewodnika typu p domieszkowanego akceptorami. W
przypadku półprzewodnika typu n możemy założyć , że liczba akceptorów równa się zeru.
Równanie (IX-9) przyjmie postać:
m k T
2 e B2
2πη
µ − Eg
3/ 2
⋅e
k BT
m k T
− 2 h B2
2πη
3/ 2
⋅e
−µ
k BT
N
=
d
− ( E g − Ed − µ )
1+ e
(IX-10)
k BT
Równanie to ma rozwiązanie tylko wówczas gdy poziom Fermiego leży w pobliżu dna pasma
przewodnictwa. Można pominąć drugi składnik po lewej stronie równania ( IX-10).
Otrzymuje się wówczas
m k T
2 e B2
2πη
( E g − Ed − µ )
µ − Eg
3/ 2
⋅e
Nd
=
k BT
− ( E g − Ed − µ )
1+ e
k BT
=
k BT
Nd e
( E g − Ed − µ )
1+ e
k BT
(IX-11)
lub
m k T
2 e B2
2πη
3/ 2
⋅e
2
µ −Eg
k BT
− Ed
=
1
N d e k BT
2
Drugie równanie otrzymano zakładając, że dla odpowiednio wysokich temperatur można
przyjąć
( E g − Ed − µ )
k BT
≈ 0
. Uproszczenie to nie jest niezbędne gdy analizuje się ilość elektronów w
pasmie przewodnictwa, wygodnie jest jednak stosować ponieważ prowadzi go prostego
analitycznego wyrażenia na energię Fermiego.
120
µ − Eg
⋅e
k BT
Nd
=
3/ 2
4 me k B T
2
2πη
1/ 2
e
− Ed
2 k BT
(IX-12)
Nd
k BT
1
ln
µ = E g − Ed +
3/ 2
2
2
4 me k B T
2
2πη
(IX-13)
Z równania (IX-13) widać, że w niskiej temperaturze energia Fermiego znajduję się mniej
więcej w połowie pomiędzy dnem pasma przewodnictwa a poziomem donorowym.
Wykorzystując równania (IX-11) otrzymujemy następujący wzór na koncentrację elektronów
w pasmie przewodnictwa
ne = N
1/ 2
d
me k B T
2
2πη
3/ 4
⋅e
− Ed
2 k BT
(IX-14)
Jak widać ilość elektronów w pasmie przewodnictwa jest proporcjonalna do pierwiastka
kwadratowego z ilości donorów.
Przeprowadzając podobne rachunki można obliczyć położenie poziomu Fermiego w
półprzewodniku typu p oraz odpowiednio koncentrację dziur. Odpowiednie zależności będą
dane przez wzory.
nh = N
1/ 2
h
mh k B T
2
2πη
3/ 4
⋅e
− Ea
2 k BT
(IX-15)
oraz
Na
k BT
1
ln
µ = Ea −
3/ 2
2
2
4 ma k B T
2
2πη
(IX-16)
Złącze p-n.
121
Znajomość położenia energii Fermiego w pasmie wzbronionym w półprzewodnikach typu p i
typu n pozwala lepiej zrozumieć działanie złącza półprzewodnikowego. Jak pokazano
poziom Fermiego w półprzewodniku typu n leży w pobliżu pasma przewodnictwa, a w
półprzewodniku typu p w pobliżu pasma walencyjnego. Jeżeli połączymy ze sobą oba
półprzewodniki energię Fermiego powinny się wyrównać. Powoduje to dyfuzję elektronów
z półprzewodnika typu n do półprzewodnika typu p, i dziur z półprzewodnika typ p do
półprzewodnika typu n. W wyniku tego powstaje tzw. potencjał zaporowy Półprzewodnik
typu p będzie miał ładunek ujemny a półprzewodnik typu n ładunek dodatni . Pojawienie się
potencjału zaporowego zobrazowane jest przez odpowiednie wygięcie pasm. (patrz rys IX-2
a).
Przy polaryzacji złącza (+) do n a (-) do p potencjał ten powiększa się i prąd
nośników większościowych nie płynie (patrz rys IX-2 b). Taka polaryzacja nazywa się
polaryzacją zaporową. Łatwo zauważamy , że przez złącze spolaryzowane w kierunku
zaporowym płynie prąd nośników mniejszościowych.
Jeśli spolaryzuje się złącze kierunku przeciwnym ( -) do n (+) do p wówczas bariera
potencjału ulegnie obniżeniu i zacznie płynąć prąd nośników większościowych ( patrz Rys.
IX-2. c) .
Fig IX.-2 a Złącze niespolaryzowane
p
●
n
●
●
●●●●●●●●●●●●
○○○○○○○○○○○○○○○
○
obszar przejściowy
122
○
○
Fig IX b złącze spolaryzowane zaporowo napięciem U1
p
●
n
●
●
○○○○○○○○○○○○○○○
●●●●●●●●●●●●
○
○
○
Fig IX 2. c Złącze spolaryzowane w kierunku przewodzenia napięciem U2
p
●
n
●
●
●●●●●●●●●●●●
○○○○○○○○○○○○○○○
U2
○
123
○
○
U1
Wykład XI. Nadprzewodnictwo.
Podstawowe definicje
Zjawisko znikania oporu elektrycznego rtęci w temperaturze kilku kelwinów zostało
zaobserwowane po raz pierwszy w 1911 roku przez Kamerlingh’a Onnes’a . Później
obserwowano to zjawisko w wielu innych metalach oraz ich stopach, a w latach
osiemdziesiątych w szeregu materiałach niemetalicznych , głównie tlenkach ziem rzadkich
domieszkowanych metalami. Co ciekawe materiały te w warunkach normalnych bardzo
słabo przewodziły prąd elektryczny , zaś zanik oporu elektrycznego występuje w nich już w
stosunkowo wysokich temperaturach kilkudziesięciu kelwinów.
Okazuje się , że w niskich temperaturach oprócz znikania oporu elektrycznego
pojawia się szereg innych ciekawych właściwości ciał, zaś przejście od stanu normalnego do
stanu nadprzewodzącego ma wszelkie cechy przejścia fazowego. Prowadzi to bezpośrednio
do wniosku , że mamy tu do czynienia ze specyficznym stanem układu zwanym stanem
nadprzewodzącym. W stanie nadprzewodzącym substancja posiada następujące cechy:
1. Opór elektryczny równy jest zeru.
2. Materiał staje się doskonałym diamagnetykiem .
Określa się temperaturę krytyczną i krytyczne pole magnetyczne, które to parametry
odpowiadają przejściu fazowemu pomiędzy stanem normalnym a stanem nadprzewodzącym.
Oznacza to ,że normalny przewodnik przechodzi do stanu nadprzewodzącego jeśli obniżymy
jego temperaturę poniżej temperatury krytycznej, Tc, Wartość temperatury krytycznej zależy
od natężenia zewnętrznego pola magnetycznego ( Hc ) i jest maksymalna w nieobecności
pola. Przykładowy diagram fazowy przedstawiony jest na rysunku XI-1a. Widać, że dla
temperatur wyższych od temperatury krytycznej nadprzewodnik przechodzi do stanu
normalnego. Równie ważny jest fakt , że wzrost zewnętrznego pola magnetycznego także
powoduje przejście do stanu normalnego. Wartość krytycznego natężenia pola
magnetycznego jest skorelowana z wartością temperatury krytycznej. Im niższe pole
magnetyczne tym wyższa temperatura krytyczna i na odwrót im wyższa temperatura
krytyczna tym niższe natężanie pola krytycznego. Podobny wykres fazowy otrzymuję się gdy
zamiast pola magnetycznego analizujemy prąd płynący w nadprzewodniku. Jeśli prąd
124
wzrośnie powyżej wartości krytycznej , zależnej od temperatury nadprzewodnik przechodzi
do stanu normalnego ( patrz diagram XI-b).
Powróćmy do własności magnetycznych nadprzewodnika. Doskonały diamagnetyzm
stanu nadprzewodzącego zastał odkryty przez Meissnera i Oshenfelda. Zjawisko to nosi
nazwę efektu Meissnera – Oshenfelda. Zgodnie z definicją namagnesowanie doskonałego
diamagnetyku kompensuje całkowicie zewnętrzne pole magnetyczne, jest więc równe
M = −H
(XI-1)
gdzie H jest natężeniem zewnętrznego pola magnetycznego. Odpowiada to zerowej indukcji
magnetycznej wewnątrz materiału.
B = µ 0 (M + H ) = 0
(XI-2)
We wzorze (XI-2) µ 0 jest przenikalnością magnetyczną próżni. Siły działające na
diamagnetyk umieszczony w polu magnetycznym , kierują go do obszaru o najniższym
natężeniu pola. Efekt ten często wykorzystywany jest w demonstracjach nadprzewodnictwa
wysokotemperaturowego , gdzie pokazuje się jak po oziębieniu nadprzewodnik lewituje w
polu magnetycznym. Można zmierzyć namagnesowanie w funkcji indukcji magnetycznej B.
Dla materiałów , które są niemagnetyczne w stanie normalnym odpowiednie wykresy
przedstawione są na rysunkach XI-2 a i b.
b zależność
prądu
krytycznego od
temperatury. Na
diagramach
zakreskowano
obszar , który
odpowiada
stanowi
nadprzewodnictw
a
1000
Stan
a
normalny
H (Gs)
500
Stan nadprzewodzący
0
4
8
T (K)
Stan
normalny
Prąd
Rysunek XI-1 a
Zależność natężenia
krytycznego pola
magnetycznego od
temperatury
Stan nadprzewodzący
125
b
0
4
8
T (K)
Materiał niemagnetyczny ( doskonały paramagnetyk ) to taki w którym, w stanie normalnym
namagnesowanie jest równe zeru . Rozważmy rysunek( XI-2.a). Począwszy od zera aż do wartości krytycznej
namagnesowanie rośnie wprost proporcjonalnie do wartości indukcji magnetycznej. Jeśli indukcja
wzrośnie powyżej wartości krytycznej materiał ten przechodzi natychmiast ze stanu nadprzewodzącego
do stanu normalnego. Nie istnieje w tym przypadku stan mieszany. Materiał mający taką cechę
nazywamy nadprzewodnikiem I rodzaju .
Na rysunku XI-2 b przedstawiony jest wykres zależności namagnesowania od indukcji dla innego typu
nadprzewodnika . Widzimy, że namagnesowanie początkowo rośnie tak jak poprzednio aż do wartości Bkr1
, następnie zaczyna maleć i osiąga wartość zerową, co odpowiada przejściu do stanu normalnego, po
przekroczeniu przez indukcję wartości Bkr2. W zakresie indukcji pomiędzy Bkr1 i Bkr2 mamy do czynienia
ze stanem mieszanym, w którym pewna objętość materiału jest nadprzewodząca a pewna znajduje się już
w stanie normalnym. Materiał taki nazywamy nadprzewodnikiem II rodzaju.
126
a
Namagnesowanie –
Rys XI-2 zależność
namagnesowania od pola
magnetycznego dla
nadprzewodnika pierwszego
rodzaju (a) i drugiego
rodzaju (b). W przypadku
nadprzewodnika pierwszego
rodzaju istnieje tylko jedna
wartość pola krytycznego.
W przypadku
nadprzewodnika drugiego
rodzaju istnieją dwie
wartości pola krytycznego
Namagnesowanie –
Bkr
b
Bkr1
Bkr2
Równania Londonów
Spróbujmy rozważyć jakie są konsekwencje zerowej oporności elektrycznej materiału
i jakie wymagania muszą być spełnione aby materiał był idealnym diamagnetykiem. Do
analizy oporności można posłużyć się modelem Drude’go, w którym ruch elektronów
wymuszany przez zewnętrzne pole elektryczne opisuje się równaniem:
m
∂υ m
+ υ u = eε
∂t τ
(XI-3)
gdzie υ ,υ u ,τ są odpowiednio prędkością średnią elektronów, prędkością unoszenia i
średnim czasem pomiędzy dwoma rozproszeniami ( zderzeniami z defektami sieci ,fononami ,
innymi elektronami , itp) pojedynczego elektronu .Przypomnijmy, że w przypadku
klasycznego przewodnictwa średnia prędkość elektronu nie ulega zmianie, stąd pierwszy
człon z lewej strony równania (XI-3) znika, zaś prąd elektryczny pojawia się ponieważ
elektrony poruszają się z prędkością unoszenia. W konsekwencji otrzymuje się
127
następujące wyrażenie na oporność właściwą przewodnika, ρ =
m
e 2τn
, gdzie n jest ilością
elektronów. Zgodnie z tym wzorem w przewodniku o zerowej oporności średni czas
pomiędzy zderzeniami elektronów powinien być nieskończony. Elektrony nie będą więc
rozpraszane. Pomijając dyskusję o przyczynach tak niezwykłego zjawiska ograniczymy
się do stwierdzenia ,że brak rozpraszania prowadzić musi do znikania drugiego członu
równania (XI-3). Będzie miało ono teraz postać:
m
∂υ
= eε
∂t
(XI-4)
Korzystając z definicji gęstości prądu ,
j = neυ
(XI-5)
otrzymujemy równanie opisujące prąd w nadprzewodniku ,
∂j e 2 n
=
ε
∂t
m
(XI-6)
Widać , że w nadprzewodniku nie jest spełnione prawo Ohma. Stałe pole elektryczne nie
powoduje przepływu stałego prądu . Prąd rośnie w czasie w miarę jak wzrasta średnia
prędkość elektronów. Równanie (XI-6) jest jednym z dwóch równań Londonów. Drugie
równanie Londonów opisuje oddziaływanie prądu nadprzewodnictwa z polem
magnetycznym. Podstawiając równanie (XI-6) do równania Maxwella
rotε = −
∂B
∂t
(XI-7)
otrzymujemy
∂ m
2 rotj + B = 0
∂t ne
(XI-8)
Szczególne rozwiązanie tego równania można otrzymać przy założeniu, że
rotj = −
ne 2
B
m
(XI-9)
Równanie (XI-9) jest właśnie drugim równaniem Londonów.
Z równania (XI-9) wynikają własności diamagnetyczne nadprzewodnika. Przyjrzyjmy się
rozkładowi pola magnetycznego w nadprzewodniku nieco dokładniej. Kombinując równania
(XI-6) , (XI-9) oraz równanie Maxwella
rotB = µ 0 j
(XI-10)
otrzymujemy następujące równoważne układy równań
128
ne 2
B
m
ne 2
j
rotrotj = − µ 0
m
rotrotB = − µ 0
(XI-11)
lub
ne 2
B
− ∇ B = −µ 0
m
ne 2
− ∇ 2 j = −µ 0
j
m
2
(XI-12)
Rozwiązania układu równań (XI-12) wygodnie jest dyskutować dla prostego przypadku gdy
granica pomiędzy nadprzewodnikiem i próżnią przebiegaj w płaszczyźnie xy oraz gdy pole
magnetyczne skierowane jest wzdłuż osi x. Patrz Rysunek XI-3 . Aby otrzymać układ
równań skorzystano z faktu, że dla pól bezźródłowych rot ⋅ rotB = −∇ 2 B
129
Bx
X
próżnia
nadprzewodnik
y
Rys. XI. 3 .
półnieskończony
nadprzewodnik
rozciągający się w
kierunku z>0 w polu
magnetycznym
z
Zgodnie z równaniem (XI-9) wewnętrzne pole magnetyczne będzie indukowało gęstość prądu
płynącego w kierunku y. Równia (XI-12) będą miały postać
ne 2
∂2
Bx = −µ 0
Bx
m
∂z 2
∂2
ne 2
j
=
−
µ
jy
y
0
m
∂z 2
(XI-13)
Równania (XI-13) mają rozwiązania, które opisują zanik prądu nadprzewodzącego i indukcji
magnetycznej wewnątrz nadprzewodnika.
µ 0 ne 2
⋅ z
B x ( z ) = B x (0) ⋅ exp −
m
(XI-14)
µ 0 ne 2
⋅ z
j y ( z ) = j y (0) ⋅ exp −
m
Widać, że zarówno indukcja jak i prąd nadprzewodzący znika eksponencjalnie wewnątrz
nadprzewodnika. Proces ten opisuje ilościowo charakterystyczna głębokość wnikania
m
= Λ . Dla nadprzewodników metalicznych głębokość wnikania jest równa kilkaset
µ 0 ne 2
Å.
Należy zwrócić uwagę, że zerowa oporność elektryczna nie jest warunkiem
dostatecznym na to aby materiał był idealnym diamagnetykiem. Z równań Maxwella wynika
tylko równanie (XI-8), które mówi, że jeśli opór elektryczny jest równy zeru to prądy
elektryczne i indukcja magnetyczna nie zmieniają się w czasie. W szczególności suma w
nawiasie w równaniu (XI-8) nie musi być równa zeru. W takim materiale pole magnetyczne
130
i indukowany przez nie prąd nadprzewodzący są niezerowe w całej objętości próbki. Ma to
istotne konsekwencje w przypadku, gdy oziębiamy materiał do temperatury niższej niż
temperatura krytyczna w obecności pola magnetycznego. Jeśli po takim oziębieniu
idealnego przewodnika wyłączylibyśmy zewnętrzne pole magnetyczne to zanik pola
zewnętrznego musiały spowodować pojawienie się magnetyzacji materiału. Zjawiska tego
nie obserwuje się w realnych nadprzewodnikach.
Zachowanie się przewodnika o zerowej
temperaturze i nadprzewodnika w polu magnetycznym przedstawione jest na rysunku( XI-4)
Fig XI-
Opis zjawiska nadprzewodnictwa przedstawiony w tym paragrafie ma charakter fenomenologiczny i
nie wyjaśnia dlaczego niektóre materiały w niskich temperaturach mogą przejść do stanu nadprzewodzącego.
W zasadzie w chwili obecnej nie ma spójnego modelu mogącego wyjaśnić nadprzewodnictwo metali oraz
131
zjawisko nadprzewodnictwa wysokotemperaturowego występującego w nie przewodzących w normalnych
warunkach, w związkach ziem rzadkich.
Znaczącym krokiem w zrozumieniu zjawiska nadprzewodnictwa jest koncepcja par Coopera i teoria
Bardeena Coopera i Schriffera (BCS). Jeśli przyjąć, że opór elektryczny materiału związany jest z
rozpraszaniem elektronów, a brak oporu elektrycznego wynika z możliwości całkowicie swobodnego ruchu
nośników prądu, wyjaśniając fenomen nadprzewodnictwa należy szukać zjawisk, które eliminowałyby lub
ograniczały możliwość rozproszeń pojedynczych elektronów .
Mikroskopowy model nadprzewodnictwa. Pary Coopera
W normalnych warunkach, w temperaturze 0K, gaz elektronów swobodnych opisywany jest przez
model Fermiego, w którym elektrony zajmują wszystkie stany energetyczne leżące poniżej poziomu Fermiego.
Frölich , a później Cooper wykazali, że w niskich temperaturach gaz elektronów Fermiego nie jest stanem, w
którym układ elektronów swobodnych w ciele stałym ma minimum energii. Okazuje się, że w sieci
krystalicznej istnieje słabe oddziaływanie przyciągające pomiędzy elektronami, które obniża energię układu
elektronów swobodnych. Oddziaływanie to wynika z faktu ,że pole elektryczne ładunku elektronu polaryzuje
sieć krystaliczną. Wytworzony w ten sposób zespół dipoli elektrycznych, związanych z jonami ( atomami ) sieci
wytwarza potencjał, który przez pozostałe elektrony „odczuwany” będzie jako potencjał przyciągający.
Na ogół rozważa się dwa oddziaływujące ze sobą elektrony. Obiekt taki nazywany jest parą
Coopera. Zgodnie z regułami mechaniki kwantowej energię pary Coopera można obliczyć rozwiązując
następujące równanie Schrödingera.
− η2 ∇12 − η2 ∇ 22
η2 k12 η2 k 22
ϕ
(
r
,
r
)
(
r
,
r
)
ϕ
(
r
,
r
)
⋅
+
⋅
=
∆
+
+
+
V
E
1
2
1
2
1
2
⋅ ϕ (r1 , r2 )
2m
2m
2m
2m
(XI-
15)
gdzie ϕ (r1 , r2 ) =
∑ g (k
k 1k 2
1
, k 2 )ϕ k 1k 2 (r1 , r2 ) jest dwuelektronową funkcją falową ,zaś
ϕ k k (r1 , r2 ) , jest dwuelektronową funkcją Blocha, którą można przedstawić przy pomocy
1 2
iloczynu funkcji jednoelektronowych ( w przypadku modelu swobodnych elektronów będą to
odpowiednie fale płaskie, zaś stałe g (k 1 , k 2 ) są współczynnikami rozwinięcia. V (r1 , r2 ) jest
potencjałem oddziaływania pomiędzy elektronami. Dokładna analiza oddziaływania
elektronu z siecią krystaliczną, która tu nie zostanie przedstawiona, pozwala stwierdzić, że
wystarczy uwzględniać tylko oddziaływanie pomiędzy elektronami o energiach bliskich
energii Fermiego. Dokładnie, energie elektronów spełniać muszą warunki
EF <
η2 k12 η2 k 22
,
< E F + ηω D
2m 2m
(XI-16)
132
gdzie ηω D jest energią Debye’a . Co więcej możemy uwzględniać tylko pary, których pędy
są przeciwne czyli takie ,że k 1 = −k 2 . Dla nich potencjał oddziaływania przybliżony jest
przez stałą wartość, -V0 . Dla pozostałych par elektronów potencjał przyciągający jest równy
zeru. Nie wchodząc w szczegóły obliczeniowe podamy przybliżoną wartość energii o którą
obniży się energia pary Coopera względem energii dwóch swobodnych elektronów na
powierzchni Fermiego, ∆E
−1
∆E ≈ −2 ηω D exp
V 0 Z (k F )
(XI-17)
gdzie Z (k F ) jest powierzchniową gęstością stanów na powierzchni Fermiego. Dla
przybliżenia swobodnych elektronów:
Z (k F ) =
mk F
2π 2 η2
(XI-18)
gdzie kF jest wektorem Fermiego.
Ujemna energia pary Coopera powoduje, że w niskich temperaturach łączenie się
elektronów w takie pary jest korzystne energetycznie.
Jeśli rozpatruje się parę Coopera jako jedna cząstkę zauważamy, że obiekt taki ma spin będący sumą
lub różnicą spinów elektronów, czyli mają wartość 1 lub 0 ( w rzeczywistości spotyka się tylko pary o spinie
zerowym). W obu jednak przypadkach para jest się bozonem, podlega więc statystyce Bosego. Oznacza to, że
nieskończenie wiele par może znajdować się w jednym stanie energetycznym.
Stan podstawowy „gazu” par Coopera. Teoria BCS
Energia wyrażona wzorem (XI-17) jest energią pojedynczej pary elektronów,
przy założeniu ,że pozostałe elektrony nie tworzą par. Jest oczywiste ,że sytuacja taka
aczkolwiek możliwa jest pewnym szczególnym mało prawdopodobnym przypadkiem.
W rzeczywistości tworzyć się będzie znacznie więcej niż jedna para. Każda sytuacja
utworzenia się określonej ilości par Coopera jest pewnym szczególnym przypadkiem
naszego układu i odpowiada pewnemu stanowi energetycznemu. Teoria BCS podaje
przepis na obliczenie energii stanu podstawowego układu, czyli stanu, w którym pary
Coopera mają najniższa energię.
Pomimo, że energia układu zależeć będzie głównie od ilości par Coopera zagadnienie to nie
sprowadza się do prostego mnożenia energii pary przez ilość wszystkich par, zgodnie bowiem z relacją ( XI-16)
generacja pary Coopera , poprzez fakt , że na to aby tworzyć parę elektrony muszą zostać wzbudzone ponad
poziom Fermiego, powoduje wzrost energii kinetycznej całego układu
Nie wchodząc w szczegóły podamy tu sposób w jaki zostały przeprowadzone
rachunki. Rozważa się układ elektronów w temperaturze 0K. Do obliczenia energii stanu
133
podstawowego par Coopera użyto przybliżenia wielocząstkowego , w którym stan układu
opisywany był przez funkcję falową będącą iloczynem jednoelektronowych funkcji falowych
pojedynczych par. Przyjęto , że każda z par elektronów o wektorach falowych k,−k może
znajdować się w dwóch stanach energetycznych; może istnieć jako para – mamy wówczas
stan |1>- lub może nie istnieć jako para - mamy wówczas stan |0> . Dlatego też funkcja
falowa pojedynczej pary jest kombinacją liniową dwóch składników ( |1> i |0>). W
konsekwencji stan układu w teorii BCS opisuje się przez następującą funkcję:
| φ BCS >= ∏ (a k 1 + bk 0 )
(XI-19)
k
gdzie a k2 ,bk2 są prawdopodobieństwami, że istnieje lub nie istnieje odpowiednia para
Coopera o wektorze falowym (k, -k). Energię układu , W, można policzyć znajdując wartość
oczekiwaną potencjału oddziaływania pomiędzy elektronami w parze V , W = φ BCS V φ BCS .
Główny problem polega na tym aby przedstawić potencjał V w odpowiedniej wygodnej
formie, jako operator zależny tylko od wektorów falowych. Ponieważ stan podstawowy ma
najniższą energię szuka się minimum energii powyższej całki
W 0 = min φ BCS V φ BCS
(XI-20)
Pierwszy stan wzbudzony to stan , w którym liczba par Coopera zmniejszyła się o 1.
Znajomość energii stanu podstawowego pozwala obliczyć energię pierwszego stanu
wzbudzonego , czyli energię jaka jest potrzebna do rozbicia pojedynczej pary. Różnica
energii pomiędzy stanem podstawowym W 0 a stanem wzbudzonym W 1 jest równa
−1
W 1 − W 0 = ∆ ≈ 2ηω D exp
V0 Z ( k F )
(XI-21)
Struktura energetyczna par Coopera przedstawiona jest na rysunku XI-5.
Przedstawiono tu energię przypadająca na jeden elektron. Dyskretny stan podstawowy
odpowiada stanowi podstawowemu BCS, czyli istnienia par Coopera. Aby pojedyncza para
została rozbita trzeba dostarczyć do układu energię większą niż 2∆ .
Energia
Swobodne elektrony
134
Fig XI-5 Struktura
energetyczna
nadprzewodnika.
Pasmo odpowiada
stanom
wzbudzonym pary
czyli swobodnym
elektronom
Przedstawione są
∆
Stan podstawowy BCS
Fakt, że do rozbicia pary Coopera potrzebna jest pewna energia jest odpowiedzialny za brak rozproszeń
par Coopera na domieszkach lub defektach sieci.
Brak rozproszeń par wynika z kwantowej natury zjawiska nadprzewodnictwa.
Zauważmy przede wszystkim, że para Coopera składa się z dwóch elektronów o przeciwnych
dobrze określonych pędach . Zgodnie z zasadą nieoznaczoności jest więc ona obiektem
zdelokalizowanym w przestrzeni rzeczywistej. Jeśli rozważa się możliwość rozproszenia
takiego złożonego obiektu ( pary Coopera) na zlokalizowanych defektach sieci to należy
uwzględniać tylko oddziaływanie defektu z poszczególnymi elektronami a nie z parą w
całości. Rozproszenie jednego elektronu z pary wiąże się oczywiście ze zmianą jego pędu , a
ponieważ zmienia się pęd tylko jednego elektronu równość k 1 = −k 2 przestaje być spełniona i
na skutek zaniku potencjału przyciągającego para musi się rozpaść. Rozpad pary z kolei
wymaga dostarczenia energii 2∆ . W niskiej temperaturze nie ma swobodnych fononów ,
które mogłyby dostarczyć tej energii, tak więc dopóki energia kinetyczna pary jest mniejsza
niż 2∆ rozproszenia nie są możliwe.
Teoria BCS daje poprawny opis szeregu właściwości nadprzewodników
metalicznych . Do takich właściwości należy istnienie temperatury krytycznej a także
krytycznego prądu i pola magnetycznego.
Rozważmy na początek skąd bierze się prąd krytyczny , czyli dlaczego przez nadprzewodnik
nie może płynąć prąd o gęstości większej niż wartość krytyczna jc.. Prąd nadprzewodzący jest
spowodowany ruchem par Coopera . Zgodnie z zasadami dynamiki,
gęstość prądu może być
obliczona ze wzoru
j = enυ =
enη
K
2m
(XI-22)
gdzie e jest ładunkiem elektronu, a υ prędkością pary Coopera . K jest wektorem falowym
pary Coopera K =
2mυ K
.
jest oczywiście przyrostem pędu pojedynczego elektronu
η
2
wynikającego z ruchu pary. Ruch pary Coopera powoduje przyrost jej energii kinetycznej .
Ten przyrost energii przypadający na jeden elektron jest równy
135
δE =
K 2
)
2
2
2
2 − η (k F ) ≈ η k F K
2m
2m
2m
η2 ( k F +
(XI-23)
Jeżeli energia kinetyczna pary 2δE przekroczy wartość 2∆ para samorzutnie ulegnie
rozpadowi. Warunek
η2 k F K
≥ 2∆
m
(XI-24)
pozwala na obliczenie krytycznej gęstości prądu nadprzewodnictwa. Podstawiając za K
wartość obliczoną ze wzoru (XI-22) otrzymamy
jc =
en∆
ηk F
(XI-25)
Znając krytyczną wartość gęstości prądu możemy obliczyć wartość krytycznego natężenia
pola magnetycznego, Hc. Całkowa postać równania Maxwella
∫ Hdl = ∫ jdS
(XI-26)
2πrH = ∫ jdS
gdzie r jest promieniem drutu nadprzewodzącego, pozwala powiązać prąd płynący w
nadprzewodniku z natężeniem indukowanego przezeń pola magnetycznego. Zakładając
zgodnie z relacja (XI-14) , że prąd nadprzewodzący płynie tylko na powierzchniowej
warstwie nadprzewodnika, i że grubość tej warstwy wynosi Λ otrzymujemy
2πrH = 2πrΛj
a stąd
H c = Λj c = Λ ⋅
en∆
ηk F
(XI-26)
Powyższe rozważania dotyczą oczywiście temperatury 0K
Przeanalizujmy teraz co stanie co stanie się jeśli podniesiemy temperaturę. W
temperaturze zera bezwzględnego jeśli prąd nadprzewodzący był mały układ znajdował się w
stanie podstawowym BCS. Jeśli podniesiemy temperaturę część par zostanie rozerwana a
elektrony wzbudzone do pasma elektronów swobodnych. Jednocześnie zmiana ilości par
spowoduje zmniejszenie się energii potrzebnej do rozpadu następnej pojedynczej pary, do
wartości 2∆(T ) > 2∆(T = 0) (Znajdujemy się w wyższym stanie energetycznym BCS). To z
136
kolei zwiększy dodatkowo ilość rozpadających się par. Wraz ze wzrostem temperatury ilość
par wzrasta więc lawinowo i dla temperatury krytycznej, dla której ∆(T ) = 0 mamy przejście
fazowe nadprzewodnik- metal. Temperaturę, przy której zachodzi to przejście nazywamy
temperaturą krytyczną. Teoria BCS pozwala na obliczenie temperatury krytycznej Wynosi
ona :
Tc =
∆(T = 0)
1.763k B
(XI-27)
Wykład 12
Przybliżenie jednoelektrodowe.
Każde ciało składa się z ogromnej ilości jąder i elektronów. Miarą ilości atomów w
makroskopowym obiekcie jest liczba Avogadra (N=6.02217 *1023) . Liczba elektronów jest
na ogół jeszcze większa.
Dla potrzeb tego wykładu załóżmy , że jądra kryształu lub innego ciała pozostają
nieruchome. Wówczas układ opisany być może przez funkcję falową , zależną od położeń
wszystkich elektronów ψ (r 1 , r 2 ,.., r N ) . r1 , r2
..... rN są wektorami opisujacymi położenia poszczególnych elektronów.
Energie stacjonarne układu można otrzymać rozwiązując równanie Schrödingera
Hψ (r 1 , r 2 ,.., r N ) = ε ⋅ψ (r 1 , r 2 ,.., r N )
(I-1)
gdzie hamiltonian H wyraża się następująco
n
H = ∑ Hi +
i =1
1 N ' e2
∑
2 i , j =1 | ri − r j |
(I-2)
gdzie
Hi = −
η2 2
∇ i + V (ri )
2m
(I-3)
137
∂2
∂2
∂2
We wzorze tym ∇ = 2 + 2 + 2 a V (ri ) jest energią potencjalną i-tego elektronu.
∂xi ∂y i ∂z i
2
i
Wskaźnik prim przy sumie we wzorze (I-2) oznacza , ze trzeba pominąć przy sumowaniu
wyrazy j=i .
Oczywiście nie znamy ścisłych rozwiązań równania (I-1). Nawet w przypadku kilku
elektronów (dwóch) . Stosuje się więc jak zwykle w mechanice kwantowej metody
przybliżone.
Omówiona zostanie metoda Hartree' ego - Focka. Podstawowym założeniem tej metody
jest zastąpienie w hamiltonianie H potencjalnej energii wzajemnego oddziaływania
elektronów polem efektywnym Uef, w którym wszystkie elektrony poruszają się niezależnie.
Pole to opisuje uśrednione działanie wszystkich pozostałych elektronów na dany elektron.
Przy takim założeniu hamiltonian układu jest równy sumie hamiltonianów zależnych od
współrzędnych jednego elektronu.
N
H = ∑ H i'
(I-4)
i =1
gdzie
H i' = −
η2 2
∇ i + V (ri ) + U ef (ri )
2m
(I-5)
Łatwo wykazać, że rozwiązaniem równania (I-1) z takim hamiltonianem jest funkcja w
postaci iloczynu :
N
ψ (r 1 , r 2 ,.., r N ) = ∏ ϕ n (ri )
i =1
(I-6)
i
gdzie wskaźnik przy funkcji ni zespół liczb kwantowych charakteryzujących dany elektron.
W ogólności wskaźnik ten uwzględnia również spin elektronu. Funkcje falowe ϕ nn (ri ) są
rozwiązaniem równań
H i'ϕ nn (ri ) = ε ni ⋅ ϕ nn (ri )
(I-7)
138
gdzie energia ε ni jest energia i-tego elektronu. Całkowita energia układu jest równa
N
ε = ∑ε n
i =1
(I-8)
i
Podstawiając hamiltonian (I-4) i funkcję falową (I-6) do równania Schrödingera (I-1)
otrzymamy
N
∑H
i =1
'
i
[ϕ n1 (r1 ) ⋅ϕ n2 (r2 )...ϕ ni (ri )...ϕ nN (rN )] = ε [ϕ n1 (r1 )ϕ n2 (r2 )...ϕ nn (rN )] (I-9)
Ponieważ hamiltonian H i' działa tylko na funkcję falową i-tego elektronu ϕ i (ri ) zgodnie z
równaniem (I-7) równanie (I-9) daje się przekształca się jak następuje
N
∑ε
i =1
ni
[ϕ n 1 (r1 )ϕ n 2 (r2 )... ϕ n n (rN )] = ε [ϕ n 1 (r1 )ϕ n 2 (r2 )... ϕ n n (rN )]
( I-10)
Dzieląc obustronnie równanie (I-10) przez [ϕ n1 (r1 )ϕ n2 (r2 )...ϕ nn (rN )] otrzymuje się równanie
(I-8) , czego właśnie należało dowieść .
Rozważmy przypadek dwóch elektronów (N=2) . Wówczas funkcja falowa dane będzie
następująco ψ (r1 , r2 ) = ϕ n1 (r1 ) ⋅ ϕ n2 (r2 )
(I-11) .
Odpowiedni hamiltonian będzie równy
H = H 1' + H 2'
(I-12)
Zauważmy , że jeśli funkcja ( I-11) jest funkcją własną hamiltonianu (I-12) to funkcja
ψ (r2 , r1 ) = ϕ n (r2 ) ⋅ ϕ n (r1 )
1
2
(I-13)
jest również funkcją własną tego samego hamiltonianu. Tzn. spełnione są równania
( H 1' + H 2' )ϕ n1 (r1 ) ⋅ ϕ n2 (r2 ) = [ε n1 + ε n2 ]ϕ n1 (r1 ) ⋅ ϕ n2 (r2 )
i
139
(I-14)
( H 1' + H 2' )ϕ n1 (r2 ) ⋅ ϕ n2 (r1 ) = [ε n1 + ε n2 ]ϕ n1 (r2 ) ⋅ ϕ n2 (r1 )
(I-15)
Funkcja ψ (r2 , r1 ) różni się od funkcji (I-11) tym, że elektrony zostały zamienione miejscami.
Wydaje się oczywiste , że przy zamianie elektronów miejscami nie powinna się zmienić
całkowita energia układu. Właściwości przestrzeni Hilberta ( jest to przestrzeń funkcyjna ,
której elementami są funkcje będące rozwiązaniami odpowiedniego równania Schrödingera ,
jeśli funkcje (I-11) i (I-13) są funkcjami własnymi hamiltonianu (I-12) to dowolna ich
kombinacja liniowa również jest funkcją własną tego hamiltonianu.
Ciekawy jest szczególny przypadek gdy obie funkcje są opisane tymi samymi liczbami
kwantowymi , tzn. gdy n1 = n2 = n . Jeśli uwzględniono tu spin to wówczas oba elektrony
zajmują ten sam stan kwantowy. Ponieważ elektrony są fermionami , zgodnie z zakazem
Pauliego taka sytuacja jest niemożliwa. Aby zakaz Pauliego był spełniony automatycznie
spośród wszystkich kombinacji liniowych funkcji (I-11) i ( I-12) wybieramy funkcje w
postaci
φ (r1 , r2 ) =
1
1 ϕ n1 (r1 ) ϕ n1 (r2 )
ϕ n1 (r1 ) ⋅ ϕ n2 (r2 ) − ϕ n1 (r2 ) ⋅ ϕ n2 (r1 ) =
2
2! ϕ n2 (r1 ) ϕ n2 (r2 )
[
]
(I-16)
Zauważamy, że jeśli n1 = n2 = n , wówczas funkcja (I-16) jest równa zeru. Nie istniej układu
dwóch elektronów gdy oba scharakteryzowane są przez ten sam zestaw liczb kwantowych.
Jeśli mamy do czynienia z większą liczbą elektronów wybieramy funkcję w postaci
wyznacznika :
φ (r , r ,.., r ) =
1
2
N
1
N!
ϕ n (r1 ) ϕ n (r2 )
ϕ n (r1 ) ϕ n (r2 )
1
1
2
2
....
ϕ n (rN )
ϕ n (rN )
1
2
....... ........
........
......
ϕ nN (r1 ) ϕ nN (r2 ) .... ϕ nN (rN )
140
(I-17)
Zauważmy, że funkcja (I-17) jest równa zero gdy dowolne dwa elektrony byłyby
scharakteryzowane przez ten sam zespół liczb kwantowych. ni = n j = n , dla dowolnego
i ≠ j powoduje , że wyznacznik posiada dwa równe wiersze . Taki wyznacznik jest równy
zeru. Wybór wieloelektrodowej funkcji falowej w postaci wyznacznika automatycznie
powoduje , ze układ wieloelektrodowy spełniać będzie zakaz Pauliego.
Powróćmy do przypadku dwu elektronów. Spróbujmy podać sposób obliczanie efektywnego
potencjału , w którym poruszają się pojedyncze elektrony. Energia układu dwóch elektronów
może być obliczona jako
E = ∫ dr1 dr2φ * (r1 , r2 )Hφ (r1 , r2 )
(I-18)
Przedstawmy hamiltonian w postaci (I-2) uwzględniając potencjał oddziaływania pomiędzy
dwoma elektronami. Dla dwóch elektronów hamiltonian będzie miał postać
H = H1 + H 2 +
e2
= H 1 + H 2 + H 12
| r1 − r2 |
(I-19)
Podstawiając funkcję falową ze wzoru (I-16) , oraz wykorzystując następujące relacje
ortogonalności
∫ϕ
∫ϕ
*
n1
(r1 ) ⋅ ϕ n2 (r1 )dr1 = δ n1n2
*
n1
(r2 ) ⋅ ϕ n2 (r2 )dr2 = δ n1n2
(I-20)
otrzymamy
141
1
E = {∫ ϕ n*1 (r1 ) H 1ϕ n1 (r1 )dr1 + ∫ ϕ n*1 (r2 ) H 2ϕ n1 (r2 )dr2 + ∫ ϕ n*2 (r1 ) H 1ϕ n2 (r1 )dr1
2
+ ∫ ϕ n*2 (r2 ) H 2ϕ n2 (r2 )dr + ∫ ϕ n*1 (r1 ) ⋅ ϕ n*2 (r2 )H 12ϕ n1 (r1 ) ⋅ ϕ n2 (r2 )dr1 dr2
+ ∫ ϕ n*1 (r2 ) ⋅ ϕ n*2 (r1 )H 12ϕ n1 (r2 ) ⋅ ϕ n2 (r1 )dr1 dr2 − ∫ ϕ n*1 (r1 ) ⋅ ϕ n*2 (r2 )H 12ϕ n1 (r2 ) ⋅ ϕ n2 (r1 )dr1 dr2
− ∫ ϕ n*1 (r2 ) ⋅ ϕ n*2 (r1 )H 12ϕ n1 (r1 ) ⋅ ϕ n2 (r2 )dr1 dr}
(I-21)
Zauważając, że
∫ϕ
*
n1
(r1 ) H1ϕ n1 (r1 )dr1 = ∫ ϕ n*1 (r2 ) H 2ϕ n1 (r2 )dr2 (I-22)
∫ϕ
*
n2
(r1 ) H1ϕ n2 (r1 )dr1 = ∫ ϕ n*2 (r2 ) H 2ϕ n2 (r2 )dr2
*
n1
(r1 ) ⋅ ϕ n*2 (r2 )H 12ϕ n1 (r1 ) ⋅ ϕ n2 (r2 )dr1 dr2 = ∫ ϕ n*1 (r2 ) ⋅ ϕ n*2 (r1 )H 12ϕ n1 (r2 ) ⋅ ϕ n2 (r1 )dr1 dr2
*
n1
(r1 ) ⋅ ϕ n*2 (r2 )H 12ϕ n1 (r2 ) ⋅ ϕ n2 (r1 )dr1 dr2 = ∫ ϕ n*1 (r2 ) ⋅ ϕ n*2 (r1 )H 12ϕ n1 (r1 ) ⋅ ϕ n2 (r2 )dr1 dr2
(I-23)
i
∫ϕ
∫ϕ
(i-24)
równanie (I-21) może być przekształcone do postaci
E = ∫ ϕ n*1 (r1 ) H1ϕ n1 (r1 )dr1 + ∫ ϕ n*2 (r2 ) H 2ϕ n2 (r2 )dr
+ ∫ ϕ n*1 (r1 ) ⋅ ϕ n*2 (r2 )H12ϕ n1 (r1 ) ⋅ ϕ n2 (r2 )dr1dr2
(I-25)
− ∫ ϕ n*1 (r1 ) ⋅ ϕ n*2 (r2 )H12ϕ n1 (r2 ) ⋅ ϕ n2 (r1 )dr1dr2
e2
lub po podstawieniu hamiltonian H12 =
| r1 − r2 |
142
E = ∫ ϕ n*1 (r1 ) H 1ϕ n1 (r1 )dr1 + ∫ ϕ n*2 (r2 ) H 2ϕ n2 (r2 )dr
+ ∫ ϕ n*1 (r1 ) ⋅ ϕ n1 (r1 )
e2
ϕ n*2 (r2 ) ⋅ ϕ n2 (r2 )dr1 dr2
| r1 − r2 |
(I-26)
e2
ϕ n*2 (r2 )ϕ n1 (r2 )dr1 dr2
− ∫ ϕ (r1 ) ⋅ϕ n2 (r1 )
| r1 − r2 |
*
n1
W równaniu (I-26) dwie pierwsze całki odpowiadają energiom elektronów z wewnętrznym
potencjale, trzecia całka reprezentuje elektrostatyczne odpychanie się
elektronów ϕ n*1 (r1 ) ⋅ ϕ n1 (r1 ) i ϕ n*2 (r2 ) ⋅ ϕ n2 (r2 ) są przestrzennymi gęstościami ładunków
pierwszego i drugiego elektronu. Czwarta , ujemna całka reprezentuje energię wymiany.
Oddziaływanie wymiany nie ma odpowiednika w elektrostatyce klasycznej . Można je
interpretować jako oddziaływanie kulombowskie pomiędzy zespolonymi ładunkami
opisanymi przez gęstości ładunków ϕ n*1 (r1 ) ⋅ ϕ n2 (r1 ) i ϕ n*2 (r2 )ϕ n1 (r2 ) .
Równanie (I-26) może być łatwo uogólnione na przypadek gdy mamy więcej niż dwa
elektrony . Dla N elektronów mamy :
N
E = ∑ ∫ ϕ n*i (ri )H i ϕ n i (ri )d ri
i =1
+
e2
1 N ' *
ϕ
ϕ
ϕ n* j (r j ) ⋅ ϕ n j (r j )d r j d ri
(
r
)
⋅
(
r
)
∑
ni
i
i
ni
∫
2 i =1 , j =1
| ri − r j |
−
e2
1 N ' *
ϕ
(
)
ϕ
(
)
ϕ n* (r j )ϕ n i (r j )d ri d r j
r
r
⋅
∑
n
i
i
nj
2 i =1 , j =1 ∫ i
| ri − r j | j
(i-27)
Podobnie jak poprzednio prim przy sumach oznacza , że nie bierze się pod uwagę składników
przy i=j.
Wróćmy do problemu znajdowania efektywnego potencjału Uef . Można go znaleźć
używając metody wariacyjnej . Rozważmy równanie (I-27) i zbadajmy jak zmienia się
energia E jeśli funkcje ϕ n*i (ri ) zmienią się o δϕ n*i (ri ) . Formalnie zmienia się o wartość δE .
Zakładając, że energia E jest "dobrą wartością własną", całka (I-27) musi mieć wartość
minimalną. Warunek na minimum powoduje, że δE musi się równać zeru.
143
Otrzymamy
N
0 = δE = ∑ ∫ δϕ n*i (ri ) H iϕ ni (ri )dri
i =1
+
e2
1
'
*
δϕ
ϕ
ϕ n* j (r j ) ⋅ ϕ n j (r j )dr j dri
(
)
(
)
⋅
r
r
∑
ni
i
i
ni
∫
2 i =1, j =1
| ri − r j |
−
e2
1 N '
*
δϕ
(
)
ϕ
(
)
ϕ n* (r j )ϕ ni (r j )dri dr j
r
r
⋅
∑
ni
i
i
nj
2 i =1, j =1 ∫
| ri − r j | j
N
( I-28)
lub
N
∑ ∫ dr δϕ
i =1
i
*
ni
(ri ) ⋅ { H iϕ ni (ri )
+
e2
1 N '
ϕ
ϕ n* j (r j ) ⋅ ϕ n j (r j )dr j
(
)
r
∑
i
ni
∫
2 j =1
| ri − r j |
−
e2
1 N '
ϕ
(
r
)
∑ n j i | r − r | ϕ n* j (r j )ϕ ni (r j )dr j − ε ni ϕ ni (ri )
2 j =1 ∫
i
j
(I-29)
}= 0
Ostatni składnik w nawiasie we wzorze (I-29) pojawił się ponieważ dla dowolnej wariancji (
zmiany) funkcji δϕ n*i (ri ) możemy założyć, że ∫ d ri δϕ n*i (ri )ϕ n j (ri ) = 0 dla dowolnego i i j.
Ponieważ wariancje funkcji są dowolne zerowanie się sumy wymaga zerowania się
wszystkich współczynników przy δϕ n*i (ri ) . W ten sposób otrzymujemy dla każdego i
następujące równanie :
H ni ϕ ni (ri ) +
1 N '
e2
ϕ n* (r j ) ⋅ ϕ n j (r j )dr j ⋅ ϕ ni (ri )
∑
2 j =1 ∫ | ri − r j | j
1 N '
e2
− ∑ ∫
ϕ n* j (r j )ϕ n (r j )dr j ⋅ ϕ n j (ri ) − ε ni ϕ ni (ri ) = 0
2 j =1
| ri − r j |
Równanie (I-30 ) można przedstawić w następujący sposób
144
(I-30)
[
1 N '
e2
H ni + ∑ ∫
ϕ n* j (r j ) ⋅ ϕ n j (r j )dr j ⋅
2 j =1
| ri − r j |
ϕ n (ri )
1 N
e2
]ϕ ni (ri ) = ε ni ϕ ni (ri )
− ∑ '∫
ϕ n* j (r j )ϕ n (r j )dr j ⋅ j
2 j =1
| ri − r j |
ϕ ni (ri )
(I-31)
Równanie (I-31) jest równaniem Schrödingera dla i tego elektronu, który porusza się w
potencjale efektywnym
U ef (ri ) =
ϕ n j (ri )
1 N '
1 N '
e2
e2
*
*
(
)
(
)
ϕ
r
⋅
ϕ
r
d
r
−
ϕ
(
r
)
ϕ
(
r
)
d
r
⋅
∑
∑
n
j
j
j
n
j
n
j
j
nj
2 j =1 ∫ | ri − r j | j
2 j =1 ∫ | ri − r j | j
ϕ ni (ri )
(I-32)
W praktyce energie i funkcje własne układu wieloelektrodowego liczy się w sposób
iteracyjny.
Na początku wybiera się początkowe funkcje w postaci wyznaczników (I-17) , następnie
oblicza się efektywne potencjały korzystając ze wzoru (I-32) . Potencjały te wstawia się do
równań (I-31) i rozwiązując te równania otrzymuje się energie własne ε ni i odpowiadające im
funkcje własne ϕ n1i (ri ) w pierwszej iteracji. Tak otrzymane funkcje falowe wstawia się do
równania (I-32) i otrzymuje się nowe potencjały efektywne , które z kolei używa się do
obliczenia energii i funkcji w drugiej iteracji. Procedurę taką powtarza się dopóty aż różnice
energii w kolejnych iteracjach będą znikome. Jeśli właściwie wybierze się warunki
początkowe ( czyli wyznacznikowe funkcje własne) wystarczy kilka iteracji aby otrzymać
wystarczająco zbieżne rozwiązania.
Metoda iteracyjna , która tu przedstawiono nazywa się często metodą pola
samouzgodnionego lub metodą Hartree - Focka.
Wykład 13.
145
Przybliżenie adiabatyczne ( Borna -Oppenhaimera)
Do tej pory zajmowaliśmy się opisem elektronów poruszających się w polu nieruchomych
jonów. Oczywiście wiemy , że w realnych układach ( drobinach lub kryształach jądra
atomów nie są nieruchome ( nawet w temperaturze 0K jądra wykonują pewne drgania o
1
energii ηω ( η jest stałą Plancka a ω częstością kołową drgań) . Uwzględnienie ruchu
2
jonów lub jąder będzie tematem tego wykładu.
Możemy skorzystać z wniosków poprzedniego wykłady i przyjąć, że udało nam się obliczyć
energie i funkcje własne układu wielolelektronoiwego w przybliżeniu jenoelektronowym dla
danych położeń jonów.
Możemy więc rozważać każdy elektron osobno używające do jego opisu hamiltonianu H (r )
i funkcji falowej ϕ (r ) .
Jeśli elektron znajduje się w krysztale lub drobinie składającej się z N jąder całkowita
energia układu będzie opisana hamiltonianem
N
Z J e2
− η2 2
η2
H=
∇ r + U ef (r ) − ∑
−
2m
2
J =1 | r − R J |
N
∇ 2RJ
∑M
J =1
J
+
1 N Z J Z K e2
∑'
2 J , K =1 | R J − R K |
(II-1)
W hamiltonianie tym pierwsze trzy człony są znanym nam już hamiltonianem
jednoelektronowym z efektywnym potencjałem opisującym oddziaływania
międzyelektrodowe, w którym potencjał oddziaływania elektron z jądrami przedstawiono
jako sumę potencjałów poszczególnych jąder. Czwarta suma reprezentuje energię kinetyczną
jąder zaś piąta suma energię potencjalna odpychania ładunków jąder. Literami ZJ i MJ z
indeksami oznaczono odpowiednio liczby atomowe i masy jąder. Literą RJ oznaczono
położenia jąder.
Na ogół drgania sieci krystalicznej lub drobin nie polegają na niezależnych drganiach
wszystkich jonów. Zawsze mamy do czynienia z ruchem uporządkowanym, w którym jądra
drgają mnie lub bardziej symetrycznie. Współrzędne opisujące ruch jąder są od siebie
wzajemnie zależne. Nie ma więc potrzeby używania N niezależnych położeń W
najprostszym przypadku ruch wszystkich jąder będzie mógł być opisany jedna współrzędną
R
Przybliżenie adiabatyczne
146
Jako interesujący przykład można rozpatrzyć cząsteczkę dwuatomową , np. H2, lub jon
metalu w związku koordynacyjnym np. CrO6 .
Rysunek 1 a i b
a
b
H
R2
R=|R2-R1|
R
H
R1
W oby przypadkach drania układu jonów można opisać przy pomocy jednej współrzędnej, R .
Powoduje to ,że hamiltonian może być przedstawiony w znacznie prostszej postaci
H (r, R ) = H e (r, R ) + H j (R )
(II-2)
gdzie He i Hj są operatorami opisującymi ruch elektronów i jąder
H e (r, R ) = −
η2 ∇ 2r
+ Ve (r, R ),
2m
H j (R ) −
η2 ∇/ 2R
+ V j (R )
2M
(II-3)
Skoro dokonano separacji zmiennych można przedstawić funkcje falową w postaci iloczynu :
Ψ (r, R ) = ϕ (r, R ) ⋅ χ (R )
(II-4)
Funkcja w tej postaci nosi czasem nazwę funkcji Borna Oppenhaimera . Pierwszy składnik
jest funkcją elektronową , opisującą ruch elektronów dla danych położeń jąder . Obrazuje to
równanie Shrödingera w postaci
η2 ∇ 2r
−
ϕ (r, R ) = ε (R )ϕ (r, R )
(II-5)
V
(
r,
R
)
V
(
R
)
+
+
e
j
2m
gdzie ε (R ) jest parametrycznie zależną od położeń jąder energią elektronów. Należy zwrócić
uwagę, że w równaniu (II-5) występuje potencjał oddziaływania jąder. Dla elektronu jest
stała , zależna od położeń jąder . Na ogół stałe elementy hamiltonianu są pomijane . W tym
przypadku bierzemy to je pod uwagę. Robimy to ponieważ w całkowitym hamiltonianie
układu (II-2) jest to funkcja zależna od położeń jąder.
Zobaczmy teraz , w jakim przypadku możemy interpretować równanie (II-5) jako równanie
Shrödingera dla elektronów. W ogólnym przypadku możemy rozwiązywać równanie z
hamiltonianem (II-2) i funkcją (II-4) . Otrzymamy :
147
η2 ∇ r2
η2 ∇/ 2R
−
+ Ve (r, R ) −
+ V j (R ) ϕ (r, R ) ⋅ χ (R ) = E ⋅ ϕ (r, R ) ⋅ χ (R ) (II-6)
2M
2m
W równaniu tym energia E jest energia własną układu elektronów i jonów . Można przyjąć
następujący warunek normalizacji funkcji falowych :
∫ϕ
*
(r, R ) ⋅ χ * (R )ϕ (r, R ) ⋅ χ (R )drdR = 1
(II-7)
Równanie (II-6) da się przepisać w postaci:
η2 ∇ 2r
η2 ∇/ 2R
(ϕ (r, R ) ⋅ χ (R ) ) = E ⋅ ϕ (r, R ) ⋅ χ (R )
+ Ve (r, R ) + V j (R ) ϕ (r, R ) χ (R ) −
−
2M
2m
(II-8)
Drugi składnik równania daje się zapisać w postaci :
2 2
2
η2 ∇/ 2R
(ϕ (r, R) ⋅ χ (R ) ) = ϕ (r, R ) η ∇/ R χ (R) + η ∇/ Rϕ (r, R ) ⋅ ∇/ R χ (R ) +
M
2M
2M
2 2
η ∇/ R
χ (R )
ϕ (r, R )
2M
(
)
(II-9)
Pierwszy składnik w równaniu (II-9) reprezentuje energię kinetyczną jonów
η2 ∇/ 2R
χ (R ) ) pomnożoną przez elektronowa funkcję falową, dwa pozostałe
(czynnik
2M
stanowią tzw. Operator nieadiabatyczności . Formalnie dokonujemy przybliżenia
adiabatycznego gdy zakładamy, że :
η2 ∇/ 2R
η2
∇/ Rϕ (r, R ) ⋅ ∇/ R χ (R ) + χ (R )
ϕ (r, R ) = 0
M
2M
(
)
(II-10)
Przybliżenie to jest uzasadnione we wszystkich przypadkach , gdy elektronowa funkcja
falowa , nie zależy lub bardzo słabo zależy od położeń jąder. Na ogół przypadku wielu
molekuł założenie to jest spełnione. W przypadku kryształów mamy do czynienia z bardziej
skomplikowaną sytuacją i założenie o adiabatyczności układu trzeba zawsze osobno
analizować. Często pomija się operator nieadiabatyczności argumentując , że w wyniku jego
m
( stosunku masy elektronu do
działania dostajemy poprawki do wartości energii rzędu
M
masy jonu).
Jeśli założy się spełnienie warunków normalizacji cząstkowej tzn.
148
∫ϕ
∫χ
*
(r, R ) ⋅ϕ (r, R )dr = 1
*
(R ) ⋅ χ (R )dR = 1
(II-11)
Wówczas
∇ R ∫ ϕ * (r, R )ϕ (r, R )dr = 2∫ ϕ * (r, R )∇ Rϕ (r, R )dr = 0
(II-12)
(ponieważ jest to różniczkowanie stałej ) prowadzi do zerowania się pierwszego składnika
(II-10) przy obliczaniu wartości własnej energii.
Równanie (II-8) można rozwiązać mnożąc lewostronnie przez ϕ * (r, R ) i całkując po
zmiennej elektronowej, r. Otrzymujemy
*
η2 ∇ 2r
−
ϕ
(
r,
R
)
+ Ve (r, R ) + V j (R ) ϕ (r, R )dr ⋅ χ (R )
∫
2m
η2 ∇/ 2R
− ∫ ϕ * (r, R )ϕ (r, R )dr ⋅
χ (R ) −
(II-13)
2M
2 2
2
*
η ∇/ R
η
∫ ϕ (r, R ) ∇/ Rϕ (r, R )dr ⋅ ∇/ R χ (R ) − χ (R ) ⋅ ∫ ϕ * (r, R )
ϕ (r, R )dr
M
2M
(
)
= E ⋅ ∫ ϕ * (r, R )ϕ (r, R )dr ⋅ χ (R )
Korzystając z pierwszego warunku normalizacji oraz równania (II-12) otrzymamy
*
η2 ∇ 2r
+ Ve (r, R ) + V j (R ) ϕ (r, R )dr ⋅ χ (R )
∫ ϕ (r, R ) −
2m
2 2
2 2
η ∇/ R
η ∇/ R
χ (R ) − χ (R ) ⋅ ∫ ϕ * (r, R )
ϕ (r, R )dr
−⋅
2M
2M
= E ⋅ χ (R )
(II-14)
Jeśli założymy, że
η2 ∇/ 2R
∫ ϕ (r, R) 2M ϕ (r, R)dr = 0
*
to równanie (II-14) da się przekształcić do postaci:
*
η2 ∇ 2r
η2 ∇/ 2R
χ (R ) = E ⋅ χ (R ) (II-15)
+ Ve (r, R ) + V j (R ) ϕ (r, R )dr ⋅ χ (R ) −
∫ ϕ (r, R ) −
2M
2m
Korzystając dalej z równania (II-5) otrzymamy równanie Schrödingera opisujące ruch jonów
149
η2 ∇/ 2R
+ ε (R ) χ (R ) = E ⋅ χ (R )
−
2M
(II-16)
Podsumowując tą część wykładu można powiedzieć , że przybliżenie adiabatyczne pozwala
separować ruch elektronów i ruch jonów. Otrzymujemy dwa równania. Najpierw
rozwiązujemy równanie (II-5) otrzymując energie elektronów w polu nieruchomych jąder dla
każdego położenia jąder osobno. Następnie rozwiązuje się równanie (II-16) otrzymując
energie całego układu.
Zwróćmy uwagę co składa się energię ε (R ) . Równanie (II-5) pozwala na przedstawienie tej
energii w formie sumy
ε (R ) = ε e (R ) + V j (R ) (II-17)
gdzie ε e (R ) jest energią elektronu , wartość własna otrzymana z równania Schrödingera nie
uwzględniającego potencjału wzajemnego oddziaływania jąder.
η2∇ 2r
−
+ Ve (r, R ) ϕ (r, R ) = ε e (R )ϕ (r, R )
2m
(II-18)
Aby zilustrować powyższe rozważania wykonajmy przykładowe obliczenia . Spróbujmy
zanalizować równanie (II-17). Zastanówmy się jak od położeń jąder zależeć będzie energia
ε (R ) w elektronowym stanie podstawowym . Jeśli układ znajduję się w położeniu
równowagi jakiekolwiek przesunięcia jonów powodują wzrost energii układu. Z mechaniki
klasycznej wiadomo, że możemy wówczas przybliżyć energię układu przy pomocy energii
sprężystej. W przypadku gdy układ daje się opisać przy pomocy jednej współrzędnej R
ε ( R ) = ε 0 ( R0 ) +
1 dε
2 dR
( R − R0 ) 2
(II-19)
R = R0
Jak widać jest to rozwinięcie funkcji energii w szereg potęgowy względem położenia
równowagi jonów, R=R0, przy założeniu ,że pierwsza pochodna jest równa zeru
dε ( R)
(
= 0 ). Łatwo pokazać, że
dR R = R0
ε ( R) = V j ( R) + ∫ ϕ * (r , R)V (r , R )ϕ (r , R)dr (II-20)
j
Łatwo zauważyć, że wykres zależności energii od położeń jąder jest dany przez parabolę.
Można wprowadzić nową zmienną Q=R-R0 wówczas równanie (II-19) można przedstawić w
postaci:
1
ε (Q) = ε 0 + kQ 2
(II-21)
2
Równanie (II-16) jest więc po prostu równaniem oscylatora harmonicznego ( patrz wykład z
fizyki teoretycznej lub mechaniki kwantowej)
150
η2 d 2
1
(II-22)
+ kQ 2 + ε 0 χ (Q) = E ⋅ χ (Q)
−
2
2
2 M dQ
W przypadku, gdy układ elektronów zostanie wzbudzony do wyższych stanów
dε (R)
energetycznych warunek (
= 0 ) nie musi być spełniony . Równanie opisujące
dR R = R0
zależność energii elektronów od położenia jonów w stanie wzbudzonym dane będzie
wzorem:
dε
1 dε
ε ( R ) = ε 0 ( R0 ) +
( R − R0 ) +
( R − R0 ) 2
(II-23)
dR R= R0
2 dR R = R0
lub
1
2
ε (Q) = ε 0 + VQ + kQ 2
(II-24)
Stała V może być liczona jako
d ∫ ϕ *1 (r , R)V (r , R)ϕ 1 (r , R )dr
dε
j
V =
=
dR R = R0
dR
(II-25)
R = R0
gdzie ϕ 1 (r , R) elektronową funkcja falową układu w stanie wzbudzonym . Zauważmy, że
jeśli
d ∫ ϕ *1 (r , R )V (r , R )ϕ 1 (r , R)dr
j
≠ 0 , nawet jeśli w stanie podstawowym
dR
R = R0
d ∫ ϕ 0 (r , R)V (r , R )ϕ 0 (r , R )dr
*
j
=0.
dR
R = R0
Na rysunku 2 przedstawione są krzywe opisujące energie układu w stanie podstawowym i
wzbudzonym . Widać, że po wzbudzeniu do stanu „1” następuje relaksacja jonów do nowego
położenie równowagi Q1.
Elementarna matematyka pozwala obliczyć położenie równowagi jonów w elektronowym
stanie wzbudzonym :
0=
d
−V
ε (Q) = V + kQ ⇒ Q1 =
,
dQ
k
(II-26)
oraz związane z przesunięciem jonów obniżenie energii układu
V2
∆E = −
(II-27)
2k
151
Rysunek 2
Diagram konfiguracyjny . Na rysunku przedstawiono
stan podstawowy i jeden ze stanów wzbudzonych.
Poziomy oscylacyjne związane z każdym stanem
elektronowym przedstawiono przy pomocy linii
poziomych .
energia
e
∆Ε
g
Q1=-V/k Q=0
Wibronowe funkcje falowe maja postać
ω
1
χ (Q ) =
m
πη 2 m !
m
i
1/2
'
,
1
H m (Q i ' ) exp − Q i ' 2
2
gdzie
[ ] ∂Q∂ '
H m (Q ' ) = ( −1) m exp Q ' 2
m
m
[
exp − Q ' 2
]
i
Q 'i = Q − Qi
Prawdopodobieństwo przejścia jest proporcjonalne do kwadratu momentu przejścia
Pnm ∝
∫ dQχ
m*
e
((Q − Q e ) χ gn (Q − Q g )dQ
2
W niskiej temperaturze widmo emisji dane jest przez przejścia ze stanu poczatkowego χ e0
Wówczas kolejne linie będą miały natężania
152
Pno ∝
0*
n
∫ dQχ e ((Q − Q e ) χ g (Q − Q g )dQ
2
=
exp( −S )S
n!
n
Analogicznie będzie w przypadku absorpcji . Stanem początkowym będzie stan χ g0 a
prawdopodobieństwa przejść do kolejnych stanów wibracyjnych wzbudzonego stanu
elektronowego będą dane wzorem
Pm 0 ∝
∫ dQχ
m*
e
((Q − Q e ) χ (Q − Q g )dQ
o
g
2
exp( −S )S
=
m!
m
gdzie S oznacza liczbę fononów , która mieści się w energii relaksacji sieci
S =
∆E
ηω
Ptra rysune 2.
Widmo absorpcji i emisji przedstawione jest na rysunku 3.
Wykład 14
Przybliżenie prawie swobodnych elektronów
Kilka uwag na temat twierdzenia Blocha .
Twierdzenie Blocha można sformułować następująco:
stany własne hamiltonianu jednoelektronowego
H =−
η2 2
∇ + V (r )
2m
(iii-1)
gdzie V (r ) = V (r + R ) jest potencjałem periodycznym z okresem sieci można wybrać w
postaci iloczynu funkcji odpowiadającej fali płaskiej i funkcji periodycznej o okresie sieci
ϕ nk (r ) = e ikr u nk (r )
(III-2)
gdzie funkcja periodyczna u spełnia warunek:
u nk (r ) = u nk (r + R ) .
(III-3)
153
Indeks "n" reprezentuje zespół liczb kwantowych wektor k jest wektorem falowym elektronu.
Zauważmy, że z warunku (III-3) wynika następująca relacja:
ϕ nk (r + R ) = e ikRϕ nk (r )
(III-4)
Relacja (III-4) może być również traktowana jako inna definicja funkcji Blocha . Zgodnie z
nią możemy powiedzieć , że funkcje własne operatora H danego wzorem (III-1) można
wybrać tak aby spełniały warunek (III-4).
Warto zapoznać się z dowodem tego twierdzenia Blocha .
W tym celu wprowadza się operator translacji o wektor R, TR działający na funkcję f
następująco:
TR f (r ) = f (r + R )
(III-5)
załóżmy, że funkcja ϕ nk (r ) funkcją własną hamiltonianu (III-1), tzn.
H (r )ϕ nk (r ) = E nk ϕ nk (r ) . Zauważmy dalej, że ponieważ hamiltonian jest niezmienniczy ze
względu na operacje translacji TR H (r ) = H (r + R ) = H (r ) . Wobec powyższego spełniona
będzie równość :
TR H (r )ϕ nk (r ) = H (r + R )ϕ nk (r + R ) = H (r )ϕ nk (r + R ) = H (r )TRϕ nk (r )
(III-6)
Z drugiej strony funkcje ϕ nk (r ) można wybrać tak aby były funkcjami własnymi operatora
translacji , czyli :
TRϕ nk (r ) = C (R )ϕ nk (r ) (III-7)
Działając na funkcję ϕ nk (r ) kolejno operatorami TR i TR' otrzymamy .
TR TR 'ϕ nk (r ) = C (R )C (R ' )ϕ nk (r ) = C (R + R ' )ϕ nk (r ) (III-8)
154
Relacja C (R )C (R ' ) = C (R + R ' ) jest spełniona gdy C (R ) = e ikR . W ten sposób
udowodniliśmy Twierdzenie Blocha.
Pojęcie kwazipędu.
Wektor k w przypadku swobodnych elektronów , opisanych funkcją falową e ikR jest
wektorem falowym , związanym z pędem elektronu następującą relacją p = ηk . Dzieje się
tak ponieważ fale płaskie są również funkcjami własnymi operatora pędu p̂ =
pˆ e ikR =
η ikR
∇e = ηke ikR
i
η
∇.
i
(III-9)
Podziałajmy operatorem pędu na funkcje Blocha :
η
η
∇[e ikr u nk (r )] = ηk[e ikr u nk (r )] + e ikr ∇[u nk (r )] (III-10)
i
i
Widać, że funkcja Blocha nie jest funkcją własną operatora pędu. Dlatego wielkość k
nazywamy kwazipędem ( czasem pseudopędem) . Kwazipęd jest określony z dokładnością
do wektora sieci odwrotnej G, to znaczy, że wektor k jest równoważny wektorowi k' jeśli
k=k'+G. Zauważmy, że e − iGR = 1 dla dowolnego wektora sieci prostej i sieci odwrotnej.
Rozważmy następujące równanie :
ϕ n ,k +G (r + R ) = e i ( k +G)R ϕ n ,k + G (r) = e ikR ϕ n ,k +G (r)
(III-11)
Z równania (III-11) wynika , że funkcja ϕ n ,k +G (r ) jest również funkcją Blocha . Co więcej ,
ponieważ u k + G (r ) = u k (r )e − iGr to ϕ n ,k (r ) = ϕ n ,k + G (r ) .
Działanie hamiltonianu (III-1) na funkcję (III-2) przedstawiamy następująco
η2 2
∇ + V (r ) e ikr u nk (r ) = E nk e ikr u nk (r )
−
2m
(III-12)
155
Wykonując działania otrzymamy
η2 2
η2 k
η2 k 2
∇ u nk (r ) −
∇u nk (r ) +
e ikr −
u nk (r ) + V (r )u nk (r ) = E nk e ikr u nk (r ) (III-13)
m
2m
2m
lub po przekształceniach
2
η2 1
∇ + k + V (r )u nk (r ) = E nk u nk (r )
−
2m i
(III-14)
Łatwo zauważyć, że równanie (III-12) trzeba rozwiązywać w całej objętości kryształu, zaś
równie (III-14) tylko w komórce elementarnej. W następnych komórkach mamy takie samo
równanie ponieważ u nk (r ) = u nk (r + R ) ( funkcja u jest periodyczna ).
Obliczanie składowych tensora odwrotności masy efektywnej .
Rozważmy równanie (III-13) i spróbujmy je zanalizować w przypadku gdy funkcja zależności
energii od wektora falowego osiąga wartość ekstremalną . Dla uproszczenia załóżmy , ze ma
to miejsce gdy wektor falowy k ma wartość zero k=0. Mamy wówczas następujący układ
równań
η2 2
∇ u n 0 (r ) + V (r )u n 0 (r ) = E n 0 u n 0 (r )
−
2m
(III-15)
załóżmy , że potrafimy rozwiązać to równanie dla każdego pasma ( określonego przez liczbę
kwantową n) i otrzymać wartości energii En0 oraz odpowiadające im funkcje falowe u n 0 (r )
Jeśli chcemy obliczyć jak zmieniać się będzie energia wraz ze wzrostem wektora k możemy
wykonać obliczenia posługując się rachunkiem zaburzeń.
E n (k ) = E n 0 + ∆ 1 + ∆ 2 + .....
156
Dla małych wartości k zaburzeniem będzie operator
η2 k
η2 k 2
∇+
Wˆ = −i
m
2m
(III-16)
Obliczmy poprawki do energii pierwszego i drugiego rzędu: ∆ 1 i ∆ 2 .
∆ 1 = u n 0 Wˆ u n 0
∆2 = ∑
u n 0 Wˆ u m 0 u m 0 Wˆ u n 0
(III-17)
En0 − Em0
m≠n
We wzorach (III-17) użyto notacji wektorów bra
i ket
do reprezentacji odpowiednich
całek
u n 0 Wˆ u m 0 = ∫ u m* 0 (r )Wˆ (r )u n 0 (r )dr (III-18)
η2
iη
ˆ
ˆ
∇
łatwo dowieść , że ponieważ pˆ = rH − Hr =
m
m
u n0 ∇ u n0 =
m
m
u n 0 rHˆ − Hˆ r u n 0 = 2 u n 0 r u n 0 ( E n 0 − E n 0 ) = 0 (III-19)
2
η
η
η2 k
η2 k 2
η2 k 2
η2 k 2
∆1 = u n 0 Wˆ u n 0 = u n 0 −
∇+
u n0 = u n0
un0 =
m
2m
2m
2m
oraz
∆2 = −
η4
m2
∑
m≠ n
[k u
n0
∇ u m 0 ]⋅ [k u m 0 ∇ u n 0
]
(III-21)
En0 − Em0
157
(III-20)
W ostatnim równaniu iloczyny w nawiasach kwadratowych są iloczynami skalarnymi w
postaci [k u n 0 ∇ u m 0 ] = k x u n 0
∂
∂
∂
u m0 + k y u n0
u m0 + k z u n0
u m 0 . Korzystając z
∂x
∂y
∂z
powyższego można przedstawić zależność energii od wektora falowego w sposób
następujący :
E (k ) = E 0 +
η2
2
∑
αβ
k αk β
m αβ
(III-22)
gdzie α i β reprezentują osie x, y, z . Wielkość
1
jest tensorem odwrotności masy
mαβ
efektywnej danym wzorem
δ αβ 2η2
1
=
− 2
mαβ
m
m
podstawiając p α = −iη
δ αβ
1
2
=
+ 2
mαβ
m m
∑
∑
u n0
∂
∂
u m0 ⋅ u m0
u n0
∂xα
∂x β
∂
∂x α
u n 0 pα u m 0 ⋅ u m 0 p β u n 0
m≠ n
En0 − Em0
δ αβ
2
=
+ 2
m m
Metody obliczania struktury energetycznej kryształów
I. Metoda fal płaskich.
Mamy hamiltonian kryształu w postaci :
η2 2
H =−
∇ + V (r )
2m
(III-23)
En0 − Em0
m≠ n
(III-24)
158
∑
m≠ n
u n 0 pα u m 0
En0 − Em0
2
(III-23)
Postulujemy rozwiązania w postaci
ϕ k (r ) = e ikr u k (r )
(III-24a)
Zagadnienie własne dane jest równaniem :
η2 2
∇ + V (r ) e ikr u k (r ) = E n (k )e ikr u k (r )
−
2m
(III-25)
Ponieważ potencjał V (r ) oraz funkcja u k (r ) są periodyczne z okresem sieci możemy rozwinąć
je w szeregi Fouriera względem wektorów sieci odwrotnej :
V (r ) = ∑ VG ⋅ e
iGr
,
(III-26)
G
u k (r ) = ∑ aG e iGr (III-27)
G
Zakładamy ,że znamy potencjał , niewiadome są energie i funkcje falowe. Po podstawieniu
(III-260 i (ii-27) do (III-25) otrzymamy:
η2 2 iGr η2
η2 2 iGr
iGr
a
G
⋅
e
+
Gk
⋅
e
+
k ⋅ e + ∑∑ VG ' aG ⋅ e i (G +G')r = Ek ∑ aG e iGr (III∑
G
2m
m
G
G
2m
G G'
29)
Zauważmy, że ponieważ sumujemy po wszytkich wektorach wynik nie zależy od kolejności
sumowania. Wobec powyższego
∑ ∑V
G'
G
G'
⋅ e i (G +G') r aG = ∑
G +G '
∑V
G'
G'
⋅ e i ( G +G') r aG = ∑
G"
159
∑V
G'
G'
⋅ e iG "r aG "− G' (III-30)
Zakładając, że podstawiając z powrotem G"=G otrzymamy dla każdego wektora G równanie
w postaci :
η2
−
E
(G + k ) 2 aG − ∑ VG a G −G' = 0
k
2m
G'
( III-31)
lub
η2
−
E
(G + k ) 2 aG − ∑ VG + K a K = 0 (III-32)
k
2m
K
Jest to układ równań pozwalający na obliczenie energii Ek i współczynników rozwinięcia
periodycznej części funkcji Blocha. Energie oblicza się przyrównując do zera wyznacznik
układu (III-31). W tym celu musimy brać skończony układ równań
Ek −
η2
(G 1 + k ) 2 + VG 1 +G 1
2m
VG 2 + G 1
Ek −
VG 1 +G 2
•
VG 1 +G n
η2
(G 2 + k ) 2
2m
•
•
VG 1 +G n −1
.•
•
η2
Ek −
(G n −1 + k ) 2
2m
VG n +G 1
•
VG n −1 +G 1
Ek −
η2
(G n + k ) 2
2m
(III-33)
W ten sposób można policzyć energie dla każdej wartości wektora k . K wybieramy z
pierwszej strefy Brillouina. Dlatego ważny jest kształt pierwszej strefy.
Wykład 15
Struktura pasmowa półprzewodników.
Pierwsza strefa Brillouina
Półprzewodniki maja strukturę diamentu ( Si, Ge lub blendy cynkowej ZnS) maja sieć
regularna płasko centrowaną . Sieć odwrotna jest siecią regularna przestrzennie centrowaną .
160
=0
Komórka Wignera Seitza sieci odwrotnej jest przedstawiona na rysunku 1. Na rysunku
zaznaczono symetryczne punkty Γ, X,L,K, U, W
oraz linie Σ,Λ,Z, ∆
Rys. 1 Pierwsza strefa
Brillouina
Struktura pasmowa Pustej
sieci przedstawiona jest na
rysunku 2 i przykładowa
struktura pasmowa kryształu
germanu na rysunku 3.
Rys.2
161
Rys. 3 Struktura energetyczna germanu
Jeśli rozwijamy w funkcję falową i
potencjał w szereg fal płaskich
opisanych wektorami sieci odwrotnej
zagadnienie jest tym trudniejsze im
więcej wektorów sieci odwrotnej jest
użyte w rozwinięciu. W realnych
kryształach jest ich wiele , bowiem
potencjał w pobliżu rdzenia jonów
zmienia się bardzo szybko. Dlatego
też w realnych obliczeniach używa
się bardziej wyrafinowanych metod.
Metody najczęściej używane to
metoda ortogonalizowanych fal
płaskich i metoda pseudopotencjału.
Metoda ortogonalizowanych fal
płaskich
Wybiera się funkcję falową w postaci
ortogonalizowanej fali płaskiej
φ k (r ) = e ikr + ∑ bcϕ kc (r ) (IV-1)
c
gdzie sumowanie odbywa się po wszystkich stanach rdzeni. Funkcje ϕ c (r ) są funkcjami
stanów rdzeni jonu. Współczynniki bc dane są wzorem
*
bc = − ∫ drϕ kc (r ) e ikr (IV-2)
wobec czego ortogonalizowane fale płaskie są automatycznie ortogonalne do wszystkich
stanów rdzeni jonów:
*
c
∫ drϕ k (r) φ k (r) = 0
(IV-3).
162
Wybiera się funkcje Blocha w postaci
Ψk (r ) = ∑ cG φ k + G (r ) (IV-4)
G
Funkcja w postaci ortogonalizowanej fali płaskiej ma szereg zalet: W obszarze rdzeni jest
funkcją szybko zmienna, poza obszarem rdzeni jest fala płaską . Aby otrzymać dobre
rozwiązania potrzeba znacznie mniej ortogonalizowanych fal płaskich niż fal płaskich.
Metoda pseudopotencjału
Metoda pseudopotencjału jest rozwinięciem metody ortogonalizowanych fal płaskich .
Podzielmy stanu w krysztale na stany walencyjne ( odpowiadają im funkcje falowe ψ kυ (r ) )i
stany rdzeni (odpowiadają im funkcje ϕ kc (r ) ) takie, że
Hψ kυ (r ) = Ekυψ kυ (r )
i
Hϕ kc (r ) = Ekcϕ kc (r )
Funkcja falowe można zapisać w postaci
[
]
ψ kυ (r ) = φ kυ (r ) − ∑ ∫ drϕ kc (r ) * φ kυ (r ) ⋅ ϕ kc (r ) (IV-5)
c
Równanie Shrödingera będzie miało postać
Hψ kυ (r ) = Ekυψ kυ (r ) (IV-6)
Po podstawieniu (IV) otrzymamy
[
]
[
]
Hφ kυ (r ) − ∑ ∫ drϕ kc (r ) * φ kυ (r ) ⋅ Hϕ kc (r ) = Ekυ φ kυ (r ) − ∑ ∫ drϕ kc (r ) * φ kυ (r ) ⋅ ϕ kc (r ) (IV-7)
c
c
Równanie to można zapisać w postaci:
[H + V ]φ
R
υ
k
(r ) = Ekυ φ kυ (r ) ( IV-8)
gdzie operator VR nazywany jest pseudopotencjałem
[
]
V Rφ kυ (r ) = ∑ ( Ekυ − Ekc ) ⋅ ∫ drϕ kc (r ) * φ kυ (r ) ⋅ ϕ kc (r )
c
163
(IV-9).
Funkcja φ kυ (r ) jest nazwana pseudopfunkcja i jest ona znacznie gładsza niż prawdziwa
funkcja falowa ψ kυ (r )
Wykład 16
Przybliżenie silnego wiązania
Zakładamy , że atomy tworzące sieć krystaliczna mają dobrze zdefiniowane stany atomowe (
dla każdego atomu dany jest zespół energii i funkcji własnych ( E n ,ψ n ) ). Inaczej można to
ująć tak, że w pobliżu każdego węzła sieci hamiltonian kryształu może być przybliżony
hamiltonianem atomowym Hat, oraz , że
H atψ = E nψ n
(1)
gdzie
H at = −
η2 ∇ 2
+ Vat (r )
2m
(2)
W granicznym przypadku potencjał kryształu jest sumą potencjałów atomowych. Mamy
wówczas
H cr = −
η2 ∇ 2
+ ∑ Vat (r − R ) = H at + ∑ Vat (r − R ) = H at + U
2m
R
R ≠0
(3)
gdzie sumujemy po wszystkich wektorach sieci prostej.
Jeśli mamy N atomów oraz jeśli funkcje falowe elektronów w poszczególnych atomach
znikają poza obszarem tego atomu, każdy stan krystaliczny jest N -krotnie zdegenerowany.
Tak jednak nie jest . Funkcje falowe na ogół nie znikają tak szybko. Potencjały od
poszczególnych atomów oddziaływują na elektrony od innych atomów.
Funkcja falowa kryształu może być wybrana w postaci funkcji Blocha , czyli spełnia warunek
:
ϕ (r + R ) = e ikR ϕ (r)
(4)
Może to być funkcja
164
ϕ nk (r ) = ∑ e ikRψ n (r − R )
(5)
R
gdzie ψ n (r − R ) jest funkcją własną atomu w położeniu węzłowym R.
Łatwo sprawdzić, ze funkcja (5) spełnia warunek (4)
ϕ n k (r + R ' ) =
∑
R
e
ikR '
∑
e
e ikRψ n (r − R + R ' ) = e ikR ' ∑ e ik ( R −R ')ψ n (r − (R − R ' )) =
R
ψ n (r − R ' ' ) = e
ikR ' '
ikR '
(6)
ϕ nk (r)
R ''
Ostatnią równość otrzymano zstępując sumowanie po R sumowaniem po R''=R-R'.
W celu znalezienia wartości własnych i funkcji własnych kryształu wybiera się funkcję
falową w postaci
φ k (r ) = ∑ bnϕ nk (r ) = ∑∑ bn e ikRψ n (r − R )
R
n
(7)
n
odpowiednie równanie Schródingera ma postać
H cr φ k (r ) = E (k )φ k (r )
(8)
Podstawiając (7) otrzymamy
H cr ∑ ∑ b n e ikRψ n (r − R ) =
R
n
E (k ) ∑ ∑ b n e
R
ikR
∑b
n
n
E n ψ n (r) + ∑ ∑ b n e ikR Uψ n (r − R ) =
R
n
ψ n (r − R )
(9)
n
Przy otrzymywaniu równania (9) wykorzystano fakt, że
H at (r )ψ n (r − R ) = 0
H at (r )ψ n (r ) = E nψ n (r )
Mnożąc równanie (9) lewostronnie przez ψ m* (r ) i całkując otrzymamy
[E (k ) − E m ]b m + ∑ b n ∑ ∫ e ikRψ m* (r)Uψ n (r − R)d r = 0
n
Lub w przybliżeniu
[E (k ) − E m ]b m + ∑ b n ∑ ∫ e ikRψ m* (r)Uψ n (r − R)d r = 0
n
(10)
R
R
165
(11)
Założono tu, że
∑∫e
ψ m* (r )ψ n (r − R )dr ≈ 0
ikR
R ≠0
Układ równań (11) pozwala znaleźć energie E(k) i współczynniki rozwinięcia bm
Każdy stan tworzy pasmo . Załóżmy ,ze niezerowe są tylko elementy diagonalne
Otrzymamy układ niezależnych równań
ikR *
E (k ) − E m + ∑ ∫ e ψ m (r )Uψ m (r − R )dr bm = 0
R
(12)
stąd
E m (k ) = E m − ∑ ∫ e ikRψ m* (r )Uψ m (r − R )dr
(13)
R
Wykład 17 .
Płytkie donory teoria masy efektywnej (TME)
Dotychczas pokazaliśmy, że w krysztale idealnym stany układu tworzą pasma energetyczne.
W stanie wzbudzonym elektron znajdujący się w paśmie zachowuje się jak cząstka
posiadająca masę efektywną m . Masa ta może być różna w zależności od kierunku
krystalograficznego. Właściwości dynamiczne elektronu opisywane są przy pomocy masy
efektywnej.
Obecnie zajmijmy się zaburzonym kryształem. Rozważmy hamiltonian w postaci
H =−
η2 ∇ 2
η2 ∇ 2
+ V ' = H 0 + U (r ) = −
+ V0 (r ) + U (r )
2m
2m
(1)
Potencjał zaburzonego kryształu zawsze możemy przedstawić w postaci sumy potencjału
idealnego kryształu i pewnego zaburzenia U (r ) . Naszym zadaniem jest znalezienie wartości
energii i funkcji falowych równania
H (r )ψ (r ) = Eψ (r )
(2)
Zagadnienie to można rozwiązać stosując rachunek zaburzeń i wykorzystując fakt ,ze w
idealnym krysztale mamy następujące rozwiązania
H 0ϕ nk0 (r ) = E n0 (k )ϕ nk0 (r )
(3)
Funkcję falową zaburzonego układu możemy skonstruować w sposób następujący :
ψ (r ) = ∑∑ Fn (k )ϕ nk0 (r )
n
(4)
k
166
Po podstawieniu do równania (2) i wymnożeniu przez ϕ n0'*k ' (r ) i wycałkowaniu po r
otrzymamy
E n0 (k ) Fn (k ) + ∑∑ < ϕ nk0 (r ) | U | ϕ n0'k ' (r ) > = EFn (k )
n'
(5)
k'
Możemy wziąć transformatę Fouriera potencjału
U (r ) = ∑ U (q)e − qr
(6)
q
wówczas
< ϕ nk0 (r ) | U | ϕ n0'k ' (r ) >= ∑ U (q) < ϕ nk0 (r ) | e iqr | ϕ n0'k ' (r) >
(6)
q
0
(r )e ikr
Funkcje falowe czystego kryształu są funkcjami Blocha ϕ nk0 (r ) = u nk
Ponieważ funkcje u są periodyczne z okresem sieci ich iloczyn jest także periodyczny z
okresem sieci . Możemy więc użyć następującego rozwinięcia
0*
u nk
(r )u n0'k ' (r ) = ∑ C nnkk'' (G )e − iGr
(7)
G
W związku z powyższym
< ϕ nk0 (r ) | e iqr | ϕ n0'k ' (r ) >= ∑ C nnkk'' (G )δ q ,k − k '+ G
(8)
G
oraz
< ϕ nk0 (r ) | U | ϕ n0'k ' (r ) >= U (| k − k ' |)C nnkk'' (0) + ∑ C nnkk'' (G )U (| k − k '+G |) (9)
G ≠0
Jeśli zauważymy, że
0*
C nnkk'' (0) = ∫ u nk
(r )u n0'k ' (r )dr ≈ δ nn ' (10)
to otrzymamy
< ϕ nk0 (r ) | U | ϕ n0'k ' (r ) >= U (| k − k ' |)
(11)
Pomijając dalej sumę po G różnych od zera w równaniu (9) równanie (5) da się przedstawić
w postaci:
167
E n0 (k ) Fn (k ) + ∑ U (| k − k ' |)Fn (k ' ) = EFn (k )
(12)
k'
Możemy wykonać odwrotną transformatę Fouriera
− kr
U (r ) Fn (r ) = ∑∑ U (| k − k ' |)Fn (k ' )e
k
k'
Fn (r ) = ∑ Fn (k )e ikr
k
η2
E n ( 0) −
2
∂2
∂2
∂2
+
+
m ∂x 2 m ∂y 2 m ∂z 2
y
z
x
Fn (r ) = ∑ E n0 (k ) Fn (k )e − kr
k
(13)
gdzie
η2
E (k ) =
2
0
n
k x2 k y2 k z2
+
+
mx m y mz
(14)
i otrzymać
−
η2
2
∂2
∂2
∂2
+
+
m ∂x 2 m ∂y 2 m ∂z 2
y
z
x
Fn (r ) + U (r ) Fn (r ) = [ E − E n (0)]Fn (r )
(15)
Wprowadza się pojęcie efektywnego Rydberga
m*
R* = R * 2
ε0
Energie stanów własnych donor dają się policzyć z następującego wzoru E n = −
jest główną liczba kwantową.
Promień orbity elektronu w stanie podstawowym jest równy a* = a 0
ε0
m
R*
gdzie n
n2
gdzie a 0 stałą
promień Bohra w stanie podstawowym w atomie wodoru.
Wykład 18.
Stany domieszkowe. Jony metali przejściowych i ziem rzadkich .
W półprzewodnikach i innych kryształach wprowadza się często domieszki będące jonami
metali przejściowych lub ziem rzadkich. Jony te charakteryzują się tym , że maja
niezapełnione powłoki 3d ( metale przejsciowe TM ) lub 4f ( ziemie rzadkie RE) .
168
Ponieważ najczęściej jony domieszki zastępują trójwartościowe jony sieci w trakcie tego
wykładu rozważamy tylko jony TM3+ i RE3+
Jony metali przejściowych i ziem rzadkich wraz z ich podstawową konfiguracją elektronową
podane są w poniższych tabelkach
Jony metali przejściowych
Ti 3+
V3+
Cr3+
3d1
3d2
3d3
Mn3+
3d4
Fe3+
3d5
Co3+
3d6
Ni3+
3d7
Zn3+
3d9
Łatwo zauważyć, że brakuje tu miedzi , która nie jest typowym metalem przejściowym .
Jony ziem rzadkich
Ce 3+ Pr3+ Nd3+
4f1
4f2
4f3
Pm3+ Sm3+ Eu3+
4f4
4f5
4f6
Gd3+
4f7
Tb3+
4f8
Dy3+
4f9
Ho3+
4f10
Er3+
4f11
Tm3+ Yb3+
4f12 4f13
Do opisu struktury energetycznej tych jonów nie używa się przybliżenia masy efektywne.
Zagadnienie rozpatruje się następująco . Jeśli jonem domieszki jest jon ziemi rzadkiej Ren+
posiadający m elektronów na powłoce 4f elektrony f są bardzo silnie zlokalizowane w
pobliżu jonu. Dlatego też oddziaływanie kryształu ( pozostałych jonów ) może być
traktowane jako zaburzenie. Struktura energetyczna jonu ziemi rzadkiej w krysztale jest
bardzo podobna do struktury energetycznej swobodnego jonu. Pole krystaliczne może być
traktowane jako małe zaburzenie.
Przyjmuje się na ogół , że pole krystaliczne jest pewnym zaburzeniem , które zmienia energie
i funkcje falowe danego jonu umieszczonego w sieci. W zerowym przybliżeniu mamy więc
energie i stany własne swobodnego jonu . Na ogół do opisu jonów używa się przybliżenia
LS, tzn stany są określone przez całkowitą orbitalną i spinową liczbę kwantową L i S
Stany jonów o konfiguracji elektronów walencyjnych d n i fn przedstawione są w tabeli 3.
Konfiguracj Termy
a
2
d1, d9
D
2
8
3
d ,d
F, 3P, 1G, 1D, 1S
Rozważmy dokładniej przypadek metali przejściowych.
Metale przejściowe .
Metal przejściowy po oddaniu do wiązań n elektronów walencyjnych ma stan ładunkowy
Men+. Załóżmy , że posiada m elektronów w powłoce 3d. Ponieważ elektrony z powłoki 3d
nie są tak blisko jonu ( jądra ) jak elektrony z powłoki 4f ich oddziaływanie z polem
krystalicznym pochodzącym od pozostałych jonów jest znacznie silniejsze. Najprostszą
teorią opisująca strukturę energetyczna jonów metali przejściowych jest teoria pola
krystalicznego.
169
Rozważmy na początek układ 3d1 ( jeden elektron w powłoce d . Część zależna od kąta
funkcji falowych d jest przedstawiona na rysunku 1.
Rys1. Funkcje falowe d ( część kątowa) . Białe kulki to jony w otoczeniu oktaedrycznym ,
czarne kulki to jony w otoczeniu tetraedrycznym.
Przy pomocy wzorów można je przedstawić jak następuje
170
5 R 3d ( r )
( 3 z 2 − r 2 ) = ϕ 20
2
16 π r
5 R 3d ( r ) 2
1
(ϕ 22 + ϕ 2 −2 )
(x − y 2 ) =
ϕυ =
2
16 π r
2
ϕu =
ϕξ =
15 R 3d (r )
1
(ϕ 21 + ϕ 2 −1 )
yz =
2
4π r
2
ϕη =
15 R 3d (r )
1
(ϕ 21 − ϕ 2 −1 )
zx =
2
4π r
2
ϕζ =
15 R 3d (r )
1
(ϕ 22 − ϕ 2 −2 )
xy =
2
4π r
2
(1)
gdzie
R3d (r ) = r 2 ⋅ e
−
r
3
(2)
a funkcje ϕ 2 −2 , ϕ 2 −1 , ϕ 20 , ϕ 21 , ϕ 22 są wodoropodobnymi funkcjami własnymi elektronu na
orbitalu 3d w postaci :
R (r ) m
ϕ nlm = nl
Y l (θ , ϕ )
(2a)
r
Potencjał pola krystalicznego jest sumą potencjałów pochodzących od wszystkich jonów . W
otoczeniu oktaedrycznym mamy:
Ze 2
Ze 2 35Ze 2 4
3
≈6
+
( x + y 4 + z 4 − r 4 ) (3)
5
R
5
4R
i =1 | Ri − r |
6
V =∑
Dla otoczenia tetraedrycznego mamy
Ze 2
Ze 2 10 3Ze 2
35Ze 2 4
3
≈4
+
xyz
−
(x + y 4 + z 4 − r 4 )
4
5
R
5
3R
9R
i =1 | Ri − r |
4
V =∑
(4)
Równości (3) i (4 ) otrzymano zakładając, że r<<R. Wartości oczekiwane energii liczymy ze
wzór
Ei = ∫ dx ∫ dy ∫ dzϕ i* ( x, y, z )H ( x, y, z )ϕ i ( x, y, z )
(5)
Wstawiając za funkcje falowe funkcje (1) , zaś za hamiltonian wyrażenie
η2 ∇ 2
H ( x, y , z ) = −
+ V ( x, y , z )
(6)
2m
171
gdzie potencjał V wstawiamy ze wzoru (3) lub (4)
Stosunkowo łatwo dowieść , że wartość oczekiwana operatora energii kinetycznej jest
zawsze taka sama (poziom d w polu o symetrii kulistej jest pięciokrotnie zdegenerowany - to
wymaga, żeby energia kinetyczna byłą zawsze taka sama) . To co nas interesuje to wartość
własna energii potencjalnej ∫ dx ∫ dy ∫ dzϕ i* ( x, y, z )V ( x, y, z )ϕ i ( x, y, z ) =< i | V | i > .
Dokonując odpowiednich podstawień zauważamy , ze w polu oktaedrycznym
< ξ | V | ξ >=< η | V | η >=< ζ | V | ζ >= −4 Dq
< u | V | u >=< υ | V | υ >= 6 Dq
35Ze 2
Gdzie D =
4R 5
i q=
2
| R3d (r ) | 2 r 4 dr
∫
105
Zaś dla otoczenia tetraedrycznego mamy
16
< ξ | V | ξ >=< η | V | η >=< ζ | V | ζ >= Dq
9
24
< u | V | u >=< υ | V | υ >= − Dq
9
(7)
(8)
(9)
Widać, że w obu przypadkach pięciokrotnie zdegenerowany poziom d rozszczepia się na
trzykrotnie zdegenerowany poziom t i dwukrotnie zdegenerowany poziom e . Interesujące jest
to ,ze kolejności stanów zależy od typu pola . Patrz rysunek 2 (a-otoczenie oktaedryczne ) i
(b -otoczenie tetraedryczne)
172
W rzeczywistości, jeśli uwzględnimy spin zauważamy ,że stany są odpowiednio 10-cio , 6-cio
i 4-ro krotnie zdegenerowane. ( każdy elektron może mieć spin + lub - 1/2.)
a
b
e
t
d
d
t
e
Wykład 19
Przykład jonu w polu krystalicznym .
Jon Ti3+ . w Al2O3 ( jon tytanu zastępuje jon glinu ) . Otoczenie oktaedryczne ( 6 ujemnych
jonów tlenu)
Konfiguracja elektronowa atomu Ti jest 1s 2s2 2p6 3s2 3p6 3d2 4s2
Konfiguracja elektronowa jonu Ti3+ ( po oddaniu trzech zewnętrznych jonów do wiązań
krystalicznych jest następująca 1s 2s2 2p6 3s2 3p6 3d1
Mamy jeden elektron , który może znajdować się w stanie podstawowym 2T2 lub stanie
wzbudzonym 2E. 10Dq w wynosi ok. 15000 cm-1
Widmo absorpcji i emisji składa się s szerokich pasm .
J Jon Cr3+ . w Al2O3 ( jon tytanu zastępuje jon glinu ) . Otoczenie oktaedryczne ( 6 ujemnych
jonów tlenu)
Konfiguracja elektronowa atomu Cr jest 1s 2s2 2p6 3s2 3p6 3d5 4s
Konfiguracja elektronowa jonu Cr3+ ( po oddaniu trzech zewnętrznych jonów do wiązań
krystalicznych jest następująca 1s 2s2 2p6 3s2 3p6 3d3 .
30000
Struktura energetyczna opisana jest przy pomocy diagramu Tanabe - Sugano
2
40000
A2
2
2
2
T2 T1 T2
35000
1
)
20000
173
2
T1
T1
2
2
E T1
2
T2
2
A1
2
4
T1(b)
2
4
T 1(b)
2
T2
T1
30000
2
E
W stanie podstawowym wszystkie spiny 3 elektronów zkierowane są w jedna stronę 3A2
konfiguracja elektronowa jest t3, tzn funkcje falowe są xy, yz, zx . Mozęmy wzbudzić ukłąd
na dwa sposoby : albo wzbudzić jeden elektron ze stany t do e ( wzbudzona konfiguracja
elektronowa t2e ) bez odwracania spinu ( kład znajduje się w stanie zbudzonym 4T2 albo
zmienić spin jednego z elektronów nie zmieniając konfiguracji wówczas mamy stan 2E.
Kryształ Al2O3:Cr3+ był pierwszym materiałem laserowym ( laser rubinowy )
Pompowanie jonów Cr3+ odbywa się przez absorpcję 4A2→4T2 lub 4A2→4T1b. Następnie
następuje bezpromienista relaksacja układu do stanu 2E . Przy wystarczająco silnym
wzbudzeniu pojawia się inwersja obsadzeń i akcja laserowa 2E→ 4A2. Laser rubinowy jest
typowym laserem trójpoziomowym.
174
luminescencja jonów Cr3+
Wykład 19a
Struktura energetyczna jonu Pr3+ w krysztale YAG ( Y3 Al5O12)
Jon Pr 3+ posiada 2 elektrony walencyjne w powłoce 4f. Rozważając spin możemy mieć do
czynienia ze stanami singletowymi ( S=0, 2S+1=1) oraz trypletowymi S=1 ( 2S+1=3).
Całkowity hamiltonian układu daje się zapisać w postaci :
H = H F + H CR
(1)
Hamiltonian swobodnego jonu H F może być zapisany w postaci,:
(1a)
H F = ∑ f i F (i ) + H s −o
i
Gdzie Fk ( tzw całki Slatera) opisują oddziaływanie pomiędzy elektronami f , H s − o opisuje
oddziaływanie spin-orbita .
∞
∞
r<k
2
Fk = e ∫ dr1 ∫ dr2 k +1 [ R f (r1 ) R f (r2 )]2
k>
0
0
gdzie r< i r> są odpowiedni mniejszą i większą spośród wartości r1 i r2 . Bez uwzględnienia
oddziaływania spin-orbita energie termów jonu Pr3+ wyrażają się następująco.
E ( 3 H ) = F0 − 25 F2 − 51F4 − 13F6
E ( 3F ) = F0 − 10 F2 − 33F4 − 286 F6
E (1G ) = F0 − 30 F2 + 97 F4 + 78 F6
E (1D) = F0 + 19 F2 − 99 F4 + 715 F6
(1b)
E ( P) = F0 + 45 F2 + 33F4 − 1287 F6
3
E (1I ) = F0 + 25 F2 + F4 + F6
E (1S ) = F0 + 60 F2 + 198 F4 + 1716 F6
Hamiltonian oddziaływania spin –orbita dany jest wzorem
H s −o =
η2
2 m 2c 2
1 dV (ri )
s i li
dr i
i
∑r
i =1 , 2
lub
H S −O =
∑
i =1 , 2
ζ i s i li
gdzie
ζi =
η2
2m 2 c 2
∫R
2
f
(ri )
1 dV (ri )
dr i
ri dr i
i powoduje dodatkowe rozszczepienie stanów ze względu na różne J
Struktura energetyczna jonu Pr3+ uwzględniająca oddziaływanie spin -orbita przedstawiona jest na rysunku 1.
175
Fig. 1
176
Pole krystaliczne opisane jest przez hamiltonian w postaci.
H CR = ∑ Bqk C qk
(2)
k ,q
k
q
Gdzie współczynniki B reprezentują całki typu
∑
∫ dr R
l
i
a
2
f
( ri ) ri k
k +1
l
Y qk (θ l , φ l ) gdzie l numeruje
ligandy .Wpływ pola krystalicznego o różnej symetrii przedstawiony jest na rysunku 2. Symbolem Oh
oznaczono pole o symetrii kubicznej, symbolem D2 oznaczono pole o niższej symetrii. Obniżenie symetrii
polega na skręceniu kubika o pewien kąt ( skręcenie podstawy) oraz wydłużeniu wzdłuż jednej z przekątnych
podstawy.
To dodatkowe obniżenie symetrii powoduje całkowite zniesienie degeneracji stanów jonu
Pr3+. W tabeli 1. Podane są wartości parametrów pola krystalicznego B qk dla pola D2 i pola o
symetrii kubicznej Oh. Zauważamy, że istnieje z 3 równoważne zbiory parametrów dających
te same energie stanów. Spowodowane jest to niezmienniczością układów fizycznych ze
względu na permutacje osi układu współrzędnych. układu współrzędnych. Przypadku pola
krystalicznego , którego nie zmienia operacja inwersji możliwe jest 6 równoważnych
zestawów parametrów B qk .
Fig. 2
Oh
1
D2
D2
T2
Γ2
Γ1
E
Γ2
Γ1
E
3
H4
Γ4
Γ1
Γ3
Γ4
Γ3
Γ1
T1
A1
Γ2
T2
Γ4
Γ1
Γ3
Table 2
177
Enegies of the 3H4 and 1D2 states in crystal filed of D2 symmetry. The data have been obtained
from diagonalization of the total Hamiltonian that includes the cubic contribution to the
crystal field described by - Bqk (cub) the and the D2 symmetry crystal field described by Bqk .
Experimental data have been taken from paper [x4].
State|
symmetry
Cubic (Oh)
representation
3
1
H4
D2
D2
Experiment
(cm-1)
T2
Energy
(cm-1)
0
Representation
Index Γ
3
1
4
Energy
(cm-1)
0
20
40
A1
565
2
494
T1
595
1
3
4
506
506
532
E
670
E
16463
1
2
1
2
754
759
16455
16462
16400
16409
T2
17092
1
3
4
16925
17137
17171
16867
17082
17117
0
19
50
533
576
742
Table 1. Bqk coefficients . Set 1 is taken from the best fit performed by Gruber at. all [x4].
The sets 2 and 3 have been obtained according to the rules form the paper [x7] We have used
the set 3 for further consideration.
Set 1
Set 2
Set 3
∆Bqk
Bqk (cub)
20
481.0
-89.9
-391.1
-391
22
123.0
356.1
-233.1
-233.1
40
-146.0
531.3
-3023.1
-61.6
42
-2248.0
-1819.7
-428.3
-428.3
-2961.5
Table 3.
178
44
-1139.0
-1705.6
1268.2
-501.8
60
-1653.0
-1210.7
1024.5
-36.3
1770.0
1060.5
62
-772.0
-426.5
334.6
334.6
64
869.0
987.2
1584.6
-405.3
1989.9
66
-656.0
-1121.7
7.2
7.2
Parameters describing the (PrO)8 system. Quantities in the firs row represent the cubic
symmetry, Quantities in the second row represent the D2 symmetry. Third row contains the
pressure coefficients of the respective angles.
R1
R2
θ1
θ2
φ1
φ2
2.23115
2.23115
125.26
125.26
-180
90
2.3030 Å
2.4323 Å
123.86 º
125.94º
-192.52º
81.24º
0
0
-0.03º/kbar
0.06 º/kbar
Na rys 3 przedstawiona jest schematycznie strefa koordynacyna jinu Pr3+
2
R1
1
R1
8
R2
R2
7
6
R2
R2
5
R1
4
Wykład 20
R1
3
x
Inne defekty punktowe.
Charakterystyczną cechą kryształów jest uporządkowane, periodyczne rozmieszczenie
cząstek, atomów lub jonów w przestrzeni. Jednak niezakłócona powtarzalność elementów
strukturalnych istnieje tylko w hipotetycznym krysztale idealnym. W kryształach
rzeczywistych występują zawsze w mniejszym lub większym stężeniu różnego rodzaju
zakłócenia periodycznej budowy sieci krystalicznej. Takie zakłócenia określane są nazwą
defektów strukturalnych lub sieciowych. W kryształach jonowych mogą istnieć trzy grupy
defektów
1 defekty termodynamicznie nieodwracalne (pęknięcia, mikroszczeliny, dyslokacje, defekty
płaskie).
2. defekty termodynamicznie odwracalne - defekty punktowe.
3. defekty związane z domieszkami.
179
Rodzaje defektów punktowych
Defektami punktowymi nazywa się zakłócenia periodycznej budowy sieci krystalicznej,
spowodowane brakiem atomu lub jonu w określonym węźle sieci albo obecnością
dodatkowego atomu w pozycji międzywęzłowej. Stężenie takich defektów zależy od
temperatury oraz od rodzaju i ciśnienia otoczenia kryształu. Defektem punktowym jest także
atom obcej domieszki oraz, w przypadku związków chemicznych, atom w położeniu
węzłowym, jednakże w miejscu drugiego składnika (tzw. anti-site ).
W kryształach jonowych nie wykazujących odstępstw od składu stechiometrycznego można
wyróżnić pięć typów zdefektowania struktury krystalicznej:
1. Kationy w przestrzeni międzywęzłowej oraz równoważna liczba pustych węzłów w
podsieci kationowej (defekt typu Frenkla). Zdefektowanie to powstaje na skutek przejścia
pewnej liczby kationów z węzłów sieci krystalicznej do przestrzeni międzywęzłowych.
2. Aniony w przestrzeniach międzywęzłowych i równoważna liczba pustych węzłów w
podsieci anionowej (defekt typu anty-Frenkla). W tym przypadku pewna liczba anionów
opuszcza węzły sieci krystalicznej i przechodzi do przestrzeni międzywęzłowych.
3. Równoważna liczba pustych węzłów w podsieci kationowej i anionowej (defekt typu
Schottky'ego). Zdefektowanie takiego typu tworzy się w wyniku opuszczenia przez
równoważną liczbę kationów i anionów swoich położeń w węzłach sieci i ich dyfuzji do
powierzchni kryształu, gdzie następuje nadbudowa nowych elementów sieci.
4. Równoważna liczba kationów i anionów w przestrzeniach międzywęzłowych (defekt typu
anty-Schottky'ego). W tym przypadku pewna liczba kationów i anionów znajdujących się w
powierzchniowej warstwie kryształu opuszcza swoje położenia w węzłach sieci i wbudowuje
się do przestrzeni międzywęzłowych.
5. Pewna liczba kationów zamienia się swoimi położeniami w węzłach sieci z anionami.
Ostatni typ zdefektowania jest mało prawdopodobny w kryształach jonowych ze względu na
to, że siły elektrostatycznego odpychania się jonów tego samego znaku przeciwdziałają
znacznemu zbliżeniu się kationów lub anionów w sieci krystalicznej.
Na Rys. 1 przedstawiono schematycznie modele zdefektowania sieci krystalicznej związków
o składzie stechiometrycznym,
+
+
+
- +
zaproponowane przez Frenkla i Schotky'ego
- + - +
- + - +
.
+
- + - +
Defekty występujące w trójskładnikowych
+
+
+
- +
- + - +
- + - +
+
kryształach tlenkowych przyjęto oznaczać
- + - + - + - + - + zgodnie z symboliką Krögera i Vinka
+
+
+
- +
- + - +
- + - +
AB, AO, BA,BO, OA, OB - atomy w
niewłaściwych węzłach sieci,
a
b
c
Rys. 1. Modele zdefektowania sieci
Ai, Bi, Oi - atomy w położeniach
krystalicznej związków
międzywęzłowych,
VA, VB, VO - nie zajęte węzły odpowiednich dwuskładnikowych
defekty typu a - Frenkla, b- antypodsieci, czyli luki (wakansje)
Frenkla, c- Schottky'ego, d - antyJon w prawidłowym położeniu węzłowym
Schotky'ego, e - kationów zamienia się
posiada względem sieci zerowy ładunek
elektryczny. Z kolei brak kationu lub anionu swoimi położeniami w węzłach sieci z
anionami.
w danym węźle sieci jest równoznaczny z
brakiem w tym położeniu odpowiedniego
ładunku elektrycznego. Luka kationowa posiada więc efektywny ładunek ujemny, zaś luka
anionowa - dodatni. Efektywny dodatni ładunek oznacza się przez "•", a ujemny " ' ".
Z warunków obojętności elektrycznej można przedstawić równanie zdefektowania
samoistnego typu Schottky’ego w związkach ABO3 (AIIIBIIIO3) i A3B5O12 i w następujący
sposób:
180
0 ↔ 3VO•• + V A′′′+ VB′′′
0 ↔ 12VO•• + 3V A′′′+ 5VB′′′
“0” oznacza kryształ niezdefektowany.
W wyniku dyfuzji atomów do powierzchni kryształu wewnątrz kryształu powstają
zjonizowane luki anionowe i kationowe.
Tak samo z warunków obojętności elektrycznej, tworzenie defektów Frenkla może być
zapisane następująco:
AAx ↔ V A′′′+ Ai•••
BBx ↔ VB′′′+ Bi•••
OOx ↔ VO•• + Oi′′
Jon z pozycji węzłowej przechodzi w pozycje międzywęzłową, w wyniku czego powstaje
luka.
Ze względu na gęsto upakowaną strukturę, rozmiary jonów, ich elektroujemność,
występowanie niektórych defektów jest mało prawdopodobne. Według autorów pracy [i]
najczęściej występującymi defektami punktowymi w strukturze perowskitu są luki VA,VO i
VB.
Niestechiometria kryształów
Oprócz defektów samoistnych w kryształach mogą istnieć także defekty chemiczne, związane
z odchyleniem od prawidłowego składu stechiometrycznego. Defekty te powstają w procesie
wzrostu kryształów i ich koncentracja nie ulega zmianie w trakcie chłodzenia kryształu do
temperatury pokojowej. Właśnie w taki sposób proces technologiczny wywiera istotny wpływ
na własności kryształów. Stężenie defektów chemicznych można zmienić przez odpowiednią
obróbkę cieplną, polegającą na wygrzewaniu kryształu w atmosferze tlenu, par tlenku jednego
ze składników, w atmosferze redukującej lub gazu obojętnego. Przykładowe równanie quasichemiczne opisujące powstanie defektów punktowych związanych z niestechiomerią można
przedstawić w następujący sposób :
A A ↔ VA′′′ + 3h • + A ↑
B B ↔ VB′′′ + 3h • + B ↑
W wyniku przejść jonów A i B do fazy otaczającej kryształ powstają luki w podsieciach A
lub B i równoważna liczba dziur (jako nośników ładunku), dzięki czemu zachowuje się
neutralność elektryczna kryształu.
O O ↔ VO•• + 2e − + 1 / 2O 2 ↑
Ostatnia reakcja może zachodzić podczas wzrostu kryształu w warunkach redukujących lub
podczas obróbki cieplnej przy obniżonym ciśnieniu parcjalnym tlenu. W wyniku tej reakcji
powstają luki w podsieci tlenowej i równoważna liczba quasi-swobodnych elektronów. Luka
VO stanowi więc centrum donorowe, a luki VA i VB - centra akceptorowe.
Defekty i własności optyczne
Badania centrów barwnych w kryształach rozpoczęto po I Wojnie Światowej, kiedy w
"czystych" kryształach zaobserwowano pasma absorpcji, które powodowały ich zabarwienie.
To zabarwienie kojarzone było wtedy z obecnością centrów barwnych, w języku niemieckim
Farbencentrum, wprowadzanych do kryształów podczas ich hodowania. Stąd takie centra
nazywano dla uproszczenia centrami F. Później, po długich badaniach okazało się, że
przyczyną pojawienia się zabarwienia w kryształach są izolowane wakansje, na których są
spułapkowane elektrony lub dziury .
Dzisiaj do klasyfikacji centrów barwnych używa się oznaczeń zaproponowanych przez
Sondera i Sibley'go [ii].
181
Centrami F-typu przyjęto nazywać elektronowe centra związane z defektami w podsieci
anionowej. W przypadku kryształów tlenkowych najprostsze centrum elektronowe kreuje się
poprzez spułapkowanie jednego lub dwóch elektronów na luce tlenowej. W pierwszym
przypadku tworzy się F+- centrum, które jest analogiem F-centrów w kryształach
halkogenków metali. Luka z dwoma elektronami tworzy tak zwane centrum F, które jest
elektrycznie neutralne i diamagnetyczne.
Centra F+ i F mają pasma absorpcji i luminescencji. W stanie podstawowym F -centrów dwa
elektrony ustawiają swoje spiny antyrównolegle tworząc singlet 1A1g pochodzący z
helopodobnej konfiguracji (1s2). Stany wzbudzone otrzymuje się od dwóch elektronów w
konfiguracjach (1s)(2s) lub (1s)(2p). Niestety, porządek stanów wzbudzonych 1T1u, 3A1u i 3T1u
jest trudny do ustalenia poprzez badania eksperymentalne.
Pasmo F+ odpowiada przejściu optycznemu ze stanu podstawowego A1g do stanu
wzbudzonego T1u.
Oprócz F-centrów elektronowych w kryształach tlenkowych mogą występować centra
dziurowe - tak zwane V centra. Takie centrum to luka anionowa razem ze spułapkowaną
dziurą, czyli jonem O- w najbliższym sąsiedztwie luki.
Wykład 21
Termodynamika defektów punktowych
Niech Ef będzie energią potrzebną na utworzenie jednego defektu ( np. defektu Frenkla ).
Niech N oznacza koncentrację atomów węzłowych a N* koncentrację możliwych położeń
międzywęzłowych, z kolei n niech będzie liczbą atomów, które w temperaturze T , w stanie
równowagi termodynamicznej znajdują się w położeniach międzywęzłowych.
Ponieważ n atomów przeniesiono do pozycji międzywęzłowych energia kryształu wzrosłą o
U = nE f . Proces przenoszenia atomów jest izotermiczno-izochoryczny, ponieważ i
temperaturę i objętość jest stała. Funkcją stanu stosowaną do opisu procesów izotermiczno izochorycznych jest energia swobodna ( funkcja Helmholtza).
F (n) = nE f − TS
( 1)
gdzie T jest temperaturą a S entropią układu. W warunkach równowagi termodynamicznej
funkcja F(n) osiąga minimum . Mamy więc:
∂S
∂F
=0
= Ef −T
∂n
∂n T
(2)
Wkład do entropii pochodzący od defektów Frenkla wyraża się wzorem .
S = k B ln P ,
(3)
gdzie k B to stałą Boltzmanna a Prawdopodobieństwo termodynamiczne związane z
powstawaniem defektów Frenkla
P jest iloczynem dwóch prawdopodobieństw cząstkowych P1 ( liczba możliwych sposobów
rozmieszczenia n atomów w położeniach międzywęzłowych,) i P2 ( liczba możliwych
sposobów rozmieszczenia n luk w położeniach węzłowych
182
N *!
( N * − n)!n!
(4)
N!
P2 =
( N − n)!n!
Gdy defekty są odległe od siebie prawdopodobieństwa P1 i P2 są od siebie niezależne.
Podstawiając (4) do (3) otrzymamy
P1 =
N *!
N!
(5)
S = k ln( P) = k ln( P1 P2 ) = k (ln P1 + ln P2 ) = k ln
+ ln
( N − n)!n!
( N * − n)!n!
W obliczeniach wykorzystuje się wzór Stirlinga
ln(n!) ≈ n ln n − n
(6)
otrzymamy
N!
= ln N !− ln( N − n)!− ln n!≈ N ln N − N − ( N − n) ln( N − n) + N − n − n ln n − n =
( N − n)!n!
N ln N − n ln( N − n) + n ln( N − n) − n ln n
(7)
ln
Obliczmy pochodną:
∂
(N ln N − n ln( N − n) + n ln( N − n) − n ln n ) = N + ln( N − n) − n − 1 − ln n ≈ ln N
∂n
N −n
N −n
n
(8)
Stąd
∂S
NN *
= k ln 2
∂n
n
(9)
Równanie (2) wygląda teraz następująco.
E f = kT ln
NN *
n2
(10)
Możemy stąd obliczyć ilość defektów Frenkla w danej temperaturze
183
n 2 (T ) = NN * exp(−
Ef
kT
)
(11)
n(T ) = NN * exp(−
Ef
2kT
)
Ilość defektów Shotkiego ( same luki) policzymy jeśli zauważymy, że w tym przypadku
N!
S = k ln P = k
( N − n)!n!
n(T ) = N exp(−
Es
) (12)
kT
Es jest energią potrzebną do przeniesienia atomu z węzła sieci na powierzchnię.
184