Zastosowanie wykładniczo skorelowanych funkcji
Transkrypt
Zastosowanie wykładniczo skorelowanych funkcji
Zastosowanie wykładniczo skorelowanych funkcji
Gaussa do wyznaczania struktury elektronowej
wielojądrowych układów dwuelektronowych
Rafał A. Bachorz
Poznań 2004
Praca magisterska wykonana
w Pracowni Chemii Kwantowej Wydziału Chemii
Uniwersytetu im. Adama Mickiewicza w Poznaniu pod
kierunkiem doktora habilitowanego Jacka Komasy
Pragnę złożyć serdeczne podziękowania panu
doktorowi habilitowanemu Jackowi Komasie za
życzliwość oraz wszechstronną pomoc w przygotowywaniu niniejszej pracy.
Pracę tę poświęcam pamięci
profesora Jacka Rychlewskiego. . .
Spis treści
1 Wstęp
2 Podstawy chemii kwantowej
2.1 Równanie Schrödingera . . . . . . . . . . . . . . . . . . .
2.2 Abstrakcyjna przestrzeń wektorów stanu . . . . . . . . . .
2.3 Kety i bra. Notacja Diraca . . . . . . . . . . . . . . . . . .
2.4 Postulaty mechaniki kwantowej . . . . . . . . . . . . . . .
2.5 Przybliżenie Borna–Oppenheimera . . . . . . . . . . . . .
2.6 Przybliżone metody rozwiązywania równania Schrödingera
2.6.1 Zasada wariacyjna . . . . . . . . . . . . . . . . . .
2.6.2 Metoda wariacyjna . . . . . . . . . . . . . . . . . .
2.6.3 Metoda Ritza . . . . . . . . . . . . . . . . . . . . .
1
.
.
.
.
.
.
.
.
.
4
4
5
6
7
10
11
12
13
14
3 Problem korelacji elektronowej
3.1 Przybliżenie jednoelektronowe i równania Hartree–Focka . . . . . . . . . . . . . .
3.2 Pojęcie korelacji elektronowej . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Metoda mieszania konfiguracji . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
16
18
19
4 Funkcje jawnie skorelowane stosowane w chemii kwantowej
4.1 Funkcje Hyllerassa i Jamesa-Coolidge’a . . . . . . . . . . . . . . . . . . . .
4.2 Metoda Hylleraas-CI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Wykładniczo skorelowane funkcje Gaussa . . . . . . . . . . . . . . . . . . .
4.3.1 Wykładniczo skorelowane funcje Gaussa falowe z członami liniowymi
4.4 Czynniki korelujące Jastrowa . . . . . . . . . . . . . . . . . . . . . . . . . .
20
20
22
23
24
24
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5 Zastosowanie wykładniczo skorelowanych funkcji Gaussa do
elektronowych
5.1 Postać funkcji falowej i całki molekularne . . . . . . . . . . . . .
5.1.1 Twierdzenie o iloczynie funkcji Gaussa . . . . . . . . . . .
5.1.2 Transformacje i wzory pomocnicze . . . . . . . . . . . . .
5.1.3 Całka nakrywania S2 . . . . . . . . . . . . . . . . . . . . .
5.1.4 Całki energii potencjalnej E2 i N21 . . . . . . . . . . . . .
5.1.5 Całka energii kinetycznej K21 . . . . . . . . . . . . . . . .
5.2 Funkcja błędu . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Ortonormalizacja Masamury . . . . . . . . . . . . . . . . . . . . .
5.4 Standardowe zagadnienie własne . . . . . . . . . . . . . . . . . .
5.4.1 Metoda Householdera . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
układów dwu.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
26
26
28
30
32
33
35
37
38
39
39
SPIS TREŚCI
5.4.2
Rafał A. Bachorz
Niejawny algorytm QL/QR . . . . . . . . . . . . . . . . . . . . . . . . . .
41
6 Optymalizacja parametrów nieliniowych
6.1 Część preoptymalizacyjna . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1.1 Losowe generowanie wszystkich współczynników, algorytm SHOTS
6.1.2 Wstępna optymalizacja bazy, algorytm MONTEC . . . . . . . . .
6.1.3 Systematyczne budowanie bazy, algorytm VARDIME . . . . . . .
6.1.4 Metody preoptymalizacyjne – podsumowanie . . . . . . . . . . . .
6.2 Optymalizacja właściwa . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2.1 Metoda sprzężonych kierunków Powella . . . . . . . . . . . . . . .
6.2.2 Metoda sympleks . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2.3 Metody optymalizacji właściwej – podsumowanie . . . . . . . . . .
6.3 Organizacja procesu obliczeniowego . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
44
45
45
45
46
47
47
48
50
52
53
7 Obliczenia dla układów dwuelektronowych
7.1 Atom helu i atomy helopodobne . . . . . .
7.2 Cząsteczka wodoru . . . . . . . . . . . . . .
7.3 Cząsteczka He2+
. . . . . . . . . . . . . . .
2
+
7.4 Cząsteczka HeH . . . . . . . . . . . . . . .
7.5 Cząsteczka H+
. . . . . . . . . . . . . . . .
3
7.6 Cząsteczka H2+
.
. . . . . . . . . . . . . . .
4
7.6.1 Konfiguracja tetraedrycznej Td . . .
7.6.2 Konfiguracja trójkątna D3h . . . . .
7.6.3 Konfiguracja kwadratowa D4h . . . .
7.6.4 Konfiguracja liniowa D∞h . . . . . .
7.6.5 Cząsteczka H2+
4 – podsumowanie . .
7.7 Układy dwuelektronowe – podsumowanie .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
55
55
58
61
62
62
67
68
70
70
71
73
74
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8 Podsumowanie
75
A Obsługa programu GEMINI
A.1 Opis programu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.2 Zawartość płyty CD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
76
80
2
Spis rysunków
1.1
Intensywność promieniowania ciała doskonale czarnego w ujęciu teorii klasycznej
i kwantowej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
5.1
Twierdzenie o iloczynie funkcji Gaussa . . . . . . . . . . . . . . . . . . . . . . . .
29
6.1
6.2
6.3
Schemat działania metody złotego podziału . . . . . . . . . . . . . . . . . . . . .
Zbieżność do minimum w metodzie odwrotnej interpolacji parabolicznej . . . . .
Operacje wykonywane na sympleksie . . . . . . . . . . . . . . . . . . . . . . . . .
50
51
53
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
Atom helopodobny . . . . . . . . . . . . . . . . . . . .
Cząsteczka dwuatomowa . . . . . . . . . . . . . . . . .
Krzywa energii potencjalnej cząsteczki He2+
2 . . . . . .
+
Cząsteczka H3 w konfiguracji trójkąta równobocznego
Cząsteczka H+2
4 w konfiguracji tetraedrycznej . . . . .
Cząsteczka H+2
4 w konfiguracji trójkątnej . . . . . . .
Cząsteczka H+2
4 w konfiguracji kwadratowej . . . . . .
Cząsteczka H+2
4 w konfiguracji liniowej . . . . . . . . .
56
60
61
64
69
70
71
72
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Spis tabel
6.1
6.2
Porównanie algorytmów preoptymalizacyjnych . . . . . . . . . . . . . . . . . . .
Porównanie algorytmów optymalizacyjnych . . . . . . . . . . . . . . . . . . . . .
47
52
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
7.11
7.12
7.13
7.14
7.15
7.16
7.17
7.18
Atom helu, część preoptymalizacyjna . . . . . . . . . . . . . . . . .
Atom helu, optymalizacja właściwa . . . . . . . . . . . . . . . . . .
Atom helu, wyniki najdokładniejsze uzyskane metodą Powella . . .
Atom helu, rożne stany . . . . . . . . . . . . . . . . . . . . . . . .
Jon H− , metoda Powella . . . . . . . . . . . . . . . . . . . . . . . .
Jon Li+ , metoda Powella . . . . . . . . . . . . . . . . . . . . . . . .
Wartości energii stanu podstawowego cząsteczki H2 . . . . . . . . .
Wartości energii stanu podstawowego cząsteczki He2+
. . . . . . .
2
Wartości energii stanu podstawowego cząsteczki HeH+ . . . . . . .
Wartości energii dla nowych konfiguracji jąder . . . . . . . . . . . .
Przykładowy zestaw punktów . . . . . . . . . . . . . . . . . . . . .
Wartośći energii stanu podstawowego cząsteczki H+
. . . . . . . .
3
2+
Wartości energii stanu podstawowego cząsteczki H4 w konfiguracji
Wartości energii stanu podstawowego cząsteczki H2+
4 w konfiguracji
Wartości energii stanu podstawowego cząsteczki H2+
4 w konfiguracji
Wartości energii stanu podstawowego cząsteczki H2+
4 w konfiguracji
Cząsteczki H2+
–
zestawienie
końcowe
.
.
.
.
.
.
. . . . . . . . . .
4
Układy dwuelektronowe – zestawienie końcowe . . . . . . . . . . .
56
57
57
58
58
59
60
62
62
66
68
69
70
71
72
72
73
74
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
tetraedrycznej
trójkątnej . .
kwadratowej
liniowej . . .
. . . . . . . .
. . . . . . . .
A.1 Symetria przestrzenna w programie GEMINI . . . . . . . . . . . . . . . . . . .
A.2 Schemat pliku wsadowego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.3 Oznaczenia zmiennych w pliku wsadowym . . . . . . . . . . . . . . . . . . . . . .
76
77
78
Wszystko zaczęło się od porządku i tak się
skończy i tak się znów zacznie, zgodnie z
prawodawcą porządku i mistyczną matematyką
niebios.
Sir Thomas Browne
Rozdział 1
Wstęp
Już od dawna wiadomo, że rozwój nauki determinowany jest przez dwa, czasami konkurujące nurty: eksperyment i teorię. Bez cienia wątpliwości można stwierdzić, że dopiero obie te
części dają nam możliwość opisu świata. Nauki doświadczalne dostarczają informacji, stwiedzają pewne fakty. Zadaniem nauk teoretycznych natomiast jest próba połączenia tych faktów,
zbudowanie modelu. Model ten powinien pozwalać na przewidywanie nowych zjawisk, wcześniej niedostępnych. Tutaj znów teoria opiera się na danych eksperymentalnych. Pozwalają one
zweryfikować poprawność modelu, znaleźć jego słabe strony i w konsekwencji go udoskonalić. Doskonalenie modelu teoretycznego jest czynnością nieustannie towarzyszącą naukowcom. Polega
ono na konsekwentnym dążeniu do zgodności z doświadczeniem, dążeniu opartym na rozsądnych
i wiarygodnych przesłankach. Jednak podstawą każdej teorii fizycznej czy matematycznej są postulaty. Koniecznść istnienia postulatów jest czymś naturalnym. Nie można ich w żaden sposób
wyprowadzić ani udowodnić. Można jedynie szukać ich uzasadnienia konfrontując je z danymi
doświadczalnymi. W matematyce na przykład mamy pięc postulatów Euklidesa, które definiują
nam takie pojęcia jak punkt, prosta czy płaszczyzna. Całą mechanikę klasyczną można zbudować opierając się na zasadzie najmniejszego działania, a elektrodynamika klasyczna sprowadza
się do czterech równań Maxwella. Wydaje się, że obecność postulatów w pewnym sensie łączy
wszystkie dziedziny nauk ścisłych. Wszystkie one mają swój początek w kilku podstawowych
stwierdzeniach, na bazie których można wyciągać daleko idące wnioski. Nie ma tutaj znaczenia
czy jest to mechanika budowli czy chemia organiczna. Jedna i druga dążąc do opisu rzeczywistości istnieje dzięki kilku podstawowym założeniom. Można więc stwierdzić, że praca naukowca
teoretyka z jednej strony polega na poszukiwaniu owych podstawowych założeń – postulatów, z
drugiej zaś na nabywaniu umiejętności wyciągania z nich wniosków.
Teoria kwantów powstała na przełomie XIX i XX wieku, a jej geneza związana jest z próbą
wyjaśnienia rozkładu energii w widmie promieniowania ciała doskonale czarnego. Ciało doskonale czarne możemy wyobrazić sobie jako pudełko wykonane z dowolnego materiału z otworem.
Promieniowanie, które wydobywa się z tego otworu po ogrzaniu nazywamy promieniowaniem
ciała doskonale czarnego. Gdy do opisu tego zjawiska zastosujemy prawa mechaniki klasycznej,
tak jak to zrobili Rayleigh i Jeans w 1900 roku [1], to dojdziemy do paradoksu. Z obliczeń otrzymamy, że im wyższa częstość promieniowania, tym większa jest jego intensywność co przeczy
zdrowemu rozsądkowi (rys. 1.1). Pierwszy krok na drodze do zrozumienia tego zjawiska udało
się uczynić Maxowi Planckowi w 1900 roku [2]. Zaproponował on wyjaśnienie widma promieniowania ciała doskonale czarnego zakładając, że promieniowanie elektromagnetyczne może być
emitowane i absorbowane tylko w postaci dyskretnych porcji tzw. kwantów. Każdy z kwantów
IntensywnoϾ
Rafał A. Bachorz
1
1
teoria klasyczna
2
teoria kwantowa
2
Czêstoœæ
Rysunek 1.1: Intensywność promieniowania ciała doskonale czarnego w ujęciu teorii klasycznej
i kwantowej
niesie ze sobą energię E, która jest równa co do wartości częstości promieniowania ν pomnożonej
przez uniwersalną stałą fizyczną h, zwaną stałą Plancka
E = hν = ℏω.
(1.1)
Bez wielkiego ryzyka można stwierdzić, że to równanie stanowi podstawę mechaniki kwantowej.
Koncepcja kwantyzacji energii pozwoliła na właściwe oszacowanie intensywności promieniowania ciała doskonale czarnego, doprowadziła do zgodności między teorią a doświadczeniem. Tak
wyglądały początki nowej dziedziny fizyki teoretycznej – mechaniki kwantowej.
Dzisiaj mechanika kwantowa stosowana jest w wielu gałęziach nauk przyrodniczych. Jej echa
można dostrzec w elektronowej teorii ciała stałego czy nowoczesnej teorii półprzewodników. Odnosi ona również niemałe sukcesy przy opisie cząsteczek. Chemia kwantowa, czyli zastosowanie
mechaniki kwantowej do problemów opisu molekuł i wiązania chemicznego jest bardzo ważnym
narzędziem nowoczesnego badacza chemika. Za poczatek tej nauki uważa się rok 1927, w którym to Heitler i London oszacowali energię stanu podstwowego cząsteczki wodoru [3]. Jest to
bardzo ważny moment w dziejach nauki. W tym roku zostaje potwierdzona prawdziwość teorii.
Okazuje się, że bardzo sformalizowana matematycznie mechanika kwantowa poprawnie przewiduje własności cząsteczek. Był to niewątpliwie pierwszy triumf chemii kwantowej. Drugim
równie dużym sukcesem było bardzo dokładne wyznaczenie energii dysocjacji cząsteczki wodoru
przez dwóch polskich naukowców: Włodzimierza Kołosa i Lutosława Wolniewicza [4]. Opierając
się na przesłankach fizycznych i doskonałej intuicji naukowej zaproponowali oni wykorzystanie
pewnej funkcji próbnej. Okazała się ona tak dobra, że rezultaty otrzymane za jej pomocą przewyższyły dokładnością znane wówczas wyniki doświadczalne [5]. Efektem tego było powtórne
przeprowadzenie eksperymetu przez Herzberga [6], co potwierdziło słuszność wyników Kołosa i
Wolniewicza. Nieczęsto zdarzają się tak spektakularne sukcesy nauk teoretycznych. Kołosowi i
Wolniewiczowi udało się zweryfikować wynik eksperymentalny, pokazali oni, że umiejętne stosowanie teorii fizycznej pozwala bezbłędnie opisywać rzeczywistość.
Współczesna chemia kwantowa stanowi integralną część nauk chemicznych. Wyraźnie widać, że
2
Rafał A. Bachorz
dzieli się ona na dwa nurty: obliczenia wysokiej dokładności relatywnie małych układów oraz
mniej dokładny opis większych cząsteczek. Każda z tych dziedzin ma swoją specyfikę i dobrze
znane ograniczenia. Jedna i druga wymaga dużej ilości pracy zarówno tej wykonanej przez człowieka jak i tej, którą poźniej wykonuje komputer. Dlatego też bardzo intensywnie poszukuje
się nowych pomysłów, które pozwalają na coraz to wydajniejsze stosowanie chemii kwantowej.
Koncepcje te wykorzystuje się do ulepszania narzędzi, które służą poźniej do wnikania w głąb
mikroświata, odkrywania jego tajemnic.
Celem tej pracy jest zastosowanie pewnej klasy funkcji, wykładniczno skorelowanych funkcji
Gaussa (ang. exponentially correlated Gaussians) do wyznaczania struktury elektronowej wielojądrowych układów dwuelektronowych. Integralną częścią pracy jest program komputerowy
GEMINI . Dodatek A jest pełnym, z punktu widzenia użytkownika, opisem tego narzędzia.
Może ono być wykorzystane do wyznaczenia energii elektronowej dowolnego atomowego lub
molekularnego układu dwuelektronowego.
3
Rozdział 2
Podstawy chemii kwantowej
2.1
Równanie Schrödingera
Jak już wspomniano we wstępie każda teoria fizyczna musi opierać się na pewnych fundamentach. Bez wątpienia podstawowym równaniem nierelatywistycznej mechaniki kwantowej jest
równanie Schrödingera [7]. Ma ono charakter postulatu, nie ma możliwości wyprowadzenia tego
równania. Można przeprowadzić tzw. heurezę dojścia do równania Schödingera, ale w sposób
ścisły nie można go wyprowadzić z bardziej podstawowych zasad. Równanie to można zapisać
w następującej postaci
iℏ
ℏ2 2
∂Ψ(r , t)
=−
∇ Ψ(r , t) + V (r , t)Ψ(r , t).
∂t
2m
(2.1)
Nie jest to najbardziej ogólna postać, ponieważ dotyczy jednej cząstki, a nie dowolnego układu
fizycznego. Nieco dalej omówiona zostanie ogólniejsza postać równania Schrödingera, która jest
jednym z postulatów teorii kwantowej.
Jak widać równanie (2.1) jest równaniem różniczkowych drugiego rzędu względem zmiennych
przestrzennych i pierwszego rzędu względem czasu. Rozwiązaniem tego równania jest funkcja
Ψ(r , t), którą nazywamy funkcją falową układu. W drugim składniku po prawej stronie równania występuje wyrażenie V (r , t) oznaczające energię potencjalną cząstki. Gdy zrobimy pewną
analogię do klasycznego związku
P2
+ V (r , t),
(2.2)
Ekl =
2m
to bez trudu zaobserwujemy zależności
∂
−→ E,
∂t
(2.3)
−iℏ∇ −→ P.
(2.4)
iℏ
Widzimy zatem, że wielkościom mierzalnym takim jak energia czy pęd odpowiadają w mechanice
kwantowej operatory. Biorąc pod uwagę zależności (2.3) oraz (2.4) możemy zapisać równanie
(2.1) w nieco ogólniejszej postaci
iℏ
∂Ψ(r , t)
= ĤΨ(r , t),
∂t
(2.5)
2.2 Abstrakcyjna przestrzeń wektorów stanu
Rafał A. Bachorz
gdzie Ĥ jest operatorem zdefiniowanym następującym wzorem
Ĥ = −
ℏ2 2
∇ + V (r , t).
2m
(2.6)
Operator (2.6) nazywamy operatorem Hamiltona (w skrócie hamiltonianem) dla (bezspinowej)
cząstki o masie m poruszającej się w polu, w którym ma ona energię potencjalną V (r , t).
Upraszczając nieco zagadnienie można powiedzieć, że cała nierelatywistyczna chemia kwantowa
sprowadza się do rozwiązywania równania (2.5). Praca chemików kwantowych polega więc na
poszukiwaniu metod, które doprowadzą do uzyskania funkcji falowej Ψ(r , t). Posiadanie funkcji
falowej równoznaczne jest bowiem z posiadaniem całej informacji o badanym układzie. Niestety droga, która prowadzi do rozwiązania równania Schrödingera jest trudna i wymaga wiele
pracy. Analityczne rozwiązania udało się uzyskać dla kilku układów modelowych, takich jak
cząstka swobodna, cząstka w pudle potencjału, oscylator harmoniczny czy wreszcie atom wodoru.
Gdy chemy opisać inne, znacznie bardziej skomplikowane układy, posługujemy się metodami
przybliżonymi. Korzystamy wtedy z dokonań intensywnie rozwijanej gałęzi matematyki zwanej
metodami numerycznymi.
2.2
Abstrakcyjna przestrzeń wektorów stanu
W poprzednim podrozdziale pokazane zostało równanie Schrödingera. Po jego rozwiązaniu otrzymujemy funkcję falową Ψ(r , t), w której to jak wiadomo zawarta jest cała informacja związana z
badanym układem. Dla prostoty wybrana została wtedy tzw. reprezentacja położeniowa. Założyliśmy bowiem wtedy zależność funkcji falowej od położenia. Nic nie stoi jednak na przeszkodzie
aby skonstruować odpowiednik równania Schrödingera, którego rozwiązaniem jest funkcja zależąca od zmiennych pędowych. Decydując się na zależność położeniową, w pewnym sensie wybraliśmy jeden z wielu możliwych układów współrzędnych. Funkcję falową możemy zatem utożsamić
sobie z pewnym abstrakcyjnym wektorem. Wybór zmiennych od których zależy ta funkcja porównać można do wyboru układu odniesienia. Dla zachowania ogólności rozważań dobrze jest
wprowadzić abstrakcyjną przestrzeń wektorów stanu. Wtedy to stan każdego układu fizycznego
(np. cząstki, atomu czy cząsteczki) opisywany jest przez pewien wektor |Ψi (wektor stanu) należący do odpowiednio dobranej, abstrakcyjnej przestrzeni Hilberta H. Przestrzeń Hilberta to
przestrzeń funkcyjna w której zdefiniowany jest iloczyn skalarny. W przestrzeni opisującej stany
układu kwantowego bezwarunkowo musi być zdefiniowany iloczyn skalarny, gdyż jak się poźniej
okaże, umożliwia on utrzymanie probabilistycznej interpretacji mechaniki kwantowej. Na elementy przestrzeni Hilberta należy nałożyć również warunek unormowania, co możemy zapisać
nastepująco
|Ψi ∈ H, kΨk = 1.
Normę tą wyznacza się za pomocą iloczynu skalarnego, który poźniej zostanie dokładnie zdefiniowany. Należy zwrócić uwagę na to, że w wektorze |Ψi nie ma żadnej zależności od położenia r .
Zależność ta pojawia się po przejściu do odpowiedniej reprezentacji, czyli po dokonaniu wyboru
odpowiedniego układu odniesienia1 . Można to porównać z aktem wyboru układu współrzędnych
w klasycznej geometrii euklidesowej. W przestrzeni trójwymiarowej wektor opisywany jest trójką liczb rzeczywistych. Przejście do innego układu współrzędnych powoduje, że ten sam wektor
1
Sformułowania ”układ odniesienia” nie należy traktować dosłownie. Ma to jedynie pomóc w zrozumieniu
istoty tego zagadnienia.
5
2.3 Kety i bra. Notacja Diraca
Rafał A. Bachorz
scharakteryzowany jest przez inną trójkę liczb. Oczywiste jest więc to, że opis wektora nie jest
jednoznaczny. Podobnie jest z elementami przestrzni Hilberta.
2.3
Kety i bra. Notacja Diraca
Niech H oznacza pewną przestrzeń Hilberta. Ketem nazywamy element tej przestrzeni, czyli
po prostu wektor |Ψi ∈ H. Przestrzeń funkcji falowych F i przestrzeń Hilberta H są izomorficzne, lecz dla zachowania ogólności rozważań będą one rozróżniane. W rozważanej przez nas
przestrzeni Hilberta zdefiniowany jest iloczyn skalarny
|Ψi, |Φi ∈ H −→ hΨ|Φi ∈ C
(2.7)
hΨ|Φi = hΦ|Ψi∗ ,
(2.8a)
o następujących własnościach
hΦ|λ1 Ψ1 + λ2 Ψ2 i = λ1 hΦ|Ψ1 i + λ2 hΦ|Ψ2 i,
λ1 , λ2 ∈ C,
hλ1 Φ1 + λ2 Φ2 |Ψi = λ∗1 hΦ1 |Ψi + λ∗2 hΦ2 |Ψi,
hΦ|Φi = kΦk2 ∈ R,
kΦk2 0,
kΦk = 0 ⇐⇒ |Ψi = 0.
(2.8b)
(2.8c)
(2.8d)
(2.8e)
Wektor |Ψi nazwany został ketem. Wygodnie jest nazwać hΦ| jako bra. Iloczyn skalarny hΦ|Ψi
nazywamy ”bra-ketem”. Nazwę tę wprowadził Paul Dirac, ponieważ nawias po angielsku to
bracket. Ścisła matematycznie definicja bra nie jest już taka prosta. Zbiór wszystkich bra tworzy tzw. przestrzeń dualną H∗ , która jest przestrzenią funkcjonałów liniowych działających na
przestrzeni wektorowej H. Szczegóły matematyczne jednak nie są tutaj istotne. Wystarczające
jest stwierdzenie, że bra hΦ| jest obiektem matematycznym, który w działaniu na ket |Ψi daje
liczbę zespoloną równą iloczynowi skalarnemu wektorow |Φi oraz |Ψi
|Ψi ∈ H
hΦ| ∈ H∗
)
−→ hΦ|Ψi ∈ C.
(2.9)
Istnieje prosta zależność pomiędzy ketem i bra. Aby ją pokazać wprowadzimy operację zwaną
sprzężeniem hermitowskim, którą zwykle oznacza się symbolem †. Odpowiedniość pomiędzy
ketami i bra wygląda następująco
operacja †
H ∋ |Ψi −−−−−−→ |Ψi∗ = hΨ| ∈ H∗ .
(2.10)
Oczywiście każdemu bra odpowiada ket, można więc zdefiniować operację odwrotną
operacja †
H∗ ∋ hΨ| −−−−−−→ hΨ|∗ = |Ψi ∈ H.
(2.11)
Widać więc, że operacja sprzężenia hermitowskiego transformuje nam ket na bra i odwrotnie.
W przestrzeni Hilberta zdefiniować należy również operatory, które działają na jej elementy,
czyli kety. Każdy taki oprator odwzorowuje przestrzeń H w siebie
Â
H ∋ |Ψi −−−−→ |Ψ′ i ∈ H
przy czym
6
|Ψ′ i = Â|Ψi.
(2.12)
2.4 Postulaty mechaniki kwantowej
Rafał A. Bachorz
Oprócz tej własności w mechanice kwantowej rozważa się tylko operatory liniowe, to znaczy
takie, które mają własność
 (λ1 |Ψ1 i + λ2 |Ψ2 i) = λ1 Â|Ψ1 i + λ2 Â|Ψ2 i,
λ1 , λ2 ∈ C.
(2.13)
Operatory można dodawać, mnożyć przez liczbę zespoloną i mnożyć między sobą. To ostanie
działanie rozumiemy jako złożenie dwóch odwzorowań
i
h
B̂ Â|Ψi = B̂ Â|Ψi = B̂|Ψ′ i.
(2.14)
Takie złożenie często bywa nieprzemienne, wygodnie jest więc zdefiniować pojęcie komutatora
dwóch operatorów
h
i
Â, B̂ = ÂB̂ − B̂ Â.
(2.15)
Można powiedzieć, że komutator jest miarą nieprzemienności operatorów. Inną ważną wielkością
jest element macierzowy operatora, który można przedstawić jako
hΦ|Â|Ψi = hΦ| Â|Ψi = hΦ|Ψ′ i ∈ C.
(2.16)
W mechanice kwantowej wyróżniona została pewna klasa operatorów, mianowicie operatory
hermitowskie. Aby je zdefiniować niezbędna jest znajomość operatora sprzężonego.
Definicja 1 (Operator sprzężony) Operator  działając na ket |Ψi daje inny wektor Â|Ψi =
|Ψ′ i. Wektorowi temu, na mocy zależności (2.10) odpowiada bra hΨ′ |, które zapisujemy w postaci
†
hΨ′ | = |Ψ′ i
†
= Â|Ψi
= hΨ|A† .
(2.17)
Widać więc, że operator  przekształca |Ψi w |Ψ′ i, nowy operator † natomiast pozwala zbudować nowe bra hΨ′ | = hΨ|Â. Zależność tą możemy zapisać rownież jako
n
o
n
o
Â|Ψi = |Ψ′ i ←→ hΨ′ = hΨ|† .
(2.18)
Relacje (2.17) i (2.18) w pełni określają operator sprzężony.
Operator  nazywamy operatorem hermitowskim jeżeli dla dowolnych |Ψi, |Φi ∈ H spełniona jest relacja
hΦ|† |Ψi = hΦ| Â|Ψi .
(2.19)
2.4
Postulaty mechaniki kwantowej
Mechanika kwantowa jak każda teoria fizyczna opiera się na kilku postulatach, które trzeba przyjąć jako aksjomaty. Nie potrafimy dokładnie wytłumaczyć dlaczego obowiązują takie a nie inne
postulaty. Jedynym kryterium ich poprawności jest porównanie z eksperymentem. W rozdziale drugim zawarte są niezbędne wiadomości, które pozwalają przedstawić postulaty mechaniki
kwantowej w ujęciu przestrzeni Hilberta. Sposób ten gwarantuje ogólność rozważań, ale jest niepraktyczny z punktu widzenia obliczeń. W chemii kwantowej zwykle pracujemy w reprezentacji
położeniowej a obiektami naszych badań są atomy i cząsteczki. Dlatego też, oprócz ogólnego
7
2.4 Postulaty mechaniki kwantowej
Rafał A. Bachorz
formalizmu Diraca, korzystnie jest pokazać postulaty w konkretnej reprezentacji. W reprezentacji położeniowej abstrakcyjne wektory przechodzą w tzw. funkcje falowe, a iloczyn skalarny
definiowany jest przez następującą całkę
hΦ|Ψi =
Z
Φ∗ (r 1 , . . . , r n , t)Ψ(r 1 , . . . , r n , t)dr 1 , . . . , dr n .
(2.20)
Granice całkowanie obejmują cały zakres zmienności położeń cząstek. Funkcję falową, z matematycznego punktu widzenia, przedstawić można jako następujący iloczyn skalarny
Ψ(r , t) = hr |Ψi
(2.21)
gdzie hr | jest wektorem związanym z operatorem położenia z przestrzeni dualnej (bra) wszytkich
cząstek, a r w funkcji falowej symbolicznie oznacza wektor współrzędnych (np. kartezjańskich)
wszystkich cząstek.
Postulat 1 – o stanie kwantowomechanicznym Stan kwantowomechaniczny układu N cząstek opisywany jest przez wektor stanu |Ψi przestrzeni Hilberta. W reprezentacji położeniowej
stan ten w pełni scharakteryzowany jest przez funkcję falową Ψ(r 1 , . . . , r n , t) zależącą od położenia cząstek i czasu. Zgodnie z probabilistyczną interpretacją funkcji falowej, zaproponowaną
przez Maxa Borna [8] wielkość
P (r , t) = |Ψ∗ (r 1 , . . . , r n , t)Ψ(r 1 , . . . , r n , t)|
(2.22)
określa prawdopodobieństwo tego, że w czasie t współrzędne cząstek znajdują sie w przedziale
{[r 1 , r 1 + dr 1 ], . . . , [r n , r n + dr n ]}. Gwiazdka oznacza tutaj sprzężenie zespolone.
Funkcja falowa musi spełniać pewne warunki. Musi ona mianowicie być ciągła wraz z pierwszą
pochodną, różniczkowalna i musi przyjmować skończone wartości w całym zakresie zmienności
położenia cząstek2 .
Postulat 2 – zasada superpozycji stanów Jeżeli |Ψ1 i, . . . , |Ψn i są wektorami stanu opisująP
cymi układ, to dowolna ich kombinacja liniowa |Ψi = i ci |Ψi i jest także możliwym stanem układu. W reprezentacji położeniowej mówimy, że gdy funkcje falowe Ψ1 (r 1 , . . . , r n , t), . . . , Ψn (r 1 , . . . , r n , t)
opisują pewne stany układu kwantowego, to dowolna ich kombinacja liniowa
Ψ(r 1 , . . . , r n , t) =
X
ci Ψi (r 1 , . . . , r n , t)
(2.23)
i
również opisuje pewien stan tego układu3 .
Postulat 3 – o nieodróżnialności cząstek identycznych Sens fizyczny, czyli wartość kwadratu modułu funkcji falowej nie może zależeć od subiektywnego ponumerowania cząstek, czyli
przyporządkowania im arbitralnych etykiet liczbowych, bo ich jednostkowa ewolucja jest niedostępna eksperymentalnie. Wynika z tego, że kwadrat modułu funkcji falowej musi być niezmienniczy względem przenumerowania współrzędnych cząstek
|Ψ(r 1 , r 2 , . . . , r i , . . . , r j , . . . , r n , t)|2 = |Ψ(r 1 , r 2 , . . . , r j , . . . , r i , . . . , r n , t)|2 .
2
3
Funkcje spełniające te warunki określa się mianem funkcji klasy Q, lub mianem funkcji porządnych.
Postulat ten w gruncie rzeczy wynika z liniowości równania Schrödingera.
8
(2.24)
2.4 Postulaty mechaniki kwantowej
Rafał A. Bachorz
Oczywiste jest więc, że amplituda funkcji falowej musi spełniać jedno z dwóch równań symetrii
względem takiej operacji wymiany
Ψ(r 1 , r 2 , . . . , r i , . . . , r j , . . . , r n , t) = ±Ψ(r 1 , r 2 , . . . , r j , . . . , r i , . . . , r n , t).
(2.25)
Funkcje symetryczne względem wymiany dwóch cząstek nieodróżnialnych opisują bozony (podlegające statystyce Bosego-Einsteina), a antysymetryczne opisują fermiony (podlegające statystyce Fermiego-Diraca).
Postulat 4 – o wynikach pomiarów Każdej wielkości mechanicznej A przyporządkowany
jest operator kwantowomechaniczny Â. Operatory te muszą być hermitowskie. Hermitowskość
operatora gwarantuje nam to, że jego wartości własne są rzeczywiste. Operatory te muszą być
również liniowe aby spełniony był postulat o superpozycji stanów. Operatory kwantowomechaniczne konstruujemy wykorzystując tzw. reguły Jordana [9].
W dowolnym, pojedynczym pomiarze wielkości mechanicznej A, której przypisany został operator kwantowomechaniczny Â, wartością obserwowaną może być tylko jedna z wartości własnych
tego operatora, otrzymana przez rozwiązanie tzw. zagadnienia własnego w przestrzeni Hilberta
Â|Ψn i = an |Ψn i.
(2.26)
W reprezentacji położeniowej równanie to przyjmuje postać
ÂΨn (r 1 , . . . , r n ) = an Ψn (r 1 , . . . , r n ).
(2.27)
 oznacza tutaj oczywiście operator kwantowomechaniczny, |Ψn i to n-ty wektor własny operatora Â, an jego n-tą wartość własną, a Ψn (r 1 , . . . , r n ) n-tą funkcję własną operatora Â.
Postulat 5 – o wartości średniej Wynik średni (spodziewany) wielkiej liczby pomiarów
wielkości fizycznej A przeprowadzony na wielu układach w tym samym stanie początkowym |Ψi
wynosi
R ∗
Ψ (r 1 , . . . , r n , t)ÂΨ(r 1 , . . . , r n , t)dr 1 , . . . , dr n
hΨ|Â|Ψi
.
(2.28)
= R ∗
hAi =
Ψ (r 1 , . . . , r n , t)Ψ(r 1 , . . . , r n , t)dr 1 , . . . , dr n
hΨ|Ψi
Można rozważać również tzw. statystyczną wartość średnią
hAi =
X
Pi ai
(2.29)
i
gdzie Pi oznacza prawdopodobieństwo zaobserwowania w pomiarze wielkości A w stanie |Ψi
cech charakterystycznych stanu |Ψi i, czyli wartości własnej ai .
Postulat 6 – równanie Schrödingera Swobodną ewolucję w czasie układu kwantowomechanicznego wyznacza tzw. równanie Schrödingera zależne od czasu. W ujęciu przestrzeni Hilberta
ma ono postać
∂|Ψi
= Ĥ|Ψi.
(2.30)
iℏ
∂t
W reprezentacji położeniowej wielocząstkowe równanie Schrödingera ma postać
iℏ
∂Ψ(r 1 , . . . , r n , t)
= ĤΨ(r 1 , . . . , r n , t).
∂t
9
(2.31)
2.5 Przybliżenie Borna–Oppenheimera
Rafał A. Bachorz
Zgodnie z tym co zostało powiedziane w rozdziale drugim (2.6) Ĥ oznacza tutaj operator energii
całkowitej (hamiltonian) badanego układu.
Warto podkreślić, że wszystkie dotychczasowe rozważania dotyczą tzw. mechaniki kwantowej w
obrazie Schrödingera. Oprócz tego sformułowania w literaturze spotkać można obraz Heisenberga, obraz odziaływania oraz najnowszy, obraz całek po trajektoriach Feynmana.
Gdy operator Hamiltona nie zależy od czasu wtedy zawsze można równanie (2.31) rozseparować
na część zależną od czasu i od położenia. Zakładamy istnienie funkcji falowej w postaci iloczynu
Ψ(r 1 , . . . , r n , t) = φ(r 1 , . . . , r n )χ(t).
(2.32)
Funkcję falową w postaci (2.32) wstawia się do równania (2.31) i po prostych operacjach matematycznych otrzymać można stacjonarne równanie Schrödingera
Ĥφ(r 1 , . . . , r n ) = Eφ(r 1 , . . . , r n ).
(2.33)
Stała E to energia układu, który określony jest przez operator Hamiltona4 .
2.5
Przybliżenie Borna–Oppenheimera
Zawarty w poprzednim podrozdziale zestaw postulatów pozwala podjąć próbę rozwiązania dowolnego problemu kwantowomechanicznego. Niestety bardzo często jest tak, że nie potrafimy
rozwiązać równania, które dany problem opisuje. Wtedy trzeba stosować uproszczenia i przybliżenia, które tak zmodyfikują zagadnienie, że będziemy w stanie znaleźć jego rozwiązanie.
Mechanika kwantowa jest bardzo ogólną teorią. Można ją stosować zarówno do rzeczywistych
układów atomowych i molekularnych, jak i abstrakcyjnych pojedynczych spinów czy momentów
magnetycznych. Chemia kwantowa jednak próbuje opisać rzeczywistość, więc w większości wypadków jej głównym zadaniem jest rozwiązanie równania Schrödingera dla konkretnego atomu
czy cząsteczki.
Jak wiadomo masa jąder atomowych jest wiele tysięcy razy większa od masy elektronów. W
związku z tym ruch ciężkich jąder jest dużo wolniejszy od ruchu relatywnie lekkich elektronów.
Dlatego też rozsądnie jest założyć, że jądra są nieruchome. Dla każdej ich konfiguracji szukać
będziemy rozkładu gęstości elektronowej.
Pełny operator Hamiltona dla molekuły dwuatomowej przedstawić można następująco
Ĥ = −
X ℏ2 ′
ℏ2
ℏ2
∆a −
∆b −
∆ + V̂ .
2Ma
2Mb
2m i
i
(2.34)
Pierwsze dwa człony są operatorami energii kinetycznej jąder, trzeci wyraz to operator energii
kinetycznej elektronów a V̂ to operator energii potencjalnej wszystkich cząstek. Rozwiąznie równania Schrödingera z hamiltonianem (2.34) jest zadaniem bardzo skomplikowanym. Jednak gdy
nie interesuje nas ruch translacyjny układu to łatwo możemy odseparować ruch środka masy
molekuły od ruchu względnego cząstek. Po nieskomlikowanych przekształceniach matemematycznych [11] otrzymać można
Ĥ = −
4
′
ℏ2
∆xyz + Ĥ0 + Ĥ ,
2M
Jest to wartość własna operatora Ĥ.
10
(2.35)
2.5 Przybliżenie Borna–Oppenheimera
Rafał A. Bachorz
gdzie Ĥ0 jest tzw. hamiltonianem elektronowym
Ĥ0 = −
X ℏ2
i
2m
∆i + V̂ ,
(2.36)
′
a operator Ĥ definiujemy następująco
′
Ĥ = −
ℏ2
′′
∆R + Ĥ .
2µ
(2.37)
Pierwszy człon w wyrażeniu (2.35) odpowiedzialny jest za energię kinetyczną układu jako całości,
laplasjan działa na współrzędne środka masy. Nas jednak nie interesuje ruch translacyjny, więc
go zaniedbujemy. Otrzymujemy zatem do rozwiązania równania własne z hamiltonianem
′
Ĥ = Ĥ0 + Ĥ .
(2.38)
′′
Operator Ĥ zawarty w wyrażeniu (2.37) sprzęga ruch jąder i elektronów i ma postać
ℏ2
Ĥ = −
8µ
′′
X
i
∇i
!2
ℏ2
−
2
X
1
1
−
∇i .
∇R
Ma Mb
i
(2.39)
We wszystkich powyższych wyrażeniach Ma i Mb to masy odpowiednio jąder a i b, m to masa
elektronu, a µ to masa zredukowana obu jąder
µ−1 = Ma−1 + Mb−1 .
(2.40)
Przybliżenie adiabatyczne polega na tym, że zakładamy istnienie całkowitej funkcji falowej5
w postaci iloczynowej
Ψ = ψk (r 1 , . . . , r n )fk (R).
(2.41)
Gdy funkcję w postaci (2.41) wstawimy do równania Schrödingera z hamiltonianem (2.38) i
scałkujemy po współrzędnych elektronowych to otrzymamy następujące równanie opisujące ruch
jąder
#
"
′
ℏ2
0
(2.42)
− ∆R + Ek (R) + Hkk (R) fk (R) = Efk (R),
2µ
gdzie
′
Hkk =
Z
′
ψk∗ Ĥ ψk dτe
(2.43)
jest małą poprawką do energii Ek0 (R). Pominięcie tej poprawki oznacza przybliżenie Borna–
Oppenheimera [12].
Pierwszym krokiem do wyznaczenia struktury elektronowej dowolnego układu atomowego czy
molekularnego jest rozwiązanie równania Schrödingera z hamiltonianem (2.36), czyli elektronowego równania Schrödingera.
Ĥ0 (R)ψk (r 1 , . . . , r n ; R) = Ek (R)ψk (r 1 , . . . , r n ; R).
(2.44)
Zarówno funkcja falowa jak i energia zależą parametrycznie od położenia jąder ponieważ dla
każdej konfiguracji jąder mamy inny hamiltonian Ĥ0 .
Wszystkie obliczenia, ktorych wyniki są zamieszczone w niniejszej pracy przeprowadzone zostały w przybliżeniu Borna–Oppenheimera. Są rezultatem rozwiązania elektronowego równania
Schrödingera (2.44) bez wprowadzania żadnych poprawek.
5
Będącej rozwiązaniem równania Schrodingera z hamiltonianem (2.38).
11
2.6 Przybliżone metody rozwiązywania równania Schrödingera
2.6
Rafał A. Bachorz
Przybliżone metody rozwiązywania równania Schrödingera
Jak zostało wspomniane, równanie Schrödingera6 analitycznie rozwiązać można dla kilku układów modelowych, z których bez wątpienia najważniejszy jest atom wodoru. Analityczne rozwiązania tego równania dla układów wielkoelektronowych, w szczególności dwuelektronowych,
pozostają nieznane. Wyjściem z tej sytuacji jest zastosowanie metod przybliżonych. Niewątpliwie
najważniejsze z nich to metoda perturbacyjna i metoda wariacyjna. Wszystkie obliczenia
w tej pracy zostały przeprowadzone w oparciu o metodę wariacyjną dlatego będzie ona szerzej
omówiona. Szczegóły związane z rachunkiem zaburzeń znaleźć można m.in. w [9, 10, 11].
Metody perturbacyjne możemy zastosować gdy hamiltonian danego układu zapisać można w
postaci
Ĥ = Ĥ0 + V̂ .
(2.45)
Konieczna jest znajomość rozwiązań problemu z tzw. hamiltonianem niezaburzonym Ĥ0 , oraz to
aby operator V̂ miał charakter niewielkiego zaburzenia, czyli nie zmieniał diametralnie funkcji
i wartości własnych operatora niezaburzonego. Często warunki te są trudne do spełnienia i
trzeba szukać innej drogi do przybliżonego rozwiązania równania Schrödingera. Alternatywą
jest tutaj stosowanie metod wariacyjnych, które ze względu na swoją ogólność prawie zawsze
można wykorzystać.
2.6.1
Zasada wariacyjna
Niech Ĥ oznacza operator Hamiltona badanego układu, a E0 dokładną energię stanu podstawowego ψ0 . Wszystkie te wielkości związane są stacjonarnym równaniem Schrödengera (2.33),
które chcemy rozwiązać. Szukamy dowolnej, porządnej funkcji Φ, którą wstawiamy do wzoru na
wartość średnią (2.28) z operatorem Hamiltona
ǫ [Φ] =
hΦ|Ĥ|Φi
.
hΦ|Φi
(2.46)
Otrzymane wyrażenie ma charakter funkcjonału ponieważ liczba ǫ zależy od funkcji Φ. Zasada
wariacyjna mówi, że wyznaczona w ten sposób wartość średnia operatora Ĥ zawsze szacuje z
góry energię dokładną E0 , czyli
ǫ E0 .
(2.47)
W powyższej nierówności ǫ = E0 zachodzi wtedy i tylko wtedy gdy funkcja próbna Φ równa jest
dokładnemu rozwiązaniu równania Schrödingera dla stanu podstawowego ψ0 .
Dowód relacji (2.47) przeprowadzać można na wiele sposobów, najłatwiej jednak zrobić to rozwijając funkcję Φ w stany własne operatora Ĥ. Stany własne hamiltonianu {ψi } tworzą układ
zupełny ortonormalny w przestrzeni Hilberta. Z matematycznego punktu widzenia zupełność w
przestrzeni Hilberta ująć można w następującą definicję [57].
Definicja 2 (Zupełność w przestrzeni Hilberta) Niech g(x) będzie dowolną funkcją porządną zdefiniowaną przestrzeni Hilberta a {f (x)} ortonormalnym zbiorem funkcji w tej samej przestrzeni Hilberta. Jeżeli istnieje zbiór stałych współczynników {ai } taki, że ciąg sum częściowych
P
gn (x) ≡ ni=1 ai fi (x) jest zbieżny w sensie wartości średniej do g(x) to zbiór {fi } jest zbiorem
6
Począwszy od tego miejsca rozważać będziemy tylko stacjonarne równanie Schrödingera (2.33).
12
2.6 Przybliżone metody rozwiązywania równania Schrödingera
Rafał A. Bachorz
zupełnym ortonormalnym. Równoważne jest stwierdzenie, że jeżeli możemy średni błąd kwadratowy uczynić dowolnie małym,
lim
n→∞
Zb
a
2
|g − gn | dx = lim
n→∞
Zb
a
|g −
n
X
ai fi (x)|2 dx = 0
(2.48)
i=1
wówczas zbiór {fi } jest ortonormalnym zupełnym zbiorem funkcji.
Korzystając z zupełności i ortonormalności przestrzeni Hilberta możemy zatem dowolną funkcję
przedstawić w postaci kombinacji liniowej funkcji własnych7 . Niech więc
X
Φ=
ci ψi .
(2.49)
i
Współczynniki ci zapewniają normalizację, co oznacza
hΦ|Φi =
X
i,j
c∗i cj hψi |ψj i =
X
X
c∗i cj δij =
c∗i cj =
i
i
i,j
X
|ci |2 = 1.
(2.50)
Wstawmy więc rozwinięcie (2.49) do wyrażenia na wartość średnią operatora Hamiltona (2.46)
ǫ = hΦ|Ĥ|Φi =
*
X
i
ci ψi |Ĥ|
X
cj ψi
j
+
=
X
i,j
E
D
c∗i cj ψi |Ĥ|ψj .
(2.51)
W następnym kroku wykorzystujemy to, że funkcje ψi są stanami własnymi hamiltonianu
X
i,j
E
D
c∗i cj ψi |Ĥ|ψj =
X
i,j
c∗i cj Ej hψi |ψj i =
Otrzymaliśmy zatem
ǫ=
X
c∗i cj Ej δij =
i,j
X
|ci |2 Ei .
X
|ci |2 Ei − E0
i
X
i
|ci |2 Ei .
(2.52)
(2.53)
Odejmijmy od obu stron równania (2.53) energie stanu podstawowego rozważanego układu
ǫ − E0 =
i
(2.54)
i wykorzystajmy relację (2.50)
ǫ − E0 =
X
i
|ci |2 Ei − E0
X
i
|ci |2 =
X
i
|ci |2 (Ei − E0 ) 0 (2.55)
Od energii stanów wzbudzonych Ei odejmujemy energię stanu podstawowego E0 , zatem nawias
po prawej stronie wyrażenia (2.55) ma zawsze wartość dodatnią. Należy zwrócić uwagę na to,
że równość w ostanim kroku zachodzi wtedy i tylko wtedy gdy Φ = ψ0 .
7
Określenia stan własny i funkcja własna stosowane będą zamiennie.
13
2.6 Przybliżone metody rozwiązywania równania Schrödingera
2.6.2
Rafał A. Bachorz
Metoda wariacyjna
W poprzednim podrozdziale udowodniona została zasada wariacyjna. Widać, że daje ona duże
możliwości do szacowania energii stanów podstawowych układów atomowych i molekularnych8 .
Metoda wariacyjna wykorzystuje zasadę wariacyjną do tego celu. Jej istota sprowadza się do
tego, że funkcję próbną wybieramy w ten sposób, aby zależała ona od pewnych parametrów
wariacyjnych c
Φ = Φ (r 1 , . . . , r n ; c) .
(2.56)
Gdy funkcję w postaci (2.56) wstawimy do wyrażenia na wartość średnią (2.46) i wycałkujemy
po współrzędnych cząstek, to otrzymamy wyrażenie, które zależy tylko od parametrów wariacyjnych. Zadaniem metody wariacyjnej jest znalezienie minimum funkcji
ǫ = ǫ (c) .
(2.57)
Oczywiście jest to zadanie nietrywialne, gdyż szukamy minimum globalnego funkcji wielu zmiennych. Postawienie warunku znikania pierwszych pochodnych
∂ǫ (c)
∂ci
dla i = 1 . . . p
(2.58)
jest zaledwie warunkiem koniecznym dla minimum globalnego. Problem poszukiwania minimum
globalnego jest w ogólności nierozwiązany. Istnieją metody wykorzystujące koncepcje symulowanego schładzania czy algorytmów genetycznych, lecz nie dają one stuprocentowej gwarancji
tego, że znaleziony punkt stacjonarny jest minimum globalnym.
2.6.3
Metoda Ritza
Bardzo często wprowadza się do funkcji próbnej liniowe parametry wariacyjne, gdyż wówczas
bardzo łatwo wyznaczyć ich optymalne wartości. Taką odmianę metody wariacyjnej wprowadził
w 1909 roku Walther Ritz i od jego nazwiska nazywa się ją metodą Ritza [13].
Zakładamy więc funkcję próbną w postaci
Φ=
n
X
ci ψi ,
(2.59)
i=1
gdzie {ψi } stanowi wybraną bazę w przestrzeni Hilberta. Funkcję w postaci (2.59) wstawiamy
do wyrażenia na wartość średnią hamiltonianu (2.46)
*
n
P
i=1
ǫ= *
ci ψi |Ĥ|
n
P
i=1
ci ψi |
n
P
j=1
n
P
j=1
cj ψj
cj ψj
+
+
n
n P
P
i=1 j=1
= P
n P
n
i=1 j=1
c∗i cj Hij
.
(2.60)
c∗i cj Sij
Zastosowana baza zwykle nie jest bazą ortonormalną, więc przeważnie
hψi |ψj i =
6 δij .
8
Po ominięciu pewnych komplikacji można też wyznaczać energie stanów wzbudzonych.
14
(2.61)
2.6 Przybliżone metody rozwiązywania równania Schrödingera
Rafał A. Bachorz
Macierz Sij w wyrażeniu (2.60) oznacza macierz całek nakrywania, a Hij to macierz całek
operatora Hamiltona. Elementy macierzowe Sij oraz Hij w reprezentacji położeniowej definiuje
się następująco
E
D
Sij = ψi |ψj =
D
E
Hij = ψi |Ĥ|ψj =
Z
Z
ψi∗ (r 1 , . . . , r n )ψj (r 1 , . . . , r n )dr 1 , . . . , dr n ,
(2.62a)
ψi∗ (r 1 , . . . , r n )Ĥψj (r 1 , . . . , r n )dr 1 , . . . , dr n .
(2.62b)
Aby otrzymać optymalne wartości współczynników ci należy wyznaczyć pochodne wyrażenia
(2.60) względem tych współczynników i przyrównać je do zera. Dla każdego k = 1, . . . , n formalnie można zapisać
∂ǫ
=
∂c∗k
n P
n
P
i=1 j=1
c∗i cj Sij
!
n
P
j=1
cj Hkj
!
n P
n
P
i=1 j=1
−
n P
n
P
i=1 j=1
!2
c∗i cj Hij
!
n
P
j=1
cj Skj
!
= 0.
(2.63)
c∗i cj Sij
Po prostych przekształceniach matematycznych dochodzi się do układu równań wiekowych9
n
X
j=1
cj (Hkj − ǫSkj ) = 0
dla k = 1, . . . , n.
(2.64)
Ze względu na współczynniki ci jest to układ równań liniowych jednorodnych. Z algebry liniowej
wiadomo, że układ taki ma nietrywialne rozwiązania wtedy i tylko wtedy gdy jego wyznacznik
równy jest zero, czyli
H11 − ǫS11 · · · H1n − ǫS1n ..
..
..
(2.65)
= 0.
.
.
.
H − ǫS
n1
n1 · · · Hnn − ǫSnn
Rozwijając wyznacznik (2.65) otrzymamy zwyczajne równanie algebraiczne n-tego stopnia. Rozwiązując to równanie uzyskamy n wartości energii. Najmniejsza z nich stanowi przybliżenie do
energii stanu podstawowego, a n − 1 kolejnych to przybliżone wartości energii stanów wzbudzonych. W związku z założeniem hermitowskości operatora Hamiltona wszystkie pierwiastki
równania (2.65) są rzeczywiste. W przypadku k-krotnej degeneracji, k spośród rozwiązań będzie
miało taką samą wartość. Aby wyznaczyć przybliżoną funkcję falową danego stanu wstawiamy odpowiednią wartość ǫ do układu równań (2.64) i rozwiązujemy ten układ ze względu na
współczynniki ci .
9
W literaturze spotkać można termin układ równań sekularnych.
15
Rozdział 3
Problem korelacji elektronowej
3.1
Przybliżenie jednoelektronowe i równania Hartree–Focka
Opisując atom czy cząsteczkę stosuje się zwykle przybliżenie adiabatyczne, lub dalej idące
przybliżenie Borna–Oppenheimera. Jak zostało pokazane wcześniej pozwala to na rozseparowanie ruchu układu jako całości od ruchu względnego tworzących ten układ cząstek. W rezultacie
szukana funkcja falowa zależy od położeń elektronów i parametrycznie uzależniona jest od konfiguracji jąder. Pomimo tego rozwiązanie elektronowego równania Schrödingera (2.44) często jest
bardzo trudne do wykonania i konieczne jest stosowanie kolejnych przybliżeń. Bardzo istotnym,
często stosowanym w chemii kwantowej uproszczeniem jest przybliżenie jednoelektronowe.
W przybliżeniu tym każdemu elektronowi w atomie, cząsteczce czy krysztale przyporządkowujemy jednoelektronową funkcję falową zwaną spinoorbitalem. W związku z tym, że prawdopodobieństwo zdarzeń niezależnych równe jest iloczynowi poszczególnych prawdopodobieństw a
gęstość prawdopodobieństwa równa jest kwadratowi modułu funkcji falowej, więc naturalne jest
przyjęcie całkowitej funkcji falowej Ψ w postaci iloczynu spinoorbitali
Ψ = φ1 (1)φ2 (2) . . . φn (n),
(3.1)
gdzie każdy spinoorbital φj (i) jest iloczynem funkcji przestrzennej i spinowej
φj (i) = ψj (r i )σ.
(3.2)
W wyrażeniu (3.2) ψj (r i ) oznacza część przestrzenną (orbital), a σ jest funkcją spinową. W
zależnośći od wartości rzutu z-towej składowej momentu pędu elektronu jest to α lub β. Taka
właśnie postać elektronowej funkcji falowej stosowana była w metodzie Hartree [14]. Funkcja ta
jednak nie spełnia postulatu o nieodróżnialności cząstek identycznych (2.25), przenumerowanie
dowolnych dwóch elektronów powinno bowiem zmienić znak funkcji falowej. Pożądaną własność
antysymetryczności ma natomiast funkcja wyznacznikowa (wyznacznik Slatera) [15]
φ (1)
1
1 φ2 (1)
Ψ= √ ..
n! .
φn (1)
φ1 (2) · · ·
φ2 (2) · · ·
..
..
.
.
φn (2) · · ·
.
φn (n) φ1 (n)
φ2 (n)
..
.
(3.3)
Przenumerowanie elektronów jest tutaj równoważne zamianie miejscami kolumn w wyznaczni1
ku, a to jak wiadomo powoduje zmianę jego znaku. Czynnik (n!)− 2 gwarantuje unormowanie
3.1 Przybliżenie jednoelektronowe i równania Hartree–Focka
Rafał A. Bachorz
funkcji, lecz tylko wtedy gdy unormowane i wzajemnie ortogonalne są spinoorbitale φ1 , . . . , φ2 .
Operator Hamiltona dla dowolnego układu n-elektronowego w przybliżeniu Borna-Oppenheimera
(hamiltonian elektronowy) w jednostkach atomowych ma postać
n
X
Ĥ =
ĥ(r i ) +
i=1
n
X
1
,
r
i>j=1 ij
(3.4)
gdzie jednoelektronowy hamiltonian ĥ(r i ) zdefiniowany jest
1
ĥ(r i ) = − ∆i + Û .
2
(3.5)
Operator Û w powyższym wyrażeniu odpowiedzialny jest za energię potencjalną oddziaływania
i-tego elektronu z wszystkimi jądrami. Aby obliczyć w przybliżeniu jednoelektronowym energię
badanego układu wstawimy hamiltonian (3.4) oraz funkcję falową postaci (3.3) do wyrażenia na
energię średnią hamiltonianu (2.46). Po nieskomplikowanych przekształceniach matematycznych
[11] otrzymać można
ǫ=2
n/2
X
Ip +
p=1
gdzie
Ip =
Jpq =
Kpq =
Z
Z
Z
n/2
X
p,q=1
(2Jpq − Kpq ),
(3.6)
ψp∗ (r i )ĥ(i)ψp (r i )dr i ,
ψp∗ (r i )ψq∗ (r j )
(3.7a)
1
ψp (r i )ψq (r j )dr i dr j ,
rij
(3.7b)
1
ψp (r j )ψq (r i )dr i dr j .
rij
(3.7c)
ψp∗ (r i )ψq∗ (r j )
Całkę Jpq nazywamy całką kulombowską a całka Kpq to całka wymiany. Mając wyprowadzony
wzór (3.6) można zastosować metodę nieoznaczonych mnożników Lagrange’a co da nam optymalne wartości orbitali. Postępowanie to prowadzi do układu równań różniczkowo-całkowych
zwanych równaniami Hartree-Focka, które mają postać
F̂ (r i )ψp (r i ) = ǫp ψp (r i ) dla p = 1, 2, . . . , n/2.
(3.8)
Występuje tutaj operator Focka
F̂ (r i ) = ĥ(r i ) +
n/2 h
X
q=1
i
2Jˆq (r i ) − K̂q (r i ) ,
(3.9)
gdzie ĥ(r i ) zdefiniowany jest wzorem (3.5), a Jˆq (r i ) oraz K̂q (r i ) nazywamy odpowiednio operatorem kulombowskim i operatorem wymiany. Definiujemy je poprzez ich działanie na
orbital ψp (r i )
#
"Z
1
(3.10a)
ψq (r j ) ψq (r j )dr j ψp (r i ),
Jˆq (r i )ψp (r i ) =
rij
K̂q (r i )ψp (r i ) =
"Z
#
1
ψq (r j ) ψp (r j )dr j ψp (r i ).
rij
17
(3.10b)
3.2 Pojęcie korelacji elektronowej
Rafał A. Bachorz
Wielkość ǫp występująca w równaniach (3.8), czyli wartość własną operatora Focka intepretować
można jako energię elektronu poruszającego się w polu jąder i uśrednionym potencjale wszystkich pozostałych elektronów. Energię tą nazywa się energią orbitalną.
W praktyce ze względu na to, że operator Focka zależy od wszystkich n/2 orbitali równania metody Hartree-Focka należy rozwiązywać iteracyjnie aż do uzyskania uzbieżnienia. Stąd technika obliczeń nosi nazwę metody pola samouzgodnionego (ang. Self Consistend Field, SCF ). Przeważnie
szukane orbitale przedstawia się jako kombinacje liniowe znanych funkcji i do minimalizacji energii stosuje się metodę Ritza. Taka odmiana SCF nosi nazwę metody Hartree-Focka-Roothaana
[16].
3.2
Pojęcie korelacji elektronowej
Metoda pola samouzgodnionego ma charakter przybliżony co jest wynikiem zastosowania przybliżenia jednoelektronowego. W zasadzie funkcja wyznacznikowa (3.3) jest ścisłym rozwiązaniem
równania Schrodingera przy pominięciu członów odpowiedzialnych za odpychanie elektronów.
Ze względu na to, że do procedury SCF zastosowany został pełny hamiltonian to odziaływanie elektron–elektron jest w rozwiązaniach ujęte, lecz w sposób statyczny. Każdemu elektronowi
przypisany został osobny spinoorbital co sprawia, że działa na niego uśrednione pole pozostałych
elektronów. Innymi słowy tak samo prawdopodobna jest sytuacja gdy elektrony są bardzo blisko
siebie jak również gdy odległość między nimi jest duża.
Wzajemne unikanie się elektronów wynikające z ich odpychania elektrostatycznego nazywane
jest korelacją kulombowską. Jest jeszcze drugi typ korelacji zwany korelacją spinową. Jest on
wynikiem unikania się elektronów opisywanych takimi samymi magnetycznymi spinowymi liczbami kwantowymi. Jak łatwo dostrzec funkcja wyznacznikowa w sposób naturalny uwzględnia
drugi typ korelacji, nie uwzględnia natomiast korelacji kulombowskiej. W literaturze korelację
kulombowską nazywa się po prostu korelacją elektronową, a efekt energetyczny z nią związany,
czyli różnicę pomiędzy dokładną energią elektronową Eel a energią będącą dokładnym rozwiązaniem równań Hartree-Focka, energią korelacji
Ecorr = Eel − EHF
czyli
Ecorr < 0.
(3.11)
Przeprowadzając bardzo ogólne rozważania można pokazać jaką postać powinna mieć dokładna
funkcja falowa Ψ. Jak wykazał Kato [17] powinna ona spełniać warunek ostrza korelacyjnego
(ang. correlation cusp condition), to znaczy
∂Ψ
∂rij
!
∂Ψ
∂rAi
!
rij =0
1
= Ψ(rij = 0)
2
rAi =0
w przypadku elektron-elektron,
(3.12a)
w przypadku jądro-elektron.
(3.12b)
= −ZΨ(rAi = 0)
Funkcja HF nie zawiera efektu korelacji, gdyż nie spełnia warunku (3.12a).
Energia elektronowa uzyskana za pomocą funkcji HF odtwarzona jest zwykle z błędem nie większym niż 1%, choć w przypadku cząsteczki wodoru H2 wkład energii korelacji wynosi 3.5%, a dla
jonu H– przekracza 8%. Korelacja elektronowa jest powodem jakościowo błędnego oszacowania
trwałości cząsteczki F2 . Jak wiadomo energia wiązanja chemicznie stabilnego układu, jakim jest
F2 , w ujęciu metody pola samouzgodnionego ma niewłaściwy znak. Inną wielkością często błędnie opisywaną przez funkcję HF jest moment dipolowy i wyższe momenty multipolowe. Dobrym
18
3.3 Metoda mieszania konfiguracji
Rafał A. Bachorz
przykładem jest tutaj cząsteczka CO. Zastosowanie funkcji HF do opisu momentu dipolowego tej cząsteczki zmienia jego zwrot. Dopiero zastosowanie metod uwzględniających korelację
elektronową poprawnie odtwarza tą wielkość. Wszystkie wielkości drugiego i wyższych rzędów
takie jak: polaryzowalność, magnetyzowalność, moment kwadrupolowy czy moment oktupolowy
w ujęciu metody SCF również są zafałszowane.
Podsumowując należy stwierdzić, że w wielu wypadkach model jednoelektronowy jest niewystarczający. Wzrost zapotrzebowania na obliczenia wysokiej dokładności sprawia, że rośnie rola
metod wychodzących poza to przybliżenie.
3.3
Metoda mieszania konfiguracji
Stosowanie modelu jednoelektronowego ma z pewnością wiele cech, które czynią go bardzo atrakcyjnym narzędziem. Najważniejszą z nich jest to, że wszystkie pojawiające się całki są najwyżej
dwuelektronowe. Wynika to z faktu, iż zarówno operator Hamiltona jak i operator Focka zawierają operatory dwuelektronowe. Bardzo często więc funkcję falową przedstawia się w postaci
kombinacji liniowej wyznaczników Slatera (3.3)
Ψ=
X
ci χi .
(3.13)
i
Zgodnie z (3.2) i (3.3) χi przedstawić można w nieco innej, równoważnej postaci1
χi = Q̂as [φ1i (1)φ2i (2) . . . φni (n)] ,
(3.14)
gdzie Q̂as oznacza tzw. antysymetryzator, czyli operator zapewniający spełnianie postulatu o
nierozróżnialności cząstek identycznych. Matematycznie operator ten przedstawić można jako
kombinację liniową operatorów permutacji elektronów ze współczynnikami +1 dla permutacji
parzystych i −1 dla permutacji nieparzystych
Q̂as =
N!
X
λi π̂i
k=1
dla λi = ±1,
(3.15)
gdzie N to liczba elektronów. Jest to pierwsze, najbardziej naturalne przybliżenie wychodzące poza model jednoelektronowy. Ważne jest to, że nie komplikuje ono nam całek. Podobnie
jak w metodzie SCF pozostają one co najwyżej dwuelektronowe. Każdy z wyznaczników Slatera stanowi przyporządkowanie elektronów do danych spinoorbitali czyli odpowiada pewnej
konfiguracji elektronowej. Metoda ta więc określana jest mianem mieszania konfiguracji lub,
mniej szczęśliwie oddziaływania konfiguracji (ang. Configuration Interaction). Do wyznaczenia
współczynników ci rozwinięcia (3.13) najczęściej stosuje się metodę Ritza, a orbitale zawarte
w wyznacznikach Slatera są rozwiązaniami równań Hartree-Focka. Gdy orbitale te przedstawia się w postaci kombinacji liniowej kartezjańskich funkcji Gaussa i optymalizuje się zarówno
współczynniki tych kombinacji jak i współczynniki wyjściowego rozwinięcia (3.13), to mamy do
czynienia z wielokonfiguracyjną metodą pola samouzgodnionego (ang. Multi-Configuration SelfConsistent Field, MC SCF ). Kolejną odmianą metody CI jest full-CI. W metodzie tej należy do
rozwinięcia (3.13) wziąć tyle wyznaczników Slatera aby opisać wszystkie możliwe wzbudzenia
badanego układu (dla danej liczby spinoorbitali).
Niestety zbieżność metod CI jest bardzo wolna. Uzyskanie relatywnie dokładnych wyników zmusza do zwiększania długości rozwinięcia (3.13). Wynika to bezpośrednio z braku jawnej korelacji
w funkcji falowej.
1
Pominięty został czynnik normujący.
19
Rozdział 4
Funkcje jawnie skorelowane
stosowane w chemii kwantowej
4.1
Funkcje Hyllerassa i Jamesa-Coolidge’a
Dokładny opis układów atomowych i molekularnych wymaga uwzględnienia korelacji elektronowej. Fakt ten był oczywisty już w pierwszych latach istnienia mechaniki kwantowej. Zastosowanie funkcji jawnie skorelowanych czyli takich, które w sposób jawny zależą od odległości
międzyelektronowej jest bardzo precyzyjnym narzędziem dla chemika kwantowego. Gdy opis
za pomocą tych funkcji połączymy z metodami wariacyjnymi to otrzymujemy dodatkowo, zgodnie z (2.47), bardzo dobre kryterium oceny wyników. Jest coś urzekającego w tym, że każda
porządna funkcja w ujęciu metody wariacyjnej szacuje nam energię układu z góry. Począwszy
od tego rozdziału wszystkie podawane energie są wartościami wariacyjnymi 1 .
Funkcje skorelowane po raz pierwszy zostały zastosowane w dwa lata po ukazaniu się pracy
Heitlera i Londona [3], którą uważa się za początek chemii kwantowej. W 1929 roku Hyllerass
[18] zastosował do stanu podstawowego atomu helu funkcję postaci
Ψ = e−ξs
n
X
ci sni t2li umi ,
(4.1)
i=1
gdzie
s = r1 + r2 ,
t = r1 − r2 ,
u = r12 ,
(4.2)
a ni , li , mi są nieujemnymi liczbami całkowitymi. Dla sześciu członów rozwinięcia otrzymał
on doskonały jak na tamte czasy wynik E = −2.90324 hartree, który gorszy był od dokładnej
energii elektronowej o mniej niż 100 cm−1 . Funkcja Hylleraasa jest zadziwiająco szybko zbieżna,
wystarczyło 20 członów aby otrzymać energię E = −2.903718 hartree, co daje błąd zaledwie 1.3
cm−1 [19]. Funkcję (4.1) można zapisać w nieco innej, ogólniejszej postaci, co zrobił w latach
50-tych Kinoshita [20]. Zaproponował on funkcję postaci
−ξs
Ψ=e
n
X
i=1
ci s
pi
qi 2ri
u
s
t
u
,
(4.3)
gdzie s, t i u zdefiniowane są tak jak w (4.2), a pi , qi i ri są nieujemnymi liczbami całkowitymi.
Łatwo zauważyć, że wzór (4.1) jest szczególym przypadkiem (4.3) dla pi qi ri . Niewielkie,
1
W kilku przypadkach pokazane zostaną wartości niewariacyjne, co będzie wyraźnie zaznaczone.
4.1 Funkcje Hyllerassa i Jamesa-Coolidge’a
Rafał A. Bachorz
80-członowe rozwinięcie funkcji (4.3) daje bardzo dobrą energię E = −2.903724347 hartree [21],
która jest zaledwie 0.007 cm−1 powyżej energii dokładnej. W połowie lat sześdziesiątych Frankowski i Pekeris wprowadzili do funkcji Hylleraasa człony logarytmiczne [22]. Tak zmodyfikowana
funkcja ma postać
Ψ = e−ξs
n
X
ci sni t2li umi (ln s)ki
(4.4)
i=1
i za jej pomocą uzyskana została dokładność 14 cyfr znaczących [23]. Funkcje Hylleraasa zastosować można do opisu atomów większych niż atom helu, lecz znacząco wzrasta czas obliczeń.
Dla atomu litu zaproponowana została funkcja postaci
Ψ=
6 X
n
X
v=1 i=1
gdzie
ci Q̂as [φi (αβα − βαα)]
(4.5)
niv piv qiv −αv r1 −βv r2 −γv r3
φi = r1kiv r2liv r3miv r12
r23 r13 e
(4.6)
i za jej pomocą uzyskany został wynik E = −7.478060312 hartree [24]. Analiza energii elektronowej atomu litu wskazuje, że rozbieżność jest mniejsza niż 0.05 cm−1 . Niestety uogólnienie
funkcji (4.1) na atomy o większej liczbie elektronów nie prowadzi do tak dokładnych wyników.
Naturalną rzeczą jest próba zastosownia koncepcji Hylleraasa do opisu struktury elektronowej
cząsteczek. Udało się to w 1933 roku Jamesowi i Coolidge’owi [43]. Dla stanu podstawowego
cząsteczki wodoru zastosowali oni funkcję w postaci
Φ = e−δ(ξ1 +ξ2 )
n
X
ci ξ1mi ξ2ni η1ji η2ki ρmi + ξ2mi ξ1ni η2ji η1ki ρmi ,
i=1
(4.7)
gdzie ξ i η to współrzędne eliptyczne zdefiniowane następująco
ξ=
ra + rb
,
R
η=
ra − rb
.
R
(4.8)
Występujące w (4.8) ra i rb to odległości elektronu od jąder a i b, a R to odległość między
jądrami. Zmienna ρ z wyrażenia (4.7) to przeskalowana odległość międzyelektronowa
ρ=
2r12
.
R
(4.9)
Podobnie jak w przypadku atomu helu wystarczyło bardzo krótkie rozwinięcie, aby uzyskać
bardzo dobry wynik. Dla 13 członów udało sie otrzymać energię E = −1.17347 hartree. Energia
ta została poprawiona dopiero w 1960 roku przez Kołosa i Roothaana [10]. Dla 50-członowego
rozwinięcia dostali oni energię E = −1.174448 hartree.
Łatwo zauważyć, że funkcja (4.7) nie posiada pewnej pożądanej cechy. Dla R → ∞ powinna ona
bowiem dążyć do asymptotycznej postaci funkcji Heitlera-Londona [3], którą we współrzędnych
eliptycznych wyrazić można następująco
− 21 R(ξ1 +ξ2 )
Ψ(R → ∞) = e
1
cosh − R (η1 − η2 ) .
2
(4.10)
Można jednak dokonać pewnego uogólnienia, które wzbogaca funcję (4.7) o tę właśnie cechę.
Ma ona wówczas postać
Ψ=
n
X
ci [φ(r 1 , r 2 ) + φ(r 2 , r 1 )],
i=1
21
(4.11)
4.2 Metoda Hylleraas-CI
gdzie
Rafał A. Bachorz
φ(r 1 , r 2 ) = e−αξ1 −ᾱξ2 cosh(βη1 + β̄η2 )ξ1mi ξ2ni η1ji η2ki ρpi .
(4.12)
Taka postać funkcji została zaproponowna przez Kołosa i Wolniewicz [4] i od ich nazwisk jest ona
nazywana funkcją Kołosa–Wolniewicza (KW). Przeprowadzili oni serię bardzo dokładnych
obliczeń dla cząsteczki wodoru. Oprócz energii elektronowej uwzględnili poprawki adiabatyczne
i relatywistyczne. Otrzymali energię dysocjacji, która znacznie różniła się od wartości doświadczalnej Herzberga [5]. Ich wynik jednak został potwierdzony późniejszymi pomiarami [6], co
zostało przez Mullikena określone mianem ”wielkiego triumfu obliczeń ab-initio” [27]. Wartość
energii elektronowej w ujęciu funkcji KW kilka razy była poprawiana, ostatnio przez Wolniewicza
[28]. Przez długie lata funkcja KW uważana była za niedościgniony wzór w opisie cząsteczki H2 .
Jak się jednak okazuje można uzyskać nieco lepsze wyniki stosując skorelowane funkcje Gaussa
[29, 30], choć różnica jest minimalna.
Funkcja postaci (4.11) z powodzeniem stosowana była również do wyznaczenia energii elektro1 +
1 +
nowej stanów wzbudzonych H2 takich jak EF 1 Σ+
g , GK Σg , H H̄ Σg [31, 32, 35, 36] i wielu
innych. Można ją także zastosować do opisu dwuelektronowych jonów, takich jak HeH+ [37, 38]
czy He2+
2 [39, 40], choć w obu wypadkach nieco lepsze rezultaty otrzymać można stosując wykładniczo skorelowane funkcje Gaussa [41].
Zastosowanie funkcji typu James-Coolidge’a do opisu układów o większej liczbie elektronów
wiąże się z ogromnymi komplikacjami natury przede wszystkim matematycznej. W literaturze
znaleźć można wyniki dla He+
2 czy He2 [33, 34], lecz są one jakościowo dużo gorsze od tych
otrzymanych dla układów dwuelektronowych.
4.2
Metoda Hylleraas-CI
Wyniki zebrane w poprzednim podrozdziale pokazują, iż jawna zależność od rij daje doskonałe
rezultaty. Jest to wynikiem spełnienia warunku ostrza korelacyjnego. Wiadomo, że w sposób
naturalny nie spełnia tego warunku kombinacja liniowa wyznaczników Slatera z metod mieszania konfiguracji (CI). Dlatego też zupełnie naturalnym krokiem jest taka ingerencja w funkcję
CI, która bez diametralnej zmiany tej funkcji pozwoli spełniać warunek (3.12a). Najprostszym
sposobem takiej modyfikacji jest przemnożenie każdego członu kombinacji (3.13) przez całkowitą
potęge rij , która pełni rolę czynnika korelacyjnego. Koncepcja ta zaproponowana została przez
Simsa i Hagstroma [42], a jej realizacja matematyczna ma postać
Ψ = Q̂as
n
X
vi
rm
[φ1i (1)φ2i (2) . . . φni (n)],
i ni
(4.13)
i=1
gdzie Q̂as zdefiniowane jest tak samo jak (3.15). Jak widać w każdym członie korelowana jest
vi
tylko jedna para elektronów rm
, co powoduje, że wszystkie pojawiające się całki są najwyżej
i ni
czteroelektronowe. Postać (4.13) ma bardzo elegancką formę ponieważ dla vi = 0 dla każdego
i sprowadza się ona do normalnego rozwinięcia CI (3.13). Wiadomo, że największy wkład do
energii korelacji dają człony liniowe z rij , więc wartości vi są zwykle ograniczone do zbioru
{0, 1, 2}.
Zastosowanie rozwinięcia (4.13) do opisu układów dwuelektronowych daje dobre rezultaty. W
2002 roku twórcy metody Sims i Hagstrom wyznaczyli energię atomu helu odzyskując 20 cyfr
znaczących! Nie jest to jednak rekord świata, ponieważ w tym samym roku pojawiła się praca
Drake’a i współpracowników poprawiająca ten wynik [44]. Zastosowanie metody Hylleraas-CI
22
4.3 Wykładniczo skorelowane funkcje Gaussa
Rafał A. Bachorz
do opisu cząsteczek wymagało rezygnacji z orbitali w postaci funkcji Slatera na rzecz prostszych
do całkowania funkcji Gaussa. W latach 80-tych opracowana została metoda wykorzystująca
jako funkcje bazowe sferyczne funkcje Gaussa
2
s (r ; α, A) = e−α|r −A| .
(4.14)
Największym sukcesem tej odmiany metody Hylleraas-CI było uzyskanie najlepszego jak na
tamte czasy wyniku dla jonu H+
3 [45].
Kolejnym etapem w rozwoju metod Hylleraas-CI było uogólnienie funkcji Woźnickiego polegające na użyciu zamiast sferycznych funkcji Gaussa (4.14), ich kartezjańskich odpowiedników
2
g (k; α, A, l, m, n) = (xk − Ax )l (yk − Ay )m (zk − Az )n e−α|r k −A| .
(4.15)
Wyniki uzyskane dla cząsteczki wodoru były nieco gorsze od najlepszych uzyskanych uogólnioną
funkcją Jamesa-Coolidge’a. Dość spektakularnym sukcesem natomiast było wyznaczenie bardzo
dokładnej powierzchni potencjału dla H+
3 , a wartość energii w konfiguracji równowagowej została
poprawiona o 90 cm−1 [46] w stosunku do wcześniejszych wyników grupy Woźnickiego.
4.3
Wykładniczo skorelowane funkcje Gaussa
Warunkiem koniecznym, determinującym efektywność obliczeń jest możliwość analitycznego całkowania. Jak wiadomo, aby zastosować metodę wariacyjną trzeba policzyć całki operatora Hamiltona oraz całki nakrywania. Omówione funkcje dają taką możliwość tylko dla wybranych
przypadków. Przykładem mogą być funkcje Jamesa-Coolidge’a, w przypadku których opis układów innych niż liniowe wiąże się z katastrofalnym wzrostem komplikacji całek. Innym kłopotem
jest wzrost kosztu obliczeń dla układów o liczbie elektronów N > 2, czego przykładem mogą
być metody Hylleraas-CI. W 1960 roku jednak, niezależnie Boys [47] i Singer [48] udowodnili,
że dla pewnej wybranej klasy funkcji będących iloczynami kartezjańskich funkcji Gaussa (4.15)
i czynników korelujących Gaussa postaci2
f=
"
N
Y
k=1
# N −1 N
Y Y
2
g (k; α, A, l, m, n)
e−βpq rpq
(4.16)
p=1 q=i+1
wszystkie pojawiające się całki policzyć można analitycznie. Całki te wyrazić można przez funkcję wykładniczą, pierwiastek kwadratowy, skończoną ilość podstawowych działań algebraicznych
oraz dobrze znaną w literaturze funkcję [49]
Fm (t) =
Z1
2
e−tx x2m dx.
(4.17)
0
W niniejszej pracy rozważane są tylko układy dwuelektronowe. Funkcja typu (4.16) opisująca
takie układy w rozwinięciu na sferyczne funkcje Gaussa przyjmuje szczególnie prostą postać
Ψ=
X
i
2
2
2
2
ci e−α1i |r 1 −Ai1 | e−α2i |r 2 −Ai2 | e−βi r12 .
(4.18)
Dla prostoty pominięta została tutaj część spinowa, operator antysymetryzacji i projektor przestrzenny.
23
4.4 Czynniki korelujące Jastrowa
Rafał A. Bachorz
Funkcje postaci (4.18) określa się mianem geminali gaussowskich (ang. Gaussian-type geminals,
GTG). Były one badane w latach sześdziesiątych, lecz ze względu na stosowanie krótkich rozwinięć oraz nieefektywną optymalizację parametrów nieliniowych otrzymywano słabe wyniki.
W związku z tym rozwijanie metod opartych na geminalach gaussowskich zostało na pewien
czas zaniechane. Dopiero na przełomie lat 70-tych i 80-tych pokazano, że kluczowe znaczenie dla
dokładności ma precyzyjna optymalizacja parametrów αi , Ai1 , Ai2 βi . Jeziorski i Szalewicz uzyskali dla cząsteczki wodoru wynik, który różnił się od wartości dokładnej o zaledwie kilka cm−1
[50]. Był to pierwszy, nieśmiały krok pokazujący potencjał drzemiący w wykładniczo skorelowanych funkcjach Gaussa. W ostatniej dekadzie pojawiła się seria prac, w których przeprowadzone
zostały obliczenia dla układów dwu-, trój- i czteroelektronowych. Niemalże wszystkie otrzymane
wyniki dla badanych układów atomowych i molekularnych okazały się lepsze od najlepszych dotąd opublikowanych [51, 30, 41, 52, 53]. Nawet w przypadku cząsteczki wodoru, wydawałoby się
że doskonale opisywanej przez funkcje Kołosa-Wolniewicza, otrzymano lepszy wynik. Minimalna
przewaga geminali świadczy jednak o wysokiej jakości uogólnionych funkcji Jamesa-Coolidge’a.
Sukces ten z cała pewnością jest wynikiem bardzo starannej optymalizacji parametrów nieliniowych.
Celem niniejszej pracy jest zastosowanie wykładniczo skorelowanych funkcji Gaussa do dokładnego opisu układów dwuelektronowych. Duży nacisk położony zostanie na problem pseudolosowego
generowania funkcji falowych oraz poźniejszą ich optymalizacje.
4.3.1
Wykładniczo skorelowane funcje Gaussa falowe z członami liniowymi
Ostatnio Pachucki i Komasa [58] zaproponowali bardzo ciekawą modyfikację wykładniczo skorelowanych funkcji Gaussa. Aby poprawić ich jakość pomnożyli funkcję postaci (4.16) przez człony
ri = |r i | i rij = |r i − r j |, gdzie r i to wektor położenia elektronu. Koncepcja ta przetestowana
została na najprostszym układzie atomowym, w którym istotna jest korelacja elektronowa czyli
na atomie helu. W przypadku tego układu badana funkcja ma postać
Ψ = Q̂as
n
X
i=1
gdzie
1,
2
2
2
ci Re−α1i r1 −α2i r2 −βi r12 ,
r1 ,
R=
r2 ,
r12 ,
mod
mod
mod
mod
(n, 4) = 1,
(n, 4) = 2,
(n, 4) = 3,
(n, 4) = 0.
(4.19)
(4.20)
Otrzymane wyniki są lepsze od tych uzyskanych dla klasycznych, wykładniczo skorelowanych
funkcji Gaussa. Wynika to z tego, iż funkcje Gaussa z członami liniowymi dobrze spełniają
warunek ostrza korelacyjnego (3.12a).
4.4
Czynniki korelujące Jastrowa
Funkcjami, które znalazły duże zastosowanie w obliczeniach typu kwantowe Monte Carlo (ang.
quantum Monte Carlo, QMC ) są tzw. czynniki korelacyjne Jastrowa [54]. Nie są to niezależne
funkcje falowe, lecz wyrażenia jawnie zależne od odległości międzyelektronowych, przez które
należy przemnożyć właściwe funkcje.
24
4.4 Czynniki korelujące Jastrowa
Rafał A. Bachorz
Funkcją próbną bardzo często wykorzystywaną w badaniach QMC jest suma iloczynów wyznaczników Slatera mnożona przez czynnik Jastrowa
Ψ=J
X
di Di↑ Di↓ .
(4.21)
i
Charakterystyczne jest to, że opisywane cząstki (najczęściej elektrony, choć mogą to być inne
cząstki podlegające statystyce Fermiego-Diraca) dzieli się na dwie grupy ze względu na zwrot
zetowej składowej spinu, i każdej z nich przyporządkowuje się osobny wyznacznik Slatera. Symbolicznie Di↑ i Di↓ oznacza wyznaczniki opisujące elektrony o spinie odpowiednio + 12 i − 12 .
Czynnik korelacyjny Jastrowa można wybrać na wiele sposobów. Bardzo często spotkać można
jego następującą postać
J=
NY
−1
N
Y
earij /(1+brij ) .
(4.22)
i=1 j=i+1
Czynnik korelacyjny Jastrowa jest również stosowany w rozwinięciach postaci3
Ψ=
L
X
ci φi ,
(4.23)
i=1
gdzie
φi = Q̂as fi (r )J.
(4.24)
Funkcja fi (r ) zdefiniowana jest następująco
fi (r ) =
N Y
M
Y
j=1 k=1
δ
(xj − Xk )αijk (yj − Yk )βijk (zj − Zk )γijk r jkijk .
(4.25)
W powyższym wyrażeniu (x, y, z) oraz (X, Y, Z) to kartezjańskie współrzędne odpowiednio elektronów i jąder, a α, β, γ oraz δ to odpowiednio dobrane liczby całkowite większe lub równe zero.
J w wyrażeniu (4.24) zdefiniowane jest tak samo jak w (4.22). Nietrudo zauważyć, że funkcje
przemnożone przez czynniki Jastrowa prowadzą do całek, których nie da się policzyć analitycznie. Niemniej są one chętnie wykorzystywane w metodach QMC, ponieważ wyznaczanie energii
sprowadza się tam do statystycznego próbkowania tzw. lokalnej energii
Eloc =
ĤΨ
,
Ψ
(4.26)
a do tego jak wiadomo nie jest konieczna analityczna całkowalność.
Bertini wraz z współpracownikami [55] zastosowali rozwinięcie w postaci (4.23) do wyznaczenia
energii układów o liczbie elektronów 2 − 5, lecz już dla cząsteczki wodoru uzyskali dokładność
rzędu dziesiątej części µ-hartree, co jest wynikiem bardzo słabym.
3
pominięta została część spinowa funkcji.
25
Rozdział 5
Zastosowanie wykładniczo
skorelowanych funkcji Gaussa do
układów dwuelektronowych
Najprostszymi układami, w których znaczenie ma korelacja elektronowa są atomy i cząsteczki dwuelektronowe. Trudno wyobrazić sobie lepsze obiekty do testowania nowych algorytmów,
gdyż ich względna prostota pozwala na dużą dokładność, a ogrom literatury umożliwia łatwą
weryfikację wyników. Bez wątpienia najlepiej poznane układy dwuelektronowe to atom helu i
cząsteczka wodoru. Dość dużo materiałów literaturowych znaleźć można na temat jonów H+
3,
.
Układy
dwuelektronowe
czterojądrowe
natomiast
są
wyraźnie
zaniedbane.
Dane
HeH+ czy He2+
2
literaturowe ograniczają się do kilku publikacji, a zamieszczane wyniki są raczej niskiej jakości.
Celem tej pracy jest wypełnienie tej luki i wyznaczenie energii i funkcji falowych na wysokim
poziomie dokładności.
5.1
Postać funkcji falowej i całki molekularne
Wprowadzenie do mechaniki kwantowej w ujęciu przestrzeni Hilberta zawarte w drugim rozdziale
pozwala na dokonanie pewnej istotnej uwagi. Jak wiadomo opis układów mikroskopowych daje
się elegancko z matematycznego punktu widzenia przeprowadzić w przestrzeni Hilberta. Elementami tej przestrzeni są abstrakcyjne wektory, a ich ewolucją rządzi równanie Schrödingera.
Pracując w formaliźmie Diraca trudno jednak otrzymać konkretne wielkości, dla chemika kwantowego jest on zbyt ogólny. Znacznie korzystniej jest pracować w konkretnej reprezentacji, a
szczególnie dogodna jest reprezentacja położeniowa. Dlatego w chemii kwantowej abstrakcyjne kety zastępuje się funkcjami falowymi, a przestrzeń Hilberta przestrzenią funkcji falowych1 .
Bardzo często nie interesuje nas jednak ewolucja czasowa układu tylko opisać chcemy stany
stacjonarne. Staje się to możliwe po separacji czasu z równania Schrödingera. Formalnie rzecz
ujmując po odseparowaniu czasu dostajemy równanie różniczkowe drugiego rzędu, którego rozwiązaniem jest funkcja falowa i energia (funkcja własna i wartość własna). Najczęściej równania
tego nie staramy się rozwiązać w sposób ogólny, tylko wybieramy pewną klasę funkcji. Wybrane
funkcje powinny być możliwie dobrze dopasowane do problemu, który chcemy rozwiązać. W
niniejszej pracy funkcjami tymi są wykładniczo skorelowane funkcje Gaussa.
1
Przestrzenie te są izomorficzne.
5.1 Postać funkcji falowej i całki molekularne
Rafał A. Bachorz
W najogólniejszej postaci wykładniczo skorelowane funkcje Gaussa przedstawić można w postaci
rozwinięcia
Ψ=
n
X
ci φi ,
(5.1)
i=1
gdzie
(
φi = Q̂as P̂R
"
N
Y
k=1
# N −1 N
Y Y
2
gk (r k ; αik , Aik , lik , mik , nik )
e−βipq rpq
p=1 q=i+1
×Ξ
N,S,MS
)
(5.2)
(σ1 , . . . , σN ) .
Zawarta w wyrażeniu (5.2) funkcja gk to kartezjańska funkcja Gaussa (4.15). Operator Q̂as
to antysymetryzator, P̂R jest projektorem (operatorem rzutowym) zapewniającym właściwą
(odpowiadającą R-tej reprezentacji nieprzywiedlnej) symetrię przestrzenną funkcji, a ΞN,S,MS
to funkcja spinowa, spełniająca równania
Ŝ 2 ΞN,S,MS = S(S + 1)ΞN,S,MS ,
(5.3a)
Ŝz ΞN,S,MS = MS ΞN,S,MS .
(5.3b)
W niniejszej pracy rozważane będą jednak wyłącznie dwuelektronowe sferyczne funkcje Gaussa.
Funkcja (5.2) przyjmie zatem postać
n
h
2
φi = Q̂as P̂R e−α1i |r 1 −Ai |
−α2i |r 2 −B i |2 −βi |r 2 −r 1 |2
i
o
× (αβ ± βα) .
(5.4)
W zależności od symetrii spinowej jaką chcemy uzyskać w funkcji spinowej powinien pojawić się
+ lub − odpowiednio dla stanu trypletowego i singletowego. Taką funkcje wykorzystać można
do obliczania elementów macierzowych. Pierwszym krokiem jest całkowanie po współrzędnych
spinowych, które dla układów dwuelektronowych jest zadaniem trywialnym. W wyniku tego
całkowania nasza funkcja przyjmie jeszcze prostszą postać
~
2
φi = (1̂ ± P̂12 )P̂R e−α1i |~r 1 −Ai |
2
~ i | −βi |~r 2 −~
−α2i |~r 2 −B
r 1 |2
,
(5.5)
gdzie operator P̂12 zamienia współrzędne elektronów. Wszystkie operatory po lewej stronie powyższego wyrażenia komutują ze sobą, więc ich kolejność nie ma znaczenia. Podobnie jak było
to wcześniej symetria spinowa zależy od znaku po lewej stronie wyrażenia (5.5), lecz tym razem
dla stanu singletowego wybieramy +, a dla trypletowego −. Po przeprowadzeniu całkowania po
współrzędnych spinowych rozwinięcie (5.1) z członem φi zdefiniowanym w (5.5) przygotowane
jest do całkowania po współrzędnych przestrzennych. Stosowanie metody Ritza wymaga obliczenia dwóch typów całek, mianowicie całek nakrywania i całek operatora Hamiltona. Zdefiniujmy
zatem hamiltonian elektronowy dla dowolnego układu dwuelektronowego wielojądrowego. W
jednostkach atomowych będzie on miał postać
N
X
Za
1
Za
1
−
+
Ĥ = − (∆1 + ∆2 ) +
2
r12 a=1 rVa 1 rVa 2
27
+
N
−1
X
N
X
Za Zb
a=1 b=a+1
Rab
,
(5.6)
5.1 Postać funkcji falowej i całki molekularne
Rafał A. Bachorz
gdzie ∆ to operator Laplace’a działający na współrzędne elektronowe, r12 to odległość międzyelektronowa, rVa 1 odległość między elektronem a jądrem Va , Rab to odległość między jądrami a
i b, Za to ładunek jądra a, a N to liczba jąder. Elementy macierzowe, które należy wyznaczyć
formalnie zapisać możemy
Hij = hψi |Ĥ|ψj i,
(5.7a)
Sij = hψi |ψj i,
(5.7b)
gdzie znak iloczynu skalarnego w przestrzeni Hilberta oznacza całkowanie po współrzędnych
dwóch elektronów. Po wprowadzeniu hamiltonianu (5.6) do wyrażenia (5.7a) otrzymamy2
1
Hij = −
2
−
N
X
Za
a=1
1
rVa 1
ψi ψj +
ψi ∆1 ψj + ψi ∆2 ψj
1
rVa 2
ψi ψj
+
N
−1
X
+
1
ψi ψj
r12
N
X
Za Zb
a=1 b=a+1
Rab
(5.8)
ψi ψj ,
co zapisać można w dogodniejszy sposób
Hij = −
N
−1 X
N
n
o
o NX
X
1n 1
Za Zb
S2 .
K2 + K22 + E2 −
Za N21 + N22 +
2
Rab
a=1
a=1 b=a+1
(5.9)
Nietrudno zauważyć, że całkowanie po współrzędnych przestrzennych sprowadza się do wyliczenie czterech całek molekularnych3
S2 = ψi ψj ,
(5.10a)
1
ψi ψj ,
E2 =
r12
1
ψi ψj ,
N21 =
rVa 1
K21
(5.10b)
(5.10c)
= ψi ∆1 ψj .
(5.10d)
Wszystkie całki można wyrazić prostymi wzorami analitycznymi, co ma bardzo duży wpływ na
czas obliczeń i ich dokładność. Prostota całek w dużej mierze wynika z prawdziwości twierdzenia
o iloczynie funkcji Gaussa (ang. Gaussian Product Theorem).
5.1.1
Twierdzenie o iloczynie funkcji Gaussa
Iloczyn dwóch sferycznych funkcji Gaussa scentrowanych w różnych punktach A i B jest z dokładnością do stałej multiplikatywnej sferyczną funkcją Gaussa scentrowaną w pewnym punkcie
odcinka AB (rys. 5.1). Wykażemy prawdziwość tego twierdzenia.
Weźmy dwie sferyczne funkcje Gaussa postaci
2
sA = e−α1 |r 1 −A| ,
2
sB = e−α2 |r 1 −B | ,
2
α1 , α2 > 0,
(5.11)
Dla wygody pomijane będą pionowe kreski oddzielające w iloczynach skalarnych.
Wykorzystujemy tutaj fakt, że wartości średnie operatorów jednoelektronowych w bazie zantysymetryzowanej
mają takie same wartości. Fakt ten wynika bezpośrednio z postulatu o nieodróżnialności cząstek identycznych.
3
28
5.1 Postać funkcji falowej i całki molekularne
co skrótowo zapiszemy
Rafał A. Bachorz
2
2
sB = e−α2 r1B .
sA = e−α1 r1A ,
Twierdzimy, że
(5.12)
2
sA sB = W e−γr1P ,
(5.13)
gdzie W i γ są pewnymi stałymi, a punkt P leży na odcinku AB.
A
P
B
Rysunek 5.1: Twierdzenie o iloczynie funkcji Gaussa
Dowód. Elementarna analiza wektorowa pozwala stwierdzić, że
r 1A = r 1P + P~A,
r 1B = r 1P + P~B.
(5.14)
Możemy zatem równanie (5.13) zapisać w postaci
e−α1 (P A
2
2
+r 21P +2P~A·r 1P ) −α2 (P B +r 21P +2P~B·r 1P )
e
2
= W e−γr1P .
(5.15)
Widać, że daje się ono łatwo rozseparować na trzy równania
2
2
e−α1 P A e−α2 P B = W,
−α1 r 21P
e
−α2 r 21P
e
−γ1 r 21P
=e
(5.16a)
,
~
~
e−2α1 P A·r 1P e−2α2 P B·r 1P = 1.
(5.16b)
(5.16c)
Po obustronnym zlogarytmowaniu równania (5.16c) otrzymamy
z czego wynika, że
−2(α1 P~A · r 1P + α2 P~B · r 1P ) = 0,
(5.17)
r 1P (α1 P~A + α2 P~B) = 0.
(5.18)
Wektor r 1P jest jednak zupełnie dowolny, więc powyższy iloczyn skalarny równy jest zero wtedy
gdy znika wyrażenie w nawiasie. Otrzymamy zatem
α1 (P~ − A) + α2 (P~ − B) = 0,
29
(5.19)
5.1 Postać funkcji falowej i całki molekularne
co da nam ostatecznie
Rafał A. Bachorz
α1 A + α2 B
.
P~ =
α1 + α2
(5.20)
Łatwo możemy sprawdzić, że punkt P~ zdefiniowany w (5.20) leży na odcinku AB, ponieważ
α1
α2
α1 A + α2 B
−A=
−1 A+
B
P~A = P~ − A =
α1 + α2
α1 + α2
α1 + α2
α2
α2
α2
~
=−
A+
B=
BA,
α1 + α2
α1 + α2
α1 + α2
co dowodzi powyższej tezy, ponieważ wartość stałej
równania (5.16b) możemy wyznaczyć stałą γ
α2
α1 +α2
(5.21)
zawarta jest zawsze między 0 i 1. Z
γ = α1 + α2 ,
(5.22)
a z równania (5.16a) stałą W . Aby to zrobić znaleźć należy wektor P~B. Uwzględniając wyrażenie
(5.21) dostaniemy
~ =
P~B = P~A − BA
α2
~ − BA
~ =
BA
α1 + α2
α2
~ = − α1 BA.
~
− 1 BA
α1 + α2
α1 + α2
(5.23)
Teraz dla wygody logarytmujemy równanie (5.16a) oraz korzystamy z (5.21) i (5.23). W konsekwencji otrzymamy
α22
α21
2
2
AB
−
α
AB
2
(α1 + α2 )2
(α1 + α2 )2
2
2
α1 α2
2 α α2 + α2 α1
2
=−
AB .
= −AB 1
2
2
(α1 + α2 )
(α1 + α2 )
2
2
ln W = −α1 P A − α2 P B = −α1
(5.24)
Pozbywając się logarytmu z lewej strony dostaniemy
α1 α2
2
AB .
W = exp −
α1 + α2
(5.25)
Udowodnione zostało zatem twierdzenie opisane wzorem (5.15). Jednocześnie uzyskaliśmy wzory
analityczne na P~ , γ i W odpowiednio (5.20), (5.22) i (5.25).
5.1.2
Transformacje i wzory pomocnicze
Całkowanie sferycznych funkcji Gaussa sprowadza się do stosowania kilku nieskomplikowanych
tożsamości. Z całą pewnością podstawą jest tutaj dobrze znana w analizie matematycznej całka
Laplace’a
r
Z∞
2
π
dla a > 0.
(5.26)
e−ax dx =
a
−∞
Korzystając z wyrażenia (5.26) wyprowadzić można wzory na inne potrzebne całki, mianowicie
Z∞
−∞
−ax2 +bx
e
dx =
r
π
b2
exp
a
4a
30
!
dla a > 0
(5.27)
5.1 Postać funkcji falowej i całki molekularne
Rafał A. Bachorz
oraz
Z∞ Z∞
−a1 x21 +b1 x1 −a2 x22 +b2 x2 +cx1 x2
e
−∞ −∞
2π
exp
dx = √
4a1 a2 − c2
a1 b22 + a2 b21 + b1 b2 c
√
4a1 a2 − c2
!
(5.28)
dla 4a1 a2 − c2 > 0.
Wyrażenia (5.26), (5.27) i (5.28) pozwalają wyznaczyć całki nakrywania. Pozostają jeszcze całki
kinetyczne i bardziej kłopotliwe całki energii potencjalnej. Wiadomo, że opertory energii potencjalnej są operatorami osobliwymi, dlatego trzeba zastosować transformacje pozwalające przenieść zmienną z mianownika operatora do wykładnika. W pracy tej stosowane jest podstawienie
Fouriera
Z
1
1
= 2 ei(r ·k ) k−2 dk ,
(5.29)
r
2π
gdzie całkujemy wektorowo, tzn. po trzech składowych wektora k . Jak widać wprowadzona
została dodatkowa zmienna k i aby się jej pozbyć skorzystać trzeba z tożsamości
−ak 2
e
= 2ak
2
Z1
s−3 e−ak
2 s−2
(5.30)
ds.
0
Dla ominięcia kłopotów przy całkowaniu wyrażeń z operatorami energii kinetycznej korzystnie
jest wprowadzić pewne ogólne własności kartezjańskich funkcji Gaussa
2
g (r , α, A, l, m, n) = (x − Ax )l (y − Ay )m (z − Az )n e−α|r −A| .
(5.31)
Zdefiniujmy dowolną całkę, która zależy od funkcji (5.31)
I(l, m, n) =
Z
f [g (r , α, A, l, m, n)] dτ .
(5.32)
Gdy wyznaczymy pochodną po składowej wektora A, to otrzymamy
∂I(l, m, n)
=
∂Ax
Z
∂g (r , α, A, l, m, n)
f
dτ .
∂Ax
(5.33)
Korzystając z definicji kartezjańskiej funkcji Gaussa (5.31) bez trudu policzyć można tą pochodną
∂g (r , α, A, l, m, n)
= −lg (r , α, A, l − 1, m, n) + 2αg (r , α, A, l + 1, m, n) .
(5.34)
∂Ax
Z (5.33) i (5.34) wynika
1
∂
I(l + 1, m, n) =
I(l, m, n) + lI(l − 1, m, n) .
2α ∂Ax
(5.35)
Widać wyraźnie, że przez odpowiednie różniczkowanie sferycznych funkcji Gaussa można otrzymać ogólniejsze, kartezjańskie funkcje Gaussa.
31
5.1 Postać funkcji falowej i całki molekularne
5.1.3
Rafał A. Bachorz
Całka nakrywania S2
Funkcja, ktorą stosujemy (5.1) nie jest znormalizowana, więc konieczne jest liczenie całek nakrywania. Całki ta mają postać
−α1i |r 1 −Ai |2 −α2i |r 2 −B i |2 −βi |r 2 −r 1 |2 −α1j |r 1 −Aj |2 −α2i |r 2 −B j |2 −βj |r 2 −r 1 |2
S2 = e
e
.
(5.36)
Po przejściu do reprezentacji położeniowej i wprowadzeniu dogodnych oznaczeń wyrażenie to
zapisujemy w postaci
S2 =
Z Z
2
2
φ1 φ3 e−βi |r 2 −r 1 | φ2 φ4 e−βj |r 2 −r 1 | dr 1 dr 2
(5.37)
r1 r2
gdzie podstawowe, sferyczne funkcje Gaussa definiujemy
2
φ1 = e−α1i |r 1 −Ai | ,
2
φ2 = e−α1j |r 1 −Aj | ,
2
φ3 = e−α2i |r 2 −B i | ,
2
φ4 = e−α2j |r 2 −B j | .
(5.38)
Całkowanie przebiega po współrzędnych obu elektronów, więc jest to całka sześciokrotna. Widać
wyraźnie, że do par φ1 , φ2 oraz φ3 , φ4 zastosować możemy twierdzenie o iloczynie funkcji Gaussa.
Gdy to zrobimy wyrażenie przyjmie postać
S 2 = W1 W2
Z Z
e−γ1 |r 1 −P|
2
−γ2 |r 2 −Q|2 −β|r 2 −r 1 |2
dr 1 dr 2 ,
(5.39)
r1 r2
gdzie przyjęto następujące oznaczenia
−
γ1 = α1i + α1j ,
W1 = e
γ2 = α2i + α2j ,
W2 = e
−
α1i α1j
γ1
α2i α2j
γ2
|Ai Aj |2
|Bi Bj |2
,
,
α1i Ai + α1j Aj
,
γ1
α2i B i + α2j B j
Q=
,
γ2
P=
(5.40)
oraz
β = βi + βj .
(5.41)
Łatwo zauważyć, że sześciokrotną całkę (5.39) można sfaktoryzować na iloczyn trzech całek
dwukrotnych (po każdej składowej kartezjańskiej), co zapisać można
S2 = W1 W2 Ix Iy Iz .
(5.42)
Składowa x-owa powyższego wyrażenia ma postać
h
i
Ix = exp −γ1 Px2 − γ2 Q2x ×
Z∞ Z∞
−∞ −∞
h
i
exp −(γ1 + β)x21 + 2γ1 Px x1 − (γ2 + β)x22 + 2γ2 Qx x2 + 2βx1 x2 dx1 dx2 .
(5.43)
Wkłady od pozostałych składowych wyglądają analogicznie, wystarczy zatem skupić się na
wyrażeniu (5.43). Widać, że całka ta ma identyczną postać jak zdefiniowana wcześniej (5.28).
Wykorzystując zatem ten wzór otrzymamy
h
i
2π
exp −γ1 Px2 − γ2 Q2x
Ix = p
γ1 γ2 + β(γ1 + γ2 )
"
#
(γ1 + β)γ22 Q2x + (γ2 + β)γ12 Px2 + 2γ1 γ2 Qx Px β
× exp
.
γ1 γ2 + β(γ1 + γ2 )
32
(5.44)
5.1 Postać funkcji falowej i całki molekularne
Rafał A. Bachorz
Biorąc pod uwagę pozostałe składowe wyjściowej całki oraz dokonując elementarnych przekształceń algebraicznych dostaniemy końcowe wyrażenie na dwuelektronową całkę nakrywania
S 2 = W1 W2
π
√
η
!3
"
#
−γ1 γ2 β|P Q|2
exp
,
η
(5.45)
gdzie
η = γ1 γ2 + β(γ1 + γ2 ).
5.1.4
(5.46)
Całki energii potencjalnej E2 i N21
Wszystkie całki energii potencjalnej zawierają kłopotliwe człony proporcjonalne do odwrotności
odległości. Można jednak je wyeliminować stosując podstawienie Fouriera. Tok obliczeń całek
E2 i N21 jest bardzo podobny, ograniczymy się więc tylko do całki E2 . Ma ona postać
−α1i |r 1 −Ai |2 −α2i |r 2 −B i |2 −βi |r 2 −r 1 |2 −α1j |r 1 −Aj |2 −α2i |r 2 −B j |2 −βj |r 2 −r 1 |2
S2 = e
e
1
.
r12
(5.47)
Po wprowadzeniu oznaczeń (5.38) i zastosowaniu twierdzenia o iloczynie funkcji Gaussa otrzymamy
Z Z
2
2
2 1
dr 1 dr 2 ,
(5.48)
e−γ1 |r 1 −P| −γ2 |r 2 −Q| −β|r 2 −r 1 |
S 2 = W1 W2
r12
r1 r2
gdzie wszystkie oznaczenia są zdefiniowane identycznie jak w przypadku całki nakrywania (5.40).
Teraz zastosujemy podstawienie Fouriera (5.29)
W1 W2
S2 =
2π 2
Z Z
−γ1 |r 1 −P |2 −γ2 |r 2 −Q|2 −β|r 2 −r 1 |2
e
r1 r2
Z
k
−2 i(r 2 −r 1 )·k
e
dk dr 1 dr 2 .
(5.49)
Widać, że można w pierwszej kolejności wycałkować po zmiennych przestrzennych, poźniej zaś
po tymczasowo wprowadzonej zmiennej k . Podobnie jak w przypadku całki nakrywania, sześciokrotna całka po współrzędnych obu elektronów sfaktoryzuje się na iloczyn trzech całek, gdzie
każda odpowiada pojedynczej składowej kartezjańskiej, co zapisać można
S2 =
W1 W2
2π 2
Z
Ix Iy Iz k −2 dk .
(5.50)
Nietrudno się domyślić, że poszczególne składowe kartezjańskie dają takie same wkłady do całki,
więc rozważymy tylko składową x-ową. Przyjmuje ona postać
Ix = exp
h
−γ1 Px2
−
γ2 Q2x
i Z∞ Z∞
−∞ −∞
h
exp − (γ1 + β)x21 + (2γ1 Px − ikx )x1 − (γ2 + β)x22
i
(5.51)
+ (2γ2 Qx + ikx )x2 + 2βx1 x2 dx1 dx2 .
Znów, korzystając ze wzoru (5.28) i przekształcając do prostej postaci otrzymamy
"
#
γ1 γ2 β|P Q|2x
π
exp −
×
Ix = p
γ1 γ2 + β(γ1 + γ2 )
γ1 γ2 + β(γ1 + γ2 )
"
#
4iγ1 γ2 (kx Qx − kx Px ) − kx2 (γ1 + γ2 )
exp
.
4γ1 γ2 + β(γ1 + γ2 )
33
(5.52)
5.1 Postać funkcji falowej i całki molekularne
Rafał A. Bachorz
Biorąc pod uwagę wszystkie składowe kartezjańskie otrzymamy
Ix Iy Iz =
"
3
#
"
#
γ1 γ2 β|P Q|2
−4iγ1 γ2 k · PQ − (γ1 + γ2 )k 2
exp −
exp
,
η
4η
π
η
(5.53)
gdzie η zdefiniowane jest w (5.46). Podstawiając (5.53) do (5.50) dostaniemy
"
πW1 W2
γ1 γ2 β|P Q|2
E2 =
exp
−
η
2η 3/2
#Z
k
−2
"
#
−4iγ1 γ2 k · PQ − (γ1 + γ2 )k 2 ~
exp
dk.
4η
(5.54)
Wykorzystamy teraz tożsamość (5.30), która wyeliminuje nam niewygodny człon k −2 . Po prostych przekształceniach dostaniemy
"
γ1 γ2 β|P Q|2
πW1 W2
exp
−
E2 =
η
2η 3/2
# Z1
s−3
Z
|
0
"
#
(γ1 + γ2 )s−2 k 2 iγ1 γ2 k · PQ
+
exp −
dk ds.
4η
η
{z
Ik
}
(5.55)
Należy teraz przeprowadzić całkowanie po składowych wektora k . Widać wyraźnie, że trójwymiarowa całka Ik faktoryzuje się na iloczyn trzech prostych całek jednowymiarowych
Ik = Ikx Iky Ikz ,
(5.56)
gdzie wystarczy rozważyć tylko jedną składową
Ikx =
Z∞
−∞
"
#
(γ1 + γ2 )s−2 kx iγ1 γ2 kx P Qx
exp −
+
.
4η
η
(5.57)
Do wyznaczenia wartości tej całki stosujemy wzór (5.27). Gdy mamy już obliczone wyrażenie
(5.56), wówczas wstawiamy je do (5.55) i po krótkich obliczeniach dostajemy
"
2π 5/2 W1 W2
γ1 γ2 β|P Q|2
E2 = √
exp −
η γ1 + γ2
η
# Z1
0
"
#
(γ1 γ2 |P Q|)2 2
s ds,
exp −
η(γ1 + γ2 )
(5.58)
co możemy zapisać wykorzystując postać funkcji (4.17)
"
#
"
#
(γ1 γ2 |P Q|)2
γ1 γ2 β|P Q|2
2π 5/2 W1 W2
exp −
F0
.
E2 = √
η γ1 + γ2
η
η(γ1 + γ2 )
(5.59)
Jak widać całka energii potencjalnej wyraża się przez nieanalityczną funkcję (4.17), którą trzeba
na bieżąco liczyć numerycznie.
Drugim typem całek operatora energii potencjalnej są całki odziaływania elektron–jądro postaci
N21 = e−α1i |r 1 −Ai |
2
−α2i |r 2 −B i |2 −βi |r 2 −r 1 |2 −α1j |r 1 −Aj |2 −α2i |r 2 −B j |2 −βj |r 2 −r 1 |2
e
1
rVa 1
.
(5.60)
Obliczamy je analogicznie do całek opertora elektron–elektron wstawiając zamiast wektora odległości międzyelektronowej r 12 = r 2 − r 1 wektor odległości elektron–jądro r Va 1 = V a − r 1 ,
gdzie V a to wektor położenia jądra a. Biorąc to pod uwagę, całkę typu N21 wyrazić można
N21
"
γ1 γ2 β|P Q|2
2π 5/2 W1 W2
exp −
= √
η γ1 + γ2
η
34
# Z1
0
"
#
Θ2
s2 ds,
exp −
η(γ2 + β)
(5.61)
5.1 Postać funkcji falowej i całki molekularne
Rafał A. Bachorz
gdzie iloczyn skalarny Θ2 wyraża się wzorem
Θ2 = Θ2x + Θ2y + Θ2z ,
(5.62)
a jego x-ową składową zapisać można w postaci
Θx = γ1 (γ2 + β)P Vax + γ2 βQVa x .
(5.63)
Znowu wygodnie jest odwołać się do definicji (4.17) i przedstawić wyrażenie (5.61) w postaci
"
#
#
"
γ1 γ2 β|P Q|2
2π 5/2 W1 W2
Θ2
exp −
E2 = √
F0
.
η γ1 + γ2
η
η(γ2 + β)
5.1.5
(5.64)
Całka energii kinetycznej K21
Wyznaczenie tej całki sprowadza się do umiejętnego różniczkowania obliczonej już całki nakrywania S2 . Ogólną postać całki K21 zapisać można
2
K21 = e−α1i |r 1 −Ai |
−α2i |r 2 −B i |2 −βi |r 2 −r 1 |2
2
∆1 e−α1j |r 1 −Aj |
−α2i |r 2 −B j |2 −βj |r 2 −r 1 |2
.
(5.65)
Korzystając z tego, że operatora Laplace’a jest sumą operatorów drugich pochodnych dostaniemy
2
2
βi |r 2 −r 1 |2
2
∆z1 φ2 φ4 eβj |r 2 −r 1 |
K21 = φ1 φ3 eβi |r 2 −r 1 | ∆x1 φ2 φ4 eβj |r 2 −r 1 |
+ φ1 φ3 e
2
+ φ1 φ3 eβi |r 2 −r 1 | ∆y1 φ2 φ4 eβj |r 2 −r 1 |
2
(5.66)
= Kx + Ky + Kz ,
gdzie oznaczenia są takie jak w (5.38), a operatory wewnątrz iloczynu skalarnego to drugie
pochodne względem odpowiedniej składowej kartezjańskiej. Nietrudno zauważyć, że wkłady od
poszczególnych składowych są identyczne, wystarczy więc rozważać tylko x-ową składową wyrażenia (5.66). Musimy zatem wyznaczyć wartość następującej całki
2
2
Kx = φ1 φ3 eβi |r 2 −r 1 | ∆x1 φ2 φ4 eβj |r 2 −r 1 |
= φ1 φ3 eβi |r 2 −r 1 |
2
2
∂2
φ2 φ4 eβj |r 2 −r 1 | .
2
∂x1
(5.67)
Na początku wyznaczmy wartość drugiej pochodnej
∂2 βj |r 2 −r 1 |2
2 2
2 2
φ
φ
e
=
−2α
−
2β
+
4α
x
+
4β
x
−
8α
β
x
x
2 4
1j
j
1j j 1Aj 12 ×
1j 1Aj
j 12
∂x21
βj |r 2 −r 1 |2
φ2 φ4 e
(5.68)
,
gdzie x1Aj i x12 oznaczają x-owe składowe wektorów r 1Aj = r 1 − Aj i r 12 = r 2 − r 1 . Wykorzystamy teraz oczywistą tożsamość wektorową
r 12 = r 1Aj + Aj Bj − r 2Bj .
35
(5.69)
5.1 Postać funkcji falowej i całki molekularne
Rafał A. Bachorz
Po wstawieniu zależności (5.69) do wyrażenia (5.68) i po elementarnych przekształceniach dostaniemy
Kx = −2 (α1j + βj ) +
2
4βj2 Aj Bj x
βi |r 2 −r 1 |2
φ1 φ3 e
βj |r 2 −r 1 |2
φ2 φ4 e
+
2
2
4 (α1j − βj )2 φ1 φ3 eβi |r 2 −r 1 | x21Aj φ2 φ4 eβj |r 2 −r 1 |
4βj2
2
2
φ1 φ3 eβi |r 2 −r 1 | x22Bj φ2 φ4 eβj |r 2 −r 1 |
βi |r 2 −r 1 |2
8βj Aj Bj (α1j − βj ) φ1 φ3 e
8βj2 Aj Bj
βi |r 2 −r 1 |2
φ1 φ3 e
βj |r 2 −r 1 |2
x1Aj φ2 φ4 e
βj |r 2 −r 1 |2
x2Bj φ2 φ4 e
+
(5.70)
−
2
−
+
8βj (α1j − βj ) φ1 φ3 eβi |r 2 −r 1 | x1Aj x2Bj φ2 φ4 eβj |r 2 −r 1 |
2
.
Wszystkie składniki wyrażenia (5.70) wyznacza się podobnie stosując wprowadzone wcześniej
własności kartezjańskich funkcji Gaussa (5.33) i (5.34). Dla przykładu zostanie wyliczony tylko
jeden człon, co jest wystarczającą ilustracją sposobu wyznaczania całki kinetycznej. Skupmy się
zatem na wyrażeniu
2
φ1 φ3 eβi |r 2 −r 1 | x1Aj φ2 φ4 eβj |r 2 −r 1 |
2
1
=
2α1j
2
2
∂
φ1 φ3 eβi |r 2 −r 1 | φ2 φ4 eβj |r 2 −r 1 |
∂Ajx
!
.
(5.71)
Prawa strona powyższego równania jest wynikiem zastosowania tożsamości (5.35). Widać więc,
że należy wykonać różniczkowanie całki nakrywania S2 względem x-owej składowej wektora Aj ,
formalnie możemy więc zapisać
2
2
∂
φ1 φ3 eβi |r 2 −r 1 | φ2 φ4 eβj |r 2 −r 1 |
∂Ajx
π
√
η
!3
π
√
η
!3
∂
W1 W2
=
∂Ajx
∂
W1 W2
∂Ajx
#
"
−γ1 γ2 β|P Q|2
exp
=
η
exp(ξ) ,
(5.72)
gdzie
−γ1 γ2 β|P Q|2
,
η
a pozostałe oznaczenia są takie jak w (5.40) i (5.46). Możemy zatem napisać
ξ=
!3
∂
S 2 = W2
∂Ajx
π
√
η
S2
α1j W1 exp(ξ)
∂
∂
exp(ξ) + exp(ξ)
W1 .
W1
∂Ajx
∂Ajx
∂
(W1 exp(ξ)) =
∂Ajx
!
(5.73)
(5.74)
Należy teraz wyznaczyć pochodne
∂
−2α1j γ2 βP Qx exp(ξ)
exp(ξ) =
∂Ajx
η
36
(5.75)
5.2 Funkcja błędu
Rafał A. Bachorz
oraz
∂
exp(ξ) = 2α1j P Ajx W1 .
∂W1
(5.76)
Gdy wstawimy wyznaczone pochodne (5.75) i (5.76) do wyrażenia (5.74) to otrzymamy końcowe
wzór na element (5.71) całki kinetycznej. Po przeprowadzeniu elementarnych działań algebraicznych dostaniemy
2
2
φ1 φ3 eβi |r 2 −r 1 | x1Aj φ2 φ4 eβj |r 2 −r 1 |
γ2 βP Qx
= P Ajx −
η
!
S2 .
(5.77)
Widać więc, że udało się wyrazić (5.71) jako kombinację liniową całek nakrywania. Podobnie
zrobić można z pozostałymi członami wyrażenia (5.70), patrz [56]. Końcową postać całki kinetycznej K21 przedstawić można następująco
K21 = 4Ω2 − 6
(γ1 + γ2 )βi βj + ε1 + ε2 + α1i α1j (γ2 + β)
S2 ,
η
(5.78)
ε1 = α1i γ2 βj ,
ε2 = α1j γ2 βi ,
ε1 − ε2
P Qx .
η
(5.79)
gdzie
5.2
Ωx = α1j P Ajx +
Funkcja błędu
Do wyrażenia całek operatorów energii potencjalnej elektronów niezbędne jest wykorzystanie
funkcji błędu. Całkę odziaływania elektron–elektron sprowadziliśmy do wyrażenia (5.58) gdzie
niezbędne jest numeryczne oszacowanie funkcji
F0 (a) =
Z1
0
exp −as2 ds,
(5.80)
gdzie a > 0. Zwykle zagadnienie to sprowadza się do wyznaczania funkcji błędu, która jest
bardzo dobrze znana [49]. Wykonując elementarne podstawienie dostaniemy
F0 (a) =
Z1
0
1
exp −as2 ds = √
a
√
Za
0
exp −u2 du.
(5.81)
Funkcję błędu definiuje się natomiast
2
erf(t) = √
π
Zt
0
exp −u2 du.
(5.82)
Wykorzystując wzory (5.81) i (5.82) wyrazimy szukaną funkcję (5.80) przez dobrze znaną funkcję
błędu
√
√
r
Za
√
π 1
π
2
√
erf( a).
exp −u du =
(5.83)
F0 (a) =
2
a
4a
0
37
5.3 Ortonormalizacja Masamury
5.3
Rafał A. Bachorz
Ortonormalizacja Masamury
Wyznaczone w poprzednim podrozdziale całki pozwalają na obliczenie wszystkich elementów
macierzowych. W ogólności zbiór bazowy, który zastosowaliśmy nie jest zbiorem ortonormalnym. Dlatego też, zgodnie z równaniem (2.64), rozwiązać należy tzw. uogólnione zagadnienie
własne
H~ci = ǫi S~ci ,
(5.84)
gdzie H i S to odpowiednio macierze całek hamiltonianu i nakrywania, ǫi to i-ta wartość własna
a ~ci to odpowiadający jej wektor własny. Istnieje wiele sposobów pozwalających na znalezienie
rozwiązania równania (5.84), jednym z nich jest sprowadzenie problemu do standardowego
zagadnienia własnego
e ci = ǫi~ci
H~
(5.85)
i późniejsze jego rozwiązanie. Przekształcenie zagadnienia (5.84) w (5.85) dokonuje się za pomocą
transformacji liniowej zdefiniowanej przez macierz T
e = TT HT.
H −→ H
(5.86)
Transformacja ta jest tzw. transformacją przez podobieństwo, więc nie zmieniamy spektrum
wartości własnych. Istnieje wiele sposobów praktycznej realizacji transformacji (5.86), w niniejszej pracy został wykorzystany algorytm Masamury [60]. Składa się on z dwóch zasadniczych
etapów, mianowicie z ortogonalizacji i normalizacji. Po tych operacjach dostajemy macierz hamiltonianu w bazie ortonormalnej, co formalnie sprowadza się do przekształcenia macierzy całek
nakrywania w macierz jednostkową. Pierwszy etap, ortogonalizację przedstawić można następującym schematem
Dla i = 2, 3, . . . , n wykonuj (1)
1. Dla j = 1, 2, . . . , i − 1 wykonuj (a) − (c)
(a) oblicz iloraz Sij /Sjj = dij
(b) od i-tego wiersza macierzy S i H odejmij j-ty wiersz pomnożony przez dij ,
(c) od i-tej kolumny macierzy S i H odejmij j-tą kolumnę pomnożoną przez dij ,
Wykonanie punktów (b) i (c) odpowiada modyfikacji i-tej funkcji zgodnie z równaniem
φi ←− φi − dij φj ,
(5.87)
co zgodnie z elementarną algebrą liniową nie zmienia rozwiązań równania (5.84). Nietrudno
zauważyć, że wykonanie operacji (1)(a) − (c) dla danej wartości parametru i spowoduje wyzerowanie fragmentu i-tego wiersza oraz i-tej kolumny (od początku do elementu poprzedzającego
element diagonalny) macierzy S. W każdym przebiegu pętli po j zerowane są bowiem elementy
Sij i Sji zgodnie z równaniami
Sij
Sii ,
(5.88a)
Sij ←− Sij −
Sii
Sji ←− Sji −
Sji
Sii .
Sii
(5.88b)
Po zakończeniu operacji macierz S staje się diagonalna. Ponieważ identyczne transformacje przeprowadzaliśmy na macierzy H, więc tym sposobem wyraziliśmy macierz hamiltonianu w bazie
ortogonalnej. Rozważmy teraz następujący cykl operacji.
38
5.4 Standardowe zagadnienie własne
Rafał A. Bachorz
Dla i = 1, 2, . . . , n√wykonuj następujące operacje
(1) oblicz ci = 1/ Sii
(2) Pomnóż i-ty wiersz macierzy H przez ci
(3) Pomnóż i-tą kolumnę macierzy H przez ci
Wykonanie punktów (2) i (3) odpowiada modyfikacji i-tej funkcji bazowej zgodnie z równaniem
φi ←− ci φi .
(5.89)
Wszystkie te operacje doprowadziły do tego, że dostaliśmy macierz hamiltonianu w bazie
ortonormalnej. Odpowiada to przekształceniu uogólnionego zagadnienia własnego (5.84) w
jego standardowy odpowiednik (5.85).
Ortonormalizacja w ujęciu Masamury jest algorytmem o złożoności obliczeniowej rzędu O(n3 ).
Będzie to zatem jeden z najbardziej czasochłonnych etapów pracy programu GEMINI. Nietrudno zauważyć jednak, że gdy zmieniamy funkcję bazową o numerze nf , to fragment szue (macierzy operatora Hamiltona w bazie ortonormalnej) zależącej od funkcji
kanej macierzy H
1, . . . , nf − 1 pozostaje niezmieniony. Można zatem zastosować tzw. uaktualnianie (ang. updating) macierzy. Polega to na stosowaniu algorytmu Masamury tylko do tego fragmentu macierzy,
który uległ modyfikacji. Pozwala to zaoszczędzić duże ilości czasu komputera. Widać, że czas
potrzebny na wyznaczenie funkcji celu (energii) będzie malał wraz ze wzrostem numeru aktualnie optymalizowanej funkcji. W programie GEMINI wykorzystana została również symetria
macierzy hamiltonianu. Pozwala ona pracować tylko na górnym lub dolnym trójkącie, a w przypadku uaktualniania tylko na niepełym trójkącie, czyli na trapezie4 macierzy H. Uproszczenia te
pozwalają na kilkakrotne zwiększenie wydajności programu, a co za tym idzie uzyskanie lepszych
wyników przy mniejszych nakładach.
5.4
Standardowe zagadnienie własne
Po zastosowaniu zmodyfikowanego algorytmy Masamury5 dostajemy standardowe zagadnienie
własne. Istnieje wiele metod pozwalających na rozwiązanie tego zagadnienia. W programie GEe do postaci trójMINI zastosowany został dwuetapowy schemat: Sprowadzanie macierzy H
diagonalnej za pomocą ciągu transformacji Householdera oraz wyznaczenie wszystkich wartości
własnych z macierzy trójdiagonalnej za pomocą niejawnego algorytmu QL/QR.
5.4.1
Metoda Householdera
Punktem wyjścia jest symetryczna, gęsta6 macierz A1 , którą zapisać można w następującej,
blokowej postaci
∗ ∗ ··· ∗
!
T
∗ ∗ ··· ∗
c
B
1
1
,
(5.90)
A1 =
. = B
.. .. . .
1 D1
. ..
. .
∗ ∗ ··· ∗
gdzie gwiazdki oznaczają niezerowe wyrazy, c1 jest wielkością skalarną, B 1 – wektorem o (n − 1)
współrzędnych, a D1 macierzą o rozmiarze (n − 1) × (n − 1). Pierwszysm etapem sprowadzania
4
Trapez macierzy wyznaczamy gdy numer aktualnie modyfikowanej funkcji n > 1.
Modyfikacja polega na stosowaniu uaktualniania i wykorzystaniu symetrii macierzy.
6
Ilość niezerowych wyrazów proporcjonalna do n2 .
5
39
5.4 Standardowe zagadnienie własne
Rafał A. Bachorz
A do postaci trójdiagonalnej jest wyzerowanie n − 2 wyrazów pierwszego wiersza i pierwszej
kolumny, tj. doprowadzenia jej za pomocą przekształcenia przez podobieństwo do postaci
∗ σ2
σ
2 ∗ ···
A2 =
.. . .
.
.
∗ ···
∗
..
.
∗
.
(5.91)
Żądamy, aby dokonywało się to w wyniku następujących przekształceń
A2 = Z̄T1 A1 Z̄T1 =
1 0T
0 ZT1
!
c1 B T1
B 1 D1
!
1 0T
0 Z1
!
=
c1
B T1 Z1
T
Z1 B 1 ZT1 D1 Z1
!
,
(5.92)
gdzie 0 oznacza (n − 1) wymiarowy wektor zerowy, Z1 zaś macierz ortogonalną o rozmiarze
(n − 1) × (n − 1). Macierz tą otrzymuje się następująco
Z1 = B 1 − 2w1 ⊗ w1 = 1 − 2w1 wT1 ,
(5.93)
gdzie w1 ∈ Rn−1 to pewien unormowany wektor, którego składowe wyznaczymy później, a
⊗ to normalny iloczyn zewnętrzny dwóch wektorów. Porównując wyrażenia (5.91) i (5.92) i
wykorzystując łaczność mnożenia macierzy dostaniemy następującą tożsamość wektorową
ZT1 B 1 = B 1 − 2w1 wT1 B 1 = B 1 − 2w1 (2w1 · B 1 ) = (σ2 , 0, . . . , 0)T .
(5.94)
Z algebry liniowej wiadomo jednak, że przekształcenia ortogonalne zachowują długość wektorów,
co w naszym wypadku oznacza kZT1 B 1 k2 = kB 1 k2 . To z kolei pozwala nam wyliczyć
σ22 =
n−1
X
i=1
b2i ,
v
un−1
uX
σ = −sgn b1 t
b2i ,
(5.95)
i=1
gdzie bi to składowe wektora B 1 , a znak liczby σ wybrany został tak aby zmniejszyć błędy
związane z zaokrągleniami. Oznaczmy teraz
w1 · B 1 = K1
(5.96)
i porównajmy składowe wektorów z wyrażeniem (5.94). Gdy każdą tożsamość podniesiemy do
kwadratu i dodamy równania stronami, to dostaniemy
n−1
X
i=1
b2i + σ22 − 2b1 σ2 = 4K12
n−1
X
i=1
wi2 = 4K12 kw1 k2 = 4K12 .
(5.97)
Gdy wykorzystamy zależność (5.95), to otrzymamy
σ2 (σ2 − b1 ) = 2K12 .
(5.98)
Wyznaczając K1 z równania (5.98) i korzystając z równania (5.96) dostajemy wzór pozwalajaący
wyznaczyć wszystkie składowe szukanego wektora w1
1
(b1 − σ2 , b2 , . . . , bn−1 )T .
w1 = p
σ2 (σ2 − b1 )
40
(5.99)
5.4 Standardowe zagadnienie własne
Rafał A. Bachorz
Pozostaje jeszcze do wyliczenia prawy dolny blok macierzy A2
ZT1 D1 Z1 = (1 − 2w1 ⊗ w1 )D1 (1 − 2w1 ⊗ w1 )
= D1 − 2w1 ⊗ w1 D1 − 2D1 w1 ⊗ w1 + 4w1 ⊗ w1 D1 w1 ⊗ w1
= D1 − 2w1 wT1 D1 − 2D1 w1 wT1 + 4w1 wT1 D1 w1 wT1
= D1 −
= D1 −
2w1 uT1 − 2u1 wT1
w1 vT1 − v1 wT1 =
(5.100)
+ 4w1 uT1 w1 wT1
D1 − w1 ⊗ v1 − v1 ⊗ w1 ,
gdzie wprowadzone zostały pomocnicze wektory
u1 = D1 w1 ,
v1 = 2[u1 − (w1 · u1 )w1 ].
(5.101)
Niewątpliwą zaletą podanego algorytmy jest to, że nie wykonujemy mnożenia pełnych macierzy,
tylko ograniczamy się do wyznaczenia odpowiednich iloczynów skalarnych. Złożoność obliczeniową O(n3 ) zastępujemy korzystniejszą O(n2 ).
W kolejnych krokach algorytmu zerujemy kolejne wiersze i kolumny macierzy A. W m-tym kroku
macierz ma postać
∗
∗
.
∗ ..
..
.
Am =
..
.
..
. ∗
∗ ∗ ∗ ···
∗ ∗ ···
.. .. . .
.
. .
∗ ∗ ···
∗
∗
..
.
∗
=
Cm B Tm
B m Dm
!
,
(5.102)
gdzie blok Cm ∈ Rm×m ma już strukturę diagonalną, a blok B m ∈ R(n−m)×m zawiera niezerowe
wyrazy tylko w ostatniej kolumnie
B m = (0, . . . , 0, B m ).
(5.103)
Przekształcenie przez podobieństwo w m-tym kroku ma postać
Am+1 =
Z̄Tm A1 Z̄Tm
=
1m 0Tm
0m ZTm
!
Cm B Tm
B m Dm
Cm
B Tm Zm
T
T
Zm B 1 Zm Dm Zm
!
!
1m 0Tm
0 m Zm
!
=
(5.104)
,
gdzie 1m ∈ Rm×m to macierz jednostkowa, 0m ∈ R(n−m)×m jest macierzą zerową, a Zm ∈
R(n−m)×(n−m) to macierz Householdera. Zatem po m-krotnym wykonaniu wszystkich transformacji dostajemy macierz w postaci trójdiagonalnej.
5.4.2
Niejawny algorytm QL/QR
Drugim etapem rozwiązania standardowego zagadnienia własnego jest wyznaczenie wartości
własnych z macierzy trójdiagonalnej. Zastosowanie niejawnego algorytmu QL/QR pozwala na
szukanie rozwiązań nawet wtedy, gdy wyrazy w macierzy różnią sie o wiele rzędów wielkości
[61, 62]. Algorytm ten oparty jest na następującym twierdzeniu.
41
5.4 Standardowe zagadnienie własne
Rafał A. Bachorz
Twierdzenie 1 (O macierzy symetrycznej) Jeśli A jest niezdegenerowaną macierzą symetryczną i T = QT AQ – macierzą trójdiagonalną o dodatnich wyrazach pozadiagonalnych, a Q
– macierzą ortogonalną, to macierze T i Q są jednoznacznie określone przez ostatni wiersz
macierzy QT .
Dowód zostanie pominięty, znaleźć go można m.in. w [63].
Macierz trójdiagonalną otrzymaną w poprzednim podrozdziale oznaczymy następująco
d1
e1
e
1
Tl =
d2
..
.
..
.
..
.
..
..
.
. dn−1 en−1
en−1 dn
.
(5.105)
Powyższe twierdzenie zastosujemy teraz do macierzy trójdiagonalnej Tl . Niech
T̄l+1 = Q̄Tl T̄Q̄l ,
(5.106)
Q̄Tl jest macierzą ortogonalną i ma taki sam ostatni wiersz jak QTl w algorytmie QL [63], a
indeksowanie związane jest z numeracją kroków algorytmu. Wówczas
Q̄l = Ql ,
T̄l+1 = Tl+1 .
(5.107)
Przypomnijmy, że w l-tym kroku algorytmu QL
QT = G1 · · · Gn−1 ,
(5.108)
ostatni wiersz Q̄T jest taki sam jak ostatni wiersz macierzy Givensa Gn−1 zerującej wyraz
(n − 1, n) macierzy T − z1. Macierze obrotu Givensa mają postać
Gi =
1
..
.
ci −si
si ci
..
.
1
,
(5.109)
gdzie ci = cos ϕ oraz si = sin ϕ. Zatem wyrazy ostatniej macierzy Givensa mają postać
dn − z
cn−1 = q
,
e2n−1 + (dn − z)2
−en−1
sn−1 = q
.
e2n−1 + (dn − z)2
Nietrudno zauważyć jednak, że macierz
Gn−1 TGTn−1
..
.
.
..
=
..
.
dn−3 en−3
en−3 dn−2 en−2 fn−2
en−2 dn−1 en−1
fn−2 en−1 dn
42
(5.110)
(5.111)
5.4 Standardowe zagadnienie własne
Rafał A. Bachorz
posiada dwa dodatkowe, niezerowe wyrazy fn−2 . W celu przywrócenia macierzy (5.111) do
postaci trójdiagonalnej wykonujemy n − 2 obrotów Givensa w płaszczyznach (j, j + 1) dla
j = n − 2, . . . , 1. Jedno przekształcenie niejawnego algortmu QL przedstawić można następująco
QT = Q̄T = SGn−1 = Ḡ1 . . . Ḡn−2 Ḡn−1 .
(5.112)
Pokazany tutaj algorytm QL/QR w połączeniu z metodą Householdera pozwala wyznaczyć
wszystkie wartości własne dowolnej, symetrycznej macierzy rzeczywistej.
43
Rozdział 6
Optymalizacja parametrów
nieliniowych
Problem optymalizacji nieliniowej jest bardzo złożonym zagadnieniem. Algorytmy optymalizacyjne wykorzystywane są w wielu gałęziach nauki i techniki. W ogólności istota ich działania
sprowadza się do wyznaczenia punktu stacjonarnego pewnej funkcji wielu zmiennych. W zależności od badanego zagadnienia może to być minimum, maksimum lub punkt siodłowy n-tego
rzędu. Dobry algorytm optymalizacyjny powinien wyznaczać punkt stacjonarny przy relatywnie
niewielkiej liczbie oszacowań funkcji celu (ang. Guide function evaluations, GFE ). Niestety jak
dotąd nie udało się znaleźć takiego uniwersalnego algorytmu. W zależności od badanego zagadnienia zastosować trzeba wybrany, najlepiej dostosowany schemat, a bardzo często kryterium
wyboru jest naukowa intuicja. Do dyspozycji mamy algorytmy gradientowe lub bezgradientowe,
w zależności od tego, czy dostępne są wartości pierwszych pochodnych. W ramach tego podziału
istnieje bardzo dużo implementacji różnych koncepcji.
W niniejszej pracy optymalizacja potrzebna jest do wyznaczania najlepszych parametrów nieliniowych. Doświadczenie pokazuje, że jest to warunek konieczny do otrzymywania bardzo dobrych
energii. Proces generowania bazy funkcyjnej podzielić można na dwa etapy, mianowicie na część
preoptymalizacyjną i optymalizacyjną. W pierwszej z nich generujemy startowe współczynniki nieliniowe, w drugiej natomiast optymalizujemy je. W progrmie GEMINI wykorzystane
zostały dwie metody preoptymalizacjne i dwie bezgradientowe metody optymalizacyjne. Warto
podkreślić, że metody optymalizacyjne działać mogą na podprzestrzeni parametrów nieliniowych
o dowolnym wymiarze. Oznacza to, że w ramach jednej iteracji optymalizacji modyfikowane mogą
być współczynniki zarówno jednego jak i wszystkich członów rozwinięcia. Ma to na celu zmniejszenie liczby wywołań funkcji celu jak również pomaga przy eliminowaniu tzw. efektu lokalnego
minimum. Jak wiadomo nie ma żadnego ogólnego kryterium oceny jakości znalezionego ekstremum1 . Dlatego też szukać należy sposobu lokalizowania globalnych punktów stacjonarnych.
Koncepcja zmian wymiaru podprzestrzeni przynajmniej w pewnym stopniu eliminuje problem
lokalnego minimum.
1
Chodzi tutaj o to czy znalezione ekstremum jest ekstremum lokalnym czy globalnym.
6.1 Część preoptymalizacyjna
6.1
6.1.1
Rafał A. Bachorz
Część preoptymalizacyjna
Losowe generowanie wszystkich współczynników, algorytm SHOTS
Na początku procesu optymalizacji niezbędne jest wygenerowanie początkowego zbioru parametrów nieliniowych. Wbrew pozorom jest to bardzo ważny etap obliczeń, który bardzo często
determinuje losy właściwej optymalizacji. Na każdy człon rozwinięcia przypada k1 = 3 + 2S
parametrów nieliniowych, gdzie S związane jest z symetrią układu i przyjmuje wartości
0,
1,
dla
dla
S=
2,
dla
3, dla
atomów,
cząsteczek liniowych,
cząsteczek płaskich,
innych cząsteczek.
(6.1)
Widać więc, że przy dużych rozwinięciach do rozwiązania mamy nietrywialne zagadnienie optymalizacyjne o ilości zmiennych proporcjonalnej do długości rozwinięcia. Im bardziej skomplikowany układ molekularny, tym trudniejsze zagadnienie optymalizacyjne. Działanie algorytmu
SHOTS polega na generowaniu wszystkich parametrów jednocześnie. Zadajemy z góry ile razy wygenerować chcemy zbiór współczynników, poźniej spośród wszystkich zbiorów wybieramy
ten, który odpowiada najniższej wartości energii. Parametry losować trzeba tak, aby zawsze
spełnione były kryteria całkowalności, to znaczy aby dla każdego i
α1i α2i
,
dla α1i , α2i > 0.
(6.2)
βi > −
α1i + α2i
Jest to pierwsze ograniczenie nakładane na parametry. Oczywiste jest również to, że musimy
pracować na skończonych wartościach, należy więc ustalić zakres zmienności parametrów, które
losujemy. W algorytmie SHOTS przyjęte zostały następujące zakresy dla parametrów wykładniczych
10−4 < α1i , α2i < 104 ,
10−3 < |βi| < 103 ,
(6.3)
10−1 < |Aix |, |Aiy |, |Aiz | < 101 .
Parametry losowane są przy użyciu tzw. minimalnego generatora liczb pseudoloswych. Każdy
generator trzeba przed właściwymi obliczeniami zainicjować, czyli wywołać go z parametrem
zwanym zarodkiem (ang. seed). W programie GEMINI stosowany jest zarodek oparty na
procedurze zwracającej bieżącą datę i godzinę. Wyrazić go można wzorem [64]
Z = R + 100(M − 1 + 12(D − 1 + 31(G + 24(M I + 60SE)))),
(6.4)
gdzie R to bieżacy rok, M miesiąc, D dzień, G godzina, M I minuta a SE to sekunda. Stosowanie zarodka (6.4) pozwala na zróżnicowanie generowanych zbiorów parametrów. Każdorazowe
uruchomienie programu GEMINI powoduje inicjowanie generatora liczb pseudolosowych inną
wartością zarodka, czego efektem jest możliwość otrzymywania różnych wartości liczb pseudolosowych.
6.1.2
Wstępna optymalizacja bazy, algorytm MONTEC
Program GEMINI oferuje możliwość wstępnej optymalizacji zbioru bazowego wygenerowanego uprzednio algorytmem SHOTS. Ze względu na prostotę tych obliczeń wstępna optymalizacja zakwalifikowana została do części preoptymalizacyjnej. Istota algorytmu MONTEC polega
45
6.1 Część preoptymalizacyjna
Rafał A. Bachorz
na stosowaniu klasycznego schematu MONTE CARLO. Gdy mamy wygenerowane wszystkie
współczynniki, to w ogólności ich przestrzeń ma wymiar
dim(C) = n(3 + 2S),
(6.5)
gdzie C to przestrzeń współczynników, n to długość rozwinięcia, a S to wielkość zdefiniowana w
(6.1). Istota działania algorytmu MONTEC polega na wykonywaniu przypadkowych ruchów w
podprzestrzeniach związanych z parametrami jednego członu rozwinięcia. W ogolności wymiar
takiej podprzestrzeni jest równy
dim(C)M ON T EC = 3 + 2S.
(6.6)
Każdemu ruchowi odpowiada wartość funkcji celu, czyli energia. Może ona zostać poprawiona,
wtedy ruch jest akceptowany, lub pogorszona, wtedy jest odrzucany. Innymi słowy, w każdym
kroku działania algorytmu MONTEC wyróżniamy pewien wektor paramaterów związanych z
aktualnie poprawianym członem funkcji. Wektor ten można zapisać
~ki = (α1i , α2i , βi , Ai , B i )
(6.7)
i odpowiada mu energia ǫ. W następnym kroku modyfikujemy go
~k′ = ~ki + ∆ξ,
i
(6.8)
gdzie składowe wektora przyrostu są liczbami pseudolosowymi z przdziału h−1, 1i. Do generowania tego wektora wykorzystuje się generator opisany w przy omawianiu algorytmu SHOTS. Z
′
′
wektorem (6.8) związna jest energia ǫ . Jeżeli ǫ < ǫ, wówczas akceptujemy przyrost, w przeciwnym wypadku powracamy do wektora (6.7). Omówiony tutaj schemat powtarzamy dla wektorów
wszystkich członów rozwinięcia. Dodatkowo obliczenia dla całego rozwinięcia mogą zostać powtórzone zadaną przez użytkownika ilość razy.
Nietrudno zauważyć, że algorytmu MONTEC nie można wykorzystać do zbudowania funkcji
„od podstaw”. Dlatego też w programie GEMINI wykorzystuje się go w połączeniu z algorytmem SHOTS. Pierwszym etapem jest wylosowanie wszystkich parametrów (algorytm SHOTS),
drugim cykliczne modyfikowanie wektorów związanych z parametrami każdego członu rozwinięcia (algorytm MONTEC). Oba te algorytmy z powodzeniem mogą zostać wykorzystane do
wygenerowania początkowej funkcji falowej, która poźniej poddawana jest procesowi właściwej
optymalizacji.
6.1.3
Systematyczne budowanie bazy, algorytm VARDIME
Alternatywną metodą generowania początkowej funkcji falowej jest systematyczne jej budowanie
poprzez rozszerzanie przestrzeni parametrów wykładniczych. Metoda ta jest bardziej wyrafinowana od schematu SHOTS+MONTEC, gdyż odwołuje się do procedury właściwej optymalizacji
POWELL, która omówiona zostanie poźniej.
Działanie algorytmu VARDIME polega na systematycznym budowaniu bazy funkcyjnej. W przypadku schematu SHOTS+MONTEC od początku dostajemy pełną n(3 + 2S)-wymiarową przestrzeń współczynników nieliniowych. Wymiar przestrzeni w algorytmie VARDIME zmienia się
natomiast w sposób następujący
dim(C)V ARDIM E
1(3 + 2S),
krok pierwszy,
2(3 + 2S), krok drugi,
=
...
...
n(3 + 2S), krok n-ty.
46
(6.9)
6.2 Optymalizacja właściwa
Rafał A. Bachorz
Po każdorazowym rozszerzeniu bazy aktualne współczynniki poddawane są właściwej optymalizacji przy wykorzystaniu metody sprzężonych kierunków Powella. Rozszerzanie bazy dokonuje
się do momentu, gdy ilość członów rozwinięcia osiągnie żądaną przez użytkownika wartość. W
pliku wynikowym pokazany jest protokół działania algorytmu VARDIME, co pozwala obserwować jak zmienia się energia wraz z powiększaniem bazy.
6.1.4
Metody preoptymalizacyjne – podsumowanie
W programie GEMINI zaimplementowane zostały dwie metody generowania początkowych
funkcji falowych, które wykorzystywane są jako punkt startowy do dalszej optymalizacji. Poniższa tabela ilustruje możliwości algorytmu VARDIME i schematu SHOTS+MONTEC. Wstępne
obliczenia przeprowadzone zostały dla dwóch układów modelowych, mianowicie dla atomu helu
i cząsteczki H2+
4 w konfiguracji tetraedrycznej. Wybór ten podyktowany jest dużą różnicą w ilości parametrów nieliniowych przypadających na jeden człon rozwinięcia. Dla atomu helu mamy
trzy takie parametry, dla cząsteczki H2+
4 natomiast dziewięć. W obu przypadkach generowane
były funkcje 50-członowe. W przypadku schematu SHOTS+MONTEC zadeklarowanych zostało
Atom He
SHOTS+MONTEC
VARDIME
Cząsteczka H2+
4
SHOTS+MONTEC
VARDIME
E [j.at.]
−2.903 183 750
−2.903 415 517
GFE
10100
3070
−1.020 768 198
−1.038 912 347
10100
9753
Tabela 6.1: Porównanie algorytmów preoptymalizacyjnych
50 prób w procedurze SHOTS i 200 iteracji w procedurze MONTEC. Stąd wynika stała ilość
wywołań funkcji celu dla tej metody preoptymalizacji. Inna sytuacja jest w przypadku algorytmu VARDIME. Tutaj GFE uzależniona jest od tempa uzyskiwania zbieżności w procedurze
optymalizacyjnej POWELL. Widać wyraźnie, że dużo wydajniejszy jest algorytm VARDIME,
choć wraz ze zwiększaniem się wymiaru podprzestrzeni parametrów związanych z jednym członem rozwinięcia jego wydajność maleje. Schemat SHOTS+MONTEC jest w pełni stochastyczny,
wszystkie zmiany energii są dziełem przypadku. Generowanie funkcji z wykorzystaniem algorytmu VARDIME zawiera w sobie natomiast element ukierunkowanej optymalizacji. Niestety nie
jest do końca poznany wpływ punktu startowego na całokształt optymalizacji. Obserwacje pokazują wyraźnie, że relatywnie niska wartość energii po etapie preoptymalizacji nie musi prowadzić
do dobrych wyników po optymalizacji właściwej.
6.2
Optymalizacja właściwa
Algorytmy SHOTS, MONTEC i VARDIME dostarczają wstępnie zoptymalizowanych funkcji
falowych. Warunkiem koniecznym uzyskania dokładnych wartości energii jest staranna optymalizacja parametrów nieliniowych. Jak to zostało pokazane wcześniej każdy człon funkcji falowej
może zawierać do dziewięciu parametrów wariacyjnych. W przypadku niedużego, 100-członowego
rozwinięcia dla cząsteczki H2+
4 w konfiguracji tetraedrycznej daje to zgodnie z (6.5) przestrzeń
o 100 · (3 + 2 · 3) = 900 wymiarach. Znalezienie minimum w tej przestrzeni jest zadaniem nietrywialnym, dlatego należy starannie wybrać algorytmy optymalizacyjne.
47
6.2 Optymalizacja właściwa
Rafał A. Bachorz
Program GEMINI pozwala na bardzo różnorodną optymalizację. Zastosowane zostały dwa
algorytmy, zaproponowana przez Powella metoda sprzężonych kierunków [65] oraz pewna odmiana metody Sympleks [66]. W ramach tych implementacji przeprowadzana jest optymalizacja
cykliczna, do momentu gdy zmiany energii staną się wystarczająco małe. Użytkownik sporządzić
może szczegółowy harmonogram optymalizacji. Polega to na umieszczeniu w pliku wejściowym
informacji mówiącej o ilości funkcji bazy podlegających jednocześnie optymalizacji. Program
umożliwia optymalizowanie parametrów związanych z jednym, jak i ze wszystkimi
członami rozwinięcia. Wymiar optymalizowanej podprzestrzeni może wahać się od (3 + 2S)
do n(3 + 2S) gdzie n to długość rozwinięcia a S zdefiniowane jest w (6.1). Poza tym po każdym
cyklu2 następuje losowa zmiana kolejności członów rozwinięcia, co ma na celu unikanie optymalizowania tych samych podprzestrzeni za każdym razem. Nie ma konieczności ograniczania
się tylko do jednego wymiaru optymalizowanej podprzestrzeni. Jest możliwość zadeklarowania
zbioru, którego elementy to ilości członów rozwinięcia podlegające jednocześnie optymalizacji w
każdym cyklu. Szczegóły techniczne znajdują sie w dodatku A niniejszej pracy.
6.2.1
Metoda sprzężonych kierunków Powella
Metoda sprzężonych kierunków Powella jest prawdopodobnie najczęściej stosowaną metodą
optymalizacji wielowymiarowej. Ze względu na to, że nie wymaga znajomości pochodnych może być aplikowana do wielu zagadnień. W ogólności problem optymalizacji sformułować można
następująco: znaleźć takie wartości parametrów p1 , p2 , . . . , pk , aby zależąca od nich funcja F
osiągała wartość ekstremalną, w naszym przypadku wartość minimalną
F (p1 , p2 , . . . , pk ) −→ min.
(6.10)
Dobry algorytm optymalizacyjny powinien wyznaczać minimum przy możliwie niewielkiej ilości
wywołań funkcji celu. Bez wątpienia najwolniejszym etapem obliczeń jest szacowanie wartości
energii.
Pierwszym krokiem wyznaczania minimum jest umieszczenie aktualnie optymalizowanych parametrów w wektorze p~. W zależności od badanego układu i ilości członów podlegających optymalizacji wektor ten jest l-wymiarowy, gdzie l = k(3+2S), k to ilość optymalizowanych członów a S
zdefiniowane zostało w (6.1). Kolejnym ważnym etapem jest zdefiniowanie wektorów kierunków,
które na początku obliczeń są wersorami w przestrzeni wektorów p~.
~q1 =(1, 0, 0, . . . , 0),
~q2 =(0, 1, 0, . . . , 0),
..
.
~ql =(0, 0, 0, . . . , 1).
Schemat metody Powella przedstawić można następująco.
1. Wybierz wektor początkowy p~0 i żądaną dokładność ǫ.
2. Dla i = 1, . . . , l wykonuj (a) i (b)
(a) Znajdź liczbę λi taką, że
F (~
pi−1 + λi ~qi ) → min,
(b) Podstaw
p~i ← p~i−1 + λi ~qi .
2
Cyklem naywać będziemy od teraz jedną pełną iterację obejmującą wszystkie człony rozwinięcia.
48
(6.11)
6.2 Optymalizacja właściwa
Rafał A. Bachorz
3. Wyznacz kierunek sprzężony
~ql+1 ←
4. Znajdź liczbę λ taką, że
i podstaw
p~l − p~0
.
|~
pl − p~0 |
F (~
pl + λ~ql+1 ) → min,
~ql+1 ← ~pn + λ~ql+1 .
5. Jeżeli |~
pn+1 − p~0 | < ǫ to zatrzymaj się, p~n+1 jest szukanym, optymalnym wektorem. W przeciwnym wypadku wykonuj (a)-(c).
(a) podstaw p~0 → ~
pl+1 ,
(b) podstaw ~
qi → ~qi+1 dla i = 1, . . . , l,
(c) idź do punktu (2).
Nietrudno zauważyć, że gdy szukamy minimum, to poruszamy się wzdłuż kolejnych kierunków.
Później wykorzystujemy wszystkie te kierunki i szukamy minimum „na przełaj”. Uwzględnianie
kierunków sprzężonych jest główną zaletą metody Powella i bardzo polepsza zbieżność, szczególnie wtedy gdy hiperpowierzchnia funkcji celu jest bardzo zróżnicowana, tzn. posiada „wąskie
i kręte wąwozy”. Widać wyraźnie, że problem optymalizacji wielowymiarowej sprowadzony został do zagadnienia poszukiwania minimum funkcji jednej zmiennej. Bardzo istotne jest zatem,
aby efektywnie rozwiązywać jednowymiarowe zadanie optymalizacyjne. W programie GEMINI do tego celu wykorzystane zostały dwie metody: metoda złotego podziału (ang. golden
section search) i algorytm odwrotnej interpolacji parabolicznej (ang. inverse parabolic
interpolation).
Metoda złotego podziału Algorytm ten wykorzystywany jest do oszacowania przedziału w
którym znajduje się minimum. Istota jego działania podobna jest do algorytmu poszukiwania
miejsca zerowego metodą połowienia przedziału. Na początku wybieramy trzy punkty i badamy
czy w przedziale określonym przez skrajne punkty znajduje się minimum. Gdy warunek ten jest
spełniony, to zaczynamy dzielenie obu przedziałów, lecz w przeciwieństwie do metody połowienia
przedziałów dzielimy je w tzw. złotym stosunku, to znaczy
√
3− 5
≈ 0.38197.
(6.12)
ω=
2
Robimy to tak długo, aż długość przedziału wyznaczona przez zewnętrzne punkty jest wystarczająco mała. Istota działania tego algorytmu przedstawiona jest na rysunku (6.1). Na początku
wybrane zostały punkty 1, 2 i 3. Poźniej podzielone zostały odcinki 1 − 3 i 3 − 2, czego efektem
jest nowa para odcinków, mianowicie 5 − 3 oraz 3 − 4. Za każdym razem badana jest wartość
funkcji w nowych punktach, co ma na celu sprawdzanie monotoniczności. Procedura taka powtarzana jest do momentu gdy długość przedziału stanie się wystarczająco mała nad czym mamy
oczywiście kontrolę.
Algorytm odwrotnej interpolacji parabolicznej Omówiona już metoda złotego podziału
służy jedynie do lokalizowanie przedziału, w którym znajduje się minimum. Kolejnym etapem
jest dokładne określenie szukanego ekstremum. Odwołujemy się tutaj do metody zaproponowanej
przez Brenta [67]. Polega ona na sukcesywnym aproksymowaniu minimum funkcji wierzchołkiem
paraboli. Pokazane jest to na rysunku (6.2). Przez początkowe punkty 1, 2 i 3 przeprowadzamy
49
6.2 Optymalizacja właściwa
Rafał A. Bachorz
2
1
4
6
5
3
Rysunek 6.1: Schemat działania metody złotego podziału
parabolę (wykres kropkowy). Następnie szacujemy wartość funkcji w minimum tej paraboli.
Mając trzy punkty a, b i c oraz znając wartości funkcji w tych punktach f (a), f (b) i f (c) łatwo
wyprowadzimy wzór na rzędną odpowiadającą wierzchołkowi paraboli
x=b−
1 (b − a)2 [f (b) − f (c)] − (b − c)2 [f (b) − f (a)]
.
2 (b − a)[f (b) − f (c)](b − c)2 [f (b) − f (a)]
(6.13)
Jak widać jest ona bliżej szukanego minimum, dlatego w następnym kroku punkt 4 zajmuje miejsce punktu 3 i przez 1, 4 i 3 znowu przeprowadzamy parabolę (wykres kreskowy). Postępujemy
tak dopóki przedział utworzony przez skrajne punkty jest wystarczająco mały. Połączenie metody złotego podziału i odwrotnej interpolacji parabolicznej umożliwia efektywną optymalizcję
jednowymiarową. Algorytm Powella natomiast aplikuje te metody do poszukiwania minimum w
wielu wymiarach.
6.2.2
Metoda sympleks
Główne koncepcje tej metody zaproponowane zostały w 1965 roku przez Neldera i Meada [68].
Pozwala ona w prosty sposób lokalizować ekstrema funkcji wielu zmiennych, lecz jest stosunkowo
wolna. Przed omównieniem procedury optymalizacji wprowadźmy definicję sympleksu.
Definicja 3 (Sympleks) Niech dany będzie w przestrzeni euklidesowej n-wymiarowej układ
n + 1 punktów ~
p0 , . . . , p~n . Przez sympleks rozumiemy zbiór wszystkich punktów p~ postaci
p~ = λ0 p~0 + . . . + λn p~n ,
(6.14)
λ0 + . . . + λn = 1,
(6.15)
gdzie
oraz λi > 0.
50
6.2 Optymalizacja właściwa
Rafał A. Bachorz
3
1
2
4
Rysunek 6.2: Zbieżność do minimum w metodzie odwrotnej interpolacji parabolicznej
Nietrudno zauważyć, że do jednoznacznego określenia sympleksu potrzeba zdefiniować n + 1
elementów (wektorów) w n-wymiarowej przestrzeni. W przestrzeni 2-wymiarowej potrzebujemy
trzech punktów na płaszczyźnie, sympleksem jest tutaj trójkąt. W przestrzeni 3-wymiarowej
konieczna jest znajomość czterech punktów, sympleksem będzie więc czworościan. Poszukiwanie
minimum w n-wymiarowej przestrzeni polega na poddawaniu sympleksu prostym operacjom algebraicznym, które można bardzo poglądowo interpretować geometrycznie. Są to: odbicie (ang.
reflection), skrócenie (ang. contraction) i rozciągnięcie (ang. expansion). Na rysunku (6.3) pokazane są przekształcenia sympleksu (a). Widzimy tutaj odbicie – (b), rozciągnięcie jednowymiarowe – (c), skrócenie jednowymiarowe – (d) i skrócenie całkowite – (e).
Algorytm metody sympleks przedstawić można następującym schematem.
1. Wybierz wektor początkowy p~0 oraz parametr ukończenia ǫ.
2. Dla i = 1, . . . , n wygeneruj kolejne wierzchołki
~pi = p~0 + λêi ,
gdzie i = 1, . . . , n, λ to parametr skalujący, a êi to wersory w przestrzeni n-wymiarowej
3. Dla wszystkich wierzchołków sympleksu wyznacz wartość funkcji celu F (~
pi ). Zlokalizuj wierzchołek dla którego funkcja celu ma wartość najniższą F (~
pL ), i dwa dla których funkcja celu
przyjmuje wartości największe F (~
pH ) i F (~
ph ).
4. Wyznacz wielkość, którą utożsamić można ze środkiem ciężkości. Weź pod uwagę wszystkie
wierzchołki z wyjątkiem tego, w którym funkcja celu ma wartość maksymalną.
p~ave
n
1X
(~
pi − p~H ).
=
n i=1
5. Przeprowadź następujące operacje na wierzchołku p~H . Każda operacja modyfikuje tylko wierzchołek sympleksu odpowiadający największej wartości funkcji celu.
51
6.2 Optymalizacja właściwa
Rafał A. Bachorz
(b). Odbicie
gdzie α to współczynnik odbicia.
(b). Rozciągnięcie
p~r = (1 + α)~
pave − α~
pH ,
~pe = γ~
pr + (1 − γ)~
pave ,
gdzie γ to współczynnik rozciągnięcia. W wyniku tej operacji otrzymujemy (dla γ > 1) punkt
położony na prostej łączącej p~H i p~r , leżący jednak dalej niż punkt p~r .
(b). Skracanie
pa = (1 − β)~
~
pave + β~
pH ,
gdzie β to współczynnik skracania przyjmujący wartości 0 < β < 1.
6. Wierzchołek odpowiadający najniższej energii jest przybliżonym minimum funkcji. Sprawdź
czy spełniony jest warunek ukończenia optymalizacji
|F (~
pL )k − F (~
pl )k−1 | < ǫ,
gdzie indeksowanie funkcji celu oznacza numery iteracji. Jeżeli warunek jest spełniony, to zakończ obliczenia. Jeżeli nie, to idź do punktu 3.
Widzimy, że optymalizacja polega na przeprowadzaniu elementarnych operacji geometrycznych
na sympleksie. Na uwagę zasługuje fakt, że operacje te dotyczą tylko tego wierzchołka sympleksu, z którym związana jest najwyższa wartość energii. W każdej iteracji eliminowany jest
najbardziej niekorzystny przyczynek do wartości funkcji celu.
Z pewnych rozważań i obserwacji wynika, że stosowanie metody sympleks daje dobre rezultaty
dla zagadnień o asymptotyce liniowej. Niestety w przypadku optymalizowania wykładniczo skorelowanych funkcji Gaussa mamy do czynienia z bardzo nieliniową zależnością, więc wydaję się,
że metoda sympleks będzie nieco mniej wydajna od metody Powella.
6.2.3
Metody optymalizacji właściwej – podsumowanie
Wszystkie wyniki prezentowane w następnym rozdziale wykorzystują opisane tutaj metody optymalizacyjne. Wydaję się jednak, że cenne jest przeprowdzenie prostych obliczeń, które pozwolą w
sposób bardzo ogólny ocenić możliwości obu metod. W tabeli (6.2) zestawione są wartości energii dla dwóch modelowych układów, atomu helu i cząsteczki H2+
4 w konfiguracji tetraedrycznej.
Początkowe funkcje pochodzą z preoptymalizacji, której wyniki znaleźć można w tabeli (6.1).
Harmonogram optymalizacji przygotowany był tak, że optymalizowane były kolejno podprzeAtom He
POWELL
SUBLEX
Cząsteczka H2+
4
POWELL
SUBLEX
E [j.at.]
−2.903 715 354
−2.903 708 886
GFE
197011
238072
Czas CPU [s]
1164.2
1725.3
−1.048 028 572
−1.048 040 789
2424229
2666182
33509.2
34303.9
Tabela 6.2: Porównanie algorytmów optymalizacyjnych
strzenie związane z parametrami nieliniowymi 1, 5 i 10 funkcji. Warunkiem zakończenia obliczeń
52
6.3 Organizacja procesu obliczeniowego
Rafał A. Bachorz
a
b
c
d
e
Rysunek 6.3: Operacje wykonywane na sympleksie
był przyrost energii na kolejnym cyklu mniejszy niż ǫ = 10−7 hartree. Widać wyraźnie, że w
przypadku atomu helu wydajniejszy jest algorytm Powella. Przy mniejszej ilości GFE otrzymujemy dużo lepszą energię. Odmienną sytuację obserwować możemy w przypadku cząsteczki
H2+
4 . Tutaj lepszy okazał sie algorytm oparty na metodzie sympleks. Na uwagę zasłguje fakt
wynikający z porównania czasów CPU. Widzimy, że gdy przechodzimy od 50-członowej funkcji
dla atomu helu (problem 150-wymiarowy) do 50-członowej funkcji dla cząsteczki H2+
4 w konfiguracji tetraedrycznej (problem 450-wymiarowy), to czas obliczeń wzrasta o jeden rząd wielkości.
Składają się na to dwa czynniki. Po pierwsze wzrasta liczba wymiarów, po drugie przy opisie
cząsteczek mamy bardziej skomplikowane całki. Są one tym bardziej czasochłonne im więcej
mamy jąder w układzie.
Wyniki zamieszczone w tabeli (6.2) nie do końca są zgodne z oczekiwaniami i przypuszczeniami. Zaskakuje fakt nieco lepszej energii dla H2+
4 uzyskanej metodą sympleks. Wynika stąd, że
pomimo tego, iż metoda ta predysponowana jest do opisu zagadnień liniowych to stosowanie jej
do optymalizowania funkcji Gaussa wydaje się być uprawomocnione.
6.3
Organizacja procesu obliczeniowego
Program GEMINI umożliwia przeprowadzanie kompleksowych obliczeń dla dowolnych układów dwuelektronowych. Aby przeprowadzić obliczenia trzeba dostarczyć programowi informacje
53
6.3 Organizacja procesu obliczeniowego
Rafał A. Bachorz
o układzie. Robimy to przez podanie w pliku wejściowym input.dat danych związanych z ilością jąder i ich ładunkami, geometrią układu, symetrią spinową, numerem optymalizowanego
pierwiastka. Gdy chcemy skorzystać z wygenerowanej wcześniej funkcji, to umieszczamy ją na
końcu pliku i odpowiedniej fladze nadajemu wartość .true.. Jeżeli chcemy optymalizować nową
funkcję to informujemy program o metodzie w części preoptymalizacyjnej. Ostatnią informacją jaką umieszczamy w pliku to sposób i harmonogram właściwej optymalizacji. Uzyskiwanie
najlepszych parametrów nieliniowych przeprowadzane jest na drodze iteracyjnej, kolejno optymalizowane są człony rozwinięcia. Dodatkową cechą rozszerzającą możliwości programu jest
możliwość jednoczesnego optymalizowania dowolnej liczby członów rozwinięcia. W ramach procesu optymalizacyjnego nie trzeba ograniczać się do jednego wymiaru podprzestrzeni. Można
sformułować harmonogram optymalizacji, według którego modyfikowane będą parametry. Na
harmonogram ten składają się dwie rzeczy. Po pierwsze trzeba zadeklarować ile razy zmieniać
chcemy wymiar aktualnie optymalizowanej podprzestrzeni parametrów nieliniowych w kolejnych
cyklach ndim . Drugą rzeczą jest zdefiniowanie wymiarów tych podprzestrzeni, co czynimy przez
podanie zestawu liczb, które oznaczają ilości członów rozwinięcia kolejno podlegających optymalizacji {k1 , . . . , kndim }. Algorytm optymalizacyjny wykorzysta te informacje i tak długo będzie
optymalizował funkcję, aż zmiany energii między kolejnymi cyklami będą wystarczająco małe.
W wyniku działania programu GEMINI dostajemy dwa pliki function.dat i output.dat.
W pierwszym z nich znajduje się zoptymalizowana funkcja, drugi natomiast zawiera protokół
działania programu. Można w nim znaleźć poszczególne energie w kolejnych cyklach optymalizacyjnych, dane na temat ilości wywołań funkcji celu oraz oszacowany czas CPU obliczeń.
54
Rozdział 7
Obliczenia dla układów
dwuelektronowych
Głównym celem tej pracy jest zbudowanie narzędzia pozwalającego precyzyjnie modelować
strukturę elektronową układów wielojądrowych dwuelektronowych. Cząsteczki dwuelektronowe
służyć mogą za model wiązania chemicznego. Wraz ze wzrostem ilości jąder obserwować można
jak rośnie konkurencja między odpychaniem elektrostatycznym jąder i efektem wiązania. Są to
również doskonałe obiekty mogące służyć do testowania nowych algorytmów, gdyż na ich temat
znaleźć można bardzo dużo literatury. Wydawałoby się, że literatura ta wyczerpuje problemy
układów dwuelektronowych. Tak jednak nie jest. Wyraźnie zaniedbane są układy czterojądrowe a
dotychczas opublikowane wyniki są bardzo słabej jakości. Stosując program GEMINI udało się
dla nich uzyskać najdokładniejsze na świecie energie w przybliżeniu Borna–Oppenheimera.
7.1
Atom helu i atomy helopodobne
Atom helu jest najprostszym atomem dla którego ścisłe rozwiązania równania Schrödingera
pozostają nieznane. Pomimo tego dokładność dostępnych dzisiaj przybliżonych rozwiązań jest
tak wysoka, że bez wahania można powiedzieć, że są one niemalże rozwiązaniami „dokładnymi”. Ostanie obliczenia Schwartza [69] szacują nierelatywistyczną energię atomu helu na
E = −2.90372 43770 34119 59831 11592 45194 40444 66969 25310 5 hartree, co dostarcza dokładność rzędu 47 cyfr znaczących! Ta zadziwiająca dokładność pozwala na dokonywanie porównań
z bardzo precyzyjnymi danymi doświadczalnymi. Prostota modelu pozwala na wzbogacanie jego
opisu poprzez uwzględnianie poprawek adiabatycznych, relatywistycznych, czy poprawek QED
(ang. quantum electrodynamics). Te bardzo dopracowane wyniki otwierają nową drogę do wyznaczania fundamentalnych stałych fizycznych. Pomimo tego, że przybliżone rozwiązanie równania
Schrödingera dla atomu helu są bardzo dobrze poznane, to opis tego układu cały czas przyciąga
uwagę naukowców. Jest to bardzo dobry obiekt do testowania i wzbogacania algorytmów.
Wykładniczo skorelowane funkcje Gaussa nie są zdolne do tak precyzyjnego wyznaczenia struktury elektronowej atomu helu. Pomimo to najdokładniejszy znany wynik [30] otrzymany z 1200członowego rozwinięcia jest wyższy od najlepszego opublikowanego o zaledwie 4 × 10−12 hartree.
Wynik ten otrzymany został przy wykorzystaniu 128-bitowej precyzji, co potwierdza jego wysoką jakość.
7.1 Atom helu i atomy helopodobne
Rafał A. Bachorz
Operator Hamiltona dla atomu helopodobnego w jednostkach atomowych ma postać
1
1
−Z
Ĥ = − (∆1 + ∆2 ) +
2
r12
1
r1V
+
1
r2V
,
(7.1)
gdzie ∆ to operator Laplace’a, Z to ładunek jądra, a pozostałe wielkości pokazane są na rysunku (7.1). Wyniki otrzymane dla stanu podstawowego atomu helu zestawione są w poniższych
r12
r2V
r1V
Rysunek 7.1: Atom helopodobny
tabelach1 . W pierwszej z nich pokazane są różne parametry związane z procesem generowania
punktu startowego i optymalizacji, w drugiej zaś zestawione i porównane są końcowe energie. W
Tabela 7.1: Atom helu, część preoptymalizacyjna
Lp
1
2
3
4
5
6
1
2
N
25
36
50
75
100
150
Epre
−2.902 454 113
−2.902 808 526
−2.903 399 164
−2.903 594 877
−2.903 692 442
−2.903 711 900
Mpre 1
S+M
S+M
V
V
V
V
GFE
2500
3600
3501
4457
5720
8492
Czas CPU2 [s]
10.3
25.8
6.2
10.1
15.7
76.0
S+M - schemat SHOTS+MONTEC, V - algorytm VARDIME
Intel Xeon 2.2GHz, 512 MB DDR/266 ECC
przypadku małych rozwinięć stosowany był schemat preoptymalizacyjny SHOTS+MONTEC,
w przypadku większych zaś preferowany był algorytm VARDIME. Funkcje, których energie pokazane są w tabeli (7.1) wykorzystane zostały poźniej do końcowej, pełnej optymalizacji. W
przypadku układów atomowych wszystkie składowe centrów funkcji Gaussa z definicji znikają,
więc na każdy człon rozwinięcia przypadają trzy parametry nieliniowe. Końcowe wyniki pełnych optymalizacji przedstawione są w poniższej tabeli2 . W każdym wypadku zastosowany był
algorytm Powella, a warunkiem ukończenia obliczeń był przyrost na pełnym cyklu mniejszy niż
10−9 hartree. Widać, że za pomocą programu GEMINI dla 75-członowego rozwinięcia udało
1
2
Wszystkie wartości podane są w jednostkach atomowych.
We wszystkich zestawieniach ∆E = Eref − EGEMINI .
56
7.1 Atom helu i atomy helopodobne
Rafał A. Bachorz
Tabela 7.2: Atom helu, optymalizacja właściwa
Lp
1
2
3
4
5
6
N
25
36
50
75
100
150
GFE
1100727
1557184
3859721
1498947
1385349
1735331
Eopt
−2.903 683 408
−2.903 709 253
−2.903 720 498
−2.903 723 795
−2.903 724 173
−2.903 724 292
CPU
902.4
2694.2
15423.2
15278.0
36896.0
49362.2
∆E 1 ×104
0.154
0.413
0.525
0.558
0.562
0.563
∆E 2 ×106
−40.2
−14.3
−3.10
0.195
0.573
0.692
∆E 3 ×106
−40.9
−15.0
−3.80
−0.505
−0.127
−0.008
1
ECG, 200-członowa funkcja, random tempering [70]
ECG, 600-członowa funkcja, random tempering [70]
3
najdokładniejszy wynik [69]
2
się uzyskać lepsze wyniki od tych otrzymanych przez Alexandra i współpracowników [70] dla
funkcji 600-członowej. Zastosowali oni jednak inną metodę optymalizacji nazywaną losowym
temperowaniem (ang. random tempering). Sprowadza się ona do optymalizowania zaledwie kilku parametrów, które generują całą przestrzeń współczynników nieliniowych. Dla atomu helu
zostały również przeprowadzone obliczenia z bardziej rygorystycznym warunkiem ukończenia
obliczeń. W tabeli (7.3) pokazane są wyniki obliczeń, dla których warunkiem ukończenia był
przyrost mniejszy niż ǫ = 10−12 hartree na pełnym cyklu.
Tabela 7.3: Atom helu, wyniki najdokładniejsze uzyskane metodą Powella
N
25
36
75
150
1
E
−2.903 688 621
−2.903 711 026
−2.903 724 136
−2.903 724 369
∆E 1
−
−
0.201 × 10−6
2 × 10−9
ECG, to samo rozwinięcie, [30]
Widać, że w dwóch wypadkach otrzymane energie są niższe od opublikowanych. Zostały zatem,
w ramach funkcji ECG i konkretnego rozwinięcia, poprawione najdokładniejsze wyniki na świecie.
Bardzo ciekawym i tanim sposobem na generowanie dużych rozwinięć jest budowanie funkcji z
wstępnie zoptymalizowanych funkcji stanu podstawowego i różnych stanów wzbudzonych. Gdy
ograniczymy się do tej samej symetrii spinowej, to jedna duża funkcja dostarczy nam również
informacji o strukturze elektronowej stanów wzbudzonych. Należy zdawać sobie jednak sprawę
z tego, że wkłady do energii stanu podstawowego od funkcji stanów wzbudzonych są znikome, gdyż funkcje te są względem siebie ortogonalne3 . Dlatego też pełna optymalizacja dużego
rozwinięcia dałaby lepsze wyniki, ale obliczenia te są jak wiadomo bardzo czasochłonne. Po
zbudowaniu funkcji wystarczy jeden raz zdiagonalizować macierz hamiltonianu i wyznaczyć te
wartości własne, które odpowiadają stanom cząstkowych funkcji. Wyniki zestawione są w tabeli
3
Chodzi tutaj o dokładne rozwiązania.
57
7.2 Cząsteczka wodoru
Rafał A. Bachorz
(7.4). Energie uzyskane zostały dla funkcji 750-członowych. Dla każdego z pięciu stanów została
Tabela 7.4: Atom helu, rożne stany
Stan
11 S
21 S
31 S
41 S
51 S
1
E
−2.903 724 151
−2.145 971 253
−2.061 267 267
−2.033 569 117
−2.021 133 064
∆E 1 ×106
−0.226
−2.79
−4.72
−17.6
−43.7
[59]
wstępnie zoptymalizowana funkcja 150-członowa. Warunkiem zakończenia był przyrost mniejszy
niż 10−5 , więc dokładność sięga najwyżej rzędu milihartree. Poźniej z wszystkich tych funkcji
została zbudowana jedna duża funkcja, która wykorzystana została do policzenia energii pięciu
pierwszych stanów singletowych atomu helu. Obliczenie to należy traktować jako sposób na tanie i szybkie generowanie dużej funkcji do dalszej optymalizacji. Pokazuje ono również zdolność
programu GEMINI do wyznaczania energii stanów wzbudzonych.
Jon H− Pierwszym rozważanym układem izoelektronowym do atomu helu jest anion wodorkowy H− . W ramach niniejszej pracy zoptymalizowane zostały trzy funkcje. Wyniki zaprezentowane są w tabeli (7.5).
Tabela 7.5: Jon H− , metoda Powella
N
25
50
100
1
E
−0.527 716 923
−0.527 749 164
−0.527 750 837
∆E 1 ×106
−34.0
−1.77
−0.103
[77]
Jon Li+ Pierwszy układ izoelektronowy do atomu helu o charakterze kationu to jon Li+ . Zoptymalizowane zostały dla niego dwie funkcje, a wyniki zaprezentowane są w tabeli (7.6).
W przypadku obu rozważanych analogów atomu helu warunkiem ukończenia obliczeń był przyrost mniejszy niż 10−9 hartree na pełnym cyklu optymalizacyjnym.
7.2
Cząsteczka wodoru
Cząsteczka wodoru jest najprostszym nietrywialnym układem molekularnym, który badany jest
metodami chemii kwantowej. Początki chemii kwantowej związane są z obliczeniami energii dla
tego właśnie układu. Wyniki Heitlera i Londona [3] udowodniły słuszność stosowania metod
mechaniki kwantowej do opisu cząsteczek. Milowym krokiem w opisie cząsteczki wodoru było
58
7.2 Cząsteczka wodoru
Rafał A. Bachorz
Tabela 7.6: Jon Li+ , metoda Powella
N
50
100
1
2
E
−7.279 906 069
−7.279 913 051
∆E 1 ×106
−7.343
−0.361 3
∆E 2 ×106
−7.342
−0.360 7
wynik najdokładniejszy [71]
ECG, 600 członów [72]
pojawienie się pracy Jamesa i Coolidge’a4 , którzy zastosowali funkcję falową jawnie zależącą od
czynnika r12 [43]. Już dla bardzo małych rozwinięć uzyskali zadziwiająco dobre wyniki, które
wówczas były najdokładniejsze. Stan taki trwał do początku lat 60-tych, kiedy to Kołos, Roothan
i Wolniewicz poprawili wyniki przez zwiększenie liczby członów w rozwinięciu [26]. Prawdziwa
rewolucja nastąpiła jednak w 1965 roku, kiedy to Kołos i Wolniewicz uogólnili funkcję Jamesa
i Coolidge’a tak aby poprawnie opisywała dysocjację układu [73]. Uogólnienie to okazało się
bardzo korzystne. Otrzymane energie były tak dobre, że podważyły poprawność wyników eksperymentalnych Herzberga, który musiał przeprowadzić swoje doświadczenia ponownie [5, 6].
Poźniej opis cząsteczki wodoru w ramach funkcji Kołosa i Wolniewicza kilkakrotnie był poprawiany. Wyznaczane były krzywe potencjału, poprawki adiabatyczne i relatywistyczne dla stanu
podstawowego i wielu stanów wzbudzonych. Nazwiska profesorów Włodzimierza Kołosa i Lutosława Wolniewicza na zawsze związane zostały z bardzo precyzyjnym opisem cząsteczki wodoru.
Wykładniczo skorelowane funkcje Gaussa równie dobrze opisują cząsteczkę wodoru. Bardzo długo wydawało się, że funkcje Kołosa i Wolniewicza są niedoścignionym wzorem w opisie molekuł
dwujądrowych dwuelektronowych. Tymczasem zastosowanie 1200-członowej funkcji ECG poprawia energię, choć niewielka różnica potwierdza wysoką jakość uogólnionych funkcji Jamesa i
Coolidge’a. Zaskakujące jest to, iż funkcje ECG, które nie spełniają warunku ostrza korelacyjnego oraz mają niewłaściwą asymptotykę na odległościach dalekich od jądra odtwarzają energię
elektronową cząsteczki wodoru najlepiej. Z całą pewnością doskonałe rezultaty wynikają w głównej mierze ze starannej optymalizacji parametrów nieliniowych.
Operator Hamiltona dla cząsteczki wodoru zapisać można następująco
1
1
−
Ĥ = − (∆1 + ∆2 ) +
2
r12
1
r1V1
+
1
r2V1
+
1
r1V2
+
1
r2V2
+
1
rV1 V2
,
(7.2)
gdzie wielkości zdefiniowane są analogicznie jak dla hamiltonianu atomu helopodobnego (7.1).
Jedyną różnicą jest obecność członu rV 1V odpowiedzialnego za odziaływanie międzyjądrowe
1 2
(rys. 7.2). Cząsteczka wodoru należy do grupy symetrii D∞h , możemy zatem odnaleźć środek
symetrii. W związku z tym zamiast rozwinięcia (5.1) zastosujemy funkcję postaci
Ψ=
n
X
i=1
ci (1 ± î)φi ,
(7.3)
gdzie î to operator inwersji, a φi zdefiniowane jest w (5.5). Operator (1 ± i) utożsamić można
z projektorem zapewniającym właściwą (odpowiadającą reprezentacji nieprzywiedlnej rozważanego układu) symetrię przestrzenną funkcji. Wykorzystanie tego projektora podwaja nam w
4
Funkcja ta opisana jest w rozdziale czwartym.
59
7.2 Cząsteczka wodoru
Rafał A. Bachorz
r12
r1V1
r1V2
r2V1
r2V2
rV1V2
Rysunek 7.2: Cząsteczka dwuatomowa
pewnym sensie rozwinięcie. Po optymalizacji dostajemy funkcję, kóra uwzględnia symetrię cząsteczki liniowej homojadrowej. Dodatkowo możemy wyznaczać stany parzyste (niem. gerade)
i nieparzyste (niem. ungerade) wybierając odpowiednio znak + lub −. Warto zwrócić uwagę
na fakt, iż działanie operatora î na wektory położeń elektronów równoważne jest modyfikacji
centrów funkcji Gaussa, co bardzo upraszcza zagadnienie od strony matematycznej.
Przeprowadzone zostały obliczenia dla kilku rozwinięć. Dane literaturowe są na bardzo wysokim poziomie, więc trudno w tym wypadku poprawić jakiekolwiek wyniki. Udało się to jednak
zrobić w przypadku kilku rozwinięć. Dane odpowiadające odległości międzyjądrowej 1.4 bohra
zestawione są w tabeli (7.7). We wszystkich obliczeniach warunkiem ukończenia optymalizacji
Tabela 7.7: Wartości energii stanu podstawowego cząsteczki H2
N
25
36
50
75
100
E
−1.174 371 045
−1.174 460 911
−1.174 469 057
−1.174 474 217
−1.174 474 942
∆E 1 ×106
−105
−14.8
−6.66
−1.50
−0.771
∆E 2 ×106
−
1.67
−2.38
−
0.703
∆E 3 ×106
−103
−13.2
−5.10
0.057
0.783
1
ECG, 1200-członowa funkcja [30]
ECG, to samo rozwinięcie [74]
3
ECG, 600-członowa funkcja, random tempering [70]
2
był zysk energetyczny mniejszy niż 10−9 hartree na pełnym cyklu optymalizacyjnym. Widać, że
program GEMINI poprawnie modeluje strukturę elektronową cząsteczki wodoru. W przypadku cząsteczek liniowych na każdy człon funkcji przypada pięć parametrów nieliniowych. Z całą
pewnością optymalizacja stanowi większy problem niż w przypadku atomów. Z programistycznego punktu widzenia przejście od atomów do cząsteczek bardzo mocno zmienia strukturę kodu
źródłowego. Istotną zmianą jest pojawienie się niezerowych wartości centrów funkcji Gaussa, co
mocno komplikuje obliczenia. Bardzo duże znaczenie ma efektywne wyznaczanie funkcji błedu,
gdyż jak wiadomo całki energii potencjalnej wyrażają się przez tą właśnie funkcję. Innym problemem jest optymalizacja centrów, których zmiany mają inny wpływ na funkcję celu niż zmiany
parametrów α1i , α2i i βi . Wszystkie te kłopoty udało się jednak ominąc, lecz aby zagwarantować
60
7.3 Cząsteczka He2+
2
Rafał A. Bachorz
stabilne działanie programu wprowadzić trzeba było cały szereg procedur zabezpieczających, co
trochę spowolnia obliczenia.
7.3
Cząsteczka He2+
2
Jon He2+
2 jest układem izoelektronowym do cząsteczki wodoru. Stan podstawowy tego układu
jest metastabilny i wiele razy był badany metodami chemii kwantowej. Do opisu jonu He2+
2 stosować można funkcje Jamesa-Coolidge’a. Po raz pierwszy wykorzystane one zostały przez Kołosa i
Roothaana [26], poźniej obliczenia wykonał Yagisawa wraz z współpracownikami [75]. Niedawno
pojawiła się praca Wolniewicza [76], w której znaleźć można najdokładniejsze z opublikowanych
krzywe energii BO dla stanu podstawowego i pierwszego stanu wzbudzonego o symetrii 1 Σg .
Krzywa energii potencjalnej dla stanu podstawowego tego układu ma pewną bardzo rzadko spotykaną cechę. Zaobserwować można obecność lokalnego minimum odpowiadającego odległości
+
+
międzyjądrowej 1.33 bohra (rys. 7.3). Leży ono powyżej granicy dysocjacji He2+
2 −→ He +He .
Możliwe jest zatem tunelowanie przez istniejąca barierę, co powoduje, że stany wibracyjne są
stanami kwazizwiązanymi ze skończonymi czasami życia. Hamiltonian dla cząsteczki He2+
2 różni
-3.50
Energia
-3.60
-3.70
-3.80
0
1
2
3
4
5
6
Odleg³oœæ miêdzyj¹drowa
Rysunek 7.3: Krzywa energii potencjalnej cząsteczki He2+
2
się od wyrażenia (7.2) tylko ładunkami jąder.
W ramach części obliczeniowej niejszej pracy bardzo starannie zoptymalizowana została funkcja 75 członowa. Podobnie jak w przypadku cząsteczki wodoru symetria układu podwaja nam
rozwinięcie. Okazało się, że zastosowanie bardzo precyzyjnej optymalizacji pozwala już dla tak
krótkiego rozwinięcia otrzymać najlepszą na świecie energię BO stanu podstawowego rozważanego układu. W tabeli (7.8) pokazane są znane w literaturze wyniki, porównane są one z
energią otrzymaną programem GEMINI . Wszystkie wartości odpowiadają odległości międzyjądrowej 1.3 bohra. Zaskakujący jest fakt, iż wystarczyło zaledwie 75 członów rozwinięcia, aby
poprawić wynik otrzymany na kilkukrotnie dłuższym rowinięciu funkcji Kołosa–Wolniewicza. Z
drugiej jednak strony rożnica wynosi zaledwie 0.028 cm−1 , co potwierdza wysoką jakość wyniku Wolniewicza. Sukces ten pozwala twierdzić, że za pomocą programu GEMINI wyznaczyć
można najdokładniejszą krzywą energii potencjanej. Kolejnym krokiem byłoby wzbogacenie jej
o poprawki adiabatyczne i relatywistyczne.
61
7.4 Cząsteczka HeH+
Rafał A. Bachorz
Tabela 7.8: Wartości energii stanu podstawowego cząsteczki He2+
2
Funkcja
FCI
JC
KW
ECG1
1
7.4
E
−3.680 223 0
−3.681 096
−3.681 116 63
−3.681 116 758
∆E 1 ×106
−894
−20.8
−0.128
−
Ref.
[78]
[75]
[76]
−
75 członów, GEMINI
Cząsteczka HeH+
Układ ten traktować można jako model cząsteczki dwuatomowej heterojądrowej. Ma on bardzo
duże znaczenie w astrofizyce, jego obecność została zarejestrowana w przestrzeni międzygwiezdnej i mgławicach planet [79]. Jon ten posiada trwały moment dipolowy, dlatego jest dobrym
modelem do wyznaczania energii przejść rotacyjno-wibracyjnych. W związku z tym bardzo istotne są precyzyjne obliczenia krzywych BO energii potencjalnej. W 1976 roku Kołos i Peek [37]
zastosowali do tego celu funkcję Kołosa i Wolniewicza, lecz krótko po tym Bishop i Cheung [38]
poprawili wyniki przez zastosowanie lepszej funkcji.
Hamiltonian układu wyglada analogicznie do hamiltonianu cząsteczki wodoru (7.2) zmienia się
tylko ładunek jednego z jąder. W odróżnieniu od H2 nie ma tutaj środka symetrii, gdyzż cząsteczka HeH+ należy do grupy punktowej C∞v . W ramach niniejszej pracy zoptymalizowana
została 100-członowa funkcja. Wyniki i porównanie znajdują się w tabeli (7.9). Odpowiadają
one odległości międzyjądrowej 1.46 bohra.
Tabela 7.9: Wartości energii stanu podstawowego cząsteczki HeH+
Lp
KW
KW
ECG1
ECG2
1
2
7.5
E
−2.978 689 06
−2.978 702 62
−2.978 706 591
−2.978 699 993
∆E 1 ×106
−17.5
−3.97
−
−6.60
Ref.
[37]
[38]
[41]
−
600 członów, [41]
100 członów, GEMINI
Cząsteczka H+
3
Jon H+
3 jest modelem cząsteczki wieloatomowej. Trzy protony tworzące tą molekułe związane są
za pomoca dwóch elektronów. W konfiguracji równowagowej tworzy ona trójkąt równoboczny o
boku 1.65 bohra. Jest to bardzo ważna cząsteczka z punktu widzenia astrofizyki, zostało zarejestrowane jej widmo w zakresie podczerwieni. Prostota układu pozwala na stosowanie bardzo
wyrafinowanych metod teoretycznego opisu, a dostępność danych eksperymentalnych umożliwia
łatwą weryfikację wyników.
62
7.5 Cząsteczka H+
3
Rafał A. Bachorz
Cząsteczka H+
3 ma bardzo bogatą historię. Do dzisiaj jest ona obiektem intensywnych badań,
głównie teoretycznych. Obliczenia sprowadzają się do wyznaczania coraz to dokładniejszych powierzchni potencjału. Pierwszym bardzo ważnym krokiem było wyznaczanie takiej powierzchni
przez Meyera, Botschwine i Burtona [80]. Zastosowali oni metodę CI i bardzo starannie wybrali
konfiguracje jąder na bazie których oparli swoje obliczenia. Niecałe dziesięć lat poźniej pojawiła się praca Rhöse, Kutzelnigga, Jaquet i Kloppera [81]. Zastosowali oni jawnie skorelowane
funkcje i wyznaczyli powierzchnię potencjału BO, która odtwarzała strukturę elektronową z
błędem rzędu kilku cm−1 . Wtedy stało się jasne, że aby móc porównywać wyniki teoretyczne
z doświadczalnymi należy wyjść poza przybliżenie Borna–Oppenheimera i uwzględnić poprawki
adiabatyczne i relatywistyczne. W 1998 roku pojawiły się dwie prace Cencka, Rychlewskiego,
Jaquet i Kutzelnigga, w których wyznaczyli oni powierzchnie potencjału z błędem 0.02 cm−1
oraz opierając się na tej powierzchni przeprowadzili analizę rowibracyjną [82, 83]. W obliczeniach
uwzględnili diagonalne poprawki adiabatyczne oraz poprawki relatywistyczne. Wspomniane mapy potencjału obliczone są dla niskoenergetycznej części powierzchni. Siatkę punktów tworzy 69
wybranych konfiguracji jąder, co zostało po raz pierwszy zaproponowane w pracy Meyera i
współpracowników [80].
Hamiltonian dla jonu H+
3 jest nieco bardziej skomplikowany, zapisać go można w postaci
1
1
1
1
1
1
1
1
−
+
+
+
+
+
+
Ĥ = − (∆1 + ∆2 ) +
2
r12
r1V1
r2V1
r3V1
r1V2
r2V2
r3V2
1
1
1
1
1
1
+
+
+
+
+
,
r1V2
r2V2
r3V2
rV1 V2
rV1 V3
rV2 V3
(7.4)
gdzie oznaczenia są analogiczne do hamiltonianu cząsteczki wodoru (7.2). W przypadku cząsteczek trójatomowych nieliniowych znika tylko z-towa składowa centrów funkcji Gaussa, na jeden
człon rozwinięcia przypada zatem siedem parametrów nieliniowych. Równowagowa struktura
H+
3 należy do grupy punktowej D3h co oznacza, że wyróżnić możemy sześć operacji symetrii (w
tym operację tożsamościową). Ma to ogromny wpływ na obliczenia, ponieważ zastosować można
rozwinięcie
Ψ=
n
X
ci (1 + P̂D3h )φi ,
(7.5)
i=1
gdzie φi zdefiniowane jest w (5.5), a operator P̂D3h zapisać można w postaci
P̂D3h = P̂+120 + P̂−120 + P̂12 + P̂13 + P̂23 .
(7.6)
Jak widać na rysunku (7.4) w przypadku cząsteczki H+
3 oprócz operacji tożsamościowej wyróżnić można następujące operacje symetrii: obroty o 120o względem osi trójkrotnej (operatory
P̂+120 i P̂−120 ) oraz obroty o 180o względem osi dwukrotnych (operatory P̂12 , P̂13 i P̂23 ). Widać,
że wykorzystanie symetrii przestrzennej może powiększyć nam rozwinięcie sześciokrotnie. Ceną
jaką trzeba za to zapłacić jest nieco zwiększony czas obliczania elementów macierzowych, lecz
biorąc pod uwagę ortonormalizację i procedury wyznaczania wartości własnych macierzy to z
całą pewnością się to opłaca.
Część obliczeniowa badań nad cząsteczką H+
3 podzielona jest na dwie niezależne części. Pierwsza z nich sprowadza się do wykorzystania programu CORREL napisanego przez dra Wojciecha
Cencka [56], druga natomiast podejmuje próbę modelowania struktury H+
3 za pomocą programu
GEMINI .
63
7.5 Cząsteczka H+
3
Rafał A. Bachorz
Rysunek 7.4: Cząsteczka H+
3 w konfiguracji trójkąta równobocznego
Pakiet CORREL zastosowany został do zoptymalizwania dużych, 1300-członowych funkcji dla
różnych konfiguracji jąder w okolicy minimum. Celem tych obliczeń jest próba zwiększenia dokładności powierzchni potencjału wyznaczonej w 1998 roku przez Cencka i współpracowników
[82]. Pomysł polega na obliczeniu energii w 40 nowych punktach, które w połączeniu z 69 już
istniejącymi pozwolą dopasować powierzchnię, której błąd będzie mniejszy niż 0.02 cm−1 .
Cząsteczka H+
3 ma trzy stopnie swobody. Do określania położenia jąder używa się specjalnego
układu odniesienia (na , nx , ny ) (ang. Morse-type symmetry adapted deformation coordinates)
wprowadzonego przez Meyera i współpracowników [80]. Związek tych współrzędnych z odległościami międzyjądrowymi przedstawić można następującymi zależnościami
√
e 12 + R
e 13 + R
e 23 )/ 3,
Sa = 0.15na = (R
√
e 12 − R
e 13 − R
e 23 )/ 6,
(7.7)
Sx = 0.15nx = (2R
√
e 23 − R
e 13 )/ 2,
Sy = 0.15ny = (R
gdzie
e
R
kl
1
=
β
Rkl
−1
1 − exp −β
Rref
,
(7.8)
dla β = 1.3 oraz Rref = 1.65 bohra. Za pomocą pakietu CORREL wyznaczone zostały energie
i 1300-członowe funkcje falowe dla 40 nowych konfiguracji jąder. Oprócz energii w przybliżeniu
Borna–Oppenheimera wyliczone zostały poprawki adiabatyczne i relatywistyczne.
Poprawki adiabatyczne Dla układów zawierających tylko lekkie atomy diagonalna poprawka adiabatyczna jest najważniejszą poprawką do powierzchni energii potencjalnej BO. Do jej
oszacowania zastosowana została formuła spopularyzowana przez Handy’ego [84]
Eadi = −
X
i
1
2Mi
Z
Ψ
∂2
Ψdτ ,
∂Q2i
(7.9)
która jest po prostu wartością średnią operatora energii kinetycznej jąder policzoną z funkcją
elektronową Ψ. Qi oznacza współrzędne i-tego jądra o masie Mi , a całkowanie przebiega po
całym zakresie zmienności położenia elektronów. Jest to bardzo proste wyrażenie, pozwalające
wyznaczyć dokładne wartości poprawek adiabatyczneych dla dowolnego układu molekularnego,
warunkiem jego stosowania jest jednak konieczność dostarczenia wysokiej jakości elektronowej
64
7.5 Cząsteczka H+
3
Rafał A. Bachorz
funkcji falowej. Do wyznaczenia wartości całki w wyrażeniu (7.9) stosuje się przybliżone różniczkowanie numeryczne, co daje
Z
2(S − 1)
∂2
Ψ 2 Ψdτ =
,
(7.10)
(∆Qi )2
∂Qi
gdzie S oznacza całkę nakrywania obliczoną z dwóch znormalizowanych funkcji falowych Ψ+ ≡
Ψ(Qi + 12 ∆Qi ) oraz Ψ− ≡ Ψ(Qi − 12 ∆Qi ). Funkcje te powinny być funkcjami własnymi elektronowego równania Schrödingera odpowiadającymi współrzędnym jąder Qi + 12 ∆Qi oraz Qi − 12 ∆Qi .
Ze względu na to, że przyrost ∆Qi jest mały funkcje te konstruuje się jednak bezpośrednio z
funkcji Ψ(Qi ) przez odpowiednie modyfikacje centrów funkcji Gaussa.
Poprawki relatywistyczne
formuły [30]
Porawki relatywistyczne wyznaczone zostały przy wykorzystaniu
D
E
Erel = ĤBP + ∆DP T ,
D
E
(7.11)
gdzie ĤBP jest średnią wartością hamiltonianu Breita-Pauliego, który dla dwuelektronowego,
singletowego stanu przedstawić można
ĤBP = c−2 Ĥ1 + Ĥ2 + Ĥ4 + Ĥ5 ,
gdzie
1
Ĥ1 = − (T12 + T22 ),
2
1 1
r 12 (r 12 p 1 )p 2
Ĥ2 = −
p 1p 2 +
,
2
2 r12
r12
π
Ĥ4 =
2
(
X
A
(7.12)
)
(7.13)
ZA [δ(r1A ) + δ(r2A )] − 2δ(r12 ) ,
Ĥ5 = 2πδ(r12 ).
Występujące w wyrażeniu (7.11) ∆DP T jest poprawką wynikającą z zastosowania teorii bezpośredniego zaburzenia (ang. Direct perturbation theory) [85]
∆DP T =
1 −2
c hT (H0 − E0 )i .
2
(7.14)
We wszystkich powyższych wyrażeniach c oznacza prędkość światła, T jest operatorem całkowitej
energii kinetycznej, p jest operatorem pędu, Ti operatorem energii kinetycznej i-tego elektronu,
δ(x) deltą Diraca, H0 nierelatywistycznym hamiltonianem a E0 jego wartością własną.
Wyniki uwzględniające energię BO oraz poprawki adiabatyczne i relatywistyczne zestawione
są w tabeli (7.10). Dla wzbogacenia jakości tworzonej powierzchni potencjału dla każdego wyznaczonego punktu wyliczone zostały energie w okolicy danego położenia jąder. Do tego celu
wykorzystany został program GEMINI . Dla każdej trójki współrzędnych (na , nx , ny ) zdefiniowanych w (7.7) wygenerowanych zostało 26 punktów przez dodanie do każdej współrzędnej
przyrostu ±1/3. W zasadzie funkcja dla każdego z nowych punktów powinna być optymalizowana. Dla zaoszczędzenia czasu komputera zostało zastosowane jednak przybliżenie polegające
65
7.5 Cząsteczka H+
3
Rafał A. Bachorz
Tabela 7.10: Wartości energii dla nowych konfiguracji jąder
na
5
−1
−4
3
1
−1
5
5
5
5
5
−4
4
−1
5
0
2
3
4
−3
5
5
5
4
−4
−4
3
−1
1
2
1
0
5
4
−2
−2
−1
4
−3
−3
nx
0
0
0
3
1
1
1
−1
0
1
2
−1
2
−2
2
2
1
1
2
3
2
−2
−3
−4
2
−2
−4
−4
2
3
3
3
1
1
−1
−2
3
2
−1
−2
ny
1
4
2
3
4
4
1
1
2
2
2
1
3
3
1
4
4
4
4
0
0
0
0
0
0
0
0
0
4
3
3
3
3
3
3
3
2
2
2
2
EBO [j.at.]
−1.238 030 261
−1.222 025 934
−1.212 343 261
−1.228 393 958
−1.244 189 158
−1.210 474 562
−1.234 871 021
−1.233 868 329
−1.226 399 810
−1.225 738 254
−1.213 616 413
−1.234 847 305
−1.232 732 487
−1.248 624 328
−1.221 280 046
−1.211 667 445
−1.243 758 696
−1.232 556 151
−1.209 222 353
−1.216 661 766
−1.223 939 601
−1.228 828 951
−1.213 750 659
−1.223 044 289
−1.214 538 285
−1.210 143 753
−1.241 879 876
−1.216 962 329
−1.227 186 695
−1.238 804 304
−1.238 260 742
−1.226 404 653
−1.207 592 448
−1.241 544 061
−1.245 087 198
−1.221 995 484
−1.244 411 695
−1.248 269 364
−1.252 136 271
−1.224 217 182
66
Eadi [cm−1 ]
96.8
142.3
143.1
135.3
131.5
138.1
98.3
99.8
104.9
103.2
115.5
141.3
117.3
142.8
109.6
133.4
130.4
133.5
130.2
144.4
107.7
101.3
111.8
121.7
143.6
142.6
120.8
134.4
129.9
131.6
132.4
135.1
122.1
114.8
140.4
146.5
136.4
111.6
138.6
142.3
Erel [cm−1 ]
−1.9
−3.5
−4.2
−2.6
−3.0
−3.6
−2.0
−2.0
−2.1
−2.1
−2.1
−4.1
−2.3
−3.3
−2.1
−3.5
−2.8
−2.6
−2.5
−3.9
−2.1
−2.0
−2.1
−2.4
−4.2
−4.2
−2.6
−3.6
−3.2
−2.8
−3.1
−3.4
−2.2
−2.3
−3.6
−3.7
−3.4
−2.2
−3.7
−3.9
7.6 Cząsteczka H2+
4
Rafał A. Bachorz
na wykorzystaniu funkcji zoptymalizowanej dla punktu wyjściowego. Jej modyfikacja ograniczała się do przeskalowania centrów funkcji Gaussa. Polega to na przemnożeniu każdej składowej
centrum przez czynnik skalujący, który wyrazić można następująco
xnew
,
xscale =
xold
ynew
yscale =
,
(7.15)
yold
znew
,
zscale =
zold
gdzie xnew i xold oznaczają kartezjańskie składowe odpowiednio starego i nowego położenia jądra.
Jest to oczywiście kompromis, należy zdawać sobie sprawę z tego, iż otrzymane funkcje nie są
optymalne. Związana z nimi wartość własna jest z pewnością nieco zawyżona. Napisane zostały
dwa programy pomocnicze pozwalające konwertować pliki wejściowe pomiędzy programem CORELL i GEMINI , są to kody Cen2Bac.f oraz Bac2Cen.f. Dla sprawnego generowania całych
zestawów energii i funkcji przygotowane zostały skrypty działające w systemie operacyjnym LINUX. W tabeli (7.11) pokazany jest przykładowy zestaw odpowiadający pierwszemu punktowi
z tabeli (7.10). Zgodnie z porządkiem generowania położeń jąder punkt wokół którego obliczamy
energie w tabeli (7.11) znajduje się na pozycji 14. Kolejnym krokiem jest wyznaczenie poprawek adiabatycznych i relatywistycznych dla każdego z punktów. Celem tych wszystkich obliczeń
jest wygenerowanie takich zestawów dla 40 nowych oraz dla 69 już istniejących punktów co ma
umożliwić dopasowanie powierzcni potencjału, której błąd będzie mniejszy niż 0.02 cm−1 . Badania te prowadzone są we współpracy z prof. Ralphem Jaquet z Uniwersytetu w Siegen.
Druga część badań nad cząsteczką H+
3 sprowadza się do zoptymalizownia funkcji dla stanu podstawowego w konfiguracji równowagowej za pomocą programu GEMINI . Wyznaczone zostały
wartości energii dla trzech rozwinięć co zaprezentowane jest w tabeli (7.12). Odpowiadają one
cząsteczce H+
3 w konfiguracji trójkąta równobocznego o boku 1.65 bohra. Wszystkie wyniki podane w tabeli (7.12) odnoszą się do obliczeń uwzględniających symetrię przestrzenną cząsteczki
(D3h ). Formalnie więc odpowiadają one funkcjom o sześciokrotnie dłuższych rozwinięciach. Aktualnie najlepszy wynik energii BO dla H+
3 wyznaczony został przez Cencka i współpracowników
[41]. Energia odpowiadająca 100-członowej funkcji gorsza jest od tego rekordu o 0.20 cm−1 .
7.6
Cząsteczka H2+
4
Przegląd literatury pokazuje, że układ ten nie został jeszcze przebadany na wysokim poziomie
dokładności. Dostępne dane ograniczają się do dwóch publikacji, w których zaprezentowano wyniki na niewysokim poziomie dokładności. Celem badań nad H2+
4 była zmiana tego stanu rzeczy,
dostarczenie funkcji falowych i energii o wysokiej dokładności. Innym ważnym pytaniem, na
które będzie można odpowiadać jest kwestia stabilności energetycznej takiego jonu. Widać, że
dwa elektrony muszą być zdelokalizowane na czterech jądrach. Należy więc się spodziewać, że
efekt wiązania będzie konkurował z odpychaniem elektrostatycznym. Rozważone zostaną różne
możliwości przemiany chemicznej H2+
4 w inne układy fizyczne.
Cząsteczki czterojądrowe są najprostszymi układami dla których istnieje wiele konfiguracji jąder
odpowiadających punktom stacjonarnym na powierzchni potencjału5 . W ramach niniejszej pracy
wszystkie najważniejsze konfiguracje zostały przebadane i każda z nich została przedyskutowana pod kątem stabilności energetycznej. Analiza układu pozwala stwierdzić, że wyróżnić można
5
Poźniej się okaże, że wszystkie one odpowiadają punktom siodłowym.
67
7.6 Cząsteczka H2+
4
Rafał A. Bachorz
Tabela 7.11: Przykładowy zestaw punktów
Lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
na
4.67
4.67
4.67
4.67
4.67
4.67
4.67
4.67
4.67
5.00
5.00
5.00
5.00
5.00
5.00
5.00
5.00
5.00
5.33
5.33
5.33
5.33
5.33
5.33
5.33
5.33
5.33
nx
−0.33
−0.33
−0.33
0.00
0.00
0.00
0.33
0.33
0.33
−0.33
−0.33
−0.33
0.00
0.00
0.00
0.33
0.33
0.33
−0.33
−0.33
−0.33
0.00
0.00
0.00
0.33
0.33
0.33
ny
1.33
1.00
0.67
1.33
1.00
0.67
1.33
1.00
0.67
1.33
1.00
0.67
1.33
1.00
0.67
1.33
1.00
0.67
1.33
1.00
0.67
1.33
1.00
0.67
1.33
1.00
0.67
EBO [j.at.]
−1.243 876 592
−1.243 584 106
−1.223 965 896
−1.245 357 006
−1.245 881 169
−1.233 376 906
−1.243 532 303
−1.246 684 473
−1.238 741 128
−1.223 313 166
−1.235 883 118
−1.223 674 196
−1.224 489 356
−1.238 030 261
−1.230 073 061
−1.220 663 689
−1.235 283 467
−1.235 016 750
−1.192 680 410
−1.218 264 099
−1.217 931 173
−1.194 679 499
−1.217 999 234
−1.223 113 867
−1.192 758 256
−1.213 780 095
−1.223 419 784
cztery konfiguracje odpowiadające różnym strukturom geometrycznym. Będą to zatem geometrie: tetraedryczna (Td ), trójkątna (D3h ), kwadratowa (D4h ) oraz liniowa (D∞h ). Współrzędne
wszystkich układów oprócz liniowego otrzymane zostały z klasycznej optymalizacji geometrii
programem Gaussian [86].
7.6.1
Konfiguracja tetraedrycznej Td
Optymalizacja funkcji falowych dla cząsteczki H2+
4 w konfiguracji tetraedrycznej jest zadaniem
bardzo złożonym. Oczywiste jest, że dla uzyskania wysokiej jakości wyników należy optymalizować wszystkie składowe centrów funkcji Gaussa. Wynika z tego, że na każdy człon rozwinięcia
przypada aż dziewięć parametrów nieliniowych. Oprócz tego dla układu czterojądrowego znacznie bardziej złożony jest hamiltonian. Oprócz członów odpowiadających za energię kinetyczną i
odziaływania międzyelektronowe w jego skład wchodzi 16 członów odpowiedzialnych za oddziaływanie elektron–jądro i 6 opisujących oddziaływania międzyjądrowe.
68
7.6 Cząsteczka H2+
4
Rafał A. Bachorz
Tabela 7.12: Wartośći energii stanu podstawowego cząsteczki H+
3
N
25
50
100
1
2
E
−1.343 764 565
−1.343 830 609
−1.343 834 729
∆E 1 ×106
−71.0
−5.01
−0.893
∆E 2 ×106
−57.4
8.61
12.7
ECG, 600-członowa funkcja [41]
ECG, 700-członowa funkcja, random tempering [70]
Układy tetraedryczne należą do grupy punktowej Td , można więc wyróżnić aż 24 elementy symetrii (rys. 7.5). W niniejszej pracy dokonane zostało przybliżenie polegające na obniżeniu tej
symetrii do grupy C3h . Oznacza to, że stosować można rozwinięcie w postaci
Ψ=
n
X
ci (1 + P̂C3h )φi ,
(7.16)
i=1
gdzie φi zdefiniowane jest w (5.5), a operator P̂C3h uwzględnia symetrię przestrzenną i zapisać
go można w postaci
P̂D3h = P̂+120 + P̂−120 + P̂σ12 + P̂σ13 + P̂σ23 ,
(7.17)
gdzie P̂+120 i P̂+120 to operatory obrotu wokół osi trójkrotnej, a P̂σ12 , P̂σ13 i P̂σ23 to operatory odbicia względem odpowiednich płaszczyzn symetrii. Bogata symetria przestrzenna ukła-
Rysunek 7.5: Cząsteczka H+2
4 w konfiguracji tetraedrycznej
du pozwala na uzyskiwanie bardzo dokładnych wyników przy stosowaniu relatywnie krótkich
rozwinięć. Stosując przybliżoną funkcję falową w postaci (7.16) powiększamy rozwinięcie sześciokrotnie. W ramach części obliczeniowej zoptymalizowane zostały dwie funkcje. W tabeli
(7.13) zaprezentowane i porównane są otrzymane energie. Odpowiadają one pełnosymetrycznej
strukturze tetraedrycznej o boku 2.338 bohra. Spośród wszystkich rozważanych układów z całą
pewnością H2+
4 w konfiguracji tetraedrycznej jest z obliczeniowego punktu widzenia najbardziej
czasochłonny. Optymalizacja 100-członowego rozwinięcia stanowi nietrywialne, 900-wymiarowe
zagadnienie.
Widać, że zastosowanie wykładniczo skorelowanych funkcji Gaussa pozwala uzyskać wyniki o
dokładności przekraczającej dokładność danych literaturowych. Rezultat otrzymany programem
69
7.6 Cząsteczka H2+
4
Rafał A. Bachorz
Tabela 7.13: Wartości energii stanu podstawowego cząsteczki H2+
4 w konfiguracji tetraedrycznej
Metoda
CCSD/6-311++G(,3pd)1
ECG/752
ECG/1002
1
2
E
−1.046 78
−1.049 032 397
−1.049 040 581
∆E 2 [j.at.]
−2.26 × 10−3
−8.18 × 10−6
−
∆E 2 [cm−1 ]
−496.1
−1.8
−
[86]
GEMINI
GEMINI jest lepszy od literaturowego o prawie 500 cm−1 . Jest to kolosalna różnica potwierdzająca niską jakość znanych w literaturze rezultatów. Optymalizacja funkcji 100-członowej była
bardzo czasochłonnym procesem. Wymagała około 17 milionów wywołań funkcji celu, co pozwoliło na uzyskanie przyrostów rzędu 10−9 hartree na pełnym cyklu optymalizacyjnym.
7.6.2
Konfiguracja trójkątna D3h
W przypadku tej konfiguracji zastosowana została symetria identyczna jak w przypadku cząsteczki H+
3 (rys. 7.6). Stosujemy więc funkcję falową postaci (7.18), co zwiększa długość naszego
rozwinięcia sześciokrotnie. Cząsteczka jest płaska, w związku z tym z-towa składowa centrów
funkcji Gaussa znika. Na każdy człon funkcji przypada zatem siedem parametrów nieliniowych.
W ramach części obliczeniowej zoptymalizowane zostały dwie funkcje. W tablicy (7.14) poka-
Rysunek 7.6: Cząsteczka H+2
4 w konfiguracji trójkątnej
zane i porównane zostały wyniki. Odpowiadają one strukturze D3h o długości wiązania 1.227
bohra. Widać wyraźnie, że wyniki uzyskane za pomocą funkkcji ECG są dużo dokładniejsze od
wartości literaturowych [86]. Energia została poprawiona o wartość porównywalną co do rzędu
wielkości z poprawką uzyskaną dla formy tetraedrycznej.
7.6.3
Konfiguracja kwadratowa D4h
Podobnie jak w poprzednim wypadku cząsteczka jest płaska, będziemy zatem mieć siedem parametrów nieliniowych przypadających na każdy człon rozwinięcia. Bogatsza jest jednak symetria
70
7.6 Cząsteczka H2+
4
Rafał A. Bachorz
Tabela 7.14: Wartości energii stanu podstawowego cząsteczki H2+
4 w konfiguracji trójkątnej
Metoda
CCSD/6-311++G(,3pd)1
ECG/502
ECG/1002
1
2
E
−1.040 13
−1.041 770 064
−1.041 803 676
∆E 2 [j.at.]
−1.67 × 10−3
−3.30 × 10−5
−
∆E 2 [cm−1 ]
−367.3
−7.3
−
[86]
GEMINI
układu. Stosować będziemy rozwinięcie
Ψ=
n
X
ci (1 + P̂D4h )φi ,
(7.18)
i=1
gdzie φi zdefiniowane jest w (5.5), a operator P̂D4h zapisać można w postaci
P̂D4h = P̂+90 + P̂+180 + P̂+270 + P̂13 + P̂24 + P̂12 + P̂34 ,
(7.19)
gdzie P̂+90 , P̂+180 i P̂+270 to operatory obrotu wokół osi czterokrotnej a cztery pozostałe związane
są z wertykalnymi osiami podwójnymi (rys 7.7). W przypadku grupy punktowej D4h wzbogaca-
Rysunek 7.7: Cząsteczka H+2
4 w konfiguracji kwadratowej
my obliczenia przez wykorzystanie symetrii przestrzennej, co pozwoli na ośmiokrotne zwiększenie
długości rozwinięcia. Wyniki i ich porównanie znajdują się w tabeli (7.15). Odpowiadają kwadratowej strukturze o boku 2.254 bohra. Podobnie jak wcześniej zostały poprawione wyniki energii
elektronowej. W przypadku konfiguracji kwadratowej o największą wartość 544 cm−1 . Wynika
to z faktu, iż dla tej konfiguracji symetria przestrzenna ma największy wpływ na jakość funkcji.
7.6.4
Konfiguracja liniowa D∞h
W przypadku tej konfiguracji nie ma żadnych danych literaturowych określających geometrię
układu. Glukhovtsev i współpracownicy [86] próbowali znaleźć punkt stacjonarny na powierzchi
71
7.6 Cząsteczka H2+
4
Rafał A. Bachorz
Tabela 7.15: Wartości energii stanu podstawowego cząsteczki H2+
4 w konfiguracji kwadratowej
Metoda
CCSD/6-311++G(,3pd)1
ECG/502
ECG/1002
1
2
E
−1.013 79
−1.016 260 513
−1.016 272 290
∆E 2 [j.at.]
−2.48 × 10−3
−1.17 × 10−5
−
∆E 2 [cm−1 ]
−544.8
−2.5
−
[86]
GEMINI
potencjału przez stosowanie klasycznych metod optymalizacji geometrii. Zastosowanie jednak
swobodnej optymalizacji prowadzi do przemiany cząsteczki H2+
4 zgodnie z poniższą reakcją
+
H2+
4 −→ H2 + 2H .
Można jednak nałożyć więzy na proces optymalizacji. W ramach niniejszej pracy zoptymalizowana została geometria liniowej struktury H2+
4 przy założeniu identycznych długości wszystkich
wiązań. Procedura ta prowadzi do osiągnięcia punktu stacjonarnego, lecz należy zdawać sobie sprawę z tego, że geometria rozważanego układu otrzymana została w sztuczny sposób.
Wykorzystany do tego celu został pakiet Gaussian [87]. Poźniej zoptymalizowana geometria
Tabela 7.16: Wartości energii stanu podstawowego cząsteczki H2+
4 w konfiguracji liniowej
Metoda
CCSD(t)/aug-cc-pVTZ1
ECG/502
ECG/1002
1
2
E
−1.000 498 526
−1.000 556 076
−1.000 579 034
∆E 2 [j.at.]
−8.05 × 10−5
−2.30 × 10−5
−
∆E 2 [cm−1 ]
−17.7
−5.0
−
Obliczenia pakietem Gaussian, [87]
GEMINI
cząsteczki wykorzystana została do obliczeń programem GEMINI . Ze względu na symetrię
stosować będziemy projektor taki jak dla cząsteczki homojądrowej dwuatomowej, molekuła
i
Rysunek 7.8: Cząsteczka H+2
4 w konfiguracji liniowej
H2+
4 w konfiguracji liniowej posiada bowiem środek symetrii (rys. 7.8). W ramach części obliczeniowej zoptymalizowane zostały dwie funkcje. Wyniki i porównanie zaprezentowane są w tabeli
72
7.6 Cząsteczka H2+
4
Rafał A. Bachorz
(7.16). Odpowiadają one strukturze o długości wiązania 2.422 bohra. Dużo mniejsze różnice
między wartościami energii wyznaczonymi pakietem Gaussian i programem GEMINI wynikają z faktu, że zastosowana została najlepsza metoda i baza jaką oferuje Gaussian. Pokazuje to
również mniej dokładny charakter modeli tam zaimplementowanych.
7.6.5
Cząsteczka H2+
– podsumowanie
4
W ramach niniejszej pracy przeanalizowane zostały cztery struktury czterojądrowe dwuelektronowe. Ze względu na brak jakichkolwiek danych eksperymentalnych zadać można pytanie czy
układ ten może istnieć. W tabeli (7.17) zestawione zostały energie dla wszystkich rozważanych
struktur. Widać, że najbardziej uprzywilejowanym układem jest cząsteczka H2+
4 w konfiguracji
Tabela 7.17: Cząsteczki H2+
4 – zestawienie końcowe
Struktura
tetraedryczna
trójkątna
kwadratowa
liniowa
E
−1.049 040 581
−1.041 803 676
−1.016 722 290
−1.000 579 034
−1
tetraedrycznej. Jest ona stabilniejsza od H2+
4 trójkątnego o 1588 cm , co stanowi dużą różnicę.
Rozstrzygnięcie stabilności tego układu wymaga rozważenia energetyki wszystkich możliwych
przemian chemicznych. Sprowadza się to do zbilansowania reakcji chemicznych na podstawie
wartości energii elektronowej substratów i produktów. Z nieskomlikowanej analizy tego problemu wynika, że istnieją trzy rozsądne drogi przemiany cząsteczki H2+
4 .
Przemiana do cząsteczki wodoru
+
H2+
4 −→ H2 + 2H .
∆E1 = EH2 − EH2+ ≈ −0.125 < 0
4
Przemiana do jonu H+
3
+
+
H2+
4 −→ H3 + H .
∆E2 = EH + − EH2+ ≈ −0.295 < 0
3
Przemiana do jonów H+
2
4
+
H2+
4 −→ 2H2 .
∆E3 = 2EH + − EH2+ ≈ −0.156 < 0
2
4
We wszystkich przypadkach energia odpowiada geometriom równowagowym danych układów.
Do obliczeń w ostatniej przemianie wykorzystana została literaturowa wartość energii H+
2 [30].
Widać, że bilanse wszystkich rozważanych przemian są ujemne, co dowodzi niestabilności substratu. Wynika z tego, że cząsteczka H2+
4 nie jest stabilnym układem molekularnym. Jest to
zgodne z obliczeniami Glukhovtseva i współpracowników [86], którzy wszystkie rozważane tutaj
struktury zaliczyli do punktów siodłowych pierwszego lub wyższych rzędów. Nie można jednak
wykluczyć powstawania tego układu w ramach stanów przejściowych przemian chemicznych.
73
7.7 Układy dwuelektronowe – podsumowanie
7.7
Rafał A. Bachorz
Układy dwuelektronowe – podsumowanie
W ramach niniejszej pracy przeanalizowanych zostało jedenaście dwuelektronowych układów o
liczbie jąder zmieniającej się od jeden do czterech. W przypadku każdego układu wyznaczona została energia i odpowiadająca jej funkcja falowa. W większości wypadków badania nie
ograniczały się do jednego rozwinięcia. Zwykle przeprowadzona została cała seria obliczeń różniących się liczbą funkcji bazy. W tabeli (7.18) zestawione są energie dla wszystkich rozważanych
atomów i cząsteczek. Odpowiadają one najdłuższym rozwinięciom, a w przypadku cząsteczek
Tabela 7.18: Układy dwuelektronowe – zestawienie końcowe
Układ
He
H−
Li+
H2
He2+
2
HeH+
H+
3
H2+
4 (tetraedr)
H2+
4 (trójkąt)
H2+
4 (kwadrat)
H2+
4 (linia)
E
−2.903 724 369
−0.527 750 837
−7.279 913 051
−1.174 474 750
−3.681 116 758
−2.978 699 993
−1.343 834 729
−1.049 040 581
−1.041 803 676
−1.016 722 290
−1.000 579 034
∆Eref
−8 × 10−9
−0.103 × 10−6
−0.361 × 10−6
−0.771 × 10−6
0.128 × 10−6
−0.660 × 10−5
−0.893 × 10−6
0.226 × 10−2
0.167 × 10−2
0.248 × 10−2
0.805 × 10−4
Ref.
[69]
[77]
[71]
[30]
[76]
[41]
[41]
[86]
[86]
[86]
[87]
Uwagi
stabilny
stabilny
stabilny
stabilny
metastabilny
stabilny
stabilny
niestabilny
niestabilny
niestabilny
niestabilny
opisują struktury równowagowe o najwyższej możliwej symetrii.
Widać wyraźnie, że przejście od układów trójądrowych do czterojądrowych powoduje utratę stabilności energetycznej. Dołożenie jednego protonu sprawia, że odpychanie elektrostatyczne bierze
2+
górę nad efektami wiązania. W przypadku cząsteczki He2+
2 i wszystkich konfiguracji H4 pokazane wartości są najdokładniejszymi na świecie energiami w przybliżeniu Borna–Oppenheimera.
Wszystkie zaprezentowane wyniki można poprawić przez uwzględnienie poprawek adiabatycznych, relatywistycznych i QED. W każdym wypadku wykorzystać można elektronową funkcję
falową uzyskaną za pomocą programu GEMINI .
74
Rozdział 8
Podsumowanie
Pierwszą częścią niniejszej pracy było skonstruowanie narzędzia do modelowania struktury
elektronowej układów dwuelektronowych wielojądrowych. Stworzony program GEMINI wykorzystuje znane od dawna wykładniczo skorelowane funkcje Gaussa. Podczas implementacji duży
nacisk został położony na optymalizację parametrów nieliniowych. Użytkownik ma możliwość
wyboru sposobu generowania funkcji falowej na etapie preoptymalizacyjnym i optymalizacyjnym. Zastosowane zostały dwie metody optymalizacji, metoda sprzężonych kierunków Powella
i metoda sympleks. W ramach obu tych metod przeprowadzana może być bardzo różnorodna
optymalizacja. Użytkownik wprowadzić może harmonogram obliczeń uwzględniający różne wymiary podprzestrzeni optymalizowanych parametrów co ma na celu przyspieszenie zbieżności i
eliminowanie efektu lokalnego minimum.
Drugą częścią pracy było przeprowadzenie obliczeń dla najważniejszych układów dwuelektronowych. Rozważonych było jedenaście układów atomowych i molekularnych i dla każdego z nich
przeprowadzone były obliczenia kwantowochemiczne za pomocą programu GEMINI . W przypadku kilku układów udało się uzyskać najlepsze energie elektronowe w ramach danej metody i
2+
rozwinięcia. W przypadku cząsteczkek He2+
2 i H4 uzyskane zostały najlepsze na świecie energie
w przybliżeniu Borna–Oppenheimera. Dodatkowo zakwestionowana została stabilność energetyczna układu H2+
4 .
Bardzo dobra zgodność otrzymanych rezultatów z danymi literaturowymi dowodzi poprawności
działania stworzonego programu oraz słuszności stosowania wykładniczo skorelowanych funkcji Gaussa. Potwierdzony został dobrze znany w literaturze fakt, że kluczowe znaczenie ma
tutaj proces optymalizacji parametrów nieliniowych. Za pomocą programu GEMINI wyznaczyć można wysokiej jakości funkcje falowe, które poźniej mogą być wykorzystane do obliczenia
poprawek adiabatycznych, relatywistycznych, czy QED. Pokazane wyniki nie wyczerpują możliwości programu. Ze względu na dużą ilość rozważanych układów konieczne było kompromisowe
potraktowanie części obliczeniowej i wybranie niedużych rozwinięć. Zastosowanie bardzo starannej optymalizacji pozwoliło jednak na uzyskanie wysokiej jakości rezultatów, które porównywać
można z najdokładniejszymi danymi literaturowymi.
Dodatek A
Obsługa programu GEMINI
A.1
Opis programu
GEMINI jest programem komputerowym pozwalającym wykonywać obliczenia dla dowolnych
układów dwuelektronowych. W ramach tych obliczeń wyznaczona może być struktura elektronowa dowolnego stanu singletowego lub trypletowego dla zadanej ilości jąder. Program napisany
został w standardowym języku FORTRAN 77. W przypadku inicjowania zarodka oraz odczytywania czasu CPU komputera (odpowiednio procedura harvest i program główny gemini)
program odwołuje się do funkcji systemowych. Po ewentualnej modyfikacji tych funkcji program
może być skompilowany i zbudowany pod dowolnym kompilatorem.
Praca nad programem odbywała się na komputerze osobistym z procesorem Intel Celeron 900
MHz w środowisku Linux Red Hat 8.0. Wykorzystywany był kompilator na licencji GNU w
wersji 3.2.2 [88].
Obliczenia ograniczone są do układów dwuelektronowych, ale ilość jąder może być dowolna.
Liczba użytych funkcji, poza względami wynikającymi z czasu obliczeń i pamięci komputera nie
jest ograniczona. Jak wiadomo kompilator FORTRAN 77 nie umożliwia dynamicznej alokacji
pamięci, dlatego trzeba zadać pewne wielkości maksymalne typu PARAMETER. W programie GEMINI najważniejsze z nich to:
maxbas maksymalna ilość funkcji bazy (standardowo ustawiona na 1000),
maxnuc maksymalna ilość jąder (standardowo ustawiona na 6).
Ze względu na dużą ilość rozważanych układów atomowych i molekularnych program napisany
został w kilku wersjach, które różnią się między sobą modułami odpowiedzialnymi za symetrię
przestrzenną. W przypadku cząsteczek posiadających środek symetrii możliwe jest wyznaczanie stanów o symetrii parzystej i nieparzystej. W tabeli (A.1) pokazane są cechy wszystkich
zbudowanych wersji programu. W tabeli tej G oznacza rząd grupy operatorów symetrii, co jest
Tabela A.1: Symetria przestrzenna w programie GEMINI
Symetria
−
D∞h
D3h
D4h
G
1
2
6
8
Układy
atomy helopodobne (He,H− ,Li+ )
2+
cząsteczki liniowe (H2 ,He2+
2 ,H4 )
+
cząsteczki trójądrowe (H3 )
cząsteczki czteroatomowe (H2+
4 )
A.1 Opis programu
Rafał A. Bachorz
równoznaczne z krotnością zwiększenia rozwinięcia.
Po rozpakowaniu archiwum plikowego powstanie katalog SOURCES, sktypt wykonywalny comp,
oraz plik wsadowy z rozszerzeniem .inp. W katalogu SOURCES umieszczone są pliki z kodami źródłowymi (eigen.f, error.f, gemini.f, integrals.f, optim.f, random.f, subprog.f, suplex.f ). Po
wprowadzeniu ewentualnych korekt przystąpić można do budowania wersji wykonywalnej przez
uruchomienie skryptu comp. W wyniku tego powstanie plik gemini.exe, który może już zostać
wykorzystany do obliczeń.
Program GEMINI korzysta z pliku wsadowego z rozszerzeniem .inp, którego nazwa uzależniona
jest od rozważanego układu. Pozwala wyznaczyć energię elektronową i funkcję falową dowolnego stanu układu dwuelektronowego. Wszystkie informacje definiujące układ zawarte są w pliku
wsadowym. Poniżej przedstawiony jest ogólny schemat takiego pliku. Wszystkie wypisane tutaj
Tabela A.2: Schemat pliku wsadowego
line1
line2
nbas
flag
preopti
nshots
opti
tol
ngroup
divi(1)
vx(1)
vx(2)
..
.
ftol
acc
divi(2)
vy(1)
vy(2)
..
.
...
vz(1)
vz(2)
..
.
divi(ngroup)
charge(1)
charge(2)
..
.
vx(nuc)
vy(nuc)
vz(nuc)
charge(nuc)
co(1,1)
co(2,1)
..
.
co(1,2)
co(2,2)
..
.
co(1,3)
co(2,3)
..
.
co(nbas,1)
co(nbas,2)
co(nbas,3)
co(1,4)
co(2,4)
..
.
co(1,6)
co(2,6)
..
.
co(1,8)
co(2,8)
..
.
co(nbas,4)
co(nbas,6)
co(nbas,8)
co(1,5)
co(2,5)
..
.
co(1,7)
co(2,7)
..
.
co(1,9)
co(2,9)
..
.
co(nbas,5)
co(nbas,7)
co(nbas,9)
nuc
state
nele
grex
numex
gerun
symm
nmontec
słowa są realnymi nazwami zmiennych używanymi przez program, a w tabeli (A.3) wyjaśnione
jest ich znaczenie.
77
A.1 Opis programu
nazwa
line1, line2
nbas
nuc
nele
numex
flag
state
grex
gerun
symm
preopti
nshots
nmontec
opti
tol
ftol
acc
ngroup
divi(i)
vx(i)
vy(i)
vz(i)
charge(i)
co(i,1)
co(i,2)
co(i,3)
co(i,4)
co(i,5)
co(i,6)
co(i,7)
co(i,8)
co(i,9)
Rafał A. Bachorz
Tabela A.3: Oznaczenia zmiennych w pliku wsadowym
tym zmiennej znaczenie
CHARACTER*60 tytuł i krótka charakterystyka obliczeń
INTEGER
ilość funkcji bazy
INTEGER
ilość jąder w układzie
INTEGER
ilość elektronów w układzie (ma zawsze wartość 2)
INTEGER
ilość parametrów nieliniowych na jeden człon rozwinięcia
LOGICAL
T - funkcja czytana, F - funkcja generowana
LOGICAL
T - stan trypletowy, F - stan singletowy
INTEGER
numer optymalizowanego pierwiastka
LOGICAL
T - symetria gerade, F - symetria ungerade
LOGICAL
T - uwzględniana symetria przestrzenna, F - brak symetrii
LOGICAL
T - SHOTS+MONTEC, F - VARDIME
INTEGER
ilość generowanych funkcji w procedurze SHOTS
INTEGER
ilość powtórzeń w procedurze MONTEC
LOGICAL
T - POWELL, F - SYMPLEKS
REAL*8
dokładność w procedurze BRENT
REAL*8
dokładność w procedurze POWELL
REAL*8
warunek ukończenia obliczeń
INTEGER
ilość optymalizowanych podprzestrzeni
INTEGER
wymiar i-tej podprzestrzeni
REAL*8
x-owa współrzędna i-tego jądra
REAL*8
y-owa współrzędna i-tego jądra
REAL*8
z-owa współrzędna i-tego jądra
INTEGER
ładunek i-tego jądra
REAL*8
pierwszy parametr wykładniczy funkcji Gaussa
REAL*8
drugi parametr wykładniczy funkcji Gaussa
REAL*8
parametr korelacyjny funkcji Gaussa
REAL*8
x-owa składowa centrum A i-tej funkcji
REAL*8
x-owa składowa centrum B i-tej funkcji
REAL*8
y-owa składowa centrum A i-tej funkcji
REAL*8
y-owa składowa centrum B i-tej funkcji
REAL*8
z-owa składowa centrum A i-tej funkcji
REAL*8
z-owa składowa centrum B i-tej funkcji
W tabeli (A.2) pokazany jest schemat pliku wsadowego w wersji dla cząsteczki o symetrii D∞h .
Flaga gerun umożliwia wybór między stanem o symetrii parzystej i nieparzystej. Analogiczne
pliki dla cząsteczek o wyższej symetrii pozbawione są tej możliwości. W przypadku atomów nie
ma również flagi symm odpowiedzialnej za uwzględnianie symetrii przestrzennej układu. Użytkownik ma możliwość wyboru punktu startowego obliczeń. Przede wszystkim można wykorzystać
wygenerowaną wcześniej funkcję, którą zgodnie ze schematem w tabeli (A.2) umieszcza się na
końcu pliku. Zmienna logiczna flag powinna mieć wartość T. Wtedy program GEMINI omija
część preoptymalizacyjną i przechodzi do optymalizacji właściwej. Gdy nie dysponujemy funkcją, to możemy ją wyznaczyć stosując jeden z zaimplementowanych algorytmów. Program jest
informowany o tym przez wartość logiczną flagi preopti. Dodatkowowo jeżeli decydujemy się na
schemat SHOTS+MONTEC, to musimy określić ilość generowanych funkcji w podprocedurze
78
A.1 Opis programu
Rafał A. Bachorz
SHOTS (zmienna nshots) i ilość powtórzeń w podprocedurze MONTEC (zmienna nmontec).
Po tym etapie można przejść do procesu optymalizacji właściwej. Tutaj również można wybrać
algorytm. Robimy to przez nadanie odpowiedniej wartości logicznej fladze opti (T dla metody
Powella i F dla metody sympleks). Dodatkowo użytkownik może sformułować harmonogram
optymalizacji. Na początku nadaje się wartość zmiennej ngroup. Mówi ona o ilości podprzestrzeni parametrów nieliniowych poddawanych kolejno optymalizacji. Kolejnym krokiem jest
wprowadzenie odpowiednich wartości do wektora liczb całkowitych divi. Liczby te mówią o
ilości funkcji bazowych poddawanych równocześnie optymalizacji w danym cyklu.
Dane zawarte w pliku wsadowym umożliwiają przeprowadzeni obliczeń. Po ich zakończniu w
bieżącym katalogu pojawiają się dwa pliki: function.dat i output.dat. W pierwszym z nich znajduje się zoptymalizowana funkcja falowa, w drugim natomiast zawarte są informacje związane z
procesem obliczeniowym. Poniżej przedstawiony jest przykładowy plik function.dat otrzymany
przez optymalizację 5-członowej funkcji stanu podstawowego cząsteczki H+
3.
Ground state of H3+ molecule, R12=R23=R13=1.65
5
3
2
7
F F 1 T
T
100
100
T
0.1000E-04
0.1000E-03
0.1000E-08
1
1
-.8250000000000000E+00
0.8250000000000000E+00
-.4763139720000000E+00
-.4763139720000000E+00
0.0000000000000000E+00
0.0000000000000000E+00
1
1
0.0000000000000000E+00
0.9526279439999999E+00
0.0000000000000000E+00
1
0.1263223699114809E+01
0.3746766686178678E+00
-.3809382664623438E-01
0.4485137143183584E+00
0.2292798722305003E+00
-.1446724983526705E-01
0.4325668841249464E+00
0.4945268653344519E+00
0.9028668264905234E+00
0.3221864037421177E+00
0.1471623950750716E+02
-.4676813193378492E-01
0.7816303326797950E+00
0.3764507015569032E+01
0.4152471527811975E-01
0.5559464129640018E-01
0.7930818479238736E+00
0.0000000000000000E+00
-.5384657581462650E+00
0.4278721942220335E+00
0.4059403170103001E-02
0.1783063780684641E+00
0.0000000000000000E+00
0.0000000000000000E+00
0.6837742756400830E-01
-.2860578372598852E+00
0.0000000000000000E+00
0.7517757245457093E+00
-.5211676031086715E+00
0.0000000000000000E+00
-.4233587247833561E+00
-.4961476986580564E-01
0.0000000000000000E+00
0.2364399804034686E+00
0.1120858172959662E+01
0.0000000000000000E+00
0.5055548007733537E+00
0.1371339436402862E+00
0.0000000000000000E+00
-.8077128574600447E+00
-.4812969724159463E+00
0.0000000000000000E+00
-.2715820684614460E-01
0.9316184437082301E+00
0.0000000000000000E+00
79
A.2 Zawartość płyty CD
Rafał A. Bachorz
Struktura pliku function.dat jest taka sama jak struktura pliku wsadowego input.dat. Bardzo
łatwo zatem wykorzystać można zoptymalizowaną funkcję do następnych obliczeń. W pliku
output.dat zawarte są natomiast szczegółowe informacje o całym procesie obliczeniowym. Można
tam znaleźć dane na temat przebiegu preoptymalizacji i optymalizacji właściwej. W każdym
cyklu optymalizacyjnym podane są informacje o ilości wywołań funkcji celu, czasie komputera i
przyrostach energetycznych. Ze wzgledu na dużą objętość zostanie pokazana tylko ostatnia część
pliku z optymalizacji pokazanej wcześniej funkcji.
|--------------------------------------------------------------------------|
| DimNumber
Energy
delta(Energy)
GFE
OptFun |
|
1
-.1338478703718605E+01
0.3276889870562627E-10 F
118
1
|
|
2
-.1338478703724904E+01
0.6299849530932988E-11 T
106
1
|
|
3
-.1338478703874493E+01
0.1495883417135246E-09 F
107
1
|
|
|
4
5
-.1338478704508478E+01
-.1338478704661866E+01
0.6339855307402331E-09 F
0.1533875249037919E-09 F
110
107
1
1
|
|
|--------------------------------------------------------------------------|
|
|
|--------------------------------------------------------------------------|
| SUMMARY NUMBER :
| CycleNo
|
158
158
Energy
-.1338478704661866E+01
|
delta(Energy)
0.9760301455941089E-09 T
|
|
|--------------------------------------------------------------------------|
|--------------------------------------------------------------------------|
| POWELL guide function evaluations :
|
89706
POWELL CPU time :
|
221.570
|
|--------------------------------------------------------------------------|
|--------------------------------------------------------------------------|
|
|
| Summary guide function evaluations :
|
91655
Summary CPU time : 221.570
|
|
|
|
|--------------------------------------------------------------------------|
Do uzyskania przyrostów energii mniejszych od 0.1 × 10−9 trzeba było wykonać 158 cykli optymalizacyjnych. Zagadnienie własne rozwiązane było 91655 razy, co łącznie trwało 222 sekundy
czasu komputera.
A.2
Zawartość płyty CD
Do niniejszej pracy dołączona została płyta CD na której znaleźć można wszystkie wersje programu GEMINI . W głównym katalogu płyty znajdują się cztery podkatalogi o nazwach: one, two,
three i four. W każdym z nich znajdują się kody źródłowe programu odpowiadające układowi o
ilość jąder, która wynika z nazwy podkatalogu. Wersje wykonywalne programu buduje się przez
uruchomienie skryptu comp. Dodatkowo do każdej wersji programu dołączone są przykładowe
pliki wsadowe i wyniki testowych obliczeń.
80
Bibliografia
[1] J. Rayleigh, Phil. Mag. 49, 539 (1900).
[2] M. Planck, Ann. Phys. 4, 553 (1901).
[3] W. Heitler, F. London, Z. Phys. 44, 455 (1927).
[4] W. Kołos, L. Wolniewicz, J. Chem. Phys. 49, 404 (1968).
[5] G. Herzberg, A. Monfils, J. Mol. Spectrosc. 5, 482 (1960).
[6] G. Herzberg, J. Mol. Spectrosc. 33, 147 (1970).
[7] E. Schrödinger, Ann. Phys. 79, 361 (1926).
[8] M. Born, Z. Phys. 37, 863 (1926).
[9] R. F. Nalewajski, Podstawy i metody chemii kwantowej, PWN Warszawa, (2001).
[10] W. Kołos, Chemia kwantowa, PWN Warszawa, (1986).
[11] L. Piela, Idee chemii kwantowej, PWN Warszawa, (2003).
[12] M. Born, J. R. Oppenheimer, Ann. Phys. 41, 457 (1927).
[13] W. Ritz, Z. Rein. Ang. Math. 135, (1909).
[14] D. R. Hartree Proc. Cam. Phil. Soc. 24, 89 (1927).
[15] J. Slater, Phys. Rev. 35, 509 (1930).
[16] C. J. Roothaan, Mod. Phys 23, 69 (1951).
[17] T. Kato, Commun. Pure Appl. Math 23, 69 (1951).
[18] E. A. Hylleraas, Z. Phys. 54, 347 (1929).
[19] J. F. Hart, G. Herzberg, Phys. Rev. 106, 79 (1957).
[20] T. Kinoshita, Phys. Rev. 105, 1490 (1957); 115, 336 (1959).
[21] T. Koga, J. Chem. Phys. 94, 5530 (1991).
[22] K. Frankowski, C. L. Pekeris, Phys. Rev. 146, 46 (1966).
[23] H. Kleindienst, R. Emrich, Int. J. Quant. Chem. 37, 257 (1990).
BIBLIOGRAFIA
Rafał A. Bachorz
[24] D. K. McKenzie, G. W. F. Drake, Phys. Rev. A 44 R6973 (1991).
[25] H. M. James, A. S. Coolidge, J. Chem. Phys. 1 825 (1933).
[26] W. Kołos, C. C. J. Roothaan, Rev. Mod. Phys. 32, 219 (1960).
[27] R. S. Mulliken, W. C. Ermler, Diatomic Molecules: Results of Ab Initio Calculations, Academic Press, New York 1977.
[28] L. Wolniewicz, J. Chem. Phys. 103, 1792 (1995).
[29] J. Rychlewski, W. Cencek, J. Komasa, Chem. Phys. Lett. 229, 657 (1994).
[30] W. Cencek, W. Kutzelnigg, Chem. Phys. Lett. 105, 5878 (1996).
[31] W. Kołos, L. Wolniewicz, J. Chem. Phys. 50, 3228 (1969).
[32] L. Wolniewicz, K. Dressler, J. Mol. Spectrosc. 67, 416 (1977).
[33] D. C. Clary, Mol. Phys. 34, 793 (1977).
[34] D. C. Clary, N. C. Handy, Chem. Phys. Lett. 51, 483 (1977).
[35] L. Wolniewicz, K. Dressler, J. Chem. Phys. 82, 3292 (1985).
[36] L. Wolniewicz, K. Dressler, J. Mol. Spectrosc. 77, 286 (1979).
[37] W. Kołos, J. M. Peek, Chem. Phys. 12, 381 (1976).
[38] D. M. Bishop, L. M. Cheung, J. Mol. Spectrosc. 79, 462 (1979).
[39] D. M. Bishop, L. M. Cheung, Mol. Phys. 38, 1475 (1979).
[40] L. Wolniewicz, J. Phys. B 32, 2257 (1999).
[41] W. Cencek, J. Komasa, J. Rychlewski, Chem. Phys. Lett. 246, 417 (1995).
[42] J. S. Sims, S. A. Hagstrom, Phys. Rev. A 4 908 (1971).
[43] H. M. James, A. S. Coolidge, J. Chem. Phys. 1, 825 (1933).
[44] G. W. F. Drake, M. M. Cassar, R. A. Nistor, Phys. Rev. A, 65 054501 (2002).
[45] A. Preiskorn, W. Woźnicki, Mol. Phys. 52, 1291 (1984).
[46] D. Frye, A. Preiskorn, G. C. Lie, E. Clementi, J. Chem. Phys. 92, 4948 (1990).
[47] S. F. Boys, Proc. Roy. Soc. A258, 402 (1960).
[48] K. Singer, Proc. Roy. Soc. A258, 412 (1960).
[49] I. S. Gradshteyn, I. M. Ryzhik, Tables of Integrals, Series and Products, Academic Press,
(2000).
[50] B. Jeziorski, K. Szalewicz, Phys. Rev. A, 19 2360 (1979).
82
BIBLIOGRAFIA
Rafał A. Bachorz
[51] J. Komasa, Chem. Phys. Lett. 363, 307 (2002).
[52] J. Rychlewski, W. Cencek, J. Komasa, Chem. Phys. Lett. 229, 657 (1994).
[53] J. Komasa, J. Chem. Phys. 115, 158 (2001).
[54] R. J. Jastrow, Phys. Rev. 98, 158 (1979).
[55] L. Bertini, D. Bressanini, M. Mella, G. Morosi, Int. J. Quant. Chem. 74, 23 (1999).
[56] W. Cencek, Metoda funkcji skorelowanych w kwantowochemicznych obliczeniach układów
wieloelektronowych, praca doktorska, Wydział Chemii UAM, Poznań, 1993.
[57] F. W. Byron, R. W. Fuller, Mathematics of classical and quantum physics, Dover Publications Inc, New York (1993).
[58] K. Pachucki, J. Komasa, Chem. Phys. Lett. 389, 209 (2004).
[59] G. W. F. Drake, High-Precision Calculations for the Rydberg States of Helium, in LongRange Casimir Forces: Theory and Recent Experiments on Atomic Systems, edited by F.
S. Levine and D. A. Micha (Plenum Press, New York, 1993), p. 107.
[60] M. Masamura, J. Comput. Chem. 9, 257 (1988).
[61] B. P. Flannery, W. H. Press, Numerical Recipies in FORTRAN 77. The Art of Scientific
Computing, Volume 1 of Fortran Numerical Recipies, Cambridge Univercity Press (1993).
[62] J. H. Wilkinson, C. Reinsch, Handbook for Automatic Computation, Linear Algebra,
Springer-Verlag (1971).
[63] W. Salejda, M. H. Tyc, M. Just, Algebraiczne metody rozwiązywania równania Schrödingera,
PWN (2002).
[64] S. L. Anderson, Random Number Generators on Vector Supercomputers and Other Advanced
Architectures, SIAM Review 32, (1990).
[65] H. J. D. Powell, Comput. J. 7, 155 (1964).
[66] T. Rowan, Functional Stability Analysis of Numerical Algorithms, praca doktorska, Department of Computer Sciences, University of Texas, Austin, (1990).
[67] R. P. Brent, Algorithms for Minimization without Derivatives, Engelwood Cliffs, (1973).
[68] J. A. Nelder, R. Mead, Comput. J. 7, 308 (1965).
[69] C. Schwartz, e-Print arXiv : physics/0208004
[70] S. A. Alexander, H. J. Monkhorst, R. Roeland, J. Chem. Phys. 93, 4230 (1990).
[71] O. Chuluunbaatar, I. V. Puzynin, S. I. Vinitsky J. Phys. B 34, L425 (2001).
[72] J. Komasa, wyniki nieopublikowane (2004).
[73] W. Kołos, L. Wolniewicz, J. Chem. Phys. 43, 2429 (1965).
83
BIBLIOGRAFIA
Rafał A. Bachorz
[74] J. Komasa, A. J. Thakkar, Mol. Phys. 78, 1039 (1993).
[75] H. Yagisawa, H. Sato, T. Watanabe, Phys. Rev. 16, 1352 (1977).
[76] L. Wolniewicz, J. Phys. B 32, 2257 (1999).
[77] A. J. Thakkar, V. H. Smith, Phys. Rev. A 15, 1 (1977).
[78] P. Valtanazanos, C. A. Nicolaides, wyniki nieopublikowane.
[79] W. Roberge, A. Dalgarno, Astrophys. 255, 489 (1982).
[80] W. Meyer, P. Botschwina, P. G. Burton, J. Chem. Phys. 84, 891 (1986).
[81] R. Rhöse, W. Kutzelnigg, R. Jaquet, W. Klopper, J. Chem. Phys. 101, 2231 (1994).
[82] W. Cencek, J. Rychlewski, W. Kutzelnigg, R. Jaquet, J. Chem. Phys. 108, 2831 (1998).
[83] R. Jaquet, W. Cencek, W. Kutzelnigg, J. Rychlewski, J. Chem. Phys. 108, 2837 (1998).
[84] N. C. Handy, Y. Yamaguchi, H. F. Schaefer, J. Chem. Phys. 84, 4481 (1986).
[85] W. Kuztelnigg, Z. Phys. 11, 15 (1989).
[86] M. N. Glukhovtsev, P. R. Schleyer, Chem. Phys. Lett. 209, 207 (1993).
[87] Gaussian 98 (Revision A.1), M. J. Frisch, G. W. Trucks, H. B. Schlegel, G. E. Scuseria,
M. A. Robb, J. R. Cheeseman, V. G. Zakrzewski, J. A. Montgomery, R. E. Stratmann,
J. C. Burant, S. Dapprich, J. M. Millam, A. D. Daniels, K. N. Kudin, M. C. Strain, O.
Farkas, J. Tomasi, V. Barone, M. Cossi, R. Cammi, B. Mennucci, C. Pomelli, C. Adamo, S.
Clifford, J. Ochterski, G. A. Petersson, P. Y. Ayala, Q. Cui, K. Morokuma, D. K. Malick,
A. D. Rabuck, K. Raghavachari, J. B. Foresman, J. Cioslowski, J. V. Ortiz, B. B. Stefanov,
G. Liu, A. Liashenko, P. Piskorz, I. Komaromi, R. Gomperts, R. L. Martin, D. J. Fox, T.
Keith, M. A. Al-Laham, C. Y. Peng, A. Nanayakkara, C. Gonzalez, M. Challacombe, P.
M. W. Gill, B. G. Johnson, W. Chen, M. W. Wong, J. L. Andres, M. Head-Gordon, E. S.
Replogle and J. A. Pople, Gaussian, Inc., Pittsburgh PA, 1998
[88] GNU Operating System – Free Software Foundation, www.gnu.org.
84