Metody obliczeniowe ab initio w fizyce struktur atomowych

26
Metody obliczeniowe ab initio w fizyce struktur atomowych Pawel Scharoch, Jerzy Peisert (skrypt w opracowaniu) Spis treści 1 Wstęp.......................................... 2 2 Teoria podstawowa................................... 3 2.1 Równanie Schr¨ odingera dla izolowanego ukladu atomów. ............. 3 2.2 Przybliżenie Borna-Oppenheimera. ......................... 4 2.3 Powierzchnia energii potencjalnej........................... 4 2.4 Stany równowagi statycznej.............................. 5 2.5 Zaburzenia adiabatyczne: twierdzenie Hellmanna-Fenmana ............ 5 3 Podstawy teoretyczne obliczeń it ab initio. ..................... 5 3.1 Zagadnienie niejednorodnego gazu elektronów, teoria funkcjonalu gęstości (DFT). 5 3.2 Twierdzenie Hohenberga-Kohna............................ 6 3.3 Równania Kohna-Shama................................ 6 3.4 Twierdzenie Janaka .................................. 8 3.5 Stany wzbudzone ................................... 8 3.6 Przybliżenia energii korelacji-wymiany: LDA i GGA. ............... 8 4 Przyklad: atom..................................... 9 5 Pseudopotencjal .................................... 11 5.1 Historia ........................................ 12 5.2 Psudopotencjal zachowujący normę ......................... 12 5.3 Generowanie pseudopotencjalu ............................ 12 5.4 Uniwersalność (transferability) i twardość (hardness) pseudopotencjalu. ..... 13 5.5 Pseudopotencjal jako separowalny operator ..................... 13 6 Reprezentacje równań Kohna-Shama. Uklady periodyczne, baza falplaskich. .. 14 7 Dynamika ukladów atomowych............................ 14 7.1 Dynamika Molekularna ................................ 14 7.2 Przybliżenie harmoniczne ............................... 14 8 Termodynamika ukladów atomowych......................... 15 8.1 Termodynamika w skali nano ............................ 15 8.2 Koncepcja powierzchni energii swobodnej (FES)................... 16 8.3 Metody obliczania funkcji rozdzialu. ........................ 17 9 Algorytmy numeryczne. ............................... 18 9.1 Metoda dynamiki molekularnej Car-Parinello .................... 18 9.2 Metoda najszybszego spadku (’Steepest descent’) ................. 18 9.3 Metoda gradientów sprzężonych ........................... 18 9.4 Algorytmy dynamiki molekularnej .......................... 18 9.5 Szybka transformata Fouriera ............................ 18 9.6 Metoda specjalnych punktów k Monkhorsta-Packa ................. 19 10 Przyklady zastosowania koncepcji PES i FES ................... 21 1

Transcript of Metody obliczeniowe ab initio w fizyce struktur atomowych

Page 1: Metody obliczeniowe ab initio w fizyce struktur atomowych

Metody obliczeniowe ab initio w fizyce struktur atomowych

Paweł Scharoch, Jerzy Peisert(skrypt w opracowaniu)

Spis treści

1 Wstęp. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Teoria podstawowa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.1 Równanie Schrodingera dla izolowanego układu atomów. . . . . . . . . . . . . . 32.2 Przybliżenie Borna-Oppenheimera. . . . . . . . . . . . . . . . . . . . . . . . . . 42.3 Powierzchnia energii potencjalnej. . . . . . . . . . . . . . . . . . . . . . . . . . . 42.4 Stany równowagi statycznej. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.5 Zaburzenia adiabatyczne: twierdzenie Hellmanna-Fenmana . . . . . . . . . . . . 53 Podstawy teoretyczne obliczeń it ab initio. . . . . . . . . . . . . . . . . . . . . . 53.1 Zagadnienie niejednorodnego gazu elektronów, teoria funkcjonału gęstości (DFT). 53.2 Twierdzenie Hohenberga-Kohna. . . . . . . . . . . . . . . . . . . . . . . . . . . . 63.3 Równania Kohna-Shama. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63.4 Twierdzenie Janaka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.5 Stany wzbudzone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.6 Przybliżenia energii korelacji-wymiany: LDA i GGA. . . . . . . . . . . . . . . . 84 Przykład: atom. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Pseudopotencjał . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115.1 Historia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125.2 Psudopotencjał zachowujący normę . . . . . . . . . . . . . . . . . . . . . . . . . 125.3 Generowanie pseudopotencjału . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125.4 Uniwersalność (transferability) i twardość (hardness) pseudopotencjału. . . . . . 135.5 Pseudopotencjał jako separowalny operator . . . . . . . . . . . . . . . . . . . . . 136 Reprezentacje równań Kohna-Shama. Układy periodyczne, baza fal płaskich. . . 147 Dynamika układów atomowych. . . . . . . . . . . . . . . . . . . . . . . . . . . . 147.1 Dynamika Molekularna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147.2 Przybliżenie harmoniczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Termodynamika układów atomowych. . . . . . . . . . . . . . . . . . . . . . . . . 158.1 Termodynamika w skali nano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158.2 Koncepcja powierzchni energii swobodnej (FES). . . . . . . . . . . . . . . . . . . 168.3 Metody obliczania funkcji rozdziału. . . . . . . . . . . . . . . . . . . . . . . . . 179 Algorytmy numeryczne. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189.1 Metoda dynamiki molekularnej Car-Parinello . . . . . . . . . . . . . . . . . . . . 189.2 Metoda najszybszego spadku (’Steepest descent’) . . . . . . . . . . . . . . . . . 189.3 Metoda gradientów sprzężonych . . . . . . . . . . . . . . . . . . . . . . . . . . . 189.4 Algorytmy dynamiki molekularnej . . . . . . . . . . . . . . . . . . . . . . . . . . 189.5 Szybka transformata Fouriera . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189.6 Metoda specjalnych punktów k Monkhorsta-Packa . . . . . . . . . . . . . . . . . 1910 Przykłady zastosowania koncepcji PES i FES . . . . . . . . . . . . . . . . . . . 21

1

Page 2: Metody obliczeniowe ab initio w fizyce struktur atomowych

1 Wstęp. 2

1 Wstęp.

W 1929 roku Paul Dirac pisał [1]: ”...The underlying physical laws necessary for themathematical theory of a large part of physics and the whole of chemistry arethus completely known and the difficulty is only that the exact application of theselaws leads to equations much too complicated to be soluble”, wskazując, że chociażmatematyczne podstawy mechaniki kwantowej zostały poznane, to jednak techniczne trud-ności obliczeniowe związane z rozwiązywaniem odpowiednich równań są nie do pokonania. Ztego powodu, na przestrzeni dziesięcioleci, własności fizyczne układów atomowych były teore-tycznie badane głównie w oparciu o podejście modelowe. Podejście takie pozwala zrozumiećmechanizmy zjawisk, jednak odniesienie do eksperymentu odbywa się zawsze poprzez parame-try dopasowania. W dobie rozwoju nowoczesnych technologii informacja uzyskiwana tą drogąjest niewystarczająca. Nie chodzi bowiem już tylko o jakościowe zrozumienie zjawiska, ale takżeo precyzyjne, czysto teoretyczne przewidywania ilościowe. Tendencję taką obserwuje się niemalwe wszystkich dziedzinach nauk przyrodniczych, a zwłaszcza (choć nie tylko) na ich styku z na-ukami inżynierskimi: zapotrzebowanie na dokładne, teoretyczne dane ilościowe. Czy trajektoriazauważonej, zbliżającej się do Ziemi asteroidy przetnie się z trajektorią naszej planety? Czyhuragan, który tworzy się nad Wyspami Karaibskimi dotrze do Florydy? Czy amortyzator ozałożonej konstrukcji będzie dobrze pracował w superszybkiej kolei? Czy dana konstrukcja an-teny nadawczej zapewni odpowiednią charakterystykę promieniowania? Czy pole fali radiowejrozproszonej przez dźwig budowlany nie stworzy zagrożenia dla ludzi pracujących w sąsiedz-twie? Takich przykładów w dzisiejszej nauce i technice znajdziemy dziesiątki. Odpowiedzi natakie i podobne pytania nie można uzyskać rozwiązując proste modele. Potrzebne są obliczenianumeryczne dużej skali oparte na podstawowych teoriach fizycznych.

Dziedzina będąca przedmiotem zainteresowania niniejszej pracy to fizyka struktur atomo-wych, w szczególności struktur wykorzystywanych w nanotechnologiach (nanostruktur). Nano-struktury atomowe są to układy o charakterystycznych rozmiarach rzędu nanometrów, czyli,powiedzmy od kilku do kilkudziesięciu tysięcy atomów. Własności fizyczne takich układówsą zdeterminowane przez ich konfiguracje geometryczne i elektronowe. W rozważaniach mo-delowych można zakładać takie czy inne konfiguracje atomów jednak natura narzuca swojerozwiązania, uzależnione od budowy pojedynczych cegiełek-atomów oraz skomplikowanych od-działywań w układzie. Używa się określenia struktury samoorganizujące się (ang.: self assem-bling structures). W tej sytuacji możliwość teoretycznego przewidywania budowy struktur, bezodniesień eksperymentalnych (których zresztą często po prostu nie ma) staje się niezbędna.Po pierwsze dlatego, że eksperyment technologiczny jest bardzo kosztowny i po drugie prze-widywania teoretyczne mogą dać odpowiedź na pytanie czy założona struktura może w ogóleistnieć. Z pomocą przychodzą rozwijające się intensywnie od czterech dziesięcioleci metodyobliczeniowe ab initio [2]. W połowie lat 60-tych, na gruncie mechaniki kwantowej powstajeTeoria Funkcjonału Gęstości (DFT-Density Functional Theory) [3, 4], która tworzy podsta-wy numerycznych obliczeń energii całkowitej oraz rozkładu gęstości elektronowej w układachwieloatomowych. Powstanie teorii splata się z rozwojem techniki komputerowej i tworzeniemefektywnych algorytmów obliczeniowych, takich jak algorytm szybkiej transformaty Fouriera(FFT - Fast Fourier Transform) czy iteracyjne metody diagonalizacji macierzy (metoda dyna-miki molekularnej Car-Parrinello [5]). Dzięki rozwojowi tych trzech elementów: teorii, metodobliczeniowych (algorytmów), oraz techniki komputerowej, metody obliczeniowe ab initio stałysię potężnym narzędziem badawczym, odnoszącym wielkie sukcesy. Można obecnie analizowaćukłady zawierające do kilkuset atomów, co w połączeniu z periodycznymi warunkami brzegowy-mi i/lub metodami hybrydowymi prowadzi już do bardzo szerokiej klasy układów poddającychsię takiej analizie, a otrzymywane wyniki pozostają zwykle w bardzo dobrej zgodności z ekspe-rymentem.

Historycznie najwcześniejszym, wywodzącym się z chemii kwantowej, oraz nadal głównym

Page 3: Metody obliczeniowe ab initio w fizyce struktur atomowych

1 Wstęp. 3

zastosowaniem metod ab initio są badania strukturalne. Obserwuje się dwa główne nurty ta-kich badań. Są to: badania materiałowe, w szczególności dla warunków ekstremalnych ciśnieńi temperatur (n.p. mineralogia układu słonecznego [6]), oraz badania dla potrzeb nanotechno-logii. Obydwa nurty stosują podobne metody badawcze, różnią się jedynie rodzajem badanychukładów. Klasa układów atomowych stosowanych w nanotechnologiach jest bardzo szeroka.Znajdą się tu zarówno lity kryształ (będący często podłożem dla nanoukładów) jak i granicafaz (stała-próżnia, stała-ciekła, stała-stała), a także obiekty zlokalizowane w kryształach i nagranicach faz (domieszki czy defekty strukturalne). Tematyka obejmuje zatem np. zagadnieniageometrii równowagowych i przejść fazowych w kryształach litych, czystą powierzchnię krysz-tału z całym bogactwem zjawisk strukturalnych (rekonstrukcja), zjawiska adsorpcji i dyfuzjipowierzchniowej, zagadnienia wzrostu kryształów i cienkich warstw, oraz wiele innych.

Struktury typowe dla nanontechnologii to cienkie warstwy, druty kwantowe, kropki kwan-towe oraz kombinacje tych struktur. W kontekście zastosowań technicznych wyłaniają się dwiegrupy problemów. Pierwszy to technologia wytwarzania takich struktur i drugi ich własnościfizyczne w tym struktura geometryczna i elektronowa (n.p. problem stabilności). Metody obli-czeniowe ab initio okazują się być nieocenionym narzędziem na etapie projektowania strukturoraz projektowania technologii ich wytwarzania. Energia całkowita układu jako funkcja wy-branych parametrów geometrycznych nazywana jest powierzchnią energii potencjalnej, EPES

(PES - ’Potential Energy Surface’). Znajomość tej funkcji oraz jej dwóch kolejnych gradien-tów względem parametrów geometrycznych okazuje się być kluczowa przy badaniu własnościstrukturalnych układów atomowych. Znajomość funkcji EPES pozwala także badać dynamikęukładów i, w kolejnym kroku, termodynamikę, a więc włączyć temperaturę do badań struktu-ralnych, wyznaczać charakterystyki termodynamiczne, zależności temperaturowe konfiguracjigeometrycznych, badać strukturalne przejścia fazowe, itp. Wreszcie, jako wynik obliczeń uzysku-je się gęstość elektronową stanu podstawowego, mierzalną wielkość fizyczną, będącą podstawowąwielkością w teorii funkcjonału gęstości (DFT - Density Functional Theory). Znajomość gęsto-ści elektronowej oraz zmian tej gęstości pod wpływem różnych czynników fizycznych pozwalawniknąć w naturę wiązań w układach i szukać uzasadnienia zjawisk strukturalnych.

Należy dodać, że w ramach DFT i przybliżenia adiabatycznego można także badać odpowiedźukładu na wolnozmienne w czasie (adiabatyczne) pobudzenia zewnętrzne (pole elektromagne-tyczne, czynniki mechaniczne itp.). Na przykład kod ABINIT [7], wykorzystywany w częścipraktycznej niniejszej pracy, umożliwia obliczanie różnych funkcji odpowiedzi układu, które sądrugimi pochodnymi energii całkowitej ze względu na różne zaburzenia. Obecnie uwzględnionesą zaburzenia nastepujących typów: (1) fonony, (2) statyczne (adiabatyczne) pole elektrycznei (3) naprężenia mechaniczne. Własności fizyczne związane z zaburzeniami (1) i (2) opisywanesą przez fononową macierz dynamiczną, tensor dielektryczny oraz ładunek efektywny Borna,natomiast dodatkowe zaburzenie w postaci naprężenia (3), w połączeniu z fononami i polemelektrycznym prowadzi do stałych sprężystych, naprężeń wewnętrznych oraz parametrów pie-zoelektrycznych.

W ostatnich latach prowadzone są też intensywne poszukiwania teoretyczne efektywnychmetod badania elektronowych stanów wzbudzonych w ramach DFT. Metody ab initio stosuje sięwięc również do badania odpowiedzi układów na wysokoczęstościowe pobudzenia zewnętrzne,choć są to w chwili obecnej obliczenia wymagające ponadprzeciętnych zasobów komputerowych.Stosunkowo najwięcej kłopotów sprawia zakres częstości ”średnich”, przy których konieczne jestwyjście poza przybliżenie adiabatyczne (Borna-Oppenheimera).

Praca niniejsza będzie poświęcona głównie zagadnieniom strukturalnym z uwzględnieniemniskoczęstościowych czynników zewnętrznych.

Page 4: Metody obliczeniowe ab initio w fizyce struktur atomowych

2 Teoria podstawowa. 4

2 Teoria podstawowa.

2.1 Równanie Schrodingera dla izolowanego układu atomów.

Jako punkt wyjścia opisu fizyki struktur atomowych przyjmuje się nierelatywistyczny hamilto-nian izolowanego układu atomów:

H = T e + TZ + U ee + U eZ + UZZ (1)

gdzie:

T e = − h

2me

i

∇2i , TZ = −∑

i

h

2Mi

∇2i , U ee =

12

i6=j

e2

|ri − rj| ,

U eZ =∑

i,k

Zie2

|ri −Rk| , UZZ =12

i6=k

ZiZke2

|Ri −Rk| ,

to operatory odpowiednio: energii kinetycznej elektronów, energii kinetycznej jąder, orazenergii potencjalnych oddziaływań elektrostatycznych elektron-elektron, elektron-jądro i jądro-jądro, a Mi i Zi oznaczają odpowiednio masy i liczby atomowe atomów tworzących układ.

Stany i energie własne układu są rozwiązaniami stacjonarnego równania Schrodingera:

HΨs(r,R) = EsΨ(r,R), (2)

gdzie Ψs(r,R) jest wielociałową funkcją falową układu zależną od elektronowych (w tymspinowych) (r) i jonowych (R) stopni swobody, Es opisuje energię całkowitą tego układu, a sindeksuje rozwiązania równania.

Ten podstawowy opis jest także punktem wyjścia teoretycznej analiz odpowiedzi układu naróżnego rodzaju oddziaływania zewnętrzne (mechaniczne, elektromagnetyczne, zależne bądźniezależne od czasu), ponieważ zwykle traktuje się je jako zaburzenie hamiltonianu (1) i sto-suje rachunek zaburzeń. Pierwszym przykładem takiego podejścia, a zarazem fundamentalnymprzybliżeniem stosowanym w teorii struktur atomowych jest przybliżenie Borna-Oppenheimera(adiabatyczne) opisane krótko w następnym rozdziale.

2.2 Przybliżenie Borna-Oppenheimera.

Pierwszym przybliżeniem jakie się stosuje jest przybliżenie Borna-Oppenheimera (adiabatycz-ne) wykorzystujące fakt dużej różnicy między masą jądra atomowego a masą elektronu (od 3do 5 rzędów wielkości). W ramach tego przybliżenia równanie Schrodingera (2) separuje się nadwa równania, które mogą być rozwiązywane niezależnie (choć sprzężone są poprzez jonowestopnie swobody). Są to:

Heψ(r) = E(R)ψ(r), (3)

równanie dla układu elektronowego, w którym jonowe stopnie swobody (R) pełnią rolęparametrów, oraz

HBOφ(R) = Etotφ(R), (4)

równanie dla układu jonów. W powyższych równaniach He jest hamiltonianem układu elek-tronowego:

He = T e + V ee + V ej (5)

a HBO hamiltonianem układu jonów:

Page 5: Metody obliczeniowe ab initio w fizyce struktur atomowych

2 Teoria podstawowa. 5

HBO = T j + V jj + E(R), (6)

do którego, jak widać, wchodzi zależna od R energia układu elektronowego. Elektronowa ijonowa funkcje falowe to odpowiednio ψ(r) i φ(R).

Opisana wyżej procedura formalnie polega na przedstawieniu funkcji Ψ w równaniu (2) wpostaci iloczynu funkcji ψ(r) i φ(R) oraz pominięciu małych (w sensie wartości oczekiwanej)składowych energii całkowitej układu. Fizycznie przybliżenie to oznacza, że układ elektronowydopasowuje się w sposób natychmiastowy do konfiguracji jonów. Konsekwencją tego przybliże-nia jest w szczególności ograniczenie możliwości uwzględniania pobudzeń zewnętrznych tylkodo niskich częstości (porównywalnych z częstościami charakterystycznymi dla układu jonów)oraz wysokich częstości (przy których układ jonowy nie reaguje na pobudzenie).

2.3 Powierzchnia energii potencjalnej.

Zagadnienie dynamiki układu jonowego można z bardzo dobrym przybliżeniem rozwiązywaćklasycznie, rozwiązując np. równania Newtona. Rolę energii potencjalnej pełnią: energia od-działywania jon-jon oraz sparametryzowana położeniami jonów energia układu elektronowego(patrz równie 6). Jest to jednocześnie energia całkowita układu Etot w wyrażeniach (2) i (4),w sytuacji statycznej (unieruchomionych jonów). Tak określona energia potencjalna jest więcw ogólności funkcją jonowych stopni swobody. Na poziomie ’mikroskopowym’ będą to współ-rzędne jonów, istnieje jednak możliwość przesunięcia części stopni swobody układu na poziommezoskopowy (i makroskopowy) w postaci np. objętości, pola powierzchni, zmiennych struktu-ralnych (definiujących komórkę elementarną w krysztale), czy składowych tensora odkształceń.Funkcja ta nazywana jest powierzchnią energii potencjalnej (PES) i stanowi kluczową charak-terystykę układu z punktu widzenia własności strukturalnych i materiałowych. Ważne są takżedwa kolejne gradienty PES ze względu na jonowe stopnie swobody reprezentujące uogólnionesiły oraz uogólnione stałe elastyczne. I tak, na poziomie mikroskopowym:

Fi = −∂Etot(R)∂Ri

(7)

to siły działające na jony (indeks i identyfikuje jednocześnie jon i współrzędną, np. karte-zjańską). Drugi gradient:

∂Fi∂Rj

= −∂2Etot(R)∂Ri∂Rj

(8)

określa w tym wypadku macierz stałych siłowych, wykorzystywaną w przybliżeniu harmo-nicznym (patrz rozdział 7.2).

Na poziomie mezoskopowym, np. przy objętości traktowanej jako stopień swobody, otrzy-mujemy ciśnienie i moduł sprężystości objętościowej (bulk modulus):

P = −∂Etot(V )∂V

(9)

B = V∂P (V )∂V

= −V ∂2Etot(V )∂V 2

(10)

Jeśli stopniem swobody będzie pole powierzchni (lub wymiar liniowy) wówczas kolejne po-chodne to napięcie powierzchniowe (liniowe) i moduł sprężystości powierzchniowej (liniowej). Zkolei jako wynik kolejnych pochodnych energii całkowitej po składowych tensora odkształceńotrzymamy tensor naprężeń oraz tensor sprężystości.

Page 6: Metody obliczeniowe ab initio w fizyce struktur atomowych

3 Podstawy teoretyczne obliczeń it ab initio. 6

2.4 Stany równowagi statycznej.

Minima lokalne lub globalne PES wyznaczają stany równowagi układów zwane równowagąstatyczną (static equilibrium). Nie jest to do końca stan odpowiadający temperaturze zera bez-względnego gdyż nie uwzględnia się tu drgań zerowych atomów. W przykładach podanych wpoprzednim podrozdziale stan równowagi statycznej określa np. położenia atomów, na poziomiemikroskopowym. Na wyższych poziomach będzie to np. objętość równowagowa, równowagowastruktura krystaliczna. Jeśli minimum PES ma charakter lokalny wówczas mamy doczynieniaze stanem metastabilnym a więc możliwe jest przejście układu do minimum globalnego, akty-wowane np. temperaturą. Warunkiem równoważnym minimum PES jest warunek zerowania sięsił lub sił uogólnionych (zerowanie pierwszych pochodnych). Zerowanie się drugich pochodnychoznacza brak dobrze określonego minimum PES, co może oznaczać brak stabilności układu.

Interesującym przypadkiem PES na poziomie mikroskopowym jest atom adsorbatu na po-wierzchni kryształu. Jeśli płaszczyzna XY kartezjańskiego układu współrzędnych pokrywa się zpłaszczyzną powierzchni wówczas PES jest dwuwymiarową funkcją współrzędnych x i y atomu(zakłada się, że atom zawsze pozostaje w minimum PES ze względu na trzeci stopień swobody,współrzędną z). Wyznaczona w ten sposób PES pozwala na określanie położeń stabilnych i me-tastabilnych atomów na powierzchni, określanie prawdopodobieństw przejść z jednych położeńdo drugich oraz na analizę dyfuzji powierzchniowej.

Bardzo istotnym parametrem, od którego zależą na własności strukturalne układów atomo-wych, jest temperatura. Jej uwzględnienie wymaga analizy termodynamiki układów. Możliwewydaje się uogólnienie koncepcji powierzchni energii potencjalnej na koncepcję powierzchnienergii swobodnej (FES - free energy surface). Zagadnieniu temu będzie poświęcony jeden zkolejnych rozdziałów.

2.5 Zaburzenia adiabatyczne: twierdzenie Hellmanna-Fenmana

Twierdzenie Hellmanna-Feynmana mówi, że jeśli energia Eλ jest wartością oczekiwaną pewnegohamiltonianu Hλ, zależnego od parametru λ, to pochodna tej energii po parametrze λ jest równawartości oczekiwanej pochodnej hamiltonianu Hλ po tym parametrze:

∂Eλ∂λ

= 〈ψλ|∂Hλ

∂λ|ψλ〉 (11)

Stąd siła Fi działająca na atom (52):

Fi = −∂Etot(R)∂Ri

= −〈ψ(R)|∂HBO(R)∂Ri

|ψ(R)〉, (12)

i ostatecznie:

Fi = −∫n(r,R)

∂V ej(r,R)∂Ri

dr− ∂V jj(R)∂Ri

, (13)

gdzie n, V ej, V jj to odpowiednio: gęstość elektronowa, energia oddziaływania elektron-jon ienergia oddziaływania jon-jon, jak w rozdziale 2.3.

3 Podstawy teoretyczne obliczeń it ab initio.

3.1 Zagadnienie niejednorodnego gazu elektronów, teoria funkcjonału gęstości (DFT).

Jak pokazano w poprzednim rozdziale, w badaniach teoretycznych własności strukturalnychukładów atomowych kluczową rolę odgrywa powierzchnia energii potencjalnej (PES) definio-wana jako energia całkowita układu przy zamrożonych jonowych stopniach swobody:

Page 7: Metody obliczeniowe ab initio w fizyce struktur atomowych

3 Podstawy teoretyczne obliczeń it ab initio. 7

Etot = V jj + E(R) (14)

Obliczenia numeryczne pierwszego składnika w tym wyrażeniu (energii kulombowskiego od-działywania jonów) są proste od strony ideowej. Trudności techniczne związane z faktem, żeoddziaływanie kulombowskie jest dalekozasięgowe pokonuje się stosując technikę Ewalda (Ref).Drugi składnik to energia całkowita układu elektronowego. Jest to znane w mechanice kwanto-wej zagadnienie układu cząstek identycznych, samo w sobie złożone i będące obiektem oddziel-nej dziedziny badań teoretycznych. W przypadku układów atomowych mówimy o niejednorod-nym gazie elektronów (fermionów). Podstawy teoretyczne analizy fizyki takich układów byłyznane już w końcu lat 20 XX wieku (Ref), jednak rozwiązanie równań okazało się technicznieniemożliwe (warto przypomnieć, że nawet klasyczny układ tylko trzech cząstek jest w ogólno-ści nierozwiązywalny analitycznie). W latach 50 rozpoczęła się rewolucja w dziedzinie technikobliczeniowych, która trwa do dzisiaj i wydaje się, że jej końca ciągle nie widać. Jednak i przyobecnym stanie rozwoju komputerów, przecież imponującym, numeryczne rozwiązanie równaniaSchrodingera nawet dla układu 10 elektronów (np. atom neonu) jest niemożliwe. Na przykładpamięć potrzebna na zapisanie funkcji falowej takiego układu w reprezentacji położeniowej, nasiatce 10-punktowej, jest rzędu 4×1030 bytów. Gdyby więc chcieć zapisać taką funkcję na płyt-kach CD o pojemności 1Gb każda to potrzeba by 1021 takich płytek. Zakładając, że jedna płytkaważy 10 gramów potrzebujemy 1016 ton płytek, a to dopiero początek układu okresowego i każdynastępny atom to o 3 rzędy wielkości więcej potrzebnej pamięci ! Sytuacja wydaje się bezna-dziejna, jednak z pomocą przychodzi teoria funkcjonału gęstości (DFT - ’Density FunctionalTheory’), której podstawy zostały sformułowane w latach 60 poprzedniego stulecia (Ref). Teoriata pozwala efektywnie rozwiązywać zagadnienie układu identycznych cząstek kwantowych po-przez rozwiązywanie jednocząstkowego równania typu Schrodingera, a centralnym problememteorii jest adekwatna reprezentacja kwantowego oddziaływania korelacji-wymiany.

3.2 Twierdzenie Hohenberga-Kohna.

Podstawą opisu układu cząstek identycznych w zewnętrznym potencjale V ext (niejednorodnegogazu cząstek) w teorii funkcjonału gęstości jest ich gęstość:

n(r) = N∫|ψ(r, r2, . . . , rN)|2dr2 . . . drN (15)

normowana do liczby cząstek:

N =∫n(r)dr (16)

Jest to funkcja rzeczywista współrzędnej przestrzennej (3 zmiennych) zatem znacznie prost-sza od funkcji falowej.

Punktem wyjścia teorii jest, sformułowane w 1964 roku, twierdzenie Hohenberga-Kohna(Ref):

• Energia układu kwantowych cząstek cząstek identycznych jest funkcjonałem gęstości:

E[n] = F [n] +∫n(r)V ext(r)dr, (17)

gdzieF [n] = 〈ψ|T + W |ψ〉, (18)

a W jest energią kulombowskiego oddziaływania cząstek

Page 8: Metody obliczeniowe ab initio w fizyce struktur atomowych

3 Podstawy teoretyczne obliczeń it ab initio. 8

• gęstość stanu podstawowego nG minimalizuje funkcjonał (17):

EG[nG] = minn→nG

E[n]⇒ δE

δn

∣∣∣∣∣n=nG

= 0, (19)

co jest oczywistą konsekwencją zasady wariacyjnej Rayleigha-Ritza

Z twierdzenia tego wynika w szczególności, że funkcjonał F [n] jest uniwersalny, to znaczy,że nie zależy od potencjału zewnętrznego. Wynika z niego także, że nie jest możliwe aby dwanietrywialnie różne potencjały (różniące się bardziej niż o stałą) produkowały taką samą gęstośćstanu podstawowego. W takim sensie potencjał zewnętrzny jest także funkcjonałem gęstości.Własność ta została wykorzystana przy konstrukcji równań Kohna-Shama, opisanej w kolejnymrozdziale.

3.3 Równania Kohna-Shama.

Twierdzenie Hohenberga-Kohna nie dostarcza recepty na znajdowanie gęstości n(r). Nie jestbowiem znana jawna postać funkcjonału F [n] (a nawet są kłopoty ze zdefiniowaniem dziedzinytego funkcjonału, czyli fizycznie akceptowalnych gęstości (Ref)). Trudności te zostały w znacz-nym stopniu przezwyciężone w konstrukcji Kohna-Shama polegającej na mapowaniu realnegoukładu cząstek na pomocniczy układ cząstek nieoddziałujących, w taki sposób aby gęstościstanu podstawowego obu układów były identyczne. Zabieg polega na konstrukcji zewnętrznegopotencjału lokalnego dla układu cząstek nieoddziałujących (na mocy tw. Hohenberga-Kohnaistnieje jeden i tylko jeden taki potencjał). Korzyść płynąca z takiego mapowania wiąże się zfaktem, że równanie Schrodingera układu cząstek nieoddziałujących separuje się na równaniajednocząstkowe.

Funkcjonał uniwersalny F [n] układu oddziałującego zapiszemy w postaci:

F [n] = T0[n] +e2

2

∫ n(r)n(r′)|r− r′| drdr

′ + Exc[n], (20)

gdzie T0[n] to energia kinetyczna układu cząstek nieoddziałujących, a Exc[n] jest tzw. ener-gią korelacji-wymiany, zdefiniowaną przez powyższe równanie. Przekształcenie funkcjonału F [n]ma charakter tożsamościowy (dodanie i odjęcie T0[n])), pozwala jednak na ulokowanie niezna-nej analitycznie części tego funkcjonału w członie Exc[n] mającym charakter energii typowokwantowych oddziaływań korelacji i wymiany.

Wariacja funkcjonału energii ze względu na gęstość n[r], z warunkiem ubocznym zachowa-nia liczby cząstek, prowadzi formalnie do takiego samego równania jakie otrzymalibyśmy wprzypadku cząstek nieoddziałujacych:

(− h2

2m∂2

∂r2+ VSCF (r)

)ψn(r) = εnψn(r) (21)

z potencjałem efektywnym VSCF (self consistent field):

VSCF (r) = V ext(r) + e2∫ n(r′)|r− r′|dr

′ + vxc(r) (22)

gdzie

vxc(r) =δExc[n]δn(r)

(23)

to potencjał lokalny nazwany potencjałem korelacji-wymiany (eXchange-Correlation).

Page 9: Metody obliczeniowe ab initio w fizyce struktur atomowych

3 Podstawy teoretyczne obliczeń it ab initio. 9

Gęstość stanu podstawowego n(r) (będąca gęstością zarówno układu prawdziwego jak i po-mocniczego) oraz energia kinetyczna układu nieoddziałującego T0[n] wyrażają się poprzez ob-sadzone przez cząstki orbitale Kohna-Shama, ψn(r):

n(r) = 2N/2∑

n=1

|ψn(r)|2 (24)

T0[n] = −2h2

2m

N/2∑

n=1

∫ψ∗n(r)

∂2ψn(r)∂r2

dr (25)

przy czym zakładamy, że układ jest niemagnetyczny i dla elektronów ma miejsce dwukrotnadegeneracja ze względu na spin.

Energię całkowitą układu można obliczać albo z wyrażeń (17) i (20) albo korzystając zenergii własnych Kohna-Shama:

E[n] = 2n/2∑

n=1

εn − e2

2

∫ n(r)n(r′)|r− r′| drdr

′ + Exc[n]−∫n(r)vxc(r)drdr (26)

Warto w tym miejscu jeszcze raz zaznaczyć, że choć równania Kohna-Shama są równaniamitypu jednocząstkowego, to ich rozwiązania nie są stanami w sensie przybliżenia cząstek nie-zależnych. W szczególności, jak widać w powyższym wyrażeniu, energia układu nie jest sumąenergii stanów obsadzonych. Jedynym odniesieniem równań Kohna-Shama do układu rzeczy-wistego jest uzyskiwana poprzez ich rozwiązanie gęstość stanu podstawowego (oraz energiacałkowita układu, ponieważ przekształcenie hamiltonianu miało charakter tożsamościowy).

Równanie (21) to nieliniowe równanie Schrodingera, w tym sensie, że występujący w rów-naniu potencjał zależy od jego rozwiązań. Dlatego równie Kohna-Shama rozwiązuje się w spo-sób samouzgodniony. Od strony formalnej jest to równanie jednocząstkowe co stanowi ogromneuproszczenie w stosunku do równania wielocząstkowego. Metoda pozwala efektywnie znajdowaćgęstość i energię stanu podstawowego układu identycznych cząstek kwantowych, pod warun-kiem, że znany jest potencjał korelacji wymiany vxc. Analityczna postać tego potencjału niejest znana dlatego stosuje się przybliżenia opisane w rozdziale 3.6.

3.4 Twierdzenie Janaka

Istnieje możliwość rozwiązania zagadnienia wariacyjnego (19) w konstrukcji Kohna-Shama przydowolnym wektorze obsadzeń λ. Postać równań Kohna-Shama (21) nie ulega zmianie, jednakich rozwiązania (energie i funkcje własne, energia całkowita) stają się funkcjami wektora ob-sadzeń (εn(λ),ψn(λ, r),E(λ)), ponieważ od tegoż wektora zależy gęstość (a zatem i potencjałsamouzgodniony V SCF ):

n(r) =∞∑

n=1

λn|ψn(r)|2 (27)

gdzie λn przyjmują wartości z zakresu 〈0, 2〉, oraz:

N =∞∑

n=1

λn, (28)

gdzie N jest liczbą cząstek.Twierdzenie Janaka pokazuje związek pomiędzy energiami własnymi Kohna-Shama przy za-

danym wektorze obsadzeń λo a pochodną cząstkową energii całkowitej ze względu na obsadzeniapoziomów:

Page 10: Metody obliczeniowe ab initio w fizyce struktur atomowych

3 Podstawy teoretyczne obliczeń it ab initio. 10

εn(λo) =(∂E(λ)∂λn

)

λ=λo

(29)

3.5 Stany wzbudzone

Analiza stanów wzbudzonych w ramach DFT to obszerna dziedzina współczesnych badań teore-tycznych (przybliżenie GW, TDDFT - time dependent density functional theory). Teoria zapre-zentowana w tym opracowaniu dotyczy przede wszystkim stanu podstawowego niejednorodnegoukładu identycznych cząstek kwantowych. Możliwa jest jednak prosta analiza energii wzbudzeńukładu (przynajmniej niektórych) opierająca się na hipotezie, że stanom wzbudzonym odpo-wiadają całkowite obsadzenia orbitali Kohna-Shama (λn = 1, 2). Jeśli oznaczymy przez λgwektor obsadzeń stanu podstawowego (λn = 2, dla n = 1, ..., N/2), a przez λe wektor obsadzeńpewnego stanu wzbudzonego, wówczas energia wzbudzenia:

∆E = E(λe)− E(λg) (30)

W szczególności, wzbudzenie jednocząstkowe polegające na inwersji obsadzeń stanów n <N/2 i m > N/2, reprezentowane przez wektor obsadzeń λmn:

(∆E)mn = E(λmn)− E(λg) (31)

Korzystając z twierdzenia Janaka energię takiego wzbudzenia można obliczyć w inny sposób:

(∆E)mn =∫dE =

∫ (∂E

∂λndλn +

∂E

∂λmdλm

)(32)

=∫ 1

0

[εn(λ)d(1− λm) + εm(λ)dλm

]

=∫ 1

0

[εm(λ)− εn(λ)

]dλm

Ostatni wzór jest użyteczny w sytuacji, gdy różnica energii całkowitych jest mniejsza niżdokładność reprezentacji numerycznej energii całkowitej (czyli w dużych układach) i nie możnazastosować wzoru 31.

3.6 Przybliżenia energii korelacji-wymiany: LDA i GGA.

Historycznie pierwszym i powszechnie stosowanym przybliżeniem energii korelacji-wymiany jestprzybliżenie lokalnej gęstości (LDA - local density approximation). Przyjmuje się, że energiakorelacji-wymiany w układzie niejednorodnym jest lokalnie równa energii korelacji-wymianyukładu jednorodnego, i wyraża się wzorem:

Exc[n] =∫εxc(n)|n=n(r)n(r)dr, (33)

gdzie εxc(n) jest energią korelacji wymiany na jedną cząstkę w układzie jednorodnym. Po-tencjał korelacji wymiany przyjmuje wówczas postać:

vxc[n](r) =(εxc(n) + n

dεxc(n)dn

)

n=n(r)

(34)

Energię εxc(n) można podzielić na część korelacyjną i wymienną:

εxc(n) = εx(n) + εc(n). (35)

Page 11: Metody obliczeniowe ab initio w fizyce struktur atomowych

4 Przykład: atom. 11

Znana jest dokładna analityczna postać energii wymiany w układzie jednorodnym:

εx(n) = − 34π

(3π2n)1/3, (36)

a formuły opisujące energię korelacji εc(n) mają charakter przybliżony i opierają się naparametryzacjach wyników symulacji QMC (Quantum Monte Carlo) (Ref).

Przybliżenie LDA jest najlepsze w granicach dużych gęstości lub gęstości wolno zmiennejprzestrzennie. W praktyce okazało się, że z sukcesem opisuje bardzo szeroką klasę układów, odpojedynczego atomu do rozmaitych układów wieloatomowych. Znane są obecnie charaktery-styczne błędy wyników uzyskiwanych w ramach przybliżenia LDA:

• znacznie większe (∼ 20%) energie kohezji w kryształach oraz energie wiązań

• zły opis układów silnie skorelowanych, takich jak tlenki metali przejściowych

• mniejsze (∼ 1%) stałe sieci w kryształach i równowagowe długości wiązań w cząsteczkach

• większe (∼ 20%) wielkości związane z własnościami sprężystymi (np. moduły sprężystościobjętościowej w kryształach)

• większe (∼ 5%) częstości oscylacji)

Inne przybliżenie energii korelacji-wymiany to przybliżenie uogólnionych gradientów (GGA- generalized gradient approximation):

Exc[n] =∫εxc(n, |∇n(r)|)|n=n(r)n(r)dr, (37)

w którym zakłada się zależność lokalnej energii korelacji-wymiany εxc od gęstości i jej gra-dientu. Charakterystyczne błędy obserwowane w przybliżeniu GGA to:

• mniejsze od eksperymentalnych (∼ 10%) energie kohezji w kryształach oraz energie wiązań(∼ 10%)

• większe (∼ 1%) stałe sieci w kryształach i równowagowe długości wiązań w cząsteczkach

• większe (∼ 5%) wielkości związane z własnościami sprężystymi (moduły sprężystości)

4 Przykład: atom.

Atom jest podstawową cegiełką w układach wieloatomowych i jednocześnie najprostszym real-nym obiektem fizycznym poddającym się analizie aparatem teoretycznym opisanym w zarysiew poprzednim rozdziale. Jednocześnie, jego własności fizyczne mają w sposób oczywisty klu-czowe wpływ na własności układów złożonych. Bardzo ważny jest więc dobry opis teoretycznyatomu i dlatego warto poświęcić temu obiektowi nieco uwagi, choć od strony formalnej aparatzaprezentowany w tym rozdziale ma w dużej części charakter podręcznikowy.

Rozwiązanie numeryczne równań Kohna-Shama dla atomów jest stosunkowo proste. Przyzałożeniu symetrii sferycznej układu (spełnionym jedynie w przypadku atomów/jonów o za-mknieetych powłokach i beedącym przybliżeniem dla atomów o otwartych powłokach) równaniaredukują się do jednego wymiaru (promienia we współrzędnych sferycznych) i mogą być rozwią-zywane w reprezentacji położeniowej, poprzez dyskretyzację na siatce radialnej. Poniżej przed-stawiony jest sposób rozwiązania dla nierelatywistycznego równania Schrodingera. Rozwiązujesię także równanie Schrodingera relatywistyczne-skalarne (w przypadku atomów ciężkich,) orazrelatywistyczne-wektorowe (w przypadku atomów, w których istotne jest oddziaływanie spin-orbita).

Page 12: Metody obliczeniowe ab initio w fizyce struktur atomowych

4 Przykład: atom. 12

W układzie jednostek Hartree (me = h = e = 4π/εo = 1) równanie Kohna-Shama mapostać:

[12∇2 + V SCF (r)

]ϕ(r) = εϕ(r) (38)

Jest to zagadnienie własne, którego rozwiązaniem jest zbiór: ϕi, εi, a gęstość elektronowąznajdujemy z sumy:

n(r) = Σiλi|ϕi(r)|2, (39)

gdzie liczby obsadzeń λi = 1, dla i = 1, ..., N ; λi = 0, dla i > N, a N jest liczbąelektronów w atomie. Przy założeniu symetrii sferycznej potencjału samouzgodnionego V SCF (r)równanie (38) można przedstawić we współrzędnych sferycznych:

[− 1

2r2

(∂

∂r

(r2 ∂

∂r

)+ L2

)+ V SCF (r)

]ϕ = εϕ, (40)

gdzie L jest operatorem momentu pędu, zależnym tylko od współrzędnych kątowych, a więckomutującym z Hamiltonianem. Funkcja falowa ϕ jest iloczynem harmoniki sferycznej Ylm(r)(gdzie r jest kierunkiem w przestrzeni r) będącej funkcją własną operatora momentu pędu,oraz funkcji radialnej R(r), będącej rozwiązaniem zagadnienia własnego:

[− 1

2r2

d

dr

(r2 d

dr

)+l(l + 1)r2

+ V SCF (r)]R(r) = εR(r) (41)

Harmoniki sferyczne indeksowane są liczbami kwantowymi: l - orbitalną, wskazującą nawartość momentu pędu, oraz m - magnetyczną, określającą rzut momentu pędu na wybranąoś.

Równanie (41) ulega dalszemu uproszczeniu po dokonaniu podstawienia: R(r) = u(r)/r.Przyjmuje wówczas postać:

[−1

2d2

dr2+l(l + 1)r2

+ V SCF (r)]u(r) = εu(r) (42)

Jest to formalnie równanie Schrodingera dla cząstki poruszającej się w jednym wymiarze wpotencjale efektywnym: l(l+1)/r2 +V SCF (r). Nietrudno także pokazać, że z warunku unormo-wania funkcji ϕ(r) wynika fakt unormowania funkcji u(r). Rozwiązania równania (42): unl, εnl(a więc także Rnl, εnl), indeksowane są liczbami kwantowymi: n - główną, określającą energięwłasną Kohna-Shama, oraz orbitalną (l), ponieważ od niej zależy efektywny hamiltonian. Jakwidać występuje degeneracja poziomów Kohna-Shama ze względu na liczbę kwantową m. Zakre-sy zmienności liczb kwantowych n, l,m podlegają znanym regułom: n = 1, 2, ... ; l = 0, ..., (n−1); −l ¬ m ¬ l. Liczby kwantowe l nazywa się zwyczajowo, kolejno s, p, d, f, ....

Równanie (42) rozwiązuje się numerycznie, poprzez dyskretyzację na siatce radialnej (stosujesiee logarytmiczne siatki kilkaset punktów), oraz zastosowanie jednego ze znanych algorytmówrekurencyjnych, z warunkami brzegowymi u(0) = 0 i R(∞) = 0. Kryterium odnalezienia funkcjii wartości własnej jest równość pochodnych logarytmicznych rozwiązań uzyskiwanych poprzezcałkowanie rekurencyjne od lewej (u−) i od prawej (u+) strony, w wybranym punkcie rm zwanympunktem dopasowania (ang. matching point):

d ln(u−)dr

|r=rm =d ln(u+)dr

|r=rm (43)

Warunek ten zapewnia gładkie zszycie funkcji u− i u+ w punkcie rm, tzn. równość wartośćfunkcji oraz ich pierwszych pochodnych. Rozwiązanie numeryczne równania (38) odbywa sięw sposób samouzgodniony, ponieważ V SCF jest funkcjonałem gęstości. Tzn. po każdym roz-wiązaniu zagadnienia własnego (38), według opisanego wyżej schematu, obliczana jest gęstość

Page 13: Metody obliczeniowe ab initio w fizyce struktur atomowych

5 Pseudopotencjał 13

(39), nowy potencjał V SCF , itd., aż do ustabilizowania się energii całkowitej. Rysunek pokazujewyniki obliczeń radialnych funkcji u(r) dla potasu, wykonane programem fhiPP.

0 1 2 3 4r (bohr)

−2

−1

0

1

2

u(r)

(ar

bitr

ary

scal

e)Radial Wavefunctions K 15:58:44 Feb 25 2004 scharoch

4s3p3s2p2s1s

5 Pseudopotencjał

Podstawową ideą pseudopotencjału jest chęć zastąpienia silnego potencjału kulombowskiegojądra atomowego i silnie związanych z jądrem elektronów rdzenia – słabym (efektywnym) po-tencjałem jonowym działajacym na elektrony walencyjne.

Potrzeba pseudopotencjału ma naturę techniczną. Wszelkie obliczenia numeryczne (nie-koniecznie komputerowe) nieznanej funkcji najczęściej sprowadzają się do rozmaitych metodprzybliżania tejże funkcji poprzez rozwinięcie w szeregi funkcyjne i znalezienie współczynnikówrozwinięcia. Wiadomo, że generalnie przybliżenie obciętym szeregiem jest tym lepsze im więcejjest wyrazów rozwinięcia. Z kolei ilość potrzebnych wyrazów rozwinięcia (dajacych ustaloneodchylenie funkcji aproksymowanej od aproksymującej) jest tym mniejsza im funkcja, aprok-symowana szeregiem, jest gładsza. Pole elektrostatyczne generowane przez jądro atomu czylienergia potencjalna w równaniu Schroedingera jest funkcją osobliwą. Rozwiązania tegoż równa-nia czyli funkcje falowe szybko oscylują w pobliżu jądra i jeśli byśmy chcieli wyrazić je poprzezwygodne szeregi funkcyjne, musielibyśmy użyć stosunkowo wielu wyrazów rozwinięcia. Odtądprzyjmiemy, że wszelkie funkcje rozwijamy w szereg trygonometryczny czyli inaczej mówiącbędziemy operować bazą ”fal płaskich”.

Pseudopotencjał jest konstrukcją, która pozwala ”wygładzić” potencjał kulombowski. Atomwieloelektronowy, można rzec, składa się z części stałej, która zawsze będzie taka sama i nicjej, w rozsadnym horyzoncie czasowym, nie ruszy. To jest po pierwsze jądro, ale nie tylko: do-chodzą do niego jeszcze tzw. elektrony rdzenia czyli te, które są najbardziej związane z jądrem.W kontakcie atomu z otoczeniem (czyli w tworzeniu całej różnorodności świata chemicznegoi biologicznego) odgrywają role jedynie elektrony zewnętrzne - walencyjne. Wystarczy więczajmować się tylko tymi elektronami zaś resztę atomu traktować jako rdzeń. Jeśli będziemyw stanie zasymulować działanie rdzenia na elektrony walencyjne i generalnie na wszelkie ob-

Page 14: Metody obliczeniowe ab initio w fizyce struktur atomowych

5 Pseudopotencjał 14

ce elektrony tak, aby one nie zauważyły że nie mają do czynienia z prawdziwym atomem -uzyskamy znaczne uproszczenie zagadnienia obliczeniowego.

Opisywać będziemy elektrony poprzez pseudofunkcje falowe o których zażądamy aby byłyidentyczne z prawdziwymi funkcjami falowymi na zewnętrz rdzenia atomowego, zaś w obszarzerdzenia były możliwie gładkie (czyli w całym zakresie zmienności nie miały węzłów). Pseudo-potencjał występujący w równaniu Schroedingera i równaniu Poissona powinien dawać właśnietakie funkcje jako rozwiązania.

5.1 Historia

Pierwsze pseudopotencjały były konstruowane w ramach ideologii o charakterze fenomenolo-gicznym: starano się symulować pewne właściwości rozproszeniowe atomu. Na przykład: zakła-dano, że pseudopotencjał atomu obcej domieszki w metalu, na zewnątrz pewnej ustalonej kulio promieniu rc jest czysto kulombowski, a wewnątrz tej kuli jest po prostu zerem. Następnierozwiąywano zagadnienie rozpraszania elektronów przewodnictwa na takich „domieszkach” ato-mowych i uzyskiwano, w rezultacie złożonych obliczeń, opór elektryczny. Wartość promienia rcdobierano tak aby otrzymać zgodność obliczonego oporu z wynikiem eksperymentu. Taki pseu-dopotencjał nazwiemy lokalnym, gdyż pole sił działających na każdy elektron jest takie samo.Jeśli jednak chcemy, aby pseudopotencjał dawał wartości własne energii (walencyjnych) atomutakie jak prawdziwy potencjał - to jest to niemożliwe. To znaczy jest niemożliwym zbudowaniepseudopotencjału lokalnego – funkcji wektora położenia zawierającą pełny opis sił działającychna elektron. Nielokalność pseudopotencjału oznacza, że na to aby wiedzieć jakie pole sił działana elektron nie wystarcza znajomość miejsca w którym ten elektron jest, ale potrzebna jest teżpewna inna informacja. Wprowadza się funkcję dwóch zmiennych – pseudopotencjał nielokalnyczyli pewien operator V PS(r, r′) zależny od dwóch wektorów położenia.

Jest możliwe zbudowanie pseudopotencjału jako zestawu potencjałów odpowiednio dla każ-dego typu symetrii funkcji falowych elektronu czyli dla każdej liczby kwantowej l (por. poprzednirozdział) – zależnego od jednej zmiennej r i części kątowej drugiej zmiennej Ωr′ . Taki pseudopo-tencjał, zestaw ”potencjałów”: Vs, Vp, Vd, ..., który jest lokalny względem r = |r| zaś nielokalnywzględem zmiennych kątowych będziemy nazywać pseudopotencjałem półlokalnym.

5.2 Psudopotencjał zachowujący normę

Do obliczeń bazujących na teorii funkcjonału gęstości, gdzie gęstość ładunku elektronowegojest wielkością podstawową, pseudopotencjał zadanego atomu musi być konstruowany dosyćprecyzyjnie:

- wartości własne energii wzorcowego atomu i pseudoatomu muszą się zgadzać,- funkcje falowe wzorcowego atomu i funkcje pseudofalowe muszą się zgadzać w obszarze na

zewnątrz kuli o zadanym promieniu Rc

- muszą się zgadzać pochodne logarytmiczne w punkcie Rc funkcji falowych wzorcowegoatomu i funkcji pseudofalowych

- całkowity ładunek elektryczny wewnątrz kuli o promieniu Rc musi być jednakowy dlaatomu wzorcowego i pseudoatomu (warunek zachowania normy)

- pochodna po energii pochodnej logarytmicznej w punkcie Rc musi być w obu wypadkachtaka sama

5.3 Generowanie pseudopotencjału

Dla wybranego atomu chcemy skonstruować zestaw funkcji Vs(r), Vp(r), Vd(r), ... który dla wa-lencyjnych stanów s, p, d, ... symulował by tenże atom. W pierwszym kroku rozwiązujemy zagad-nienia pojedynczego atomu (patrz poprzedni rozdział). Następnie wydzielamy stany walencyjne,

Page 15: Metody obliczeniowe ab initio w fizyce struktur atomowych

5 Pseudopotencjał 15

czyli te, które odpowiadają najwyżej położonym poziomom energii. Mając pełnoelektronowypotencjał efektywny oraz stany walencyjne stosujemy jeden ze schematów konstruowania po-średniego tzw. pseudopotencjału ekranowanego. Tutaj odniesiemy się do schematów Hamanna[] i Troulliera-Martinsa [].

Jeśli wyrazić naszą funkcję pseudofalową jako iloczyn ϕpslm(r) = [upsl (εpsl ; r)/r]Ylm(Ωr) to jejczęść radialna upsl (εpsl ; r) ma być rozwiązaniem (o najniższej energii) równania (42) odpowiada-jącym wartości własnej εpsl z pseudopotencjałem ekranowanym V PS,scr

l (r). Jeśli byśmy znali całąfunkcję pseudofalową, to moglibyśmy znależć pseudopotencjał ekranowany poprzez odwrócenierównania Schrodingera:

V ps,scrl (r) = εpsl −

l(l + 1)r2

+1

2upsl

d2

dr2upsl . (44)

Mamy więc pewną dowolność w konstruowaniu pseudopotencjału w obszarze r < rcl . Tutajjest miejsce na różne schematy konstruowania. Schemat Hamanna jest schematem „minimal-nym” czyli najprostszym spełniajacym wyżej wspomniane wymagania wraz z żądaniem abyfunkcje pseudofalowe nie miały węzłów. Schemat Troulliera-Martinsa wprowadza dodatkowewymagania, w szczególności dla zachowania się pseudopotencjału i jego pochodnych w zerze iw r = rcl . Pseudopotencjał typu Troulliera-Martinsa zgadza się z potencjałem pełnoelektrono-wym dla r > rcl dokładnie podczas gdy pseudopotencjał Hamanna „zgadza się” w sensie „zbliżawykładniczo”.

Następnym krokiem konstruowania pseudopotencjału jest tzw. ”odekranowanie”(unscreening)polegające na tym, że od ekranowanego pseudopotencjału odejmuje się sumę potencjału Har-treego i potencjału wymiany-korelacji V PS

Hxc(r) = V PSH (r) + V PS

xc (r) określonego dla elektronówwalencyjnych opisanych przez funkcjie pseudofalowe.

Dla dalszych zastosowań wygodnie jest rozdzielić każdy pseudopotencjał Vl na cześć lokalna(część wspólną, niezależną od l) i składnik nielokalny

Vl = Vlok + δVl. (45)

Zauważmy że dla r > rcl mamy δVl ≡ 0.Na koniec zapiszmy nasz pseudopotencjał jako „półlokalny”(semilocal) operator

V SL(r, r′) = V pslok(r)δ(r− r′) +

lmax∑

l=0

l∑

m=−lδV SL

l (r, r′)

= V pslok(r)δ(r− r′) +

lmax∑

l=0

l∑

m=−lY ∗lm(Ωr)δV SL

l (r)δ(r − r′)

r2Ylm(Ωr′). (46)

Powyższe warunki nie determinują „najlepszego” pseudopotencjału dla każdego ustalonego pier-wiastke. Jest tu pewna dowolność i ostateczny rezultat zależy od szczegółów jego wykorzystania.Mamy dwie przeciwne sobie przesłanki: z jednej strony domaganie się dużej dokładności symu-lacji atomu przez pseudopotencjał i uniwersalności tegoż każe zadawać mały promień obcięcia,rcl , (wtedy tylko mały obszar w pobliżu rdzenia jest „zafałszowany”). Z drugiej – staramy sie abypseudopotencjał był jak najbardziej gładki ponieważ chcemy go przedstawiać poprzez możliwiemało funkcji bazy (fal płaskich) czyli chcemy jak największego rcl .

Procedura „odekranowania” nie jest całkiem automatyczna. Pseudopotencjał jonowy, którystaramy się skonstruować, to taki, który wraz z dodanym potencjałem Hartreego i potencjałemwymiany-korelacji da nam pełny pseudopotencjał działający na elektrony walencyjne. Odekra-nowanie daje nam sumę powyższych trzech potencjałow a także gęstość ładunku i pseudogęstośćwalencyjną. Gdyby potencjał wymiany-korelacji był liniową funkcją gęstości elektronowej (a takjest w przypadku potencjału Hartreego) wówczas moglibyśmy łatwo wydzielić potencjał jono-wy. Niestety potencjał wymiany-korelacji nie jest liniową funkcją ładunku i potrzeba tu korekty

Page 16: Metody obliczeniowe ab initio w fizyce struktur atomowych

6 Reprezentacje równań Kohna-Shama. Układy periodyczne, baza fal płaskich. 16

zwanej poprawka rdzenia ze względu na nieliniowość – non-linear core-valence correction. Trud-ność tę omija się zwykle wprowadzając tzw. częściową gęstość rdzenia (partial core density),typowa postać której jest

ncorepartial =

A sin(Br)r

, r < r0,ncore(r), r > r0,

(47)

gdzie A i B są określone przez wartość gęstości rdzenia i jej pochodnej w punkcie r0 takim, wktórym ncore jest jeden do dwóch razy większa niż nvalence.

5.4 Uniwersalność (transferability) i twardość (hardness) pseudopotencjału.

Twardym potencjałem określa się sztywny zlokalizowany rdzeń jonowy który można z powo-dzeniem stosować w rozmaitych otoczeniach innych atomów. Z kolei „zmiękczanie” potencjału(polegające na zastąpieniu przebiegu o dużej zmienności, np. zawierającego miejsca o dużejwartości pochodnej – przebiegiem o małej zmienności) pogarszało uniwersalność stosowalnościpotencjału czyli pogarszało jego transferability. Te opisowe cechy (pseudo-)potencjału kwanty-fikuje się. Twardość opisuje stopień wierności z jaką pseudopotencjał odtwarza zmiany wartościenergii walencyjnych przy zmianach (zaburzeniach) potencjału, ładunku rdzenia czy innychmożliwych do pomyślenia. W sumie tworzenie pseudopotencjału wymaga wielu testów.

5.5 Pseudopotencjał jako separowalny operator

Kleinman i Bylander zauważyli, że można skonstruować separowalny operator pseudopotencja-łu tzn. taki, że część nielokalna pseudopotencjału δV (46) daje się, z dobrym przybliżeniem,zastąpić przez sumę iloczynów

∑i fi(r)gi(r′). Operator zapiszemy w sposób jawny w postaci:

VKB = Vlok +∑

lm

|ϕpslmδVl〉〈δVlϕpslm |〈ϕpslm |δVl |ϕpslm〉

. (48)

Funkcja 〈δVlϕpslm | jest operatorem rzutowania:

〈δVlϕpslm |ψ〉 =∫

dr δVl(r)ϕpslm(r)ψ(r). (49)

Działanie części nielokalnej takiego takiego operatora przedstawia formuła na jego elementmacierzowy:

〈ψi |δVKB |ψj〉 =∑

lm

〈ψi |δVlϕpslm〉1

〈ϕpslm |δVl |ϕpslm〉〈δVlϕpslm |ψj〉. (50)

Korzyść jaką osiągamy w takim ujęciu polega na tym, że współczynniki EKBl = 〈ϕpslm |δVl |ϕpslm〉−1

możemy policzyć raz na początku obliczeń samouzgodnionych; poza tym dla N -elementowej ba-zy funkcji ψi dla obliczeń (i przechowania w pamięci) elementów macierzowych w przypadkupseudopotencjału półlokalnego potrzeba około N2/2 elementów macierzowych 〈ψi |δV SL |ψj〉zaś dla postaci separowalnej potrzebna jest ilość operacji rzutowania 〈δVlϕpslm |ψ〉 rzędu N orazzwykłe mnożenia. Taki pseudopotencjał w działaniu na stany atomowe (pierwotne rozwiązaniaatomowego równania Schrodingera) zachowuje się prawidłowo lecz na stany o innych energiachmoże działać gorzej, mianowicie mogą wystąpić fałszywe stany własne hamiltonianu, tzw. „zja-wy” (ghost states) co kompletnie psuje prawidłowość obliczeń. Wypracowano procedurę modyfi-kowania pseudopotencjału taką, która eliminuje „zjawy” a sprowadzająca sie do odpowiedniegowyboru składnika lokalnego oraz odpowiednich wartości promieni obcięcia rdzenia.

6 Reprezentacje równań Kohna-Shama. Układy periodyczne, baza fal płaskich.

(W opracowaniu)

Page 17: Metody obliczeniowe ab initio w fizyce struktur atomowych

7 Dynamika układów atomowych. 17

7 Dynamika układów atomowych.

W rozdziale 2.3 przedstawiono koncepcję powierzchni energii swobodnej. Jest to energia cał-kowita układu jako funkcja wybranych geometrycznych stopni swobody. Minima tej funkcjiodpowiadają stanom równowagi statycznej, stabilnym (minimum globalne) lub matastabilnym(minimum lokalne). Jest to podstawowy krok w określeniu możliwych konfiguracji równowago-wych. Jednak sytuacja może się zmienić jeśli uwzględni się temperaturę układu. Jak wiadomoukład minimalizuje wówczas energię swobodną. Potrzebna jest zatem analiza termodynami-ki, a ta z kolei musi być poprzedzona analizą dynamiki na poziomie mikro czyli dynamikiatomów. W przybliżeniu adiabatycznym atomy poruszają się w polu PES, a zatem wyznacza-nie sił sprowadza się do obliczania gradientów PES. Wykorzystuje się przy tym twierdzenieHellmanna-Feynmana.

7.1 Dynamika Molekularna

Znajomość sił pozwala na symulację dynamiki molekularnej (MD - ’Molecular Dynamics’) po-przez numeryczne rozwiązanie zagadnienia wartości początkowej, i obserwację ewolucji trajek-torii atomów w przestrzeni fazowej. Choć od strony ideowej proste, są to obliczenia wymagającebardzo dużych mocy obliczeniowych. Alternatywą jest opisane dalej przybliżenie harmoniczne.

7.2 Przybliżenie harmoniczne

W przybliżeniu harmonicznym zakłada się, że siły są liniowymi funkcjami wychyleń atomów zpołożeń równowagi. Dynamika układu w takim przybliżeniu jest zawsze superpozycją niezależ-nych oscylacji harmonicznych (modów normalnych). Wektory polaryzacji oraz odpowiadająceim częstości tych oscylacji An, ωn znajduje się z rozwiązania zagadnienia własnego:

ΦA = ω2A (51)

gdzie

Φ = [Φij] =

1√

MiMj

∂2Etot(R)∂Ri∂Rj

(52)

jest macierzą dynamiczną układu. Liczba modów normalnych jest równa 3 × NA, gdzieNA jest liczbą atomów w układzie. W przypadku układów periodycznych, jak kryształ, macierzdynamiczna redukuje się, dzięki symetrii translacyjnej, do wymiaru 3x liczba atomów w komórceelementarnej, jednak elementy macierzy (a także jej wektory i wartości własne) są funkcjamiwektora falowego k z I strefy Brillouina (BZ - ’Brillouin Zone’). Mody normalne w takimprzypadku są falami płaskimi charakteryzowanymi przez związki dyspersyjne ω(k).

Wykorzystując twierdzenie Hellmanna-Feynmana uzyskuje się formułę na drugie pochodnecząstkowe energii całkowitej, potrzebne do konstrukcji macierzy dynamicznej:

∂2Etot(R)∂Ri∂Rj

= − ∂Fi∂Rj

=∫ ∂n(r,R)

∂Rj

∂V ej(r,R)∂Ri

(53)

+∫n(r,R)

∂2V ej(r,R)∂Ri∂Rj

dr +∂2V jj(R)∂Ri∂Rj

W formule tej występuje pochodna cząstkowa gęstości elektronowej po współrzędnej ato-mu ∂n(r,R)/∂Rj, której obliczanie już nie jest niestety tak łatwe jak obliczanie sił. Do jejwyznaczania w ramach DFT stosuje się teorię liniowej odpowiedzi lub rachunku zaburzeń.

Istnieje też inna metoda wyznaczania macierzy dynamicznej Φ, wykorzystująca fakt, żemacierz ta wiąże siły działające na atomy z wychyleniami:

Page 18: Metody obliczeniowe ab initio w fizyce struktur atomowych

8 Termodynamika układów atomowych. 18

Fi =∑

j

∂2Etot(R)∂Ri∂Rj

4(Rj) =∑

j

√MiMjΦij4(Rj) (54)

Wykonując obliczenia ab initio sił działających na atomy dla odpowiedniego zestawu wychy-leń i wykorzystując powyższy związek można zbudować układ równań, w którym niewiadomymibędą elementy macierzy dynamicznej. Uwzględnienie symetrii zwykle znacznie redukuje liczbęróżnych elementów tej macierzy i tak np. dla kryształów o symetrii kubicznej potrzebne jesttylko jedno wychylenie atomu w wybranym kierunku. Metoda zwana jest metodą bezpośrednią(Ref).

8 Termodynamika układów atomowych.

8.1 Termodynamika w skali nano

Rozważania prowadzone w tym rozdziale oparte będą na koncepcji zespołu kanonicznego. W ra-mach tej koncepcji układ będący w równowadze termicznej z termostatem realizuje mikrostanyz prawdopodobieństwem P zależnym tylko od ich energii:

P ∼ exp(−βE) (55)

gdzie β = 1/(kBT ), kB jest stałą Boltzmana a T temperaturą układu (i termostatu). Czyn-nikiem normującym prawdopodobieństwa jest 1/Z, gdzie

Z =∑

E

exp(−βE) (56)

to tzw. funkcja rozdziału (lub suma statystyczna). Jest to podstawowa wielkość w termody-namice statystycznej. Korzystając z relacji:

F = − ln(Z)β

(57)

(58)

gdzie F jest energią układu, poprzez związki termodynamiczne można wyznaczyć wszystkieinne charakterystyki. Można także obliczać wartości średnie pewnych parametrów zależnych odenergii (x(E)), jako wartości oczekiwane (x), uzyskując w ten sposób ich zależności tempera-turowe (uśrednianie po zespole kanonicznym):

x(T ) = 〈x〉 = − 1Z

E

x(E) exp(−βE) (59)

Często mamy doczynienia z sytuacją gdy z różnych powodów energię w wyrażeniu (56)można rozseparować, tzn. przedstawić jako sumę pewnych niezależnych składowych. Energięmożna rozseparować np. ze względu na stopnie swobody, np.:

• pędowe i konfiguracyjne stopnie swobody w układach klasycznych,

• translacyjne oraz rotacyjne i oscylacyjne stopnie swobody w cząsteczkach,

• oscylacyjne mody normalne w układach wieloatomowych w przybliżeniu harmonicznym,

• w sytuacji, gdy potencjał jest superpozycją potencjału, np. dla 3 kierunków kartezjańskich.

Page 19: Metody obliczeniowe ab initio w fizyce struktur atomowych

8 Termodynamika układów atomowych. 19

Szczególnym przypadkiem jest sytuacja, gdy układ można podzielić na słabo oddziałującepodukłady, tzn. gdy ich energia oddziaływania jest mała w porównaniu z energią wzbudzeńsamych podukładów. Przykładem jest tu gaz doskonały, który jest układem słabo oddziałują-cych identycznych podukładów. Do dalszych rozważań przyjmiemy, że energia separuje się napewien składnik Ei i resztę Er:

E = Ei + Er (60)

Wówczas funkcja rozdziału staje się iloczynem:

Z = ZiZr (61)

gdzie

Zi =∑

Ei

exp(−βEi) (62)

Zr =∑

Er

exp(−βEr) (63)

oraz, definiując Fi(r) = − ln(Zi(r))β

,:

F = Fi + Fr (64)

Nietrudno pokazać, że jeśli jakiś parametr układu zależy tylko od energii Ei wówczas uśred-nianie po całym zespole kanonicznym upraszcza się do uśredniania po składowej energii Ei:

xi(T ) = − 1Zi

Ei

xi(E) exp(−βEi) (65)

W takim sensie możemy mówić o termodynamice pojedynczej cząstki w gazie doskona-łym (np. o rozszerzalności cieplnej pojedynczego dimera gazu doskonałego) lub termodynamicepewnego, wybranego stopnia swobody (np. zależności temperaturowej amplitudy wybranegomodu normalnego w krysztale). W takim też sensie można mówić o termodynamice układówatomowych o rozmiarach rzędu nanometrów, istotnych w nanotechnologiach.

Im mniejszy jest układ, którego termodynamikę w wyżej opisanym sensie chcemy badać,tym istotniejsze są fluktuacje czyli odchylenia od wartości średniej. Jedną z możliwych miarfluktuacji jest odchylenie standardowe:

δ(x) = [〈(x− 〈x〉)2〉]1/2 (66)

W przypadku układów atomowych w nanoskali fluktuacje mają szczególnie istotne znaczenie.

8.2 Koncepcja powierzchni energii swobodnej (FES).

W rozdziale 2.3 opisano koncepcję powierzchni energii potencjalnej (PES) jako funkcji pew-nych wybranych geometrycznych stopni swobody, zawierającej informację o stanach równowagistatycznej a także dynamice układu. Uwzględnienie temperatury może istotnie zmienić własno-ści strukturalne i termodynamiczne układów. Energia swobodna jest wielkością, którą układminimalizuje przy braku fizycznych więzów geometrycznych, a także jest punktem wyjścia wobliczeniach charakterystyk termodynamicznych. Ta funkcja powinna więc być punktem wyj-ścia wszelkich badań. Wydaje się możliwe uogólnienie koncepcji PES na powierzchnię energiiswobodnej (FES - ’Free Energy Surface’).

Przypuśćmy, że wektor X charakteryzuje uogólnione współrzędne pewnego zestawu zamro-żonych (zewnętrznych, usztywnionych, związanych, unieruchomionych) stopni swobody układu.Mogą to być np.:

Page 20: Metody obliczeniowe ab initio w fizyce struktur atomowych

8 Termodynamika układów atomowych. 20

• zmienne strukturalne w krysztale (np. długości wektorów prymitywnych i kąty pomiędzynimi)

• składowe tensora odkształceń

• wybrane współrzędne atomów, np. kartezjańskie lub wzdłuż wektora polaryzacji wybra-nego modu normalnego

• wybrane odległości międzyatomowe na powierzchni

• współrzędne planarne atomu adsorbatu na powierzchni

• odległości pomiędzy wybranymi atomami w złożonej cząsteczce

przy czym założymy, że liczba zamrożonych stopni swobody jest znacznie mniejsza od liczbywszystkich stopni swobody. Energia układu jest sumą energii statycznej Es(X), czyli energiina powierzchni PES oraz energii związanej z dynamiką względem uwolnionych stopni swobodyEd(X):

E = Es(X) + Ed(X). (67)

Funkcja rozdziału przyjmie postać:

Z =∑

Ed

exp(−β[Es + Ed)] = exp(−βEs)Zd, (68)

w której wydzielono wkład dynamiczny do funkcji rozdziału Zd.Energia swobodna, oprócz tego, że jest funkcją temperatury, staje się też funkcją uogólnio-

nych współrzędnych X:

F (T,X) = Es(X)− 1β

ln[Zd(T,X)], (69)

którą nazwiemy powierzchnią energii swobodnej (FES). Dwa kolejne gradienty FES wzglę-dem współrzędnych uogólnionych X:

Pi(T,X) =∂F (T,X)∂Xi

(70)

oraz

Kij(T,X) =∂2F (T,X)∂Xi∂Xj

(71)

mają sens odpowiednio uogólnionych sił (naprężeń) oraz stałych sprężystości.Powierzchnia energii swobodnej wyznaczona z zasad pierwszych może być podstawowym

źródłem informacji o układach z punktu widzenia ich własności strukturalnych. Jej minimawyznaczają (zależne od temperatury) stany równowagi układów, znikanie drugich pochodnychmoże wskazywać na przemianę fazową (utrata stabilności).

Możliwa jest taka sytuacja, że występuje fizyczna przyczyna zamrożenia pewnego stopniaswobody w układzie, np. powierzchnia kryształu lub cienka warstwa może być naprężona przezpodłoże (kryształ lity). W takim przypadku w stanie równowagi układ minimalizuje energiąswobodną Gibbsa, którą w przypadku uogólnionych współrzędnych X można zdefiniować jako:

G = F −∑i

XiPi (72)

Page 21: Metody obliczeniowe ab initio w fizyce struktur atomowych

9 Algorytmy numeryczne. 21

8.3 Metody obliczania funkcji rozdziału.

Znanych jest kilka metod obliczania funkcji rozdziału ab initio lub z wykorzystaniem potencja-łów empirycznych. Są to:

• dynamika molekularna

• metoda Monte Carlo (całkowanie po konfiguracyjnych stopniach swobody)

• przybliżenie harmoniczne

W przybliżeniu harmonicznym układ wieloatomowy jest termodynamicznie równoważnyukładowi niezależnych oscylatorów harmonicznych, tzn. funkcja rozdziału jest iloczynem funkcjirozdziału pojedynczego oscylatora:

Z =∏

i

Zi (73)

gdzie Zi dla oscylatora kwantowego ma postać:

Zi =exp(−βhωi/2)

1− exp(−βhωi) (74)

a energia swobodna jest sumą energii pojedynczych oscylatorów i energii statycznej całegokryształu.

F =∑

i

Fi + Es (75)

9 Algorytmy numeryczne.

9.1 Metoda dynamiki molekularnej Car-Parinello

(w opracowaniu)

9.2 Metoda najszybszego spadku (’Steepest descent’)

(w opracowaniu)

9.3 Metoda gradientów sprzężonych

(w opracowaniu)

9.4 Algorytmy dynamiki molekularnej

(w opracowaniu)

9.5 Szybka transformata Fouriera

Wiemy, że każdą funkcję f(x) ciągłą na odcinku [0, 2π] spełniającą warunek f(0) = f(2π)można przedstawić jako szereg trygonometryczny:

f(x) =ao2

+∞∑

k=1

ak cos kx+ bk sin kx (76)

Page 22: Metody obliczeniowe ab initio w fizyce struktur atomowych

9 Algorytmy numeryczne. 22

to znaczy pomiędzy funkcją f(x) a ciągiem wspólczynników ak, bk istnieje wzajemnie jedno-znaczna odpowiedniość. W jedną stronę określa ją powyższe równanie, zaś w drugą formułyEulera-Fouriera:

ak =1π

∫ 2π

0f(x) cos kxdx, bk =

∫ 2π

0f(x) sin kxdx. (77)

Funkcje trygonometryczne 1, cosx, sinx, cos 2x, sin 2x, ... cos kx, sin kx, ... tworzą bazę ortogo-nalną przestrzeni wektorowej funkcyjnej funkcji ciągłych na odcinku [0, 2π] gdzie iloczyn ska-larny dwóch funkcji definiuje się jako

(f1, f2) =∫ 2π

0f1(x)f2(x)dx. (78)

W praktyce obliczeniowej mamy do czynienia raczej z funkcjami określonymi na dyskretnymzbiorze punktów. Załóżmy, że funkcja f(x) jest zadana poprzez wartości fi w równoodległychpunktach, których jest parzysta ilość równa n:

xj =2jπn, fj = f(xj), j = 0, 1, ...n− 1. (79)

Można łatwo sprawdzić, że ortogonalność całkowa (78) ma swój odpowiednik w ortogonalnościna dyskretnym zbiorze xj, co ostatecznie pozwala przybliżyć naszą stablicowaną funkcję wpostaci wielomianu trygonometrycznego

wn(x) =ao2

+n/2−1∑

k=1

(ak cos kx+ bk sin kx) + an/2 cosmx (80)

ze wspólczynnikami

ak =2n

n−1∑

j=0

f(xj) cos kxj, bk =2n

n−1∑

j=0

f(xj) sin kxj. (81)

W postaci zespolonej powyższe wzory są następujące:

wn(x) =n−1∑

k=0

ck exp(ikx), i =+√−1 (82)

ck =1n

n−1∑

j=0

f(xj) exp(−ikxj). (83)

Metoda szybkiej transformaty Fouriera (FFT,fast Fourier transform) polega na zredukowa-niu ilości wykonywanych operacji wyliczania wartości funkcji (w tym wypadku funkcji wykład-niczej). Metodę tę przedstawimy dla szczególnego przypadku, tak jak to uczynili jej wynalazcy,Cooley i Tukey. Rozważmy sytuację w której nasza funkcja oryginalna jest zadana w n punktachi n jest potęgą dwójki czyli n = 2p. Jeśli oznaczymy

w = exp(−2πin

), aj =1nf(

2πjn

) (84)

to wzór (83) przyjmie postać

ck =n−1∑

j=0

ajwk·j. (85)

Widać że po pierwsze wystarczy tylko raz obliczyć wartość funkcji wykładniczej zaś po drugie– odpowiednie przeprowadzenie operacji wyliczania współczynników grupujące parzyste i nie-parzyste wskażniki j pozwala na obliczenie transformaty Fouriera (metodą szybką) przy użyciu

Page 23: Metody obliczeniowe ab initio w fizyce struktur atomowych

9 Algorytmy numeryczne. 23

2n log2 n działań na liczbach zespolonych co ogromnie zmniejsza czas obliczeń. Obecne algoryt-my FFT są nieco bardziej wyrafinowane i obsługują nie tylko przypadek Cooleya-Tukeya, alenajczęściej przypadek n = 2p × 3q × 5r. Warunkiem zastosowania FFT jest możliwość wyborun w postaci iloczynu potęg małych liczb pierwszych.

9.6 Metoda specjalnych punktów k Monkhorsta-Packa

Metoda specjalnych punktów k Monkhorsta-Packa jest metodą całkowania funkcji posiadającejperiodyczność nieskończonej sieci po komórce elementarnej. W obliczeniach ’ab initio’ stosujesię ją do znajdowania gęstości elektronowej w układach periodycznych. Wyznaczanie gęstosciwymaga całkowania po I strefie Brillouina kwadratów modułów obsadzonych stanów Kohna-Shama (oraz sumowania po pasmach energetycznych).

Rozważamy sieć zdefiniowaną poprzez prymitywne translacje:

~R = R1~a1 +R2~a2 +R3~a3 (86)

Odpowiadająca jej sieć odwrotna rozpięta jest na wektorach:

~b1 =2πΩ~a2 × ~a3, ~b2 =

2πΩ~a3 × ~a1, ~b3 =

2πΩ~a1 × ~a2 (87)

gdzieΩ = ~a1 · (~a2 × ~a3) (88)

jest objętością komórki elementarnej.Definiujemy ciąg liczb:

ur =2r − q − 1

2qr = 1, 2, 3, . . . , q (89)

gdzie q (naturalne) będzie determinowało liczbę specjalnych punktów k. Wyjściowy zbiór punk-tów k definiujemy następująco:

~kprs = up~b1 + up~r2 + up~s3 (90)

Otrzymuje się w ten sposów q3 różnych punktów k, rozmieszczonych równomiernie w strefieBrillouina.

Definiujemy także:

Am(~k) = N− 1

2m

|~R|=Cmei~k·~R (91)

gdzie sumowanie przebiega po wektorach sieci należących do tej samej gwiazdy (przechodzącychw siebie poprzez operacje symetrii grupy punktowej kryształu), Cm oznacza długość wektorówz danej gwiazdy i zmienia się w sposów rosnący od C1 = 0, a Nm oznacza liczbę wektorównależących do danej gwiazdy. Należy zauważyć, że Am(k) są niezmiennicze względem operacjisymetrii grupy punktowej kryształu. Stanowią one także ortogonalną bazę w przestrzeni k :

BZd~kA∗m(~k)A∗n(~k =

8π3

Ωδmn (92)

Tak, że dowolną funkcję f(~k), posiadającą symetrię sieci odwrotnej można przedstawić w bazieAm(~k):

f(~k) =∞∑

m=1

fmAm(~k) (93)

Page 24: Metody obliczeniowe ab initio w fizyce struktur atomowych

9 Algorytmy numeryczne. 24

gdzie

fm =Ω

8π3

BZd~kA∗m(~k)f(~k) (94)

Rozważmy następującą wielkość:

Smn(q) =1q3

q∑

p,r,s=1

A∗m(~kprs)A∗n(~kprs) (95)

Po podstawieniu do powyższego wyrażenia definicji (??) można je przekształcić do postaci:

Smn(q) = (NmNn)−12

Nm∑

a=1

Nn∑

b=1

3∏

j=1

W abj (q) (96)

gdzie:

W abj (q) =

1q

q∑

r=1

e(πq

)(2r−q−1)(Rbj−Raj ) (97)

We wzorze (96) sumowanie po a i b odbywa się po wszystkich wektorach należących dogwiazd odpowiednio m i n. Wyrażenie W ab

j może przyjmować następujące wartości:

W abj (q) =

1 dla |Rbj −Ra

j | = 0, 2q, 4q, . . .(−1)q+1 dla |Rb

j −Raj | = q, 3q, 5q, . . .

0 dla |Rbj −Ra

j | inne(98)

Należy pamiętać, że q oraz Raj to liczby całkowite. Nałożymy następnie ograniczenie:

|Raj | <

q

2, |Rb

j| <q

2, j = 1, 2, 3 (99)

Co prowadzi do:W abj (q) = δ(Ra

j , Rbj) (100)

a z zależności (96):Smn = δmn (101)

Oznacza to, że wszystkie funkcje Am(~k), które spełniają warunek (99) są ortonormalne nadyskretnym zbiorze punktów kprs w I strefie Brillouina. Liczba tych funkcji jest tym większaim większa jest liczba q.

Wykorzystanie symetrii punktowej sieci prowadzi do znacznego zredukowania sumy we wzo-rze (95):

Smn(q) =1q3

P (q)∑

j=1

wjA∗m(~kj)An(~kj) (102)

gdzie P (q) jest zależną od symetrii liczbą punktów kj, ze zbioru kprs znajdujących się w nie-redukowalnej części strefy Brillouina, a wj jest współczynnikiem wagowym równym stosunkowirzędu pełnej grupy symetrii do rzędu grupy wektora falowego kj. Inaczej mówiąc, ponieważoperacje symetrii punktowej nie zmieniają wartości wyrazów w szeregu (95), sumowanie powektorach ze zbioru kprs, różnych lecz związanych operacjami symetrii punktowej, możnazastąpić mnożeniem przez czynnik wj.

Przypuśćmy, że chcemy całkować pewną funkcję f(~k), która jest całkowicie symetrycznai periodyczna w przestrzeni k. Jak pokazano już wcześniej może ona być formalnie rozwiniętaw bazie Am(~k):

f(~k) =∞∑

m=1

fmAm(~k) (103)

Page 25: Metody obliczeniowe ab initio w fizyce struktur atomowych

10 Przykłady zastosowania koncepcji PES i FES 25

gdzie, z powodu ortogonalności Am(~k) w strefie Brillouina,

fm =Ω

8π3

BZd~kA∗m(~k)f(~k) (104)

Całka f(~k) po całej strefie Brillouina jest związana z pierwszym współczynnikiem rozwinięcia:∫

BZd~kA∗mf(~k) =

8π3

Ωf1 (105)

Jeśli rozwinięcie (103) ograniczymy do gwiazd spełniających warunek (99), czyli reprezenta-cję funkcji f(~k) ograniczymy do jej rzutu na przestrzeń rozpietą na gwiazdach spełniającychwarunek (99), to wartości współczynników fm dane są znacznie prostszą zależnością:

fm =1q

P (q)∑

j=1

wjf(~kj)Am(~kj) (106)

Współczynniki te oczywiście różnią się od dokładnych, z powodu ograniczenia przestrzeni.Otrzymujemy w ten sposób przybliżoną reprezentację funkcji f(~k):

f(~k) =NG∑

m=1

fmAm(~k) (107)

gdzie NG jest liczbą gwiazd spełniających warunek (99).Całkowanie po I strefie Brillouina funkcji f(~k), jak w (105), z wykorzystaniem reprezentacji

(107) będzie obarczone błędem:

εBZ =∫

BZd~k[f(~k)− f(~k)] =

m>1

fmN12mSm1(q) (108)

gdzie

Sm1(q) =

(−1)q−1q

(R1+R2+R3) dla R1−R3q

= integer0 dla innych

(109)

10 Przykłady zastosowania koncepcji PES i FES

A. Kryształ.Najprostszym i znanym przypadkiem zastosowania koncepcji powierzchni energii swobodnej

jest przybliżenie kwaziharmoniczne dla kryształu, w którym związanym stopniem swobody jestobjętość, a dynamika i termodynamika układu traktowana jest w przybliżeniu harmonicznym.Ciśnienie jest uogólnioną siłą a moduł sprężystości objętościowej uogólnioną stałą sprężystości.Położenie minimum FES zależy od temperatury i opisuje rozszerzalność termiczną kryształu.Z kolei znikanie drugiej pochodnej po objętości (moduł sprężystości objętościowej dążący dozera) oznacza utratę stabilności mechanicznej (przegrzanie, stan bliski topnieniu).

B. Powierzchnia.Przykłady PES.C. Atom adsorbatu.Dyskusja.

Literatura

[1] P. A. M. Dirac. Proc.Roy.Soc (London), 123:714.

Page 26: Metody obliczeniowe ab initio w fizyce struktur atomowych

10 Przykłady zastosowania koncepcji PES i FES 26

[2] M. C. Payne, M. P. Teter, D. C. Allan, T. A. Arias, and J. D. Joannopoulos. Rev. Mod.Phys., 64:1045, 1992.

[3] P. Hohenberg and W. Kohn. Phys.Rev.Lett., 48:1425, 1965.

[4] W. Kohn and L. J. Sham. Phys. Rev., 140:A1133, 1965.

[5] R. Car and M. Parrinello. Phys. Rev. Lett., 55:2471, 1985.

[6] A.Oganov. http://olivine.ethz.ch/, 2004.

[7] X. Gonze, J.-M. Beuken, R. Caracas, F. Detraux, M. Fuchs, G.-M. Rignanese, L. Sindic,M. Verstraete, G. Zerah, F. Jollet, M. Torrent, A. Roy, M. Mikami, Ph. Ghosez, J.-Y. Raty,and D.C. Allan. Computational Materials Science, 25:478–492, 2002.