Co to takiego analiza niestandardowa

60
1 ################################################################################ Co to takiego analiza niestandardowa ? W. A. Uspienskij Tytul oryginalu : „Что такое нестандартный анализ ?” Moskwa Nauka 1987 ************************************************************************************************ Tlumaczenie : R. Waligóra Pierwsze tlumaczenie : 2014 Ostatnia modyfikacja : 2014-03-30 Tlumaczenie calości książki. //////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// Wstęp ogólny 1) Skróty i oznaczenia zastosowane w tlumaczeniu (wlasne ). Dopiski wlasne oznaczono symbolami (* ... *) ************************************************************************************************ Przedslowie Slowo „niestandardowa” w tytule niniejszej książki, wywoluje zapewne pewien naturalny sprzeciw. A co to jest jeszcze do tego „analiza niestandardowa” ? Czyżby standardowa analiza matematyczna, wiernie slużąca naszym nauczycielom, przestala nas już zadowalać ? Czy należy odejść od zgromadzonej w przeciągu trzech stuleci bogactwa ? Wszystkie takie pytania zmuszają nas do wyjaśnienia miejsca analizy niestandardowej we wspólczesnej matematyce. Miejsce to jest nader skromne. Analiza niestandardowa nie ma zamiaru zastępować analizy standardowej. Wszystkie istniejące „standardowe” wyniki pozostają w mocy. Oprócz tego, analiza niestandardowa nie pretenduje, aby otrzymać zasadniczo nowe wyniki – wszystkie wyniki otrzymane za pomocą jej metod, mogą być dowiedzione również za pomocą standardowych metod. Zatem, po co jest nam ona potrzebna ? Można powiedzieć, ze odróżnienie niestandardowego sposobu wykladu od standardowego polega tylko na „wyrażeniach, które przy naszej metodzie są bardziej proste i bardziej dogodne dla sztuki wykladu” ( Leibniz ) Trudno powiedzieć, dlaczego tak jest – doświadczenie w zastosowaniu analizy niestandardowej póki, co jest jeszcze male. Jednakże jest to istotnie prawdziwe ( nawet w niewielkim stopniu ), to analiza niestandardowa zasluguje na naszą uwagę. Interesującym jest zauważyć, że analiza niestandardowa – ta „modna nowinka” – w istocie nie jest taką nowością. Jego początki można wskazać w tym czasie, w którym rodzila się standardowa analiza matematyczna – w pobliżu końca XVII wieku. Problem w tym, że sama analiza matematyczna pojawila się – w pracach jednego ze swoich twórców – Leibniza – w tej formie, która niestety jest obecnie bliższa temu, co obecnie nazywa się „analizą niestandardową” niż wspólcześnie rozumianej „analizie standardowej” ( zobacz również paragraf 12 ) W istocie, zatem nowość jest tym, co zapomniano dawniej. W niniejszej książce próbujemy pokazać, na czym polega istota analizy niestandardowej, dając czytelnikom możliwość wyrobienie sobie pojęcia o tym, na ile analiza niestandardowa może okazać się użyteczna.

Transcript of Co to takiego analiza niestandardowa

Page 1: Co to takiego analiza niestandardowa

1

################################################################################

Co to takiego analiza niestandardowa ? W. A. Uspienskij Tytuł oryginału : „Что такое нестандартный анализ ?” Moskwa Nauka 1987 *************************************************** ********************************************* Tłumaczenie : R. Waligóra Pierwsze tłumaczenie : 2014 Ostatnia modyfikacja : 2014-03-30 Tłumaczenie całości książki. ////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

Wstęp ogólny 1) Skróty i oznaczenia zastosowane w tłumaczeniu (własne ). Dopiski własne oznaczono symbolami (* ... *) *************************************************** ********************************************* Przedsłowie Słowo „niestandardowa” w tytule niniejszej książki, wywołuje zapewne pewien naturalny sprzeciw. A co to jest jeszcze do tego „analiza niestandardowa” ? Czyżby standardowa analiza matematyczna, wiernie służąca naszym nauczycielom, przestała nas już zadowalać ? Czy należy odejść od zgromadzonej w przeciągu trzech stuleci bogactwa ? Wszystkie takie pytania zmuszają nas do wyjaśnienia miejsca analizy niestandardowej we współczesnej matematyce. Miejsce to jest nader skromne. Analiza niestandardowa nie ma zamiaru zastępować analizy standardowej. Wszystkie istniejące „standardowe” wyniki pozostają w mocy. Oprócz tego, analiza niestandardowa nie pretenduje, aby otrzymać zasadniczo nowe wyniki – wszystkie wyniki otrzymane za pomocą jej metod, mogą być dowiedzione również za pomocą standardowych metod. Zatem, po co jest nam ona potrzebna ? Można powiedzieć, ze odróżnienie niestandardowego sposobu wykładu od standardowego polega tylko na „wyrażeniach, które przy naszej metodzie są bardziej proste i bardziej dogodne dla sztuki wykładu” ( Leibniz ) Trudno powiedzieć, dlaczego tak jest – doświadczenie w zastosowaniu analizy niestandardowej póki, co jest jeszcze małe. Jednakże jest to istotnie prawdziwe ( nawet w niewielkim stopniu ), to analiza niestandardowa zasługuje na naszą uwagę. Interesującym jest zauważyć, że analiza niestandardowa – ta „modna nowinka” – w istocie nie jest taką nowością. Jego początki można wskazać w tym czasie, w którym rodziła się standardowa analiza matematyczna – w pobliżu końca XVII wieku. Problem w tym, że sama analiza matematyczna pojawiła się – w pracach jednego ze swoich twórców – Leibniza – w tej formie, która niestety jest obecnie bliższa temu, co obecnie nazywa się „analizą niestandardową” niż współcześnie rozumianej „analizie standardowej” ( zobacz również paragraf 12 ) W istocie, zatem nowość jest tym, co zapomniano dawniej. W niniejszej książce próbujemy pokazać, na czym polega istota analizy niestandardowej, dając czytelnikom możliwość wyrobienie sobie pojęcia o tym, na ile analiza niestandardowa może okazać się użyteczna.

Page 2: Co to takiego analiza niestandardowa

2

*************************************************** ********************************************* Rozdział 1 Kilka przykładów. Czy gryfy i jednorożce należą do parzystokopytnych ? Jak zbudowane są ich układy krwionośne ? Jak przebiega reakcja chemiczna pomiędzy kamieniem filozoficznym i flogistonem ? Czytelnik zaznajomiony w poważnymi naukowymi pracami, analizę takich i podobnych zagadnień uzna za oburzające. Jednakże poszczególne prace związane z analizy niestandardowej mogą wywierać na nieprzygotowanym czytelniku ( nawet na przygotowanym czytelniku, ale stricte w obszarze standardowej matematyki ) podobne wrażenia. Oto kilka przykładów.

Przykład 1. Obliczmy pochodną funkcji y = x2. Nadajmy argumentowi x przyrost dx, przechodząc od punktu x do punktu

x + dx. Wyjaśnijmy na ile przy tym zmienia się wartość samej funkcji. W punkcie x jest ona równa x2. W punkcie x + dx równa się ona :

( x + dx ) = x2 + 2x dx + (dx )2 Zatem, zmienia się ona o :

dy = 2x dx + (dx )2 (rys. 1 )

Rys. 1 Stosunek przyrostu dy funkcji y = x do przyrostu dx argumentu x jest równy :

Jeśli dx jest nieskończenie małe ( zapisując dx ≈ 0 ), to człon dx w sumie 2x + dx można zaniedbać, zatem szukana pochodna ( jako stosunek przyrostu funkcji do przyrostu argumentu , jeśli ten ostatni jest nieskończenie mały ) jest równa 2x. Przykład 2. W analogiczny sposób obliczmy pochodna funkcji y = √x. Przyrost dy jest równy √x + dx – √x, iloraz dy/dx jest równy :

Biorąc dx nieskończenie małym, iż pochodna będzie równa : 1/ √x + √x = 1/2√x Przykład 3. Przykład ten odnosi się nie do obliczenia czegoś tam, a do definicji pojęcia całki. Tak, więc, co to jest całka : b

∫ f(x) dx a od funkcji f po odcinku [a, b] ? Rozbijmy odcinek [a, b] na nieskończenie dużą liczbę H, części o nieskończenie małych długościach dx ( tak, że b = a + Hdx ).

Page 3: Co to takiego analiza niestandardowa

3

Rozpatrzmy dalej sumę :

składającą się z nieskończonej liczby członów, a dokładnie z H członów. Wartość tej sumy, pomnożona przez dx będziemy przyjmowali jako powyżej określoną całkę. Przykład 4. Dowód równomiernej ciągłości funkcji, ciągłej na odcinku. Ciągłość funkcji f w punkcie x oznacza, że dla dowolnego nieskończenie bliskiego punktu x’ wartość f(x’) jest nieskończenie bliska wartości f(x), mówiąc inaczej, dla każdego x’ : x' ≈ x ⇒ f(x’) ≈ f(x) (1) gdzie zapis α ≈ β oznacza nieskończona bliskość liczb α i β. Ponieważ z definicji funkcja f jest ciągła w każdym punkcie x, to (1) jest spełnione dla wszystkich x i dla wszystkich x’. Zatem, nieskończona bliskość dowolnych dwóch argumentów pociąga za sobą nieskończoną bliskość wartości funkcji, a to oznacza ciągłość równomierną. Przykład 5. Budowa zbioru niemierzalnego. Każdą liczbę rzeczywistą x, spełniającą nierówność 0 ≤ x ≤ 1, rozłożymy jako nieskończony rozkład binarny. W celu zapewnienia jednoznaczności wykluczamy rozkłady o nieskończonej liczbie kolejnych jedynek. Ustalmy dowolną nieskończenie dużą liczbę naturalną ν i wybieramy te liczby rzeczywiste, dla których ν-człon rozkładu jest równy 1. Zbiór wszystkich wybranych w ten sposób liczb rzeczywistych jest niemierzalny według Lebesgue’a. Przykład 6. Rozkład sinusa i nieskończony iloczyn. Wychodząc od równości :

„ex = ( 1 + x /i )i (2) gdzie i oznacza nieskończenie dużą liczbę” ( łac. Infinitus – nieskończony, nie mylić z oznaczeniem jednostki urojonej łac. Imaginarus – wyobrażony ), „rozpatrzymy wyrażenie :

ex – e–x = ( 1 + x /i )i – ( 1 – x /i )i „ (3)

Dalej wykorzystamy podzielność członu an – z2n na człony postaci a2 – 2az cos(2kπ/n) + z2, przy czym zakładamy : a = ( 1 + x/i ) , z = ( 1 – x/i ) , n = i. „Ponieważ wielkość 2kπ/i jest nieskończenie mała, to :

cos(2k/i)π = 1 – (2k2/i2 )π2” (4)

Dlatego funkcja ex – e–x będzie podzielna przez 1 + (x2/k2π2 ) – (x2/i2 ), gdzie człon x2/i2 może być opuszczony bez żadnej obawy, ponieważ nawet po pomnożeniu przez i pozostaje on nieskończenie mały. Oprócz tego, pierwszy czynnik będzie równy x. Na tej podstawie po ułożeniu takich czynników w określonej kolejności otrzymamy :

itd.” Dokonując w tożsamości 95) podstawienia x = z√–1, ostatecznie otrzymujemy :

Student matematyki, którego odpowiedź na egzaminie analizy matematycznej zawierałaby metodę przedstawioną w dowolnym z powyższych przykładów, zapewne otrzymałby ocenę niedostateczną. Jednakże obliczenia pochodnej wykorzystany w przykładach 1 i 2, pokazany jest w paragrafie 7, rozdziału 2 książki Martina Davis’a „Analiza niestandardowa w zastosowaniach” [3] ( Martin Davis - Applied nonstandard analysis ; John Wiley & Sons 1977 ), przykłady 4 I 5 wzięto również z tej książki ( twierdzenia 5.8 i paragraf 9, rozdział 2 ), a definicja całki ( z pewnymi nieistotnymi zmianami i pewną nieścisłością, którą poprawimy w paragrafie 8 ) z książki [38] Keisler H. J. Elementary Calculus. Przykład 6 odtwarza rozumowanie Eulera, zawarte w paragrafie 155 – 158 pierwszego tomu jego pracy „Introductio in Analysin infinitorum (1784 ) Tekst wzięty w cudzysłów przy przedstawieniu przykładu 6 należy bezpośrednio do Eulera, wzór kończący (6) jest znanym wzorem Eulera dla sinusa i jest on słuszny przy dowolnym zespolonym z. Jeśli przykłady 1 i 2 chociaż mogą szokować pewną naiwną nieścisłością, ale wszystko w nich odpowiada intuicji, przykład 4 jest na pierwszy wzgląd zdrowemu rozsądkowi - pozostaje niezrozumiałe, dlaczego podanego rozumowania nie

Page 4: Co to takiego analiza niestandardowa

4

można zastosować nie do odcinka, a powiedzmy do interwału, dla którego, jak wiadomo, twierdzenie o równomiernej ciągłości jest niesłuszne. Przykłady 3 i 6 ( jeśli nie wiemy, ze ostatni z nich należy do Eulera ) stwarzają jeszcze dziwniejsze wrażenie, a przykład 5 wydaje się po prostu abrakadabrą. Analiza niestandardowa, prawie cała składa się z podobnej abrakadabry, ale mającej w jej ramach ścisły matematyczny sens. ( dla przykładów 1 – 6 sens ten skomentujemy w rozdziale 8 ). W szczególności pozwala ona z nowego punktu widzenia spojrzeć na wiele analiz prowadzonych w ramach klasycznej analizy matematycznej, które wydają się nieścisłe, ale które doprowadziły do postępu, a następnie na drodze niewielkich uściśleń sprawić, aby stały się one zadowalającymi z perspektywy współczesnych kryterii ścisłości. Rozdział 2 Co to takiego – nieskończenie małe ? Pierwsze, co należy uściślić w podanych w poprzednim rozdziale „niestandardowych” rozważaniach – to pojęcie wielkości nieskończenie małej. Jeden z zasadniczych momentów analizy niestandardowej związany jest z tym, że nieskończenie małe rozpatrywane są nie jak wielkości zmienne ( tj. jako funkcje, dążące do zera, jak uczą nas współczesne podręczniki ), a jak wielkości stałe. Warto zauważyć, ze takie podejście jest zgodny zarówno z intuicją badacza, jak i z rzeczywista historią narodzin analizy matematycznej. Co tyczy się intuicji, to wystarczy otworzyć dowolny podręcznik fizyki, aby natknąć się na nieskończenie małe przyrosty, nieskończenie małe objętości itp. Wszystkie te wielkości są rozumiane nie jako zmienne, a po prostu jako wielkości bardzo małe – prawie równe zero. Byłoby nieprawidłowe przyjmować, iż tego typu analizy intuicyjne są obecne tylko w podręcznikach do fizyki. Czy bowiem matematycy nie przyjmują ( poglądowo) element długości ds jako „nieskończenie małą drogę” ? Matematyk, zestawiając odpowiednie równanie różniczkowe, powie, że w nieskończenie małym czasie dt punkt przebył nieskończenie małą drogę ds, a ilość materii radioaktywnej zmienia się o nieskończenie małą wielkość dN. Co zaś tyczy historii analizy matematycznej, to w najbardziej jaskrawej formie przedstawione podejście pojawiło się u jednego z twórców tej dyscypliny – Leibniza. W maju 1984 roku upłynęło 300 lat od dnia, w którym symbole dx i dy po raz pierwszy pojawiły się na stronach publikacji matematycznej, a dokładnie na stronach artykułu Leibniza [7] Właśnie to Leibniz lepiej niż inni odczuwał wielkości nieskończenie małe, jako wielkości stałe ( chociaż robił to w postaci wyobrażeniowej), wielkości specyficzne, to Leibniz sformułował zasady operowania takimi wielkościami w postaci określonych rachunków. Zatem będzie nam chodziło o liczby nieskończenie małe. Jaka liczbę należy nazwać nieskończenie małą ? Oczywiście, w pierwszej kolejności będzie to zero ! Jednakże fakt taki nie jest interesujący – interesujące będzie znaleźć liczbę nieskończenie małą, nie równą zero ( np. liczbę dodatnią ). Zatem jaką dodatnią liczbę większą od zera należy nazywać nieskończenie małą ? Pierwsza, naiwna odpowiedź jest taka – liczbę dodatnią ε nazywamy nieskończenie małą, jeśli jest ona mniejsza od wszystkich liczb dodatnich ( Rys. 2).

Rys. 2 Łatwo jednakże zrozumieć, że w takim sensie liczb dodatnich nie ma – liczba mniejsza od wszystkich innych liczb dodatnich i sama będąc dodatnia, powinna być mniejsza sama od siebie. Spróbujmy poprawić sytuację, wymagając, aby ε była najmniejsza pośród wszystkich pozostałych liczb dodatnich, ale była ona większa od zera tj. aby ε była najmniejszą liczbą w zbiorze liczb dodatnich. Na osi liczbowej takie ε powinno być przedstawione przez punkt leżący najbardziej po lewej w zbiorze (0, +∞) ( rys. 3)

Rys. 3 Taką „definicje” liczby nieskończenie małej często podaje się uczniom, którzy dopiero, co rozpoczynają naukę analizy matematycznej. Niestety liczby ε o wskazanych własnościach nie mogą istnieć – jeśli ε jest dodatnia, to liczba ε/2 będzie

Page 5: Co to takiego analiza niestandardowa

5

liczbą dodatnią, mniejszą od ε. ( zgodnie ze standardowymi własnościami nierówności dla każdego a > 0 spełniona jest nierówność 0 < ½ a < a ). Tak więc, jeśli nie chcemy odchodzić od znanych nam własności liczb rzeczywistych ( np. od możliwości podzielenia dowolnej liczby przez 2 lub od możliwości pomnożenia dowolnej nierówności przez liczbę dodatnią ), ale chcemy posiadać liczby nieskończenie małe, to podana definicja nieskończenie małej nie jest odpowiednia. Bardziej zadowalająca definicja liczby nieskończenie małej ε > 0, którą będziemy posługiwali się dalej, jest taka : Będziemy dodawali liczbę samą ze sobą, otrzymując liczbę ε, ε + ε, ε + ε + ε, ... itd. Jeśli wszystkie otrzymane liczby okażą się mniejsze od 1, to liczbę ε będziemy nazywali nieskończenie małą. Innymi słowy, jeśli ε jest nieskończenie mała, to ile byśmy tylko razy nie odkładali odcinak o długości ε wzdłuż odcinka o długości 1, nie wyczerpiemy go do końca (rys. 4)

Rys. 4 Nasze wymagania co do nieskończenie małej ε możemy przepisać następująco :

Zatem, jeśli liczba ε jest nieskończenie mała, to liczba 1/ε jest nieskończenie wielka w tym sensie, że jest ona większa od dowolnej z liczb : 1, 1 + 1, 1 + 1 + 1, .... Tak więc, jeśli będziemy mierzyli odcinek o długości 1/ε z pomocą etalonu długości ( tj. będziemy odkładali kolejno odcinki o długości jednostkowej ), to proces pomiaru nigdy się nie zakończy. Z powyższej analizy można się przekonać, że istnienie nieskończenie małych jest sprzeczne z tzw. aksjomatem Archimedesa, który mówi, że dla dowolnych dwóch odcinków A i B można odłożyć mniejszy z nich (np. A ) dowolną liczbę razy, tak aby w sumie otrzymać odcinek, przewyższający co do długości odcinek dłuższy (B) ( na rysunku 5 odłożono odcinek A 4 razy )

Rys. 5 Podane sformułowanie dotyczy odcinków, jeśli przyjmiemy ( jak to się robi standardowo), ze długości odcinków są liczbami, to dochodzimy do następującego sformułowania aksjomatu Archimedesa : Dla dowolnych dwóch liczb a, b dla których 0 < a < b, jedna z nierówności a + a > b, a + a + a > .... jest spełniona obowiązkowo. W dalszej kolejności, jeśli będziemy mówili o aksjomacie Archimedesa, to będziemy mieli na myśli właśnie to sformułowanie. Z takiego sformułowania widać, ze w zbiorze liczb rzeczywistych ( gdzie aksjomat ten jest spełniony ) nieskończenie małe nie występują – aby się o tym przekonać, wystarczy przyjąć a = ε, b = 1. Dalej przekonamy się, ze w istocie aksjomat Archimedesa jest równoważny stwierdzeniu o nie występowaniu nieskończenie małych elementów, nie równych zero. Wniosek z tego wszystkiego jest następujący : jeśli chcemy rozpatrywać nieskończenie małe, to należy rozszerzyć zbiór R – liczb rzeczywistych do pewnego większego zbioru R*. Elementy tego nowego zbioru będziemy nazywali liczbami hiprrzeczywistymi. W zbiorze tym aksjomat Archimedesa nie jest spełniony i istnieją nieskończenie małe liczby ( w sensie poniższej definicji ) – takie, ze ile razy byψmy je nie dodawali wzajemnie, suma cały czas pozostaje mniejsza niż 1. Podobnie jak standardowa analiza matematyczna zajmuje się badaniem zbioru liczb rzeczywistych R, analiza niestandardowa bada zbiór liczb hiperrzeczywistych R*. Otrzymane w wyniku takiego badania wyniki wykorzystuje się dla analizy własności R ( w ten sposób mogą być otrzymane „niestandardowe” dowody własności zwyczajnych liczb rzeczywistych ) Porządek w R jest archimedesowy, a w R* niearchimedesowy tzn. że w R aksjomat Archimedesa jest spełniony, a w R* nie. Z tego powodu standardowa analiza nazywana jest czasami archimedesowską, a analiza niestandardowa – niearchimedesowską. Zatem dla zbudowania analizy niestandardowej należy rozszerzyć zbiór liczb rzeczywistych do szerszego zbioru liczb hiperrzeczywistych. Zanim to jednak zrobimy pomówimy o samych liczbach rzeczywistych i ich pochodzeniu.

Page 6: Co to takiego analiza niestandardowa

6

Do tej pory zakładaliśmy milcząco, że pojęcie liczby rzeczywistej jest nam znane. Tym niemniej nienależny zapominać, że pojęcie liczby rzeczywistej ma długą historię, sięgającą początków jeszcze w starożytnej Grecji ( o czym przypomina nazwa „aksjomat Archimedesa” ), historia ta kończy się dopiero w XIX wieku. Historia ta pomoże nam lepiej zrozumieć miejsce liczb hiperrzeczywistych pośród różnorodnych systemów liczbowych. Najbardziej pierwotnym i podstawowym systemem liczbowym jest oczywiście układ liczb naturalnych. Znane stwierdzenie niemieckiego matematyka L. Kroneckera (1823 – 1891 ) „Die genze zahlen hat der liebe Gott gemacht, alles anderes ist menschenwerk” ( Bóg stworzył liczby całkowite, wszystko inne jest dziełem człowieka ) w jeszcze większym stopniu może być odniesione do liczb naturalnych ( sam Kronecker miał raczej na myśli te liczby, przekład jest zbyt dosłowny ) Liczb naturalnych okazuje się zbyt mało : próbując szukać rozwiązania równania 3 + x = 2 w zbiorze liczb naturalnych, przekonujemy się, że nie ma ono rozwiązania i nasze żądanie zdefiniowania operacji odejmowania okazuje się niezadowalające. Dlatego też rozszerzamy zbiór liczb naturalnych do zbioru liczb całkowitych W takiej procedurze obecnie jest dla nas ważna następująca sprawa : w jaki sposób zdefiniowaliśmy dodawanie i mnożenie na zbiorze liczb całkowitych ? To, ze 2 + 2 = 4 można zobaczyć, dodając dwa koszyki w których są po dwa jabłka. Jednakże dlaczego przyjmujemy, że : (–2) + (–2) = –4 ? Dlaczego przyjmujemy, że (–1) • (–1) = 1 ? Zagadnienie nie jest tak trywialne, jak może się wydawać. Znalezienie prawidłowej odpowiedzi będzie prostsze, jeśli sformułujemy pytanie nieco inaczej : co złego stanie się, jeśli przyjmiemy np. że (–1) • (–1) = 1 ? Odpowiedź jest prosta : w tym przypadku dobrze znane własności dodawania i mnożenia liczb naturalnych ( komutatywność, asocjatywność i inne ) nie będą spełnione w zbiorze liczb całkowitych. Można pokazać, ze standardowa definicja operacji nad liczbami ujemnymi jest jedyną możliwą, jeśli tylko chcemy zachować znane własności operacji dodawania i mnożenia. Należy się tutaj zastanowić głębiej i zapytać : Jakie właściwie własności dodawania i mnożenia chcemy zachować ? Jeśli bowiem chcielibyśmy zachować wszystkie własności, to wprowadzenie liczb ujemnych byłoby nie tylko zbyteczne ale i szkodliwe : własność „równanie x + 3 = 2 nie posiada rozwiązań” słuszna dla liczb naturalnych, staje się niesłuszna dla liczb całkowitych ! Jeśli nie chcemy zachować niczego, to całe zagadnienie staje się nie tyle łatwe, co po prostu puste : możemy zdefiniować operacje prowadzone z liczbami ujemnymi jak nam się podoba. Prawidłowy wybór jest tutaj jak zwykle sprawą lawirowania pomiędzy Scyllą ślepego ulegania tradycji i Charybdą bezpłodnego nowatorstwa. Powracając do historii rozwoju pojęcia liczby, widzimy że wprowadzenie liczb ujemnych nie jest całkowicie satysfakcjonujące : Równanie 2 • x = 3 tak jak i wcześniejsze równanie nie posiada rozwiązania. To pobudza nas aby wprowadzić liczby wymierne (ułamki). Ale i to okazuje się niewystarczające : od liczb wymiernych musimy przejść do liczb rzeczywistych. W wyniku tego procesu otrzymujemy ciąg zbiorów : N ⊂ Z ⊂ Q ⊂ R ( liczb naturalnych, całkowitych, wymiernych, rzeczywistych ) W takim ciągu inkluzji każdy kolejny zbiór zawiera w sobie zbiór poprzedni, a operacje wykonywane w zbiorze węższym są przedłużane na zbiór szerszy, zachowując przy tym swoje użyteczne własności. Taki ciąg zbiorów chcielibyśmy przedłużyć o jeszcze jedno ogniwo, otrzymując ciąg : N ⊂ Z ⊂ Q ⊂ R ⊂ R* Wybiegając nieco do przodu, powiemy że nowy krok takiego rozszerzenia będzie miał wiele wspólnego z poprzednim – przedłużymy mianowicie na R* operacje wykonywane w R, zachowując przy tym ich własności. Będą jednakże miały miejsce dwie zasadnicze różnice. Po pierwsze , rozszerzenie to ( tj. przejście od R do R* ) można zrealizować na wiele możliwych sposobów tj. można zbudować istotnie różne zbiory R*, pośród których ani jeden z nich nie jest wyróżniony. Jednocześnie należy pamiętać, ze wszystkie kroki rozszerzenia układu liczb od N do R były w pewnym sensie jednoznaczne. Po drugie istnieje pewna różnica naszych celów. Jeśli pierwotnie ( tj. poruszając się od N do R ) budowaliśmy nowy układ liczbowy głownie po to, aby analizować jego własności oraz jego zastosowania, to budowany układ R* nie jest na tyle po to aby badać jego własności, ale raczej po to, aby z jego pomocą analizować własności R. Przy tym być może różnica ta nie jest zbyt duża – wcześniej też rozszerzenie układu liczbowego było jednym ze sposobów otrzymania nowych wiadomości o starych obiektach ( np. mamy dział matematyki zwany analityczną teorią liczb ) Oprócz tego zbiór R* można rozpatrywać (być może ) jako odpowiadający rzeczywistości fizycznej nie gorzej niż zbiór R ( zobacz paragraf 12 ) Zatem powróćmy do stojącego przed nami zadania : należy rozszerzyć zbiór R do większego zbioru R*, zawierającego nieskończenie małe, zachowując przy tym wszystkie użyteczne własności R. Centralne zagadnienie polega na tym, jakie konkretne własności liczb rzeczywistych chcielibyśmy zachować ? Na to pytanie nie odpowiemy od razu, najpierw skupimy się na najprostszych własnościach liczb rzeczywistych.

Page 7: Co to takiego analiza niestandardowa

7

W pierwszej kolejności chcielibyśmy, aby liczby hiperrzeczywiste można było dodawać, mnożyć, odejmować i dzielić, tak aby te operacje posiadały standardowe własności, nazywane aksjomatami ciała. Sformułujmy je dokładnie. Pośród liczb hiperrzeczywistych powinny być wyróżnione liczby 0 i 1, powinny być zadane operacje dodawania x + y, mnożenia x • y, brania elementu przeciwnego –x, elementu odwrotnego 1/x ( przy x ≠ 0 ). Przy tym wszystkim powinny być spełnione następujące własności :

Zbiór z operacjami spełniającymi takie własności nazywa się ciałem. Zatem warunki 1 – 9 można krótko sformułować tak : R* powinno być ciałem liczbowym. Oprócz operacji arytmetycznych, na liczbach hiperrzeczywistych powinniśmy zadać porządek. Oznacza to, że dla dowolnych dwóch różnych liczb hiperrzeczywistych a i b powinniśmy określić jaka z nich jest większa ( tj. określić - albo a > b, albo b < a ) Przy tym powinny być spełnione następujące własności : 10) jeśli a > b, b > c, to a > c 11) jeśli a > b, to a + c > b + c dla dowolnego c 12) jeśli a > b, c > 0, to a • c > b • c jeśli a > b, c < 0, to a • c < b • c Ciało w którym wprowadzono porządek o powyższych własnościach, nazywa się ciałem uporządkowanym. Zatem, można powiedzieć, ze R* powinno być ciałem uporządkowanym. Chcemy aby pośród liczb hiperrzeczywistych zawarte były wszystkie liczby rzeczywiste. Przy takiej operacji porządki określone na R i R* powinny być zgodne – jeśli suma dwóch liczb rzeczywistych x i y jest równa z, to suma x i y, rozpatrywanych jako liczby hiperrzeczywiste, również powinna być równa z. ( byłoby bardzo dziwne, jeśli po przejściu do zbioru R*, równość 2 + 2 = 4 przestała być słuszna ! ) Dokładnie tak powinna wyglądać sprawa i z innymi operacjami oraz z porządkiem – jeśli x, y ∈ R i x > y ( w ogólnym sensie ), to x powinno być większe od y również jako liczba hiperrzeczywista ! Takie warunki zgodności można krótko wyrazić tak : ciało uporządkowane R* powinno być rozszerzeniem ciała uporządkowanego R. Tym nie wyczerpujemy własności liczb rzeczywistych, które chcielibyśmy zachować. Jednakże dalej należałoby powiedzieć o tym czego nowego oczekujemy od R*. Czego nie omówili śmy do tej pory – nieskończenie małych ( dokładniej należałoby powiedzieć – nieskończenie małych różnych od zera, ponieważ 0 również będzie nieskończenie małą liczbą, według naszej definicji ) Co to takiego liczba nieskończenie mała ( dokładniej – nieskończenie mały element ciała uporządkowanego ) ? Definicja. Element x ≥ 0 ciała uporządkowanego nazywamy nieskończenie małym, jeśli x < 1, x + x < 1 , x + x + x < 1 itd. Definicja ta odnosi się do nieujemnych x, ujemne x nazywamy nieskończenie małym, jeśli – x(= | x | ) jest nieskończenie małe. Jak widzieliśmy istnienie niezerowych nieskończenie małych jest sprzeczne z aksjomatem Archimedesa. Słuszne jest i stwierdzenie odwrotne – jeśli dla uporządkowanego ciała nie spełniony jest aksjomat Archimedesa tj. istnieją takie x, y > 0, że x < y, x + x < y , x + x + x < y itd., to istnieją niezerowe nieskończenie małe. Taką będzie np. liczba x/y : mnożąc nierówność x + x + ... + x < y przez liczbę dodatnią 1/y, otrzymujemy na mocy własności 912) iż x/y + x/y + ... + x/y < 1. Zatem, istnienie niezerowych nieskończenie małych jest równoważne naruszeniu aksjomatu Archimedesa, dla liczb hiperrzeczywistych. Ciała uporządkowane, w których słuszny jest aksjomat Archimedesa i nie ma nieskończenie małych, nazywa się ciałami archimedesowsko uporządkowanymi lub prosto – ciałami archimedesowskimi. Ciała w których aksjomat Archimedesa nie jest spełniony i występują nieskończenie małe, nazywamy ciałami niearchimedesowskimi.

Page 8: Co to takiego analiza niestandardowa

8

Z użyciem takich pojęć nasze wymaganie możemy sformułować tak : układ liczb hiperrzeczywistych powinien być ciałem niearchimedesowskim, będącym rozszerzeniem uporządkowanego ciała liczb rzeczywistych. W tym miejscu pojawia się pytanie : czy spełniliśmy już nasze oczekiwania ? Czy można zbudować układ liczbowy spełniający takie oczekiwania ? ( mało tego - dalej sformułujemy znacznie silniejsze warunki, które okażą się również spełnione ) Rozdział 3 Pierwsze zaznajomienie z prostą hiperrzeczywistą. Rozpoczniemy od tego, co w konstrukcyjnych zadaniach geometrycznych nazywamy analizą – zakładając, że niearchimedesowskie rozszerzenie ciała uporządkowanego liczb rzeczywistych istnieje, zbadamy jego własności. Niech R* - będzie niearchimedesowskim rozszerzeniem R. Jego elementy nazywamy liczbami hiperrzeczywistymi. Pośród nich , w szczególności zawarte są również wszystkie liczby rzeczywiste. Aby odróżnić je od tych liczb hiperrzeczywistych, które nie są liczbami rzeczywistymi, liczby rzeczywiste będziemy nazywali standardowymi, a pozostałe liczby hiperrzeczywiste ( elementy zbioru R*\ R ) – niestandardowymi. Zgodnie z naszym założeniem pośród liczb hiperrzeczywistych istnieją nieskończenie małe. Są one oczywiście niestandardowe. Rozpatrzmy dowolną dodatnią liczbę nieskończenie małe ε. Jest ona mniejsza od dowolnej liczby standardowej dodatniej a. Niech jednak ε ≥ a. Ponieważ a jest standardowe, a dla liczb standardowych słuszny jest aksjomat Archimedesa, to możemy znaleźć taką liczbę naturalną n, że :

Ale wtedy :

co jest sprzeczne z nieskończoną małością ε. Otrzymana sprzeczność pokazuje, że ε < a. Zatem, nieskończenie małe liczby dodatnie są mniejsze od wszystkich standardowych liczb dodatnich. ( w analogiczny sposób ujemne nieskończenie małe liczby są większe od wszystkich standardowych liczb ujemnych ) Zatem, jeśli próbujemy wyobrazić sobie liczby nieskończenie małe na osi liczbowej, to musielibyśmy wcisnąć je na tyle blisko zera, aby wszystkie dodatnie liczby standardowe znajdowały się po prawej od nich, a liczby ujemne – po lewej. Wskazana własność może służyć jako definicja nieskończonej małości : jeśli liczba ε > 0 jest mniejsza od wszystkich standardowych liczb dodatnich, to jest ona nieskończenie mała. W istocie w tym przypadku dla dowolnego naturalnego n :

ponieważ ε jest mniejsze od standardowej liczby 1/n. Oczywiście poprzez nieskończenie małe nie wyczerpujemy wszystkich liczb naturalnych. Przykładowo 1 + ε ( ε > 0 – nieskończenie małe ) również jest liczba niestandardową ( jeśli byłaby ona standardowa, to również ε = ( 1 + ε ) – 1 – była by liczbą standardową jako różnica dwóch liczb standardowych ). Jednakże nie jest ona nieskończenie małą ( ponieważ jest większa od 1 ). Bardziej wyraźny przykład – liczba hiperrzeczywista 1/ε, gdzie ε - liczba nieskończenie mała, różna od zera ( stwierdzenie „różna od zera” jest ważna, ponieważ 1/x zgodnie z definicją ciała jest określona tylko przy x ≠ 0, w analizie niestandardowej, tak jak i w standardowej nie można dzielić przez zero ) Liczba 1/ε stanowi przykład „nieskończenie dużej” liczby hiperrzeczywistej. Definicja. Liczbę hiperrzeczywistą A > 0, nazywamy nieskończenie dużą, jeśli :

( liczbę ujemną B nazywamy nieskończenie dużą, jeśli nieskończenie duży jest jej moduł | B | = – B ) Pokażemy teraz, że przy nieskończenie małym ε > 0 liczba A = 1/ε będzie ( dodatnią ) nieskończenie dużą.

Page 9: Co to takiego analiza niestandardowa

9

W istocie – mnożąc obie części nierówności :

przez 1/ε, otrzymujemy :

czego właśnie wymagaliśmy. Ławo zauważyć, że dodatnia nieskończenie duża liczba A jest większa od dowolnej liczby standardowej : jeśli a – jest dowolną liczbą standardową, to możemy znaleźć taką liczbę naturalną n, że 1 + ... + 1 > a -- n razy -- a tym bardziej A > a. W analogiczny sposób, każda ujemna nieskończenie duża liczba hiperrzeczywista jest mniejsza od dowolnej ujemnej liczby standardowej. Łatwo zauważyć, że jeśli A – jest liczbą nieskończenie dużą, to 1/A – jest liczba nieskończenie mała różną od 0. To pokazuje, że archimedesowsko uporządkowane ciało można zdefiniować jako ciało uporządkowane, w którym istnieją elementy nieskończenie duże ( Wcześniej było to ciało w którym występują nieskończenie małe ) Liczby hiperrzeczywiste, nie będące nieskończenie dużymi będziemy nazywali skończonymi. Definicja równoważna : liczba A jest skończona, jeśli a < A < b dla pewnych liczb standardowych a, b. Wszystkie liczby standardowe, są oczywiście skończone. Przykład liczby skończonej, ale nie standardowej już podaliśmy – jest to liczba ε + 1, gdzie ε > - nieskończenie mała. Ogólnie, jeśli a – jest liczbą standardową, a ε - nieskończenie małą, różną od zera, to a + ε - jest skończoną liczbą niestandardową. W istocie jest ona skończona, ponieważ – 1 < ε < 1 ( ε nieskończenie mała ), a zatem a – 1 < a + ε < a + 1 Jeśli liczba ta byłaby standardowa, to i liczba ε = ( a + ε ) – a – była by liczbą standardową, jako różnica dwóch liczb standardowych. Okazuje się, że w ten sposób można otrzymać wszystkie skończone liczby hiperrzeczywiste. Słuszne jest następujące twierdzenie : Jeśli s – jest skończoną liczbą hiperrzeczywistą, to możemy znaleźć liczbę standardową v i nieskończenie małą ε, dla których s = v + ε. W istocie. Niech s – będzie skończoną liczbą hiperrzeczywistą. Na mocy jej skończoności znajdziemy ( standardowe ) liczby rzeczywiste a, b, dla których a < s < b. Rozpatrzmy dwa zbiory ( standardowych ) liczb rzeczywistych : zbiór L wszystkich standardowych x, mniejszych od s, jak również zbiór R – wszystkich standardowych x, większych niż s. Zbiór zawiera a, a zbiór R zawiera b, dlatego też oba te zbiory nie są puste. Zbiory te nie przecinają się ( zgodnie z definicją porządku, żadna liczba nie może być jednocześnie większa i mniejsza niż s ) Dowolna liczba należąca do L jest mniejsza od dowolnej liczby należącej do R : jeśli p < s i s < q, to p < q. Na mocy znanej własności liczb rzeczywistych ( „aksjomatu zupełności w formie Dedekina” ) możemy znaleźć „liczbę rozdzielającą” v, tj. taka liczbę, że p ≤ v dla wszystkich p ∈L i v ≤ q dla wszystkich q ∈ R. ( można wziąć v równe granicy górnej L lub granicy dolnej R ) Pozostaje teraz dowieść, że różnica ε = s – v będzie nieskończenie mała. Dowiedziemy np. że ε jest mniejsza od dowolnej dodatniej liczby standardowej, tj. że s – v < z lub s < v + z. Jeśli tak nie jest i v + z ≤ s, to v + ½ z < v + z ≤ s, tj. v + ½ z ∈ L. Jest to jednakże sprzeczne z tym, że v – jest liczbą rozdzielającą, ponieważ v + ½ z > v, a wszystkie elementy L powinny być nie większe niż v. W analogiczny sposób dowodzimy, że ε = s – v – jest większa od wszystkich ujemnych liczb standardowych.

Rys. 6 Zatem, każda skończona liczba hiperrzeczywista może być przedstawiona w postaci v + ε, gdzie v – liczba standardowa, ε - nieskończenie mała. Takie przedstawienie jest jednoznaczne. Jeśli bowiem v + ε = v’ + ε’, to v – v’ = ε’ – ε.

Page 10: Co to takiego analiza niestandardowa

10

Lewa część tej równości jest standardowa, a prawa nieskończenie mała ( | ε – ε’ | < z dla dowolnej liczby standardowej z, ponieważ : | ε – ε’ | ≤ | ε | + | ε’ | < ½ z + ½ z = z | ε | < ½ z , | ε’ | < ½ z na mocy nieskończonej małości ε i ε’ ) Ponieważ pośród liczb standardowych nie ma nieskończenie małych, oprócz zera, to v – ν’ = ε – ε’ = 0, czego chcieliśmy dowieść. Własność ta pozwala nam sformułować następujące stwierdzenie : Standardową cześć St(x) skończonej liczby hiperrzeczywistej x nazywamy taką liczbę standardową v, ze x = v + ε dla nieskończenie małego ε. Spróbujemy teraz „ogarnąć wzrokiem” prosta hiperrzeczywstą. Na początku widać, że rozbija się ona na trzy części ( od lewej na prawą ) : ujemne nieskończenie duże, skończone, dodatnie nieskończenie duże (rys. 7) ... ___________________________ ... .... ––––––––––––––– ... .... _________________ ... ujemne nieskończenie duże skończone dodatnie nieskończenie duże Rys. 7 Z daleka „końcowa cześć” prostej hiperrzeczywistej wygląda jak zwykła prosta rzeczywista. Jeśli jednak popatrzymy bliżej, to można zobaczyć, że wraz z każdą liczbą standardową a umiejscowiony jest zbiór nieskończenie bliskich mu liczb hiperrzeczywistych, dla których a jest częścią standardową. Zbiór ten ( na cześć Leibniza ) nazywa się monadą liczby standardowej a. Zatem, zbiór skończonych liczb hiperrzeczywistych rozbija się na nieprzecinające się klasy – monady, odpowiadające standardowym liczba rzeczywistym. Łatwo sprawdzić, że suma i różnica nieskończenie małych, są nieskończenie małe, iloczyn nieskończenie małej i skończonej liczby hiperrzeczywistej jest nieskończenie mały. Podamy teraz proste dowody tych własności, tak aby czytelnik mógł stopniowo przywyknąć do stylu rozumowań prowadzonych w analizie niestandardowej. Niech ε, ε’ – będą nieskończenie małe. Dowiedziemy, że ε + ε’ i ε – ε’ – są liczbami nieskończenie małymi, tj. że

| ε + ε’ | < p, | ε– ε’ | < p, dla dowolnej liczby standardowej p > 0.

Mamy bowiem : | ε + ε’ | ≤ | ε | + | ε’ | oraz | ε– ε’ | ≤ | ε | + | ε’ | Dalej mamy : | ε | < ½ p i | ε’ | < ½ p ponieważ ε i ε’ – są nieskończenie małe. Dlatego też : | ε | + | ε’ | < p skąd wynika wymagana własność. Niech teraz ε będzie nieskończenie małe, a a – skończone. Ponieważ a jest skończone, to | a | jest mniejsze od pewnej liczby standardowej A. Wtedy | ε • a | < | ε | • | A | Dowiedziemy, że | ε | • | A | < p dla dowolnej liczby standardowej p > 0. W istocie mamy : | ε | < p / | A | ponieważ ε jest nieskończenie małe, a p / | A | - jest standardową liczbą >0. Zatem ε • a – jest nieskończenie małe. Zapewne podobne stwierdzenia o wielkościach nieskończenie małych, są znane czytelnikowi z podręczników analizy matematycznej. Jednakże taka zbieżność nie powinna przysłaniać nam zasadniczej różnicy – w podręczniku do analizy chodzi o ciągi liczb rzeczywistych ( które nazywa się nieskończenie małymi, jeśli ich granica jest równa zero ), a nam obecnie nie chodzi o ciągi, a o nowe liczby – liczby hiperrzeczywiste. Dwie liczby hiperrzeczywiste nazwiemy nieskończenie bliskimi, jeśli ich różnica jest nieskończenie mała. Z podanych powyżej własności nieskończenie małych wynika, że relacja nieskończonej bliskości jest relacją równoważności. Przypomnijmy, że oznacza to, iż relacja ta jest refleksywna ( każde x jest nieskończenie bliskie samemu sobie ), symetryczna ( jeśli x jest nieskończenie bliskie y, to y jest nieskończenie bliskie x ) i tranzytywna ( jeśli x jest nieskończenie bliskie y, a y jest nieskończenie bliskie z , to x jest nieskończenie bliskie z ). Każda relacja równoważności rozbija zbiór, na którym jest ona określona na nieprzecinające się klasy, przy czym dowolne dwa elementy jednej klasy są równoważne, a dowolne dwa elementy dwóch różnych klas nie są równoważne. W szczególności nasza relacja rozbija R* na nieprzecinające się klasy, przy czym elementy jednej klasy są nieskończenie bliskie wzajemnie, a elementy różnych klas – nie. Klasy zawierające standardowe liczby rzeczywiste, reprezentują sobą wspomniane już monady.

Page 11: Co to takiego analiza niestandardowa

11

Zapoznaliśmy się już z budową R* „z bliska”, teraz spojrzymy ja budowę R* z „daleka”. Rozważmy drugą relacje równoważności na R*, mówimy, że liczby hiperrzeczywiste x i y „znajdują się w jednej galaktyce”, jeśli ich różnica – jest skończoną liczbą hiperrzeczywistą. Jest jasne, że otrzymujemy relacje równoważności na zbiorze wszystkich liczb hiperrzeczywistych ( jeśli x – y i y – z są skończone, to ich suma, równa x – z – jest skończona) Relacja taka rozbija wszystkie liczby hiperrzeczywiste na klasy, które naturalnie będzie nazwać galaktykami. Takie rozbicie jest „grubsze”, niż rozbicie na monady – każda galaktyka przedstawia sobą sumę nieskończonej liczby monad. Jedną z galaktyk jest zbiór wszystkich liczb hiperrzeczywistych ( taką galaktykę naturalnie będzie nazwać „naszą galaktyką” ), dowolna inna galaktyka albo składa się z nieskończenie dużych liczb dodatnich, albo składa się z nieskończenie dużych liczb ujemnych. Galaktyki „nie mieszają się” : jeśli G1 i G2 – są dwiema galaktykami, to albo G1 leży najbardziej po lewej G2

( tj. dowolna liczba należąca do G1 jest mniejsza od dowolnej liczby z G2 ), albo na odwrót. Pomiędzy dowolnymi dwiema

galaktykami istnieje trzecia ( aby ją znaleźć, weźmiemy x i y należące do G1 i G2 i rozpatrzymy galaktykę, zawierającą ich

sumę ½ ( x + y )), a zatem istnieje nieskończenie wiele pośrednich ( weźmiemy dalej galaktykę leżącą pomiędzy pierwszą i trzecia itd. ) Pośród takich galaktyk nie ma największej ( „leżącej najbardziej po prawej” ), ani najmniejszej ( „leżącej najbardziej po lewej” ): jeśli galaktyka G zawiera x, a ω - jest nieskończenie dużą, to liczba x + ω będzie znajdowała się w galaktyce G’, umiejscowionej po prawej G, a liczba x – ω będzie znajdowała się w galaktyce G’’, umiejscowionej po lewej G. Tak jak w standardowym wykładzie analizy matematycznej, możemy rozróżniać nieskończenie małe ( lub nieskończenie duże ) różnych rzędów. Dokładniej – będziemy mówili, że nieskończenie mała ε jest nieskończenie małą wyższego rzędu, niż nieskończenie mała δ, jeśli stosunek ε/δ jest nieskończenie mały. W analogiczny sposób nieskończenie duża A ma wyższy rząd, niż nieskończenie duża B, jeśli A/B – jest nieskończenie duży. Zgodnie z takimi definicjami, dla dowolnej

nieskończenie małej ε, można wskazać nieskończenie małą wyższego rzędu, np. ε2 , ε3 itd. ( analogicznie sprawa wygląda z nieskończenie dużymi ) Można powiedzieć, że rozpatrując otoczenie 0 poprzez mikroskop o dowolnym ( nawet nieskończonym ) powiększeniem zawsze będziemy widzieli połączone punkty, będące w istocie różnymi punktami. Jeśli mikroskop powiększa 1/ε razy, to ε

będzie widoczne w skończonej odległości od zera, ale ε2 będzie łączyło się z punktem zerowym. ( przy tym wszystkie liczby standardowe, będą leżały nieskończenie daleko, poza naszym polem widzenia )

Rys. 8

Zwiększając powiększenie 1/ε2 zobaczymy, że ε jest teraz nieskończenie daleko od naszego pola widzenia, a ε2 jest dobrze

odróżnialne od zera, ale tak jak wcześniej i teraz istnieją liczby nieodróżnialne od zera np. ε3. Podamy jeszcze kilka „mikrofotografii” [na podstawie 38] różnych obiektów. Kierując obiektyw mikroskopu na dowolny punkt prostej rzeczywistej, nie zobaczymy niczego szczególnie nowego : po prostu w miejscu 0 wystąpi dowolna inna liczba rzeczywista. Wykres funkcji y = ( standardowa część x ) zdefiniowanej na skończonych hiperrzeczywistych x, przy oglądaniu bez mikroskopu, nie różni się niczym od wykresy funkcji y = x Patrząc jednakże przez mikroskop ( z nieskończenie dużym powiększeniem ) na dowolny jego punkt, zobaczymy, że zbieżność jest tylko pozorna – w mikroskopie wykres wygląda jak linia pozioma ( wykres y = x i w mikroskopie prosta przechodząca pod kątem 45° do osi współrzędnych ) (rys. 9 )

Page 12: Co to takiego analiza niestandardowa

12

Rys. 9 Rys. 10

Wykres funkcji y = x2 pod mikroskopem też wygląda jak prosta. ( rys. 10 ) W początku współrzędnych taki wykres jest horyzontalny, a w innych punktach ma niezerowe nachylenie. Nie przypadkowo wykorzystaliśmy słowa „wygląda jak” i „pokrywa się”.

Rys. 11 Jeśli zobaczymy przez jeszcze większe powiększenie, to możemy zobaczyć, że takie połączenie nie jest pełne – pomiędzy wykresem i prostą istnieje „nieskończenie mała przerwa” ( rys. 11 ) Do tej pory kierowaliśmy nasz mikroskop na skończoną część prostej hiperrzeczywistej ( lub na punkty płaszczyzny o skończonych współrzędnych ). „przyrząd” przeznaczony do analizy nieskończenie oddalonych fragmentów, należałoby raczej nazwać „teleskopem”. Kierując zatem taki teleskop na dowolną nieskończenie dużą liczbę hiperrzeczywistą, zobaczymy, coś mniej więcej takiego :

Rys. 12 Patrząc przez teleskop na wykres funkcji y = 1/x w punkcie nieskończenie dużym, zobaczymy, ze łączy się on z osią rzędnych (Ox ). Jednakże jeśli powiększymy ten obraz przez mikroskop, to zobaczymy iż prosta tego wykresu jest „równoległa” do osi Ox (rys. 13)

Page 13: Co to takiego analiza niestandardowa

13

Rys. 13 Rozdział 4. Przykład niearchomedesowskiego układu liczbowego. Do tej pory mówiliśmy o prostej hiperrzeczywistej ( dokładniej, o dowolnym niearchimedesowskim rozszerzeniu uporządkowanego ciała liczb rzeczywistych ), odkładając zagadnienie o tym, czy istnieje choćby jedno takie rozszerzenie. Teraz spróbujemy zbudować takie rozszerzenie. Pierwsza przychodząca do głowy myśl jest taka – postępując zgodnie z tradycją, nazwać nieskończenie małymi hiperrzeczywistymi liczbami ciąg liczb rzeczywistych, zbieżny do zera. Należy oczywiście mieć również mieć nie tylko takie liczby. Jednakże najbardziej naturalna droga jest taka – przyjąć jako hiperrzeczywistą liczbę dowolny ciąg liczb rzeczywistych. Wymagane jest, aby liczby rzeczywiste stanowiły przypadek szczególny liczb hiperrzeczywistych, możemy to łatwo osiągnąć, utożsamiając każdą liczbę rzeczywistą a z ciągiem złożonym z jednakowych elementów a, a, a, ... W ten sposób otrzymujemy na pierwszy wzgląd ciekawą konstrukcje – wszystkie ciągi liczb rzeczywistych nazywamy liczbami hiperrzeczywistymi, pośród nich są liczby standardowe ( ciągi stałe ) oraz liczby dążące do zera. Liczby hiperrzeczywiste można dodawać i mnożyć, tak jak to się zwykle robi z ciągami – człon po członie, przyjmując sumę ciągów : a = a0 , a1 , … ; b = b0 , b1 , …

a + b = a0 + b0 , a1 + b1 , …

a iloczyn a • b = a0 • b0 , a1 • b1 , …

( przy tym zerem jest ciąg złożony z samych zer, a jednością – ciąg złożony z samych jedynek ) Jednakże dalej czeka nas rozczarowanie – w ten sposób ciała nie otrzymamy. Dokładnie – nie uda się określić operacji brania odwrotności. Co np. możemy przyjąć jako odwrotność ciągu : 0, 1, 0, 1, ... Jest jasne, ze znaleźć takie x, że ax = 1, można tylko jeśli w ciągu a nie ma zer. Próba eliminacji ciągów, które zawierają zera, nie prowadzi do niczego dobrego – po takiej decyzji, nie jest jasne jak określić dodawanie ( suma dwóch ciągów bez zer, może zawierać zera ). Trudności będziemy mieli również z określenia porządku – będziemy musieli np. rozstrzygnąć jaki z dwóch ( nie równych ) ciągów : 0, 1, 0, 1, ... 1, 0, 1, 0, ... jest większy. Widzimy więc, że idea aby określić liczby hiperrzeczywiste jako ciągi napotyka na poważne problemy, dla przezwyciężenia których będziemy potrzebowali jakieś nowej idei. Do takiej konstrukcji jednakże jeszcze powrócimy. Opiszemy teraz drugi sposób zbudowania układu liczb hiperrzeczywistych ( póki co dla nas „układ liczb hiperrzeczywistych” oznacza „niearchimedesowskie rozszerzenie uporządkowanego ciała liczb rzeczywistych” ) Podstawowa idea tej konstrukcji może być opisana w jednym zdaniu tak : Nie mamy obiektów, ale mamy nazwy dla nich, zatem nazwy będą obiektami ! ( co często stosuje się w logice matematycznej ) Taka idea konkretyzuje się w naszym przypadku w następujący sposób. Wiemy, że w naszym ( póki co jeszcze nie zbudowanym i niewiadomo czy istniejącym ) rozszerzeniu powinna istnieć choćby jedna nieskończenie mała dodatnia liczba hiperrzeczywista. Oznaczmy ją przez ε. Ponieważ liczby hiperrzeczywiste można mnożyć przez siebie ( i w szczególności przez liczby rzeczywiste ), to wraz z ε w naszym rozszerzeniu będą występować również liczby 2ε, 0,5ε i w ogólności liczby postaci aε, gdzie a – dowolna standardowa

Page 14: Co to takiego analiza niestandardowa

14

liczba rzeczywista. Oprócz tego, liczbę ε można mnożyć przez siebie, dlatego też w naszym rozszerzeniu będą występować liczby

ε2 , ε3 , 2ε2 , 2ε2 + 2ε + 1, ... i w ogólności wszystkie liczby hiperrzeczywiste postaci P(ε) , gdzie P(ε)- jest wielomianem ze standardowymi współczynnikami. Zbiór liczb takiej postaci, jak łatwo zrozumieć, jest zamknięty ( w sensie algebraicznym ) względem dodawania, odejmowania i mnożenia. Jednakże dla liczb hiperrzeczywistych zdefiniowane jest jeszcze dzielenie. Dlatego w takim rozszerzeniu będą występowały liczby postaci P(ε)/ Q(ε) , gdzie P, Q – są wielomianami o współczynnikach standardowych. Po tym otrzymujemy zbiór liczb hiperrzeczywistych , zamknięty względem wszystkich operacji arytmetycznych : dodawania, odejmowania, mnożenia i dzielenia. W ten sposób, nie mając póki co poszukiwanego rozszerzenia mogliśmy już nadać niektórym jego elementom nazwy. Takimi nazwami są zapisy postaci P(ε)/ Q(ε), gdzie ε - jest pewnym symbolem. Oprócz tego, możemy wnioskować jaki z takich dwóch zapisów oznacza większa liczbę. W tym celu wystarczy umiejętność określenia, czy dany zapis jest dodatnią , ujemną czy też zerową liczbą ( ponieważ a > b wtedy i tylko wtedy, kiedy a – b > 0 ) Wiedząc, że znak ułamka, można określić znając znaki licznika i mianownika, widzimy że wystarczy umieć określić znak P(ε). Robimy to następująco. Łatwo zauważyć, że znak wielkości a0 + a1ε + ... pokrywa się ze znakiem a0, jeśli a0 ≠ 0. Składniki a1ε + ... są bowiem

nieskończenie małe, a dodając dodatnią ( ujemną ) liczbę z nieskończenie małym, otrzymujemy dodatnią ( ujemną ) liczbę. Możliwy jest jednakże przypadek a0 = 0. Dla skonkretyzowania będziemy przyjmowali, że ε - jest dodatnią liczbą

nieskończenie małą. Z rozpatrywanego wielomianu wyprowadzimy najwyższa potęgę ε tj. zapiszemy go w postaci :

εk ( ak + ak+1ε + … )

gdzie ak jest już różne od zera.

Teraz jest jasne, ze znak całego takiego wyrażenia określony jest przez znak wyrażenia w nawiasie ( przy mnożeniu przez dodatnią liczbę znak nie zmienia się ), a znak wyrażenia w nawiasie ( jak już wiemy ) określony jest przez znak liczby ak.

To co powiedzieliśmy powyżej zilustrujemy teraz na przykładzie. Niech mamy za zadanie porównać liczby :

1 + ε2 / 1 + ε oraz 2 + ε3 / 2 + ε2

lub innymi słowy, mamy porównać ich różnicę :

( 1 + ε2 / 1 + ε ) – ( 2 + ε3 / 2 + ε2 ) z zerem. Obliczając taka różnicę zgodnie z standardowymi zasadami, otrzymujemy :

Widać, że jest ona ujemna. To oznacza iż pierwsza liczba jest mniejsza od drugiej. W istocie już zbudowaliśmy szukane rozszerzenie niearchimedesowskie. Należy tylko spojrzeć na nasze analizy z innej pozycji. Do tej pory wyrażenie P(ε)/Q(ε) rozpatrywaliśmy jako nazwy „prawdziwych” liczb hiperrzeczywistych ( wziętych niewiadomo skąd ). A teraz same one staną się liczbami hiperrzeczywistymi. Rozpatrzmy wyrażenia formalne postaci P(ε)/ Q(ε) , gdzie ε - jest pewnym symbolem, a P i Q – wielomiany o współczynnikach rzeczywistych, przy czym Q≠ 0. Proklamując, iż obiektami, a w danym przypadku liczbami hiperrzeczywistymi są nazwy, a w danym przypadku wyrażenie lub zapisy postaci P(ε)/Q(ε), nie bylibyśmy zupełnie ściśli. Problem w tym, że oczywiście dwa różne zapisy mogą wyrażać jedną i tę samą liczbę ( innymi słowy, mogą być dwoma różnymi nazwami jednej i tej samej liczby ) :

przykładowo naturalnym jest przyjąć, ze zapis ( ε2 – 1 )/( ε – 1 ) wyraża tę samą liczbę, co ( ε + 1) / 1. Dwa wyrażenia P(ε)/Q(ε) i R(ε)/ S(ε) będziemy nazywali równoważnymi, jeśli P(ε) • S(ε) = R(ε) • Q(ε) ( równość rozumiemy tutaj jako równość wielomianów tj. jako równość współczynników stojących przy jednakowych potęgach ) Łatwo sprawdzić, że taka definicja rzeczywiście zadaje relacji równoważności, rozbijająca wszystkie wyrażenia postaci P(ε)/Q(ε) na klasy. Takie klasy będziemy nazywali liczbami hiperrzeczywistymi. Dodawanie, odejmowanie, mnożenie i dzielenie liczb hiperrzeczywistych definiujemy zgodnie ze standardowymi zasadami. Przykładowo, jeśli α - jest klasą, zawierająca P/Q, a β - klasą zawierająca R/S, to ich sumą nazywamy klasę, zawierającą ( PS + RQ )/ SQ a iloczynem – klasę, zawierająca PR/QS.

Page 15: Co to takiego analiza niestandardowa

15

Łatwo również sprawdzić, ze taka definicja jest poprawna, tj. nie jest zależna od wyboru elementów P/Q w klasie α i R/S w klasie β ( w wyniku czego otrzymujemy różne reprezentacje jednej i tej samej klasy ) W analogiczny sposób możemy zdefiniować branie odwrotności i przeciwieństwa, jak również zero i jedność. Łatwo sprawdzić, ze wszystkie aksjomaty ciała przy tym będą spełnione. Przedstawiona konstrukcja jest dobrze znana w algebrze : zbudowane ciało nazywa się ciałem funkcji wymiernych o współczynnikach w R i oznaczamy go jako R(ε). Pozostało nam tylko zdefiniować porządek, wskazując jak wybrać z dwóch liczb hiperrzeczywistych ( tj. z dwóch różnych klas równoważności ułamków ) większą liczbę. W tym celu należy odjąć jedną liczbę od drugiej i zdefiniować, czy taka różnica ( różna od zera, ponieważ liczby są różne ) będzie dodatnia lub ujemna. Aby określić, czy różna od zera liczba α będzie dodatnia czy też ujemna, weźmiemy jej reprezentantów P/Q. Gdzie P i Q są różne od 0( Q jest różne od zera z definicji, P – dlatego, ze zgodnie z naszym założeniem, różnica nie jest równa 0 ). Wyprowadzimy w liczniku i mianowniku ε w najwyższej możliwej potędze :

Liczba α będzie dodatnia, jeśli ak i bi mają jednakowe znaki, a ujemna, jeśli mają one różne znaki.

W charakterze ćwiczenia czytelnik może sprawdzić ( jest to łatwe), ze podana definicja jest poprawna ( tj. nie jest ważne jaka z równoważnych reprezentacji weźmiemy ) oraz, że spełnione są wszystkie aksjomaty ciała uporządkowanego. Zbudowane w taki sposób ciało uporządkowanej R(ε) można rozpatrywać jako rozszerzenie ciała R : wystarczy utożsamić liczbę rzeczywistą x z klasą równoważności ułamków, zawierającą ułamek x/1. Pozostało tylko pokazać, że aksjomat Archimedesa nie jest spełniony, ujawniając w ten sposób element nieskończenie mały. Tym elementem będzie, oczywiście ε ( dokładnie, klasa zawierająca ε/1 ) W istocie mamy : ε + ε + ... + ε < 1 --- n razy --- ponieważ różnica 1 – nε jest dodatnia ( znak określony jest członem swobodnym , a 1 > 0 ) Zatem, szukane rozszerzenie zostało zbudowane. Na tym przykładzie można zilustrować niektóre pojęcia, omawiane już przez nas. Ułamek :

będzie nieskończenie mały, jeśli pierwszy niezerowy współczynnik at w liczniku będzie umiejscowiony bardziej na prawo

niż pierwszy niezerowy współczynnik bs w mianowniku tj. jeśli t > s. Jeśli t < s, to ułamek będzie nieskończenie duży. Jeśli

t = s, to ułamek będzie skończoną hiperrzeczywista liczbą, której standardowa część będzie równa at /bs.

Przykładowo :

ε1, ε22 , ε2 – 2ε3 / 1 + ε - nieskończenie małe.

1/ε, 1 + ε / ε2 + 2ε2 – nieskończenie duże

1 + ε / 1 + 2ε , ε2 + ε5 /2ε2 + 3ε4 – skończone liczby hiperrzeczywiste ( standardowa część pierwszej jest równa 1, a drugiej ½ )

Page 16: Co to takiego analiza niestandardowa

16

Rozdział 5 Nowe wymagania związane z liczbami hiperrzeczywistymi. Zatem zbudowaliśmy niearchimedesowskie rozszerzenie R(ε) ciała liczb rzeczywistych. Teraz postaramy się zrozumieć, czy jest ono wystarczające dla uzasadnienia przedstawionych wcześniej „analiz niestandardowych”.

Przykład z obliczeniem pochodnej funkcji y = x2 jest w pełni poprawny – należy powiedzieć tylko, że pochodną tej funkcji w punkcie standardowym x nazywa się standardowa część stosunku dy/dx : st (dy/dx) = st( 2 x + dx ) = 2x Gorzej jest z innymi przypadkami. Przy próbie zrożniczkowania pierwiastka należy obliczyć różnicę : sqrt( x + dx) – sqrt(x) I w szczególności wyciągnąć pierwiastek z liczby hiperrzeczywistej x + dx. A w naszym ciele R(ε) nie zawsze możemy wyciągać pierwiastek. ( w charakterze ćwiczenia czytelnik może sprawdzić, ze nie istnieje w nim liczba hiperrzeczywista

a dla której a3 = ε ) Jeszcze gorzej sprawa wygląda z definicją całki – należy tam bowiem dodawać wielkości postaci f(x), gdzie x – jest liczbą hiperrzeczywistą, jednocześnie funkcja f jest określone tylko na liczbach rzeczywistych. Już z tych przykładów widać, ze czegoś nam brakuje. Musimy umieć obliczać „wartości” standardowych funkcji ( zadanych pierwotnie jako funkcje o argumentach i wartościach rzeczywistych ) na argumentach hiperrzeczywistych. Innymi słowy, dla każdej funkcji : f : R → R powinniśmy mieć jej hiperrzeczywisty analog : f * : R* → R* Przy tym, oczywiście wartości f* na liczbach standardowych powinny pokrywać się z odpowiednimi wartościami funkcji f. Innymi słowy f* powinna być przedłużeniem f. Takie analogi mieliśmy dla operacji dodawania, odejmowania mnożenia i dzielenia. Ale to za mało – musimy mieć również analogi innych funkcji. Jeśli mielibyśmy je dla obliczenia pierwiastków, to moglibyśmy rozpatrywać funkcje : sqrt(x) ( z argumentami i wartościami rzeczywistymi ), a następnie wziąć jej przedłużenie sqrt*(x) i zdefiniować pochodną jako standardową część stosunku : ( sqrt*(x + dx) – sqrt*(x) /dx Zatem dla każdej standardowej funkcji f (z argumentami i wartościami rzeczywistymi ) musimy mieć jej przedłużenie hiperrzeczywiste f*. Jeśli od f* nic innego nie wymagamy, to sprawa jest trywialna – można przyjąć, że we wszystkich punktach rzeczywistych f* przyjmuje te same wartości, co f, a w punktach niestandardowych f* posiada wartości dowolne ( np. zero ). Jest jednakże jasne, że warunek ten jest niezadowalający – przy obliczeniu pochodnej pierwiastka np. wymagamy, aby funkcja sqrt* posiadała następującą własność : sqrt*(b) – sqrt*(a) = b – a / sqrt*(b) + sqrt*(a) Ponieważ trudno zawczasu przewidzieć, jakie właściwie własności mogą się nam przydać, byłoby porządne, aby funkcja f* była jak najbardziej podobna do funkcji f – w ideale f* powinna posiadać wszystkie własności, które posiada f tj. by była ona jej „naturalnym rozciągnięciem” z R na R*. Słowa „wszystkie własności” należy jednakże rozumieć prawidłowo. Przecież chcemy jedynie, aby f była określona tylko na liczbach rzeczywistych. Musimy zatem wydzielić niektórą klasę własności – klasę tych własności, które chcemy zachować. Prawidłowy wybór takiej klasy ma decydujące znaczenie dla powodzenia naszej konstrukcji systemu liczb hiperrzeczywistych. Jeśli taka klasa będzie zbyt wąska, to nie będzie pożytku z przedłużenia f*. Jeśli klasa będzie zbyt szeroka, to sama możliwość budowy systemu liczb hiperrzeczywistych i definicji przedłużeń okaże się pod znakiem zapytania. Zatem, nasze główne zadanie, to opisanie jakie własności funkcji standardowych chcemy zachować przy przejściu od liczb rzeczywistych do hiperrzeczywistych. Mamy dwie możliwości wykonania tego zadania. Pierwsza możliwość polega na zastosowaniu metod logiki matematycznej. Można powiedzieć, że przy przejściu od liczb rzeczywistych do hiperrzeczywistych zachowują się wszystkie własności, które można wyrazić w „języku pierwszego rzędu”. Taka drogę omówimy ( i w szczególności wyjaśnimy, co to takiego język pierwszego rzędu ) w dalszej kolejności. Obecnie skupimy się na drugiej możliwości, która pozwala nam obejść się bez języka logiki. Oczywiście przy tym będziemy mieli do czynienia z pewnymi niedogodnościami, ale za to nie będziemy wymagali znajomości logiki matematycznej. Przypomnę sytuacje w jakiej znajdujemy się obecnie. Zakładamy, że oprócz ciała R liczb rzeczywistych, mamy szersze ciało uporządkowane R* liczb hiperrzeczywistych, zawierające R jako podzbiór ( jeszcze raz podkreślam, że istnienie R* o wymaganych własnościach póki co jest tylko hipotezą, a nie dowiedzionym faktem ) Niech dla każdej funkcji f z argumentami rzeczywistymi istnieje naturalne rozszerzenie – „hiperrzeczywisty analog” – funkcja z argumentami i wartościami hiperrzeczywistymi. Przy tym funkcja f może być funkcja nie tylko jednej zmiennej rzeczywistej, ale dwóch trzech itp. Oczywiście funkcja f* powinna mieć tę samą liczbę argumentów. Dla uproszczenia póki co nie będziemy rozpatrywali funkcji o pochodnych cząstkowych i będziemy przyjmowali, że f ( odpowiednio f* ) jest określona przy wszystkich rzeczywistych ( odpowiednio – hiperrzeczywistych ) argumentach.

Page 17: Co to takiego analiza niestandardowa

17

Sformułujemy teraz nasz warunek ( „analogi posiadają te same własności, co funkcje wejściowe” ) nieco ściślej. Będziemy rozpatrywali układy równań typu t = s i nierówności postaci t ≠ s, lewe i prawe części których zawierają dowolne funkcje rzeczywiste, argumentów rzeczywistych, stałe rzeczywiste i zmienne – coś w rodzaju : sin( cos(x )) = y + exp(z) , z ≠ y – 2 • x , [z] = y Taki układ zawiera zmienne x, y, z , funkcje sin, cos , exp , [ . ] – cześć całkowitą, funkcje dwuargumentowe ( dodawanie, odejmowanie i mnożenie ) oraz stałą 2 ( stałe dla jednolitego podejścia będziemy przyjmowali jako funkcje zero argumentów ). Wszystkie wchodzące do tego układu funkcje mają według naszego założenia hiperrzeczywiste analogi. Oznaczmy je jako sin*, cos* , exp* [ . ]* +*, –* , •* Zapiszmy układ : sin*( cos*(x )) = y* + exp*(z) , z ≠ y –* 2 •* x , [z]* = y który naturalnie będzie nazwać „analogiem hiperrzeczywistym układu wejściowego”. W charakterze możliwych wartości zmiennych takiego układu mogą figurować dowolne liczby hiperrzeczywiste. Tym samym nabiera sensu zagadnienie o obecności lub braku hiperrzeczywistych rozwiązań takiego układu. Ponieważ zakładamy, że wchodzące do niego funkcje są przedłużeniami odpowiednich funkcji argumentu rzeczywistego, to każde ( rzeczywiste ) rozwiązanie wejściowego układu będzie jednocześnie rozwiązaniem nowego układu. Zatem, jeśli wejściowy układ posiada rozwiązania, to i jej hiperrzeczywisty analog posiada rozwiązania. Wymagamy również warunku odwrotnego : każdy układ równań i nierówności, którego hiperrzeczywisty analog posiada ( hiperrzeczywiste ) rozwiązania, powinna posiadać rozwiązania rzeczywiste. Wnikliwy czytelnik mógłby powiedzieć, że pojęcie „układ równań i nierówności” nie zostało przez nas zdefiniowane – podaliśmy tylko jeden przykład. Tym samym i nasze wymaganie nie otrzymało ścisłego sformułowania. Aby odpowiedzieć na ten zarzut wprowadzimy pojęcie termu. Wybierzemy przeliczalny zbiór symboli, którego elementy nazwiemy zmiennymi. Termem będziemy nazywali dowolną zmienną, dowolną liczbę rzeczywistą, jak również dowolne wyrażenie postaci f(t1, ... , tn ), gdzie f – jest funkcją n

rzeczywistych argumentów ; t1, ... , tn – są zadanymi wcześniej termami.

Tym samym sin(cos(x)) , a( y, exp(z)) ( a – funkcja dodawania ) itd. są termami. Układem, a dokładniej układem równań i nierówności, nazwiemy skończony zbiór zapisów postaci t = s lub t ≠ s, gdzie t, s – termy. Podany przez nas wcześniej przykład układu podpada pod taką definicje, należy tylko zamienić standardowe oznaczenia, typu x + y na a(x, y), gdzie a – funkcja dodawania itd. Dalej zdefiniujemy pojęcie rozwiązania układu. Jeśli do termu podstawimy liczby rzeczywiste w miejsce zmiennych, to nabierze on pewnej wartości rzeczywistej. Rozwiązanie układu – jest to taki zbiór wartości zmiennych, przy którym lewa i prawa część dowolnej równości t = s, wchodzącej do danego układu, nabierają jednej i tej samej wartości, a lewa i prawa część dowolnej nierówności t ≠ s, wchodzącej do układu – różne. Zgodnie z naszym założeniem każda funkcja z argumentami rzeczywistymi i wartościami posiada hiperrzeczywisty analog ( „naturalne przedłużenie” ). Pojęcie hiperrzeczywistego analogu łatwo rozciągnąć na termy – aby otrzymać analog termu t, należy po prostu zamienić wszystkie wchodzące do niego funkcje na ich hiperrzeczywiste analogi. Wykonując taką operacje ze wszystkimi termami, wchodzącymi do jakiegoś układu S, otrzymamy układ S*, który naturalnie byłoby nazwać hiperrzeczywistym analogiem układu S. Ponieważ wchodzą do niego funkcje z hiperrzeczywistymi argumentami i wartościami, w miejsce zmiennych można podstawić dowolne liczby hiperrzeczywiste. Hiperrzeczywistym rozwiązaniem układu S* nazwiemy taki zbiór hiperrzeczywistych wartości zmiennych, przy których spełnione są wszystkie wchodzące do niego równania i nierówności. Teraz można sformułować nasz wymóg odnośnie układu liczb hiperrzeczywistych i analogów hiperrzeczywistych w następujący sposób : Niech S – będzie dowolnym układem równań i nierówności, S* - jej hiperrzeczywistym analogiem. Jeśli S* posiada ( hiperrzeczywiste ) rozwiązania, to S powinno posiadać rozwiązania rzeczywiste. Przypomnimy, że możliwość zbudowania niearchimedesowskiego uporządkowanego rozszerzenia R ciała R * i takich hiperrzeczywistych analogów F* dla wszystkich funkcji rzeczywistych f, które spełniałyby sformułowane wymagania, póki co pozostaje tylko hipotezą. ( Taką hipotezę będziemy nazywali – Podstawową hipotezą PH ) W następnych paragrafach omówimy jego następstwa. A do zagadnienia o możliwości zbudowania układu liczb hiperrzeczywistych o wymaganych własnościach jeszcze powrócimy.

Page 18: Co to takiego analiza niestandardowa

18

Rozdział 6 Pierwsze wnioski. W niniejszym rozdziale podamy kilka przykładów, pokazujących jakie następstwa można wyprowadzić ze sformułowanego w poprzednim rozdziale PH. Okazuje się, że mimo, iż sformułowany przez nas wymóg jednoczesnej rozwiązywalności układu równań i nierówności wydaje się zbyt szczególne, posiada on bardzo różne następstwa i jest on wystarczający dla uzasadnienia znacznej części analiz prowadzonych z liczbami hiperrzeczywistymi. Przykład 1. Niech f – będzie funkcją jednego argumentu rzeczywistego, przyjmującej tylko wartości 0 i 1. Dowiedziemy, że funkcja f* przyjmuje tylko wartości 0 i 1. W tym celu rozpatrzymy układ : f(x) ≠ 0, f(x) ≠ 1 Przykład 2. Niech f, g – będą funkcjami jednego argumentu rzeczywistego, przy czym zbiory ich zer pokrywają się ( Zbiór zer funkcji – jest to zbiór tych wartości argumentu, przy których wartość jest równa 0 ) W tym przypadku również zbiory liczb hiperrzeczywistych będącymi zbiorami zer funkcji f* i g*, pokrywają się. Dowiedziemy tego. W istocie, każdy z układów : (1) f(x) = 0 , g(x) ≠ 0 (2) g(x) = 0 , f(x) ≠ 0 nie posiada rozwiązań rzeczywistych. Zatem, nie posiadają rozwiązań hiperrzeczywistych rozwiązań i ich analogi. Dlatego, dowolne hiperrzeczywiste zero funkcji f* jest zobowiązane ( taka aby nie być rozwiązaniem analogu układu (1)) być również erem dla g* i odwrotnie. Przykład ten pozwala zdefiniować hiperrzeczywiste analogi nie tylko dla funkcji, ale również dla zbiorów. Niech A – będzie dowolnym zbiorem liczb hiperrzeczywistych. Rozpatrzymy dowolną funkcje f, dla której A – jest zbiorem zer. ( wystarczy przyjąć np. f(x) = 0 przy x ∈ A i f(x) = 1 przy x ∉ A ) Rozpatrzymy teraz hiperrzeczywisty analog f* funkcji f i zbiór A* - jego ( hiperrzeczywistych ) zer. Jak się przekonamy, zbiór A* nie jest zależny od wyboru funkcji f. Nazwiemy go hiperrzeczywistym analogiem zbioru A. Przykład 3. Możemy teraz rozstrzygnąć czy włączyć do układu wraz z równościami t = s i nierównościami t ≠ s również zapis typu s ∈ A, gdzie s reprezentuje sobą term, a A – jest zbiorem liczb rzeczywistych. Przy tym rozwiązaniami będą takie zbiory ( rzeczywistych i hiperrzeczywistych ) wartości zmiennych, przy których spełnione są wszystkie równości i nierówności, a wartość s należy do zbioru A. Hiperrzeczywistym analogiem zapisu s ∈ A będzie s* ∈ A*, gdzie s* - jest hiperrzeczywistym analogiem termu s, a A* - jest analogiem zbioru A ( we wskazanym sensie ). Zatem dla każdego układu równości, nierówności i relacji przynależności typu s∈ A, pojawia się hiperrzeczywisty analog. Dla takich układów pozostaje w mocy własność jednoczesnej rozwiązywalności – jeśli hiperrzeczywisty analog układu posiada ( hiperrzeczywiste ) rozwiązania, to wejściowy układ posiada (rzeczywiste ) rozwiązania. Aby się o tym przekonać wystarczy zamienić s∈ A na a(s) = 0, gdzie a – jest funkcją o wartościach i argumentach rzeczywistych, której zbiór zer to A. W analogiczny sposób można dodać do układu również stwierdzenia postaci s∉A ( które zamieniamy na a(s) ≠ 0 ) Przykład 4. Niech A – będzie zbiorem pustym. Dowiedziemy, że A* - jest zbiorem pustym. W istocie układ : x ∈ A nie posiada rozwiązań rzeczywistych, dlatego również układ x ∈A* nie posiada rozwiązań ( hiperrzeczywistych ). Analizując układ x ∉A, otrzymujemy w analogiczny sposób, iż jeśli A zawiera wszystkie liczby rzeczywiste, to A* zawiera wszystkie liczby hiperrzeczywiste. Zatem, hiperrzeczywistym analogiem zbioru R będzie zbiór R*, tak że nasze oznaczenia są zgodne. Aby nie mnożyć bytów, w dalszej kolejności pozwolimy sobie na pewną dowolność. Dokładniej – w miejsce tego, aby mówić o układzie S i jego rozwiązaniach hiperrzeczywistych, jak również o układzie S* i jego rozwiązaniach hiperrzeczywistych , będziemy mówili o rzeczywistych i hiperrzeczywistych rozwiązaniach układu S. ( oczywiście mówiąc o rozwiązaniach hiperrzeczywistych układów S, w istocie będziemy mieli na uwadze rozwiązania hiperrzeczywiste układu S* ). To pozwoli nam na ekonomię zapisu i niezapisywania dwóch układów różniących się od siebie tylko gwiazdkami. Przykładowo, w ostatnim przykładzie moglibyśmy powiedzieć, że „układ x∈A nie posiada rozwiązań rzeczywistych, a zatem nie posiada również rozwiązań hiperrzeczywistych, dlatego A* jest pusty”. Przykład 5. Jeśli A = B ∩ C, to A* = B* ∩ C*. W istocie, każdy z układów : x ∈ B, x ∈ C , x ∉ A x ∈A, x∉ B x ∈ A, x ∉ C

Page 19: Co to takiego analiza niestandardowa

19

nie posiada rzeczywistych, a zatem i hiperrzeczywistych rozwiązań. ( ściślej należałoby mówić o analogach tych układów ) Stąd otrzymujemy, że : B* ∩ C* ⊂ A* ( pierwszy układ ) , A* ⊂ B* (drugi ) i A* ⊂ C* ( trzeci ) skąd wynika, że : A* ⊂ B* ∩ C* W charakterze ćwiczenia czytelnik może sprawdzić analogiczne własności innych teorio-mnogościowych operacji : Jeśli A = B ∪ C, to A* = B* ∪ C* , jeśli A = R \ B, to A* = R* \ B* Przypomnijmy, że nasze wymagania odnośnie układu liczb hiperrzeczywistych składały się z dwóch części. Po pierwsze, R* powinno być uporządkowanym ciałem niearchimedesowskim, rozszerzającym R. Po drugie, powinny istnieć analogi dla wszystkich funkcji rzeczywistych, spełniające wymaganiu jednoczesnej rozwiązywalności układu równań. Warunki te okazują się nadwyżkowe – fakt, ze hiperrzeczywiste analogi dodawania, mnożenia itp. Przekształcają R* w ciało, można wyprowadzić z wymogu jednoczesnej rozwiązywalności układów równań. Teraz to pokaże. Przykład 6. Niech a, m – będą funkcjami dodawania i mnożenia liczb rzeczywistych : a(x, y ) = x + y , m( x, y ) = x • y Funkcje a i m ( tak jak I dowolne funkcje o wartościach I argumentach rzeczywistych ) posiadają hiperrzeczywiste analogi a* i m*. Analogi te będziemy rozpatrywali w charakterze dodawania i mnożenia liczb hiperrzeczywistych. W analogiczny sposób, rozpatrując funkcje N ( wzięcie elementu przeciwnego ) i R ( wzięcie elementu odwrotnego ) i ich hiperrzeczywiste analogi, definiujemy analogiczne operacje w R*. ( Istnieje tutaj niewielka subtelność. Rozpatrujemy tylko funkcje określone wszędzie, a funkcja R pierwotnie nie jest określona w 0. Łatwo to poprawić, np. dookreślając ją, przyjmując, że R(0) = 0 ) Pokażemy, że wprowadzone w taki sposób w R* operacje spełniają aksjomaty ciała. Robimy to całkiem prosto. Sprawdzamy przykładowo, że w R* : x( y + z ) = x • y + x • z Ponieważ R jest ciałem, to układ : m( x, a(y,z)) ≠ a(m(x, y) , m(x, z)) nie posiada rozwiązań rzeczywistych. To oznacza, że nie ma on również rozwiązań hiperrzeczywistych tj. wymagana własność jest spełniona również w R*. Analogicznie sprawdzamy pozostałe aksjomaty ciała. Dla przykładu rozpatrzymy jeszcze jeden : x • 1/x = 1 przy x ≠ 0 ( poprzez niego chcieliśmy zilustrować, to że uwzględnienie warunku x ≠ 0 nie sprawia trudności ) Układ : x ≠ 0, m( x, R(x)) ≠ 1 nie posiada rzeczywistych, a zatem i hiperrzeczywistych rozwiązań. Dlatego też nie ma hiperrzeczywistych x, dla których x ≠ 0 i m*( x, R*(x)) ≠ 1 tj. dla wszystkich hiperrzeczywistych x, dla których x ≠ 0, spełnione jest : m*(x, R*(x)) = 1 Przykład 7. Kontynuując taki kierunek powinniśmy przekształcić R* w ciało uporządkowane, wychodząc z wymagania jednoczesnej rozwiązywalności układów w R* i R. Innymi słowy, potrzebujemy hiperrzeczywistego analogu relacji porządku. Relacja porządku na R, jak każda dwuczłonowa relacja, jest pewnym podzbiorem zbioru R× R par liczb rzeczywistych. Dla każdego S ⊂ R × R zdefiniujemy jej analog w następujący sposób ( zobacz przykład 2). Rozpatrzmy funkcje s dwóch rzeczywistych argumentów, dla której s(x, y ) = 0 jest równoważne < x, y > ∈ S. Rozpatrzmy jej hiperrzeczywisty analog s* oraz zbiór S* tych par liczb hiperrzeczywistych <x, y > dla których s*(x, y ) = 0. Tak samo jak w przykładzie 2, łatwo sprawdzić, że zbiór S* zależy tylko od zbioru zer funkcji s. Taką ogólną procedurę można zastosować również do relacji porządku, rozpatrując zbiór Ord tych par < x, y > liczb rzeczywistych, dla których x < y, oraz jej analog Ord* definiując porządek w R* następująco : liczba hiperrzeczywista x jest mniejsza od liczby hiperrzeczywistej y, jeśli para < x, y > należy do Ord*. Teraz do PH wraz z równościami t = s, nierównościami typu s ≠ t i relacją zawierania t ∈ A, możemy dołączyć nierówności postaci t < s oraz t ∠ s. Zapisy te należy rozpatrywać jako skróty od : ord (t, s ) = 0 i ord( t, s ) ≠ 0 Gdzie ord – jest funkcją, której zbiorem zer jest Ord. Łatwo sprawdzić własności relacji porządku. W istocie, układ : x < y , y < x nie posiada rozwiązań rzeczywistych, dlatego jednoczesne spełnienie warunków x < y I y < x nie jest możliwe również dla liczb hiperrzeczywistych. Analogicznie układ x < x nie posiada rozwiązań rzeczywistych i dlatego żadna liczba hiperrzeczywista nie jest mniejsza od samej siebie. Na koniec, rozpatrując układ :

Page 20: Co to takiego analiza niestandardowa

20

x ≠ y , x ∠ y , y ∠ x nie posiadający rozwiązań, przekonujemy się, ze z dowolnych dwóch różnych liczb hiperrzeczywistych jedna jest mniejsza od drugiej. Rozpatrując układ : x < y , x + z ∠ y + z przekonujemy się, ze z x < y wynika x + z < y + z itp. Tym samym R* przekształca się w ciało uporządkowane. Przykład 8. Niech A – będzie dowolnym zbiorem liczb rzeczywistych. Pokażemy, że A ⊂ A*. W istocie, jeśli a ∈ A, a f – jest funkcją o zbiorze zer A ( przykład 2 ), to f(a) = 0, co oznacza f*(a) = 0 tj. a ∈ A*. Przykład 9. Niech A – będzie skończonym zbiorem liczb rzeczywistych. Pokażemy, że w tym przypadku A* = A tj. A* nie zawiera w porównaniu z A żadnych nowych elementów. Niech np. A zawierało trzy liczby rzeczywiste p, q, r. Rozpatrzmy układ : x ≠ p, x ≠ q, x ≠ r , x ∈ A Nie posiada on rozwiązań rzeczywistych, a to oznacza, że nie posiada również rozwiązań hiperrzeczywistych. Jednakże każdy x ∈A*, różny od p, q, r byłby jej rozwiązaniem, to oznacza, że : A* = A Przykład 10. Naturalne pytanie jakie pojawia się po rozpatrzeniu powyższego przykładu jest takie – co będzie dla nieskończonych A ? Widzieliśmy, że każde rzeczywiste x, należące do A należy również do A*. W analogiczny sposób każde rzeczywiste x, nie należące do A, nie należy do A*. Dlatego wszystkie nowe elementy A* w porównaniu z A powinny być niestandardowe. Okazuje się, ze będą one takie, jeśli A jest nieskończone ! Zanim przeanalizujemy taki wniosek, zwracamy uwagę na to, że jest to pierwsza analiza wykorzystująca istnienie nieskończenie małych w R*. Do tej pory odwoływaliśmy się tylko do PH, a zatem wszystkie nasze rozważania były słuszne również dla przypadku R*=R. Dalej dowiedziemy, że jeśli A jest nieskończone, to w A* istnieją elementy niestandardowe ( a zatem, elementy nie należące do A ). Dowód ten jest znacznie bardziej złożony niż dowody jakie spotkaliśmy do tej pory ( które były oczywiste na pierwszy wzgląd ). Jego idee można opisać następująco. Jeśli A jest nieskończone, to istnieje funkcja rzeczywista f, nie ograniczona od góry na A. Wtedy jej analog f* będzie nieograniczony na A*. To oznacza, że pośród x ∈ A* można znaleźć niestandardowe : jeśli wszystkie elementy A* standardowe, to i wszystkie wartości f(x) przy x∈A* byłyby standardowe i zbiór tych wartości byłby ograniczony od góry nieskończenie dużą liczba hiperrzeczywistą. Przeanalizujemy teraz to stwierdzenie dokładniej. Niech A jest nieskończone. Rozpatrzmy funkcje f jednego argumentu rzeczywistego o wartościach rzeczywistych, nie będąca ograniczona od góry na A. ( Aby zbudować taką funkcje wystarczy wybrać przeliczalny podzbiór : Λ’ = {a0 , a1 , ... } , A’ ⊂ Λ i przyjąć f(an ) = n, f(x) = 0 przy x ∉ A’ ). Ponieważ funkcja f nie jest ograniczona, to dla

dowolnego c istnieje takie x ∈ A, że f(x) > c. Oznaczmy takie x przez g(c). Mamy dwie funkcje f, g o następujących własnościach : g(c) ∈ A przy wszystkich rzeczywistych c, przy czym c < f( g(c)). Rozpatrzmy teraz analogi hiperrzeczywiste f* i g* funkcji f i g i dowiedziemy kilku stwierdzeń. 1) g*(c) ∈ A* przy wszystkich hiperrzeczywistych c. W istocie układ g(x)∉ A nie może posiadać rozwiązań hiperrzeczywistych, ponieważ nie miał on rozwiązań rzeczywistych. 2) c < f*(g*(c)) przy wszystkich hiperrzeczywistych c. W istocie, układ x <≠ f(g(x)) nie posiada rozwiązań hiperrzeczywistych, ponieważ nie posiada rozwiązań rzeczywistych. 3) Przy nieskończenie dużym dodatnim c liczba g*(c) jest niestandardowa. W istocie, jeśliby g*(c) była standardową, to i f*( g*(c)) było by standardowe ( f* na liczbach standardowych przyjmuje wartości standardowe ) Jednakże to jest sprzeczne z nierównością c < f*( g*(c)) oraz tym, że c – jest dodatnią liczbą nieskończenie dużą. Zatem, g*(c) przy nieskończenie dużym c reprezentuje sobą niestandardową liczbę hiperrzeczywistą, należącą do A*, czego chcieliśmy dowieść. Zwróćcie uwagę, na powyższe stwierdzenie, mimo, że na pierwszy wzgląd może się ono wydać nieco dziwne, to wykorzystywany w nim sposób postępowania będzie dla nas jeszcze użyteczny.

Page 21: Co to takiego analiza niestandardowa

21

Rozdział 7 Ograniczenia i granice. W poprzednim rozdziale pokazaliśmy, że dowolny zbiór skończony liczb rzeczywistych A jest równy swojemu analogowi hiperrzeczywistemu A* ( a zatem, A* składa się tylko z elementów standardowych ), a dla dowolnego nieskończonego A zbiór A* zawiera elementy niestandardowe. Fakt ten można rozważać z kilku punktów widzenia. Można go przyjąć jako własność charakterystyczną układu liczb hiperrzeczywistych. Inny punkt widzenia, wydający się na pierwszy wzgląd jako nienaturalny, a nawet absurdalny polega na tym, aby zobaczyć w takiej własności definicje skończoności zbioru. Wyobraźmy sobie na chwilę, że nie wiemy co to są zbiory skończone i nieskończone. Wtedy możemy zdefiniować zbiór nieskończony, jako taki zbiór A, którego hiperrzeczywisty analog A* zawiera elementy niestandardowe. Możemy nawet dowieść różnych własności zbiorów nieskończonych , wychodząc od takiej definicji. Dowiedziemy przykładowo, że jeśli C = A ∪ B, jest zbiorem nieskończonym, to co najmniej jeden ze zbiorów A lub B jest nieskończony. Jak bowiem zauważyliśmy w poprzednim paragrafie , jeśli C* = A* ∪ B*, to z definicji C* zawiera element niestandardowy, co oznacza, ze powinien go zawierać w skrajnym przypadku jeden ze zbiorów A* i B*. Analiza ta wygląda na absurdalną – dowodzimy oczywistego faktu z wykorzystaniem zagadkowego hiperrzeczywistego rozszerzenia, samo istnienie którego póki co budzi wątpliwości ! Zgodzicie się jednak, ze mimo swej absurdalności ( lub właśnie dzięki niej ), analiza ta wydaje się bardzo obiecująca. Doceniając taki fakt, można przyjąć iż czytelnik zaczyna rozumieć siłę analizy niestandardowej. Wszystko co dalej pokaże będzie polegało na zastosowaniu tej właśnie idei w innych sytuacjach . Nasz pierwszy przykład zastosowania analizy niestandardowej, to niestandardowy dowód następującego ( bardzo standardowy ) : Każdy ograniczony nieskończony zbiór liczb rzeczywistych posiada punkt graniczny. Dowód będzie polegał na tym, że podamy nowe niestandardowe ( ale, oczywiście równoważne stwierdzeniom standardowym ) definicje zbioru ograniczonego i punktu granicznego, po czym dane twierdzenie stanie się prawie oczywiste. Jednakże na początku przypomnimy standardowe definicje. Zbiór A liczb rzeczywistych nazywa się ograniczonym, jeśli zawiera się on w pewnym odcinku tj. jeśli istnieją takie liczby rzeczywiste p i q, że p ≤ x ≤ q dla wszystkich x ∈ A. Punkt a nazywa się punktem granicznym, zbioru A, jeśli dla każdego dodatniego ε w interwale ( a – ε, a + ε ) znajdziemy punkt zbioru A, różny od x. Niestandardowa definicja ograniczoności jest bardzo prosta – A jest ograniczony jeśli A* nie zawiera nieskończenie dużych liczb hiperrzeczywistych. Pokażemy, że taka definicja jest równoważna definicji standardowej. Niech A będzie zbiorem ograniczonym w standardowym sensie, tj. będzie zawarty w pewnym odcinku [p, q]. Wtedy układ : x ∈ A, x > q nie posiada rozwiązań rzeczywistych, dlatego też nie ma rozwiązań hiperrzeczywistych, a zatem wszystkie elementy a* nie większe niż q ( w sensie porządku istniejącego na liczbach hiperrzeczywistych ). W analogiczny sposób wszystkie elementy A* są nie mniejsze niż p. Dlatego też wszystkie elementy A* są skończone. Teraz należy pokazać stwierdzenie odwrotne. Niech A będzie zbiorem nieograniczonym ( w standardowym sensie ). Wtedy albo dla każdego rzeczywistego p znajdziemy x∈A, dla którego x < p ( A jest nieograniczony z dołu ), albo dla każdego rzeczywistego q znajdziemy x ∈A, dla którego x > q ( A jest nieograniczony z góry ). Niech przykładowo A będzie zbiorem nieograniczonym z góry. Rozpatrzmy funkcje f, która względem każdego q q, daje x ∈A, dla którego x > q. Innymi słowy f(q)∈ A i f(q) > q przy wszystkich rzeczywistych q. Wtedy f*(q)∈ A* ( układ f(q) ∉A nie posiada rozwiązań ) i f*(q) > q ( układ f(q) ≠> q nie posiada rozwiązań ) przy wszystkich hiperrzeczywistych q. Biorąc q jako dodatnie i nieskończenie duże, przekonujemy się, że f*(q) jest wielkością nieskończenie dużą ( ponieważ f*(q) > q ) i należy do A. Zatem, A nie jest zbiorem ograniczonym w sensie definicji hiperrzeczywistej. Podamy teraz hiperrzeczywistą definicję punktu granicznego. Liczba standardowa a nazywa się punktem granicznym zbioru A liczb rzeczywistych, jeśli A* zawiera niestandardową liczbę hiperrzeczywistą, nieskończenie bliską a. ( uwaga. „niestandardową” ponieważ jeśli by jej nie było, to każdy element A był by punktem granicznym A ) Dowiedziemy teraz, że taka definicja jest równoważna definicji standardowej. Niech a – będzie punktem granicznym zbioru A w sensie standardowej definicji. Wtedy dla każdego rzeczywistego ε > 0 istnieje takie x∈A, że x ≠ a i x ∈ ( a – ε, a + ε ). Rozpatrzmy funkcje f, która daje jedno z takich x względem ε ( przy ε ≤ 0 dookreślimy ją dowolnie ). Wtedy dla wszystkich ε > 0 mamy : f(ε) ∈ A, f(ε)≠ a, f(ε) < a + ε , f(ε) > a – ε Każda z tych zależności jest zachowana po przejściu do liczb hiperrzeczywistych – dla wszystkich ε ∈R* , ε > ) mamy bowiem : f*( ε) ∈ A* , f*( ε)≠ a , f*(ε) < a + ε , f*(ε) > a – ε ( wystarczy rozpatrzyć cztery układy, każdy z których nie posiada rozwiązań względem ε :

Page 22: Co to takiego analiza niestandardowa

22

f(ε) ∉ A , ε > 0 ; f(ε) = a , ε > 0 f(ε) <≠ a + ε , ε > 0 ; f(ε) ≠> a – ε, ε > 0 ) Weźmy dodatnie nieskończenie małe ε. Wtedy f*(ε) będzie elementem A*, różnym od a. Oprócz tego, f*(ε) jest nieskończenie bliskie a, ponieważ różnica f*(ε) – a jest zawarta pomiędzy ε i –ε, zatem jej moduł jest mniejszy niż ε i jest mniejszy od dowolnej standardowej liczby dodatniej. Zatem równoważność definicji jest już w połowie dowiedziona. Dowiedziemy teraz stwierdzenia odwrotnego. Załóżmy, że a nie jest punktem granicznym w sensie definicji standardowej. Wtedy możemy znaleźć takie ε > 0, że w interwale ( a – ε, a + ε ) nie ma punktów zbioru A, różnych od a. Innymi słowy, układ : x > a – ε , x < a + ε , x ≠ a, x ∈ A ( rozpatrywany jako układ względem x ) nie posiada rozwiązań. ( zwróćcie uwagę na to, że w odróżnieniu od poprzedniego rozważania, ε w tym układzie nie jest zmienną , tylko stałą – taką stałą, jak a ). Zgodnie z PH taki układ nie ma również rozwiązań hiperrzeczywistych, jednakże dowolny niestandardowy element A*, nieskończenie bliski do a, byłby jej hiperrzeczywistym rozwiązaniem. Dlatego a nie jest punktem granicznym zbioru A w sensie definicji hiperrzeczywistej. Teraz jesteśmy już gotowi, aby zakończyć dowód sformułowanego na początku tego paragrafu stwierdzenia. Niech A – będzie ograniczonym nieskończonym zbiorem liczb rzeczywistych. Ponieważ A jest nieskończone, A* zawiera niestandardowy element s ( taka jest hiperrzeczywista definicja nieskończoności ). Ponieważ A jest zbiorem ograniczonym, to s – jest skończona liczba hiperrzeczywistą ( na mocy hiperrzeczywistej definicji ograniczoności ). Taka jak każda skończona liczba s posiada cześć standardową a – standardową liczbę nieskończenie bliską s. To ona właśnie jest punktem granicznym zbioru A ( na mocy hiperrzeczywistej definicji punktu granicznego ) Widzimy, że dowód ten jest prawie że trywialny, można oczywiście powiedzieć, iż całą trudność przeniesiono na dowiedzenie równoważności standardowej i hiperrzeczywistej definicji nieskończoności, ograniczoności i punktu granicznego. Jednakże stronnik analizy niestandardowej powie, że definicje standardowe nie są mu w ogóle potrzebne, od początku do końca należy wykorzystywać definicje niestandardowe. Przy takim podejściu zagadnienie równoważności oczywiście nie pojawia się. Dalej podamy kilka przykładów, które być może pomogą czytelnikowi zbudować własne zdanie na temat analizy niestandardowej. Spojrzymy mianowicie z hiperrzeczywistego punktu widzenia na pojęcia, tradycyjnie otwierające wykład analizy matematycznej – pojęcie ciągu i granicy. Ciągiem nazywamy funkcje, która przyporządkowuje każdej liczbie naturalnej n, pewną liczbę rzeczywistą, nazywaną n-tym wyrazem ciągu. Naturalnym jest oczekiwać, że hiperrzeczywisty analog ciągu będzie przyporządkowaniem każdej liczbie naturalnej n pewnej liczby hiperrzeczywistej. Dalej podamy dokładniejszą definicję. Rozpatrzmy zbiór N – liczb naturalny oraz jego hiperrzeczywisty analog N*. Elementy zbioru N* będziemy nazywali liczbami hipernaturalnymi. Łatwo zauważyć, ze wszystkie niestandardowe hipernaturalne liczby są nieskończenie wielkie. Dla dowolnej liczby standardowej q układ : x∈ N , x ≤ q , x ≠ 0 , ... x ≠ q gdzie q - oznacza całkowitą cześć q ( największą liczbę całkowitą nie przewyższającą q ) nie posiada rozwiązań. Dlatego tez każda liczba hipernaturalna, nie większa od q, powinna pokrywać się z jedną z liczb 0 , ... , q , a zatem powinna być ona standardowa. Ponieważ q można wybrać dowolnie, otrzymujemy fakt, że każda skończona liczba hipernaturalna jest standardowa. Dlatego też wszystkie niestandardowe hipernaturalne liczby są nieskończenie wielkie. Takie nieskończenie duże hipernaturalne liczby istnieją rzeczywiście – wystarczy wziąć funkcje : f(x) = x + 1 aby przekonać się, że układy f(x)∉ N i f(x) < x nie posiadają rozwiązań ( a zatem f*(x) ∈ N* i f*(x) ≥ x dla wszystkich hiperrzeczywistych x ) , a następnie wziąć f*(a) dla nieskończenie dużego a. Niech a0 , a1 , ... – będzie dowolnym ciągiem. Rozpatrzmy funkcje α, dla której α(i) = ai przy naturalnym i, wartości α(x)

przy x, nie będącymi liczbami naturalnymi mogą być wybrane dowolnie. Rozpatrzmy teraz wartości α* na liczbach hipernaturalnych. Funkcje przyporządkowująca każdej liczbie hiperrzeczywistej wartość funkcji α* na niej, będziemy nazywali hiperrzeczywistym analogiem ciągu a. Będziemy wykorzystywali pewną dowolność, nazywając α*(ω) ( przy hipernaturalnych ω ) ω-tym członem ciągu a i oznaczymy go jako aω. Zatem, przy przejściu z obszaru rzeczywistego do

hiperrzeczywistego dla każdego ciągu „wyrasta hiperrzeczywisty” ogon.

Page 23: Co to takiego analiza niestandardowa

23

Aby powyższa procedura była poprawna, należy sprawdzić tylko, że wartość aω przy hiperrzeczywistym ω nie jest zależna

od wyboru funkcji α. Istotnie – niech α1 i α2 – będą dwiema funkcjami, pokrywającymi się na argumentach naturalnych. Wtedy układ :

x ∈ N , α1(x) ≠ α2(x)

nie posiada rozwiązań, a zatem α*1 i α*2 pokrywają się na wszystkich argumentach hipernaturalnych.

Teraz powinniśmy w sposób systematyczny sformułować definicje różnych własności ciągów w języku hiperrzeczywistym. Rozpoczniemy od najprostszej własności – ograniczoności. Oto standardowa definicja : Ciąg a0 , a1 , ... – jest ograniczony, jeśli możemy znaleźć takie liczby rzeczywiste p, q, że p ≤ ai ≤ q dla wszystkich i.

Przypominając sobie treść poprzedniego paragrafu ( hiperrzeczywisty wariant definicji ograniczoności dla zbiorów ), można założyć, że ciąg jest ograniczony wtedy i tylko wtedy, kiedy wszystkie jego człony ( zarówno naturalne jak i hipernaturalne ) są skończone ( tj. an – jest skończoną liczbą hiperrzeczywistą dla wszystkich n ∈ N* )

Dowód równoważności jest prawie że taki sam jak dla zbiorów. Niech a = a0 , a1 , ... – będzie ciągiem ograniczonym w

standardowym sensie oraz p ≤ an ≤ q dla wszystkich ( standardowych) naturalnych n. Wtedy każdy z układów :

n ∈ N , an < p

n ∈ N , an > q

nie posiada rozwiązań. ( bardziej formalnie należałoby zapisać nie an < p i an > q,a raczej α(n) < p i α(n) > q, gdzie α -

funkcja przedłużająca a na argumenty, nie będące naturalnymi ) Dlatego an ≥ p i an ≤ q dla wszystkich hipernaturalnych n ( w tym i niestandardowych ), dlatego an jest skończony.

Dowiedziemy teraz twierdzenia odwrotnego. Niech ciąg a = a0 , a1 , ... – będzie ciągiem nieograniczonym. Wtedy jest on

albo nieograniczony z góry ( tj. dla każdego rzeczywistego q znajdziemy takie naturalne n, że an > q ), albo jest on

nieograniczony od dołu ( tj. dla każdego p znajdziemy takie n, dla którego an < p )

Niech przykładowo, będzie on nieograniczony z góry. Rozpatrzmy funkcje N, która daje n po q, tj. N(q) ∈ N i aN(q) > q

dla wszystkich rzeczywistych q. Postępując w standardowy sposób, otrzymujemy iż dla wszystkich hiperrzeczywistych q słuszne są zależności : N*(q) ∈ N* i aN*(q) > q

Biorąc q nieskończenie duże i dodatnie, przekonujemy się, że przy n = N(q) hiperrzeczywista liczba an będzie

nieskończenie duża. Zatem, równoważność standardowej i niestandardowej definicji ograniczoności ciągów jest dowiedziona. Postarajmy się jednak przypomnieć sobie jak wyobrażaliśmy sobie granicę, kiedy rozpoczynaliśmy naukę analizy matematycznej. Takie sformułowanie wydaje się najbardziej prawdopodobne : „liczba a jest granicą ciągu x0 , x1 , ... jeśli nieskończenie dalekie człony takiego ciągu są nieskończenie bliskie a”

Teraz możemy ja wykorzystać zupełnie dosłownie : Nieskończenie dalekie człony – to xn z nieskończenie dużymi hipernaturalnymi n, a nieskończona bliskość xn do a

oznacza, że xn – a jest nieskończenie małe.

Jedyna okoliczność wymagająca uściślenia jest taka – czy wymagamy, aby wszystkie nieskończenie dalekie człony były nieskończenie bliskie a, czy też wystarczającym jest, aby niektóre z nich były takie. Okazuje się, że oba warianty odpowiedzi na powyższe pytanie prowadzą do zadowalających pojęć : pierwsza ( „wszystkie” ) daje nam definicje granicy, a druga ( „niektóre” ) daje nam definicje punktu granicznego. Do punktów granicznych jeszcze powrócimy, a obecnie dowiedziemy równoważności dwóch definicji granicy : Definicja standardowa. Liczbę a nazywamy granicą ciągu x0, x1, x2, ...

jeśli dla dowolnego ε > 0 znajdziemy takie M, że dla wszystkich naturalnych n ≥ M spełniona jest nierówność : | xn – a | < ε.

Definicja hiperrzeczywista. Liczbę a nazywamy granica ciągu x0, x1, x2, ...

jeśli dla dowolnej nieskończenie dużej liczby hipernaturalnej n, różnica xn – a jest nieskończenie mała.

Przypominamy, że w obu tych definicjach liczby a i xi są liczbami standardowymi. Niech a jest granicą ciągu x0, x1, x2, ...

według definicji standardowej, n – niech będzie nieskończenie dużą liczbą hipernaturalną. Dowiedziemy, że xn – a jest

nieskończenie małe, tj. że | xn – a | < ε dla dowolnego dodatniego standardowego ε. W istocie, niech ε > 0 – będzie liczbą

standardową. Wtedy zgodnie z definicją znajdziemy taką liczbę standardową M, że dla wszystkich liczb standardowych n > M będzie spełniona nierówność | xn – a | < ε

Page 24: Co to takiego analiza niestandardowa

24

Wtedy to będzie ona spełniona również dla nieskończenie dużych hipernaturalnych n. ( ponieważ układ n ∈ N, n > M, | xn – a | ≥ ε nie posiada rozwiązań ), co właśnie potrzebowaliśmy.

Teraz dowiedziemy stwierdzenia odwrotnego. Niech a nie będzie granicą ciągu x0, x1, x2, ...

( w sensie definicji standardowej ). To oznacza, że dla pewnego ( standardowego ) rzeczywistego ε > 0 i dla dowolnego M możemy znaleźć ( standardowe ) naturalne n ≥ M, dla którego | xn – a | ≥ ε.

Rozpatrzmy dalej funkcje f, dającą n po M, tj. taką funkcje, że f(M) ∈N, f(M) ≥ M i | xf(M) – a | ≥ ε dla dowolnego

rzeczywistego M. Weźmy n = f*(M) dla nieskończenie dużej liczby hiperrzeczywistej M. Wtedy n ∈ N*, n ≥ M i | xn – a | ≥ ε

( dowodzimy tego w standardowy sposób z pomocą odpowiednich układów, nie posiadających rozwiązań ) Wtedy n – jest nieskończenie dużą liczbą hipernaturalną, a | xn – a | ≥ ε, gdzie ε - standardowa dodatnia liczba, zatem xn

nie jest nieskończenie bliskie a. Zatem, niestandardowa definicja granicy również nie jest spełniona. Dowodząc równoważności standardowej i niestandardowej definicji granicy, możemy się przekonać jak wyglądają niestandardowe dowody standardowych twierdzeń. Rozpoczniemy od najprostszych z nich. Jednoznaczność granicy. Dowiedziemy, że ciąg x0, x1, x2, ... nie może posiadać dwóch różnych granic a i b. W istocie w

tym przypadku xn przy nieskończenie dużym hipernaturalnym n powinno być nieskończenie bliskie zarówno a jak i b,

dlatego a i b są nieskończenie bliskie. A ponieważ są one standardowe to a = b. Monotoniczność granicy. Dowiedziemy, że jeśli xn ≤ yn dla wszystkich n i xn → a, yn → b, to a ≤ b.

W istocie, niech n – będzie nieskończenie dużą hipernaturalną liczbą. Wtedy a = St(xn ), b = St(yn ) ( przez St(p ) –

oznaczamy standardową część skończonej liczby hiperrzeczywistej p ). Ponieważ xn ≤ yn przy wszystkich standardowych

n, to nierówność ta jest słuszna również dla wszystkich hipernaturalnych n. Łatwo sprawdzić również, że z p ≤ q wynika St(p) ≤ St(q). Dlatego a = St(xn ) ≤ St(yn ) = b.

Granica sumy. Dowiedziemy teraz, że jeśli zn = xn + yn , xn → a, yn → b, to zn → a + b.

W istocie, równość zn = xn + yn , jest słuszna dla wszystkich naturalnych, a to oznacza, ze również dla wszystkich

hipernaturalnych n. Dlatego zn przy nieskończenie dużym n jest równe :

xn + yn = a + ( nieskończenie małe ) + b + ( nieskończenie małe )

Jak już widzieliśmy, suma nieskończenie małych jest nieskończenie mała, dlatego zn jest nieskończenie bliskie a + b przy

nieskończenie dużych hipernaturalnych n. Analogicznie można pokazać, że granica iloczynu jest równa iloczynowi granic ( przy tym wykorzystamy ten fakt, że iloczyn nieskończenie małego i skończonego liczb hiperrzeczywistych jest nieskończenie mały ) Zbieżność ciągu monotonicznie ograniczonego. Niech x0 ≤ x1 ≤ ... – będzie monotonicznie niemalejącym i ograniczonym

ciągiem. Dowiedziemy, że ma on granicę. Wszystkie jego człony nieskończenie dalekie są skończone ( zgodnie z definicją ograniczoności ). Pozostaje dowieść tylko, że ich części standardowe są równe. Niech m i n – będą dwiema nieskończenie dużymi liczbami hipernaturalnymi i niech St(xm ) ≠ St( xn )

Niech dla określoności m < n. Wtedy St(xm ) < St( xn ) z założenia, a St(xm ) > St( xn ) jest niemożliwe, ponieważ w tym przypadku xm > xn, co byłoby

sprzeczne z monotonicznością ciągu ). Rozpatrzmy (standardową ) liczbę a, dla której St(xm ) < a < St( xn ).

Wtedy xm < a ; xn > a. Wszystkie człony xk ze standardowym k spełniają nierówność xk < a ( ponieważ xk ≤ xm na mocy

monotoniczności ciągu, a xm < a )

Dlatego układ xk > a nie posiada rozwiązań naturalnych, ale ma rozwiązanie hipernaturalne ( k = n ). Otrzymana

sprzeczność pokazuje, że założenie St(xm ) ≠ St( xn ) jest fałszywe co chcieliśmy pokazać.

Teraz przejdziemy do pojęcia punktu granicznego ciągu. Standardowa jego definicja jest taka : a nazywamy punktem granicznym ciągu x0, x1, ... jeśli dla każdego dodatniego ε i każdego N znajdziemy takie naturalne

n ≥ N, przy którym | xn – a | < ε. Dalej dowiedziemy, że taka standardowa definicja jest równoważna ( już wspomnianej )

definicji niestandardowej : a nazywamy punktem granicznym ciągu {xn }, jeśli przy pewnym nieskończenie dużym hipernaturalnym n, liczba xn jest

nieskończenie bliska a.

Page 25: Co to takiego analiza niestandardowa

25

Niech spełniona będzie definicja standardowa. Rozpatrzmy standardowo postępując funkcje, dającą n po ε, N, tj. taką funkcje f, że (przy ε > 0 i dowolnym N ) spełnione są następujące własności : F(ε1, N) ∈ N, f(ε1 , N) > N

oraz | xf(ε,N) – a | ≤ ε

Standardowe postępowanie pokazuje, ze przy dowolnej dodatniej hiperrzeczywistej ε i przy dowolnej liczbie hipernaturalnej N, liczba n = f*(ε, N) będzie liczbą hipernaturalną, większą od N i taką, że | xn – a | ≤ ε.

Biorąc ε > 0 jako nieskończenie małą, a N jako nieskończenie dużą i dodatnią, znajdziemy nieskończenie dużą hipernaturalną liczbę n, dla której | xn – a | jest nieskończenie mała, co właśnie chcieliśmy dowieść.

I odwrotnie, niech definicja standardowa nie będzie spełniona. Wtedy znajdziemy takie ε > 0 i N, że | xn – a | ≥ ε dla

wszystkich naturalnych n ≥ N, zatem | xn – a | ≥ ε dla wszystkich hipernaturalnych n, większych od N. Ponieważ wszystkie

nieskończenie duże hipernaturalne n są takie ani jeden z elementów xn przy nieskończenie dużych n nie może być

nieskończenie blisko a ( różnica | xn – a | jest większa od dodatniej standardowej liczby ε )

Zatem, dowiedliśmy równoważności definicji standardowej i niestandardowej punktu granicznego. W charakterze bezpośredniego następstwa otrzymujemy dowód następującego twierdzenia : Każdy ciąg ograniczony posiada punkt graniczny. W istocie – rozpatrzmy dowolny człon takiego ciągu z dużym numerem. Będzie on skończoną liczbą hiperrzeczywistą ( ciąg jest ograniczony ), a jej część standardowa będzie punktem brzegowym. 8. Funkcje ciągłe i zwartość. Następnym tradycyjnym tematem wykładu analizy matematycznej są własności funkcji ciągłych. Podtrzymując tą tradycje, podamy niestandardową definicje ciągłości. Definicja ta, podobnie jak definicja granicy prawie dosłownie odtwarza „naiwną” definicje ( wspomnianą w punkcie 1 ) : Funkcja f jest ciągła w punkcie x, jeśli jej wartość w punktach nieskończenie bliskich x jest nieskończenie bliskie wartości funkcji w punkcie x : x' ≈ x ⇒ f(x’) ≈ f(x) ( symbol ≈ oznacza nieskończoną bliskość ) Powyższa definicja wymaga uściślenia dla następujących okoliczności – czy x powinno być liczbą standardową ? Co robić, jeśli f – nie jest funkcją wszędzie określoną ? Podamy teraz ścisłą definicję. Niech f – będzie funkcją o wartościach rzeczywistych, zdefiniowaną na pewnym zbiorze M liczb rzeczywistych ( rozpatrujemy funkcje jednego argumentu, a czytelnik może się przekonać, że przypadek kilku argumentów nie jest bardziej złożony ) Zbudujemy hiperrzeczywisty analog funkcji f - funkcje f*, zdefiniowana na zbiorze M* i przyjmującą wartości hiperrzeczywiste. Będziemy postępowali dokładnie tak samo jak dla przypadku ciągów ( kiedy M było równe N ) Weźmy dowolne przedłużenie F funkcji f na wszystkie liczby rzeczywiste, pokrywającymi się z f na M i dowolnymi na zbiorze R\ M. Weźmy teraz hiperrzeczywisty analog F* funkcji F i ograniczymy go na M* tj. będziemy interesowali się jej wartościami tylko na elementach zbioru M*. Łatwo sprawdzić, że otrzymana funkcja będzie określona przez funkcje f i nie będzie zależeć od tego, jakiekolwiek przedłużenie F, tej funkcji byśmy nie wzięli. W istocie, jeśli F1 i F2 – są dwiema przedłużeniami funkcji f, to układ :

x ∈ M, F1(x) ≠ F2(x)

nie posiada rozwiązań rzeczywistych. Dlatego nie posiada on również rozwiązań hiperrzeczywistych, tj. F*1(x) = F*2(x)

dla wszystkich x ∈ M*. Zatem, dla każdej funkcji f o wartościach rzeczywistych, określonej na pewnym zbiorze M liczb rzeczywistych, mamy hiperrzeczywisty analog f* o obszarze określoności M* i wartościach hiperrzeczywistych. Niech f : M → R – będzie dowolną funkcją. Zdefiniujemy co oznacza ciągłość f w punkcie x ∈ M. ( Zwróćcie uwagę : x – jest punktem standardowym O takim fakcie przypomnimy omawiając ciągłość równomierną ) Dokładnie – oznacza to, że dla każdej liczby hiperrzeczywistej x’∈ M*, dla której x’ ≈ x, słuszne jest f*(x’ ) ≈ f(x).

Page 26: Co to takiego analiza niestandardowa

26

Teraz powinniśmy pokazać, ze taka definicja jest równoważna definicji standardowej. Przypomnijmy definicje standardową. Funkcja f : M → R nazywa się ciągłą w punkcie x ∈ M, jeśli dla każdego ε > 0 istnieje takie δ > 0, ze dla wszystkich x’∈M, dla których | x’ – x | < δ , słuszna jest nierówność | f(x’) – f(x) | < ε. Niech funkcja f będzie ciągła w sensie definicji standardowej. Niech x’∈ M* i x’ ≈ x; pokażemy że f*(x’ ) ≈ f(x) , tj. iż dla dowolnego standardowego ε > 0 słuszne jest | f*(x’ ) – f(x) | < ε Ponieważ funkcja f jest ciągła w sensie standardowym, to znajdziemy takie δ > 0, że dla wszystkich standardowych x’∈M, dla których | x’ – x | < δ, spełnione jest | f(x’) – f(x) | < ε. Analiza do jakiej jesteśmy już przyzwyczajeni pokazuje, że i dla wszystkich hiperrzeczywistych x’, dla których x’ ∈M* i | x’ – x | < δ spełniona jest nierówność | f*(x’ ) – f(x) | < ε. Do takich przypadków x’ odnoszą się oczywiście, wszystkie nieskończenie bliskie ku x elementy M*. I odwrotnie, niech f nie będzie funkcją ciągłą w standardowym sensie. Wtedy możemy znaleźć takie ε > 0, że przy dowolnym δ > 0 możemy znaleźć x’∈M, dla którego | x’ – x | < δ i | f(x’ ) – f(x) | ≥ ε. Tak jak to zwykle robiliśmy, rozpatrzymy x’ jako funkcje δ, tj. rozpatrzymy funkcje X, dla której dla wszystkich δ> 0 spełnione są następujące własności : X(δ) ∈ M, | X(δ) – x | < δ i | f( X(δ) – f(x) | ≥ ε Teraz x’ = X*(δ) , gdzie δ - jest dodatnią nieskończenie małą liczbą; będzie liczbą hiperrzeczywistą, dla której | x’ – x | = | X*(δ) – x | < δ i dlatego x’ ≈ x, ale : | f*(x’) – f(x) | = | f*( X*( δ)) – f(x) | ≥ ε i dlatego f*(x’) ≈≠ f(x) Zobaczmy teraz, jakie dowody otrzymują teraz twierdzenia o funkcjach ciągłych, dowodzone na wykładzie analizy standardowej. Ciągłość sumy funkcji ciągłych. Niech f, g – będą funkcjami, określonymi na zbiorze M i ciągłe w punkcie x. Wtedy ich suma : h : h(u) = f(u) + g(u) jest ciągła w punkcie x. W istocie – jeśli x’ ≈ x, x’ ∈ M*, to h*(x’ ) = f*(x’) + g*(x’) ≈ f(x) + g(x) = h(x) ( wykorzystaliśmy tutaj to, że a ≈ b i c ≈ d pociąga a + c ≈ b + d Wynika to z własności nieskończenie małych, które omawialiśmy w punkcie 3 ) Ograniczoność funkcji ciągłej na odcinku. Niech f – będzie funkcją określoną i ciągłą we wszystkich punktach odcinka I = [a, b] . Dowiedziemy, że jest ona ograniczona. Łatwo pokazać ( zobacz niestandardowa definicja ograniczoności zbioru i ciągu ), że ograniczoność funkcji f jest równoważna temu, że f*(x) jest skończona dla wszystkich x ∈ I*. Łatwo zauważyć , że I* składa się ze wszystkich liczb hiperrzeczywistych z, dla których a ≤ z ≤ b. Wszystkie one są skończona i cześć standardowa St(z) należy do [a, b] ( jeśli St(z) < a, to z < a, a jeśli St(z) > b, to z > b ) Na mocy ciągłości w punkcie St(z) z z ≈ St(z) wynika, że f*(z) ≈ f( St(z)), ponieważ f(St(z)) jest standardowe, to f*(z) jest skończone. Czytelnik może sprawdzić własne wiadomości, odpowiadając na pytanie : Dlaczego taka analiza nie będzie słuszna w przypadku odcinka otwartego (a, b) zamiast odcinka zamkniętego [a, b] ? ( dla odcinka otwartego stwierdzenie powyższe nie jest prawdziwe – funkcja y = 1/x jest określona i ciągła, ale nie jest ona ograniczona na odcinku (0, 1) ) Problem w tym, że wykorzystaliśmy ciągłość f w punkcie St(z), a zatem wymagaliśmy aby St(z) należała do obszaru określoności funkcji. Dla odcinka (a, b) tak nie jest – jeśli z = a + ε, gdzie ε > 0 – nieskończenie mała, to z należy do obszaru określoności f*, podczas gdy St(z) nie. Twierdzenie o wartościach pośrednich. Jeśli f – jest funkcją ciągłą na odcinku [a, b] i f(a) > 0, f(b) < 0, to istnieje taka liczba rzeczywista x ∈ [a, b], że f(x) = 0. Dowiedziemy tego stwierdzenia. Rozpoczniemy od prostego spostrzeżenia ( w żaden sposób nie związanego z liczbami hiperrzeczywistymi ). Rozbijemy odcinek [a, b] na n równych części i będziemy analizowali znaki f w punktach rozbicia. Jeśli choćby w jednym z nich f była równa 0, to nie musimy dowodzić niczego dalej, jeśli nie, to znajdziemy taki odcinek rozbicia, na końcach którego f posiada różne znaki. Oznaczymy końce tego rozbicia przez xn i yn. Wtedy słuszne są takie stwierdzenia :

| xn – yn | = ( b – a)/n , xn , yn ∈ [a, b], f(xn ) > 0 , f(yn ) < 0.

Teraz przypominamy sobie o liczbach hiperrzeczywistych i weźmiemy człony nieskończenie dalekie ciągu xn i yn.

Page 27: Co to takiego analiza niestandardowa

27

Niech N – będzie nieskończenie dużą liczbą hipernaturalną. Wtedy : | xN – yN | = ( b – a)/N

jest nieskończenie małą dlatego xN ≈ yN i St(xN ) = St(yN ). Ponieważ xN , yN ∈ [a, b], to

x = St(xN ) = St(yN ) ∈ [a, b]

Na mocy ciągłości f(x) jest nieskończenie bliskie liczbie dodatniej f*(xN ) i ujemnej f*(yN ).

Jedyną liczbą standardową, dla której jest to możliwe jest zero. To oznacza iż f(x) = 0, co chcieliśmy dowieść. Teraz przeanalizujemy pojęcie funkcji monotonicznie ciągłej. Zgodnie z definicją standardową funkcja f. Określona na zbiorze M ⊂ R, nazywa się monotonicznie ciągłą, jeśli dla każdego ε > 0 można znaleźć takie δ > 0, że z x , y ∈ M , | x – y | < δ wynika | f(x) – f(y) | < ε Definicja niestandardowa wymaga, aby dla dowolnych nieskończenie bliskich hiperrzeczywistych x, y ∈ M* wartości f*(x) i f*(y) były nieskończenie bliskie. Na pierwszy wzgląd na taką definicje niestandardowej monotonicznej ciągłości wydaje się, że nie różni się ona od definicji ciągłości w dowolnym punkcie zbioru M. Jest jednakże ważna różnica – w definicji ciągłości w punkcie x, punkt x był obowiązkowo standardowy, a w definicji monotonicznej ciągłości oba punkty x i y mogą być hiperrzeczywiste. Dowód równoważności definicji standardowej i niestandardowej jest analogiczny do wcześniejszych. Jeśli f jest funkcją monotonicznie ciągłą ( w sensie standardowym ), a x i y są nieskończenie bliskie, to | f*(x) – f*(y) | jest mniejsze od dowolnego standardowego ε ( wybierzemy δ > ε i wykorzystując podaną definicje zauważymy, że | x – y | < δ ). Jeśli f nie jest funkcją monotonicznie ciągłą w standardowym sensie, to znajdziemy takie ε > 0, że dla dowolnego δ > 0 można znaleźć x i y takie że | x – y | < δ , | f(x) – f(y) | ≥ ε Rozpatrzmy teraz takie x i y jako funkcje δ i podstawimy w miejsce δ liczbę nieskończenie małą. Wtedy : | x – y | < δ, x ≈ y , ale | f*(x) – f*(y) ≥ ε f*(x) ≠≈ f*(y) Teraz przytoczone w punkcie 1 rozumowanie ( praktycznie bez zmian ) można rozpatrywać jako w pełni ścisły dowód twierdzenie mówiącego o tym, że każda funkcja ciągła na odcinku jest monotonicznie ciągła. W istocie – niech f będzie określona i ciągła na [a, b]. Dowiedziemy jej monotonicznej ciągłości. Niech x, y – będą dowolnymi nieskończenie bliskimi hiperrzeczywistymi liczbami należącymi do [a, b]*, tj. a ≤ x, y ≤ b. Wtedy St(x) i St(y) są równe, oznaczmy ich ogólną wartość przez c. Jest jasne, że c ∈[a, b] ( ważne jest to, mamy odcinek zamknięty, a nie otwarty ) Wtedy ( na mocy ciągłości w punkcie c ) f*(x) ≈ f(c), f*(y) ≈ f(c), a zatem f*(x) ≈ f*(y)) Zatem dowiedliśmy monotonicznej ciągłości. Do tej pory rozpatrywaliśmy własności funkcji ciągłych, określonych na odcinkach zamkniętych prostej rzeczywistej. Jak wiadomo ze standardowych wykładów analizy matematycznej, wiele z własności takich funkcji pozostaje nadal słuszne dla funkcji określonych na dowolnych zbiorach zwartych. W niniejszym punkcie pokażemy, w jaki sposób odpowiednie twierdzenia mogą być otrzymane za pomocą metod analizy niestandardowej. Ponieważ póki co ograniczamy się do podzbiorów prostej rzeczywistej, wystarczająca będzie następująca definicja zwartości zbioru : Zbiór A ⊂ R nazywamy zwartym, jeśli jest on zamknięty i ograniczony. Przypominam, że zbiór A nazywa się zamknięty, jeśli dla każdego punktu x, nie należącego do A, możemy znaleźć takie ε > 0, że ε-otoczenie punktu x ( zbiór wszystkich punktów y, dla których | x – y | < ε ) nie przecina się z A. Teraz powinniśmy podać niestandardową definicje zwartości. Ponieważ dla pojęcia ograniczoności mamy już taką definicje, powinniśmy podać jedynie definicje zamkniętości. Oto ona. Zbiór A ⊂ R nazywa się zamkniętym, jeśli dla każdej skończonej liczby hiperrzeczywistej y, należącej do A*, jej cześć standardowa St(y) należy do A. Stosując taką definicję np. do odcinka I = (a, b), widzimy, że nie jest on zamknięty, ponieważ liczba a + ε ( ε > 0 – nieskończenie mała ) należy do I*, a cześć standardowa tej liczby, równa a nie należy do I. Dowiedziemy teraz, że nasza definicja jest równoważna definicji standardowej. Niech A będzie zbiorem zamkniętym w sensie definicji standardowej, y- niech będzie skończoną liczbą hiperrzeczywistą, należącą do A*, x – to jej część standardowa. Niech x nie należy do A. Wtedy znajdziemy takie ( standardowe ) ε > 0, że żadna liczba rzeczywista z, dla której | z – x | < ε nie należy do A. Układ : | z – x | < ε , z∈ A ( gdzie z jest niewiadomą ) nie posiada rozwiązań rzeczywistych. Jednakże y jest jego hiperrzeczywistym rozwiązaniem. Otrzymana sprzeczność z PH pokazuje, że x ∈ A.

Page 28: Co to takiego analiza niestandardowa

28

Niech teraz A nie będzie zbiorem zamkniętym ( zgodnie z definicją standardową ), a punkt x niech tym samym dla którego wymogi definicji nie są spełnione. To oznacza, ze x nie należy do A i że dla każdego ε > 0 możemy znaleźć y ∈ A, dla którego | y – x | < ε. Rozpatrzmy takie y jako funkcje od ε, tj. rozpatrzmy taką funkcje f, że ( przy ε > 0 ) f(ε) ∈A, | f(ε) – x | < ε. Teraz łatwo możemy sprawdzić, że : y = f*(ε), gdzie ε - jest nieskończenie małą dodatnią liczbą będzie liczbą hiperrzeczywistym, należącą do A, nieskończenie bliską x, a zatem skończoną, której część standardowa nie należy do A. Zatem dowiedliśmy, równoważności definicji standardowej i niestandardowej zamkniętości ( drugi sposób dowodu polega na tym, aby odwołać się do niestandardowej definicji punktu granicznego, oraz na ten fakt, że zbiór A jest zamknięty wtedy i tylko wtedy, kiedy A zawiera wszystkie swoje punkty graniczne ). Zatem, dochodzimy do następującej definicji zwartości : Zbiór A jest zwarty, jeśli dowolny element A* jest nieskończenie bliski do jednego z elementów A. Przypominając sobie dowód twierdzenia o ograniczoności funkcji ciągłych na odcinku lub o monotonicznej ciągłości, funkcji ciągłej na odcinku, widzimy, że w istocie wykorzystywaliśmy w nich właśnie zwartość odcinka domkniętego. Zilustrujemy ten fakt na przykładzie dowodu twierdzenia o monotonicznej ciągłości. Niech funkcja f będzie ciągła i zwarta na zbiorze A. Dowiedziemy jej monotonicznej ciągłości, na początku przypominając odpowiednią definicje niestandardową. Niech x, y – będą nieskończenie bliskimi elementami A*. Na mocy zwartości zbioru A, elementy x i y są nieskończenie bliskie ku pewnych elementów x0 , y0 ∈ A. Wtedy x0 ≈ y0 (x0 ≈ x ≈ y ≈ y0 ). Ponieważ x0 i y0 są standardowe, to

x0 = y0 Na mocy ciągłości f w x0 mamy :

f*(x) ≈ f(x0) = f(y0 ) ≈ f*(y0 )

dlatego f*(x) ≈ f*(y) co chcieliśmy dowieść. Do podanej powyżej niestandardowej definicji zwartości powrócimy jeszcze omawiając zastosowanie metod niestandardowych w topologii. A obecnie wspomnimy przykłady od jakich zaczynaliśmy naszą znajomość z analizą niestandardową. Pierwszy i drugi przykład staje się w pełni jasny, jeśli zdefiniujemy pochodną f’(a) jako standardową część stosunku dy/dx, gdzie dx – nieskończenie mała. dy = f*(a + dx) – f(a) ( w tym przykładzie wykorzystujemy m.in. tożsamość : √y – √x = ( y – x ) (√y + √x ) która jest słuszna również dla liczb hiperrzeczywistych x, y; układ : √y – √x ≠ ( y – x ) (√y + √x ) nie posiada rozwiązań rzeczywistych ) W trzecim przykładzie ( definicja całki ) funkcja standardowa f może być przedłużona do f* po czym wyrażenia : f(a + dx), f(a + 2dx ) , ... , f( a + ( H – 1)dx ) nabierają sensu. Tego jest jednakże za mało – należy wyjaśnić, co to takiego suma nieskończonej liczby składowych ( dokładnie H składowych ). Możemy to zrobić wykorzystując np. taki trik. Zdefiniujmy ( w zwykłym „standardowym” świecie ) funkcje : S(n, dx ) = [ f(a) + f( a + dx) + … + f( a + ( n – 1)dx)] dx ( n – liczba naturalna, dx – liczba rzeczywista ) Odpowiadający takiej definicji analog niestandardowy reprezentuje sobą funkcje S* z hipernaturalnymi i hiperrzeczywistymi argumentami. Podstawiając do niej H i dx = ( b – a)/H, otrzymamy liczbę hiperrzeczywistą S*(H, dx), której cześć standardową nazwiemy całką ( w sensie standardowym ) funkcji f po ( standardowym ) odcinku [a, b]. Przykład czwarty już przeanalizowaliśmy. Przykład piąty – przykład zbioru niemierzalnego – staje się również całkowicie jasny. Powinniśmy w nim rozpatrzyć funkcje z(n, x) = ( n-ty znak rozkładu binarnego liczby x ). Jest to funkcja ze zbioru N × R w { 0, 1 }. Jej hiperrzeczywisty analog jest to funkcja z* z N* × R* również o wartościach w { 0, 1 }. Wybierzemy teraz nieskończenie dużą liczbę hipernaturalną H i rozpatrzymy te liczby standardowe x ∈ [0,1], dla których z*(H, x ) = 0 Będzie to zbiór (standardowych ) liczb rzeczywistych i jest on niemierzalny w sensie Lebesgue’a ( oczywiście należy tego dowieść, ale dowód tego faktu nie jest trudny – opiera się on mówiąc ogólnie, na fakcie, ze dowolna całka jest wypełniana przez taki zbiór tylko połowicznie )

Page 29: Co to takiego analiza niestandardowa

29

Przykład szósty ( przykład Eulera ) dokładnie analizowany jest w książce [53 , str. 64 – 65 ] Podana jest tam próba wyjaśnienia jak podejście Eulera staje się poprawne ( ze współczesnego punktu widzenia ) w świetle analizy niestandardowej. 9. Budowa układu liczb hiperrzeczywistych. Na koniec omówimy problem istnienia liczb hiperrzeczywistych. Ściślej zagadnienie to należy sformułować następująco : Czy można zbudować rozszerzenie zbioru liczb rzeczywistych, dla którego spełniona była by PH. Przypominam, że PH ( Podstawowa Hipoteza ) wymaga, aby : 1) istniał pewien zbiór R* dla którego R ⊂ R

2) dla każdej funkcji f : Rn → R istniała pewna funkcja f* : ( R* )n → R*, będąca przedłużeniem funkcji wejściowej 3) dowolny układ równań i nierówności, hiperrzeczywisty analog których posiada ( hiperrzeczywiste ) rozwiązania miał rozwiązania rzeczywiste ( o tym co może stać po lewych i prawych stronach takich równań i nierówności, mówiliśmy wcześniej ) 4) R* zawiera elementy nieskończenie małe, różne od zera. W niniejszym paragrafie pokażemy w jaki sposób możemy spełnić takie wymagania. Co prawda przy tym będziecie musieli przyjąć pewne twierdzenia związane z teorią mnogości, bez dowodu ( np. istnienie nietrywialnego ultrafiltru na zbiorze liczb naturalnych ) Powróćmy do naszej pierwotnej próby zbudowania układu liczb hiperrzeczywistych, kiedy nazwaliśmy liczbami hiperrzeczywistymi ciągi liczb rzeczywistych. Próba taka ( punkt 4 ) skończyła się niepowodzeniem. Aby naprawić takie podejście, przypomnimy jak następuje przejścia od Q do R ( ściślej – jak może ono przebiegać w jednym z wariantów budowy układu liczb rzeczywistych z liczb wymiernych ) Rozpatrujemy wszelkie możliwe ciągi fundamentalne liczb wymiernych tj. takie ciągi, że dla dowolnego ε > 0 istnieje odcinek o długości ε, zawierający wszystkie człony ciągu, oprócz skończonej ich liczby. Dwa takie ciągi xn i yn nazywają

się równoważnymi, jeśli xn – yn dąży do 0 przy n → ∞.

Taka relacja równoważności rozbija ciągi fundamentalne na klasy które właśnie nazywa się liczbami rzeczywistymi. Teraz, kiedy nabraliśmy już wystarczającej inercji myślenia ( jak widać inercja myśli nie zawsze jest czymś złym ), możemy przeanalizować nasze zagadnienie – zbudowania zbioru liczb hiperrzeczywistych. Okazuje się, że osiągniemy swój cel, jeśli przejdziemy od ciągu do klas ciągów, przyjmując że dwa ciągi x0 , x1 , ... i y0 , y1 , ...

zadają jedna i tę samą liczbę hiperrzeczywistą , jeśli xn = yn „dla większości liczb naturalnych n”.

Oczywiście nie jest tutaj jasnym co oznacza stwierdzenie „dla większości n”. Dla określoności wyobraźmy sobie, że prowadzimy głosowanie na temat : czy powinniśmy przyjąć ciągi xn i yn jako pokrywające się ?

Głosującymi w takiej ankiecie są liczby naturalne, przy czym liczba n głosuje „za” jeśli xn = yn i „przeciw” jeśli xn ≠ yn

Ciągi xn i yn przyjmiemy za pokrywające się, jeśli wi ększość liczb naturalnych głosuje za. Należy tylko wyjaśnić w jaki

sposób podliczamy głosy tj. jakie zbiory liczb naturalnych przyjmujemy jako „większe” ( zawierające „większość” liczb naturalnych ), a jakie przyjmujemy za małe” ( zawierające „mniejszość” liczb naturalnych ) Wymieńmy te własności, które powinien posiada system zliczania głosów, tj. system dzielący zbiory liczb naturalnych na duże i małe : 1) Dowolny zbiór liczb naturalnych jest albo duży, albo mały. Ani jeden zbiór nie może być jednocześnie dużym i małym ( głosowanie powinno zawsze dawać jednoznaczny wynik ) 2) Zbiór wszystkich liczb naturalnych jest duży, a zbiór pusty jest mały 3) Dopełnienie ( do N ) dowolnego małego zbioru jest zbiorem dużym, dopełnienie dowolnego dużego zbioru – małym 4) Dowolny podzbiór zbioru małego jest mały, dowolny podzbiór zbioru dużego – dużym 5) Suma dwóch małych zbiorów jest zbiorem małym, iloczyn dwóch dużych zbiorów jest zbiorem dużym ( Jeśli każda z dwóch grup głosujących nie tworzy większości, to wspólnie też jej nie tworzą – nie można tworzyć koalicji Jeśli każda z grup tworzy większość, to głosujący wchodzący jednocześnie do obu grup już stanowią większość ) Powyższe wymaganie są bardzo silne. Aby to zrozumieć, rozpatrzymy przypadek skończonego zbioru głosujących. ( zamieniając N na pewien zbiór skończony M ) Czy w tym przypadku można spełnić powyższe wymagania ? Jeden ze sposobów jest prawie oczywisty. Wybierzmy jednego z „głosujących” m ∈M i nazwijmy większymi wszystkie zawierające m, a mniejszymi – wszystkie zbiory nie zawierające m ( „dyktatura” m ). Przy takiej definicji łatwo możemy sprawdzić wszystkie własności 1 – 5. Okazuje się, że w taki sposób wyczerpujemy wszystkie możliwości spełnienia warunków 1 – 5, dla przypadku zbioru skończonego.

Page 30: Co to takiego analiza niestandardowa

30

Niech zadane będzie rozbicie wszystkich zbiorów na duże i małe, spełniające warunki 1 – 5. Rozpatrzmy zatem wszystkie duże zbiory i wybierzmy z nich zbiór M0, zawierający najmniejszą możliwą liczbę elementów ( pośród dużych zbiorów ).

Zbiór M0 nie jest pusty. Jeśli zawiera on dokładnie jeden element m, to będzie on duży, a na mocy własności 3 wszystkie

zbiory nie zawierające m, będą małe. Pozostało pokazać, że M0 nie może zawierać więcej niż jednego elementu.

W istocie – w tym bowiem przypadku można byłoby go rozbić na dwie niepuste nieprzecinające się części M1 i M2

Części te powinny być małe ( ponieważ zawierają mniej elementów niż M0 ), a ich suma M0 jest zbiorem dużym, co jest

sprzeczne z wymaganiem 5. Okazuje się jednak, ze przy przeliczalnej liczbie głosujących możliwe są systemy głosowania, spełniające warunki 1 – 5 i nie sprowadzające się do wymienionego powyżej przypadku trywialnego. Innymi słowy, można tak rozbić wszystkie podzbiory naturalnego szeregu na duże i małe, aby spełnić warunki 1 – 5 i by dowolny zbiór jednoelementowy był mały. Wtedy ( na mocy własności 5) i dowolny zbiór skończony będzie mały, a ( na mocy własności 3) każdy zbiór ze skończonym dopełnieniem ( do N ) – duży. Zatem, do warunków 1 – 5 można bez sprzeczności dodać i taki warunek : 6) Każdy zbiór skończony jest mały, a każdy zbiór o skończonym dopełnieniu – duży. ( przy głosowaniu mniejszej niż skończona liczbie głosów ich wynik jest nieistotny ) Rozbicie wszystkich podzbiorów szeregu liczb naturalnych na duże i małe, spełniające warunki 1 – 6, nazywa się nietrywialnym ultrafiltrem na zbiorze liczb naturalnych. Nie będziemy dokładnie omawiali jak można dowieść istnienia takiego rozbicia. Powiemy tylko, ze taki dowód wykorzystuje indukcje pozaskończoną ( i tzw. aksjomat wyboru ) Teraz pokażemy, że takie rozbicie pozwala zbudować układ liczb hiperrzeczywistych, spełniających wymagania PH. Niech zatem dane będzie rozbicie, spełniające wymagania 1 – 6. Dwa ciągi x0 , x1 , ... i y0 , y1 , ... nazwiemy

równoważnymi, jeśli zbiór tych n, przy których xn = yn jest zbiorem dużym. Na mocy wymagania 2, każdy ciąg jest

równoważny sam sobie. Dowiedziemy, że zbudowana w ten sposób relacja jest przechodnia – jeśli ciąg x jest równoważny ciągowi y, a ciąg y jest równoważny ciągowi z, to ciąg x jest równoważny ciągowi z. Oznaczmy przez A, B, C zbiory tych liczb naturalnych n, przy których, odpowiednio : xn = yn , yn = zn , zn = xn

Zgodnie z warunkami zbiory A i B są duże, oprócz tego z faktu xn = yn i yn = zn wynika zn = xn dlatego A ∩ B ⊂ C.

Zgodnie z wymaganiem 5 zbiór A ∩ B jest duży. Teraz wymaganie 4 gwarantuje, że C również jest zbiorem dużym. Widzimy, że wprowadzona relacja jest zwrotna, symetryczna i przechodnia zatem rozbija ona ciągi liczb rzeczywistych na klasy równoważności tj. takie klasy, iż dowolne dwa ciągi jednej klasy są równoważne, a dowolne dwa ciągi różnych klas – nie. Takie klasy nazwiemy liczbami hiperrzeczywistymi. Czego jeszcze potrzebujemy ? Chcemy aby zbiór liczb rzeczywistych był podzbiorem zbioru liczb hiperrzeczywistych. Należy umieć dla każdej funkcji z argumentami i wartościami rzeczywistymi, budować jej hiperrzeczywisty analog. Należy sprawdzić czy dowolny układ równań i nierówności hiperrzeczywisty analog której posiada rozwiązania hiperrzeczywiste, posiada również rozwiązania rzeczywiste. I na koniec, należy przekonać się iż pośród liczb hiperrzeczywistych ( rozpatrywanych jako ciało uporządkowane – zobacz paragraf 6 , przykłady 6, 7 ) istnieją nieskończenie małe różne od zera. Aby sprawić iż R będzie podzbiorem R, utożsamimy każda liczbę rzeczywistą x z ciągiem x0 , x1 , ... ( dokładniej z klasą

zawierającą taki ciąg ). Przy tym różnym liczbom rzeczywistym odpowiadają różne klasy x0 , x1 , ... nie równoważne

y0 , y1 , ... ( zbiór tych n, przy których n-te człony pokrywają się jest pusty, a zatem jest zbiorem małym )

Niech f : R → R – będzie funkcją o argumentach i wartościach rzeczywistych. Zdefiniujmy jej hiperrzeczywisty analog f* : R* → R*. Niech x – będzie dowolna hiperrzeczywistą liczbą , tj. klasą równoważności ciągów liczb rzeczywistych. Rozpatrzmy dowolny taki ciąg x0 , x1 , ... i zastosujmy f do wszystkich jego członów. Klasę zawierającą otrzymany w ten

sposób ciąg : f(x0 ), f(x1 ) , ...

będziemy przyjmowali jako wartość f na x. Należy teraz sprawdzić, iż taka definicja jest poprawna, tj. iż otrzymana klasa nie jest zależna od wyboru ciągu x0 , x1 , ... w klasie x.

Niech x0 , x1 , ... i y0 , y1 , ... – będą dowolnymi ciągami, należącymi do jednej klasy. To oznacza, że xn = yn ,

„dla większości n”, tj. że zbiór M tych n, przy których xn = yn jest duży. Należy dalej pokazać, że f(x0 ), f(x1 ) , ... i

f(y0 ), f(y1 ) , ... leżą w jednej klasie, tj. że zbiór tych n, przy których f(xn ) = f(yn ) jest duży.

Page 31: Co to takiego analiza niestandardowa

31

Ale ten fakt jest oczywisty, ponieważ zbiór ten zawiera M ( z xn = yn wynika f(xn ) = f(yn ) ), a każdy nadzbiór zbioru

dużego jest duży ( własność 4 ). Analogicznie definiujemy hiperrzeczywiste analogi dla funkcji kilku argumentów. Niech, przykładowo, f – będzie funkcją dwóch argumentów rzeczywistych o wartościach rzeczywistych : f : R × R → R Zdefiniujemy jej hiperrzeczywisty analog f*. Aby zastosować f* do dwóch hiperrzeczywistych liczb x , y, weźmiemy ciągi x0 , x1 , ... i y0 , y1 , ... należące do tych liczb i w charakterze f*(x, y) rozpatrzymy klasę ciągów

f(x0, y0 ), f( x1, y1 ) , ...

Dowiedziemy teraz poprawności takiej definicji. Jeśli x’ 0 , x’1 , ... i y’0 , y’1 – są innymi elementami klas x i y, to

x’n = xn dla większości n i y’n = yn dla większości n, tj. zbiory :

P = { n | x’n = x’n } i Q = { n | y’n = yn }

są duże. Na mocy własności 5 zbiór P ∩ Q również jest duży, tj. dla większości n słuszne jest x’n = xn i y’n = yn

jednocześnie. Ponieważ dla tych n spełniona jest równość : f(x’ n, y’n ) = f( xn, yn )

to poprawność powyższej definicji jest dowiedziona. Dokładnie tak samo postępujemy dla przypadku funkcji więcej niż dwóch argumentów. Dalej należy sprawdzić, że zbudowane w powyższy sposób analogi hiperrzeczywiste będą przedłużeniami wejściowych funkcji o argumentach i wartościach rzeczywistych. Jest to widoczne w sposób oczywisty z definicji. Sprawdzimy teraz, że każdy układ równań i nierówności, posiadający rozwiązania hiperrzeczywiste posiada również rozwiązania rzeczywiste ( powinniśmy raczej mówić o układzie, którego hiperrzeczywisty analog posiada rozwiązania hiperrzeczywiste, ale nie będziemy aż tacy pedantyczni ) Niech np. układ : f( g(x, y), z ) = z , h(x) ≠ h(y) posiada rozwiązania hiperrzeczywiste x, y, z. Rozpatrzmy ciągi x0 , x1 , ... i y0 , y1 , z0 , z1 , ...

należące do odpowiednich klas równoważności. Wtedy g(x0 , y0 ), g(x1, y1 ) , ... – należą do klasy g(x, y), a f( g(x0 , y0 ), z0 ) , f( g(x1, y1) , z1 ) , ... – do klasy

f( g(x, y), z ). Ponieważ x, y, z z założenia są rozwiązaniami układu, to f( g(xn , yn ), zn ) = zn dla większości n.

Ponieważ h(x) ≠ h(y), to ciągi h(x0), h(x1), ... i h(y0 ), h(y1), ... nie są równoważne i zbiór tych n, przy których

h(xn ) = h(yn ) jest zbiorem małym. Wtedy zbiór tych n, przy których h(xn ) ≠ h(yn ) jest zbiorem dużym.

Ponieważ przecięcie dwóch zbiorów dużych jest zbiorem dużym, to zbiór tych n, przy których : f( g(xn , yn ), zn ) = zn , h(xn ) ≠ h(yn )

jest zbiorem dużym, To znaczy, że nie jest on pusty ! Zatem, układ posiada również rozwiązania rzeczywiste. W analogiczny sposób postępujemy z dowolnym układem równań i nierówności : Jeśli x, y, z – są rozwiązaniami takiego układu, a {xn }, {y n }, {z n }, ... – są odpowiednimi ciągami, to zbiór tych n, przy

których liczby rzeczywiste xn , yn , zn , ... są rozwiązaniami układu, jest duży, a zatem nie jest pusty.

Pozostaje jedynie sprawdzić, ze pośród liczb hiperrzeczywistych istnieją nieskończenie małe, różne od zera. Dodatnią nieskończenie mała liczba hiperrzeczywista będzie np. klasa ciągów 1, ½ , 1/3 , ... ( lub dowolny inny ciąg liczb rzeczywistych, zbieżny do 0 ) Musimy sprawdzić, że taka hiperrzeczywista liczba ( oznaczmy ją przez ε ) jest dodatnia, ale jest ona mniejsza od dowolnej standardowej liczby dodatniej. Aby tego dowieść, powinniśmy sobie przypomnieć jak definiowaliśmy porządek na zbiorze liczb hiperrzeczywistych. Był on budowany zgodnie z ogólnym schematem budowania hiperrzeczywistego analogu dla dowolnej relacji na zbiorze liczb rzeczywistych. Należy wziąć funkcje f dwóch argumentów rzeczywistych, dla której własności f(x, y) = 0 i x < y są równoprawne i rozpatrzyć jej hiperrzeczywisty analog f*. Hiperrzeczywista liczba x nazywa się mniejszą od liczby hiperrzeczywiste y, jeśli f*(x, y ) = 0. Zobaczmy co daje nam taka konstrukcja dla zbudowania w opisany sposób układu liczb hiperrzeczywistych. Jeśli x – jest klasą ciągów f(x0 , y0 ), f(x1, y1) , ...

Równość takiej klasy zeru ( tj. klasie ciągów 0, 0, ... ) oznacza, że f (xn , yn ) = 0 dla większości n, tj. że xn < yn dla

większości n. Zatem, aby obliczyć czy prawdziwa jest nierówność x < y dla liczb hiperrzeczywistych x, y należy wziąć ciągi x0 , x1 , ... i y0 , y1, ...

W klasach x i y i wyjaśnić czy zbiór tych n przy których xn < yn jest duży czy mały.

Page 32: Co to takiego analiza niestandardowa

32

Musieliśmy zatem sprawdzić, że 0 < ε i że ε > p dla dowolnej standardowej liczby dodatniej p ( przypomnijmy, że ε - jest klasa ciągów 1, ½ , 1/3 , ... ) Jest to proste : 0 < ε, ponieważ 0 < 1/n dla wszystkich n ( a zbiór N jest duży ), ε < p, ponieważ 1/n < p dla wszystkich naturalnych n, oprócz skończonej liczby, a każdy zbiór o skończonym dopełnieniu jest mały. ( własność 6 „układu liczenia głosów” ) Zauważmy, że wykorzystaliśmy tutaj po raz pierwszy własność 6, do tej pory wszystkie nasze analizy były słuszne również w przypadku „dyktatury” ( kiedy większymi przyjmowaliśmy te i tylko te zbiory, które zawierały pewną liczbę naturalną N ). W tym przypadku dwa ciągi są równoważne, jeśli pokrywają się ich N-te człony i wszystkie hiperrzeczywiste liczbę są standardowe ( klasa równoważności x0 , x1, ... pokrywa się z liczbą standardową xN )

10. Analiza niestandardowa i logika matematyczna. Wspominaliśmy już, że istnieją dwa sposoby wyłożenia analizy niestandardowej – „chałupnicza „naukowa” ( z wykorzystaniem logiki matematycznej ). Do tej pory nasz wykład naśladował tą pierwszą metodę. Obecnie postaramy się wyjaśnić, jak może być użyteczna logika matematyczna w celu uzasadnienia zbudowania i wykorzystywania liczb hiperrzeczywistych. Nasza PH mówiła, że stwierdzenia dotyczące rozwiązywalności układów równań i nierówności są jednocześnie albo prawdziwe, albo fałszywe w R i R*. W istocie można wskazać znacznie szersza klasę stwierdzeń, które są jednocześnie albo prawdziwe, albo fałszywe w R i R*. Zanim jednak wskażemy taką klasę, omówimy pewne fundamentalne pojęcia logiczne. Wcześniej mówiliśmy o układach równań i nierówności, złożonych z funkcji o argumentach rzeczywistych, jak również o ich analogach złożonych z funkcji o argumentach hiperrzeczywistych. Przykładowo, można było rozpatrywać układ : sin(x) = y, sin( cos(y)) ≠ x oraz jego analog hiperrzeczywisty : sin*(x) = y, sin*( cos*(y)) ≠ x Bardziej naturalnym jest jednakże przyjąć, że do takiego układu wchodzą nie same takie funkcje, a ich nazwy, tj. ich zapisy symboliczne. Po tym jak takim nazwom nadamy określony sens tj. każdemu z nich przyporządkujemy określoną funkcje, można mówić o rozwiązaniach układu ( przy zadanej interpretacji wchodzących do niej nazw ). Przy tym w miejsce tego, aby wprowadzać różne nazwy dla funkcji i ich hiperrzeczywistych analogów, przyjmiemy, że mamy jedną nazwę, która jest dwuznaczna – ma sens rzeczywisty i hiperrzeczywisty. Opiszemy teraz taki przepis bardziej formalnie. Rozpatrzmy wszystkie możliwe funkcje argumentów rzeczywistych o wartościach rzeczywistych ( o dowolnej liczbie argumentów, przy tym funkcje 0 argumentów utożsamimy z liczbami rzeczywistymi ) i nadamy im nazwy. W tym celu wybierzemy pewną relacje wzajemnie jednoznaczną pomiędzy zbiorem wszystkich takich funkcji i pewnym zbiorem I, którego elementy będziemy nazywali nazwami. Element zbioru I - nazwę, przyporządkowany danej funkcji, będzie właśnie jej nazwą. Jeśli funkcja posiada n –argumentów, to odpowiadający jej symbol będziemy nazywali n-tą walencją. Zatem 0-walencyjne symbole są w istocie nazwami liczb rzeczywistych. Nazwy ( elementy zbioru I ) będziemy wykorzystywali przy tworzeniu termów. Przyjmijmy przeliczalny spis symboli różnych od elementów I, którego elementy nazwiemy zmiennymi. Teraz termy możemy zdefiniować jako wyrażenia, budowane wedle następujących zasad : 1) każda zmienna jest termem 2) każdy 0-walencyjny symbol funkcjonalny jest termem 3) jeśli zadany jest u – n-walencyjny symbol funkcjonalny, a t1 , ... , tn – są termami, to u(t1 , ... , tn ) – są również

termami. Przykładowo f( x, h(y)) i g(g(x, z), t ) – są termami, jeśli x, y, z – są zmiennymi, h- 1-walencyjny symbol funkcjonalny, t jest 0-walencyjnym symbolem funkcjonalnym, f, g są 2-walencyjnymi symbolami funkcjonalnymi. Jak widzimy definicja termów w żaden sposób nie odwołuje się do sensu wchodzących do nich symboli. Dlatego wraz z początkowym sensem termów ( pojawiającym się, kiedy z nazwą i związana jest ta sama funkcja, nazwą której jest i ) można nadać im również drugi hiperrzeczywisty sens, przyporządkowując i hiperrzeczywisty analog tej funkcji. Nazwa funkcji f ↓ ↓ Funkcja rzeczywista Hiperrzeczywisty analog f* funkcji f Okazuje się, ze przy tej drugiej interpretacji istotnymi są jedne i te same formuły. Zdefiniujmy teraz takie formuły.

Page 33: Co to takiego analiza niestandardowa

33

Na początku wypiszemy zasady budowania formuł. Jeśli t1i t2 są termami, to zapis ( t1= t2 ) jest formułą.

Jeśli ϕ i ψ - są formułami, to zapisy ( ϕ ∧ ψ ) , ( ϕ ∨ ψ ) , ( ϕ ⇒ ψ ), ϕ - są formułami, które czytamy następująco : „ ϕ i ψ” , „ ϕ lub ψ” , „jeśli ϕ, to ψ” , „nieprawda, że ϕ” Jeśli ϕ - jest formułą, a ξ - zmienną, to zapisy ∀ξϕ i ∃ξϕ - są formułami, które czytamy następująco : „dla wszystkich ξ słuszne jest ϕ”, „istnieje ξ, dla którego słuszne jest ϕ” Formułami nazywamy tylko te zapisy, które można otrzymać na podstawie powyższych zasad. W ten sposób określili śmy pojęcie formuły. Teraz należy wyjaśnić jaki sens możemy im nadać. W pierwszej kolejności wprowadzimy pojęcie parametrów formuły. Mówiąc ogólnie, parametry formuły – są to te zmienne od wartości których zależy prawdziwość danej formuły. Ścisła definicja jest następująca. Parametrami formuły ( t1= t2 ) są wszystkie zmienne wchodzące w t1lub do t2.

Parametry formuły ϕ są takie same jak dla ϕ. Parametrami formuł : ϕ ∧ ψ , ϕ ∨ ψ , ϕ ⇒ ψ są wszystkie zmienne będące parametrami ϕ lub ψ. Parametrami formuł ∀ξϕ i ∃ξϕ - są parametry formuły ϕ, różne od ξ. Przykładowo parametrami formuły : ∃x ∀y (( f(x, h(y)) = g(z, z) ∧ ( z = t ) ) są zmienne t i z, a formuła : ∃x( f(x, x ) = x ) nie posiada parametrów. Teraz będzie interesowało nas zagadnienie prawdziwości lub fałszywości formuł. Aby miały one sens, należy wykonać dwie rzeczy. Po pierwsze, należy ustalić interpretacje naszego języka, tj. wyjaśnić jaki jest zbiór M możliwych znaczeń zmiennych ( nośnik interpretacji ) i jakie funkcje na takim zbiorze są przyporządkowane symbolom funkcjonalnym. Po drugie, jeśli interesuje nas prawdziwość formuły ϕ, posiadającej jakieś parametry, to należy wskazać wartości takich parametrów, przyporządkowując im jakieś elementy zbioru M. Niech zatem będzie przyjęta pewna interpretacja i każdemu parametrowi formuły ϕ przypisano pewną wartość, będącą elementem M. Wtedy formuła, jest albo prawdziwa, albo fałszywa. Nie będziemy dokładnie opisywali zasady, wedle której fakt taki następuje, mając nadzieję, że sens znaków ∧ , ∨ , ⇒ , , ∀, ∃ jest jasny. Podamy teraz kilka przykładów. Formuła : ∃x∀y(h(y) = x ) nie posiada parametrów i będzie prawdziwa w tym przypadku, jeśli funkcja oznaczona symbolem h, będzie stała na M. ( Zauważmy, że przy przestawieniu kwantyfikatorów ∃x i ∀y formuła ta przekształca się w formułę prawdziwą tożsamościowo ). Formuła : ∃x ( h(x) = y ) posiada jeden parametr y i będzie prawdziwa przy danej jej znaczeniu wtedy i tylko wtedy, kiedy jej znaczenie wchodzi do obszaru wartości funkcji h. Formuła : ∃x∃y((h(x) = k(y)) ∧ ( f(x, y) = y )) nie posiada parametrów I będzie prawdziwa w tym przypadku, jeśli układ : h(x) = k(y) , f(x, y) ≠ y posiada rozwiązania, tj. istnieją takie x0 , y0 ∈ M, że wartość związanej z h funkcji na x0 jest równa wartości funkcji

związanej z k na y0, a wartość funkcji związanej z symbolem f na parze (x0 , y0 ) nie jest równa y0.

Nasza zasada budowania formuł dopuszcza w szczególności również formuły ∀ξA, gdzie ξ nie jest parametrem A. Przykładowo można zbudować formułę : ∀x ( f(y) = g(y)) do której z nie wchodzi do wyrażenia wiązanego z kwantyfikatorem lub formułę : ∀x∃x( f(x) = y ) gdzie x chociaż wchodzi do A, to nie jest jej parametrem. Przyjmiemy, że formuły ∃ξA i ∀ξA dla których ξ nie jest parametrem A, mają ten sam sens co wejściowa formuła A. Mamy zatem, dwie interpretacje naszego języka – rzeczywistą ( o nośniku R ) oraz nową interpretacje hiperrzeczywistą ( o nośniku R* ). Uogólnieniem wymagania jednoczesnej rozwiązywalności układów równań i nierówności jest następująca zasada nazywana, zasadą Leibniza. Niech ϕ - będzie formułą bez parametrów. Wtedy jest ona jednocześnie prawdziwa lub fałszywa w R i R*. Łatwo zrozumieć iż taka zasada jest rzeczywiście uogólnieniem naszego starego wymagania. Dla każdego układu równań i nierówności łatwo zapisać formułę, twierdzącą ( przy interpretacji rzeczywistej lub hiperrzeczywistej ), że układ ( lub jej hiperrzeczywisty analog ) posiada rozwiązania. Formuła taka ma postać : ∃ x1, ... , ∃ xn ϕ, gdzie x1, ... , xn – zmienne wchodzące do układu, ϕ ma postać:

( ... ((ψ1 ∧ ψ2 ) ∧ ψ3 ) ∧ ... )

Page 34: Co to takiego analiza niestandardowa

34

gdzie każda formuła ψi ma postać ( t = s ) lub ( t = s ) i odpowiada jednemu z równań i nierówności układu.

Można dowieść, że dla naszego języka ( zawierającego symbole dla wszystkich funkcji ) zasada Leibniza oraz wymaganie jednoczesnej rozwiązywalności układu równań i nierówności są równoważne. Tym niemniej zasadę Leibniza dogodniej jest stosować. Zademonstruje to na kilku przykładach. Dowodziliśmy, że jeśli zbiory zer funkcji o nazwach f i g pokrywają się, to i zbiory zer funkcji f* i g* pokrywają się. Teraz w tym celu wystarczy zapisać stwierdzenie o pokrywaniu się zbiory zer w postaci formuły : ∀x ((( f(x) = 0 ) ⇒ ( g(x) = 0 )) ∧ ((g(x) = 0 ) ⇒ ( f(x) = 0 ))) Dowodziliśmy również równoważności standardowej i niestandardowej definicji ciągłości w punkcie x funkcji f, zdefiniowanej na zbiorze M. Teraz możemy to zrobić następująco. Niech f będzie funkcją ciągłą zgodnie z definicją standardową, x’ ∈ M i jest nieskończenie bliski do x. Dowiedziemy, że | f*(x’ ) – f(x) | jest mniejsze od dowolnego standardowego ε > 0. Wybierzemy (standardowe ) δ > 0, dla którego formuła : ∀y ((( y ∈M ) ∧ ( | y – x | < δ )) ⇒ ( | f(y) – f(x) | < ε )) jest prawdziwa na zbiorze liczb rzeczywistych. Wtedy jest ona prawdziwa również w R* i podstawiając x’ w miejsce y, otrzymujemy wymagany wynik ( Zauważmy dwa szczegóły. Po pierwsze zwróćcie uwagę, że powyższa formuła nie posiada parametrów : x, ε i δ - nie są zmiennymi, a symbolami, reprezentującymi odpowiednie liczby rzeczywiste. Po drugie – przy zapisie tej formuły wykorzystaliśmy szereg skrótów. W miejsce y ∈ M należałoby zapisać m(y) = 0, gdzie m – jest funkcją, której zbiorem zer jest M, a zapis typu | a – b | < c należy rozumieć jako ord ( d(a, b), c ) = 0, gdzie ord – jest oznaczeniem dla funkcji dwóch zmiennych, dla której : ord( x, y ) = 0 ⇔ x < y d – jest oznaczeniem dla funkcji, dla której : d(x, y ) = | x – y | itd. ) I odwrotnie, niech f nie jest funkcja ciągłą. Wtedy znajdziemy takie ε >0, że formuła : ∀δ ((δ > 0 ) ⇒ ∃y (( | y – x | < δ ) ∧ ( | f(y) – f(x) | ≥ ε ))) będzie prawdziwa w R. Wtedy będzie ona prawdziwa również w R* ( zasada Leibniza ) i biorąc nieskończenie małe dodatnie δ, znajdziemy odpowiadające mu hiperrzeczywiste y. Takie y będzie nieskończenie bliskie ku x, a : | f*(y) – f*(x) | ≥ ε I zatem : f*(y) ≈≠ f(x) Z takiego przykładu widać, ze wykorzystanie zasady Leibniza pozwala wykonać wiele operacji krócej ( głownie dlatego, że odpada konieczność przechodzenia od prawdziwości twierdzenia typu ∀x∃y ϕ(x, y) do funkcji dającej po x takie y, że ϕ(x, y)) Zanim pójdziemy dalej, odpowiemy na pytanie, które być może już pojawiło się u czytelników. Zasada Leibniza mówi, że liczby hiperrzeczywiste posiadają te same własności, co standardowe liczby rzeczywiste. Ale liczby standardowe spełniają aksjomat Archimedesa, a hiperrzeczywiste nie. Czy jest to sprzeczne z zasadą Leibniza ? Oto co pisze w tym temacie M Davies [ 3, str. 26] : „Leibniz postulował istnienie układu liczb, posiadających te same własności, co liczby standardowe, ale posiadającego różne od zera nieskończenie małe ... Jednakże sytuacja Leibniza wydaje się oczywiście absurdalną. Standardowe liczby rzeczywiste, oczywiście posiadają jedną własność, którą nie posiadają postulowane przez Leibniza rozszerzenie – pośród liczb rzeczywistych nie ma nieskończenie małych. Paradoks eliminujemy poprzez ścisły wybór formalnego języka z użyciem pojęć logiki współczesnej ( tak samo sztywne określony jak np. komputerowy język programowania ). W ten sposób zasada Leibniza jest uściślana : Istnieje rozszerzenie liczb rzeczywistych, zawierające elementy nieskończenie małe i posiadające te same własności, co i liczby rzeczywiste, ponieważ takie własności mogą być wyrażone w języku formalnym. Stąd wnioskujemy, że własność bycia nieskończenie małą nie może być wyrażona we wskazany sposób” W istocie, spróbujmy zapisać aksjomat Archimedesa w naszym języku. Chcielibyśmy zapisać coś w rodzaju : ∀ε ( ε > 0 ) ⇒ ((ε > 1 ) ∨ ( ε + ε > 1 ) ∨ ( ε + ε + ε > 1 )∨ ... )) ale każda formuła powinna posiadać skończoną długość ( i nie powinna zawierać wielokropków ! ) Możemy spróbować zapisać aksjomat Archimedesa w postaci „dla każdej liczby istnieje liczba naturalna od niej większa” ∀x∃y (( y ∈ N ) ∧ ( x < y )) ( zapisy postaci y∈N, x < y – są skrótami, np. zapis y ∈ N należy rozumieć jako n(y) = 0, gdzie n – symbol funkcjonalny, któremu odpowiada funkcja przyjmująca wartość 0 w liczbach naturalnych i tylko w nich ) Formuła ta jest formalnym analogiem aksjomatu Archimedesa i oczywiście jest prawdziwa w R. Zatem, jest ona prawdziwa i w R*. Nie jest to sprzeczne z tym faktem, że ciało R* nie jest archimedesowskim, ponieważ przy interpretacji w R formuła ta oznacza tylko, że dla każdej liczby hiperrzeczywistej istnieje większa od niej liczba hipernaturalna. Dlatego – jak tego należało oczekiwać – żadnej sprzeczności tutaj nie ma.

Page 35: Co to takiego analiza niestandardowa

35

Widzieliśmy już co daje nam logika matematyczna przy wykorzystaniu liczb hiperrzeczywistych. Obecnie rozpatrzymy zagadnienie związane z budowaniem układu liczb hiperrzeczywistych z pomocą metod logiki matematycznej. Okazuje się, że istnienie układu liczb hiperrzeczywistych, spełniającego postawione przez nas wymagania, jest prostym następstwem jednego z podstawowych twierdzeń logiki matematycznej – twierdzenia o zwartości Malcewa. Zanim sformułujemy to twierdzenie, wprowadzimy pewne podstawowe pojęcia logiczne ( pojęcie języka, termu, formuły, interpretacji języka ). Niech będzie ustalony pewien zbiór symboli { P, Q, ... }, którego elementy będziemy nazywali symbolami predykatywnymi, oraz zbiór { f, g , ... }, którego elementy będziemy nazywali symbolami funkcjonalnymi. Niech każdemu symbolowi predykatywnemu i funkcjonalnemu przyporządkowana będzie pewna liczba naturalna, nazywana liczbą argumentów danego symbolu. W takim przypadku mówimy, że zadano pewien język ( ściślej jest to język pierwszego rzędu ). Do tej pory rozpatrywaliśmy język, w którym dla każdej funkcji o argumentach i wartościach rzeczywistych mieliśmy pewien symbol funkcjonalny z odpowiednia liczbą argumentów, symboli predykatywnych nie używaliśmy. Zdefiniujmy teraz pojęcie formuły danego języka. Zanim podamy definicje formalną, podamy kilka przykładów formuł. Niech język zawiera symbole predykatywne P, Q, R o liczbie argumentów, odpowiednio 0, 1, 2, oraz symbole funkcjonalne f, g, h również o liczbie argumentów odpowiednio 0, 1, 2. Wtedy formułami takiego języka będą np. takie zapisy :

( Przykładowo drugą z powyższych formuł czytamy tak : jeśli istnieje takie y, że ma miejsce R or x i y, to mają miejsce Q od z i Q od w ) Wybierzmy pewien nieskończony ciąg symboli, nazywanymi zmiennymi. Niech będą to np. symbole x, y, z, u, v, w, x1, ...

Definicja termu jest taka jaką podaliśmy wcześniej, mianowicie : (T1) dowolna zmienna i dowolny symbol funkcjonalny z zerem argumentów są to termy (T2) jeśli dane są termy t1 , ... , tm , s - jest symbolem funkcjonalnym o m argumentach, to wyrażenie s(t1 , ... , tm ) jest

termem. Termami nazywamy te i tylko te wyrażenie, które można otrzymać na drodze wielokrotnego zastosowania zasad (T1) i (T2). Przykładowo, przy przyjętych powyżej założeniach o walencji symboli f, g, h wyrażenia : x, f, g(x), h(x, y), H( h(x, x), g(y) ) są termami. Zdefiniujemy teraz pojęcie formuły : (F1) jeśli t, s – są termami, to ( t = s ) – jest formułą. (F2) jeśli t1 , ... , tm – termy, a P – to symbol predykatywny o m argumentach , to P(t1 , ... , tm ) – jest formułą

Jeśli P – jest symbolem predykatywnym o zerze argumentów, to P – jest formułą. (F3) Jeśli P , Q – formuły, to P, ( P ∧ Q ), ( P ∨ Q ) ( P ⇒ Q ) – są formułami (F4) Jeśli P – jest formułą, a ξ - zmienną, to ∀ξP i ∃ξP ( dla wszystkich ξ słuszne jest P , istnieje takie ξ, że P ) – są formułami. Formułami nazywamy te i tylko te wyrażenia, które można otrzymać na drodze wielokrotnego zastosowania zasad (F1) – (F4). Czytelnik może się łatwo przekonać, że podane definicje termów i formuł stanowią uogólnienia wcześniejszych naszych definicji na przypadek dowolnego języka. W ten sposób określili śmy pojęcie formuły. Teraz chcemy omówić jaki sens można nadać formułą. W tym celu należy w pierwszej kolejności nadać sens wchodzącym do nich symbolom predykatywnym i funkcjonalnym. Każdemu symbolowi predykatywnemu o liczbie argumentów m należy przyporządkować m-pozycyjny predykat, przyjmujący wartości „prawda” i „fałsz”, a każdemu symbolowi funkcjonalnemu o liczbie argumentów m – pewną m-pozycyjną funkcje ( Wszystkie takie predykaty i funkcje powinny być, oczywiście zadane na jednym i tym samym zbiorze, a wartości funkcji powinny należeć do tego właśnie zbioru ). Jeśli coś takiego zrobiliśmy, to mówimy, że zadana jest interpretacja języka.

Page 36: Co to takiego analiza niestandardowa

36

Dokładniej – niech będzie dany pewien język L z symbolami predykatywnymi { P, Q, ... } i symbolami funkcjonalnymi { f, g, ... }. Zdefiniowanie interpretacji języka L oznacza : 1) wybrać pewien zbiór M – nośnik interpretacji 2) z każdym symbolem predykatywnym P o walencji m związać pewien m pozycyjny predykat tj. pewną funkcje P, argumentami której są skończone ciągi złożone z m elementów zbioru M, a wartościami symbole – Pr (prawda) i F ( fałsz). 3) z każdym symbolem funkcjonalnym f o walencji k związać pewną funkcje f, przyporządkowująca dowolnemu k-elementowemu ciągowi elementów M pewien element M. ( w tej definicji liczby m i k mogą być równe zero, symbolom funkcjonalnym o zerze argumentów przy interpretacji powinny odpowiadać elementy M, a symbolom predykatywnym – symbole Pr i F ) Aby ostatecznie określić sens formuł, należy wyjaśnić sens innych wchodzących do nich znaków. Jednakże ich sens jest jasny z ich nazwy. Ograniczymy się do podania kilku przykładów. Jeśli a – jest stałą ( zero pozycyjny symbol funkcjonalny ), Q – jedno pozycyjny symbol, to formuła Q(a) będzie prawdziwa w tym i tylko w tym przypadku, kiedy element a zbioru M, przyporządkowany symbolowi a, posiada własność Q, przyporządkowana symbolowi Q tj. kiedy Q(a) = Pr. Jeśli x – jest zmienną, to zagadnienie o prawdziwości formuły Q(x) nabiera sensu tylko po ustaleniu wartości zmiennej x. Ściślej – niech w danej interpretacji o nośniku M, symbolowi Q odpowiada funkcja Q z obszarem określoności M i wartościami Pr i F. Wtedy prawdziwość formuły Q(x) ( w tej interpretacji) będzie zależeć od tego jaki element x0∈ M

wziąć w charakterze wartości zmiennej x. Dokładnie : Q(x) będzie prawdziwa przy x = x0 wtedy i tylko wtedy, kiedy

Q(x0) = Pr.

Analogicznie prawdziwość formuły h(x, x ) = h( h(x, x), g(y)) zależy nie tylko od wybranej interpretacji, ale również od wartości zmiennych x i y. Formuła ta będzie prawdziwa przy x = x0 i y = y0, jeśli elementy x0∈ M i y0∈ M są takie, że :

h(x0, x0) = h( h(x0, x0), g(y0))

Rozpatrzmy teraz formułę ∃xQ(x). Jej prawdziwość już nie zależy od wartości x, a jest określona przez wybór interpretacji. Dokładnie – formuła ta jest prawdziwa w danej interpretacji wtedy i tylko wtedy, kiedy funkcja Q przyjmuje wartość Pr choćby tylko na jednym elemencie M. Prawdziwość formuły : ∃x( h(x, y) = h(h(x, x), g(y))) również nie zależy od wartości zmiennej x. Jej prawdziwość jest w pełni określona przez wybór interpretacji i wartości zmiennej y. Formalna definicja prawdziwości prowadzimy według już wspomnianego schematu. Wprowadzamy pojęcie „parametru formuły” ( zmiennej od wartości której może zależeć prawdziwość formuły ) i definiujemy prawdziwość formuły przy zadanych wartościach jej parametrów. Formuły, nie zawierające parametrów, nazywają się formułami zamkniętymi. Jak tylko ustaliliśmy jakąkolwiek interpretacje języka, to wszystkie formuły zamknięte przekształcają się w prawdziwe lub fałszywe zdania. Z pomocą wprowadzonej terminologii można opisać całą sytuacje następująco. Rozpatrujemy język, zawierający symbol funkcjonalny dla każdej funkcji o argumentach i wartościach rzeczywistych. Oznaczymy taki język jako RL. Język RL posiada dwie interpretacje – rzeczywistą i hiperrzeczywistą. W interpretacji rzeczywistej każdemu symbolowi funkcjonalnemu przyporządkowano funkcje o wartościach i argumentach rzeczywistych, w interpretacji hiperrzeczywistej – jej hiperrzeczywisty analog. Zasada Leibniza może być teraz sformułowana następująco :w interpretacjach rzeczywistej i hiperrzeczywistej prawdziwe są jedne i te same formuły zamknięte języka RL. W logice mamy specjalną nazwę dla takiej sytuacji : dwie interpretacje pewnego języka, w których prawdziwe są jedne i te same zamknięte formuły, nazywają się elementarnie równoważne. Wykorzystując taką terminologię, zagadnienie zbudowania układu liczb hiperrzeczywistych możemy sformułować tak : Należy zbudować interpretacje języka RL, elementarnie równoważną standardowej interpretacji rzeczywistej, ale zawierającą nieskończenie małe, różne od zera. Przekonajmy się teraz, że potrzebujemy właśnie czegoś takiego. Niech będzie dana właśnie taka interpretacja i M – jej nośnik. W naszym języku występują symbole, przedstawiające wszystkie funkcje rzeczywiste argumentów rzeczywistych. W szczególności dla każdej liczby rzeczywistej ( zero-pozycyjnej funkcji ) mamy stałą, ją reprezentującą. Takiej stałej przy interpretacji odpowiada określony element zbioru M. Jeśli c, d – są stałymi dla różnych liczb rzeczywistych, to odpowiadają im różne elementy M, inaczej formuła ( c = d ) była by fałszywa w interpretacji standardowej i prawdziwa w naszej interpretacji. Utożsamiając każdą liczbę rzeczywistą z odpowiednim elementem M,

Page 37: Co to takiego analiza niestandardowa

37

można przyjąć, że R jest podzbiorem M. Należy sprawdzić również, że funkcje na M, przyporządkowane każdemu symbolowi funkcjonalnemu języka RL, stają się przy tym przedłużeniami odpowiednich funkcji na R. Niech f – będzie symbolem funkcjonalnym o n argumentach, a c1 , ... , cn – stałe, oznaczające n liczb rzeczywistych.

Wtedy formuła f(c1 , ... , cn ) = d będzie prawdziwa w interpretacji standardowej, jeśli d – jest stałą oznaczającą wartość f

na liczbach c1 , ... , cn. ( dokładniej – wartość funkcji oznaczonej symbolem f, na liczbach oznaczanych symbolami

c1 , ... , cn ). Zgodnie z zasadą Leibniza formuła ta będzie prawdziwa również w interpretacji z nośnikiem M. Dlatego

wartość funkcji o argumentach i wartościach w M, odpowiadająca symbolowi f, na elementach M, oznaczanych symbolami c1 , ... , cn jest równa elementowi oznaczonemu symbolem d. To właśnie oznacza, że funkcje na M są przedłużeniami

odpowiednich funkcji na R. Zobaczmy teraz co może nam dać logika matematyczna dla budowy interpretacji języka RL, elementarnie równoważnej interpretacji standardowej. Zanim jednakże to zrobimy podamy kilka pojęć. Niech dany będzie pewien język L. Niech T – będzie zbiorem formuł zamkniętych tego języka. Będziemy mówili, ze interpretacja P języka L jest modelem T, jeśli wszystkie formuły z T są prawdziwe w P. W charakterze L weźmiemy teraz rozpatrzony przez nas wcześniej język RL ( z symbolami dla wszystkich funkcji na R ), a w charakterze T – zbiór Tr, wszystkich formuł zamkniętych tego języka, prawdziwych w standardowej jego interpretacji. Wtedy zgodnie z naszą definicją, standardowa interpretacja, jak również dowolny układ liczb hiperrzeczywistych, będzie modelem dla Tr. Pokażemy teraz, ze w dowolnym modelu dla Tr wszystkie formuły zamknięte języka RL, nie wchodzące do Tr będą fałszywe. Jeśli ϕ - jest formułą zamkniętą, nie wchodzącą do Tr, to ϕ jest fałszywa w interpretacji standardowej. Wtedy formuła ϕ, jest w niej prawdziwa, a zatem wchodzi do Tr. To oznacza, że ϕ jest prawdziwa w dowolnym modelu zbioru Tr, a ϕ fałszywa w dowolnym modelu zbioru Tr. Zatem, w dowolnym modelu zbiory Tr prawdziwe są te i tylko te formuły, które są prawdziwe w modelu standardowym. Możemy to sformułować następująco : Jeśli T – jest zbiorem formuł zamkniętych, prawdziwych w pewnej interpretacji P języka RL, to własności Tr ⊂ T i Tr = T są równoważne. Teraz zadanie zbudowania układu liczba hiperrzeczywistych możemy sformułować tak : znaleźć model zbioru Tr, który rozpatrywany jako ciało uporządkowane, nie spełnia aksjomatu Archimedesa. Zanim jednak zajmiemy się tak sformułowanym zagadnieniem, wprowadzimy jeszcze jedno pojęcie, odnoszące się do dowolnego języka L i dowolnego zbioru T formuł zamkniętych języka L. Zbiór T nazwiemy zgodnym, jeśli istnieje jego model, tj. jeśli istnieje interpretacja języka L, w której prawdziwe są wszystkie formuły z T. Teraz mamy wszystko gotowe, aby sformułować twierdzenie o zwartości Malcewa. Twierdzenie o zwartości. Niech będzie dany dowolny język L i dowolny zbiór T formuł zamkniętych tego języka. Niech każdy podzbiór T zbioru T będzie zgodny, wtedy również cały zbiór T jest zgodny. Twierdzenie to pokazuje, że dla zbudowania modeli zbioru T wystarczy umieć zbudować modele wszystkich skończonych podzbiorów zbioru T ( stwierdzenie odwrotne jest oczywiste, ponieważ model zbioru T jest również modelem dla wszystkich jego skończonych podzbiorów ) Dowód powyższego twierdzenia omówimy nieco później, a póki co zademonstrujemy jak z jego pomocą możemy otrzymać układ liczb hiperrzeczywistych. W pierwszej kolejności dodamy do naszego języka RL ( zawierającego symbole funkcjonalne dla wszystkich funkcji na zbiorze R ) jeszcze jeden zero pozycyjny symbol funkcjonalny c ( różny od wszystkich innych symboli ) Otrzymujemy w ten sposób, nowy rozszerzony język RLc Aby zadać interpretacje tego języka należy wziąć dowolną

interpretacje języka RL, wybrać w jej nośniku dowolny element i nadać jego wartość symbolowi c. I odwrotnie, jeśli mamy dowolną interpretacje języka RLc , to z niej w trywialny sposób otrzymujemy interpretacje języka

RL – należy po prostu zapomnieć o symbolu c i o tym jaki element został mu przyporządkowany. Rozpatrzmy teraz pewien zbiór formuł zamkniętych Tc nowego języka. Będzie ona zawierała, po pierwsze wszystkie

elementy Tr, tj. wszystkie zamknięte formuły języka RL, prawdziwe w jego interpretacji standardowej, a oprócz tego przeliczalny zbiór formuł o postaci :

G(c, 0– ) = 0– , G(c, 1– ) = 0– , G(c, 2– ) = 0– , ... Gdzie G - dwu pozycyjny symbol funkcjonalny, oznaczający funkcje, dla której G(x, y ) = 0 ⇔ x > y ,

a 0– , 1– , 2– , ... – zero pozycyjne symbole funkcjonalne języka RL, odpowiadające liczbom rzeczywistym 0, 1, 2, , ... Teraz wystarczy pokazać, że taki zbiór (Tc ) posiada model. Jeśli bowiem model istnieje, to zapominając o symbolu c,

otrzymamy interpretacje języka RL ( nie zawierająca symbolu c ), będącą modelem zbioru Tr.

Page 38: Co to takiego analiza niestandardowa

38

Model ten ( jako ciało uporządkowane ) będzie niearchimedesowski – jego element odpowiadający symbolowi c, będzie nieskończenie dużym. Zatem, pozostało nam dowieść zgodności zbioru Tc. W tym celu zgodnie z twierdzeniem o zwartości wystarczy dowieść

zgodności dowolnego skończonego podzbioru, zbioru Tc. Będzie to zrobione, jeśli pokażemy zgodność następującej

rodziny :

Tc(n) = Tr ∪ { G(c, 0– ) = 0– , ... , G(c, n– ) = 0– }

Przy dowolnym n, ponieważ dowolna skończona podrodzina, rodziny Tc jest zawarta w pewnym Tc(n) przy wystarczająco

dużym n. Aby dowieść zgodności rodziny Tc(n), należy zbudować jej model. A to jest bardzo proste :

Weźmiemy standardową interpretacje języka RL i rozszerzymy ją do interpretacji języka RLc, przyjmując, że c

interpretujemy jako liczbę n + 1. Oczywiście, że wszystkie formuły rodziny Tc(n) będą prawdziwe w takiej interpretacji.

Tym samym dowodzimy zgodności rodziny Tc(n) przy dowolnym n, stad zgodnie z twierdzeniem o zwartości

otrzymujemy zgodność rodziny Tc. Modele takiej rodzin, jak już widzieliśmy przekształcają się w poszukiwany układ liczb

hiperrzeczywistych, jak tylko zapomnimy o c. Przedstawione rozumowanie jest bardzo proste, w ten sposób podstawowa trudność w zbudowaniu układu liczb hiperrzeczywistych zawarta jest w twierdzeniu o zwartości. Teraz opowiemy w jaki sposób możemy dowieść tego twierdzenia. Istnieją ( w skrajnym przypadku ) dwa sposoby jego dowiedzenia. Jeden z nich jest analogiczny do opisanego wcześniej sposobu zbudowania układu liczb hiperrzeczywistych z pomocą klas równoważności ciągów. Nie będziemy jednak omawiali tego sposobu. Druga metoda ( jak się wydaje bardziej naturalna ) polega na zastosowaniu jednego z centralnych twierdzeń logiki – twierdzenie Goedla-Malcewa o zupełności. Niestety ścisłe sformułowanie tego twierdzenia wykracza daleko poza ramy naszego wykładu, dlatego tez ograniczymy się w tym temacie do pewnych nieformalnych komentarzy. Jeśli chcielibyśmy opisać twierdzenie Goedla-Malcewa w jednym zdaniu, to można powiedzieć tak – twierdzenie to daje nam syntaktyczne kryteria zgodności zbioru formuł. Kryteria te są takie. Definiujemy pojęcie wywodliwości danej formuły ϕ z danego zbioru formuł T. Nie możemy podać ścisłej definicji tego pojęcia, ponieważ jest ono zbyt złożone. Powiemy tylko, że wywodliwość ϕ z T oznacza, ze istnieje ciąg formuł, każda z których należy albo do T, albo do wcześniej przyjętego zbioru ( elementy którego nazywamy aksjomatami ), albo jest otrzymywana z wcześniejszych członów ciągów zgodnie z określonymi zasadami ( zasady te nazywają się zasadami dowodzenia ) przy czym ostatnią formułą tego ciągu jest formuła ϕ. Ciąg formuł, posiadający opisane powyżej własności nazywa się wyprowadzeniem formuły ϕ ze zbioru formuł T. Zatem, wywodliwość ϕz T oznacza, ze istnieje wyprowadzenie formuły ϕ z T. Już z tego opisu staje się jasną następująca własność wywodliwości : jeśli formuła ϕ jest wywodliwa z pewnego zbioru T, to w tym wywodzie wykorzystuje się tylko skończoną liczbę formuł należących do T. Ściślej, słuszne jest następujące stwierdzenie : jeśli formuła ϕ jest wywodliwa ze zbioru T, to istnieje taki skończony podzbiór T’ ⊂ T, ze formuła ϕ może być wywiedziona ze zbioru T’. Zbiór formuł nazwiemy sprzecznym, jeśli możemy z niego wywieść jednocześnie pewną formułę ϕ oraz jej zaprzeczenie ϕ. Teraz jesteśmy gotowi do sformułowania twierdzenie Goedla-Malcewa o zupełności. Twierdzenie. Niech L – będzie dowolnym językiem ( chcąc być dokładnym należałoby powiedzieć – jednostronnym językiem pierwszego rzędu, ale my innych języków nie wprowadzaliśmy ), T – niech będzie zbiorem formuł zamkniętych tego języka. Wtedy następujące własności są równoważne : a) T jest zbiorem zgodnym b) T jest zbiorem niesprzecznym Twierdzenie to pozwala zamienić semantyczną ( tj. odwołującą się do interpretacji ) własność zgodności, na syntaktyczną ( rozpatrujemy formuły tylko jako ciągi znaków, w oderwaniu od ich sensu ) własność niesprzeczności. Z tej ostatniej łatwo wynika twierdzenie o zwartości. Po pierwsze bowiem, zgodność pokrywa się z niesprzecznością, należy dowieść tylko, że jeśli każdy skończony podzbiór danego zbioru formuł zamkniętych jest niesprzeczny, to również cały zbiór jest niesprzeczny. Innymi słowy, należy dowieść, ze jeśli dany zbiór T jest sprzeczny, to sprzeczny jest jego pewien skończony podzbiór. A to wynika ze wspomnianej powyżej własności relacji wywodliwości. Jeśli bowiem ze zbioru T możemy wywieść formuły ϕ i ϕ, to znajdziemy takie skończone podzbiory T1 i T2 zbioru T, że z T1 możemy wywieść ϕ, a z T2 –

wywieść ϕ. Wtedy ze zbioru skończonego T1 ∪ T2 wywieść możemy zarówno ϕ jak i ϕ, a zatem jest on sprzeczny.

Zatem, twierdzenie o zwartości łatwo wynika z twierdzenie Goedla-Malcewa o zupełności ( Nazwaliśmy to twierdzenie – twierdzeniem Goedla-Malcewa, a nie po prostu twierdzeniem Goedla, ponieważ interesujący nas wariant po raz pierwszy dowiódł A. I. Malcew. Goedel dowiódł równoważności zgodności i niesprzeczności tylko dla języków o przeliczalnym zbiorze symboli predykatywnych i funkcjonalnych. Zatem, podstawowa trudność w zbudowaniu liczb hiperrzeczywistych polega właśnie na dowodzie twierdzenia o zupełności. Niestety szczegółowe omówienie pojęcia wywodliwości wykracza poza ramy naszego wykładu.

Page 39: Co to takiego analiza niestandardowa

39

Logika matematyczna pozwala również wyjaśnić zagadnienie związane z niejednoznacznością hiperrzeczywistego rozszerzenia zbioru liczb rzeczywistych. Okazuje się, że można zbudować układ liczb hiperrzeczywistych ( tj. interpretacje języka RL, elementarnie równoważną interpretacji standardowej ), posiadający dowolnie dużą moc. Tym samym R* nie jest jedynym rozszerzeniem. Nie jest to jednakże jakiś szczególny problem, ponieważ wszystkie interpretacje języka RL, elementarnie równoważne interpretacji standardowej, są wzajemnie równoważne. Dlatego, chociaż nie są one jednakowe, w pewnym sensie są one „nierozróżnialne”. 11. „Analiza niestandardowa” lub Matematyka niestandardowa” ? ( przykłady topologiczne ) Pojęcie „analiza niestandardowa” może być wykorzystywane w dwóch zakresach – wąskim i szerokim. Do tej pory mówiliśmy o analizie niestandardowej w wąskim sensie, rozumiejąc pod tym pojęciem porównawczą analizę układu R – liczb rzeczywistych i układu R* - liczb hiperrzeczywistych ( ściślej – dowolny z układów R* ) W wyniku takiego porównania nie tylko otrzymujemy pewne wiadomości o własnościach R*, ale również o własnościach prostej rzeczywistej R. Pojawia się chęć rozciągnięcia tej metody na szerszy obszar zastosowania. Gdzie możemy oczekiwać pożytku z takiego rozszerzenia ? Prawdopodobnie tam, gdzie chodzi o coś w rodzaju nieskończenie małej lub nieskończenie dużej wielkości tj. w topologii, teorii równań różniczkowych, mechanice itd. Przykładowo w topologii, chcielibyśmy rozciągnąć te definicje punktu brzegowego i granicy, które już wspominaliśmy, na przypadek dowolnej przestrzeni topologicznej. Dalej omówimy, czy można to zrobić, a jeśli tak, to jak. Przypominam, że taka przestrzeń topologiczna ( w standardowym sensie matematycznym ). Niech zadany będzie pewien zbiór X. Elementy tego zbioru będziemy nazywali punktami, a sam zbiór X – przestrzenią. Niech oprócz X zadana będzie pewna rodzina zbiorów T, elementy którego są podzbiorami X. Niech rodzina T posiada następujące własności : a) suma dowolnej liczby zbiorów z T należy do T b)przecięcie dowolnej skończonej liczby zbiorów z T należy do T. c) zbiór pusty ∅ i cała przestrzeń X należy do T W takim przypadku mówimy, że na zbiór X wprowadzono topologię T; parę < X, T> ( lub bardziej dowolnie sam zbiór X ) nazywamy przestrzenią topologiczną, a podzbiory X, wchodzące do T – podzbiorami otwartymi przestrzeni topologicznej < X, T>. Podamy teraz kilka przykładów przestrzeni topologicznych. 1) Wprowadzimy topologię na zbiorze R liczb rzeczywistych. Punkt x∈R punktem wewnętrznym zbioru A ⊂R, jeśli istnieje takie ε > 0, że dowolny punkt y, odległa od x mniej niż ε ( w tym i sam punkt x ), wchodzi do A. Zbiór A⊂R nazywamy zbiorem otwartym, jeśli dowolny punkt x tego zbioru jest punktem wewnętrznym. Innymi słowy zbiór A jest otwarty, jeśli dla dowolnego punktu x∈A znajdziemy takie ε > 0, ze interwał ( x – ε, x + ε ) jest podzbiorem zbioru A. Łatwo sprawdzić, że rodzina wszystkich otwartych ( we wskazanym sensie) podzbiorów zbioru R posiada własności a) – c), a zatem jest topologią na zbiorze R. Taka topologia nazywa się topologią naturalną na R. 2) W analogiczny sposób możemy wprowadzić topologie również na zbiorze wszystkich punktów płaszczyzny. Dokładnie : punkt x nazywa się punktem wewnętrznym zbioru A, jeśli znajdziemy takie ε > 0, że okrąg o środku w punkcie x o promieniu ε wchodzi całkowicie do A. Zbiór A punktów płaszczyzny nazywa się otwartym. W ten sposób otrzymujemy topologię na płaszczyźnie, topologię tą nazywamy topologią naturalną. 3) Niech X – będzie dowolnym zbiorem. Możemy wprowadzić topologię na X, twierdząc, że wszystkie podzbiory X są otwarte ( łatwo sprawdzić, że przy takiej definicji, własności a) – c) są spełnione ) Taka topologia nazywa się topologią dyskretną. 4) Niech X – będzie dowolnym zbiorem. Możemy wprowadzić topologię na X, w której będą występowały tylko dwa zbiory otwarte – zbiór pusty i cały zbiór X. Własności a) – c) są oczywiście spełnione. Jest to przykład topologii przeciwny do poprzedniego przykładu – w poprzednim przykładzie wszystkie zbiory były otwarte, a w tym otwartymi są tylko te zbiory, których nie można nie nazwać takimi ( według własności c) ) Spróbujemy teraz wyjaśnić w jakim sensie pojęcie przestrzeni topologicznej związane jest z intuicyjną ideą „bliskości” , „otoczenia” itp. Spróbujemy przykładowo, nadać ścisły sens takiemu wyrażeniu : „dla wszystkich punktów wystarczająco bliskich punktowi a, spełniona jest własność P” Niech na początku pod punktami rozumiemy punktu prostej rzeczywistej ( tj. liczby rzeczywiste ) W tym przypadku wskazane wyrażenie można uściślić w następujący sposób : Własność P jest spełniona dla wszystkich x, wystarczająco bliskich ku a, wtedy i tylko wtedy, kiedy istnieje takie ε > 0, że własność P jest spełniona dla wszystkich x, dla których | x – a | < ε

Page 40: Co to takiego analiza niestandardowa

40

Przykładowo, dla wszystkich x wystarczająco bliskich ku 1, spełniona jest taka własność : 0,00 ≤ x2 ≤ 1,01 ( aby to sprawdzić wystarczy np. wziąć ε = 0,001 ) Drugi przykład : dla wszystkich x, wystarczająco bliskich ku π, spełniona jest nierówność cos(x) ≤ – 0,999 Pojawia się następujące zagadnienie : przenieść takie zagadnienia z prostej na inne przestrzenie topologiczne, np. nadać ścisły sens takiemu intuicyjnie jasnemu stwierdzeniu : Jeśli odcinek AB przecina prostą ł, to dla każdego punktu B’, wystarczająco bliskiego ku B, odcinek AB’ również będzie przecinał prostą ł.

Rys. 15 Nadanie sensu wyrażeniu „dla wszystkich wystarczająco bliskich ...” okazuje się możliwe w następujący sposób. Niech na zbiorze X wprowadzono topologię T, przekształcając go w przestrzeń topologiczną. Niech P – będzie pewna własnością, którą mogą posiadać lub nie punkty X. Będziemy mówili, że własność P jest spełniona dla wszystkich wystarczająco bliskich ku a punktów przestrzeni X, jeśli istnieje zbiór otwarty ( tj. zbiór należący do rodziny T ) U ⊂ X, zawierający punkt a, dla wszystkich punktów którego spełniona jest własność P. Łatwo sprawdzić, że jeśli w charakterze X wziąć zbiór liczb rzeczywistych R, a w charakterze T – topologię naturalną na nim, opisaną w przykładzie 1, to podana tylko co definicja jest równoważna definicji podanej wcześniej. Sformułowane stwierdzenie o odcinkach może być teraz uściślone w następujący sposób : Jeśli odcinek AB przecina prostą ł, to istnieje zbiór otwarty, zawierający punkt B, dla dowolnego punktu B’ zbioru B, odcinek AB przecina prostą ł. Podamy jeszcze kilka przykładów, pokazujących w jaki sposób różnorodne pojęcia przenoszą się z prostej rzeczywistej na dowolne przestrzenie topologiczne. Podamy definicje granicy i punktu granicznego ciągu punktów przestrzeni topologicznej X. Niech x0 ,x1, ... – ciąg punktów przestrzeni topologicznej X, a – niech będzie pewnym jej punktem. Mówimy, że a jest

granicą x0 ,x1, ... jeśli dowolny zbiór otwarty, zawierający a, zawiera wszystkie człony takiego ciągu, za wyjątkiem

skończonej liczby. Mówimy, ze a jest punktem granicznym ciągu x0 ,x1, ... jeśli dowolny zbiór otwarty, zawierający a,

zawierają nieskończenie wiele członów tego ciągu. Ważną klasę przestrzeni topologicznych stanowią przestrzenie Hausdorffa. Przestrzeń X nazywa się przestrzenią Hausdorffa, jeśli dla dowolnych różnych punktów x, y istnieją nieprzecinające się zbiory otwarte U, V, zawierające odpowiednio punkty x i y.

Rys. 16 Łatwo sprawdzić, że przestrzenie z przestrzeni 1 – 3 są przestrzeniami Hausdorffa, przestrzeń z przykładu 4 nie jest przestrzenią Hausdorffa ( jeśli w X zawarte jest więcej niż jeden element ). Większość przestrzeni, spotykanych w praktyce matematycznej ( jak również w zastosowaniach ), są przestrzeniami Hausdorffa. W przestrzeniach niehausdorffowskich mogą pojawiać się nieoczekiwane zjawiska , np. jeden i ten sam ciąg może mieć dwie różne granice. Przestrzenie Hausdorffa nazywają się również przestrzeniami separowalnymi. Zaznajomiliśmy się już z kilkoma pojęciami topologii, teraz omówimy w jaki sposób możemy zastosować metody analizy niestandardowej do przestrzeni topologicznych. Na pierwszy wzgląd zagadnienie to wydaje się trudne. Wcześniej ( w R i jej rozszerzeniach ) w definicjach nieskończenie małych występowała pewna trudność – w dowolnej przestrzeni topologicznej takie trudności oczywiście nie występują. Jak jednak zdefiniować nieskończoną bliskość ?

Page 41: Co to takiego analiza niestandardowa

41

Obecnie spróbujemy opisać w ogólnym planie schemat zastosowania metody analizy niestandardowej do dowolnych przestrzeni topologicznych. Niech A – będzie dowolnym zbiorem. Elementy tego zbioru naśladując M. Daviesa [3], będziemy nazywać indywiduami. Przyjmiemy, że indywiduły nie są same zbiorami. Rozpatrzmy teraz wszystkie możliwe zbiory, które można zbudować wychodząc od elementów A, w skończonej liczbie kroków. Zanim uściślimy to podejście, podamy kilka przykładów takich zbiorów. W pierwszej kolejności, są to wszystkie możliwe podzbiory zbioru A. Zbiór wszystkich takich podzbiorów oznaczymy jako P(A). W następnym kroku możemy rozpatrywać zbiory, elementami których są ( wraz z indywiduami ) również zbiory indywidułów tj. podzbiory A ∪P(A). Zbiory te ponownie można wykorzystać w charakterze elementów w dalszych konstrukcjach. Podamy teraz ściślejsze sformułowania. Zdefiniujmy ciąg zbiorów A0 , A1, ... następująco :

A0 = A, Ai+1 = Ai ∪ P(Ai )

Otrzymujemy dla każdego A wzrastający ciąg zbiorów : A0 ⊂ A1⊂ ....

Jego sumę będziemy ( również naśladując M. Daviesa ) superstrukturą o indywiduach A i będziemy ją oznaczali jako S(A). Zatem, nad każdym zbiorem indywidułów A pojawia się superstruktura S(A). Wyjaśnijmy dlaczego wymagamy, aby elementy A same nie były zbiorami. Jest to potrzebne dlatego, aby różne „poziomy” naszej superstruktury nie mieszały się. Przykładowo, jeśliby A, wraz z elementami a i b zawierała ( w charakterze swojego elementu ) zbiór { a, b }, to A i P(A) przecinałyby się : zbiór { a, b} można byłoby rozpatrywać zarówno jako element A, jak i zbiór elementów A, tj. jako element P(A). Teraz, oprócz „standardowej” superstruktury, opisanej powyżej, zbudujemy jej „niestandardowe” rozszerzenie w pewnym sensie nieodróżnialne od standardowej superstruktury. Należy jedynie wyjaśnić w jakim sensie jest ona nieodróżnialna i na czym polega jej niestandardowość. Omówienie niestandardowości odłożymy na później, a póki co zajmiemy się nieodróżnialnością. Nieodróżnialność standardowej superstruktury od niestandardowej będziemy rozumieli w tym sensie iż w takich strukturach prawdziwe są jedne i te same formuły zamknięte ( sądy ) pewnego języka. Pozostaje nam opisać taki język. Formuły tego języka będziemy budowali ze stałych ( tj. nazw ) dla wszystkich elementów superstruktury A(A) oraz zmiennych z użyciem znaków : ∈ ( symbol przynależności ), = ( znak równości), znaków logicznych ( alternatywy, sumy logicznej, negacji itd. ) oraz kwantyfikatorów ( kwantyfikatora ogólnego i kwantyfikatora egzystencjalnego ) Innymi słowy, język ten zawiera jeden- jednoznaczny dwupozycyjny symbol predykatywny „przynależności” ( dla wygody w miejsce zapisu ∈(x, y ), będziemy pisali po prostu x∈ y ) i dużą liczbę zeropozycyjnych symboli funkcjonalnych ( są to właśnie stałe) – ile , tyle ile elementów występuje w superstrukturze S(A). Zakładamy przy tym, że ustalona jest wzajemnie jednoznaczna relacja pomiędzy symbolami funkcjonalnymi i elementami superstruktury S(A). Język taki posiada interpretacje standardową w której nośnikiem jest S(A), zeropozycyjnym symbolom funkcjonalnym przypisujemy odpowiadające im elementy superstruktury S(A), a symbolowi predykatywnemu ∈ odpowiada standardowa relacja przynależności, tj. funkcja przyporządkowująca parze x,y∈ S(A) symbol P jeśli x∈ y i symbol F jeśli x ∉ y. Rozpatrzmy teraz dowolną ( i nie obowiązkowo standardową ) interpretacje takiego języka. Jego nośnik oznaczymy przez S*, na zbiorze S* istnieje relacja binarna, odpowiadająca symbolowi predykatywnemu ∈. Taką relacje będziemy oznaczali jako ∈* i będziemy pisali x ∈* y, jeśli para < x, y > ( x, y ∈* S ) znajduje się w takiej relacji, tj. ∈*( x, y ) = P. Oprócz tego w S* są zinterpretowane wszystkie symbole funkcjonalne języka ( przypomnijmy, że wszystkie one są zeropozycyjne ), innymi słowy każdemu elementowi s ∈ S(A) przyporządkowano pewien element zbioru S*. Element zbioru S* przyporządkowany elementowi s należącemu do S(A) będziemy oznaczali jako s*. Wymagamy, aby dla nowej interpretacji słuszna była zasad Leibniza tj. aby były prawdziwe te same formuły zamknięte rozpatrywanego języka, co w standardowej jego interpretacji. Mając świadomość tego faktu spróbujmy teraz wyjaśnić jak zbudowany jest zbiór S*. Z każdym elementem s ∈ S(A) związany jest element s* ∈ S*. Czy dwóm różnym elementom s1 , s2 ∈ S(A) mogą być przyporządkowane jednakowe elementy S* ?

Łatwo zauważyć, że nie. W istocie, niech c1, c2 – będą stałymi ( tj. zeropozycyjnymi symbolami funkcjonalnymi )

odpowiadające elementom s1 i s2. Rozpatrzmy formułę c1 = c2. W S(A) taka formuła jest fałszywa, ponieważ jako

interpretacja stałej c1 jest to s1,a elementy s1 i s2 są różne. To oznacza, że w S* taka formuła będzie fałszywa tj.

interpretacje stałych c1 i c2 w S* - elementy s*1 i s*2 – będą różne. W takim razie zbudowaliśmy odpowiedniość

wzajemnie jednoznaczną pomiędzy S(A) i pewnym podzbiorem zbioru S*. Elementy tego podzbioru możemy nazwać standardowymi elementami S*. Teraz staje się jasne, ze S* można przyjąć jako rozszerzenie superstruktury S(A), utożsamiając S(A) z pewną częścią zbioru S*.

Page 42: Co to takiego analiza niestandardowa

42

Przyjrzyjmy się takiemu utożsamieniu dokładniej. Niech a∈A – będzie pewnym indywidułem, a X ⊂ A – pewnym zbiorem indywidułów. Wtedy zarówno a jak i X są elementami superstruktury S(A). Odpowiadają im pewne elementy a* i X* w jej niestandardowym rozszerzeniu S*. Czy znajdują się one w relacji ∈* ? Innymi słowy, czy prawdziwe jest w S* to, że *a* ∈ X* ? Łatwo zrozumieć, że jest to słuszne wtedy i tylko wtedy, kiedy a∈ X. Niech bowiem ca i cX – będą stałymi naszego języka, odpowiadającymi a i X. Prawdziwość sądu ca ∈ cX w standardowej

superstrukturze, oznacza naturalnie, że a∈ X. Prawdziwość tego sądu w S* oznacza, że *a* ∈ X* Zatem, przy włożeniu superstruktury S(A) w S* zachowana jest relacja przynależności. Każdemu elementowi Y z S* można przyporządkować pewien podzbiór S* - właśnie podzbiór tych x ∈ S*, dla których w S* ma miejsce x*∈ Y. Zobaczmy jakim będzie taki zbiór dla pewnych standardowych elementów z S*. Najprostszy przykład – zbiór pusty ∅∈ S(A). Odpowiada mu element standardowy ∅*∈ S* i dalej zbiór wszystkich tych x∈S* dla których x*∈∅*. Łatwo zrozumieć, ze zbiór ten jest pusty. W istocie – w S(A) prawdziwa jest formuła : ∀x ( x ∈ ∅ ) Formuła ta na mocy naszego założenia jest prawdziwa również w S*. To oznacza, ze dla wszystkich x∈ S* nie jest prawdziwe x*∈ ∅* tj. że interesujący nas zbiór jest pusty. Nieco bardziej złożony przykład. Niech a, b – będą pewnymi indywiduami, X = { a, b }. Zbiór X jest elementem superstruktury S(A), a to oznacza że przyporządkowano mu pewien element X* z S*. Jaki podzbiór w S* mu przyporządkowano ? Innymi słowy, dla jakich x∈S* spełniona jest zależność x* ∈ X* ? Łatwo zauważyć, że jest tak przy x = a* i x = b*, ale czy jest również inne x ∈S*, przy którym x* ∈ X* ? Okazuje się, że nie. Aby to zrozumieć, rozpatrzmy formułę : ∀x( x ∈cX ⇒ ( x = ca ) ∨ ( x = cb ) )

w którym cX, ca, cb są w istocie stałymi, odpowiadającymi elementom X, a, b superstruktury S(A).

Formuła ta jest prawdziwa w S(A), ponieważ X = {a, b}. To oznacza, ze jest ona prawdziwa również w S*. To oznacza, ze dowolny element x∈ S*, dla którego x*∈ X*, jest równy albo a*, albo b*. Zatem, elementowi X* odpowiada podzbiór { a*, b* } Czy tak będzie zawsze ? Sformułujmy to pytanie ściślej. Rozpatrzmy dowolny zbiór X ⊂ A. Odpowiada mu element X*∈ S*. Rozpatrzmy dalej podzbiór w S*, składający się z wszystkich tych x∈ S*, dla których x*∈X*. Oczywiście, że taki podzbiór zawiera wszystkie a* dla wszystkich możliwych a∈X. Czy może on zawierać coś jeszcze innego ? Łatwo zauważyć, że innych elementów standardowych on nie zawiera – jeśliby *s* ∈ X* przy pewnym s∈ S(A), to ( zgodnie z zasadą Leibniza ) okazałoby się, ze s∈X, alej jak przekonamy się dalej, mogą istnieć niestandardowe elementy x, dla których x* ∈ X*. Powstała sytuację możemy zilustrować następująco :

Rys. 17 Lewy rysunek przedstawia sytuację w standardowej superstrukturze : zbiór X zawiera elementy a, b, c, ... Po prawej przedstawiono sytuację w S*. Tak jak wcześniej elementy a*, b*, c*, ... znajdują się w relacji ∈* do elementu X*, ale teraz oprócz nich mogą pojawiać się nowe niestandardowe elementy, również znajdujące się w relacji ∈* do elementu X*. Podobny efekt może się pojawić ( i istotnie pojawia się ) na wyższych poziomach. Przypominam, że przez P(A) oznaczyliśmy rodzinę wszystkich zbiorów indywidułów. Zbiór P(A) ( jak i dowolny element S(A)) posiada analog P*(A) w S*; dla każdego X ∈P(A) element X* znajduje się w relacji ∈* z P*(A), jednakże mogą istnieć i elementy niestandardowe, znajdujące się w relacji ∈* z P*(A), zatem w S* mogą pojawiać się nie tylko „nowe indywidua”, ale i „nowe zbiory indywidułów”.

Page 43: Co to takiego analiza niestandardowa

43

Strukturę S* można rozpatrywać jako wynik konstrukcji, podobnej do budowy S(A). Dokładniej można wyobrazić sobie to tak : wkładamy A w szerszy zbiór A0, następnie rozpatrujemy zbiór A1będący sumą A0 z pewną rodziną podzbiorów

zbioru A0, następnie rozpatrujemy A2, równy sumie A1 z pewną rodziną podzbioru A0, itd.

Różnica pomiędzy tą konstrukcją od konstrukcji budowania S(A) polega na tym, że teraz na każdym kroku bierzemy nie wszystkie podzbiory, a tylko niektóre z nich ( nazywają się one „wewnętrznymi” ) Sformułujmy to wszystko nieco ściślej. Niech S* - będzie dowolnym rozszerzeniem S(A), spełniającym zasadę Leibniza. Wtedy istnieją ciągi zbiorów : A0 ⊂ A1 ⊂ A2 ⊂ ...

dla których: A ⊂ A , Ai+1 ⊂ Ai ∪ P( Ai )

Dla wszystkich i, oraz odpowiedniość wzajemnie jednoznaczna pomiędzy S* i sumą wszystkich możliwych zbiorów Ai dla

wszystkich i, przy takiej odpowiedniości relacja ∈* na S* przechodzi w standardową relacje przynależności na sumie wszystkich Ai Oprócz tego, jeśli x ∈ S(A) i wchodzi do zbioru Ai ( przypomnijmy, że S(A) budowaliśmy jako sumę

wzrastającego ciągu zbiorów A0 ⊂ A1 ⊂ ... z A0 = A oraz Ai+1 = Ai ∪ P ( Ai )), to elementowi x* zbioru S* odpowiada

element zbioru Ai )

Zatem, zbiór S* może być zbudowany tak : na początku rozszerzamy A do pewnego A0, a następnie będziemy stosowali

standardową konstrukcje superstruktury dla A0 z tą różnicą, że na każdym kroku rozpatrujemy nie wszystkie podzbiory, a

tylko niektóre z nich. Wszystko to możemy przedstawić na następującym rysunku :

Rys. 17 Zaczernione punkty i linie ciągłe przedstawiają standardowe obiekty oraz standardową relacje przynależności. Zaczernione punkty dolnego poziomu przedstawiają indywidua z A, zaczernione punkty kolejnego poziomu – zbiory indywidułów itd. Jasne punkty i linie przerywane przedstawiają dodane ( niestandardowe ) elementy. Widać, ze na każdym poziomie pojawiają się nowe elementy oraz, że dla kolejnych zbiorów pojawiają się nowe elementy. Taki schemat, jest oczywiście umowny, ale może stanowić punkt wyjścia dla zbudowania ogólnej reprezentacji struktury niestandardowych rozszerzeń. Teraz możemy wyjaśnić, jak następuje, np. zastosowanie metod niestandardowych w topologii. Punkty analizowanej przestrzeni przyjmujemy jako indywidua. Następnie nadbudowujemy nad nimi standardową superstrukturę i rozpatrujemy jej niestandardowe rozszerzenia. W rozszerzeniu niestandardowym pojawiają się nowe, niestandardowe punkty. Topologia ( jako rodzina zbiorów otwartych ) również jest elementem superstruktury, dlatego pojawia się odpowiedni obiekt w rozszerzeniu niestandardowym. Elementy tego obiektu ( tj. elementy S* znajdujące się w relacji ∈* z nimi ) można rozpatrywać jako niestandardowe „zbiory otwarte”. Każdy standardowy zbiór otwarty U posiada analog U* w modelu niestandardowym, do takiego analogu „należą” „te same” standardowe punkty, co i U, oraz być może niektóre punkty niestandardowe. Słowo „należą” wzięte jest w cudzysłów, ponieważ mamy tutaj do czynienia z pewną dowolnością, poprawniej należałoby mówić „znajdują się w relacji ∈*” w miejsce „należą”. Z analogicznych powodów wzięto w cudzysłów „te same” – w istocie do zbioru U* należą nie same elementy zbioru U, a ich niestandardowe analogi ( elementy modelu niestandardowego utożsamione z nimi ). Jednakże nie będziemy zbytnio pedantyczni i pozwolimy sobie na takie dowolności, mając nadzieje, że czytelnik sam, bez trudu potrafi odtworzyć poprawniejsze sformułowania. W ten sposób, przy przejściu do modeli niestandardowych stare zbiory otwarte mogą przyjmować nowe (niestandardowe ) punkty, oprócz tego mogą pojawiać się nowe (niestandardowe ) zbiory otwarte. Teraz pokażemy jaki sposób w interpretacji niestandardowej wprowadza się pojęcie „nieskończonej bliskości”. Na początku rozpatrzymy sytuacje w interpretacji standardowej. Niech x – będzie standardowym punktem przestrzeni topologicznej X. Rozpatrzymy wszystkie standardowe zbiory otwarte, zawierające x. Rozpatrzmy przecięcie wszystkich takich zbiorów. Jeśli przestrzeń X jest separowalna, to takie przecięcie zawiera jedyny punkt x. ( jeśli bowiem y ± x, to istnieje zbiór otwarty, zawierający x i nie zawierający y, dlatego punkt y nie wchodzi do przecięcia wszystkich zbiorów otwartych, zawierających x )

Page 44: Co to takiego analiza niestandardowa

44

Do tej pory cała nasza analiza była standardowa. Przechodząc do interpretacji niestandardowej zauważamy, że w rozpatrywanym przecięciu mogą pojawić się punkty niestandardowe, różne od x. Ściślej, mogą znaleźć się takie z ∈*S, różne od x*, że dla dowolnego ( standardowego) zbioru otwartego U, zawierającego ( standardowy) punkt x, spełnione jest z*∈* U. Punkty z taką własnością nazywamy nieskończenie bliskimi do punktu x. Zbiór wszystkich takich punktów nazywa się monadą punktu x. W przypadku, kiedy X reprezentuje sobą prostą rzeczywistą o topologii naturalnej, dochodzimy w istocie do tej samej definicji monady, co wcześniej ( pomijając oczywiście to, ze teraz rozpatrujemy inny język ) Z użyciem monad udaje się podać kryterium separowalności ( tj. hasusdorffowskości ) przestrzeni topologicznych. Przypominam, że przestrzeń topologiczna X nazywa się separowalną, jeśli dla każdych punktów x, y takiej przestrzeni, dla których x ≠ y, możemy znaleźć nieprzecinające się zbiory otwarte U, V, zawierające odpowiednio x, y. Okazuje się, że przestrzeń X jest separowalna wtedy i tylko wtedy, kiedy w jej niestandardowym rozszerzeniu monady dowolnych dwóch punktów standardowych nie przecinają się. Innymi słowy, separowalność przestrzeni oznacza, że nie istnieje ( być może niestandardowy ) punkt, który byłby nieskończenie bliski ku dwóm różnym punktom standardowym. Należy jednakże uściślić, co mamy na myśli, mówiąc o niestandardowych rozszerzeniach przestrzeni X. Do tej pory wymagaliśmy jedynie tego, aby w rozszerzeniu niestandardowym superstruktury nad X były prawdziwe te same formuły co i w standardowym rozszerzeniu. To jest jednakże za mało – powinniśmy wyjaśnić również na czym polega osobliwość rozpatrywanych niestandardowych obiektów ( zbioru S* oraz relacji przynależności ∈* ), różniąca je od obiektów standardowych. Do tej pory o tym nie mówiliśmy, a wszelkie nasze wymagania związane z S* były spełnione również w tym przypadku, kiedy w charakterze S* wzięta była sama superstruktura S(A), a w charakterze relacji ∈* wzięto standardową relacje przynależności. Jest jednakże jasne, że w tym przypadku „niestandardowa” topologia nie daje niczego nowego w porównaniu ze standardową. Dlatego też powinniśmy sformułować jakieś wymagania nakładane na obiekty niestandardowe, które odróżniałyby je od obiektów standardowych. Wymagania te powinny być wystarczająco silne, aby z ich pomocą można było rozwijać treściwą teorię, a oprócz tego powinny być takie, aby można było je spełnić – jeśli bowiem wymagamy od S* zbyt wiele, to takiego S* po prostu nie otrzymamy. Wcześniej, kiedy rozpatrywaliśmy analizę niestandardową w węższym sensie ( dla prostej rzeczywistej ), takim wymaganiem było niearchimedesowskość ciała liczb hiperrzeczywistych. Było to wymaganie wystarczające dla rozwinięcia odpowiednie dla naszych potrzeb teorii. Niestety, własność taka wykorzystuje specyfikę liczb rzeczywistych – obecność dodawania i relacji porządku. Dla przypadku dowolnej przestrzeni topologicznej konieczne jest wprowadzenie ogólniejszych pojęć i metod. Jedną z takich metod opiszemy dalej, formułując wymaganie „skierowania” odróżniające rozszerzenie niestandardowe od wejściowej standardowej superstruktury. Z jego pomocą kryterium separowalności otrzyma ściślejsze sformułowanie. Niech ustalone będzie dowolne niestandardowe rozszerzenie superstruktury na przestrzeni topologicznej X, dla którego słuszna jest zasada Leibniza oraz wymaganie skierowania. W tym przypadku monady dowolnych dwóch punktów standardowych nie przecinają się wtedy i tylko wtedy, kiedy wejściowa przestrzeń X jest separowalna. Dowód tego kryterium składa się z dwóch części. Należy dowieść, że jeśli X jest separowalna, to monady nie przecinają się i przeciwnie – jeśli X jest nieseparowalna, to monady pewnych dwóch standardowych punktów przecinają się. Wymaganie skierowania wykorzystujemy tylko w drugiej części, dlatego jego sformułowanie odłożymy i na początku podamy pierwszą cześć dowodu. Należy zauważyć, że zarówno podana dalej analiza, jak i jej motywacja słowna ( z niestandardowo rozumianymi słowami typu „przynależy”, „jest włączony” itp. ) są bardzo typowe dla całej analizy niestandardowej. Niech przestrzeń będzie separowalna. Dowiedziemy, ze monady różnych jej punktów standardowych nie przecinają się. Niech x, y – będą dwiema różnymi punktami standardowymi przestrzeni. Dowiedziemy, że monady µ(x) i µ(y) nie przecinają się. Ponieważ wymaganie separowalności jest spełnione, to istnieją zbiory otwarte U, V, zawierające punkty x i y, nie posiadające ogólnych punktów standardowych. Rozpatrzmy teraz odpowiadające im obiekty U*, V* w interpretacji niestandardowej. Są to „zbiory otwarte” interpretacji niestandardowej. „Zawierają” one punkty x i y. Stwierdzenie mówiące o tym, że zbiory U i V nie przecinają się, może być zapisane w postaci sądu w naszym języku : ∃x ( ( x∈cU ) ∧ ( x ∈ cV ))

gdzie cU , cV – stałe ( tj. symbole funkcjonalne o zerze argumentów ), odpowiadające elementom U i V w standardowej

interpretacji. Będąc prawdziwym w interpretacji standardowej, sąd ten ( zgodnie z zasadą Leibniza ) powinien być prawdziwy również w interpretacji niestandardowej. To oznacza, że U*, V* „nie przecinają się”. Stąd wynika, że i monady punktów x i y nie przecinają się, ponieważ monada punktu x „jest włączona” do zbioru U, a monada punktu y „jest włączona” do V. W podanej analizie szeroko wykorzystujemy pewne „dowolności”, wykorzystując niektóre słowa w przenośni, ale mamy nadzieje że czytelnik ( jeśli zechce) może ustanowić spowrotem poprawny sposób ich wyrażenia. Przykładowo, kiedy mówiliśmy, że monada µ(x) „jest włączona” do U, mieliśmy na myśli, to że „każdy element monady µ(x) znajduje się w relacji ∈* z U*” W analizie niestandardowej należy przywyknąć do takiego przenośnego rozumienia pojęć. W ten sposób połowę dowodu niestandardowego kryterium separowalności została zakończona. Zanim jednakże przejdziemy do drugiej części, powinniśmy zdefiniować pojęcie skierowania. Niestety jego sformułowanie może wydawać się nieco sztuczne, a jego sens może się ujawnić tylko przy zastosowaniu tego pojęcia w praktyce.

Page 45: Co to takiego analiza niestandardowa

45

Zaczniemy od następującej prostej uwagi. Niech na superstrukturze S(A) zadana będzie pewna relacja binarna R(x, y), przy czym uczestniczące w niej pary elementów < x, y > sięgają pewnego ustalonego poziomu. Dokładniej – przypomnijmy, że superstruktura S(A) reprezentuje sobą sumę zbiorów A0 , A1, ... gdzie Ai+1 = Ai ∪ P(Ai )

Zatem nasze założenie o binarnej relacji R na zbiorze S(A) ma następujący sens : Istnieje takie N, że dla dowolnej pary < x, y >, znajdującej się w relacji R, elementy x, y należą do zbioru AN.

Dalej będziemy rozpatrywali tylko relacje binarne z opisaną własnością, nazywając je relacjami o skończonym poziomie. Własność ta pozwala rozpatrywać relacje binarne jako elementy superstruktury z pomocą znanej metody Kuratowskiego, utożsamiającej pary <x, y > ze zbiorem {{x}, {x, y}}. Jeśli x, y należą do poziomu AN , to zbiór {{x}, {x, y}} nale ży do

poziomu AN+2 ( ponieważ {x} i { x, y} nale żą do AN+1 )

Tym samym dowolny zbiór uporządkowanych w sensie Kuratowskiego par < x, y >, gdzie x, y ∈ AN, staje się elementem

AN+3. Przypominam, że pierwszym poziomem relacji R nazywamy zbiór wszystkich tych x, dla których R(x, y) jest

słuszne dla pewnego y. Relacje R nazwiemy skierowaną, jeśli dla dowolnego skończonego zbioru x1, ... , xn ,elementy

którego wchodzą do pierwszego poziomu relacji R, możemy znaleźć y, znajdujące się w relacji R ze wszystkimi xi.

Innymi, warunek skierowania ma następujący sens : jeśli dla każdego xi ze skończonego zbioru x1, ... , xn ,możemy

znaleźć y, dla którego R(xi , y), to istnieje jednoznacznie y, przy którym R(xi , y) dla wszystkich xi.

Z pomocą pojęcia relacji skierowanej o skończonym poziomie sformułujemy określone wymagania nakładane na niestandardową interpretacje, różniące ją od interpretacji standardowych. Zanim to zrobimy, przypomnimy sobie, że każdemu elementowi S(A) przyporządkowujemy pewien element S*. Niech R – będzie dowolną relacją skierowaną o skończonym poziomie. Wymagamy spełnienia następującego warunku : istnieje takie y ∈S*, ze dla dowolnego standardowego x, wchodzącego do pierwszego poziomu R, spełniona jest relacja R(x, y). Wyjaśnijmy to dokładniej. Nie jest jasne, co oznacza tutaj R(x, y), przecież x – jest elementem superstruktury S(A), a y – elementem jej rozszerzenia S*. Przypomnijmy jednakże, że relacja skończonego poziomu rozpatrywana jest jako element superstruktury S(A). Tak jak każdemu innemu elementowi, odpowiada jej pewien element R* ∈ S*. Zatem wymagamy, aby < x*, y > ∈* R* dla dowolnego elementu x ∈ S(A), wchodzącego do pierwszego poziomu relacji R. Element y o takich własnościach powinien istnieć dla dowolnej relacji skierowanej R skończonego poziomu. Na tym właśnie polega wymaganie skierowania. Należy jeszcze wyjaśnić, co oznacza zapis < x*, y >. Dla dowolnych elementów a, b ∈ S* istnieje jednoznaczny element c∈ S*, dla którego a ∈* c, b ∈* c oraz z t ∈*c wynika, że t = a lub t = b dla dowolnego t ∈ S*. ( wynika to z tego faktu, ze analogiczna własność jest słuszna w S(A))Taki element c naturalnie będzie oznaczyć jako { a, b}, oznaczymy również { a, a} przez {a} i { {a}, {a, b}} przez <a, b>. W ten sposób nadaliśmy sens wyrażeniu <a, b> dla dowolnych elementów a, b ∈ S*. Sformułowane wymagania można krótko wyrazić tak – jeśli w (standardowej ) superstrukturze S(A) dla dowolnego skończonego zbioru elementów można znaleźć element, znajdujący się ze wszystkimi tymi elementami w pewnej relacji, to w rozszerzeniu niestandardowym można znaleźć element, znajdujący się w tej właśnie relacji ze wszystkimi elementami standardowymi. Na pierwszy wzgląd wymaganie takie ( wymaganie skierowania) wydaje się nieco bezsensowne. Aby go umotywować, należy po pierwsze pokazać, że jest ono do zrealizowania tj. dla każdej superstruktury S(A) można znaleźć jego rozszerzenie S*, spełniające zasadę Leibniza i wymaganie skierowania, a po drugie – zademonstrować użyteczność tej zasady dla zbudowanie analizy niestandardowej. Rozpoczniemy od pierwszego. Tak jak i w przypadku ciała liczb hiperrzeczywistych, zbudowanie poszukiwanego rozszerzenia S* ( ściślej – dowód jego istnienia ) może być zrealizowane różnymi metodami. Jedna z metod wykorzystuje twierdzenie o zwartości inna nietrywialne ultrafiltry. Jedyną istotną różnicą pojawiające się obecnie sytuacji od przypadku liczb hiperrzeczywistych jest to, że teraz należy rozpatrywać ultrafiltry nie na szeregu naturalnym N, a na pewnych innych zbiorach. Jeśli chodzi o szczegóły ( w tym do ścisłej definicji ultrafiltru na dowolnym zbiorze ) ponownie odsyłamy zainteresowanego czytelnika do książki Davisa [3]. Teraz przejdziemy do omówienia drugiego zagadnienia – zagadnienia związanego z tym, jaką korzyść można otrzymać z wymagania skierowania. Obiecaliśmy wykorzystać taki wymóg, kończąc dowód niestandardowego kryterium separowalności. Jednakże na początku zademonstrujemy go w prostszej sytuacji, pokazując, że w zastosowaniu do superstrukturze o zbiorze indywidułów R, daje ona pewne niearchimedesowskie rozszerzenie tego ciała. W istocie – rozpatrzmy taką relacje R(x, y) na zbiorze R : R(x, y) ⇔ x < y Jej pierwszym poziomem jest cała R, tak ze dla każdej liczby istnieje liczba większa. Oprócz tego, dla każdego skończonego zbioru liczb możemy znaleźć liczbę, która jest większa od wszystkich elementów tego zbioru, dlatego też relacja R jest skierowana. Teraz pozostaje zastosować zasadę skierowania i otrzymać takie (niestandardowe )c, że R(x, c) przy dowolnej standardowej liczbie rzeczywistej x. Takie c będzie właśnie nieskończenie duże. Można również

Page 46: Co to takiego analiza niestandardowa

46

przeprowadzić podobne rozważanie dla nieskończenie małej w miejsce nieskończenie dużej, w tym celu w charakterze R należy wziąć relacje : ( x > 0 ) ∧ ( y > 0 ) ∧ ( x > y ) Teraz przejdziemy do zakończenia dowodu niestandardowego kryterium separowalności. Niech przestrzeń topologiczna nie jest separowalna. Niech x, y – będą punktami, dla których nie będzie spełnione wymaganie separowalności. To oznacza, że dowolne zbiory otwarte U, V dla których x ∈U i y∈ V, posiadają punkt wspólny. Zdefiniujmy następującą relacje : R(a, b) ↔ a reprezentuje sobą parę zbiorów otwartych< U, V >, przy czym U zawiera x, V zawiera y, a b jest punktem wspólnym zbiorów U i V. Teraz przekonamy się, że taka relacja jest skierowana. W tym celu należy rozpatrzyć dowolny skończony zbiór a1 , ... , an

każdy z członów którego należy do pierwszego poziomu relacji R i znaleźć takie b, że R(a1, b) dla wszystkich i.

Jeżeli każdy ai należy do pierwszego poziomu, to reprezentuje on sobą parę < U1, Vi > , gdzie Ui – jest zbiorem otwartym,

zawierającym x, Vi – jest zbiorem otwartym, zawierającym y.

Rozpatrzmy przecięcia : F = ∩ Ui ; G = ∩ Vi

Takie przecięcia są zbiorami otwartymi. ( w definicji przestrzeni topologicznej wymagaliśmy, aby skończone przecięcia zbiorów otwartych były zbiorami otwartymi ). Zbiory F i G zawierają odpowiednio x i y. Ponieważ dla punktów x i y naruszony jest warunek separowalności, to zbiory F i G posiadają punkt wspólny. Biorąc taki punkt jako b, otrzymujemy, że R(ai , b) dla wszystkich i. Tym możemy zakończyć sprawdzenie skierowania R.

Do tej pory nasze analizy miały miejsce w interpretacji standardowej. Teraz przejdziemy do niestandardowej i wykorzystamy wymaganie skierowania. Zgodnie z nim znajdziemy takie ( ogólnie mówiąc niestandardowe ) b, że R(a, b) dla dowolnego standardowego a, wchodzącego do pierwszego poziomu relacji R. Innymi słowy b ∈ U* ∩ V* dla dowolnej pary standardowych zbiorów otwartych U i V, dla których x∈U i y ∈V. Wtedy b należy do monady punktu x i do monady punktu y, a zatem monady te przecinają się. Tym samym kończymy dowód niestandardowego kryterium separowalności, sformułowanego powyżej. Podamy teraz jeszcze jeden przykład niestandardowego kryterium standardowego pojęcia. Tym pojęciem będzie zwartość. Mieliśmy już niestandardowe kryterium zwartości zbioru liczb rzeczywistych, teraz ྲྲgólnimy go na dowolne przestrzenie topologiczne. Przypominam, że przestrzeń topologiczną X nazywamy zwartą, jeśli z dowolnego jej pokrycia zbiorami otwartymi możemy wybrać podpokrycie skończone. Innymi słowy przestrzeń X jest zwarta, jeśli dla dowolnej rodziny α zbiorów otwartych ( w przestrzeni X ), tworzących pokrycie przestrzeni X ( tzn. że każdy punkt przestrzeni X należy choćby do jednego ze zbiorów α ), istnieje skończony podzbiór α’ ⊂ α, również tworzące pokrycie przestrzeni X. Własność zwartości ( niekiedy nazywa się go również własnością bizwartości ) jest jednym z najważniejszych własności przestrzeni topologicznych. Teraz podamy niestandardowe kryterium zwartości : przestrzeń X jest zwarta wtedy i tylko wtedy, kiedy dowolny punkt jej niestandardowego rozszerzenia X* jest nieskończenie bliski dowolnego standardowego punktu takiego rozszerzenia. Innymi słowy, X jest zwarta wtedy i tylko wtedy, kiedy suma wszystkich monad pokrywa się ze zbiorem wszystkich punktów niestandardowego rozszerzenia przestrzeni X. Spróbujemy teraz przedstawić podstawową idee dowodu kryterium zwartości. Przy tym będziemy szeroko wykorzystywali dowolność materii – systematycznie utożsamiając obiekty standardowej interpretacji z odpowiadającymi im obiektami interpretacji niestandardowej. Niech przestrzeń X będzie zwarta. Dowiedziemy, ze każdy ( być może niestandardowy ) punkt jest nieskończenie bliski ku pewnemu punktowi standardowemu. Niech x – będzie dowolnym ( być może niestandardowym ) punktem przestrzeni X. Musimy znaleźć punkt standardowy ku któremu jest on nieskończeni bliski. Załóżmy, ze taki punkt nie istnieje. To oznacza, że dla każdego punktu standardowego a istnieje zbiór otwarty Ua nie zawierający punktu x ( przypominamy w tym miejscu definicje

monady ) Takie zbiory otwarte tworzą pokrycie. Wybierzemy z niego skończone podpokrycie U1 , ... , Un.

Takie podpokrycie będzie zawierało wszystkie punkty standardowe przestrzeni, ale nie wszystkie niestandardowe. Dlatego sąd : ∀x( ( x∈X ) ⇒ ( ( x∈U1 ) ∨ ... ∨ ( x∈Un ) ))

mówiący, że zbiory U1 , ... , Un tworzą pokrycie, będzie prawdziwy w interpretacji standardowej i fałszywy w

niestandardowej, co jest sprzeczne z zasadą Leibniza. Zatem, w jedną stronę kryterium zwartości jest dowiedzione.

Page 47: Co to takiego analiza niestandardowa

47

Teraz dowiedziemy, stwierdzenia odwrotnego. Niech wiadomo będzie, ze każdy punkt jest nieskończenie bliski ku pewnemu punktowi standardowemu. Pokażemy, że z każdego pokrycia można wybrać skończone podpokrycie. Niech α - będzie pokryciem z którego nie można wybrać skończonego podpokrycia. Rozpatrzmy relacje : R(U, x) ↔ U jest zbiorem z pokrycia α, a x – punktem przestrzeni nie przynależącym do U ∈ Ponieważ pokrycie α nie posiada skończonego podpokrycia, to powyższa relacja będzie skierowana. Zgodnie z wymaganiem skierowania, możemy znaleźć ( być może niestandardowy ) punkt x, który znajduje się w tej relacji z dowolnym standardowym zbiorem otwartym z naszego pokrycia. Pokażemy, że punkt ten ( w przeciwieństwie do założenia ) nie będzie nieskończenie bliski do żadnego punktu standardowego. W istocie, niech a – będzie dowolnym punktem standardowym. Będzie on zawarty w jakimś ze zbiorów pokrycia. Oznaczmy taki zbiór przez U. Zgodnie z definicją nieskończonej bliskości wszystkie nieskończenie bliskie punkty ku a również są zawarte w U. Jednakże punkt x nie jest zawarty w U. To znaczy, że nie może on być nieskończenie bliski ku a. Otrzymana sprzeczność kończy dowód niestandardowego kryterium zwartości. Dokładny dowód tego kryterium można znaleźć w książce [3]. Tam również można znaleźć również dowód rozpatrzonego przez nas niestandardowego kryterium separowalności ( twierdzenie 1.2). Z pomocą niestandardowego kryterium zwartości można bez szczególnej trudności dowieść twierdzenia Tichonowa o zwartości iloczynu dowolnej liczby przestrzeni zwartych. Taki dowód jest również podany w książce [3] ( twierdzenie 2.6) Zauważmy, że „standardowy” dowód tego twierdzenia jest bardzo złożony ( w szczególności wykorzystuje on aksjomat wyboru ). Analiza niestandardowa pozwala „ukryć” zastosowanie aksjomatu wyboru w podstawowych konstrukcjach ( a dokładniej w budowie niestandardowej interpretacji o wymaganych własnościach ) Jest to jeden z powodów tego, że niestandardowe dowody często okazują się prostsze od dowodów standardowych, tych samych twierdzeń. Na tym zakończymy omówienie zastosowania niestandardowych metod w topologii. 12. Leibniz i „dawna historia” analizy niestandardowej. Powstanie analizy niestandardowej datuje się ( w zależności od punktu widzenia ) od dwóch dekad, do trzech wieków wstecz. Dwie dekady otrzymamy, jeśli przyjmiemy, że analiza niestandardowa zapoczątkowana została jesienią 1960 roku, kiedy to Abraham Robinson, wygłosił wykład na jednym z seminariów Uniwersytetu w Princeton mówiący o możliwości zastosowania metod logiki matematycznej do uzasadnienia analizy matematycznej. Trzysta lat otrzymamy, jeśli przyjmiemy iż początek analizy niestandardowej wiąże się z wprowadzeniem symboli nieskończenie małych dx i dy w traktacie Leibniza „Nowa metoda” [7, str. 166]. Trudno powiedzieć z pewnością na ile bliski był Leibniz ku ideom analizy niestandardowej. Jak pisze sam Robinson [61] „historia zagadnienia zazwyczaj pisana jest w świetle jego późniejszego rozwoju. Już ponad pól wieku temu wszystkie przeglądy związane z historią rachunku różniczkowego i całkowego oparte były, na wierze o tym, że pojęcie nieskończenie małych i nieskończenie dużych, jeśli nie są sprzeczne, to przynajmniej są nieużyteczne dla rozwoju analizy. W wyniku tego faktu w pracach tego okresu zaciemniona została różnica pomiędzy ścisłością, z którą rozpatrywano idee Leibniza i jego następców, pobłażliwością przejawianą w stosunku do autorów idei granicy” Charakterystyczna jest np. następująca wypowiedź A. Lebesgue’a (1926) „Nieskończenie małe były kiedyś pojęciami ogłupiającymi, spotykanymi w niejasnych i nieścisłych sformułowaniach. Wszystko zostało wyjaśnione dzięki wprowadzeniu pojęcia granicy” [6] Przyjmuje się, że idee Leibniza oraz idee stronników pojęcia przejścia granicznego stały się podwójnym standardem, przy przewadze głosów na korzyść granicy. Robinson zaproponował przeanalizowanie ogólnego obrazu narodzin i rozwoju analizy matematycznej od Newtona i Leibniza do Cauchye’go i Weierstrassa. Analiza taka prowadzi do pełniejszego przyznania zasług Leibnizowi, sam Leibniz przechodzi tym samym od poziomu geniuszy trzeciej klasy do geniuszy drugiej klasy ( wykorzystujemy tutaj klasyfikacje zaproponowaną przez Stanisława Lema [8]. Postaramy się teraz przedstawić historyczno-matematyczne poglądy Robinsona. Przy tym wszystkim należy jednakże pamiętać, iż istnieje tutaj możliwość wpadnięcia w drugą skrajność, przypisując Leibnizowi i jego następcom nasze współczesne poglądy, wyrobione pod wpływem współczesnej analizy niestandardowej. Aby być w stanie podać „obiektywną” ocenę wczesnych etapów rozwoju analizy matematycznej, należy czytać prace jej twórców oczami ich bezpośrednich uczniów, co jak się wydaje nie jest możliwe nie zagłębiając się w atmosferę kultury i nauki tego okresu. Autor niniejszej książki oczywiście do tego w żadnym stopniu nie pretenduje. ( Nie pretenduje do tego również Robinson, który pisze : „Nasze uwagi z konieczności będą fragmentaryczne, ponieważ pełna historia Analizy leży poza ramami książki” ) Przechodząc do referowania poglądów Robinsona ( wiele z których jest nietradycyjnych ), chcemy przypomnieć czytelnikowi o nie przyjmowaniu ich bez krytycznie.

Page 48: Co to takiego analiza niestandardowa

48

Zanim Robinson przedstawił swój punkt widzenia, dokonuje podsumowania standardowego poglądu na historię rozwoju analizy matematycznej w następujących słowach [61] : „Po długim okresie czasu, w przeciągu którego zostały zdefiniowane pojęcia pola, objętości i stycznych dla różnych przypadków szczególnych, w drugiej połowie XVII wieku Newton i ( nieco później, ale niezależnie) Leibniz zbudował ogólną teorię różniczkowania i całkowania. Motywując wprowadzone przez siebie pojęcia Newton zwraca się to raz do nieskończenie małych, to do granic, to do bezpośrednio intuicji fizycznej. Jego bezpośredni następcy skłaniali się ku tej ostatniej. Z drugiej strony Leibniz i jego następcy rozwijali teorię wychodząc od różniczek pierwszego i dalszych rzędów. Techniczne dogodności oznaczeń, z wykorzystaniem różniczek doprowadziły do szybkiego rozwoju Analizy, oraz jej zastosowań w Europie, gdzie zostały one szybko przyjęte. Jednakże wewnętrzne sprzeczności takiej koncepcji doprowadziły do tego, że stały się potrzebne jakieś inne jej uzasadnienia. Lagrange uważał, że udało mu się znaleźć odpowiednie rozwiązanie, biorąc za podstawę rozkład Taylora funkcji. Jednakże pierwsze ścisłe uzasadnienie analizy matematycznej zostało podane przez Cauchy’ego. Podstawą teorii Cauchy’ego było pojęcie granicy, które po raz pierwszy sformułował Newton, a następnie rozwinął d’Alalmbert. Bardziej formalne przedstawienie metody Cauchy’ego podał Weierstrassa ( który w pewnym stopniu wyprzedził Bolzano ) Po zbudowaniu teorii granic wykorzystywanie nieskończenie małych i nieskończenie dużych zamieniło się w stosowanie wyrażeń postaci ”... dąży do nieskończoności”. Dalszy rozwój teorii ciał niearchimedesowskich zostało całkowicie pozostawione algebrze” Taki standardowy pogląd wedle Robinsona, w pewnym stopniu „powinien zostać uzupełniony lub nawet zmieniony”. Na dowód tego Robinson podaje znaczną liczbę cytatów z prac Leibniza i innych autorów, wymienionych powyżej. Jak uważa Robinson „...stosunek Leibniza do wielkości nieskończenie dużych i małych w Analizie, w zasadzie pozostawał niezmienny w przeciągu dwóch ostatnich dziesięcioleci jego życia. Porzucił ich zastosowanie, ale przyjmował je jako ”idealne elementy, podobne do liczb urojonych. Takie idealne elementy spełniały te same prawa, co standardowe liczby. Tym niemniej reprezentowały one sobą nic więcej jak wygodne funkcje, konieczne dla wspomożenia rozważań i odkryć. Przy żądaniu można zawsze się ich pozbyć w użyciu i powrócić do stylu antycznych matematyków, rozważających z użyciem wielkości wystarczająco dużych (lub małych) dla tego, aby błąd był mniejszy od dowolnie zadanego. Wszystko to wyraźnie i wielokrotnie można przeczytać w pracach Leibniza” [61, str. 261] Podamy teraz niektóre ze stwierdzeń Leibniza, cytowane przez Robinsona ( cytaty za [7] ) : „...Powinno się rozważać nieskończoność podobnie do tego jak to się robi w optyce, kiedy promienie słoneczne przyjmuje się jako przychodzące z punktu nieskończenie oddalonego i z tego powodu, przyjmuje się je jako równoległe... I kiedy mamy różne rzędy nieskończonego lub nieskończenie małych, to rozumiemy je w tym sensie, w jakim kula ziemska przyjmowana jest jako punkt w porównaniu z odległością do gwiazd stałych, a kulkę w naszych rękach – jako punkt w porównaniu z promieniem kuli ziemskiej, tak że odległość do gwiazd stałych jest nieskończenie daleka lub nieskończonością nieskończoności w stosunku do średnicy kulki w rękach. W miejsce ilości nieskończenie dużej lub nieskończenie małej można wziąć liczbę na tyle dużą lub małą, na ile jest to wymagane, aby błąd nie przekraczał zadanego. Odróżnienie od archimedosowskiego stylu analiz tkwi w wyrażeniach, które są dla nas bardziej bezpośrednie i lepiej przystosowane dla sztuki wynajdywania” [ 7, str. 190]. „... Jeśli ktokolwiek nie chce rozpatrywać nieskończenie dużych i małych w ściśle metafizycznym sensie, jako rzeczywiście istniejące, to może wykorzystywać je jako „pojęcia idealne”, które skracają rozumowania, podobnie do urojonych pierwiastków w standardowej analizie ( coś w rodzaju √–2 )... Nie należy sobie wyobrażać, że nauka o nieskończonym zadowala się tym wyjaśnieniem i sprowadza się do fikcji, albo w sposób stały pozostaje – mówiąc językiem scholastyki – nieskończonością synkategoryczną. Przykładowo, pozostaje słusznym, że 2 jest równe 1/1 + ½ + ¼ + 1/8 + ... co jest szeregiem nieskończonym, w którym zawierają się od razu wszystkie ułamki o liczniku równym 1 i z mianownikami tworzącymi podwajający się postęp geometryczny, chociaż występują tutaj cały czas tylko standardowe liczby i nie wprowadza się tutaj żadnego nieskończenie małego ułamka lub ułamka o nieskończonym mianowniku ... Zasady skończonego zachowują siłę w nieskończonym, tak jakby istniały atomy ..., chociaż one nie istnieją, ponieważ materia jest podzielna bez końca i na odwrót – zasady nieskończonego zachowują siłę w skończonym, tak jakbyśmy mieli metafizycznie nieskończenie małe, chociaż nie ma w tym żadnej konieczności... „... Prawdę mówiąc ja sam nie jestem przekonany, ze należy rozpatrywać nieskończone i nieskończenie małe inaczej niż jako rzeczy idealne i dobrze uzasadnione fikcje ... [ 61, str.263] „... Wielkościami nieporównywalnymi nazywa takie wielkości, jedna z których nigdy nie może przewyższyć drugiej, bez względu na jaką liczbę byśmy jej nie pomnożyli, tak jak to rozumie Euklides ...”

Page 49: Co to takiego analiza niestandardowa

49

Podam jeszcze kilka cytatów tym razem [7] : „...Pokaże, że dxdy i ddx są w istocie wielkościami, ponieważ przy ich pomnożeniu przez liczbę nieskończoną ( lub wyższą nieskończoną nieskończoność ) dają one standardowe wielkości” [7, str. 188] „...Przy dowodzie stosowałem nieporównywalnie małe wielkości, np. różnicę dwóch standardowych wielkości, nieporównywalne z samymi wielkościami. Jeśli nie jestem w błędzie, to można je wyjaśnić w taki sposób. Jeśli ktoś nie chciałby dopuszczać nieskończenie małe, to może on przyjmować wielkości na tyle małe, na tyle ile są one wystarczające, aby były one nieporównywalne i pociągały za sobą nieistotny błąd, mniejszy od zadanego. Podobnie do tego jak w porównaniu z niebem, Ziemia może być przyjęta za punkt, a jej średnica za nieskończenie małą linię, w ten sposób możemy dowieść, ze jeśli boki kąta obejmują nieporównywalnie mniej, niż same one, to tworzony przez nie kąt będzie nieporównywalny z samą różnią boków, różnica sinusa, sinusa dopełnienia i kosinusa również będą nieporównywalne z samymi różnicami. [7, str.187] Metoda Leibniza królowała w kontynentalnej Europie w przeciągu więcej niż 50 lat. Jednakże w drugiej połowie XVIII wieku rozpoczęto poszukiwania alternatywnej drogi zbudowania analizy. W charakterze takiego podejscia Lagrange rozpatrywał rozkłady funkcji w szeregi potęgowe, zakładając jak się wydaje, że dowolna lub prawie dowolna funkcja może być rozłożona w taki szereg. d’Alambert dla zbudowania analizy matematycznej, przyjmował charakterze pojęcia wejściowego, pojęcie granicy. Pisał on : „Mówimy, że jedna wielkość jest granica drugiej, jeśli ta druga może przybliżyć się do pierwszej bliżej niż o dowolnie zadaną wielkość... Teoria granic jest odparciem metafizyki rachunku różniczkowego... W rachunku różniczkowym chodzi nie o wielkości nieskończenie małe, tak jak to twierdzą niektórzy, a chodzi o granicę skończonej wielkości. Pojęciem „nieskończenie mała” posługujemy się tylko jako skrótem ...” Takie poglądy d’Alamberta wyglądają jak przedstawienie (chociaż nie w pełni ścisłe ) współczesnego punktu widzenia na pojęcie granicy. Można byłoby sądzić, że od tego czasu pojęcie nieskończenie małych zostanie całkowicie wyeliminowane. Jednakże tak nie jest. Cauchy – uważany za twórcę współczesnego podejścia do analizy – wykorzystuje pojęcie wielkości nieskończenie małej. Próbując wyjaśnić z użyciem współczesnych pojęć, co Cauchy nazywał „wielkością”, można przyjąć, że wielkość – jest to funkcja o wartościach rzeczywistych, określona na uporządkowanym zbiorze bez elementu największego. Jednakże nie można w pełni przyjąć, że Cauchy sprowadza wielkości do funkcji. Odwrotnie – mówi on o funkcji jako o stosunku, wiążącym dwie wielkości. W jego podejściu nieskończenie małe i granice figurują jako równoprawne składowe podstaw analizy. Zilustrujmy styl wykładu Cauchy’ego na przykładzie znanego „błędu Cauchy’ego” – jego „dowodzie” tego, ze suma szeregu funkcjonalnego : u0(x) + u1(x) + ...

zbudowanego z funkcji ciągłych, jest ciągła. Sformułowanie Cauchy’ego wygląda całkowicie współcześnie : „Jeśli różne człony szeregu ... są funkcjami jednej i tej samej zmiennej x, ciągłymi ze względu na tą zmienną w otoczeniu podanego punktu, w którym szereg jest zbieżny, to suma takiego szeregu również jest ciągła w otoczeniu tego punktu” Dowód tego stwierdzenia apeluje jednakże do wielkości nieskończenie małych. Wprowadzając oznaczenia :

Cauchy rozpatruje „przyrosty, które otrzymują te trzy funkcje, kiedy x zwiększane jest o wielkość nieskończenie małą. Przyrost sn będzie wielkością nieskończenie małą ... ; przyrost rn staje się nieistotny ..., jeśli wziąć n bardzo duże”

Na tym analiza Cauchy’ego kończy się. Z użyciem pojęć analizy niestandardowej, możemy to powiedzieć tak : Różnica | s( x + α) – (x) | oceniana jest jako nieprzewyższajacą | s(x + α) – sn( x + α ) | + | sn( x + α ) – sn(x ) | + | s(x) – sn(x ) |

drugi człon jest nieskończenie mały przy nieskończenie małych α, a pierwszy i trzeci jest nieskończenie mały przy nieskończenie dużych n. Taki stwierdzenie jest jednakże nieprawdziwe : sn( x + α ) – sn(x )

jest nieskończenie mały przy nieskończenie małych α i standardowych n ( a nie dowolnych ! ) Wracając do swego twierdzenia ( już po podanym przez Abela kontrprzykładzie – szeregu funkcji ciągłych, suma którego jest nieciągła ), Cauchy formułuje takie stwierdzenie : jeśli ui – są funkcjami ciągłymi i „suma un + ... + un’–1 jest zawsze

nieskończenie mała przy nieskończenie dużym n > n’ „, to szereg ΣΣΣΣ ui jest zbieżny ku funkcji ciągłej.

Powyższe sformułowanie powinniśmy odpowiednio zinterpretować. Jeśli interpretować go tak : „un(x) + ... + un’–1(x) jest nieskończenie mała przy dowolnych nieskończenie dużych n i n’ > n i dowolnym ( nie

koniecznie standardowym ! ) x”, to dochodzimy do pojęcia zbieżności monotonicznej, figurującym we współczesnym wariancie analogicznego twierdzenia ( o ciągłości granicy monotonicznie zbieżnego szeregu funkcji ciągłych ) To co powiedziano pokazuje, że punkt widzenia Cauchy’ego jak się wydaje nie jest tak prosty i nie sprowadza się – jak to się może wydawać – do elastycznemu wyłożeniu naszych obecnych poglądów.

Page 50: Co to takiego analiza niestandardowa

50

Na tym zakończymy przegląd „dawnej” historii analizy niestandardowej ( w którym postępowaliśmy zgodnie z Robinsonami ) i omówimy bardziej współczesną historię analizy niestandardowej – logice matematycznej. Konkretniej, takim źródłem stały się niestandardowe modele systemów aksjomatycznych. 13. Robinson i „nowa historia” analizy niestandardowej. Metoda aksjomatyczna analizy jakieś matematycznej struktury, mówiąc ogólnie, jest następująca. Wydzielamy niektóre własności rozpatrywanej struktury i nazywamy je aksjomatami. Następnie wyprowadzamy z takich aksjomatów różnorodne następstwa (twierdzenia). Twierdzenia takie będą prawdziwe w rozpatrywanej strukturze. Mało tego, będą one prawdziwe nie tylko w rozpatrywanej strukturze, ale w dowolnej innej, w której prawdziwe są aksjomaty. Może się okazać, że istnieje wiele najróżniejszych struktur, spełniających dany układ aksjomatów. Każda taka struktura nazywa się modelem rozpatrywanego układu aksjomatów. Czy to dobrze, czy źle, jeśli układ aksjomatów posiada wiele różnych (nieizomorficznych ) modeli ? To zależy w jakim celu zbudowaliśmy w jakim celu zadaliśmy układ aksjomatyczny. Jeśli taki układ, podobnie do układu aksjomatów ciała, jest przeznaczony po to, aby wydzielić ogólne własności różnorodnych struktur i w jednolitej metodzie otrzymać ogólne własności o wszystkich tych strukturach, to im bardziej różnorodne są takie modele, tym lepiej. Różnorodność modeli układu aksjomatów ciała świadczy o szerokiej możliwości zastosowania teorii ciał ( to samo można oczywiście powiedzieć np. o aksjomatach grup, pierścieni itd. ) Istnieje jednakże i drugie podejście do układów aksjomatycznych, zgodnie z którym układ aksjomatyczny powinien w sposób jak najbardziej pełny, odzwierciedlać własności danej, konkretnej struktury np. zbioru liczb naturalnych. Przykładem układu aksjomatycznego zbudowanego w takim celu, są aksjomaty Peano, charakteryzujące szereg naturalny jak zbiór N z wyróżnionym elementem ( oznaczanym jako 0 i nazywany zerem ) i jednopozycyjną operacją ( oznaczaną jako S i nazywaną braniem następnika ) : 1) ∀a( 0 ≠ S(a)) 2) ∀a∀b ( S(a) = S(b) ) ⇒ ( a = b ) 3) (aksjomat indukcji) Jeśli zbiór M ⊂ N jest taki, że 0∈M i dla każdego α∈M spełnione jest S(α)∈M, to M = N. Aksjomaty takie są przeznaczone, aby w sposób jak najpełniejszy odzwierciedlić własności liczb naturalnych. Dlatego znalezienie struktury ( zbioru N o wyróżnionym elemencie i jednopozycyjną operacją ), która spełniałaby w/w aksjomaty, ale silnie różniłaby się od standardowego szeregu liczb naturalnych, oznaczałoby, ze aksjomaty te są niezadowalające. Na szczęście okazuje się, że znalezienie takiej struktury nie jest możliwe, ma bowiem miejsce następujące twierdzenie ( kategoryczność aksjomatów Peano ) : Niech N – będzie dowolnym zbiorem, O – dowolny element należący do N, S – funkcja określona na N o wartościach w N, przy czym spełnione są własności 1 – 3. Wtedy istnieje odpowiedniość wzajemnie jednoznaczna pomiędzy N i standardowym szeregiem liczb naturalnych N, przy której elementowi O∈N odpowiada liczba naturalna 0, a funkcja S przechodzi w funkcje następnika ( jak mówi się – struktury N i N są izomorficzne ) Dowód tego twierdzenia jest bardzo prosty. Poszukiwaną odpowiedniość zadamy następująco : Liczby naturalne Elementy N 0 O 1 S(O) 2 S( S(O)) ... ... Oznaczając : S ( S ( ... S(O) ... ) --- n razy ---

przez Sm(O), można powiedzieć, że liczbie naturalnej m∈N przyporządkowany jest element Sm(O)∈N.

Należy teraz dowieść, ze taka odpowiedniość jest wzajemnie jednoznaczna ,tj. że Sm(O) ≠ Sn(O), przy m ≠ n, oraz że

dowolne x∈N jest równe Sm(O) przy pewnym m∈N.

Jeśli Sm(O) = Sn(O), m ≠ n , n, m > 0 to Sm–1(O) = Sn–1(O) zgodnie z aksjomatem 2 ( ponieważ Sk(O) = S(Sk–1(O)) )

Stosując takie rozważania wielokrotnie, znajdujemy że Sm–n(O) = 0 tj. S(a) = O, gdzie a = Sm–n–1(O) ( dla określoności rozważamy przypadek m > n) A to jest sprzeczne z aksjomatem 1. Aby zakończyć dowód wzajemnej jednoznaczności, należy pokazać jeszcze, ze zbiór

M = { O, S(O), ... , Sn(O), ... } Pokrywa się ze wszystkimi elementami N. Fakt ten wynika bezpośrednio z aksjomatu indukcji. W ten sposób wzajemna jednoznaczność zbudowanej odpowiedniości została dowiedziona. To, ze przy takiej odpowiedniości zero przechodzi w element O, a funkcja przyrostu jedności – w funkcje S, jest sprawą oczywistą. Zatem, dowiedliśmy kategoryczności aksjomatów Peano.

Page 51: Co to takiego analiza niestandardowa

51

W ten sposób, można powiedzieć, ze aksjomaty Peano „całkowicie” opisują liczby naturalne. Jednakże układ aksjomatów posiada następujący niedostatek – zakłada ona wcześniejszą znajomość pojęcia zbioru ( pojęcie to figuruje w aksjomacie indukcji). Chcielibyśmy, aby wszystkie aksjomaty były zapisane w postaci formuł pewnego języka pierwszego rzędu ( podobnie jak ma to miejsce dla dwóch pierwszych aksjomatów – aksjomaty te reprezentują sobą formuły języka pierwszego rzędu o jednym zero pozycyjnym i jednym jedno pozycyjnym symbolami funkcjonalnymi ). Przy tym chcielibyśmy, aby własność kategoryczności ( izomorfizm wszystkich modeli takiego układów aksjomatów) została zachowana. Niestety twierdzenie Goedla o zupełności i jego następstwo – twierdzenie o zwartości – burzą nadzieję na zbudowanie kategorycznego układu aksjomatów w języku pierwszego rzędu – takiego układu aksjomatów nie można zbudować dla żadnej struktury, zawierającej nieskończenie wiele elementów. Wyjaśnimy dlaczego tak jest. W charakterze układu aksjomatów weźmiemy zbiór T wszystkich formuł zamkniętych, prawdziwych w danej strukturze. Jest jasne, że taki układ aksjomatów jest największy ze wszystkich możliwych, jeśli okaże się on niekategoryczny, to i dowolny inny układ aksjomatów, zapisanych w tym języku, nie będzie kategoryczny. Stosując rozważania, analogiczne do tych jakie przeprowadziliśmy w paragrafie 7, możemy zbudować model zbioru T, istnienie którego jest sprzeczne z wymaganiem kategoryczności, innymi słowy będzie to „niestandardowy” model zbioru T. Podana powyżej analiza metody aksjomatycznej ( niezbyt ścisła ) była nam potrzebna po to, aby pokazać w jaki sposób analiza możliwości takiej metody prowadzi do pojęcia modelu niestandardowego. W 1960 roku metody budowania modeli niestandardowych ( z pomocą ultrafiltrów i z użyciem twierdzeń o zupełności i zwartości ) były już dobrze znane specjalistom zajmującym się teorią modeli, jednym z nich był A.. Robinson [11] Pozostało „jedynie” połączyć takie metody z ideami o zastosowaniu wielkości nieskończenie małych w analizie, w ten sposób zapoczątkował on bujnie rozwijającą się gałąź matematyki – analizę niestandardową. W 1961 roku pojawił się artykuł Robinsona „Analiza niestandardowa” [60]. W artykule tym zostały naszkicowane zarówno podstawowe założenia analizy niestandardowej jak i niektóre jej zastosowania ( np. w mechanice analitycznej) W szczególności w artykule tym Robinson pisze : „naszym głównym celem jest pokazanie, ze takie modele dają naturalne podejście ku staremu problemowi zbudowania rachunku, zawierającego ilości nieskończenie małe i nieskończenie duże. Jak dobrze wiadomo, wykorzystanie nieskończenie małych zapoczątkowane przez Leibniza i bez wahań przyjęte przez Eulera, zostało zakwestionowane wraz z pojawieniem się metod Cauchy’ego, który postawił analizę matematyczną na twardych podstawach” ( tak na marginesie należy zauważyć, że za taką „twardość” podstaw należało zapłacić zarówno złożonością aparatu matematycznego, jak i odejściem od fizycznej poglądowości ) I w ten sposób, do 1961 roku pojęcie nieskończenie małej wielkości stałej, liczby nieskończenie małej obecne było w najlepszym wypadku jako pojęcie nieostre, a w gorszym przypadku – jako bezsensowne. Robinson [60] pierwszy zauważył, że takiemu pojęciu można nadać ścisły matematyczny sens. W przeciągu kolejnych 8 lat wyszły w świat trzy monografie, przedstawiające teorię niestandardową : W 1962 – książka W. A. J. Luxemburga „Analiza niestandardowa. Wykłady o robinsonowskiej teorii liczb nieskończenie małych i nieskończenie dużych” [50] , 1966 – książka A. Robinsona „Analiza niestandardowa” [61] W 1969 – książka M. Machowera, J. Hirschfelda „Wykłady o analizie niestandardowej” [54] Największy oddźwięk wywołała oczywiście książka Robinsona, która wyszła w znanej serii „Prace z logiki i podstaw matematyki”. W 9 pierwszych rozdziałach tej monografii zawarto zarówno budowę wymaganego aparatu logiczno-matematycznego ( z odsyłaczem do pracy A. I. Malcewa jako autora leżącego u podstaw tego aparatu twierdzenia o zwartości ), jak i różnorakie zastosowania – do rachunku różniczkowego i całkowego, ku topologii ogólnej oraz do teorii funkcji zmiennej zespolonej, do teorii grup Liego, do hydrodynamiki i teorii sprężystości. Szczególny interes przedstawia sobą ostatni rozdział 10, w którym autor przedstawia swoje poglądy na historię rozwoju analizy matematycznej. Chociaż książka Robinsona, która miała kilka wydań i miała znaczny wpływ na rozwój analizy niestandardowej, nie można jej rekomendować jako książkę do początkowej nauki tego przedmiotu – jest ona napisana skrótowo i ciężko. Oprócz książki Robinsona w 1966 roku w analizie niestandardowej nastąpiło jeszcze jedno ważne zdarzenie. Pojawił się artykuł Bernsteina i Robinsona [21] w którym po raz pierwszy z użyciem metod analizy niestandardowej otrzymano rozwiązanie wcześniej postawionego problemu, odnoszącego się do „standardowych” obiektów matematycznych. Dla zainteresowanych wyjaśnimy o jaki chodzi problem. Chodzi o zagadnienie podprzestrzeni inwariantnych dla wielomianowo zwartych operatorów ( operator T nazywa się wielomianowo zwarty, jeśli zwarty jest operator p(T) dla pewnego wielomianu p o współczynnikach zespolonych ) Twierdzenie o istnieniu nietrywialnej inwariantnej przestrzeni zamkniętej dla operatorów zwartych w separowalnej zespolonej przestrzeni Hilberta zostało dowiedzione przez J. Von Neumanna na początku lat 30-tych. ( Jak wiadomo, wszystkie separowalne przestrzenie Hilberta są izomorficzne do „kanonicznej” przestrzeni ł2, składającej

się z ciągów liczb zespolonych, sumowalnych z kwadratem. Co zaś tyczy przestrzeni nieseparowalnych, to dla ich twierdzenie to jest oczywiste )

Page 52: Co to takiego analiza niestandardowa

52

Dowód Neumanna nie został jednak opublikowany. To samo twierdzenie dla operatorów zwartych w dowolnej przestrzeni Banacha nad ciałem liczb zespolonych został przedstawiony dalej przez Aronzajna, Shmita [18]. W artykule Halmosa [31] w charakterze dziewiątego problemu figuruje postawione przez K.T. Shmita zagadnienie o

istnieniu podprzestrzeni inwariantnej dla takich operatorów T w przestrzeni Hilberta ł2, dla których operator T2 jest zwarty

( wszystkie takie T, są oczywiście wielomianowo zwarte ). Rozwiązanie tego problemu przedstawili A. P. Bernstein i A. Robinson z użyciem metod analizy niestandardowej. Pokazali oni, że dowolny wielomianowy operator zwarty w przestrzeni Hilberta ł2, posiada nietrywailną zamkniętą podprzestrzeń. Halmos zaznajomił się z tym dowodem, a następnie

przerobił go na dowód nie wykorzystujący analizy niestandardowej [32]. W dalszej kolejności Bernstein, wykorzystując analizę niestandardową rozszerzył twierdzenie Bernsteina-Robinsona na przypadek wielomianowych operatorów zwartych w dowolnych przestrzeniach Banacha nad ciałem liczb zespolonych [20] Stosunkowo niedawno twierdzenie o podprzestrzeniach inwariantnych dla operatorów zwartych zostało uogólnione ( również z pomocą metod analizy niestandardowej ), na szerszą klasę liniowych przestrzeni topologicznych niż przestrzenie Banacha [30]. Należy również zauważyć, ze W. I. Łomonosow pokazał ( z użyciem metod standardowych), ze każdy operator w nieskończenie wymiarowej przestrzeni Banacha, komutujący z operatorem zwartym ( i tym samym z każdym operatorem wielomianowo zwartym), posiada podprzestrzeń inwariantną [12] Twierdzenie Bernsteina-Robinsona stanowi nie jedyny ( chociaż jest on najbardziej efektywny) przykład zastosowania metod analizy niestandardowej. Liczba i różnorodność takich zastosowań cały czas rośnie. Zastosowania analizy niestandardowej wewnątrz matematyki obejmują obszerny krąg zagadnień od topologii ( [1, str. 210-211; 19, 29, 36], teorii równań różniczkowych [17], teorii miary i prawdopodobieństwa ( w której pojawia się możliwość rozumienia prawdopodobieństwa zdarzeń jako stosunku nieskończonej liczby wyników sprzyjających do ogólnej liczby zdarzeń ) [22,26,42,46, 47, 58,59], w teorii gier [68]. Liczby nieskończenie małe ( w sensie analizy niestandardowej )okazują się również użyteczne w analizie wielkości nieskończenie małych w sensie standardowych podręczników analizy ( funkcji, dążących do zera ) [43, 45]. Co zaś tyczy zastosowań poza czysto matematycznych, to spotyka się je np. w ekonomice [23,24] Wielce obiecującym wydaje się wykorzystanie niestandardowej przestrzeni Hilberta ł2* w celu zbudowania mechaniki

kwantowej ( tradycyjnie formułowanej z użyciem „standardowej przestrzeni Hilberta ł2 ) [28,55].

W szczególności rozpatruje się niestandardową definicje feynmanowskie całki po trajektoriach [41], rozpatruje się nieskończoną fluktuacje pola w nieskończenie małym obszarze [40]. W mechanice statystycznej staje się możliwe rozpatrywanie układów o nieskończonej liczbie cząstek [53]. Zainteresowanie fizyków analizą niestandardową sprawia, że pojawia się ona w popularnych wykładach i czasopismach specjalistycznych [64, 66]. Oprócz zastosowań do różnorodnych obszarach matematyki (i nie tylko matematyki), prowadzi się również badania w obszarze samej analizy niestandardowej, w postaci badania samych struktur niestandardowych [37]. W 1976 roku ukazały się trzy książki poświęcone analizie niestandardowej : „Analiza elementarna” , „Podstawy rachunku nieskończenie małych” – Keislera [38, 39] oraz „Wprowadzenie do teorii nieskończenie małych” - W. A. Luxemburga, K. D. Stroyan [62]. Pierwsza z nich reprezentuje napisany z niestandardowej pozycji podręcznik do analizy matematycznej. Znajduje się w niej duża liczba przykładów i ćwiczeń, jednakże wiele z dowodów podano tylko w zarysie, a samo istnienie ciała liczb hiperrzeczywistych i pewien wariant zasady Leibniza, wprowadza się w charakterze aksjomatów. Cały materiał stanowiący uzasadnienie przeniesiony został do drugie książki tego autora, ściśle związanej z pierwszą. Zatem książkę druga należy przeczytać jako pierwszą, aby odpowiednio zrozumieć materiał wyłożony w „Analizie elementarnej” Książka Stroyan’a i Luxemburga – jest to fundamentalna monografia, która przy czytaniu sprawia trudności nawet specjalistom. W 1977 roku wydano książkę M. Davisa [3], według nas, książka ta jak najbardziej nadaje się dla pierwszego zaznajomienia z tematem. W książce tej podano liczne zastosowania analizy niestandardowej. Być może największą korzyść metody niestandardowe mogą przynieść w obszarze matematyki stosowanej – nie darmo fizycy i inżynierowie tak lubią mówić o „nieskończenie małym” i „nieskończenie dużym”. W 1981 w serii „Lecture notes in mathematics” wydano książkę L. Lutz, M. Gose „Analiza niestandardowa – praktyczny przewodnik z zastosowaniami” [48]. W tej książce po wyłożeniu podstawowych zasad analizy niestandardowej, rozpatrywane są zagadnienia teorii zaburzeń. Mówiąc ogólnie, zadanie teorii zaburzeń jest następujące. Mamy pewien obiekt ( wielomian, operator liniowy, algebra Liego, równanie różniczkowe itd. ). Obiekt ten nieco zmieniamy. Jak teraz związane są własności tak zaburzonego obiektu z obiektem wejściowym ? W języku analizy niestandardowej zagadnienie stawiamy tak. Wejściowy obiekt jest standardowy. Zmiana, której on podlega, jest nieskończenie małą. Co można teraz powiedzieć o własnościach zmienionego obiektu, jeśli znamy własności obiektu wejściowego ? Widzimy, ze pojęcia analizy niestandardowej figurują już w samym zadaniu całego zagadnienia. ( a nie tylko w jego rozwiązaniu ). Oczywiście można próbować przetłumaczyć zagadnienie na język analizy klasycznej ( bez nieskończenie

Page 53: Co to takiego analiza niestandardowa

53

małych) i rozwiązać go z użyciem środków klasycznych, ale jak piszą autorzy przedstawionej książki, w wyniku zastosowania metod niestandardowych pojawiają się „zarówno jasne sformułowania, jak i intuicyjnie jasne dowody” [ 48, str. 127]. W szczególności w 8-zadaniu części IV w/w książki autorzy rozpatrują szeroko znany ( w dużym stopniu dzięki pracom kręgu matematyków N. Bourbakiego [25, 5] ) tzw. „problem kaczek”. Problem ten polega na próbie wyjaśnienia w jaki sposób w równaniu van der Pola :

ε x•• + ( x2 – 1 )x• + x = a gdzie ε - dodatnia I wystarczająco mała liczba znika cykl graniczny, kiedy parametr a, wzrasta przechodząc przez wartość 1. Nazwa problemu jako „kaczki” wyjaśnia się tym, ze taki cykl graniczny w procesie swojego przekształcenia nabiera formę przypominająca kontur lecącej kaczki. Rozpatrzenie parametru ε ni po prostu jako małej liczby rzeczywistej, a jako wielkości nieskończenie małej okazało się dla tego zagadnienia bardzo użyteczne. Wraz z przedstawionym w niniejszej książce podejściem ku analizie niestandardowej ( pochodzącym od Robinsona ) istnieje, również zyskujący obecnie popularność, kierunek w którym elementy nieskończenie małe „pozbywają się” stylu rozszerzenia prostej rzeczywistej lub innych struktur matematycznych, a „egzystują” wewnątrz takich struktur. W takim podejściu musimy przyznać np. że nieskończenie małe zawsze były obecne pośród liczb rzeczywistych, ale my ich po prostu nie widzieliśmy, nie mając możliwości wydzielenia ich z pośród pozostałych liczb. To co powiedziano wydaje się być sprzeczne – przecież wiemy, że dla ciała liczb rzeczywistych słuszny jest aksjomat Archimedesa, a zatem nie ma nieskończenie małych. Jak zatem można je tam „odkryć” ? Przypomnijmy jednakże, omówienie aksjomatu Archimedesa i jego formalnego analogu podanego w paragrafie 10. Widzieliśmy, że jest możliwa sytuacja której aksjomat Archimedesa nie jest spełniony, a jednocześnie jego formalny analog jest formułą prawdziwą. W tej sytuacji musimy przyjąć, ze właśnie tak ma miejsce w „standardowych” liczbach rzeczywistych. Przy tym wszystkie standardowe twierdzenia wiążące się z liczbami rzeczywistymi pozostają w mocy, ponieważ ich dowody mogą być sformalizowane i w takich formalizacjach wykorzystuje się nie intuicyjne rozumienie aksjomatu Archimedesa, a jego formalny analog. To co powiedziano wymaga oczywiście uściślenia. Teraz jedynie podamy szkic takiego podejścia ( posługując się przy tym pracą [56], drugi sposób uściślenia omówiono w pracy [33] ) Rozpatrzmy układ aksjomatyczny teorii zbiorów i dodajmy do niego nowe nieokreślone pojęcie „x – zbiór standardowy” ( jako dodatek do już posiadanego nieokreślonego pojęcia „x – element zbioru y” ) Przy tym zachowujemy wszystkie wcześniejsze aksjomatu tego układu ( niczego oczywiście nie mówiącymi, o nowym pojęciu „bycia standardowym” ), dodajemy również nowe aksjomaty. Mówiąc ogólnie, takie aksjomaty odpowiadają zasadzie Leibniza, zasadzie skierowania i możliwości rozpatrywania dowolnych zbiorów w standardowej superstrukturze. Przy tym okazuje się, ze pojawiające się rozszerzenie aksjomatycznej teorii zbiorów jest konserwatywne w tym sensie, że każda wywodliwa w takim rozszerzeniu formuła standardowej teorii zbiorów ( tj. nie zawierająca pojęcia „standardowy” ) jest wywodliwa i w standardowej teorii zbiorów. Zatem, dla „starych” formuł „nowe” środki dowodowe są równoważne „starym” chociaż - i w tym właśnie tkwi użyteczność – całej analizy niestandardowej „nowe”, dowody mogą być krótsze i bardziej naturalne, niż „stare” dowody tych samych twierdzeń. Różnica pomiędzy podejściem Robinsona do analizy niestandardowej i nowym podejściem aksjomatycznym, tkwi nie tyle w wynikach matematycznych, które z ich pomocą mogą zostać otrzymane, a raczej na stanowisku z jakiego je rozpatrujemy. Przyjmując do wiadomości pogląd, że nieskończenie małe – są to zawsze istniejące obiekty rzeczywistości, podejście aksjomatyczne skłania nas do ich spokojnego wykorzystywania nie tylko w charakterze środków dowodowych ”użytecznych funkcji”, ale jako pełnoprawnych obiektów matematycznych, mogących wchodzić do sformułowań naszych twierdzeń. Dalszy rozwój analizy niestandardowej zapewne pokażę, na ile taki pogląd jest płodny. W obecnym czasie analiza niestandardowa zdobywa sobie coraz większe uznanie. Organizuje się międzynarodowe sympozja, specjalnie poświęcone analizie niestandardowej oraz jej zastosowaniom [51, 52, 34]. W ciągu ostatnich dziesięcioleci analiza niestandardowa ( a ściślej – elementarna analiza matematyczna na podbudowie niestandardowej ) stała się przedmiotem wykładowym uniwersytetów amerykańskich (USA). 14. Czy liczby hiperrzeczywiste istnieją „naprawd ę” ? Oczywiście, niestandardowe liczby hiperrzeczywiste ( tj. liczby hiperrzeczywiste, nie będące rzeczywistymi ) – są obiektami nie zwykłymi. Zapewne z tego powodu nazywa się je właśnie niestandardowymi. Ale co oznacza, że są one niezwykłe ? Niezwykłe zazwyczaj oznacza cos do czego nie jesteśmy przyzwyczajeni. To do czego przywykliśmy jest już dla nas czymś zwyczajnym. Również do liczb niestandardowych należy po prostu się przyzwyczaić. Proces ten zapewne budzić będzie pewne psychologiczne trudności, ale od razu pragniemy wyjaśnić, gdzie znajduje się miejsce dla „nowych” liczb. Dla liczb nieskończenie dużych takie miejsce. Dla liczb nieskończenie dużych, takie miejsce znajduje się z łatwością – gdzieś tam w ujemnej lub dodatniej nieskończoności. W tym sensie psychologicznie prościej jest oswoić się z niestandardowymi liczbami hipernaturalnymi. Każda taka liczba jest nieskończenie duża i dodatnia i jest ona większa od każdej liczby naturalnej.

Page 54: Co to takiego analiza niestandardowa

54

W istocie wyobrażenie o takiej liczbie już bytowało ( chociaż nie w ścisłym sensie ) w społeczności matematyków : słówkiem ”gugol” nazwano potocznie liczbę naturalną, która przewyższa każda rozsądną wartość. Nieskończenie duże liczby hiperrzeczywiste mogą być już nie tylko dodatnie, ale i ujemne : nieskończenie duża liczba ujemna jest mniejsza, a dodatnia – większa od wszystkich standardowych liczb. Ale są jeszcze skończone niestandardowe liczby. Gdzie one się mieszczą ? Są one umiejscowione pomiędzy liczbami rzeczywistymi wypełniając pustki pomiędzy nimi. Ale czy takie pustki istnieją ? Oczywiście jeśli stoimy na takim stanowisku, ze możliwe są tylko ( standardowe ) liczby rzeczywiste, to żadne pustki pomiędzy nimi nie pojawiają się, a nawet jeśli by istniały to nie ma ich czym zapełnić ( przecież przy wybranym punkcie widzenia żadne liczby niestandardowe nie istnieją ). Przejście od liczb rzeczywistych do skończonych liczb hiperrzeczywistych na drodze do tych pierwszych skończonych liczb niestandardowych, następuje analogicznie do tego jak przeszliśmy od liczb wymiernych do liczb rzeczywistych, poprzez dodanie do tych pierwszych liczb niewymiernych. Liczby niewymierne są umiejscowione pomiędzy liczbami wymiernymi i jawne zrozumienie takiego faktu, nierzadko również wywołuje pewne psychologiczne opory. Również w takim przypadku można ( chociaż jest to bardzo niedogodne ) stać na stanowisku, ze liczby bywają tylko wymierne, a zatem na naszej osi liczbowej dla liczb rzeczywistych nie byłoby miejsca. Oczywiście w tym przypadku powinniśmy zrezygnować od takich standardowych możliwości, jak powiedzmy możliwość wyciągnięcia pierwiastka kwadratowego z dowolnej liczby dodatniej. Eliminując liczby niestandardowe, również pozbywamy się pewnych możliwości – w tym przypadku będą to oczywiście możliwości nieco niezwykłe, takie jak np. prawo do rozważania liczb nieskończenie małych i nieskończenie dużych. Oczywiście analogia pomiędzy skończonymi liczbami niestandardowymi i liczbami niewymiernymi jest słuszna tylko do pewnych granic – liczby niewymierne wypełniają tzw. luki pomiędzy liczbami wymiernymi ( po jednej liczbie niewymiernej na każda taką lukę ), aby otrzymać skończoną część osi hiperrzeczywistej, należy każdą liczbą rzeczywistą rozciągnąć w pewien odcinek ( co prawda nieskończenie mały )( Przecież np. gwiazdy widzimy jako punkty, chociaż w odpowiednim powiększeniu mają one kształt dysków. Analogicznie możemy przyjąć, że to co „widzimy” jako punkty na osi rzeczywistej, to w istocie są odcinki o środku w pewnej liczbie rzeczywistej tj. monady ) Zapewne czytają powyższe wywody, czytelnik ma mieszane odczucia. Co ma znaczyć iż „można przyjąć tak, a można przyjąć inaczej” ? Jak jest w rzeczy samej ? Z czego skalda się oś liczbowa – tylko z liczb wymiernych, czy tylko z rzeczywistych – a może skończonych hiperrzeczywistych lub z samych hiperrzeczywistych, zarówno skończonych jak i nieskończenie dużych ? Aby odpowiedzieć na wszystkie te pytania, należy w pierwszej kolejności zrozumieć, co oznaczają słowa „w istocie”. Jaka jest istota rzeczy ? Problem w tym, ze należy sztywno rozróżniać realność matematyczną i fizyczną. W realności matematycznej istnieją różnorodne układy liczbowe ( jeśli tak jest wygodniej można nazywać je osiami liczbowymi ) : N, Z, Q, R, R*. Każdy z nich reprezentuje sobą liniowo uporządkowany zbiór z określonymi nad nimi operacjami dodawania i mnożenia. Każdy taki układ można przyjąć jako rozszerzenie poprzedniego ( przy czym zarówno porządek, jak i wynik zastosowania operacji jest zachowany ), możemy zatem zapisać : N ⊂ Z ⊂ Q ⊂ R ⊂ R* Układ liczbowy ( lub inaczej oś liczbowa ) R jest wyróżniona tym, że jej elementy ( liczby rzeczywiste ) wzajemnie jednoznacznie i z zachowaniem porządku odpowiadają punktom prostej geometrycznej. Wydawać by się mogło, że własność ta jest decydująca – prosta geometryczna ( ściślej – prosta z wyróżnionymi na niej dwoma punktami, nazwanymi odpowiednio „zero” i „jedynka” ) daje nam oś liczbową. Jednakże sama prosta geometryczna reprezentuje sobą obiekt matematycznej ( a nie fizycznej ! ) realności – w danym przypadku obiekt struktury matematycznej, opisywany przez odpowiednie aksjomaty i nazywana „geometrią Euklidesa”. Można jednakże rozpatrywać i inne układy aksjomatów, otrzymując inne geometrie, w których proste będą posiadały inne niż w geometrii euklidesowej własności. Wiemy przecież, ze istnieją geometrie nieeuklidesowe. Pośród nich są geometria Łobaczewskiego i geometria Riemanna. W geometrii Łobaczewskiego naruszane są ( w porównaniu z geometria Euklidesa ) zewnętrzne własności prostej tj. własności charakteryzujące zachowanie prostej względem innych prostych, ale własności wewnętrzne prostych są zachowane : punkty na prostej Łobaczewskiego umiejscowione są tak samo jak punkty na prostej euklidesowej. W geometrii Riemanna naruszane są nie tylko własności zewnętrzne, ale i wewnętrzne prostej : porządek punktów na prostej Riemanna jest cykliczny, a zatem jest on podobny do porządku punktów na okręgu ( w ścisłym matematycznym sensie nie można go nazwać nawet porządkiem )A można wymyślić i taki „niestandardowy” układ aksjomatów geometrii, w którym punkty na prostej będą umiejscowione tak jak na osi hiperrzeczywistej R*. W ten sposób możemy wymyślać różnorodne geometrie, którym będą odpowiadały różnorodne układy liczbowe. W takim przypadku naturalnym wydaje się pytanie, która z takich geometrii i w szczególności które wyobrażenie o prostej geometrycznej, opisuje realna przestrzeń fizyczną, a w szczególności realną prostą fizyczną ? Należy jednakże zdawać sobie sprawę iż geometryczny opis realności fizycznej jest możliwy tylko w pewnym przybliżeniu I tak planetę Ziemia można opisywać jako kulę, jako elipsoidę, albo jako geoidę – każdy z takich opisów jest przybliżony, ale stopień dokładności opisu wzrasta ( nie należy myśleć, że im lepsza dokładność tym lepszy opis – fundamentalna rewolucję przyniosło wyobrażenie o Ziemi jako o kuli i jak się wydaje takie wyobrażenie na zawsze stanie się najbardziej istotne )

Page 55: Co to takiego analiza niestandardowa

55

Przy niezbyt dużych i niezbyt małych ( w porównaniu z rozmiarami człowieka ) rozmiarach przestrzennych przestrzeń fizyczna z wystarczającą dokładnością opisywana jest przez standardową geometrią Euklidesa. Przy znacznym powiększeniu lub, przeciwnie przy zmniejszeniu wymiarów taka dokładność zaczyna być coraz mniejsza. O tym jak zbudowana jest przestrzeń fizyczna w skalach bardzo dużej i bardzo małej wiemy jeszcze bardzo mało. Ogólnie przyjętym jest punkt widzenia zgodnie z którym globalnie przestrzeń jest skończona. Promień światła skierowany z pewnego punktu takiej przestrzeni w dowolną stronę, powróci do tego punktu z drugiej strony ( chociaż jest to poparte całym zbiorem dodatkowych uwag ) (* dalej autor prowadzi rozważania natury ogólno fizycznej *) Być może w wielu przypadkach nie jest celowym pytać, która z określonego zbioru modeli matematycznych lepiej opisuje rzeczywistość fizyczna. Jak się wydaje rozsądnie przyjąć zasadę wielorakości modeli i przyjąć, że realność opisywana jest od razu przez cały zbiór modeli matematycznych, być może częściowo wzajemnie sprzecznych. Przykładowo rozsądnie można byłoby przyjąć, że przestrzeń fizyczna jednocześnie jest opisywana przez kilka modeli - jeden, z których to standardowa geometria Euklidesa, drugi np. zakłada istnienie minimalnego rozmiaru przestrzennego „kwant przestrzenny”, trzecia – istnienie odległości nieskończenie małych itd. W takim kontekście warto wspomnieć, że również w pracach twórców analizy matematycznej – Newtona i Leibniza – zakładano istnienie różnorodnych modeli praw natury. Leibniz widział świat jak mozaikę, złożoną z mniejszych części – można zatem interesować się stosunkiem jednej cząstki dy do drugiej dx. Świat Newtona jest ciągły i zmienia się w sposób ciągły z upływem czasu : zmienne ( według Newtona – fluenty ) x, y, ... są w istocie funkcjami czasu można interesować się prędkościami ich zmienności ( wedle Newtona – fluksjami ) x• , y• ,... W ten sposób, jeśli obraz świata Leibniza realizuje się w technice mozaiki i zmienia się tak, jak byśmy obracali kalejdoskopem przez nieskończenie małe odcinki czasu dt, to obraz świata Newtona farbami olejnymi, które nie zdążyły jeszcze wyschnąć i rozpływają się na powierzchni płótna. W ten sposób nie jest wykluczone, że wyobrażenie o nieskończenie małych – odległościach, masach, ładunkach itp. dobrze odpowiada rzeczywistości fizycznej. Zatem dla opisania takich wielkości nieskończenie małych potrzebujemy nieskończenie małe liczby. Jeśli żądamy, aby takie liczby podlegały standardowym operacjom arytmetycznym, to nieuchronnie pojawiają się liczby nieskończenie duże ( jako wynik dzielenie jedności przez nieskończenie małe ), jak również takie liczby niestandardowe, które nie są ani nieskończenie duże, ani nieskończenie małe ( jak wynik dodania nieskończenie małych do standardowych liczb rzeczywistych ). Otrzymany w ten sposób układ liczb hiperrzeczywistych, zawierający wszystkie liczby rzeczywiste jako swój podukład, pretenduje do tego, aby opisywać świat fizyczny, nie gorzej niż robi to standardowa oś liczbowa.

Page 56: Co to takiego analiza niestandardowa

56

Literatura

Page 57: Co to takiego analiza niestandardowa

57

Page 58: Co to takiego analiza niestandardowa

58

Page 59: Co to takiego analiza niestandardowa

59

Page 60: Co to takiego analiza niestandardowa

60

*************************************************** ***********************************************