Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense...

250
Poukladać matematykę (lub przynajmniej próbować) Grzegorz Jarzembski Wydzial Matematyki i Informatyki Uniwersytet M. Kopernika w Toruniu

Transcript of Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense...

Page 1: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Poukładać matematykę(lub przynajmniej próbować)

Grzegorz JarzembskiWydział Matematyki i Informatyki

Uniwersytet M. Kopernika w Toruniu

Page 2: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Spis treści

1 Liczby naturalne 91.1 Liczba naturalna - co to jest? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.1.1 Liczby naturalne w teorii mnogości . . . . . . . . . . . . . . . . . . . . . . . . 111.2 Nieskończoność potencjalna czy aktualna? . . . . . . . . . . . . . . . . . . . . . . . . 12

2 Nieskończoność kontrolowana 152.1 Matematyczny konstruktywizm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.2 Struktury rekurencyjne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.3 Struktury rekurencyjne w metamatematyce . . . . . . . . . . . . . . . . . . . . . . . 22

2.3.1 Gramatyki i języki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.3.2 Dowodzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.3.3 Dodatek: jaką nieskończoność tolerują komputery? . . . . . . . . . . . . . . . 26

3 Przestrzeń - matematycznie 293.1 „Przestrzeń” - co to jest? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.2 Kontinuum - przedmiot (ciągłego) sporu . . . . . . . . . . . . . . . . . . . . . . . . . 313.3 Wielkości graniczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.3.1 O continuum nieco inaczej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393.3.2 Liczby p-adyczne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.3.3 Liczby zespolone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4 Spór o istotę matematycznego bytu 434.1 Koncepcja Hilberta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.2 Rola teoria mnogości w koncepcji Hilberta . . . . . . . . . . . . . . . . . . . . . . . . 494.3 Opozycja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.4 Czy jest coś oprócz języka? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.4.1 O konstruktywiźmie Brouwera (subiektywnie) . . . . . . . . . . . . . . . . . . 56

5 Język matematyki 655.1 Języki naturalne i formalne: dwa mity. . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.1.1 Logika języka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665.2 Język matematyki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.2.1 Co to jest „własność”? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705.2.2 Genialny wynalazek - formuła . . . . . . . . . . . . . . . . . . . . . . . . . . . 725.2.3 Równie genialny pomysł - termy . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.3 Diabelska sztuczka - kwantyfikatory . . . . . . . . . . . . . . . . . . . . . . . . . . . 745.3.1 Nowy rodzaj zdań . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 765.3.2 Trzeci wymiar języka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

5.4 Skąd się biorą teorie? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 855.4.1 Dodatek: zmienne w informatyce . . . . . . . . . . . . . . . . . . . . . . . . . 87

1

Page 3: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

SPIS TREŚCI 2

6 Arytmetyka 886.1 Język arytmetyki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 896.2 Ważne pytanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

6.2.1 Orzekać = rozstrzygać? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 906.2.2 Orzekać = dowodzić? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

6.3 Twierdzenie Godla - po raz pierwszy . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

7 Obliczalność 987.1 Maszyna Turinga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

7.1.1 Klasyfikacja języków Chomsky’ego revisited . . . . . . . . . . . . . . . . . . . 1027.1.2 Maszyna uniwersalna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

7.2 Funkcje obliczalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1057.2.1 Funkcje obliczalne według Kleene’ego . . . . . . . . . . . . . . . . . . . . . . 1067.2.2 Numeracja i efektywna numeracja . . . . . . . . . . . . . . . . . . . . . . . . 109

7.3 Maszyny Turinga z wyrocznią . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1107.3.1 Arytmetyki słabsze niż PA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1127.3.2 Krok w bok: rekurencja, iteracja i... matematyka eksperymentalna . . . . . . 114

1167.4.1 Systemy redukcji wyrażeń . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

7.5 λ-rachunek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1207.5.1 Glossa: skąd się wziął λ-rachunek? . . . . . . . . . . . . . . . . . . . . . . . . 1237.5.2 Maszyny Turinga a λ-rachunek . . . . . . . . . . . . . . . . . . . . . . . . . . 1247.5.3 Dodatek: nieco więcej o λ-rachunku . . . . . . . . . . . . . . . . . . . . . . . 125

7.6 Hipoteza Churcha i twierdzenie Tennenbauma . . . . . . . . . . . . . . . . . . . . . 1267.6.1 Obliczalność funkcji rzeczywistych . . . . . . . . . . . . . . . . . . . . . . . . 1277.6.2 Algorytmy kwantowe - krótko . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

7.7 Liczba Ω Chaitina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1287.7.1 Wielki Wybuch i Collapsing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

7.8 Złożoność obliczeniowa czyli o pragmatyce języka obliczeń . . . . . . . . . . . . . . . 134

8 Twierdzenia Godla 1378.0.1 Niezupełność PA - pierwsze twierdzenie Godla . . . . . . . . . . . . . . . . . 1378.0.2 Powrót do źródeł . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

8.1 Zdanie godlowskie G . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1408.1.1 O praprzyczynie pewnych niemożności . . . . . . . . . . . . . . . . . . . . . . 142

8.2 Niesprzeczność arytmetyki Peano - drugie twierdzenie Godla . . . . . . . . . . . . . . 1458.3 Próba bilansu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

9 Wokół koncepcji prawdy Tarskiego 1529.1 Koncepcja Tarskiego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1529.2 Syntaktyka - składnia języka pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . 1549.3 Modele logiki pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

9.3.1 Teoriomnogościowe modele języka pierwszego rzędu . . . . . . . . . . . . . . . 1579.3.2 Jeszcze jedno twierdzenia Godla . . . . . . . . . . . . . . . . . . . . . . . . . 1579.3.3 Ograniczenia języka pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . 160

9.4 Nominalizm Tarskiego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1629.4.1 Zbiorowa hipnoza? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1629.4.2 Nominalizm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

Page 4: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

SPIS TREŚCI 3

10 Pewna szczególna teoria - ZFC 16510.1 Modele ZFC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

10.1.1 ZFC, ZFC− i arytmetyka Peano . . . . . . . . . . . . . . . . . . . . . . . . 16910.1.2 Kłopoty (to moja specjalność)... . . . . . . . . . . . . . . . . . . . . . . . . . 17010.1.3 Twierdzenie Łosia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

10.2 Konsekwencje twierdzenia Łosia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17410.3 Matematyczne uniwersum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

10.3.1 Model zamierzony ZFC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17910.3.2 Superstruktury i niestandardowe uniwersa . . . . . . . . . . . . . . . . . . . . 18210.3.3 Wilk w owczej skórze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18410.3.4 Dlaczego ZFC? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

11 Logika intuicjonistyczna 18811.1 Konsekwencja i implikacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18811.2 Źródła logiki intuicjonistycznej . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190

11.2.1 Formalizacja zdaniowej logiki intuicjonistycznej . . . . . . . . . . . . . . . . . 19111.3 Semantyka Kripkego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195

11.3.1 Semantyka algebraiczna i topologiczna . . . . . . . . . . . . . . . . . . . . . 19711.4 Logika intuicjonistyczna pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . . . 198

11.4.1 Arytmetyka intuicjonistyczna . . . . . . . . . . . . . . . . . . . . . . . . . . . 20011.4.2 Realizowalność Kleene’ego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

12 Kategorie, funktory i toposy 20512.1 Język kategorii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

12.1.1 Teoria mnogości v. teoria kategorii - okiem pragmatyka . . . . . . . . . . . . 20912.1.2 Izomorfizm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210

12.2 Toposy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21012.2.1 Elementarne struktury w toposie . . . . . . . . . . . . . . . . . . . . . . . . . 211

12.3 Przykłady toposów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21212.3.1 Zbiory zmienne w czasie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21212.3.2 Toposy presnopów i toposy snopów . . . . . . . . . . . . . . . . . . . . . . . . 213

12.4 Logika toposu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21512.4.1 Semantyka języka pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . . . 218

12.5 Teoria zbiorów a teoria toposów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22012.6 Od logiki do toposów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

12.6.1 Topos snopów revisited . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22312.6.2 Topos reprezentacji snopów . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22512.6.3 Punkty i elementy - od H-obiektów do H-snopów . . . . . . . . . . . . . . . 22712.6.4 Semantyka języka pierwszego rzędu . . . . . . . . . . . . . . . . . . . . . . . . 231

13 Topos Hylanda 23513.0.5 Kategoria zbiorów efektywnych . . . . . . . . . . . . . . . . . . . . . . . . . 235

13.1 Topos Hylanda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237

Page 5: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Proces nie jest rzeczą.Raczej rzecz jest stanem procesu.

Jeśli uważasz, że trud poznania jest uzasadniony tylko wtedy, gdy przynosi praktyczną korzyść- daj sobie spokój.

Jeśli choć raz na jakiś czas pytasz o sens tego, co robisz, to ten tekst jest dla ciebie. To tekstdla tych, którzy zechcą zmierzyć się z pytaniem „czym jest matematyka?” w sposób wolny od edu-kacyjnego przymusu, powodowani li tylko czystą ciekawością.Wykształcenie matematyczne jakie zdobywamy w szkołach i na uczelniach jest, delikatnie mówiąc,niedoskonałe1. We wspomnieniach większości edukacja matematyczna to ciągła konfrontacja na-szych ograniczonych zdolności z doskonałością, jaką w wydaniu szkolnym i uniwersyteckim jestmatematyka. Ta konfrontacja zawsze - wcześniej lub poźniej - kończy się kapitulacją2.

Powszechne przekonanie o doskonałości matematyki to skutek edukacji, która z bezwarunkowejakceptacji jej podstawowych i jednocześnie wysoce abstrakcyjnych założeń czyni warunek koniecznyprzynależności do grona wtajemniczonych. Trafnie - choć nie wiem, czy w sposób zamierzony -napisał o tym J. Pogonowski, rozpoczynając jeden ze swoich wykładów: „Proszę, aby słuchaczena czas tego wykładu uwierzyli w pewne dogmaty. Nie jest tego wiele: aksjomaty teorii mnogości(Zermelo-Fraenkla) oraz aksjomaty arytmetyki Peana (...) . W szczególności, proszę (...) wierzyćw istnienie co najmniej jednego zbioru nieskończonego.” [91]. Te słowa, kierowane do słuchaczypopularnonaukowego wykładu, zdają się sugerować, że matematycy potrafią zastąpić wiarę wiedząo słuszności i niepodważalności podstawowych założeń matematyki. Ale to nieprawda.

Matematyka szkolno-uniwersytecka to świat aż nadto poukładany, bez luk i czarnych dziur.Pewność i niezawodność. Raj3. Ogrom matematyki przytłacza jak rzymska bazylika św. Piotra.Jako studenci przyjmujemy z pokorą, że nie wszystko rozumiemy. Gotowi jesteśmy akceptować pre-zentowane (narzucane) nam koncepcje w nadziei, że kiedyś poznamy argumenty przekonujące o ichsłuszności. Ale to zdarza się nader rzadko - większość studentów matematyki opuszcza uniwersytetyraczej z wiarą w sens matematyki niż ze zrozumieniem jej źródeł i podstaw4.To nie jest ich wina. Tak jest, bo - w większości - wykładowcy uniwersytetcy zachowują się tak,jakby dyskusja o podstawach matematyki była czymś wstydliwym. Niby znamy ograniczenia teoriimnogości ujawnione kilkadziesiąt lat temu przez Godla i Cohena, ale rzadko o tym nie mówimy(myślimy)5. Uznajemy, że podstawy matematyki to tylko jeden z wielu działów matematyki, do-mena grupy specjalistów, tzw. „podstawowców”. Nam nic do tego.M. Kordos pisał o takim kształtowaniu postaw adeptów matematyki tak: „Model jest jasny. Wpra-wiamy siebie i swoich uczniów w pewnego rodzaju mistyczny sen, w którym przeżywamy naszematematyczne sukcesy, porażki, odkrycia i rozczarowania. I można by to nawet prześladować, jakozbiorowa hipnozę, (...) gdyby nie jedno, co budzi w pospólstwie zabobonny lęk:

1Nikt nic nie czyta, a jeśli czyta, to nic nie rozumie, a jeśli nawet rozumie, to nic nie pamięta. - S. Lem.2Nie dotyczy to nielicznej grupy prawdziwych matematyków i licznej grupy zarozumialców uważających się za

matematyków. Trzeba bowiem ogromnej wiedzy (bądź równie wielkiej zarozumiałości) by stwierdzić „ogarniam irozumiem matematykę”. Nawet będąc wybitnym specjalistą w jednej dziedzinie matematycznej skazani jesteśmy naignorancję w innych.

3”Nikt nas nie wyprowadzi z raju stworzonego przez Cantora” - David Hilbert4Są i tacy, którzy kończą studia z mniejszą wiarą niż ta, z którą zaczynali edukację...5B. Russell, jedna z głównych postaci tego tekstu twierdził, że jego (wspólne z A. Whiteheadem) dzieło „Principia

Mathematica” przeczytało ... pięć osób. A liczba odwołań do niego jest niemal nieskończona. Dla ścisłości: ja też nie.

4

Page 6: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

SPIS TREŚCI 5

zdumiewająca i niewytłumaczalna skuteczność matematyki.” [62]6

The courses in the foundations of mathematics (...) emphasize the mathematical analysis offormal systems, at the expense of philosophical substance. Thus it is the mathematical professionthat tends to equate philosophy with the study of formal systems, which require knowledge oftechnical theorems for comprehension. They do not want to learn yet another branch of mathematicsand therefore leave the philosophy to the experts. As a consequence, we prove these theoremsand we do not know what they mean. - to z kolei opinia E. Bishopa7.

Myślą tyle, co wartoani chwili dłużej,bo za tą chwilą czai się wątpliwość...8

Czasem jednak zdarza się coś szczególnego. Oto jak swój przypadek opisał P.J. Davis, współ-autor książki „Świat matematyki” [38]: „Jeszcze pięć lat temu byłem normalnym matematykiem.(...) Miałem swoją dziedzinę - równania różniczkowe cząstkowe - i w niej tkwiłem (...). Mój sposóbmyślenia i moje prawdziwe życie intelektualne opierały się na kategoriach i metodach analizy, któreprzyswoiłem wiele lat temu (...). Ponieważ nie wychylałem się daleko poza te kategorie i metody,miałem jedynie ich niejasną świadomość. (...) Mój awans zależał od moich badań i publikacji (...)Osąd innych osób pracujących w mojej dziedzinie decydował o wartości tego, co robiłem. Nikt innynie miał po temu kwalifikacji i jest wątpliwe, czy ktokolwiek poza nimi byłby tym zainteresowany.Moje uwolnienie od takiej postawy tzn. uświadomienie sobie, że jest ona tylko jednym z wielusposobów patrzenia na świat, (...) wcale nie było potrzebne w mojej karierze. Przeciwnie, takie nie-ortodoksyjne i wątpliwe przedsięwzięcie w najlepszym razie mogły się wydać głupim marnowaniemczasu, a w najgorszym - rozwiązłym zanurzeniem w tak wątpliwych i podejrzanych sprawach jakpsychologia, socjologia czy filozofia...”

Refleksja nad istotą matematyki ustąpiła pragmatyzmowi... To jest postawa „pracujących matematy-ków”9, którzy stanowią zdecydowaną większość matematycznej społeczności.Rozważanie podstawowych dylematów jest dla niespecjalistów przedsięwzięciem wysokiego ryzyka, gdyż -jak miał odwagę napisać L. Susanka - „dithering about foundational matters can easily get you brandedasa crank or a heretic, not a career enhancing event” [112]10.

Paradoksalnie, taką postawę ogromniej większości matematyków można tłumaczyć ... chęciąsprostania wymagom naukowej rzetelności. Przecież przed sformułowaniem własnego sądu w kwe-stii podstaw matematyki, powinniśmy poznać i zrozumieć(?) poglądy genialnych myślicieli, logikówi matematyków, od Arystotelesa do Godla. A my, zajęci karierą, zobowiązani do zdobywania kolej-nych stopni po prostu nie mamy czasu! Jeśli nawet podejmiemy wyzwanie, to szybko odkrywamy,że utknęliśmy w gąszczu specjalistycznej terminologii i utonęliśmy w morzu cytatów. Jeśli cudemprzebrniemy przez choćby ułamek tego, co dostępne w bibliotekach i internecie, to stwierdzamy, żepoznanie różnych - często przeciwstawnych - poglądów niewiele zbliżyło nas do określenia własne-go stanowiska. Ogarnia nas zwątpienie i zniechęcenie. Jaką mamy szansę powiedzieć coś własnegoo fundamentalnych problemach dogłębnie przemyślanych przez takich geniuszy jak Arystoteles, Le-ibniz, Kartezjusz, Cantor, Hilbert, Church, Godel, Tarski? Narasta poczucie, że jesteśmy intruzemw świecie gigantów. A skoro tak, to jakie mamy prawo do głoszenia własnego sądu? Jaką szansę,że będzie on choć odrobinę oryginalny?

To nie jest zażalenie na reguły współczesnej nauki. Tak nie tylko jest, ale tak powinno być.Brutalnie kawę na ławę wyłożył C. F. von Weizsacker:

Ogólnie rzecz biorąc, fizyk podobnie jak każdy inny naukowiec - ma za zadanie odpowiedziećna (...) pytania, na które aktualnie jest w stanie odpowiedzieć. Nie wolno mu stawiać pytań za

6Profesorowie J. Pogonowski i M.Kordos to znakomici polscy popularyzatorzy matematyki.7E. Bishop: The Crisis in Contemporary Mathematics, Historia Mathematica 2, 507-515, 1975.Erret Bishop (1928-

1983), amerykański matematyk-konstruktywista, autor dzieła „Foundations of Constructive Analysis”.10Pragmatyk = człowiek odznaczający się praktycznym sposobem myślenia i działania. Termin „pracujący mate-

matyk” („robotnik matematyki”) - „working mathematician” zapożyczyłem od S. McLane’a [72].

Page 7: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

SPIS TREŚCI 6

trudnych.(...) Fizyk nie może pytać: co to jest materia? co to jest czas lub przestrzeń? Biolog niemoże pytać: co to jest życie? Psycholog nie może pytać: co to jest umysł? Wszyscy oni stawiająszczegółowe pytania, na które da się odpowiedzieć przy pomocy stosowanych przez nich metod. Wtym sensie unikanie filozofii jest warunkiem możliwości uprawiania nauk11.

Mowa tu wprawdzie o fizyce ale to bez znaczenia: aby być skutecznym, należy zadawać tylkotakie pytania, które można zadać. Ale za chwilę, w tym samym artykule Weizsacker pisze:

Jednakże reguła ta załamuje się wtedy, gdy nauka dokonuje tzw. wielkich kroków. Nawiązuję tudo znanej koncepcji (...) T. Kuhna12. Według niego nauka rozwija się wzdłuż łańcucha składającegosię z dwu typów ogniw. Ogniwa jednego typu to tzw. normalne okresy rozwoju, kiedy to naukowcystawiają i rozwiązują zagadnienia wewnątrz określonego paradygmatu, posługując się dobrze usta-lonymi metodami. Normalne okresy są oddzielone od siebie przez fazy drastycznych zmian, zwanerewolucjami naukowymi; polegają one na przejściu od jednego paradygmatu do drugiego. Podczastakich przejść (...) naukowiec musi filozofować, musi stawiać przynajmniej niektóre z tych pytań,których w okresach normalnych należy unikać.”

Ostatnią rewolucję matematyka przeżyła za sprawą matematyków dwóch pokoleń - Hilberta iGodla. Współczesny mainstream matematyczny został wyznaczony przez teorię mnogości i wspie-rającą ją klasyczną logikę. To teraźniejszy paradgmat. Dziś jesteśmy zanurzeni w teorii mnogościpo uszy i czubek rozumu. Trwa stan upojenia jej oszałamiącymi sukcesami w XX wieku. Takzostaliśmy wychowani i tak kształcimy studentów.

Czy matematyka ma przetrwać nietknięta w czasienajwiekszej od wynalezienia druku rewolucjitechnologiczno-cywilizacyjnej, która zmienia wszystkie dziedziny nauki, kulturę i obyczajowość?Trzeba szczególnego rodzaju ortodoksji by trwać w przekonaniu, że matematyka jest ponad tę rewolucję.

Sądzę, że właśnie teraz, warto i trzeba zadawać sobie pytanie, czym właściwie jest matematyka.I że należy szukać własnych odpowiedzi nawet wtedy, gdy wiemy, że takiej „ jedynie słusznej”odpowiedzi nie ma.Jednak by dać sobie szansę zrozumienia istoty matematyki nie wystarczy czytać i kolekcjonowaćbezrefleksyjnie poglądy wielkich. Trzeba wyjść poza ograniczenia wyznaczone przez edukacyjneschematy i podjąć ryzyko sformułowania własnego sądu. Bez tego nie mamy szans na zrozumienieczegokolwiek. To tak, jakby prowadzić działalność badawczą bez hipotez, jakby próbować nauczyćsię matematyki nie rozwiązując samodzielnie żadnego zadania.

„To really understand something, I believe that one must discover it oneself, not learn it from anyoneelse!”13.Nie szukajcie w tym tekście odpowiedzi na te podstawowe pytania a jedynie pomocy i zachęty do poszu-kiwania własnych.

Cztery uwagi, a nawet sześć

1. Ten tekst nie jest przeznaczony do druku a jedynie do rozpowszechniania elektronicznego. Wra-cam do niego i go zmieniam, poprawiam, uzupełniam. Twierdzenie, że można napisać o podstawachmatematyki w sposób kompletny, bez luk, niedopowiedzeń i błędów, to czysta arogancja. „ Plainsuccess is not the only possible goal; this might simply be the exposition of a disorder in thisapparently well-organised universe”. J.-Y. Girard [41]

11Filozofia grecka a fizyka współczesna, Zagadnienia Filozoficzne w Nauce II, 1979/80. Carl Friedrich Freiherr baronvon Weizsacker (1912 – 2007), niemiecki fizyk i filozof.

12Thomas Kuhn (1922-1996) amerykański filozof nauki autor dzieła The Structure of Scientific Revolutions” wktórym wprowadził pojęcie paradygmatu. Paradygmat to zbiór pojęć, stwierdzeń, teorii stanowiących podstawę danejdziedziny nauki. W odróżnieniu od dogmatu paradygmat nie jest wieczny, jest rodzajem „umowy społecznej” badaczyodgrywających w danym czasie dominujacą i decydująca rolę.

13G.J. Chaitin - „Information Theoretic Incompletness”

Page 8: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

SPIS TREŚCI 7

2. Będę starał się oszczędzić czytelnikom zmagań ze specjalistycznym językiem i rozbudowanymformalizmem.

3. Nie traciłem (niestety) zbyt dużo czasu na tworzenie hiperpoprawnej dokumentacji źródeł. Alezapewniam, że szanuję reguły obowiązujące w świecie akademickiej nauki parametryzowanej i punk-towanej na wszelkie sposoby. Dlatego nazywam ten tekst „notatkami” a nie pracą (para)naukową.

4. Cytatów jest tu wiele. Ktoś powie - zbyt wiele. Ale dlaczego mam szukać własnych sformu-łowań, gdy uznaję cudzą wypowiedź za trafną? A że po angielsku? No cóż, w tym kraju prawie nakażdych drzwiach umieszczono słowa „push” lub ”pull”. A tłoku jakoś nie ma... .

5. „Im bardziej zaawansowane technicznie (doskonalsze) medium, tym bardziej prymitywne,błahe i bezużyteczne wiadomości są przy jego pomocy przekazywane” - S. Lem (Gazeta Wyborcza,lipiec 2011). Zapewniam, że starałem się pamiętać o tej złośliwie przenikliwej uwadze ... .

6. Nie należy tych zapisków traktować ze śmiertelną powagą. To tylko rodzaj zabawy (inte-lektualnej - jeśli mogę nieskromnie dodać), rezultat subiektywnych doświadczeń a nie dogłębnych,obiektywnych i niesłychanie wnikliwych studiów nad podstawami matematyki.

O roli wątpienia

1. Kartezjusz14 „Rozprawa o metodzie”:

Poznanie zaczyna się od wątpienia15. „Dawno już dostrzegłem, że (...) zachodzi czasem potrze-ba, by dać się wieść mniemaniom, o których wiemy, że są bardzo niepewne (...); ponieważ jednakwówczas pragnąłem oddać sią wyłącznie poszukiwaniom prawdy, pomyślałem, że należało postąpićwręcz przeciwnie i odrzucić jako bezwzględnie fałszywe wszystko, co do czego mógłbym sobie wy-obrazić najlżejszą nawet wątpliwość, aby zobaczyć, czy potem nie zostałoby w zespole mych wierzeńnic takiego, co by było całkowicie niewątpliwe. Tak więc (...) zamierzałem przyjąć, że nie istniejeani jedna rzecz, która by była taką, jaką wydaje nam się za ich sprawą. Ponieważ zaś są ludzie,którym się zdarza, że mylą się (...) , to sądząc, iż tak jak każdy inny byłem podatny omyłkom,odrzuciłem jako błędne wszystkie racje, które brałem poprzednio za dowody.”

2. O. Tilmann Pesch SI, „Chrześcijańska filozofia życia”. Wydanie drugie. Kraków, 1930 (tekstznaleziony w internecie),

„Jednym z najsilniejszych dowodów słabości ludzkiego rozumu jest (...) mania powątpiewania,która jak niebezpieczna choroba grozi wszystkim myślącym. Nierozumne powątpiewanie pochodzitak samo ze słabości ducha, jak nierozumna łatwowierność. Człowiek zarażony tą chorobą, jestniezadowolony z tego, co na pewno wiemy. A ponieważ tyle jest rzeczy, których umysł ludzki niemoże do gruntu zbadać, chciałby i te nieliczne pewne rzeczy usunąć, aby mógł o wszystkim wątpić.(...) wątpienie pochodzące ze sceptycyzmu prowadzi do wolnodumstwa; gdyż polega na niechęci dowszelkich przekonań. Wolnodumstwo rodzi się z dążności do umysłowej niesforności, z usposobienialekkomyślnego, nie lubiącego obowiązków, dlatego swawola i wolnodumstwo tak ściśle ze sobą sięłączą. Wątpienie jest wtedy nierozumne, kiedy się wątpi w te prawdy, do których przyjęcia sąwystarczające powody.

Gdzie jest przyczyna tej wadliwej skłonności do powątpiewania? Zawsze albo w słabości ducha,albo w namiętności. Pierwsza prowadzi do gnuśnej bezmyślności i obojętności, a druga kryje siępoza fałszywym wyobrażeniem o istocie i zadaniu nauki.”

I jeszcze jedno zdanie tegoż Autora:„Matematyczną pewność spotykamy tylko w matematyce; czyż dlatego wszystko inne ma być

niepewne?”

Zamiast komentarza, takie oto poruszające wyznanie Bertranda Russella16:

14Kartezjusz ( Rene Descartes, 1596 - 1650) – francuski filozof, matematyk i fizyk.15Najlepsi studenci to ci, którzy nie przyjmują do wiadomości, że „Słowacki wielkim poetą był”.16Bertrand Arthur William Russell (1872-1970) – angielski arystokrata, logik, matematyk, filozof. Laureat Nagrody

Nobla w dziedzinie literatury (1950).

Page 9: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

SPIS TREŚCI 8

Pożądałem pewności, jak ludzie pożądają religijnej wiary. Sądziłem, że łatwiej znaleźć pewnośćw matematyce niż gdziekolwiek indziej. Odkryłem wszakże, że liczne matematyczne dowody (...)pełne były zwodniczych argumentów i że, o ile pewność daje się w matematyce odkryć, powinnabyć ona w jakieś nowej dziedzinie matematyki. (...) Jednakże w miarę postępów w pracy staleprzypominałem sobie bajkę o słoniu i żółwiu. Skonstruowawszy słonia, na którym matematykamogłaby się opierać, zauważyłem, że się on chwieje. Przystąpiłem zatem do skonstruowania żółwia,by powstrzymywał przed upadkiem słonia. Ale i żółw nie był pewniejszy i po dwudziestu latachwysiłków doszedłem do przekonania, że niczego więcej dla zapewnienia matematyce pewności niepotrafię zrobić”17.

Czy poukładałem matematykę? Nie sądzę.

„Niels Bohr (...) uczestniczył kiedyś w konferencji filozofów - pozytywistów. Wygłosił tam odczyt onajnowszych postępach mechaniki kwantowej. Następnego dnia był... powiedzmy, w złym humorze; naj-widoczniej konferencja nie przypadła mu do gustu. Gdy zapytaliśmy go, dlaczego, odparł: „Ależ oniwszyscy zgadzają się ze mną! Gdy ktoś po raz pierwszy słyszy o teorii kwantów i nie budzi to w nimgłębokiego sprzeciwu, to znaczy, że niczego nie zrozumiał”. [124]

17Bertrand Russell , „Portraits from Memory”

Page 10: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 1

Liczby naturalne

Co Pan uważa za główne zadanie matematyków?Dostrzec, które twierdzenia są ciekawe.

K. Godel [31]

Zdarza się, że opracowania przedstawiające problemy leżące u podstaw matematyki rozpoczynają się odprezentacji teorii mnogości. Radzę porzucić taką lekturę. Cantorowska teoria zbiorów ze swoją stukilku-dziesięcioletnią historią to ledwie jeden z rozdziałów matematyki. Wspaniały, zgoda. Ale ogląd matematy-ki przez pryzmat teorii mnogości jest ex definitione zawężony1. Jeśli tak widzimy matematykę, to trudnodyskutować o jej podstawowych problemach. Można jedynie rozmawiać o problemach teorii mnogości.Lepiej zacząć budować zrozumienie matematyki od tego, co było w niej zawsze. Od liczb naturalnych.

1.1 Liczba naturalna - co to jest?

Natural numbers were made by God; all elsebeing the works of Man.

L. Kronecker2

Liczby naturalne to najprostszy zbiór liczbowy i zarazem fundament konstrukcji większychzbiorów liczbowych - liczb całkowitych, wymiernych, itd. To jądro matematyki.

Stwierdzenie Kroneckera, sformułowane zapewne w okresie jego sporu z Cantorem, winniśmydziś odczytać tak: „liczby naturalne są dobrem powszechnym. Są wytworem cywilizacji stworzonymprzez wszystkich dla wszystkich. Reszta jest dziełem... matematyków”.

Liczby naturalne zostały utworzone, bo były potrzebne. By panować nad rzeczywistością, musimyumieć nazywać rzeczy i zjawiska. „Man gave names to all the animals, in the beginning” - pisał(śpiewał) Bob Dylan. G.G. Marquez w „Stu latach samotności” napisał jeszcze piękniej: „Światbył jeszcze tak młody, że wiele rzeczy nie miało nazwy i mówiąc o nich trzeba było wskazywać jepalcem”. Zdolnosc do tworzenia nazw nie tylko indywiduowych, ale i takich, które obejmują klasyobiektów wyróżnionych w procesie abstrakcji3, to podstawowa cecha umysłowości człowieka.

Człowiek stworzył liczby naturalne bo potrzebował uniwersalnego systemu nazw. Na czym po-lega ta uniwersalność?Nazwy-liczby nie nawiązują w żaden sposób do fizycznych cech nazywanych (numerowanych) przed-miotów. Możemy nazywać-numerować elementy dowolnej skończonej kolekcji, niezależnie od cha-rakteru jej elementów. To sprawiło, że człowiek zaczął posługiwać się abstrakcyjnym pojęciem „li-czebności zbioru”. Zaczął porównywać zbiory fizycznie nieporównywalne. Dzięki temu jeden władca

1„Jednym z bardziej szokujących faktów jest to, że wszystko w matematyce można sprowadzić do zbioru” (internet- (jabba.pl/hyperreal/klucz/teoria-mnogości). Straszne są skutki edukacji matematycznej opartej na jedynie słusznejteorii mnogości...

2Leopold Kronecker, matematyk niemiecki (1823-91). Wielki i nieprzejednany oponent Cantora.3Abstrahować - pomijać pewne cechy, sprawy na rzecz innych (...) - słownik W. Kopalińskiego.

9

Page 11: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 1. LICZBY NATURALNE 10

mógł powiedzieć do drugiego satrapy (chcąc go pognębić): „mam więcej żon niż ty wojowników”. Ibyło to stwierdzenie, które można było weryfikować.Ten zasób nazw jest niewyczerpywalny. Liczb naturalnych jest wystarczająco wiele, by za ich po-mocą nazywać-numerować wszystko, co spotkamy w otaczającym nas świecie.

I wreszcie, te liczby to nie tylko zasób, ale uporządkowany liniowo system nazw. Z każdą liczbą-nazwą związany jest jej następnik - „dwa - trzy” „sto - sto jeden”... . Dlatego nazywanie-numerowanieelementów dowolnej kolekcji oznacza automatycznie jej uporządkowanie, ustalenie kolejności4.

Liczby naturalne są uniwersalnym systemem zliczania i kolejkowania5.

Zliczanie i kolejkowanie to procesy - czynności dziejące się w czasie. Dlatego myślący czło-wiek wpadł na pomysł by wykorzystać liczby naturalne do (dyskretnego) skalowania czasu. A tokonieczne by próbować zrozumieć dziejące się wokół procesy i planować działania. Kto nie znadziecięcego „Raz, dwa, trzy,..., piętnaście - szukam!”? Dzięki temu umownemu skalowaniu czasuchowający się wiedzą, ile mają czasu na znalezienie kryjówki a szukający może określić graniceobszaru poszukiwań.

Odpowiedź na pytanie „do czego są potrzebne liczby naturalne?” jest ważniejsza niż rozważania o tym,„co to jest liczba naturalna?” Poza matematyką liczba jest narzędziem opisu rzeczy a nie rzeczą. Jestnośnikiem informacji6..

Liczby naturalne nie należą do matematyków. Są dobrem powszechnym. Każdy człowiek wwieku powyżej trzech lat łatwo wskaże kolekcje złożone z dwóch, trzech, itd. elementów, znajdującw tym oparcie dla swego wyobrażenia o liczbach. A pytany „cóż to jest liczba trzy?” ograniczy siędo takiego wskazania, nie siląc się na formułowanie definicji. I ma rację.

To jest sens stwierdzenia Kroneckera.Ten pogląd podzielał D. Hilbert7 który mówił, że - w odróżnieniu od innych pojęć matematycznych -„liczby naturalne są obecne w naszej intuicji”. Podobnie myślał Poincare8:„the structure of naturalnumbers and the associated principle of induction are given in intuition and do not require afoundation; indeed, in his view, they are presupposed in any attempt at such a foundation” [39].

„Uniwersalny, uporządkowany i niewyczerpywalny system nazw” to jeden z najbardziej uda-nych pomysłów człowieka. Liczby naturalne są obecne w każdej kulturze, są elementem każdegojęzyka. Wraz z postępem cywilizacyjnym rósł zakres ich zastosowań9. Jednym z najwcześniejszychprzełomowych momentów była działalność Pitagorasa i jego ucznów, którzy skojarzyli arytmety-kę z geometrią i zaczęli używać liczb do badania obiektów geometrycznych, do opisu rezlutatów

4Używając języka mainstreamowej matematyki: liczby naturalne to zbiór dobrze uporządkowany.5Ta podwójna rola liczb naturalnych została odwzorowana w teorii mnogości: liczby natutralne to jednocześnie

najprostsze liczby kardynalne (zliczanie) i liczby porządkowe (kolejkowanie). W gramatyce języka polskiego mówimyo liczebnikach głównych i porządkowych. A kognitywiści mówią o kardynalnym i porządkowym aspekcie liczb [14].

6„Jeden, dwa, trzy...” to liczebniki a nie rzeczowniki.7David Hilbert (1862 - 1943) - genialny matematyk niemiecki. To jeden z głównych bohaterów tego tekstu.8Jules H. Poincare (1854- 1912).9Dziś trudno sobie wyobrazić, jak ważny był wynalazek zera. „Zero” nie jest tak intuicyjnie oczywiste jak inne

liczby naturalne. Nawet twórcy Europy, Rzymianie go nie znali. A stało się to w Indiach około V wieku naszej ery.Był sobie raz. Wymyślił zero.W kraju niepewnym. Pod gwiazdą

dziś może ciemną. Pomiędzy datami,na które któż przysięgnie. Bez imienianawet spornego. Nie pozostawiającponiżej swego zera żadnej myśli złotejo życiu, które jest jak. Ani legendy,że dnia pewnego do zerwanej różyzero dopisał i związał je w bukiet.Że kiedy miał umierać, odjechał w pustynię

na stugarbnym wielbłądzie. Że zasnął

w cieniu palmy pierwszeństwa. Że się zbudzi,kiedy już wszystko zostanie przeliczoneaż do ziarenka piasku. Cóż za człowiek.Szczeliną między faktem a zmyśleniemuszedł naszej uwagi. Odpornyna każdy los. Strąca ze siebiekażdą, jaką mu daję, postać.Cisza zrosła się nad nim, bez blizny po głosie.Nieobecność przybrała wygląd horyzontu.Zero pisze się samo.

W. Szymborska, „Wiersz ku czci”:

Page 12: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 1. LICZBY NATURALNE 11

mierzenia odległości i ich porównywania10.

1.1.1 Liczby naturalne w teorii mnogości

Liczba staje się rzeczą gdy czynimy ją przedmiotem badań. Dlatego liczba jest obiektem (rzeczą)w matematyce.Język teorii mnogości - w zamierzeniu jej twórców - miał objąć wszystkie rodzaje matematycznejaktywności. Dlatego teoria mnogości musiała zaproponować własną definicję liczb naturalnych.

Teoria mnogości odrzuca wszelkie pre-intuicje. Poza jedną - jedynym pierwotnym pojęciem teorii mnogościjest „zbiór”11. Dlatego liczby naturalne musiały być zdefiniowane w tej teorii jako pojęcie wtórne, poprzezodwołanie do tego jedynego pojęcia podstawowego.

Popatrzmy jak to zrobiono. Jedem z aksjomatów ZFC12 to postulat istnienia zbioru induktywnego:

„Zbiór A jest induktywny, jeżeli zawiera zbiór pusty i wraz z każdym zbiorem B zawiera zbiórB ∪ B.13

Zbiór liczb naturalnych N to najmniejszy zbiór induktywny14. Jego pierwszym elemen-tem - zerem - jest zbiór pusty ∅. Jedynką - zbiór ∅. Dwójką - zbiór ∅, ∅.Następnikiem dowolnego zbioru-liczby A ∈ N jest zbiór A ∪ A.

Niech to nie umknie naszej uwadze: pojęciem definiowanym jest zbiór liczb naturalnych. Same liczbysą „tylko” elementami tego zbioru. I też są zbiorami.Liczba abdykowała na rzecz zbioru15..

To nie jest miła definicja. Jaki pożytek ze stwierdzenia, że liczba to zbiór? Przecież to w żadensposób nie pomaga zrozumieć dlaczego 2 + 2 = 4... .

∅, ∅+ ∅, ∅ ?= ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅, ∅,

Nie w tym rzecz. Ta teoriomnogościowa definicja to element języka metaarytmetyki. Nie ma służyćprowadzeniu obliczeń, ale badaniu własności tych obliczeń. Nie ma ułatwiać obliczenia, że 3+4 = 7, ale ma pomóc np. zrozumieć (uprawomocnić?) zasadę indukcji matematycznej16.

To pierwsze to rachunki, to drugie to matematyka.

10Pitagorejczycy byli tak zachwyceni swoim pomysłem, że popadli w przesadę. Uznali, że istotne w rzeczach jesttylko to, co można wyrazić za pomocą liczb. Wyróżniamy te obiekty przestrzenne (i nazywamy geometrycznymi), którecharakteryzuje pewna doskonałość stosunków liczbowych - trójkąt (równoboczny), kwadrat, koło, kula. Zdumienimożliwościami jaki dawał taki opis świata uznali, że ten „liczbowy ład” nie jest przez nich kreowany ale odkrywany.Jest zasadą organizującą rzeczywistość. To stało się paradygmatem ich oglądu świata - doszukiwać się we wszystkim„ładu liczbowego i geometrycznego”. Dlatego np. Ziemia - centrum ich wszechświata - winna być kulą. „Sens istnieniaczłowieka polega na poszukiwaniu harmonii, którą się utrzymuje wszystko, nie wyłączając bogów” [62]

11Pojęcie pierwotne danej teorii to takie, które nie jest w niej definiowane (np. punkt w geometrii).12ZFC - aksjomaty teorii mnogości Zermelo-Fraenkla wraz z pewnikiem wyboru. Będę często pisał „teoria ZFC”

zamiast „teoria mnogości”.13B to oznaczenie zbioru, którego jedynym elementem jest zbiór B. Teoria mnogości tak ma. Musisz się z tym

pogodzić i zrozumieć, że np. zbiór pusty ∅ to nie to samo co ∅.14Nazywany też modelem von Neumanna lub modelem standardowym arytmetyki.15„(...) starting from ZFC each mathematical entity, in particular each natural number, is some set. From a formal

point of view the latter has the advantage that there is just one primitive notion, but (...) why numbers should besets (in formalistic mathematics after the natural numbers come to life in the form of sets, this fact is concealed assoon as possible)? Moreover, aren’t we presupposing at least the order of the natural numbers already when writingdown axioms by means of suitable symbols? - J. Ponstain, Nonstandard Analisys (internet)

16Teoriomnogościowe sformułowanie zasady indukcji wygląda tak: jeśli podzbiór A ⊆ N zawiera zbiór pusty i wrazz każdym zbiorem B zawiera zbiór B ∪ B to A = N. Pomyśl: skoro N to najmniejszy zbiór induktywny, to każdyinduktywny zbiór w nim zawarty musi mu być równy. Więcej w rozdziale „Arytmetyka”.

Page 13: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 1. LICZBY NATURALNE 12

1.2 Nieskończoność potencjalna czy aktualna?

Gdyby oczyścić drzwi percepcji, każda rzecz ja-wiłaby się taka, jaka jest: nieskończona.

W. Blake17

The existence of ... infinite object? Show meone and I will then show you a cuple of angelsengaged in the ”macarena” on the head ofthe pin [112]

.

Zasób uniwersalnych nazw - liczb naturalnych - jest niewyczerpywalny. Nie jest skończony.Teoriomnogościowcy idą krok dalej: mówią, że definiowany w teorii mnogości zbiór liczb naturalnychjest zbiorem nieskończonym.

Stwierdzenie, że „liczby naturalne nie tworzą zbioru skończonego” nie musi oznaczać, że tworzą one zbiórnieskończony. Ale teoriomnogościowcy, nie akceptujący niczego co nie jest zbiorem, musieli uznać, żeliczby naturalne tworzą inny rodzaj zbioru - zbiór nieskończony.

Pytanie o nieskończoność to nie problem wyłącznie matematyczny. To jedno z fundamentalnychpytań człowieka myślącego. Każdy kiedyś przeżył to szczególne uczucie, jakie budzi ogrom i fizyczneniemal odczucie nieskończoności rozgwieżdżonego nieba i świadomość „bycia cząstką kosmosu”.... Nieskończoność fascynuje. Czy wszechświat jest nieskończony? Czy czas jest nieskończony? 18

To kontrapunkt dla naszej egzystencji zdeterminowanej przez skończoność. Niepogodzeni, chętniewierzymy w nieskończoność czasu i przestrzeni. Jako rodzaj absolutu nieskończoność jest obecna wniemal każdej religii, gdzie obietnica nieskończonego istnienia jest największą wartością.

Jest jednak przepaść między uzasadnioną psychologicznie potrzebą odniesienia się do nieskoń-czoności a świadomą akceptacją jej istnienia. Wbrew temu, że to pojęcie nie ma żadnego desygnatuw fizycznej czasoprzestrzeni.

Nieskończoność... ale jaka? Ciut upraszczając można powiedzieć, że spór o nieskończoność tościeranie się dwóch koncepcji ukształtowanych i dyskutowanych zawzięcie już w starożytności.

Arystoteles19 uważał, że istnieje tylko nieskończoność potencjalna. „Nieskończoność istnieje wten sposób, że jedna rzecz występuje zawsze po drugiej i każda rzecz tego ciągu jest skończona izawsze różna” (...) Nieskończoność jest przeciwieństwem tego, co się tak zazwyczaj określa. Nie tobowiem jest nieskończone, co już nie ma niczego poza sobą lecz właśnie to, co zawsze ma coś pozasobą” (Arystoteles, Fizyka)20.Stanowisko przeciwne to uznanie istnienia nieskończoności aktualnej, akceptacja „bytów nieskoń-czonych”. Arystotelesowska nieskończoność potencjalna to teraz tylko próba poznania „właściwej”nieskończoności.

Liczby naturalne postrzegane jako niewyczerpywalny zasób nazw to nieskończoność potencjalna.Definiowany w teorii mnogości zbiór liczb naturalnych jest zbiorem aktualnie nieskończonym.„Nieskończoność potencjalna oznacza nieograniczoną zdolność umysłu do konstruowania obiektów. W tymujęciu sama nieskończoność nie jest obiektem podlegającym operacjom matematycznym, alewyłącznie źródłem tych obiektów.Nieskończoność aktualna charakteryzuje się tym, że sama jest obiektem podlegającym rozmaitym opera-cjom” [44].

Uznanie nieskończoności aktualnej w matematyce teoriomnogościowej oznacza, że staje się ona

17Willam („Mad”) Blake (1757-1827)- poeta i mistyk angielski. Ten cytat to ukłon w stronę tych, którzy wiedzą,czym była grupa „The Doors”.

186 sierpnia 2011 roku zmarł polski malarz-konceptualista, Roman Opałka, który od 1965 roku tworzył cykl „Opałka1965/1 - ∞”. A ten cykl to wypisywanie na obrazach kolejnych liczb naturalnych...„Jestem przejęty czasem i jegoupływem. Idea malowania czasu stała się moim programem, który zostanie zakończony wraz z moją śmiercią.” .

19Arystoteles, (384 p.n.e.- 322 p.n.e.) – jeden z trzech, obok Platona i Sokratesa, najważniejszych filozofów greckich.20Jeszcze jeden cytat z tego dzieła:„Now, ‘to be’ means either ‘to be potentially’ or ‘to be actually’, and a thing

may be infinite either by addition or by division. I have argued that no actual magnitude can be infinite, but it canstill be infinitely divisible (it is not hard to disprove the idea that there are indivisible lines), and we are left withthings being infinite potentially” (cytuję za [63])

Page 14: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 1. LICZBY NATURALNE 13

przedmiotem badań. Jest bytem i może być źródłem (osnową) innych bytów. Zgodzono się też -nieco bezkrytycznie - że w świecie zbiorów nieskończonych obowiązuje większość praw, których do-świadczamy w świecie obiektów (zbiorów) skończonych. Na przykład zgodzono się, że wolno mówićo „zbiorze wszystkich podzbiorów zbioru liczb naturalnych” tak samo jak o zbiorze podzbiorówzbioru sześcioelementowego... . Wolno, ale trzeba pamiętać, że to jedynie apriorycznie przyjętezałożenie a nie fakt, który można w jakikolwiek sposób potwierdzić.

Teoria mnogości nie tylko akceptuje, ale wręcz afirmuje nieskończoność aktualną. E. Zermelonazywał matematykę „logiką nieskończoności”. Ta teoria odwraca relację między skończonościąa nieskończonością: początkujący adept matematyki dowiaduje się, że „zbiór skończony to taki,który nie jest nieskończony”. Skołowany nie pyta, czy to jest zgodne z intuicją skończoności, czynp. tak rozumiany skończony zbiór można opróżnić w skończonym czasie poprzez wyjmowaniepojedynczych elementów?21

Dzielenie włosa na czworo? Tak to wygląda z dzisiejszej perspektywy. Ale przed Cantorem nieskoń-czoność aktualna wcale nie dominowała w matematyce. W starożytnej Grecji wręcz jej unikano:„Nieskończoności (aktualnej - GJ) unikano zarówno w filozofii jak i geometrii. Rozważania matema-tyczne, w których (...) pojawiała się nieskończoność, prowadziły do paradoksów i różnego rodzajuaporii (trudności). Dlatego w miarę możliwości eliminowano z matematyki wszelkie takie „podej-rzane” sytuacje. Jeśli przyjrzymy się dokładnie „Elementom”, to zauważymy, że nieskończonośćjest z nich wyeliminowana całkowicie. Linia prosta jest ograniczona - kończy się punktami (...)”22.

Oto jedna z takich podejrzanych sytuacji:„Czy Achilles dogoni żółwia, od którego dzieli go (skończony) dystans D? Achilles biega dziesięćrazy szybciej i dlatego musi dogonić żółwia - tak nam się zdaje. Ale gdy Achilles, przebiegniedystans D, to żółw przeczłapie jedną dziesiątą tego dystansu i odległość między nimi będzie wtedyrówna 1

10D. Gdy Achilles przebiegnie dystans równy tej nowej odległości, to też nie dogoni żówia,bo on w tym czasie oddali się na odległość równą 1

100D. I tak dalej, w nieskończoność... . Dystansmiędzy Achillesem i żółwiem będzie coraz mniejszy, ale Achilles nigdy nie dogoni żółwia...”.To jeden z paradoksów Zenona z Elei23. Są dwa powody zamieszania wokół tej opowiastki, obazwiązane z nieskończonością aktualną. Pierwszy to założenie, że możliwe jest nieskończone dzielenieskończonego odcinka - dystansu w rzeczywistej przestrzeni. Grecy tego nie wiedzieli, ale my wiemy(powinniśmy wiedzieć), że „jeżeli będziemy wciąż zmniejszać odległość między dwoma punktami,to w pewnym momencie dosięgniemy tak małej skali, że samo pojęcie odległości straci swójzwykły sens”24. Ten sens utracimy szybciej, niż się zdaje: jeśli, dla przykładu, pierwotna odległośćmiędzy Achillesem a żółwiem to jeden kilometr, to już przy 13-15 pomiarze odległości będziemyoperowali wielkościami porównywalnymi ze średnicą atomu wodoru...

Paradoks Zenona nie dotyczy rzeczywistości, ale jej modelowania matematycznego. Opowieść o gonitwiez żółwiem jest tylko bajką dla ludu25.

Drugi powód zamieszania to przekonanie, że nieskończone sumowanie skończonych wielkości(odcinków drogi, czasu) musi dać wynik nieskończony26. Zatem jeśli Achilles dogoni żółwia, to

21Może i lepiej, bo to pytanie byłoby nielichym kłopotem dla wielu wykładowców. A wprowadzenie wykładowcy wzakłopotanie może (musi) oznaczać kłopoty ... . Szanowny studencie, masz rację: tego nie można dowieść! Wykażemyto, gdy będzie tu mowa o twierdzeniu Łosia.

22M.Heller, Z.Pogoda: „Geometria i kosmologia - historia wzajemnych związków” - http://www.msn.ap.siedlce.pl/smp/msn/3/27-31.pdf. Przywołane tu „Elementy” to słynne dzieło Euklidesa (ok. 365 r. p.n.e. - ok. 300 r. p.n.e.)..To szczególne poczucie bezradności starożytnych Greków określane jest mianem „horror infinity” - strach przednieskończonością. Niektórzy przypisują autorstwo tego określenia Cantorowi.

23Zenon z Elei ( ok. 490 p.n.e. - ok. 430 p.n.e.), filozof grecki.24R. Penrose, „Nowy umysł cesarza”. Penrose nawiązuje tu do osiągnięć fizyki kwantowej, a w szczególności do

zasady nieoznaczoności Heisenberga.25Nic w tym dziwnego: wszak i dziś od wykładowców akademickich wymaga się, by mówili „łatwo i przystępnie”...26Prawo Archimedesa mówi, że dla dowolnych dodatnich liczb rzeczywistych a < b pewna wielokrotność a jest więk-

sza od b. W skończonym sumowaniu można osiągnąć dowolnie dużą wielkość. Stąd zdaje się wynikać, że nieskończone

Page 15: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 1. LICZBY NATURALNE 14

tylko po nieskończenie długiej pogoni, czyli nigdy. Współczesna matematyka temu przeczy - dziśjuż wiemy, że „suma nieskończonej ilości skończonych liczb” może być liczbą skończoną27. Sumazbieżnego szeregu liczb to wielkość graniczna, do której zmierzają sumy coraz to większej liczbypoczątkowych wyrazów takiego szeregu. Nazywanie tej liczby „sumą nieskończonej ilości liczb” totylko „figura retoryczna” jak mówił Gauss. Teoria szeregów i jej wyniki usprawiedliwiają takiemodelowanie czasoprzestrzeni, w którym dopuszczalne są nieskończone podziały.

Tak matematyka rozwiązała problem, który sama wykreowała.

Jednak to nie Cantor był pionierem uznania nieskończoności aktualnej w matematyce. Pięćsetlat wcześniej Mikołaj z Kuzy głosił: „wszystko, co skończone, ma swe źródło w zasadzie nieskończo-ności” [34]28. Już Bolzano wskazywał zbiory, dla których można ustalić wzajemnie jednoznacznąodpowiedniość między elementami tych zbiorów a elementami ich istotnie mniejszych podzbiorów(co dziś jest - w teorii mnogości - wyróżnikiem zbiorów nieskończonych)29. Ale to Cantor uczyniłnieskończoność aktualną centralnym pojęciem matematyki i przeciął węzeł gordyjski odwiecznychsporów o nieskończoność.

Uznanie nieskończoności aktualnej w matematyce nie było oczywistością. Była to świadomadecyzja twórców teorii mnogości a w szczególności Cantora. To rewolucja, akt intelektualnej odwagi,porównywalny z rewolucją kopernikańską30. Zdominowało matematykę XX wieku.

„Nikt nas nie wygna z raju, który stworzył Cantor” - D. Hilbert31.

Puenta

Czy dyskusja o nieskończoności może mieć puentę?

Spór o nieskończoność nie zawsze był dyskusją szanujących się wzajemnie adwersarzy. Kiedy w XV wiekuMikołaj z Kuzy zaczął głosić, że wszechświat jest nieskończony, Kościół szybko przystąpił do kontrofen-sywy. Jej ofiarą stał się Giordano Bruno, wyznawca poglądu o nieskończoności wszechświata. Pogląd ten(wraz z innymi głoszonymi przez niego) uznano za herezję. G. Bruno został uwięziony, torturowany przezdługie lata i spalony na stosie w 1600 roku...

sumowanie musi nas doprowadzić do nieskończności. Ale ten wniosek jest nieuprawniony.27Drogi przebyte przez Achillesa i żółwia, do momentu n-tego pomiaru, opisuje nierówność

(Σnk=01

10k)D < D + (Σnk=1

110k

)D

A równość (Σ∞k=01

10k )D = D + (Σ∞k=11

10k )D w której występują „sumy nieskończone” (sumy szeregów) dowodzi, żeAchilles jednak dogoni żółwia po skończonym czasie, gdyż nieskończona suma „odcinków czasowych” Σ∞k=1

110k jest

skończona i równa 109 czasu, który Achilles zużył do przebiegnięcia dystansu D.

28Umberto Eco w [30] pisał: „Wraz z Kuzańczykiem (Mikołaj z Kuzy, a właściwie: Nicolaus Krebs (1401-1464),filozof i teolog niemiecki - GJ) zarysowuje się wyobrażenie wszechświata jako otwartego w nieskończoność mającegośrodek wszędzie a obwód nigdzie (...) Gdy wydłuża się tedy średnica okręgu maleje jego krzywizna: nieskończonyobwód staje się nieskończoną prostą: w Bogu zbiegają się wszelkie przeciwieństwa”.

29Przyporządkowując każdej liczbie naturalnej n liczbę 2 · n ustalamy wzajemnie jednoznaczną odpowiedniośćmiędzy zbiorem wszystkich liczb naturalnychN i zbiorem liczb parzystych 2N. Te zbiory mają „tyle samo” elementów- są - równoliczne - choć w sposób oczywisty 2N jest podzbiorem N istotnie od niego mniejszym.

30Nie jest prawdą, że idee Cantora uzyskały powszechną i natychmiastową akceptację. W rzeczywistości Cantor niedoczekał się należnego mu uznania. To było jedna z przyczyn załamania się jego działalności naukowej już ok. czter-dziestego roku życia (Cantor żył 73 lata). Towarzyszyły temu depresje związane m.in. z niemożnością rozstrzygnięciahipotezy continuum (o czym jeszcze coś tu powiemy).

31Hilbert spoke of Cantor’s set theory as one of the most beautiful creations of the human intellect, and theContinuum Hypothesis as one of the most fundamental questions in mathematics” [23].

Page 16: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 2

Nieskończoność kontrolowana

„Nie o to chodzi, by złowić króliczka, ale by gonić go...”

Agnieszka Osiecka

Czy nieskończoność aktualna jest konieczna? Czy jest alternatywa dla raju Cantora? Czy ma-tematyka potrafi modelować nieskończoność potencjalną?

Mówiąc „zbiór liczb naturalnych” traktujemy wszystkie liczby w sposób równouprawniony. Aprzecież B. Russell zatytułował rozdział w [96] poświęcony liczbom naturalnym nie „zbiór...” a „ciągliczb naturalnych”. A G. Mannoury już w 1909 roku wskazywał na pułapkę ukrytą w stwierdzeniuże np. liczba 3 to taka sama liczba jak 999

. Skończoność to więcej niż kosmos1.

Niektórzy matematycy gotowi są utożsamiać skończoność obiektu matematycznego z jego try-wialnością. Być może ogłoszenie w 1976 roku komputerowego rozwiązania problemu czterech barwskłoniło część z nich do rewizji poglądów2. Ale nie wywołało rewolucji.

Osią sporu między zwolennikami nieskończoności aktualnej i potencjalnej jest stosunek do roli czasu wkreacji obiektów matematycznych. Teoria mnogości jako spadkobierczyni platonizmu pojmuje obiektymatematyczne jako wieczne i niezmienne w czasie. Rozszerzając świat platońskich idei o nowy byt -nieskończoność - musiała przyjąć, że jest to nieskończoność aktualna.Dla konstruktywistów - zwolenników nieskończoności potencjalnej - kreacja to konstrukcja, proces prze-biegający w czasie. Każda liczba naturalna powstaje z zera w wyniku skończonego procesu. A wtedyliczba 3 zaczyna się różnić od 99

9- jest łatwiej dostępna3.

Skoro każdy rodzaj bytu może być wyróżniony bądź jako potencjalny bądź jako w pełni urze-czywistniony, wobec tego urzeczywistnianie bytu potencjalnego jako takiego będzie właśnieruchem” - Arystoteles, Fizyka, Ks. III. Minęlo ponad dwa tysiące lat i M.Atiyah4 napisał tak: Wstatycznym wszechświecie nie można sobie wyobrazić algebry, ale geometria jest zasadniczo statycz-na. Mogę tu siedzieć i patrzeć i nic się może nie zmieniać, a mimo to mogę widzieć. Algebra wszakżema do czynienia z czasem, ponieważ jej operacje trzeba wykonywać kolejno (...). Każdy algorytm,każdy proces rachunkowy, jest ciągiem kroków wykonywanych jeden po drugim. Współczesny kom-puter wyraźnie to nam uświadamia (...). Algebra dotyczy manipulacji w czasie, a geometria dotyczyprzestrzeni. Są to dwa ortogonalne aspekty świata, przedstawiające dwa różne punkty widzenia na

0Gerrit Mannoury (1867 - 1956) matematyk i filozof holenderski, którego uczniem był Brouwer.1It should be pointed out that already here an element of idealization enters. We regard 5, 1000 and 101010 as

objects of ”the same sort” though our mental picture in each of these cases is different: we can grasp” five” immediatelyas a collection of units, while on the other hand 101010 can only be handled via the notion of exponentiation [121]Liczbę atomów we wszechświecie szacuje się na 6 · 1078. Co robię, gdy piszę „dodajmy liczbę 1 do 1097” ???.

2Czy każdą mapę można pokolorować za pomocą czterech barw tak, by sąsiadujące państwa (mające wspólną,ale nie jednopunktową, granicę) nie miały tego samego koloru? Komputerowy dowód potwierdzający taką możliwośćpolegał na rozpatrzeniu prawie 2000 różnych możliwych przypadków.

3Terminy „następnik”, „poprzednik” używane w opisie struktury liczb naturalnych zdradzają pierwotny związektego systemu nazw z czasem.

4Michael F. Atiyah (ur. 1929) – matematyk brytyjski, laureat medalu Fieldsa w 1966 roku.

15

Page 17: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 16

matematykę. Czas jest czymś, co istnieje w algebrze, a nie istnieje w geometrii.” [2]

Te „dwa ortogonalne5 (...) punkty widzenia” teoria mnogości usiłuje opisywać tym samym ję-zykiem, którego pierwotnym pojęciem jest statyczny „zbiór”. W konsekwencji te dwa „aspektymatematyki ” nie są w mainstreamowej matematyce równouprawnione. Nieco zmieniając zakoń-czenie wypowiedzi Atiyaha można powiedzieć, że „czas jest czymś, co istnieje w matematyce, a nieistnieje w teorii mnogości”.6

2.1 Matematyczny konstruktywizm

To know that A is a set is to know how to formthe canonical elements in the set and under whatconditions two canonical elements are equal.

P. Martin-Lof

Czy o liczbach naturalnych można mówić matematycznie, ale inaczej? Można, jeśli tylko uznamyza możliwe uprawianie matematyki poza teorią mnogości.

Martin-Lof7 mówi: „wiedzieć, że A jest zbiorem oznacza, że wiemy jak konstruować (formować,kształtować) jego elementy”. Zbiór jest opisem (specyfikacją) warunków, jakie muszą być spełnionew procesie konstrukcji jego elementów8.

„To form” to czasownik. Formowanie odbywa się w „dyskretnym” czasie, krok po kroku.Spójrzmy oczami Martin-Lofa na konstrukcję liczb naturalnych. Zaczynamy od pojedynczej wielko-ści początkowej - liczby 0. W każdym pojedynczym kroku dodajemy jedną nową wielkość - następ-nik ostatnio skonstruowanej liczby9. Wszystko, co utworzymy w ten sposób w rezultacie dowolniedługiego, ale skończonego ciągu kroków, jest liczbą naturalną. I nic ponad to10.

Zapiszmy reguły tego procesu w sugestywnej formie:

(Nat)0 : N

n : Nsucc(n) : N

Brak licznika w pierwszej regule-ułamku oznacza, że zero - 0 - jest bezwarunkowo liczbą naturalną.A druga reguła mówi, że napis succ(n) jest liczbą o ile jest nią napis n11.

5„Wzajemnie prostopadłe”6Kantowskie rozdzielenie „czasu” i „przestrzeni” zostało zanegowane przez Einsteina w postaci szczególnej teorii

względności, w której pewna współzależność tych pojęć została zrealizowana pod hasłem „czasoprzestrzeń” . Mate-matyczne podstawy tego pojęcia zbudował Minkowski (przestrzeń Minkowskiego”) którego wykładów na politechnicew Zurychu słuchał A. Einstein.

7Per Martin-Lof ( 1942 -) szwedzki logik i filozof. Twórca tzw. intuicjonistycznej teorii typów. Cytat zaczerpnąłemz tekstu wykładu M. Gaboardiego „Martin Lof’s Type Theory: constructive set theory and logical framework”dostępnego w internecie (http://www.cs.unibo.it/ gaboardi/publication/ML types.pdf)

8Aby uniknąć niepożądanych skojarzeń możemy mówić o „typach” zamiast o „zbiorach” rozumiejąc ten termintak, jak współczesna informatyka (a nie jak np. B. Russell).

9n succ(n) = n+ 1.10Dodajmy wartą uwagi wypowiedź H. Curry’ego: A formalist would not speak of „the natural numbers” but ofa set or system of natural numbers. Any system of objects (...) which is generated from a certain initial object by acertain unary operation in such a way that each newly generated object is distinct from all those previously formedand that the process can be continued indefinitely, will do as a set of natural numbers. He may (...) objectify thisprocess by representing the numbers in terms of symbols; he chooses some symbol, let us say a vertical stroke „|”, forthe initial object, and regards the operation as the affixing of another „|” to the right of the given expression. Buthe realizes there are other interpretations; in particular, if one accepts the platonist or intuitionist metaphysics, theirsystems will do perfectly well”. [102].Haskell Curry (1900-1982)- amerykański matematyk i logik. Ciekawostka: język programowania funkcyjnego Haskellzostał tak nazwany właśnie na cześć Curry’ego.

11Takie odczytywanie reguł to intepretacja „z dołu do góry” („backward”) - stwierdzenie zapisane w mianownikujest zasadne o ile zasadna jest przesłanka zapisana w liczniku. Te reguły można też czytać „z góry w dół” („forward”)- „jeżeli przesłanka zapisana w liczniku jest zasadna, to stwierdzenie zapisane w mianowniku jest też zasadne”.

Page 18: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 17

Skutkiem stosowania tych reguł jest kreacja (potencjalnie) nieskończenie wielu obiektów matema-tycznych. Dopiero w drugiej kolejności możemy uznać, że jest nim kreacja pojedynczego obiektu -(aktualnie) nieskończonego zbioru liczb naturalnych. Ale czy musimy?

Poszukiwaczom dziury w całym (wyznawcom teorii mnogości) pytającym o definicję „skończonego ciągukroków” odpowiem: skończoność - w odróżnieniu od nieskończoności - to termin, który jak żaden innyjest związany z istotą naszej egzystencji. Operowanie pojęciem „dowolnie długi, lecz skończony proces”nie może budzić sprzeciwu. Jest intuicyjnie oczywiste.

Skoro tak, to mamy dwie definicje liczb naturalnych. Porównajmy:

definicja teoriomnogościowa1. ∅ ∈ N,2. n ∈ N→ n ∪ n ∈ N,3. N to najmniejszy spośród zbiorów speł-niających warunki 1. i 2.

.

definicja konstruktywna1. 0 ∈ N,2. n ∈ N→ succ(n) ∈ N,3. liczbą naturalną jest to, co potrafimy skon-struować za pomocą reguł 1. i 2. w skończo-nym czasie.

Pomijając kwestię oznaczeń, dwa pierwsze punkty obu definicji mówią to samo. Ale ostatniepunkty są istotnie różne: jeden z nich opisuje zbiór N, drugi mówi o procesie tworzenia liczb.

A jednak spodziewamy się - jesteśmy przekonani (?) - że są to definicje równoważne, opisują tensam obiekt matematyczny. Piszemy

N = ∅, ∅, ∅, ∅, . . .

i mówimy „liczbą naturalną jest zero (zbiór pusty) i wszystko, co z niego skonstruujemy w skoń-czonej liczbie kroków korzystając z operacji A A ∪ A”.Pięknie, ale ... tego się nie da dowieść - w ZFC!12. Dowodliwe jest tylko zawieranie

∅, ∅, ∅, ∅, . . . ⊆ N

choć i to nie jest prawdą! Można tylko pokazać, że każdy z kolejno budowanych zbiorów ∅, ∅, ∅, ∅, . . .należy do N - jest liczbą. To „coś” po lewej stronie symbolu „⊆” wcale nie musi być zbiorem13!

Czym więc są liczby naturalne? Są tym, co uznaliśmy za pierwotną intuicję - uniwersalnym systememnazw. Definicja teoriomnogościowa to tylko ich opis (próba opisu) w specyficznym języku14.

I takie założenie przyjmujemy w tym tekście.

„Formalistycznie pojmowana teoria zbiorów odseparowana jest od wszystkiego co intuicyjne” - pisałvon Neumann15 . Nie sposób posługiwać się teoriomnogościową definicją liczb naturalnych bez tejpierwotnej intuicji. A że przy tej okazji dokonujemy ich nieuprawnionego utożsamienia... . No cóż,nobody’s perfect...16.

12Teoria mnogości nie zna pojęcia „w skończonej liczbie kroków”. Można w niej mówić o „konstruowaniu w nkrokach”, gdzie n to liczba naturalna. Ale czy można konstruować liczby naturalne odwołując się do liczb naturalnych?

13Wbrew przekonaniu 99% studentów teoria zbiorów nie przesądza, że „część zbioru” musi być jego podzbiorem.14Podobnie „konstruowalność w n-krokach, gdzie n to pewna liczba naturalna”, którą posługujemy się w teorii

mnogości, to jedynie teoriomnogościowy odpowiednik (imitacja) „konstruowalności w skończonej liczbie kroków”.Oburzonym ortodoksyjnym teoriomnogościwcom uświadamiam, że nie wszyscy podzielają pogląd o definiowalnościliczb naturalnych w ZFC. W [56] napisano ostrożnie bardzo: „The finite ordinals in the standard model of ZFCresemble the usual natural numbers.” Resemble = być podobnym.

15The meaning of mathematical symbols is not the symbols alone (...). Nor is the meaning of symbols in theinterpretation (...) in terms of set theoretical models(...). Ultimately, mathematical meaning is like everydaymeaning. It is a part of embodied cognition.- [67]. Pewien student (Cambridge Univ.) na stronie internetowej naktórej dyskutowano subtelności cohenowskiego forsingu napisał: „I think that the formality is crucial, but only afteryou have a basic intuitive idea of whats going on. We are humans not computers. Without basic intuition theformality worth nothing.” A Beatelsi mówią o tym po swojemu:Hey Jude, don’t make it bad, take a sad song and make it better. Remember to let her under your skin, then youbegin to make it better. .

16Nobody’s perfect - nie jesteśmy doskonali to ostatnia kwestia filmu „Pół żartem, pół serio”.

Page 19: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 18

2.2 Struktury rekurencyjne

„Recursion is frequently used in mathematics and programmingin the construction of classes of objects and in the definition offunctions and programs. We call the former „recursive datatypes”and the latter „recursive definitions”.

A. Bundy [16]

Najprostsze specyfikacje zbiorów, spełniające warunki określone przez Martin-Lofa, to strukturyrekurencyjne.

Rekurencja17 to mechanizm tworzenia potencjalnie nieskończonych kolekcji. Tak człowiek za-panował nad liczbami naturalnymi. Tak też osiągnął drugi fenomenalny sukces - zaczął zapisywaćto, co mówi, za pomocą słów (nad ustalonym alfabetem)18. Współczesna matematyka opisuje tękonstrukcję tak:

punktem wyjścia - wielkością początkową - jest jedno jedyne słowo puste - ε. Konstruktorówsłów jest tyle, ile liter w alfabecie A: jeżeli a ∈ A a „w” jest wcześniej utworzonym słowem nadalfabetem A, to napis „wa” jest słowem nad alfabetem A.Oznaczając przez A∗ zbiór wszystkich słów utworzonych z liter alfabetu A zapiszemy to tak:

ε ∈ A∗w ∈ A∗

wa ∈ A∗a ∈ A

Jeżeli cokolwiek ma być uznane za fundamentalne dla naszej cywilizacji, to musi tym być zdolność czło-wieka do przekazywania i odbioru informacji kodowanych jako skończone ciągi sygnałów (znaków, liter).

„Bo przecież gdy się dobrze zastanowić, zdumienie człowieka ogarnia, dwadzieścia kilka liter, w innychalfabetach mniej czy więcej, (...) a cały świat, jaki był, jaki jest i jaki będzie”19.

Opiszmy istotę konstrukcyjnych procesów rekurencyjnych za pomocą mało precyzyjnej, ale(mam nadzieję) zrozumiałej quasidefinicji:

Struktura rekurencyjna to para (P,K) w której P to skończony zbiór wielkości początkowych a K- skończony zbiór konstruktorów.Konstruktor k ∈ K przyporządkowuje pewnym, wcześniej skonstruowanym, skończonym ciągomobiektów (Ob1, . . . , Obnk) nowy jednoznacznie określony obiekt k(Ob1, . . . , Obnk).

ObOb ∈ P Ob1, . . . , Obnk

k(Ob1, . . . , Obnk)k ∈ K

Wymagamy też, by konstruktory były rozstrzygalne: byśmy mogli - dla dowolnego konstruktorak ∈ K i każdego ciągu obiektów (Ob1, . . . , Obnk , Ob) - rozstrzygać, czy Ob = k(Ob1, . . . , Obnk).

Podobnie jak wcześniejsze pojęcie „skończonej liczby kroków” tak i przywoływaną teraz „zdolność dorozstrzygania” (czy Ob = k(Ob1, . . . , Obnk) dla pewnych Ob1, . . . , Obnk?) rozumiemy jako przyrodzoną iwzmacnianą przez edukację umiejętność oceny, czy dany obiekt jest tym, czego oczekujemy.20

Do kolekcji wyznaczonej przez taką strukturę włączamy każdy obiekt, który:- jest wielkością początkową ze zbioru P ,

17recurrere (łac.) - przybiec z powrotem. Tworzymy nowe, odwołując się do tego, co stworzyliśmy wcześniej.18Jeśli wśród znaków alfabetu mamy znaki interpunkcyjne i spację, to dowolny tekst jest pojedynczym słowem.

Dodajmy, że litera wcale nie musi być pojedynczym znakiem graficznym. Może być ciągiem znaków (czyli słowemnad innym alfabetem). To rozpowszechniona praktyka, szczególnie w informatyce. Takie litery-słowa to tokeny.

19W. Myśliwski, Ostatnie rozdanie. I jeszcze jedno zdanie z tej książki: „Drugi taki porządek (obok leksykograficz-nego - GJ)to kolejno liczb: jeden, dwa, trzy, cztery i tak dalej. Zastanawiam sie nawet, czy to nie jedyne porządki,którym można jeszcz zaufac”

20Na matematyczną definicję rozstrzygalności przyjdzie czas poźniej.

Page 20: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 19

- można go utworzyć z wielkości początkowych w skończonej liczbie kroków, korzystając zkonstruktorów ze zbioru K 21.

Choć ta definicja nie grzeszy precyzją, to nieźle oddaje sens: na pierwszym planie są narzędziatworzenia. Kolekcja kreowanych obiektów jest wtórna. Ta kolekcja jest potencjalnie nieskoń-czona - w skończonym czasie zbudujemy skończenie wiele elementów tej kolekcji.22.Stwierdzenie: „obiekt należy do kolekcji wyznaczonej przez daną strukturę rekurencyjną” jest we-ryfikowalne: głoszący ten sąd ma obowiązek przedstawić konstrukcję obiektu. A wymóg roz-strzygalności i finitarności konstruktorów sprawia, że każdy może sprawdzić poprawność tej kon-strukcji23.

Relacja przynależności - „∈” - to pojęcie pierwotne matematyki teoriomnogościowej. Wszystko, o czymmówi teoria mnogości (i oparta na niej matematyka) da się wyrazić za pomocą zdań budowanych z dwóchprostych stwierdzeń: „zbiory A i B są równe” - A = B - oraz „zbiór A należy do zbioru B” - A ∈ B.

Pojęcia pierwotnego nie można opisać odwołując się do innych pojęć tej teorii. Dlatego z teoriomnogo-sciową relacją przynależności nie jest związana żadna procedura weryfikująca stwierdzenie, że A ∈ B24.To jest fundamentalna różnica między matematyką teoriomnogościową a konstruktywną.

Struktura rekurencyjna Nat opisująca liczby naturalne jest najprostsza z możliwych: mamy tupojedynczą wielkość początkową i jeden jedyny konstruktor.

Matematyka kocha byty czyste. Proste, ale posiadające wszystkie istotne cechy interesujących nas obiek-tów. To piękna zasada decydująca o estetycznych walorach królowej nauk25. Koncentrujemy uwagę naobiektach idealnych, pozbawionych zbędnych elementów, co ułatwia odkrycie istoty problemu.

Dlatego wiedza o liczbach naturalnych - arytmetyka - jest esencją wiedzy o strukturach rekurencyjnych,o „nieskończoności kontrolowanej” - „(Arithmetics is) the science that elaborates the abstract structuresthat all progressions have in common merely in virtue being progression”26.

Liczby całkowite i wymierne

Liczby całkowite i wymierne to też struktury rekurencyjne.

Liczby całkowite to rozszerzenie uniwersalnego systemu nazw - liczb naturalnych - które wprowadziłonową jakość i nowy rodzaj uporządkowania. Od elementu podstawowego - zera - rozwijamy się „w dwóchkierunkach” - do plus- i minus nieskończoności. Potrzebę takiego uporządkowania poczuli zapewne jakopierwsi ci spośród naszych przodków, którzy zaczęli pożyczać pieniądze...27

Aby opisać rekurencyjnie liczby całkowite wystarczy potraktować liczby naturalne jako wielkościpoczątkowe i „uruchomić” dwa nowe konstruktory:

n : Nn : Z

n : N−n : Z

(n 6= 0)

21W matematyce mainstreamowej tak opisane „kolekcje” nazywane są zbiorami rekurencyjnymi.22Jak mawiał prezydent L. Wałęsa: „Jeśli chcesz komuś naprawdę pomóc, to daj mu wędkę, a nie rybę”...23Czasem zamiast o konstrukcji mówimy o wyprowadzeniu danego obiektu. A nawet o konstruktywnym „uprawo-

mocnieniu” - konstruktywnym dowodzie istnienia.24To stwierdzenie wymaga doprecyzowania. Zrobimy to, gdy będziemy wiedzieli więcej o rozstrzygalności.25Zwana czasem „brzytwą Ockhama”. Oczywiście nie królowa, tylko zasada. „Pluralis non est ponenda sine”.

„Bytów nie mnożyć, fikcji nie tworzyć, tłumaczyć rzeczy jak najprościej”.. Wilhelm Ockham to XIV-wieczny teologangielski, franciszkanin. Wyrzucony z uniwersytetu oksfordzkiego udał się do Avinionu gdzie oskarżył papieża JanaXXII o ... herezję i został ekskomunikowany.

26P. Benacerraf, „What numbers could not be”, Philosophy of Mathematics, 1983. E. Nelson w [82] pisze o „gene-tycznym” charakterze liczb naturalnych: „Numerals” - terms containing only unary symbol S and a constant 0 aregenetic; they are formed by human activity.

27Na jednej z niezliczonych stron internetowych napisano inaczej (ale tyż piknie): „The addition of 0 to the naturalnumbers was a major intellectual accomplishment in its time. The addition of negative integers to form Z alreadyconstituted a departure from the realm of immediate experience to the realm of mathematical models.”. Dowodemświadczącym o porzuceniu świata bezpośredniego doświadczenia jest stwierdzenie, że (−2) · (−2) = 4.

Page 21: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 20

Liczby wymierne to kolejne, uzasadnione cywilizacyjnie rozszerzenie systemu nazw. I ten zbiórmożna opisać rekurencyjnie - przedstawić jako „ułamki” skonstruowane z liczb całkowitych...

Zbyt to proste by było matematyką? Tak można sądzić widząc, co z tymi liczbami wyczyniateoria mnogości. Każdy student matematyki „wie” (bo musi), że zbiór liczb całkowitych to zbiórilorazowy postaci (N×N)/ ∼= dla odpowiednio określonej równoważności ∼=28. Zatem każda poje-dyncza liczba całkowita to ... zbiór nieskończony!29. „Who care about?”

Równie niemiło wygląda teoriomnogościowa definicja zbioru liczb wymiernych - ponownie ko-rzystamy z możliwości tworzenia zbiorów ilorazowych, tym razem rozpoczynając konstrukcję odzbioru liczb całkowitych. Każda liczba wymierna to (też) nieskończony zbiór... .

Powtórzmy, co powiedzieliśmy przy okazji teoriomnogościowej definicji liczb naturalnych: tedefinicje to tylko opisy tych zbiorów liczb w języku teorii mnogości. Niezbędne, by włączyć je domatematyki której paradygmatem jest stwierdzenie, że „obiekty matematyczne to zbiory”.

A co z liczbami rzeczywistymi? Powiedzmy krótko: to nie jest zbiór rekurencyjny. To nie jest„system nazw”. To jest miejsce, w którym ostatecznie rozchodzą się drogi matematycznych kon-struktywistów i platoników. Opowiemy o tym w rozdziale „Przestrzeń matematyczna”.

Liczby - słowa - numerały

Zbiór opisany przez nietrywialną30 strukturę rekurencyjną jest nieskończony. Jego nieskończonośćjest tego samego rodzaju co nieskończoność liczb naturalnych - obiekty wygenerowane za pomocądowolnej struktury rekurencyjnej można efektywnie ponumerować liczbami naturalnymi. Robimy totak: najpierw numerujemy wielkości początkowe (których jest skończenie wiele) potem numerujemyte, które są konstruowane „w jednym kroku”, po jednokrotnym użyciu jednego z dopuszczalnychkonstruktorów. Potem numerujemy wielkości skonstruowane „w dwóch krokach”. I tak dalej31. Wszczególności tak można ponumerować słowa nad dowolnym alfabetem.

Z drugiej strony, liczby naturalne to nazwy-słowa 0, succ(0), succ(succ(0)), . . . konstruowanezgodnie z regułami opisanej wcześniej struktury rekurencyjnej Nat.

Liczby to słowa. Słowa można ponumerować. Co jest wcześniejsze, ważniejsze: słowo czy liczba? Tokiepskie pytanie. To są dwie wyróżnione, pierwotne struktury rekurencyjne. To pojęcia komplementarne,wzajemnie się dopełniające, a nie konkurencyjne.

Normalni ludzie - nie-matematycy - nie kojarzą liczb naturalnych z (koszmarnymi) napisamipostaci 0, succ(0), succ(succ(0)) . . .. Oni korzystają z reprezentacji tych liczb - numerałów.

Jest wiele systemów numerałów. Nasz przodek chcąc zapisać liczbę „siedem” rył na ścianie ja-skini siedem kresek - reprezentował liczby jako słowa nad jednoelementowym alfabetem. Dziś światposługuje się systemem dziesiętnym - reprezentacją liczb naturalnych za pomocą słów-numerałównad alfabetem 0, 1, 2, 3, 4, 5, 6, 7, 8, 932. A symbolem ery komputerów stał się zapis binarny.Zapisy liczb w systemie dziesiętnym (dwójkowym, rzymskim) to synonimy podstawowych nazw. 3jest synonimem napisu succ(succ(succ(0))). Te synomimy nie są potrzebne matematykom. Takareprezentacja staje się istotna, gdy interesują nas „praktyczne aspekty wykorzystania liczb natural-nych” czyli, mówiąc po ludzku, rachunki. Nasz przodek chcąc obliczyć iloczyn „sto jeden razy stodwa” musiał by sto i dwa razy wyryć sto jeden kresek - zajęcie na cały sezon łowiecki. A korzysta-jąc np. z systemu dziesiętnego i prostych algorytmów dodawania i mnożenia, które otrzymaliśmyw pakiecie z tym systemem, średnio rozgarnięty uczeń gimnazjum rozwiąże to zadanie w minutę33.

28(m,n) ∼= (m1, n1) gdy m− n = m1 − n1.29Klasa abstrakcji pewnej pary liczb naturalnych (n,m) względem relacji „∼=”.30Zawierającą konstruktory.31Znaczenie terminu „efektywna numeracja” wyjaśnimy w przyszłości. Teraz niech nam wystarczy nasza intuicja.32Ten system, importowany z Indii za pośrednictwem Arabów wyparł produkt europejski - system rzymski.33Gimnazja to szkoły istniejące w słusznie minionym okresie... Aby docenić zalety systemu dziesiętnego proszę

spróbować opracować algorytmy realizujące dodawanie i mnożenie w systemie rzymskim.

Page 22: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 21

Dodatek: struktury rekurencyjne w teorii mnogości

Teoria mnogości miała być w zamierzeniu podstawą wszelkich działań matematycznych. Jak zatemradzi sobie ze strukturami rekurencyjnymi? Całkiem nieźle. Teoriomnogościowe twierdzenie, któreujmuje istotę tej metody konstruowania obiektów to twierdzenie Tarskiego o punkcie stałym.

Aksjomatyka teorii mnogości postuluje istnienie - dla dowolnego zbioru A - jego zbioru potęgo-wego 2A , którego elementami są wszystkie podzbiory zbioru A:

B ∈ 2A wtw B ⊆ A(B ⊆ C jeżeli każdy element zbioru B jest też elementem zbioru A).

W ten sposób z dowolnym zbiorem A stowarzyszamy uporządkowaną strukturę (2A,⊆).Powiemy, że operator działający na podzbiorach A - czyli funkcja F : 2A → 2A - jest monoto-

niczny, jeżeli dla dowolnych podzbiorów B,C ⊆ A, F (B) ⊆ F (C) jeśli tylko B ⊆ C. Operator Fjest finitarny, gdy dla dowolnego podzbioru B:

F (B) =⋃F (Bf );Bf − skończony podzbiór B

czyli F jest jednoznacznie określony przez swoje działanie na skończonych podzbiorach.

Teraz można sformułować twierdzenie Tarskiego o punkcie stałym:34 „każdy monotoniczny ifinitarny operator F : 2A → 2A ma (najmniejszy) punkt stały - istnieje podzbiór AF ⊂ A taki, żeF (AF ) = AF . Co więcej:

AF =⋃n∈N

Fn(∅) = ∅ ∪ F (∅) ∪ F 2(∅) ∪ · · · ∪ Fn(∅) ∪ · · ·

Łatwo skojarzyć konstrukcję zbioru AF ze strukturami rekurencyjnymi. Działanie operatora F -przejście od zbioru B do zbioru F (B) - odwzorowuje rezultat jednokrotnego zastosowania dostęp-nych konstruktorów do elementów zbioru B. Początek konstrukcji AF to zbiór F (∅) stworzony „zniczego” - ze zbioru pustego. To jest zbiór wielkości początkowych. Potem, krok po kroku, budu-jemy zbiory Fn(∅) - coraz lepsze przybliżenia zbioru AF 35. Fn(∅) zawiera elementy konstruowalne„w nie więcej niż n krokach”. AF jako suma wszystkich zbiorów Fn(∅), składa się z elementówkonstruowalnych w skończonej liczbie kroków. A to, że jest to punkt stały operatora F oznacza, żedalsze próby konstrukcji nowych elementów są bezowocne - nie skonstruujemy nic nowego aplikującdostępne konstruktory do elementów zbioru AF

36.

Równanie AF = F (AF ) nazywamy równaniem rekurencyjnym zbioru AF . I tak np. równanie

Nat = 0 ∪ succ(n) : n ∈ Natopisuje zbiór - punkt stały operatora Nat : (2Ar

∗,⊆) → (2Ar

∗,⊆) (gdzie Ar = 0, succ,+, ·.).()

zdefiniowanego tak:Nat(J) = 0 ∪ succ(a); a ∈ J

Liczby naturalne to punkt stały pewnego operatora...37.

Ważne pytanie. I jeszcze ważniejsza odpowiedź

Zbiór AF to domknięcie zbioru pustego, w tym sensie, że zastosowanie dostępnych konstruktorów(operatora F ) - do zbioru AF nie da nic nowego. Tak jest, bo dostępne konstruktory są finitarne(operator F jest finitarny).

34W istocie mówimy tu tylko o pewnym zastosowaniu tego twierdzenia.35Coraz lepsze, bo monotoniczność operatora F gwarantuje, że Fn(∅) ⊆ F (Fn(∅)) = Fn+1(∅).36To wynika z założenia, że nasze konstruktory są finitarne.37Nie dajmy się zwieść: nie można twierdzić, że wewnątrz teorii mnogości można „utworzyć” zbiór liczb naturalnych.

A to dlatego, że opisując zbiór Nat korzystamy z twierdzenia Tarskiego, którego niesposób dowieść bez założenia, że... mamy do dyspozycji zbiór liczb naturalnych N.

Page 23: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 22

Ale co się stanie, gdy zrezygnujemy z warunku finitarności konstruktorów (opertora), gdy np. je-den z konstruktorów potrzebuje przeliczalnej liczby argumentów38 Czy wówczas każdy zbiór możnapodobnie domknąć? Intuicja podpowiada, że ów „punkt stały operatora F” można próbować kon-struować podobnie, tylko nie można poprzestać na sumie

⋃n∈N Fn(A). Trzeba iść „dalej”. Ale jak

numerować kolejne kroki konstrukcji, skoro już wyczerpaliśmy wszystkie liczby naturalne?Takie pytania postawił sobie kiedyś Cantor. I był to początek budowy teorii mnogości39.

2.3 Struktury rekurencyjne w metamatematyce

Rezygnacja z wymogu konstruowalności obiektów w matematyce teoriomnogościowej może suge-rować, że struktury rekurencyjne pełnią w niej marginalną rolę. Ale to nieprawda. Jest wręczodwrotnie: struktury rekurencyjne są narzędziem sprawowania kontroli nad matematyką.

2.3.1 Gramatyki i języki

Strukturę języków naturalnych badają językoznawcy. To trudne, bo pracują na żywym i zmiennymorganizmie i mają minimalny (żaden?) wpływ na kształt badanego języka.Matematyka i logika potrzebuje języków formalnych o czytelnej i jednoznacznej strukturze. Skorojesteśmy twórcami tych języków, to możemy ich strukturę zaplanować tak, by zapewnić sobie pełnąnad nimi kontrolę. Chcemy też, by - podobnie jak języki naturalne - języki formalne były zbioramipotencjalnie nieskończonymi40. Dlatego do opisu tych języków wykorzystuje się rekurencję.

Zmodyfikujmy nieco wcześniejszą (quasi)definicję struktury rekurencyjnej dostosowując ją doopisu języków: struktura rekurencyjna nad (skończonym) alfabetem A to każda para (P,K), wktórej P ⊂ A∗ to skończony zbiór słów a K to skończony zbiór konstruktorów.Konstruktor k ∈ K przyporządkowuje pewnym (wcześniej skonstruowanym) skończonym ciągomsłów (w1, . . . , wnk) nowe, jednoznacznie określone słowo k(w1, . . . , wnk).Jak uprzednio, wymagamy by konstruktory były rozstrzygalne.

ww ∈ P w1, . . . , wnk

k(w1, . . . , wnk)k ∈ K

Słowo w należy do języka opisanego przez strukturę (P,K) wtedy, gdy jest słowem początkowym- w ∈ P - lub można je skonstruować ze słów początkowych w skończonej liczbie kroków, za pomocądostępnych konstruktorów.

Jednak jest to wciąż tylko quasidefinicja języka rekurencyjnego, bo odwołujemy się w niej dointuicyjnie rozumianej rozstrzygalności41.

. Jeśli chcemy wyeliminować tę nieścisłość musimy posłużyć się nieco bardziej skomplikowanympojęciem gramatyki:

Gramatyka to układ trzech skończonych zbiorów: G = (NT, T, P ) nazywanych odpowiednio: al-fabetem pomocniczym (NT ), alfabetem właściwym (terminalnym) (T ) i zbiorem produkcji (P ).Wyróżniamy też symbol początkowy - S ∈ NT .

38Np. gdy jesteśmy w świecie liczb rzeczywistych a konstruktor przyporządkowuje ciągowi Cauchy’ego jego granicę.39For a collection P of real numbers let P ′ be a collecion of limit points of P and P (n) the result of n iterations of

this operation (...) Cantor recalled (...) that he was considering infinite iterations of his P ′ operation using „symbolsof infinity”: P∞ =

⋃(P (n) : n ∈ N), P∞+1 = (P∞)′ (...) [53].

40Język polski to nie tylko słowa utworzone z liter polskiego alfabetu ale - po rozszerzeniu alfabetu o znaki inter-punkcyjne i spacje - dowolny tekst (wypowiedź) w języku polskim. I nikt rozsądny nie określi maksymalnej długościwypowiedzi sformułowanej w języku polskim (co jednak nie jest przyzwoleniem na nieskończone ględzenie...).

41Termin „rozstrzygalny” używamy tu w znaczeniu, jakie przypisujemy mu w języku naturalnym. Ponieważ WielkiSłownik PWN traktuje czasownik „rozstrzygać” po macoszemu - jako synonim stwierdzenia „decydować w sposóbostateczny” - wytłumaczmy (nieformalnie) o co nam chodzi: definiując wielkości i konstruktory musimy zachowaćzdolność oceny (rozstrzygania) czy „coś” - obiekt matematyczny - jest czy nie jest wielkością początkową. I czy danykrok konstrukcji jest wykonany zgodnie z jednym z konstruktorów czy też jest to nieprawdą.Rozstrzygalność doczeka się w tym tekście ścisłej definicji matematycznej.

Page 24: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 23

Pojedyncza produkcja to para słów nad alfabetem NT ∪T -zapisywana sugestywnie jako „u→ v”.Poprzednik reguły - słowo u - musi zawierać choćby jedną literę pomocniczą.Wyprowadzenie słowa (z symbolu początkowego S za pomocą produkcji ze zbioru P ) rozumiemytak, jak się nam wydaje.

Kolekcja generowana przez gramatykę to wszystkie wyprowadzalne słowa nad alfabetemNT∪T . Alejęzyk generowany przez gramatykę G to tylko te wyprowadzalne słowa, które są złożone wyłączniez liter alfabetu terminalnego T .

Nie dajmy się zwieść odmiennej terminologii: gramatyka to jest struktura rekurencyjna z jedną wielkościąpoczątkową S i konstruktorami odpowiadającymi poszczególnym produkcjom42. A „wyprowadzenie” toto samo, co wcześniejsza „konstrukcja”.

Przykład. Gramatyka (znanych ze szkoły) wyrażeń arytmetycznych. Jej alfabet terminalny tozbiór 0, succ,+, ·, ), (x, y, z43 a symbole nieterminalne to trzy słowa-tokeny - liczba, zmienna,wa. wa to symbol początkowy. Produkcje tej gramatyki definiujemy tak:

wa → liczba, wa→ zmienna , wa → (wa+ wa) ,wa→ ( wa · wa) wa→ succ(wa), liczba → 0, liczba → succ(Liczba) ,zmienna → x, zmienna → y , zmienna → z,

Wyprowadzenie wyrażenia arytmetycznego (succ(0) + x) wygląda tak:

wa (wa + wa) (succ(wa)+wa) (succ(liczba)+wa) (succ(0)+zmienna) (succ(0)+x)

Opis języków za pomocą gramatyk otworzył możliwość ich klasyfikacji. Piękną, przejrzystąklasyfikację zaproponował Noam Chomsky44:

I. Język jest regularny gdy jest opisany przez gramatykę regularną - taką, która zawiera jedynieprodukcje postaci A→ Ba , A→ B, A→ ε (A,B to symbole nieterminalne, a - terminalny a „ε”to słowo puste).II. Język bezkontekstowy jest opisany przez gramatykę (bezkontekstową) w której dopuszczalne sąprodukcje postaci A→ w (gdzie A to symbol nieterminalny a w ∈ (NT ∪X)∗).III. Język kontekstowy jest opisany przez gramatykę (kontekstową), której produkcje mają kształtαAβ → αγβ gdzie A to symbol nieterminalny a α, β, γ - słowa nad (NT ∪X)∗.IV. A język kombinatoryczny to taki, który można opisać za pomocą dowolnej gramatyki.

Cóż w tym pięknego? Cierpliwości - do tej klasyfikacji powrócimy w przyszłości.

2.3.2 Dowodzenie

Przyjmijmy nieco bardziej liberalną definicję struktury rekurencyjnej: uznajmy, że zbiór wielko-ści początkowych i konstruktorów nie musi być skończony ale jedynie rozstrzygalny, czyli „podkontrolą”. Wciąż jednak zakładamy, że konstruktory są finitarne, czyli aplikowane do skończonejliczby obiektów. To w szczególności oznacza, że do konstrukcji dowolnego elementu wykorzystujemyjedynie skończenie wiele wielkości początkowych.

Ta własność struktur rekurencyjnych ma specjalną nazwę - „zwartość”. To - mówiąc najogólniej - własnośćtych konstrukcji, które mając do dyspozycji potencjalnie nieskończony zasób, w każdym pojedynczymdziałaniu wykorzystują tylko skończony jego fragment.

Cel dowodzenia to bezsporne wykazanie związku przyczynowo-skutkowego między stwierdzeniami-założeniami i stwierdzeniem - tezą. Ten cel osiągamy poprzez formalizację dowodzenia, co umożliwia

42Aby to zauważyć wystarczy zapisać produkcje w postaci „ułamków”: zamiast u→ v pisz uv

.43Ograniczamy się do wyrażeń arytmetycznych zawierających te trzy zmienne tylko po to, by było prościej.44N. Chomsky, (1928 - ) twórca podstaw współczesnej lingwistyki matematycznej. Zacytujmy zdanie Chomsky’ego

dobrze wpisujące się w dyskusję o nieskończoności kontrolowanej: „znajomość języka zakłada niejawną znajomośćnieskończenie wielu zdań...”[14]

Page 25: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 24

obiektywną kontrolę poprawności tego procesu. Zapewniają to takie oto paradygmaty:45

- dowodzenie jest skończoną i dyskretną procedurą, sekwencją kroków dowodowych,- wykonanie pojedynczego kroku sprowadza się do przywołania aksjomatu-założenia lub użycia

pewnej reguły dowodzenia.

Reguły dowodzenia to opisy warunków, jaki ma spełniać skończony zbiór stwierdzeń P1, . . . , Pn ipojedyncze stwierdzenie K, by móc uznać, że między przesłankami P1, . . . , Pn a konkluzją K istniejezwiązek przyczynowo-skutkowy: „uznając przesłanki reguły, mamy prawo uznać jej konkluzję”.

P1, . . . , PnK

Np. fundamentalna dla klasycznej logiki reguła odrywania („modus ponens”) stanowi, że „uznającstwierdzenie A i implikację A→ B mamy prawo uznać stwierdzenie B”:

A,A→ B

B

Dowód związku przyczynowo-skutkowego: „stwierdzenie-teza ST jest konsekwencją zbioru stwier-dzeń - założeń (aksjomatów) A ” - to ciąg stwierdzeń:

ST0 ST1 · · ·STi STi+1 · · · STn = ST

taki, że każde stwierdzenie STi jest:- jednym z wyjściowych założeń (aksjomatów), lub- konkluzją pewnej reguły, której przesłanki można odnaleźć w podciągu poprzedzającym STi.

Mówimy wtedy, że ST jest wywodliwe (da się wywieść, ma dowód) ze zbioru założeń A.

System dowodzenia to struktura rekurencyjna: aksjomaty to wielkości początkowe a reguły dowodzeniato konstruktory.Obiekty konstruowane w tej strukturze to stwierdzenia dowodliwe - konsekwencje aksjomatów rozważa-nego systemu dowodzenia. Dowody to konstrukcje stwierdzeń. ,Zwartość” oznacza, że w każdym poje-dynczym dowodzie korzystamy tylko ze skończonego podzbioru zbioru aksjomatów.Wiedza o konsekwencjach zbioru aksjomatów ma cechy zbioru potencjalnie nieskończonego: do dziś zbu-dowaliśmy jego skończony fragment złożony z udowodnionych twierdzeń. Jutro ten zbiór rozszerzymy46.

Przykład „z życia wzięty”: uznajmy za aksjomaty informacje: „istnieje bezpośrednie połącze-nie lotnicze z miasta A do B” a za regułę stwierdzenie: „jeśli istnieją połączenia lotnicze z A do Bi z B do C, to istnieje połączenie między miastami A i C”.

Warszawa ParyżA B,B C

A C

(wypisaliśmy tu tylko przykładowy „aksjomat”. Ich pełny zbiór to „Światowy Rozkład Lotów”).Możemy teraz próbować bezspornie dowieść istnienia połączenia lotniczego (z przesiadkami) np. zWarszawy do Sydney. A gdy pomyślimy o komfortowych podróżach, to wystarczy zmienić regułę nabardziej restrykcyjną: „jeżeli istnieją wygodne połączenia z A do B i z B do C, a czas oczekiwaniaw B nie przekracza 3 godzin, to uznajemy, że istnieje wygodne połączenie z A i C”.47

Wymóg rozstrzygalności zbioru aksjomatów i reguł sprawia, że potrafimy rozstrzygać o poprawnościdowodu - „we recognise a proof when we see one”48. To umożliwia sprawowanie społecznej kontroli nad

45Mówimy tu o hilbertowskiej koncepcji dowodu.46Zwolennicy matematycznej transcednecji powiedzą, że my nie budujemy, ale odkrywamy coraz to większe frag-

menty aktualnie istniejącego nieskończonego zbioru prawd matematycznych.47Moi rówieśnicy pamiętają dworcowe „okienko informacji PKP” gdzie pani zapytana o połączenie Gdynia - Ustrzy-

ki Górne z zadziwiajacą biegłością, korzystając z aksjomatów (rozkładu jazdy), swojej wiedzy i doświadczenia, wska-zywała stosowne połączenia. Dziś tę rolę pełnią programy komputerowe...

Page 26: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 25

matematyką: jeśli mówisz, że twoje twierdzenie jest prawdziwe, to pokaż jego dowód. A my zweryfikujemyjego poprawność.Przyjęcie hilbertowskiej koncepcji dowodu uczyniło z matematyki naukę tak pewną, jak to tylko możli-we: liczba kontrolujących poprawność głoszonych „prawd matematycznych” - dowiedzionych twierdzeń -jest nieograniczona (potencjalnie nieskończona). A wymóg rozstrzygalności aksjomatów i reguł systemudowodzenia wyklucza jakiekolwiek spory interpretacyjne.

Jest wiele systemów dowodzenia. Praktycznie każda dziedzina współczesnej matematyki ma sweaksjomatyczne przedstawienie, czyli swój własny system dowodzenia. Systemy dowodzenia poja-wiają się też w matematyce stosowanej. Stworzono nawet specjalny język programowania Prolog, wktórym możemy zbudować swój własny system - taki jak np. „światowy system połączeń lotniczych”- i wykorzystać Prolog do automatycznego dowodzenia twierdzeń w tym systemie49.

Niech nam jednak nie przyjdzie do głowy utożsamiać hilbertowskiego zapisu dowodu z procesem do-wodzenia! Więcej o tym w rozdziale poświęconym językowi matematyki i logice języka.

Więcej niż przykład: równoważność kontrolowana

Krótko(!) po wynalezieniu liczb naturalnych ludzie zaczęli ich używać nie tylko do prostego zliczaniai kolejkowania, ale w sposób bardziej zaawansowany - do usprawniających te czynności obliczeń50. Wkonsekwencji język arytmetyki został rozszerzony. Zaczęto mówić o sumie i iloczynie liczb. Pojawiły sięnapisy, które dziś nazywamy wyrażeniami (termami) arytmetycznymi, a wraz z nimi konieczność ocenyczy takie napisy „znaczą to samo”, są równoważne? Np. czy 3 · (2 + 11) to jest to samo, co 5 · 3 + 2 · 7?.

Czy potrafimy kontrolować równoważność wyrażeń?Matematyk to pytanie sformułuje tak: czy potrafimy wskazać system formalny - zbiór aksjoma-

tów i reguł - pozwalający dowodzić równoważności wyrażeń w językach rekurencyjnych?To możliwe. Nie zawsze, ale w większości „interesujących” przypadków. Pokażemy, jak to zrobić.

Chcąc zachować sens (istotę) stwierdzenia „wyrażenia znaczą to samo” musimy się zgodzić, żerównoważność wyrażeń ma trzy podstawowe cechy: dla dowolnych wyrażeń t, r, s :

- „t znaczy to samo co t”,- „ jeśli t znaczy to samo co p, to p znaczy to samo co t”,- „ jeśli t znaczy to samo co p, a p to samo co r, to p znaczy to samo co r”,

Te cechy równoważności - nazywane przez matematyków zwrotnością, symetrycznościa i przechod-niością - posłużą do sformułowania reguł poszukiwanego systemu dowodzenia. Jeśli użyjemy napisut ≡ p dla oznaczenia stwierdzenia „t jest równoważne p” to zapiszemy je tak:

t ≡ t,

t ≡ p

p ≡ t,

t ≡ p, p ≡ rt ≡ r

Czwarta reguła odnosi się do rekurencyjnego charakteru języka wyrażeń i mówi tyle: „jeśli pew-ne wyrażenia są parami równoważne, to i wyrażenia utworzone z nich za pomocą tego samegokonstruktora są równoważne”51:

48G. Suldholm, „Vestiges of realism” - artykuł w książce The Philosophy of Michael Dummett.49W Prologu można implementować tylko systemy dowodzenia należące do pewnej, ścisle określonej klasy. Jest

jednak ona na tyle duża, że programy logiczne - implementacje systemów dowodzenia - znajdują liczne zastosowania.Dodajmy dla porządku: hilbertowska koncepcja dowodu nie jest niekwestionowanym paradygmatem matematycznym.Akceptacja nieskończoności aktualnej zachęciła niektórych do rozważania logik infinitarnych w których odchodzi sięod finitarnego charakteru procesu dowodzenia. Ale to nie jest temat, którym będziemy się tu zajmować.

50Słowo „arytmetyka” można wywieść od greckiego arithmein – liczyć. A liczyć to nie to samo co zliczać.Archeolodzy odnaleźli dowody, że dodawanie i odejmowanie znane były ludom neolitycznym ok. ... 10 tys. lat temu.

51Gdy chcemy mówić o „równoważności w dowolnym zbiorze” musimy z tego warunku zrezygnować. Dlatego ma-tematyka teoriomnogościowa rozumie przez „równoważność” relację zwrotną, symetryczna i przechodnią. Czwartywarunek nazywa się - szczególnie w algebrze - kongruentnością

Page 27: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 26

t1 ≡ p1, . . . tk ≡ pkk(t1, . . . , tk) ≡ k(p1, . . . , pk)

dla dowolnego konstruktora k

To wszystko - jeśli mówimy o regułach. Opisem danej równoważności jest teraz wskazanie rozstrzy-galnego zbioru równoważności bazowych ti ≡ pi : i ∈ I - aksjomatów budowanego systemu.

„Wiedzieć” że wyrażenia t i p są równoważne oznacza teraz, że potrafimy zbudować dowódstwierdzenia t ≡ p w tak skonstruowanym systemie. Możemy kontrolować równoważność kontrolującpoprawność dowodu. Jest tak, jak chciał Martin-Lof.

Z równoważnością jest trochę tak, jak z nieskończonością. Można przyjąć, że - z definicji! - równoważnośćmusi być pod kontrolą, musi mieć rozstrzygalny zbiór bazowych równoważności. Tak chcą konstruktywiści.

Ale można myśleć inaczej: przyjąć, że równoważnością wyrażeń jest każda relacja zwrotna, symetryczna,przechodnia i kongruentna. I wtedy - na własne życzenie! - mamy problem. Bo nie każda taka równo-ważność ma rozstrzygalny podzbiór równoważności bazowych, który mógłby pełnić rolę zbioru ak-sjomatów systemu pozwalającego „orzekanie o równoważności” zastąpić formalnym dowodzeniem. Takiejrównoważności nie potrafimy kontrolować52.Który definicja równoważności jest właściwa? A która matematyka jest właściwa - konstruktywna czy ta,która zaproponowali Cantor i Hilbert?

Na koniec wróćmy do początku, czyli do równoważności wyrażeń arytmetycznych. Ta równo-ważność jest, na szczęście, „konstruktywna”53. Równoważności bazowe - aksjomaty systemu po-zwalającego na dowodzenie równoważności wyrażeń arytmetycznych - opisujemy sprytnie tak:

x+ 0 ≡ x x · 0 ≡ 0x+ succ(y) ≡ succ(x+ y) x · succ(y) ≡ (x · y) + x

Dlaczego sprytnie? Te cztery zapisy to „schematy”. Każdy taki schemat opisuje nieskończony zbiórbazowych równoważności, które otrzymamy zastępując zmienne w nich występujące - litery x i y- wyrażeniami arytmetycznymi. Np. do zbioru opisanego przez schemat x + 0 ≡ x należy rów-noważność succ(succ(0) + succ(0)) + 0 ≡ succ(succ(0) + succ(0)) otrzymana przez podstawienie[x := succ(succ(0) + succ(0))].

Użycie schematów pozwola na skończony opis nieskończonego, ale rozstrzygalnego zbioru bazo-wych równoważności.

Twierdzisz, że 2 + 2 ≡ 4? No to przedstaw dowód54

Czy takie rozwiązanie problemu równoważności wyrażeń jest satysfakcjonujące? Nie dla wszystkich.A dlaczego, powiemy gdy będziemy wiedzieć więcej - w rozdziale „Obliczalność”

2.3.3 Dodatek: jaką nieskończoność tolerują komputery?Nie pytaj o znaczenie. Pytaj o użycie.

L. Wittgenstein55

Komputery liczą. We wielu językach programowania mamy do dyspozycji tzw. typ całkowity (w C,C++ - „int”, w Pascalu - „integer”) – który jest zbiorem liczb całkowitych, ale tylko z pewnegozakresu. Ten zakres może być nawet bardzo duży, ale zawsze jest skończony. Te zbiory (typy) tylkoudają nieskończoność aktualną.

52Matematyka mainstreamowa idzie krok dalej: definiuje równoważność na dowolnym zbiorze A jako relację zwrot-ną, symetryczną i przechodnią. Każdy student „wie”, że dla dowolnego zbioru par B ⊂ A × A istnieje najmniejszarównoważnosć rB zawierająca B. Ale rzadko ma świadomość niekonstruktywnego charakteru tego dowodu.

53„Na szczęście” bo w przeciwnym razie najprawdopodobniej mieszkalibyśmy wciąż w jaskiniach i szałasach...54Pzypomnijmy, że „2” to succ(succ(0)) a „4” to succ(succ(succ(succ(0)))).55Ludwig Wittgenstein (1889 - 1951) – filozof, którego będziemy wielokrotnie tu przywoływać.

Page 28: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 27

Ale są języki, które swobodnie posługują się nieskończonością potencjalną. To możliwe, bopotrafimy zmusić komputery do odczytywania równań rekurencyjnych. Np. w języku programowa-nia funkcyjnego Haskell możemy jako deklaracji typu użyć takiego zapisu:

data Nat = Zero | Succ NatPodobieństwo do równania rekurencyjnego opisującego liczby naturalne - Nat = 0∪succ(n);n ∈Nat - jest widoczne. Ale - z oczywistych powodów - po wczytaniu takiej specyfikacji komputer niewygeneruje w swej pamięci aktualnie nieskończonego zbioru liczb naturalnych. Kompilator Haskellaodczyta to równanie jako opis rekurencyjnej procedury pozwalającej rozstrzygać, czy dany napisjest numerałem - wyrażeniem typu Nat.

Komputery nie rozumieją, czym jest liczba naturalna. One tylko potrafią je rozpoznawać - rozstrzygać,czy dany napis reprezentuje liczbę naturalną.

W Haskellu możemy też użyć równań rekurencyjnych do opisu innych (potencjalnie) nieskończonychobiektów, np. list. I tak np. równanie rekurencyjne:

Jeden = 1 : Jedento haskellowy opis procedury konstrukcji potencjalnie nieskończonej listy [1, 1, 1, . . .].Jak to działa? Operacja „1 : ” to dopisywanie jedynki do początku danej listy. Aplikując wielokrot-nie ten operator do listy pustej [ ] otrzymamy ciąg coraz to dłuższych list jedynek:

[ ] 1 : [ ] = [1] 1 : [1] = [1, 1] [1, 1, 1] · · · [1, 1, . . . , 1]

Ta rodzina skończonych list to potencjalnie nieskończona lista jedynek która jest „dostępna” wkomputerze56.

Pięknym przykładem wykorzystania możliwości operowania nieskończonością potencjalną w Ha-skellu jest implementacja sita Eratostenesa - procedury budowy listy liczb pierwszych. Przypomnij-my tę procedurę.

dane początkowe to nieskończona lista liczb naturalnych uporządkowana rosnąco, bez 0 i 1,krok pierwszy: z listy początkowej wyrzuć wszystkie wielokrotności 2 z wyjątkiem pierwszegoelementu listy,krok rekurencyjny: z listy utworzonej w k-tym kroku, usuń wszystkie wielokrotności liczbystojącej na k + 1 miejscu (z wyjątkiem k + 1 elementu listy).

W tym opisie swobodnie korzystamy z aktualnej nieskończoności liczb naturalnych. Budującimplemantację tej procedury - trzeba zastąpić nieskończoność aktualną przez potencjalną: musimyopisać strukturę rekurencyjną generującą taką potencjalnie nieskończoną listę.

Ta implementacja w Haskellu wygląda tak:

sieve (p : xs) = p : sieve [x | x <- xs, x ‘mod‘ p > 0]primes = sieve [2..]

(Napis [2.. ] to haskellowa deklaracja procedury generującej listę liczb naturalnych bez zerai jedynki57. A deklarację „sieve [x | x <- xs, x ‘mod‘ p > 0]" czytamy tak: „z listy xswybierz te liczby, które nie dzielą się przez p”.58)Wywołanie procedury „primes” to inicjacja nieograniczonego w czasie procesu generowania po-tencjalnie nieskończonej listy liczb pierwszych. Jeśli tak, to sens uruchomienia tej procedury jestwątpliwy - komupter nigdy nie zakończy pracy, nie wyprodukuje kompletnej listy liczb pierwszych.

To oczywiste. Ale możemy skorzystać z dostępnej w Haskellu procedury „take n”, która za-aplikowana do listy zwraca jej pierwszych n elementów.

56W odróżnieniu od aktualnie nieskończonej listy jedynek [1, 1, 1, . . .] , której do komputera raczj nie włożymy...57Działa to podobnie jak wyżej opisana procedura produkująca dowolnie długą listę jedynek.58Spróbuj się przekonać, że sieve [2..] to rzeczywiście (potencjalnie) nieskończona lista liczb pierwszych. To nie

takie trudne - jeśli czujesz rekurencję...

Page 29: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 2. NIESKOŃCZONOŚĆ KONTROLOWANA 28

Program „take n primes” wygeneruje listę n najmniejszych liczb pierwszych!Wyjaśnienie, w języku mainstreamowej matematyki, dlaczego tak to działa, jest nieco kłopotliwe.No bo tak: żeby wybrać n elementów listy primes muszę najpierw tę (aktualnie nieskończoną) listęumieścić w pamięci komputera i dopiero potem uruchomić procedurę take n. Niemożliwe...A jednak. Wystarczy przyjąć, że primes to proces (generowania listy) a nie rzecz (lista) a apli-kacja procedury take n do primes to ingerencja w ten proces - przerywa go po wygenerowaniupoczątkowego fragmentu długości n. Proste?

Proste, bo zamiast o rzeczach, zaczęliśmy myśleć o procesach. Struktura rekurencyjna jest teraz interpre-towana nie jako opis zbioru, ale procesu.Komputery nigdy nie zaakceptują nieskończoności aktualnej. Ale potrafią korzystać z nieskończonościpotencjalnej (jeśli je tego nauczymy).

Page 30: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 3

Przestrzeń - matematycznie

„Przestrzeń stanowi aprioryczną formę ujmowania zjawisk,formę porządkującą napływ wrażeń zmysłowych”

I. Kant1

Matematyka konstruktywna dysponuje liczbami naturalnymi, całkowitymi, wymiernymi, słowa-mi, językami i dowodami. Dlaczego to za mało?

O kształcie współczesnej matematyki zdecydowały osiągnięcia cywilizacyjne starożytnej Grecji.To wtedy wypracowano podstawy arytmetyki i geometrii - dwóch fundamentalnych teorii mate-matycznych. I to do tych teorii odniósł się Kant gdy prawie dwa tysiące lat później definiowałmatematykę jako „logiczną analizę stosunków czasowych i przestrzennych. Pierwsze zadanie mate-matyka realizuje za pomocą arytmetyki, drugie - geometrii”.Geometria Greków miała dwa źródła: pierwsze to problemy praktyczne, związane z pomiaramiziemi, budownictwem itp.. Drugie to astronomia2. Wykorzystanie liczb do opisu proporcji mię-dzy porównywalnymi obiektami geometrycznymi (np. długościami odcinków) to kolejne, odwiecznezastosowanie liczb (naturalnych). Bardziej wyrafinowane od zliczania i kolejkowania, bo w konse-kwencji prowadzące do akceptacji nowego rodzaju liczb - liczb wymiernych - ułamków. I to o tychliczbach myśleli pitagorejczycy głosząc pogląd, że „wszystko co istotne jest liczbą”3.To był niepodważalny paradygmat wsparty codziennym doswiadczeniem. Do czasu, gdy te do-świadczenia mierniczych, budowniczych, etc. postanowiono przenieść do świata platońskich bytówidealnych. Wtedy okazało się, że w idealnym kwadracie proporcja długości przekątnej i boku wcalenie jest liczbą wymierną... . To był szok4 i przyczyna tzw. pierwszego wielkiego kryzysu w mate-matyce: liczb, które możemy finitarnymi metodami skonstruować z liczb naturalnych jest za mało.Sto lat po tej katastrofie Eudoksos zaproponował rozwiązanie problemu - teorię proporcji. W dużymskrócie: źródłem liczb u Eudoksosa są proporcje porównywalnych wielkości - np. długości odcinków.Liczby (dzisiaj powiemy: liczby rzeczywiste dodatnie) to miary proporcji:

√2 jest miarą proporcji

długości przekątnej i boku kwadratu5.

1Immanuel Kant (1724 - 1804) – filozof niemiecki, profesor na Uniwersytecie w Królewcu. Nie wiem wystarczającowiele o jego koncepcjach filozoficznych, by móc z pełnym przekonaniem tłumaczyć je innym. To, co piszę, jest jedyniewybiórcza (nad)interpretacja poglądów Kanta. Spragnionych wiedzy rzetelnej odsyłam np. do [36] gdzie opisanowpływ Kanta na filozofię matematyki.

2O związkach astronomii, kosmologii i geometrii można przeczytać w artykule J. Waszkiewicza „Wpływ astronomiigreckiej na powstanie geometrii” (http://www.msn.ap.siedlce.pl/smp/msn/1/34-44.pdf) i w artykule M. Hellera i Z.Pogody Geometria i kosmologia - historia wzajemnych związków (http://www.msn.ap.siedlce.pl/smp/ msn/3/27-31.pdf

3Pitagorejczycy to uczniowie i następcy Pitagorasa (572 p.n.e. - 497 p.n.e.). Sprowadzenie filozofii pitagorejczykówdo jednego, przedstawionego wyżej hasła jest oczywiście uproszczeniem.

4Jedna z legend głosi, iż odkrywca niewymierności „liczby”√

2 został z tego powodu uśmiercony...5Eudoksos (ok. 408 p.n.e.- ok. 355 p.n.e.).Proporcje porównujemy korzystając z prostej konstrukcji geometrycz-

nej: ab> c

dgdy można wskazać dwie liczby naturalne m,n takie, że n-krotnie przedłużony odcinek a jest dłuższy

od m-krotnie przedłużonego odcinka b i jednocześnie m-krotnie przedłużony odcinek d jest dłuższy od n-krotnieprzedłużonego odcinka c (dziś - korzystając z ustalenia, że „długość odcinka to liczba rzeczywsta! - możemy napisać:

29

Page 31: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 30

Konieczność wyjścia poza liczby wymierne to nie jedyny kłopot z jakim trzeba się zmierzyć,by objąć działaniami matematycznymi (metodami obliczeniowymi) geometrię Greków. Ból głowynarasta, gdy mamy odpowiedzieć - matematycznie - na pytanie „co to jest przestrzeń?” i „czymjest ciągłość przestrzeni?”

3.1 „Przestrzeń” - co to jest?

„Czas i przestrzeń nie są własnościami rzeczy, lecz właściwościami podmiotowego sposobu ujmo-wania zjawisk; są formami naszej zmysłowości; są „siecią”, za pomocą której „łowimy” to, copostrzegamy. Poznać przedmiot to ująć go w czasie i przestrzeni” - to znowu Kant6.

L. Wittgenstein pisał : „Każda rzecz jest niejako w przestrzeni możliwych stanów rzeczy. Prze-strzeń mogę pomyśleć jako pustą, ale rzeczy bez przestrzeni nie. Przedmiot przestrzenny musi leżećw nieskończonej przestrzeni.I jeszcze jedno jedno zdanie z „Traktatu”: „to czego nie uda się ująćmatematycznie, co nie ma formy przestrzenno-czasowej jest poza doświadczeniem”.Współcześnie kognitywiści7 o przestrzeni mówią tak: „Space does not consists of objects. Rather,it is the background settings the objects are located in. Space exists independly of, and priorto, any object located in the space” [67]8.

Ujmowanie zjawisk to funkcja mózgu który rejestruje bodźce, porównuje z wcześniejszymi, za-pamiętuje. To proces permanentny i w części niezależny od naszej świadomości. Ale zdolność dorejestracji nie jest tożsama z umiejętnością analizy, która ujawnia powiązania między zjawiskami ipozwala na podjęcie prób dotarcia do ich istoty. Do tego niezbędne jest skojarzenie z danym sche-matem wyobrażeniowym adekwatnego języka9. Jego osnową jest siatka pojęć - zbiór strukturalniepowiązanych nazw wskazujących kluczowe elementy wybranej formy ujmowania zjawisk10.

Kluczowe pojęcie klasycznego języka opisu przestrzeni to punkt: „Punkt jest tym, co nie ma częścilub nie ma żadnej wielkości”- Euklides. Kognitywiści dodają: „Points are locations in space, onlines, or on planes. They are not objects that can exists independly of the line, plane or space [67].”

Jak to się stało, że abstrakcyjne pojęcie bezwymiarowego punktu zyskało akceptację starożytnych? Możedlatego, że wszyscy mamy nad głową mamy ten sam podręcznik „geometrii przestrzeni” - bezkresneniebo z nieosiągalnymi (i tym samym, abstrakcyjnymi, pozbawionymi fizyczności) gwiazdami-punktami.Te punkty łatwo - w wyobraźni - łączyć prostymi i innymi liniami tworząc idealne figury geometryczne11.

Geometria operuje też pojęciami linii, płaszczyzny, przestrzeni. Jaka jest relacja między punk-tem a tymi pojęciami? Czy linia (płaszczyzna, przestrzeń) jest zbiorem punktów, czy też punkty

ab> m

n> c

d). Dwie proporcje wyznaczają tę samą liczbę rzeczywistą gdy nie jest prawdą, że a

b< c

doraz c

d< a

b. [85]

6http://www.kul.pl/files/450/Kant.pdf7Kognitywistyka to dość młoda dziedzina nauki zajmująca się obserwacją i analizą działania zmysłów, mózgu i

umysłu. W pewnym sensie uzupełnia ona tradycyjną epistemologię - teorię poznania, korzystając z dorobku współ-czesnej medycyny, psychologii czy lingwistyki.

8Pozwolę sobie na ekstrawagancję: w muzyce baroku funkcjonuje termin „basso continuo” „Continuo” po włoskuto „ciągle, nieprzerwanie”. A chodziło o „głos basowy tworzący podstawę harmoniczną utworu”..

9W cytowanym wyżej internetowym wykładzie poświęconym filozofii Kanta znalazło się ładne zdanie: „Podmiotw poznaniu jest aktywny – dokonuje syntezy tego, co dane. Podmiot konstytuuje świat swojego doświadczenia, alenie w sensie jego istnienia, lecz w sensie wprowadzenia ładu i jedności w chaotyczną rapsodię wrażeń”.

10Oto (niepełna) lista współcześnie funkcjonujących w matematyce „przestrzeni” zamieszczona na stroniehttp://mathworld.wolfram.com/Space.html potwierdzająca przydatność tego pojęcia jako schematu wyobrażenio-wego: affine s. (space), Baire s., Banach s., Base s., Bergman s., Besov s, Borel s., Calabi-Yau s., Cellular c., Chus., Drinfeld’s Symmetric s., Eilenberg-Mac Lane s., Euclidean s., Fiber s., Finsler s., First-Countable s., Frechet s.,Function s., G-Space, Green s., Heisenberg s., Hilbert s., Inner Product s., L2-Space, Lens s., Liouville s., LocallyFinite s., Loop s., Mapping s., Measure s., Metric s., Minkowski s., Muntz s., Normed s., Paracompact s., Planar s.,Polish s., Probability s., Projective s, Riemann’s Moduli s., Sample s., Standard s., State s., Stone s., Symplectic s.,T2-Space, Teichmuller s., Tensor s., Topological s., Topological Vector s., Total s., Vector s..

11Dodajmy, że około stu lat przed Euklidesem Demokryt stworzył teorię, w której materia składała się z niepo-dzielnych („punktowych”) i zapewne bezwymiarowych, atomów...

Page 32: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 31

jedynie leżą na linii (płaszczyźnie, w przestrzeni)? Te pytania można by uznać za błahe gdyby nieto, że linii (płaszczyźnie, przestrzeni) przypisuje się niezwykły atrybut - ciągłość.

3.2 Kontinuum - przedmiot (ciągłego) sporu

Natura non facit saltus - (natura nie skacze)G.F. Leibniz12

Liczby naturalne to struktura dyskretna. Podobnie liczby całkowite. Liczby wymierne to struk-tura gęsta - między każde dwie takie liczby można wstawić trzecią od nich różną.Ale matematyka potrzebuje czegoś więcej - potrzebuje ciągłości, potrzebuje swego kontinuum13.Na jednej ze stron internetowych (bodajże wikipedii) napisano tak:

Continuum (...) anything that goes through a gradual transition from one condition, to a differentcondition, without any abrupt changes14.

Ciągłość to niepodzielność, brak luk i skoków. Antyteza dyskretności15. Zmiany wysokości tonuskrzypiec odbieramy jako ciągłe a fortepianu - jako dyskretne, „schodkowe”. Ciągłość nie budzisprzeciwu. Przeciwnie: z niedowierzaniem przyjmujemy informację, że coś, co odbieramy jako prze-kaz ciągły, jest w istocie gęstym przekazem dyskretnych sygnałów. To jest własność naszych zmy-słów i umysłu: mamy w sobie mechanizm wygładzania sekwencji odbieranych sygnałów16. W takimwidzeniu świata utwierdzali nas wielcy: „Natura nie skacze” - Leibniz, „czas i przestrzeń to cią-głe wielkości” (quanta continua) - Kant17. Dziś kognitywiści mówią to samo: „Space is absolutelycontinuous” [67]. My tak postrzegamy przestrzeń i procesy w niej zachodzące18.

Tylko postrzegamy. Od czasów Maxa Plancka wiemy, że przynajmniej na poziomie kwantów założenieciągłości procesów nie jest niepodważalne.

Starożytni Grecy mieli z ciągłością kłopot. Dla Arystotelesa continua to „odległość, czas i ruch”[63]. W „Fizyce” napisał: „Continuum nie może być utworzone z niepodzielnych wielkości” (np.punktów)”19. Arystoteles opisywał kontinuum tak:1. „kontinuum składa się z części”,2. „ich stykające się granice są te same i zawierają się w sobie nawzajem”,3. części te są „podzielne w nieskończoność”20

Dla Euklidesa linia to drugie, obok punktu, pojęcie pierwotne geometrii. „Linia to długość bezszerokości”. „Linią prostą jest ta, która jest jednakowo położona względem punktów na niej leżą-

12Gottfierd Leibniz (1646-1716) filozof, matematyk, prawnik i ... dyplomata.13Kontinuum - słowo łacińskie, które w [10] objaśniono (po angielsku) tak: „the word “continuous” derives from a

Latin root meaning “to hang together” or “to cohere”; this same root gives us the nouns “continent” — an expanseof land unbroken by sea — and “continence” — self-restraint in the sense of “holding oneself together”. Synonymsfor “continuous” include: connected, entire, unbroken, uninterrupted.”

14abrupt - nagły, gwałtowny.15Polski termin „matematyka dyskretna” jest dość nieszczęśliwy. „Dyskrecja” ma w języku polskim inne znaczenie,

bliższe angielskiemu „discreet” (a nie „discrete”) . A nikt na świecie nie słyszał o „discreet mathematics”...16Bezwładność oka sprawia, że po zarejestrowaniu wrażenia wzrokowego przez krótki czas oko nie jest w stanie

odebrać nowego obrazu. To pozwala na oglądanie ruchomych obrazów w telewizji - obrazy pojawiające się na ekranieczęściej niż co 0,1 sekundy zlewają się ze sobą i dają wrażenie ciągłego ruchu.

17„Space and time are quanta continua ...points and instants mere positions.. and out of mere positions viewed asconstituents capable of being given prior to space and time neither space nor time can be constructed.”

18Dawno temu, jeden z moich przyjaciół, astronom, pasjonował się pionierskim w owym czasie wykorzystaniemkomputerów do oczyszczania wyników nasłuchów radioteleskopowych, rejestrowanych w postaci nieregularnej krzywej,z gwałtownymi zmianami, skokami. Oczyszczanie polegało na „wygładzeniu” tej krzywej w przekonaniu, że to, co jejgładkość (ciągłość) psuje, to zakłócenia nakładające się na sygnał przychodzący z wszechświata. Wszak natura nieskacze...

19„No continuum can be made up of indivisibles, as for instance a line out of points, granting that the line iscontinuous and the point indivisible”. [10]

20Ta „nieskończona podzielność” jest potencjalna..

Page 33: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 32

cych”. Pierwsze zdanie wydaje się naiwne, drugie niezrozumiałe. Ale z tego drugiego wynika, że wkoncepcji Euklidesa linia nie jest zbiorem punktów! Punkty leżą na linii ale jej nie tworzą.

„ Końcami (kresami) linii są punkty”, „prostą można ciągle przedłużać po prostej”21.

Teoria mnogości, która narzuciła sobie ograniczenie podstawowych schematów wyobrażeniowychdo jednego - zbioru - nie ma - bo mieć nie może - wątpliwości: linia to zbiór punktów.

W 1872 roku Dedekind22 przedstawił konstrukcję, która przez matematykę mainstreamowązostała uznana za satysfakcjonujące rozwiązanie problemu kontinuum. Dedekind zaproponowałtaki oto sposób konstruowania zbioru liczbowego istotnie większego od zbioru liczb wymiernych:jeżeli gęsty zbiór liczb wymiernych rozdzielić na niepuste zbiory A i B tak, by każda liczba z Abyła mniejsza od każdej liczby z B, to może się zdarzyć jedna z trzech sytuacji: albo zbiór A maelement najmniejszy, albo B najmniejszy albo między tymi zbiorami jest luka - w A nie ma liczbynajwiększej, a w B - najmniejszej. Tak jest gdy np. przyjmiemy B = a ∈ Q : a2 > 2.Sens defincji Dedekinda to stwierdzenie, że tam nie ma luki - tam jest liczba rzeczywista

√2:

jakikolwiek podział zbioru liczb wymiernych na dwa zbiory spełniający opisane wyżej warunki -przekrój Dedekinda - wyznacza liczbę rzeczywistą. Jeśli to jest „przekrój z luką” to wyznacza liczbęniewymierną a jeśli nie, to liczbę wymierną.

Twierdzenie, że coś istnieje tam, gdzie niczego nie ma to niedorzeczność - gdy traktujemy matematykęjako odkrywanie. Ale ma sens, gdy ją tworzymy.

Dlaczego propozycja Dedekinda spotkała się z tak powszechną aprobatą? Oto jak tłumaczy topolski matematyk, R. Sikorski23:(...) zbiór liczb wymiernych ma wady. Wprawdzie jest gęsty, (ale) jest jednak dziurawy (...). Istnieniedziur w zbiorze liczb wymiernych jest źródłem wielu kłopotów. Obrazowo można powiedzieć, żeprzez te dziury wycieka treść matematyczna wielu pięknych twierdzeń (...) . Zbiór liczb wymiernychjest świetny do rachunków na liczbach konkretnych, ale zły dla wielu celów teoretycznych (...). Woparciu o pojęcie liczby rzeczywistej można zbudować całą analizę matematyczną (...). U podstawwszystkich twierdzeń tej części matematyki leży „szczelność” zbioru liczb rzeczywistych.

Budowanie wyobrażenia ciągłości zaczynamy od intuicyjnego stwierdzenia, że „funkcja jest cią-gła, jeżeli jej wykres można narysować bez odrywania ołówka od papieru”24. To wystarczy byzgodzić się z twierdzeniem Darboux: „jeśli funkcja f : R → R jest ciągła i f(a) < 0 < f(b) , toistnieje punkt-liczba rzeczywista c ∈ [a, b] taki, że f(c) = 0”25.

To przestaje być prawdą, gdy liczby rzeczywiste zastąpimy wymiernymi. Wystarczy pomyślećo ciągłej funkcji f : Q → Q opisanej wzorem f(x) = x2 − 2 : oczywiście f(0) < 0 < f(2) ale nieistnieje liczba wymierna c taka, że f(c) = 0.

Twierdzenie Darboux to jeden z matematycznych wyników, które „wyciekną” gdy nie uszczel-nimy struktury liczb wymiernych za pomocą liczb rzeczywistych...

W dowodzie twierdzenia Darboux wykorzystujemy to, że „niepusty podzbiór liczb rzeczywistych, któryjest ograniczony z góry, ma kres górny”. Ta nieco zawiłe i wysoce abstrakcyjne stwierdzenie zostało przezDedekinda wyniesione do rangi matematycznej definicji ciągłości.

21Cytuję za artykułem „O „elementach” Euklidesa” - http://www.math.uni.opole.pl/ ebryniarski Elementy Eukli-desa.pdf (z czego wnoszę, że autorem tego tekstu jest E. Bryniarski).Pamiętamy o greckim „horror infiniti”? Linia prosta nie jest nieskończona, ale jest nieskończenie przedłużalna, coteż kojarzy nam się z nieskończonością potencjalną), jest „rozciągliwa”.

22Julius Dedekind (1831 -1916) – niemiecki matematyk, uczeń Gaussa.23Roman Sikorski (1920 - 1983) – autor prac z logiki matematycznej, topologii, funkcji rzeczywistych, analizy

funkcjonalnej. Cytat pochodzi z artykułu „Czy liczby rzeczywiste są rzeczywiste?” (Delta 01/1974). I niech nas niezwiedzie, że adresatem artykułu są dzieci i młodzież: aby coś wytłumaczyć dziecku trzeba być lepiej przygotowanyniż do wygłoszenia wykładu „ex cathedra”...

24M. Heller, Początek jest wszędzie - Nowa Hipoteza Pochodzenia Wszechświata.25Wykres takiej funkcji ciągłej f , rozpoczynamy rysować pod prostą x = 0 a kończymy powyżej niej, nie odrywając

ołówka od papieru. Dlatego wykres musi ją przeciąć - mieć z nią wspólny punkt.

Page 34: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 33

Dedekind wiedział, że jedynie modeluje ciągłość matematycznie (teoriomnogościowo). Pisał: „przyjęcietej własności linii prostej jest (...) aksjomatem dopiero na mocy którego przyznajemy linii prostej jejciągłość” [93]26.

Skuteczność analizy matematycznej, której podstawą jest taka interpretacja ciągłości, to ważkiargument na rzecz propozycji Dirichleta. Ale to nie oznacza, że wszystko jest jasne: definicja Dede-kinda może (powinna) napotkać na wewnętrzny opór. Jak można twierdzić, że istnieje „coś” tam,gdzie nie ma nic, gdzie jest luka? Przecież:

„powiedzieć, że istnieje, o czymś, czego nie ma, jest fałszem. Powiedzieć o tym, co jest, że jest,a o tym, czego nie ma, że go nie ma, jest prawdą”. („Metafizyka”, Arystoteles) .

To, co zrobił Dedekind zdaje się być jawnie sprzeczne z tą zasadą. Więc?Formalista powie: w teorii mnogości uznajemy aktualne istnienie dowolnych podzbiorów liczb wy-miernych. Liczbą niewymierną nie jest „coś” w luce między zbiorami w której nic nie ma. Ta liczbato wskazana para zbiorów liczb wymiernych - przekrój Dedekinda. Napis

√2 to tylko nazwa jednej

z takich par27. I nic w tym dziwnego, bo przecież w matematyce teoriomnogościowej, wszystkiewcześniej konstruowane liczby - naturalne, całkowite i wymierne - też są zbiorami.To wyjaśnienie, choć formalnie poprawne, jest mało przekonujące. Liczba to para (nieskończonych)zbiorów liczb? I jeszcze mam to „coś” nazywać liczbą rzeczywistą?Formalizm nie jest najlepszym sposobem postrzegania matematyki. Ani jej objaśniania. Gdzie więcszukać źródeł intuicji pozwalającej na mentalną akceptację tak definiowanych „liczb”?Odwołajmy się powtórnie do odwiecznego współistnienia arytmetyki i geometrii. Te dwa „ortogo-nalne” aspekty matematyki wzajemnie na siebie oddziaływują i inspirują. To siła matematyki.

Kognitywiści G. Lakoff i R.E. Nunez formułują w [67] tezę, że jednym z motorów poznaniamatematycznego jest metafora.

Metafora ( przenośnia) to zabieg pozwalający cechy jednego obiektu (zjawiska, procesu) przypisać innemu.Np. z uczuciami wiążemy metaforycznie temperaturę. Wystarczy powiedzieć „jesteś zimna jak lód” iwiadomo, w czym rzecz. Tworzenie metafor to domena poetów - Like a bird on the wire, Like a drunk ina midnight choir I have tried in my way to be free. (L.Cohen) A my to „rozumiemy”... .

„Metafora to przeniesienie nazwy jednej rzeczy na inną: z rodzaju na gatunek, z gatunku na rodzaj,z jednego gatunku na inny, lub też przeniesienie nazwy z jakiejś rzeczy na inną na zasadzie analogii”(Arystoteles, Poetyka). „Metafory i analogie, poprzez zestawienie razem różnych kontekstów, prowadządo powstawania nowych sposobów patrzenia. Prawie wszystko to, co wiemy, łącznie z poważnąnauką, opiera się na metaforze. I dlatego nasza wiedza nie jest absolutna” – J. Weizenbaum28.„Gdy w XV w. pojawiły się pierwsze mechaniczne zegary (...) wszyscy zgodzili się z tym, ze Wszechświatjest zegarem. Ale w gruncie rzeczy nawet wtedy zdawano sobie sprawę, że zegar to tylko metafora -Wszechświat jest czymś bardziej skomplkowanym(...)” - M.Heller, Czy fizyka jest nauką humanistyczną”

Kontinuum Dedekinda jest realizacją jednej z podstawowych metafor matematycznych, którąnazywam „metaforą geometryczno-liczbową” a która polega na utożsamieniu liczb rzeczywistych zpunktami prostej.

26„Continuum, tak rozumiane, jest zbiorem poszczególnych elementów, uszeregowanych w pewnym porządku; jestich wprawdzie nieskończenie wiele, ale poszczególne elementy są całkowicie rozdzielone. Nie odpowiada to zwykłe-mu rozumieniu continuum, zgodnie z którym poszczególne elementy są połączone i tworzą całość, dzięki czemu niepunkt istnieje przed linią, lecz linia przed punktem. Ze słynnej formuły ”continuum to jedność w wielości” pozostałatylko wielość, jedność znikła. Analitycy mają jednak słuszność, gdy określają swoje continuum tak, jak to opisaliśmypowyżej, gdyż takie pojęcie continuum jest przedmiotem ich rozważań, od kiedy w rozważaniach tych zaczęli prze-strzegać ścisłości. To wystarczy, byśmy zdali sobie sprawę, że continuum matematyczne jest czymś zupełnie innymniż continuum fizyków lub metafizyków.” - to H. Poincare (Nauka i Hipoteza)Dodajmy, że niesposób dowieść twierdzenia Darboux nie korzystając z tej definicji ciagłości.

27„Zgodnie z definicją Dedekinda, liczba niewymierna nie jest niczym innym, jak symbolem tego szczególnegopodziału liczb wymiernych. Każdemu podziałowi odpowiada liczba (...), która jest jego symbolem” [90].

28J. Weizenbaum (1923 - 2008), p twórca (w 1966r!) programu ELIZA, który umożliwiał prowadzenie prostejrozmowy z komputerem.

Page 35: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 34

Punkt to liczba (rzeczywista). Liczba to punkt (leżący na prostej).Dwa abstrakcyjne pojęcia, które postrzegane osobno nie są oczywiste, dzięki tej geometryczno-liczbowejmetaforze stają się „realne”. „Intuicja przestrzenna (...) jest nadzwyczaj potężnym narzędziem i dlategogeometria jest w istocie tak potężną częścią matematyki – nie tylko dla rzeczy, które są oczywiściegeometryczne, ale nawet dla tych, które takimi nie są. Usiłujemy im nadać postać geometryczną, bo topozwala nam posługiwać się naszą intuicją” - M. Atiyah [2].

Liczby wspierają geometrię. A geometria dostarcza „dowodów istnienia” takich liczb jak√n czy

π . Umiemy „podnosić liczby do kwadratu”. Rozumiemy, co to „pierwiastek kwadratowy”. Łatwoakceptujemy stwierdzenie, że liczby rzeczywiste są miarą odległości między „realnymi obiektamigeometrycznymi” - punktami prostej. Geometryczno-liczbowa metafora pozwala bez sprzeciwu ak-ceptować nazwę „liczba rzeczywista” dla tego, co jest rezultatem konstrukcji Dedekinda.29.

Jednak to metaforyczne wsparcie ze strony geometrii to trochę mało by rozwiać wszelkie wąt-pliwości związane z tą konstrukcją. Dlatego ogromnie ważne okazało się takie oto twierdzenie:

każda liczba rzeczywista - w sensie Dedekinda - jest granicą pewnego ciągu liczb wymiernych.

To twierdzenie udowodnił Cantor łącząc w ten sposób teoriomnogościową konstrukcję Dedekin-da z wcześniejszymi pomysłami A.Cauchy’ego30. Cauchy to ten geniusz, któremu zawdzięczamyostateczne uprawomocnienie istnienia wielkości granicznych w matematyce.

3.3 Wielkości graniczne

Obwód kwadratu wpisanego w okrąg

&%'$

jest pewnym przybliżeniem, aproksymacją długości tego okręgu. Jest jego „ograniczeniem z dołu”.Marnym, ale zawsze. Łatwo to poprawić: jeśli kwadrat zastąpimy ośmiokątem

&%'$PP

BB

BBPP

to otrzymamy lepsze przybliżenie - obwód ośmiokata jest bliższy długości okręgu niż obwód kwa-dratu. Powtarzając to postępowanie, czyli podwajając w każdym kroku liczbę boków wpisywanegowielokąta, otrzymamy ciąg liczb - obwodów kolejnych wielokątów - coraz lepiej aproksymującychdługość okręgu. Można wyobrazić sobie potencjalnie nieskończony ciąg takich wielokątów. Dłu-gość okręgu nie jest elementem tego ciągu, ale jest z nim ściśle związana - to wyznaczona przezeńwielkość graniczna31.

Skąd wiemy, że taka liczba - wielkość graniczna - istnieje, jest jedna jedyna i jest długością okrę-gu? Sądzę, że większość z nas zaakceptuje taką argumentację: „widzimy, że powierzchnia pomiędzyokręgiem a aproksymujacymi je wielokątami jest - w miarę zwiększania liczby boków - coraz mniej-sza, a boki wielokątów coraz bliższe okręgowi. To musi oznaczać, że obwody kolejnych wielokątów

29„Analiza matematyczna (...) opierała swoje znaczenie i poczucie słuszności na związku z geometrią”.([38] str.289). Realizacją metafory geometryczno-liczbowej jest przestrzeń metryczna - podstawowy obiekt analizy matema-tycznej. Takiego metaforycznego wsparcia zabrakło przy konstrukcji kolejnego, większego zbioru liczbowego - liczbzespolonych. Takie liczby mają „część rzeczywistą” i „część urojoną” - imaginery part”. Liczba i jest urojona, bo jejkwadrat to −1... Dlatego o liczbach rzeczywistych uczymy w szkole a o liczbach zespolonych - nie.

30Augustin L. Cauchy (1789 - 1857) – francuski matematyk.31Takie działanie, to znana matematykom starożytnej Grecji metoda wyczerpywania pozwalająca na wyznaczanie

przybliżonych wartości obwodów i pól różnych figur. Archimedes wykorzystując 96-kąt wpisany w okrag pokazał, żeliczba π mieści się w przedziale 3 10

70 , 3171 .

Page 36: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 35

są coraz bliższe długości okręgu”.Czy rzeczywiście? Przeanalizujmy podobny przykład. Przyjmijmy, że wędrówka z A do B przez

trzeci wierzchołek trójkąta równobocznego - C - jest pierwszym elementem ciągu wędrówek aprok-symujących wędrówkę po prostej - wzdłuż odcinka z A do B:

A BAAAAA

C

Gdy zastąpimy ten trójkąt dwoma mniejszymi trójkątami równobocznymi to otrzymamy nową,„zygzakowatą” trasę wędrówki z A do B:

AAA

A BAAA

Gdy teraz zastąpimy każdy z tych dwóch trójkątów dwoma mniejszymi (postępując tak, jakprzed chwilą) to wyznaczymy kolejną trasę zygzakowatej wędrówki z A do B. I tak dalej... .

Wydaje się, że sytuacja jest taka jak poprzednio: suma pól figur ograniczonych odcinkiem ABi kolejnym zygzakami jest coraz mniejsza a trasy kolejnych wędrówek coraz bliższe prostej drodze zA do B. Zatem i długość zygzakowatej wędrówki, w miarę zwiększania liczby trójkatów, powinnazbliżać się do długości odcinka AB... . Ale przecież długość zygzakowatych wedrówek jest zawszetaka sama i równa podwojonej długości odcinka AB!Przekonanie, że „zmniejszając pole powierzchni zawartej między dwiema liniami łączącymi punktyA i B sprawiamy, że długości tych linii zbliżają się do siebie” okazało się naiwnością, iluzją.

Jak z tego wybrnąć32? Przede wszystkim musimy jasno powiedzieć jak rozumiemy „aproksy-mujący ciąg” liczbowy i jak definiujemy wielkość graniczną - liczbę związaną z takim ciągiem. Izrobić tak, by - w szczególności - uprawomocnić opisaną metodę obliczania liczby π 33.

Trudno uwierzyć, ale na precyzyjny matematyczny opis takiej „aproksymacji” trzeba było czekaćaż do XIX wieku. Taką definicję sformułował A. Cauchy34.

Cauchy za własność definiującą liczbowy ciąg aproksymujący (an : n ∈ N) uznał to, że wy-razy takiego ciągu są „od pewnego miejsca blisko siebie” - niezależnie od tego, jak rygorystycznierozumiemy „bliskość”. Matematycznie: dla dowolnej liczby m można wskazać numer nm taki, żebezwzględna różnica - liczba |ai − aj | jest mniejsza od 1

2m jeśli tylko i, j > nm . Dziś takie ciąginazywamy ciągami Cauchy’ego. A wielkość graniczna związana z takim ciągiem (an) to liczba ataka, że „prawie wszystkie” wyrazy tego ciągu są jej bliskie - ponownie niezależnie od tego jakprecyzyjnie zinterpretujemy „bliskość”35.Czy każdy ciąg Cauchy’ego wyznacza wielkość graniczną, czy aproksymuje pewną liczbę? Gdy my-ślimy o liczbach wymiernych to odpowiedź brzmi „nie”. Sens konstrukcji Dedekinda w tym, że gdymówimy o liczbach rzeczywistych to odpowiedź brzmi „tak” - w tym zbiorze każdy ciąg Cauchy’egoma granicę36.

32Można wywiesić białą flagę i uznać, że nie wszystkie „długości” dowolnych linii i stosunki (proporcje) międzytymi długościami można wyrazić liczbowo. Ale to by przeczyło przyjętej geometryczno-liczbowej metaforze.

33Liczba π wyraża stosunek między długością półokręgu a jego średnicą - to definicja pierwotna, geometryczna. Ama być liczbą rzeczywistą w sensie Dedekinda.

34Gwoli ścisłości: pierwszeństwo należało by przypisać B. Bolzano. Jednak jego praca opublikowana w 1816 roku„pozostała niezauważona” jak napisano w wikiedii. Cauchy przedstawił swoją definicję w 1821 roku.

35Matematycznie: dla dowolnej liczby m można wskazać numer km taki, że |as − a| < 12m jeśli tylko s ­ km.

Tak definiowaną „wielkość graniczną” nazywamy w matematyce krótko granicą ciągu. Moim zdaniem sens polskiegosłowa „granica” niezbyt dobrze przystaje do matematycznej treści jaką chcemy z nim związać. To słowo jest wpierwszej kolejności kojarzone z linią, której przekroczenie jest jakimś szczególnym krokiem - np. z granicą państwa.Odpowiada to bardziej angielskim słowom border lub frontier. A przecież matematyczny sens tego terminu nie w tym,że „przekraczamy granice” ale w tym, że owa granica to wielkość, do której możemy zbliżyć się dowolnie blisko (przezciąg aproksymujący) a której nie możemy osiągnąć. Anglicy mają łatwiej: słowa limit i border nie są synonimami.

36Nieco dokładniej: to stwierdzenie jest wnioskiem z omawianego twierdzenia Cantora. Mówiąc naukowo: prostarzeczywista to przestrzeń metryczna zupełna - każdy ciąg Cauchy’ego ma granicę - i ośrodkowa - każda liczba rze-czywista jest granicą ciągu Cauch’ego liczb wymiernych.

Page 37: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 36

Prosta rzeczywista jest ockhamowskim domknięciem prostej wymiernej ze względu na konstrukcje wiel-kości granicznych (granic ciągów Cauchy’ego). Akceptacja dedekindowskich liczb rzeczywistych to przy-znanie konstrukcjom granicznym pełni praw obywatelskich (w krainie matematyki).

Cantor nie miał wątpliwości. Pisał „continuum is the arithmetical continuum of all real numbers,defined by means of the method of the Dedekind cuts”. Prosta rzeczywista - continuum - to centralnyobiekt jego matematyki37.

Teoriomnogościowe continuum to w pewnym sensie ukoronowanie programu arytmetyzacji matematyki -stworzenia hierarchii podstawowych struktur liczbowych, której podstawą są liczby naturalne. Kolejne,bogatsze systemy są konstruowane z tych prostszych. Liczby rzeczywiste są „konstruowalne”, jeśli tylkozaakceptujemy aktualną nieskończoność - zastosowanie „konstruktora granic” odpowiedzialnego za two-rzenie liczb rzeczywistych wymaga dostarczenia mu nieskończonego argumentów - ciągu liczb wymiernychspełniających warunek Cauchy’ego38.

Jest jeszcze coś, co istotnie odróżnia liczby rzeczywiste od liczb naturalnych całkowitych i wy-miernych: te liczby nie mają - więcej: mieć nie mogą - swoich unikatowych nazw, identyfikatorów39

Nie są nazwami. Czym więc są?

Przestrzenie kartezjańskie

Liczby rzeczywiste - zbiór R - to geometryczna przestrzeń jednowymiarowa - prosta. R możeteż służyć jako skala (ciągłego) czasu.Aby modelować matematycznie płaszczyznę korzystamy z genialnego pomysłu Kartezjusza - utożsa-miamy punkty płaszczyzny z parami liczb rzeczywistych - ich współrzędnymi w pewnym, ustalanymarbitralnie, układzie współrzędnych. W ten sposób utożsamiamy płaszczyznę z iloczynem kartezjań-skim R×R. Podobnie modelujemy matematycznie przestrzenie trój- a nawet n-wymiarowe.

To fundament geometrii analitycznej, czyli badania obiektów geometrycznych metodami algebraicznymi(obliczeniowymi). Geometria budzi intuicję i wyobraźnię, liczby oferują mierzalność40.Wyjście poza wyobrażalną „przestrzeń trójwymiarową” i wejście w światy n-wymiarowe oznacza, żematematyka pozwala opisywać rzeczywistość niedostępną naszej intuicji i zmysłom...

Funkcje ciagłe

Ciągłe są nie tylko przestrzeń i czas. Ciągłe są też procesy. Matematyka chce je opisywać zapomocą funkcji ciągłych, których argumenty są punktami przestrzeni n-wymiarowej a wartościamiliczby rzeczywiste - funkcje postaci φ : Rn → R :

„Funkcja ciągła charakteryzuje się tym, że małym zmianom jej argumentu odpowiadają małezmiany wartości funkcji. Wykres funkcji ciągłej narysujemy bez odrywania ołówka od papieru”.

Ta intuicyjna charakteryzacja ciągłości funkcji długo i skutecznie opierała się matematycznejformalizacji. Np. Leibniz do opisu ciagłości funkcji używał wielkości nieskończenie małych, którejednak dla wielu były „ciałem obcym” w matematyce. Cantor nazywał je „bakcylami cholery, którezainfekowały matematykę” [10]41.

37„If the object of study is formed by the real numbers, then the real lineR, which is the real number set, could be theuniverse under consideration. Implicitly, this is the universe that Georg Cantor was using when he first developedmodern naive set theory and cardinality in the 1870’s and 1880’s in applications to real analysis. The only sets thatCantor was originally interested in were subsets of R”(http://en.wikipedia.org/wiki/Universe (mathematics).

38To nowa jakosć , bo w strukturach rekurencyjnych konstruktory są finitarne... .39Dlaczego tak jest stanie się jasne w przyszłości.40Krzywe stożkowe - okrąg, elipsę, hiperbole parabolę- greccy geometrzy definiowali korzystając z pojęcia odległości.

„Elipsa to zbiór punktów dla których suma odległości od dwóch ustalonych punktów jest stała”, „Hiperbola to zbiórpunktów, dla których wartość bezwzględna różnicy ich odległości tych od dwóch punktów jest stała”. Korzystajac zkartezjańskiego układu współrzędnych można te krzywe opisać jako zbiory rozwiązań równań algebraicznych drugiegostopnia z dwiema niewiadomymi.

41Nieskończenie małe - wielkości, które otaczają każdą liczbę rzeczywistą odgrywały kluczową rolę nie tylko w ana-lizie matematycznej Leibniza, ale również w jego koncepcjach filozoficznych (tzw. monady Leibniza)[10]. W internecie

Page 38: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 37

Akceptacja konstrukcji granicznych pozwoliła rozwiązać i ten problem Wystarczyło do tego (nie-banalne) pojęcie - „granicy funkcji f w punkcie a”:

liczba b jest granicą funkcji f w punkcie a jeżeli dla dowolnego ciągu an zbieżnego do a ciągwartości f(an) zbiega do b42

Piszemy wtedy b = limx→a f(x). Odtąd „ciągłość funkcji” będziemy rozumieli tak:„funkcja f : R → R jest ciągła, jeśli

f(a) = limx→a f(x)

dla każdej liczby rzeczywistej a43.Skoro każda liczba rzeczywista jest granicą pewnego ciągu liczb wymiernych, to każda rzeczy-

wista funkcja ciągła jest jednoznacznie wyznaczona przez to, jak działa na liczbach wymiernych44

I dlatego - tylko dlatego! - matematycy potrafią dodawać i mnożyć liczby rzeczywiste. Wystarczyłoprzyjąć, że te działania - rozpatrywane jako dwuargumentowe funkcje rzeczywiste - są ciągłe. Suma liczbrzeczywistych a i b, aproksymowalnych odpowiednio przez ciągi wymierne (an) i (bn), to liczba-granicaciągu (wymiernych) sum (an + bn). Podobnie z mnożeniem.W konsekwencji, wszystkie funkcje rzeczywiste wielomianowe są ciągłe. A twierdzenie Stone’a-Weierstrassa mówi, że każdą funkcję rzeczywistą ciągłą (określoną na przedziale domkniętym ) możnaprzybliżyć jednostajnie, z dowolną dokładnością, funkcjami wielomianowymi45.

Funkcje różniczkowalne

Jedno z najbardziej efektywnych (i efektownych) zastosowań konstrukcji granicznych to zde-finiowanie pojęcia pochodnej ciągłej funkcji rzeczywistej f w punkcie a: ta pochodna to liczbaf ′(a) - granica „ilorazu różnicowego” - funkcji danej wzorem f(x)−f(a)

x−a46. W oparciu o to pojęcie

zbudowano słownik umożliwiający precyzyjną analizę przebiegu (ciągłych) funkcji rzeczywistych- orzekania, gdzie - dla jakich punktów prostej rzeczywistej - taka funkcja rośnie (maleje) i jak„szybko” to się dzieje, gdzie ma lokalne ekstrema (maxima i minima), jak się zachowuje, gdy jej ar-gument „zmierza do plus (minus) nieskończoności”47. Ten język pozwolił też na klasyfikację funkcjiciągłych ze względu na ich (intuicyjnie jasną) „gładkość”48.Tak skonstruowany aparat badawczy pozwolił na odkrycie wielu dotąd ukrytych własności i za-leżności między nimi. Wśród nich chyba najbardziej zdumiewają te, które związane są ze słynnąliczbą „e” - liczbą Eulera.

Tę liczbę definiuje się jako granicę ciągu ((n+1n )n : n ∈ N). To niewymierna liczba rzeczywista49.

Funkcja wykładnicza f(x) = ex jest gładka - ma w każdym punkcie pochodną dowolnego rzędu.Co więcej: te wszystkie pochodne są jej równe! Stąd - na mocy słynnego wzoru Taylora - liczba ejest też granicą ciągu sum coraz to dłuższch sum ułamków budowanych za pomocą arytmetycznejoperacji silnia:

dostępna jest też książka J.L.Bella „The Continuous and the Infinitesimal in Mathematics and Philosophy”.42Ważna subtelność: tak ma być dla dowolnego ciągu (an) zbieżnego do a! Może on zbiegać do a z „lewej” lub

„prawej strony” a może też naprzemiennie. I m.in. dlatego funkcja może nie mieć granicy w pewnych punktach. Np.funkcja przyporządkowująca rzeczywistym liczbom dodatnim wartość 1 a pozostałym 0, nie ma granicy w punkcie 0.

43Nieco inaczej (prościej): dla dowolnej liczby a i ciągu liczb rzeczywistych (an) zbieżnego do a, ciąg wartości f(an)zbiega do granicy, którą jest liczba f(a)” - f(lim an) = lim f(an)

44Tę definicję ciagłości funkcji rzeczyywistej można łatwo uogólnić i mówić o ciągłości funkcji φ : Rn →R.45Co nie oznacza, że tak można aproksymować każdą funkcję ciągłą na całym zbiorze liczb rzeczywistych...46 Metafora geometryczno-liczbowa znowu pięknie się sprawdza: f ′(a) to współczynnik kierunkowy (miara „kąta

nachylenia”) prostej stycznej do wykresu funkcji f w punkcie (a, f(a)).47Badanie przebiegu funkcji to domena rachunku różniczkowego którego podstawy tworzyli równocześnie i nieza-

leżnie Newton i Leibniz. To jednocześnie potwierdzenie, że język Cantora, Hilberta (i innych np. Weierstrassa) wrazz akceptacją nieskończoności aktualnej i konstrukcji granicznych umożliwił uporządkowanie zastanej matematyki.

48Jeśli funkcja f ma pochodną w każdym punkcie - tzn. przyporządkowanie x → f ′(x) jest funkcją, to możnarozważać istnienie „pochodnej funkcji f ′ w punkcie a” nazywając ją drugą pochodną funkcji f w tym punkcie. I takdalej... .W „klasie gładkości” Ck są funkcje, które mają „pochodne rzędu ¬ k” w każdym punkcie. W klasie C∞znajdują się funkcje gładkie - takie, które mają pochodne wszystkich rzędów.

49„Bliska” liczbie wymiernej 2, 7182818. Ta stała zwana jest też liczbą Nepera.

Page 39: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 38

e = limk→∞(( 10! + 1

1! + 12! + · · ·+ 1

k!) ... .50

Dla zwolenników platonizmu te zaskakujące rezultaty to dowód, że oto mamy wreszcie język pozwalającyna odkrywanie zależności między „realnie istniejącymi obiektami matematycznymi” których w żaden spo-sób nie mogą dostrzec zwykli śmiertelnicy... . Zadziwienie, a czasem wręcz zdumienie takimi rezultatami,wynika zapewne stąd, że operowanie precyzyjnie definiowanymi „wielkościami granicznymi” to przywilejmatematyków. W językach naturalnych „granica nieskończonego ciągu” to tylko mglista intuicja.

Pięknie się ten puzzel ułożył... Genialne osiagnięcia Kartezjusza, Dedekinda, Cantora, Cau-chy’ego, Weierstrassa i wielu innych stworzyły świetne podstawy rozwoju analizy matematycznej.Stworzono język modelowania matematycznego, któremu w decydującej mierze zawdzięczamy osza-łamiające osiagnięcia nauki XX wieku, (prawie) we wszystkich jej dziedzinach.

Jednak to nie znaczy, że matematyczny spór o kontinuum został rozstrzygnięty. J.L. Bell w ar-tykule „Infinitesimals and the Continuum” zebrał wypowiedzi wielu matematycznych znakomitościdotyczących kontinuum. Warto je poznać. Choćby po to, by przestać wierzyć, że teoriomnogościowerozstrzygnięcie tej kwestii jest jedynie słuszne:

Ch.E.Peirce (1839-1914): „The very word continuity implies that the instants of time or the pointsof a line are everywhere welded together. The continuum does not consist of indivisibles, or points,or instants, and does not contain any except insofar as its continuity is ruptured.”H.Poincare (1854-1912): „Between the elements of a continuum there is a sort of intimate bondwhich makes a whole of them, in which the point is not prior to the line, but the line to the point”51

H.Weyl (1885-1955): „Exact time - or space - points are not the ultimate, underlying atomic ele-ments of the duration or extension given to us in experience. A true continuum is simply somethingconnected in itself and cannot be split into separate pieces: that contradicts its nature.”E.Brouwer (1881 - 1966)52: „The linear continuum is not exhaustible by the interposition of newunits and can therefore never be thought of as a mere collection of units”.R.Thom (1923-2002)53: „A true continuum has no points”.

Ponówmy pytanie: czy linia to zbiór punktów, czy też odrębny byt matematyczny? Pięknie -bo prosto - o tym fundamentalnym dylemacie napisał M. van Atten w artykule „Brouwer as neverread by Husserl” (Synthese 137, 3-19, 2003):

„Co bardziej przypomina linię: ziarna piasku ułożone jedno za drugim czy nić z topionego sera54?Klasyczna matematyka optuje za ziarnami piasku, linia prosta jest myślana jako nieskończony zbiórodrębnych punktów. Ale już Arystoteles zauważył, że to nie do końca jest słuszne: punkty się niełączą, więc gdzie tu jest ciągłość? Tymczasem ciągłość jest tym, co czyni linię linią. jak my tomodelujemy matematycznie? Leibniz zaintrygowany tym pytaniem doszedł tak daleko, że w1689 roku zadeklarował (cytat): „Są dwa labirynty ludzkiej myśli. Jeden to natura wolności a drugito budowa continuum”. I dodawał: „Oba mają to samo źródło - nieskończoność”55.

50Więcej: ex = limk→∞((x0

0! + x1! + x2

2! + · · ·+ xk

k! ) = limn→∞(n+xn

)n51intimate bond = intymna więź. Dla porządku dodajmy inną, (późniejszą(?)) wypowiedź Poincare: „Aby do-

wiedzieć się, co matematycy rozumieją przez continuum, nie należy zwracać się do geometrii (...). Analitycyuwolnili matematykę od wszelkich obcych pierwiastków, mogą zatem odpowiedzieć na pytanie, czym jest w istociecontinuum (...)? Continuum, tak rozumiane, jest zbiorem poszczególnych elementów, uszeregowanych w pewnym po-rządku; jest ich wprawdzie nieskończenie wiele, ale poszczególne elementy są całkowicie rozdzielone. Nie odpowiadato zwykłemu rozumieniu continuum, zgodnie z którym poszczególne elementy są połączone i tworzą całość, dziękiczemu nie punkt istnieje przed linią, lecz linia przed punktem.” [90].

52Luitzen E.J. Brouwer, matematyk holenderski. Jego aktywność naukowa trwała około 50 lat, od 1907 roku dokońca lat pięćdziesiątych XX wieku. O jego koncepcji matematyki rozwijanej w opozycji wobec matematyki Cantorai Hilberta już za chwilę.

53Rene Thom, francuski matematyk laureat nagrody Fieldsa (matematycznego Nobla) w 1958 roku.54W oryginale: „string of melted cheese”.55A my dodajmy jeszcze jedną wypowiedź Leibniza: „a point may not be a constitutive part of a line.”

Page 40: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 39

3.3.1 O continuum nieco inaczej

Dla oponentów Dirichleta i Cantora kontinuum to różny od zbioru byt matematyczny. To „matryca”na której są posadowione wszystkie liczby rzeczywiste jakie potrafimy skonstruować. Brouwer pisał:„Having recognized that the intuition of continuity, of ‘fluidity’, is as primitive as that of severalthings conceived as forming together a unit, the latter being at the basis of every mathematicalconstruction, we are able to state properties of the continuum as a „matrix of points to be tho-ught of as a whole” ([3],[63]). W innym miejscu doprecyzowuje: „matryca nieskonstruowanych(dotąd nieistniejących) punktów”56

Teoria mnogości operuje jednym pierwotnym pojęciem - zbiorem - i jedną relacją - przynależności zbiorudo zbioru, A ∈ B. W tej matematyce „istnieć” oznacza „być zbiorem”. Ockhamowski postulat wstrze-mięźliwości w kreowaniu bytów podstawowych zrealizowano tu w sposób skrajny.Uparte poszukiwanie jednego jedynego pierwotnego pojęcia jako podstawy całej matematyki może byćusprawiedliwione jedynie wiarą, że obcując z matematyką „dotykamy absolutu”... Obsesja? Religia?57.

Jak matematycznie opisać tę odmienną wizję continuum, tę „nić topionego sera?” Wyobraźmysobie prostą rzeczywistą inaczej - jako wiązkę wszystkich otwartych odcinków o wymiernych koń-cach58. Ta wiązka jest splątana - jeden odcinek może zazębiać się z drugim, być w nim zawartybądź mogą być one rozłączne.

Matematycy powiedzą, że te odcinki to baza zbiorów otwartych pewnej przestrzeni topologicznejposadowionej na zbiorze liczb rzeczywistych59.

Matematyczne kontinuum to właśnie ta przestrzeń topologiczna.

Ale nie wszyscy podzielali pogląd, że język topologii jest najlepszym narzędziem opisu ciagłości.H. Poincare pisał ostro: „Point set topology is a disease60 from which the human race will soonrecover” - za chwilę zrozumiemy, dlaczego.Uważny (czyli każdy) czytelnik tego tekstu też ma prawo czuć się zawiedziony: ten opis kontinuumnie jest niczym nowym w stosunku do propozycji Dirichleta: przecież aby taki obiekt skonstruować,musimy mieć do dyspozycji cały zbiór liczb rzeczywistych! To jest co najwyżej uzupełnienie opisukontinuum Dirichleta a nie nowa propozycja.

Trudno zaprzeczyć. Chyba, że zaczniemy mówić o topologii bezpunktowej:„(...) the main idea (of pointless topology - GJ) is to reverse the traditional conceptual

order of definitions in topology and define points as particular filters of neighborhoods ratherthen neighborhoods as particular set of points [100]”61.Podstawowa struktura topologii bezpunktowej to locale - uporządkowana struktura (L,¬) speł-

56Korzystając z kartezjańskiej fuzji geometrii i algebry możemy tę ideę próbować przybliżyć tak: traktujmy równanieax + by + c = 0 jako opis, specyfikację prostej. Każde (konstruktywne) rozwiązanie tego równania to punkt - paraliczb. Prosta (jej równanie) istnieje niezależnie od zbioru rozwiązań tego równania.

57Tę skrajną oszczędność w wyborze pojęć podstawowych projektowanej uniwersalnej teorii G. Chaitin tłumaczytak: „Remember that Spinoza has a philosophical system in which the world is built up of only one substance, andthat substance is God, thats’s all there is. Zermelo-Fraenkel set theory is similar. Everything is set, and everythingis built up of the empty set. That’s all there is: the empty set, and sets built out of the emptyset” [20]

Benedykt Spinoza (1632 - 1677 ) - filozof niderlandzki, twórca systemu filozoficznego, który zakładał, że „istniejetylko jedna substancja stanowiącą podstawowy budulec wszechświata. Substancja ta musi istnieć sama przez się imusi być pierwotna w stosunku do wszelkich swoich atrybutów. Musi być nieskończona, istnieć samoistnie (nie byćstworzona) i być przyczyną istnienia wszystkich innych bytów – czyli musi być wszechmocna. Nie może to być zatemnic poza Bogiem.” (cytat z wikipedii).

58Odcinek otwarty, to odcinek bez końców, np. (0, 1) = x ∈ R : 0 < x < 1.59Przestrzeń topologiczna to zbiór X, w którym z każdym elementem x ∈ X związana jest rodzina jego otwartych

otoczeń - wyróżnionych podzbiorów X zawierających x i spełniająca pewne, w tej chwili nieistotne, warunki. Wnaszym przykładzie otoczenia punktu-liczby rzeczywistej to odcinki otwarte o wymiernych końcach które ją zawierają.Podzbiór przestrzeni topologicznej jest otwarty, jeśli wraz z dowolnym punktem zawiera jego pewne otoczenie.

60choroba, przypadłość61Pointless topology v. point set topology. Ta „nowa” topologia powstała w latach osiemdziesiątych XX wieku,

choć niektórzy upatrują jej początków już w latach pięćdziesiątych, w pracach Ehresmanna [51].

Page 41: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 40

niająca pewne warunki62. „Punkty” są tu pojęciem wtórnym - są one wyznaczone przez specjalnepodzbiory zbioru L zwane zupełnymi filtrami pierwszymi...

Nie mam zamiaru torturować mniej zaawansowanych matematycznie abstrakcyjnymi definicja-mi. Powiedzmy tylko, że otwarte otoczenia dowolnego punktu na prostej rzeczywistej tworzą takifiltr. I to jest istota „odwrócenie kierunku myślenia”: w klasycznej topologii punkt wyznacza filtr(otoczeń otwartych), w topologii bezpunktowej - filtr wyznacza punkt (który otacza).

Jak wygląda ów „bezpunktowy opis continuum”, czyli „locale of real numbers”? To proste:wystarczy uwolnić opis opisanej wcześniej wiązki odcinków otwartych o końcach wymiernych ododwołań do dedekindowskich liczb rzeczywistych. Zrobimy to zastępując każdy odcinek otwarty(a, b) (czyli zbiór liczb rzeczywistych) przez wyznaczajacą jego „końce” parę liczb wymiernych (a, b).Powiemy, że (a, b) ¬ (c, d) gdy a ¬ c < d ¬ b. Tak uporządkowana struktura par liczb wymiernychto jest poszukiwane locale liczb rzeczywistych, continuum opisane jako „prosta bezpunktowa”63.

„(...) we are going to regard the real numbers as locale rather then a space. The basic idea ofthe following definition is that, assuming the set of rationals as given, we wish to make the set ofopen intervals with rational endpoints into a site for open-set locale of R” [51], str. 123.

„Locale liczb rzeczywistych” to struktura, w której mogą być osadzone liczby rzeczywiste: „Weylsays that the point or real number in this sense is only though or conceived” [3]64. Aby w miejscu„wskazanym” przez filtr znalazła się liczba, musimy ją skonstruować. Tak interpretowane localeliczb rzeczywistych to brouwerowska „matryca dotąd nieskonstruowanych liczb rzeczywistych”.

Liczby wymierne potrafimy konstruować, pary takich liczb też. Locale liczb rzeczywistych jest więc wpewnym sensie (finitarnie) konstruowalne.

Jeśli pominąć kwestię, czy filtry to punkty, czy też jedynie wskazują ich lokalizacje, to ostatecz-ny efekt obu konstrukcji - Dedekinda i tej odwołującej się do topologii bezpunktowej - jest takisam. O co więc kruszyć kopie?Jako robotnicy matematyki nie musimy wybierać. Możemy korzystać z obu opisów. Jak pokazaławspółczesna fizyka, dwoistość w opisie nawet najbardziej fundamentalnych obiektów nie musi pro-wadzić do konfliktu65. Jednak taki kompromis jest trudniejszy, gdy mówimy o podstawach matema-tyki. Te dwie propozycje obrazują różnicę między hilbertowską a brouwerowską wizją matematyki.Będziemy o tym mówili już w kolejnym rozdziale.

Dlaczego koncepcja kontinuum Dedekinda i Cantora dominuje we współczesnej matematyce?Po pierwsze, dzięki odwołaniu do metafory geometryczno-liczbowej jest przyjazna. Nie można tegolekceważyć. Nauka nie rozwija się w próżni. Wpływu tradycji (przyzwyczajeń) doświadczył jużKopernik przeciwstawiając się ponadtysiącletniej tradycji ptolemeuszowskiej66.

62Dla lepiej zorientowanych: jest to krata zupełna dystrybutywna. Nazwa „locale” nie ma polskiego odpowiednika.Ten sam obiekt może być też nazwany „frame” albo „zupełna algebra Heytinga”.

63W naszym opisie jest (zbyt?) wiele uproszczeń. Zainteresowanych odsyłam na stronę http://ncatlab.org/nlab/show/locale+of+real+numbers.

64though or conceived = zamierzone lub pomyślane. H.Weyl (1885-1955) - niemiecki matematyk, fizyk i filozof.Zwolennik konstruktywizmu matematycznego. Gwoli ścisłości: Weyl nie myślał o konstrukcji ”możliwych lokalizacjipunktów” za pomocą filtrów, ale o czymś bardzo podobnym: „We could try to approach a durationless point in thisintuitive continuum by an infinite sequence of nested rational intervals the length of which converges to 0.(...) ).

65Nawiązuję tu do dualizmu korpuskularno-falowego, którego odkrycie i zaakceptowanie przez fizyków umożliwiłopowstanie fizyki kwantowej.Dodajmy, że dualność opisu kontinuum jest też akceptowana poza matematyką: w Słowniku PWN znajdujemy takieoto objaśnienie, zręcznie godzące obie koncepcje: kontinuum - ciągły, uporządkowany zbiór nieskończonej liczbyelementów przechodzących płynnie jeden w drugi.

66A o zderzeniu Maxa Plancka z XIX-wieczną fizyką w [98] napisano tak: „jego wyjaśnienie wydawało się bardziejzagmatwane niż problem, który miało wyjaśnić (chodzi o zjawisko promieniowania cieplnego, które M. Planck objaśniłwprowadzając „sztucznie” pewną stałą, zwaną dziś stałą Plancka - GJ). Teoria Plancka wydawała się śmieszna. Niktsię, co prawda, nie śmiał, bo Herr Professor Planck był zbyt ważnym człowiekiem. Jego sugestie przeskoków kwan-towych zostały po prostu zignorowane. (...)Sam Planck zgodził się z tymi obiekcjami i obiecał dalsze poszukiwania.Prawie niezauważona rewolucja kwantowa przeprosiła za swe nadejście.”

Page 42: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 41

Po drugie, jej podstawowa warstwa pojęciowa jest genialnie prosta. A Leibniz mówił, że modelerzeczywistości powinny być od niej prostsze, bo tylko tak można dostrzec istotę rzeczy i zjawisk.Po trzecie wreszcie, ta koncepcja to, jak już wspomnieliśmy, fundament analizy matematycznej,niezwykle skutecznego narzędzia modelowania świata.

„Bezpunktowa” koncepcja kontinuum nie może przeciwstawić tym argumentom własnych, świad-czących na jej korzyść. Jest trudna, wymaga już na starcie akceptacji wielu złożonych pojęć.Warto jednak wspomnieć o pewnej przewadze topologicznej koncepcji kontinuum. Otóż Cantorpokazał, że prosta rzeczywista R jest równoliczna z płaszczyzną reprezentowaną jako iloczyn kar-tezjański R×R. A to oznacza, że z teoriomnogościowego punktu widzenia te dwa zbiory są takiesame - nie można w języku teorii mnogości sformułować własności, która rozróżnia prostą i płasz-czyznę (choć „każdy widzi”, że są różne...). Rzeczywistość teoriomnogościowa okazała się różna od„rzeczywistości rzeczywistej”... . To odkrycie zapewne zaskoczyło (zasmuciło? ucieszyło?) Cantorai sprowokowało go do słynnego stwierdzenia „widzę, ale nie wierzę”. Teoria mnogości nie radzi sobiez „wymiarem (ciągłej) przestrzeni”.

A Brouwer dowiódł, że prosta i płaszczyzna, postrzegane jako przestrzenie topologiczne, wcalenie są takie same - nie są „homeomorficzne”...

3.3.2 Liczby p-adyczne

A gdyby tak uwolnić się od tej geometryczno-liczbowej metafory? Definiowanie liczb rzeczywistychza pomocą ciągów Cauchy’ego oparte jest na geometrycznym wyobrażeniu odległości między licz-bami wymiernymi. A gdyby tę odległość zdefiniować inaczej?67. To możliwe.

Z każdą różną od zera liczbą wymierną amożna jednoznacznie związać liczbę całkowitą c taką, żea = 2c · qr gdzie q i r to całkowite liczby nieparzyste. Wykorzystając ten fakt zdefiniujemy odległośćmiędzy liczbami wymiernymi tak: d2(x, y) = 2−n, gdzie x− y = 2n · qr a q i r to nieparzyste liczbycałkowite68. Ta nowa miara odległości jest istotnie różna od „metryki euklidesowej”. Wystarczypomyśleć o „otoczeniu zera o promieniu 1” w tej metryce - są w nim wszystkie liczby całkowiteparzyste, wszystkie liczby całkowite nieparzyste są na jego brzegu a liczby wymierne postaci 1

2n

są poza nim. To zdecydowanie mniej intuicyjne niż takie otoczenie zera w metryce euklidesowej -odcinek (−1, 1) na prostej rzeczywistej.

Posługując się tą nową metryką możemy powtórzyć konstrukcję Cauchy’ego: wyróżnimy ciągiCauchy’ego i uzupełnimy zbiór liczb wymiernych dokładnie tak, jak w klasycznym przypadku. Takzbudowany zbiór liczb 2-adycznych jest jednak istotnie różny od zbioru liczb rzeczywistych (choćjest z nim równoliczny)!69 Np. ciąg (2n : n ∈ N) jest teraz ciągiem Cauchy’ego. Ale nie wyznacza2-adycznej liczby niewymiernej bo jest zbieżny do 070. Nie można też zdefiniować „2-adycznej liczbye” tak jak w zbiorze liczb rzeczywistych... .

„Matematyk jest wynalazcą nie odkrywcą” (Wittgenstein). Wynalazł konstrukcję graniczną która - jakkażde dobre narzędzie - może być stosowana na wiele różnych sposobów...71.

„p-adic numbers are “far removed from our everyday intuitions”, Scholze said. Over the years,though, they have come to feel natural to him. “Now I find real numbers much, much more confusingthan p-adic numbers. I’ve gotten so used to them that now real numbers feel very strange.”72.

67Liczba |x − y| to odległość między liczbami wymiernymi x i y wyobrażonymi jako punkty (przyszłej) prostejrzeczywistej. Mówiac naukowo, metrykę euklidesową w zbiorze liczb wymiernych chcemy zastąpić inną metryką.

68Dodatkowo d2(0, 0) = 0.69Aby skonstruować zbiór liczb p-adycznych wystarczy zastąpić 2 przez liczbę pierwszą p.70Co więcej: nieskończona suma (suma szeregu) 1 + 2 + · · ·+ 2n + · · · jest tu równa... −1.!71Dla równowagi: „czy matematykę wymyślamy czy odkrywamy? Czy matematycy tylko tworzą skomplikowane

konstrukcje umysłowe, które (...) tak dalece ogłupiają nawet ich twórców, że wierzą w ich realność? Czy też matema-tycy odkrywaja prawdy już istniejące? (...) Jak sądzę, jest jasne, że (...) jestem zwolennikiem tego właśnie poglądu”- R.Penrose [85], str. 118

72Quanta Magazine,The Oracle of Arithmetic. Peter Scholze and the Future of Arithmetic Geometry3, 2016. PeterScholze (1987- ). Za przełomowe wyniki w dziedzinie arytmetycznej geometrii algebraicznej,teorii liczb, oraz topologii

Page 43: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 3. PRZESTRZEŃ - MATEMATYCZNIE 42

Ale po co nam to? Ponieważ nie czuję się zbyt pewnie w tych rejonach matematyki, wykpięsię cytetem z wikipedii: „liczby p-adyczne znajdują zastosowanie w teorii liczb, w tym w słynnymdowodzie Wielkiego Twierdzenia Fermata odkrytym przez Andrew Wilesa”.

3.3.3 Liczby zespolone

Liczby rzeczywiste, choć to twór doskonały, mają też swoje wady. Np. nie potrafimy - w R - rozwią-zać równania x2 = a gdy a < 0. Ale ten kłopot rozwiązano - rozwiązali algebraicy - zadziwiającoprosto: wystarczyło „uznać istnienie” rozwiązania równania x2 + 1 = 0 , oznaczyć tę „liczbę” przez„i” i nazwać ją - chroniąc resztki zdrowego rozsądku - liczbą urojoną.Mniej mistycznie: liczby zespolone to pary liczb rzeczywistych. Algebraiczny cel - istnienie miejsczerowych dowolnych wielomianów - zapewnia odpowiednio zdefiniowane dodawanie i mnożenie ta-kich par73.Rozszerzenie operacji dodawania i mnożenia jest stosunkowo proste. Ale z innymi nie jest już takprosto. No bo jak rozumieć potęgę az , gdzie a to dodatnia liczba rzeczywista a z to dowolna liczbazespolona? Tu znaleziono rozwiązanie równie wspaniałe co dyskusyjne. Wspomniany już wcześniejwzór Taylora pozwala udowodnić równość

ex =∑∞n=0

xn

n!

dla dowolnej liczby rzeczywistej x. Teraz łatwo o uogólnienie - wystarczy podstawić argumentzespolony w miejsce rzeczywistego i uznać to za definicję tej funkcji wykładniczej o argumentachzespolonych.

Ta pozornie proste i formalne rozwiązanie problemu ma niesamowite konsekwencje, które zdra-dza taka rowność:

ea+bi = ea · ebi = ea(cos b+ i sin b),

dla dowolnej liczby rzeczywistej z = a+ bi . Geometrycznie: aby znaleźć punkt płaszczyzny repre-zentujący ea+bi dla wystarczy - w świecie liczb rzeczywistych - obliczyć ea a potem - na okręgu opromieniu ea - znaleźć punkt wyznaczony jednoznacznie przez parę (cos b, sin b)74.

Pięknym zwieńczeniem tych konstrukcji jest przesławna tożsamość Eulera:

eπi = −1

Jest tu wszystko: geometryczne π, algebraiczne i i „graniczne” e... . A przecież tego wszystkiego by niebyło, gdyby nie akceptacja konstrukcji granicznych.

Ta krótka wzmianka o liczbach zespolonych koncentrujaca sie na problemie algebraicznej do-mkniętosci jest nieco kompromitująca (autora). Trzeba by tu napisać np. o zdumiewającej roli liczbzespolonych w mechanice kwantowej. Może kiedyś...

algebraicznej został on nagrodzony medalem Fieldsa w 2018 roku.73(a, b) · (c, d) = (ac − bd, ad + bc), (a, b) + (c, d) = (a + c, b + d). i to para (0, 1). Liczba rzeczywista a jest tu

reprezentowana przez parę - liczbę zespoloną (a, 0) Zauważ, że te działania ograniczone do liczb rzeczywistych - parpostaci (a, 0) - to „zwykłe” dodawanie i mnożenie. Zazwaczaj zamiast (a, b) piszemy a+ bi.

74Gładka jest nie tylko funkcja rzeczywista ex ale też trygonometryczne funkcje sinus i cosinus. To oznacza, że -korzystając ze wzoru Taylora - dla dowolnej liczby x wielkości ex, sinx, cosx można przedstawiać jako „nieskończonesumy”. To jest początek dość długiej i wyboistej drogi prowadzącej do udowodnienia tej równości. Dla porzędkudodajmy: dla dowolnej liczby rzeczywistej c > 0 i liczby zespolonej z, cz = ez ln a.

Page 44: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 4

Spór o istotę matematycznego bytu

Zobacz! Oto ludzie są niby w podziemnym pomieszczeniu na kształt jaskini.Do groty prowadzi wejście zwrócone ku światłu (...). W niej oni siedzą (...)przykute mają nogi i szyje tak, że trwają na miejscu i patrzą tylko przedsiebie. (...) Z góry pada na nich światło ognia, który się pali za ich plecami(...) czy myślisz, że tacy ludzie mogli by z siebie samych i z siebie nawzajemwidzieć coś innego oprócz cieni, które ogień rzuca na ścianę jaskini?

Platon, Państwo

Pytania: „czy istnieje nieskończony zbiór liczb naturalnych?” „czy istnieje liczba rzeczywista(która jest luką w zbiorze liczb wymiernych)?” prowokują do postawienia kolejnego: „co to znaczy„istnieć”? Bez obaw: nie zamierzam dyskutować tego problemu in extenso. Interesuje nas pytanie:„czym jest istnienie matematyczne”?

O dziele Cantora i Hilberta mówi się często jako o uporządkowaniu podstaw matematyki. Jestwięc oczywiste, że musieli oni odnieść się do problemu matematycznego istnienia. Szukając określeńopisujących zwięźle „ideową podstawę” tego porządkowania, można bez większego ryzyka stwier-dzić, że był to platonizm wsparty przez rygorystyczny formalizm.

Platon1 stworzył system filozoficzny2, oparty na założeniu, że prawdziwe byty to idee. Wiecz-notrwałe i niezmienne. Rzeczywistość materialna jest tylko ich odbiciem. Nie odnajdziemy w niejidealnego kwadratu, więc

√2 jest bytem idealnym, posiadającym niedoskonałe realne odbicia. Ma-

tematyka miała odnosić się do bytów idealnych wprost, pomijając rzeczywistość. Pojęcia geometriieuklidesowej - punkt, prosta - należą do tego idealnego świata. „Poznanie geometryczne dotyczytego, co istnieje wiecznie”3. Platon widział w matematyce sposób poznania świata idei niepozna-walnych inaczej niż za pomocą rozumu. Używając dzisiejszego języka powiemy: jeśli chcemy wyjśćpoza zmysłowe poznanie rzeczywistości, musimy stworzyć jej abstrakcyjny, „idealny” model.

Uznanie transcedentnego istnienia świata idei zdawało się starożytnym warunkiem koniecznym, by ma-tematyka stała się nauką normatywną, której zadaniem jest ustalanie tego, co winno być (czylinorm) a nie tego, co jest (i co jest domeną nauk deskryptywnych).Dziś, zamiast o ideach, mówimy raczej o „pojęciach abstrakcyjnych”4. Nie potrzebujemy ich niezależnegotranscedentnego istnienia. Przyjmujemy, że mamy prawo do ich tworzenia - w sferze języka. Kreujemy jena podstawie obserwacji „podobnych” obiektów, abstrahowania od tego, co je różni i eksponownia tego,co dla nich wspólne.

1Platon (427 p.n.e. - 347 p.n.e.) był twórcą pierwszej naukowej instytucji - akademii platońskiej, która przetrwałaaż do 529 roku, kiedy została zamknięta przez cesarza Justyniana I. Tenże cesarz wydał kodeks praw zawierającyparagraf „O złoczyńcach, matematykach i tym podobnych osobnikach”, głoszący m.in., że „potępienia godna sztukamatematyczna jest zakazana przede wszystkim”. Cesarz Justynian zyskał przydomek „Wielki”... .Jednym z „absolwentow akademii platońskiej był (najprawdopodobniej) Euklides.

2Zwany dziś idealizmem platońskim. Uwaga: przywołując w tym tekście poglądy filozofów (Platona, Kanta iinnych) mówię o moim subiektywnym odbiorze ich idei i koncepcji. Nie przypisuję sobie prawa do obiektywnego ipełnego przedstawiania ich poglądów. I nie trzeba się ze mną zgadzać.

3Platon, Państwo.

43

Page 45: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 44

Tak postrzegany świat idei - pojęć abstrakcyjnych - to model rzeczywistości, który - jak powiedział dwatysiące lat później Leibniz - jeśli ma być doskonalszy od rzeczywistości, musi być od niej prostszy.

Wiemy, że nieskończoność aktualna nie mieści się w świecie platońskich idei5. Jak to się stało, żeporzucono to samoograniczenie? Aby to zrozumieć, trzeba sięgnąć do Kanta i jego teorii poznania:

(...) „rozum nie jest w stanie ograniczyć swojego poznania do obszaru możliwego doświadczenia.Dąży do poznania rzeczy samych w sobie, dokonuje operacji abstrahujących i systematyzujących,czego rezultatem są idee (czystego rozumu)”6.

Wyjaśnijmy, barbarzyńsko upraszczając, naturę owych idei. Opisując rzeczywistość formułujemysądy, które Kant dzielił na:- syntetyczne, a posteriori czyli te, które są skutkami doświadczeń,- analityczne, a priori, które są niezależne od doświadczenia.

Rzeczy obserwujemy, nazywamy, opisujemy i badamy dociekając logicznych związków między opisami7.Euklides dokonał syntezy doświadczeń swoich poprzedników (i własnych), które doprowadziły go dosformułowania aksjomatów geometrii (zwanej dziś euklidesową). To są sądy syntetyczne.Sądy analityczne to - w tym przypadku - twierdzenia dotyczące obiektów geometrycznych, które potrafimylogicznie uzasadnić odwołując się do sformułowanych wcześniej aksjomatów8.

Kant wyróżnił też kategorię sądów syntetycznych a priori - niezależnych od doświadczenia,rozumianego jako obserwacja realnego świata. Od sądów analitycznych - logicznie uzasadnionychkonsekwencji aktualnej wiedzy - różnią się tym, że formułują nowe idee - idee czystego rozumu.Zdolność do formułowania sądów syntetycznych a priori to istota naukowego procesu poznania.

Wolno (należy) tworzyć abstrakcyjne pojęcia, gdy przybliżają poznanie istoty rzeczy. Na różnychpoziomach. Nie tylko na podstawowym, pozostającym w ścisłym związku z oglądem rzeczywistości.Na wyższych poziomach kreujemy nowe pojęcia („jedności”) próbując uchwycić zależności międzypojęciami niższego poziomu.Poznania tej hierarchicznej struktury nie można wesprzeć rzeczywistym doświadczeniem.

Akceptacja idei czystego rozumu stworzyła nową perspektywę dla dyskusji o nieskończoności. Wolną odposzukiwania uzasadnień w rzeczywistym świecie i pytań w stylu: „czy ktoś widział nieskończoność?”Koncepcja Kanta to kulminacja nurtu w nauce zapoczątkowanego przez Platona9. Nurtu, który za celnauki uznawał poznanie rzeczywistości nie wprost, przez doznania zmysłowe, ale przez budowanie modeliwykraczających poza dosłowne odwzorowanie rzeczywistości. To woda na młyn matematyków. Oni „odzawsze” (od Pitagorasa) szukając prawdy wychodzili poza obszar fizycznego doświadczenia.

Kant utwierdza ich w słuszności takiego postępowania mówiąc, że to konieczne, jeśli chcemy przybliżyćpoznanie „rzeczy samej w sobie”10.

4To tylko sugestia, zdradzająca mój pogląd na matematykę. Matematyczni realiści (platonicy) wciąż podpisują siępod deklaracją Platona: „nazwy (...) stanowią jedynie obraz rzeczywistości, nigdy nie mogą jej zastąpić. Język jestjedynie narzędziem obrazowania świata.” [26].

5Przypomijmy wspominany wcześniej „horror infiniti”.6C S. Sztajer -http://mumelab01.amu.edu.pl/SKH/S.Sztajer.html8Russell pisał: „(...) bezpośrednio znamy to, co uświadamiamy sobie wprost, bez pośrednictwa wnioskowań czy

pewnej znajomości prawd. Tak więc, bezpośrednio znam dane zmysłowe” (cytuję za artykułem M. Łełyka „Epistemo-logia i logika jako dwa źródła krytyki języka. Filozofia Bertranda Russella w okresie atomizmu logicznego”(internet)).

9Stawianie tak blisko siebie Platona i Kanta może dziwić a nawet gorszyć. Wszak Platon myślał o odkrywaniutranscedentnego świata idei a Kant o kreowaniu języka modelującego rzeczywistość. Różne motywacje, ale rezultatynie tak znów odległe.

10G.W.Hegel (1770-1831) pisał: „Rzecz sama w sobie (...) oznacza przedmiot, o ile abstrahuje się od wszystkiego,czym on jest dla świadomości, od wszystkich jego określeń czuciowych, jak też od wszystkich dotyczących go okre-ślonych myśli.” W skrajnej wersji poznanie rzeczy samej w sobie ma być wolne od ograniczeń jakie niesie język.Skoro zabrnęliśmy tak daleko, to dodajmy jeszcze cytat z pracy doktorskiej A. Pietras „Postneokantowskie projektyfilozofii Nicolai Hartmann i Martina Heideggera” (internet): „(...) Kant wyraźnie sprzeciwia się przenoszeniu metodwłaściwych dla poznania matematycznego na grunt metafizyki. Wskazuje on na specyfikę poznania metafizycznego,

Page 46: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 45

4.1 Koncepcja Hilberta

Największym odkryciem XIX wieku było wynalezienie metody odkrywania.A. N. Whitehead, Science and Modern World

From the range of the basic questions of metaphysics we shall here ask thisone question: “What is a thing?” The question is quite old. What remains evernew about it is merely that it must be asked again and again.

Martin Heidegger, What is a thing?

Ponad sto lat później, genialną - i jak się mogło zdawać, ostateczną - odpowiedź na rozważanetu pytanie zaproponował Hilbert. Sformułował on fenomenalnie proste kryterium istnienia „bytumatematycznego” [106]:

„if the arbitrarily given axioms do not contradicts each other (...) then the object defined throughthe axioms exists. That, for me, is the criterion of true and existence”11

To jest istota, manifest tzw. realizmu pojęciowego12. Pogląd Hilberta podzielał Poincare: „Twórmatematyczny istnieje zawsze, jeśli tylko jego definicja jest wolna od sprzeczności wewnętrznych inie prowadzi do sprzeczności z przyjętymi twierdzeniami”[90].

Przeanalizujmy dokładnie, jak czekiści13, ten manifest. Aksjomatem może być każde zdanie ję-zyka w którym opisujemy przedmiot badań i któremu możemy przypisać wartość logiczną - prawdęlub fałsz. Teoria to dowolny zbiór takich zdań.Stwierdzenie: „(...) dowolnie wybrane aksjomaty” nie oznacza przyzwolenia na ich absolutnie arbi-tralny wybór ale jest potwierdzeniem prawa do swobody twórczej. „Hilbert nigdy nie twierdził, żematematyka jest systemem sformalizowanym14 - dla niego była to tylko rekonstrukcja istnie-jącej matematyki dokonywana w pewnym określonym celu” [76]. Hilbert przyjął jako oczywistezałożenie, iż tworzenie bytów matematycznych będzie rezultatem odpowiedzialnych działań.

Czytajmy dalej: „jeśli dowolnie wybrane aksjomaty nie są wewnętrznie sprzeczne (...) to istniejeobiekt przez nie definiowany”. Uprawomocnieniem istnienia jest wyłącznie niesprzeczny opis.Hilbert odrzucił wszelkie inne kryteria sensowności teorii. Zapewne nie chciał mieszać do budowypodstaw matematyki kryteriów „miękkich”, niosących ryzyko niejednoznacznych interpretacji. Takaformuła czyniła z matematyki naukę otwartą, zdolną do ekspansji, rozszerzania zakresu badań.

Hilbertowski formalizm odebrał matematyce wiele z jej mistycyzmu. Uznanie istnienia świataplatońskich idei przestało być warunkiem koniecznym uprawiania matematyki. Zamiast odkrywać,zaczęliśmy tworzyć. Relacja między matematyką a światem wiecznotrwałych idei przestała byćkryterium poprawności działań matematyków. W tej roli zastąpił go formalizm - wiara, że potrafimykontrolować własne dzieło i unikać sprzeczności.

Nie do końca... „Hilbert was at heart a Platonist.(...) His formalism was primarily a tactic in his battleagainst Brouwer’s intuitionism” [82]. Jego wizja matematyki to realizacja koncepcji, którą w filozofiimatematyki określa się jako matematyczny realizm15.„Trudno nie wierzyć w nic”. Trudno nie wierzyć w obiektywne istnienie czegoś, czego badaniu poświęciłosię całe życie... . Matematyka domaga się choć odrobiny (subiektywnego) realizmu16.

któremu przypisuje zadanie analizy, a nie (jak w matematyce) konstrukcji, pojęć. „Zadaniem filozofii jest rozbiór,precyzowanie, i określanie pojęć, które są dane jako niejasne. Zadaniem matematyki jest łączenie i porównywaniepojęć dotyczących wielkości, które są jasne i pewne, aby zobaczyć, co z tego może być wywnioskowane.” (...) O ile więcw matematyce chodzi o to, by przedstawić najpierw jasne definicje podstawowych pojęć, by w oparciu o nie rozwijaćnasze poznanie za pomocą syntezy, o tyle w filozofii nie należy zaczynać od definicji, gdyż cel tej nauki jest inny.”Pamiętajmy, że te uwagi Kanta odnoszą się do matematyki jego czasów, która była w większości konstruktywna.

11Pogląd Hilberta nie był aż tak rewolucyjny. Np. w [80] znaleźć można w artykuł P.Vopenki „Zbiory aktualnienieskończone”, w którym Autor przywołuje taką oto wypowiedź Bolzano: „Niemożliwym trzeba nazwać to, co przeczyjakiejś prawdzie czysto pojęciowej: możliwym przeto to, co nie jest w sprzeczności z żadną prawdą czysto pojęciową”.

12Dziś hilbertowską koncepcję nazywa się koherencyjną teorią prawdy (koherencja (łac.) = spójność, spoistość).13CzeKa - Wszechrosyjska Komisja Nadzwyczajna do Walki z Kontrrewolucją, Spekulacją i Nadużyciami Władzy.14Skąd już niedaleko do prześmiewczego twierdzenia, że matematyka to „kolekcja rebusów”...

Page 47: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 46

Większość matematyków nie roztrząsa dylematu „formalizm czy platonizm” godząc jedno z drugim.Matematycy są pragmatyczni.Być może to ta dwoistość, ten platońsko-formalistyczny charakter koncepcji Hilberta zadecydował, że odponad stu lat zajmuje ona centralne miejsce w matematyce...17.

Czym jest hilbertowska „niesprzeczność teorii”? Zgodnością z rzeczywistością? Nic z tych rzeczy:

Sprzeczność teorii to możliwość jednoczesnego uzasadnienia (udowodnienia) na jej podstawiepewnego stwierdzenia i jego zaprzeczenia. A niesprzeczność to zaprzeczenie sprzeczności.Niesprzeczność matematycznej teorii jest zawsze tylko niesprzecznością wewnętrzną.

o niesprzeczności rozstrzyga się w sferze logiki.Hilbert wyznaczył logice rolę gwaranta obiektywnego charakteru procesu poznania matematycznego.Sformalizowane dowodzenie miało stać się synonimem prawdziwości. Hilbert był przekonany, że będzie-my potrafili w sposób sformalizowany (czyli obiektywny i pewny ) dowodzić niesprzeczności budowanychteorii - „(...) consistency of the comprehensive formalized system is to be proved by using only restricted,uncontroversial and contentual finitistic mathematics” [95]. Utwierdzały go w tym przekonaniu dotych-czasowe osiągnięcia matematyki a także - a może przede wszystkim? - wiara w możliwości człowieka.

Rozstrzyganie o niesprzeczności teorii to nie jedyna rola przypisana logice w koncepcji Hilberta.Skoro byty matematyczne nie są materialne, to musimy się zgodzić, że:

Byt matematyczny jest tym, co można o nim powiedzieć18

Jeśli żadne z pary przeciwstawnych zdań (φ,¬φ)19 nie jest konsekwencją niesprzecznej teorii T , tomożna rozpatrywać dwie bogatsze i niesprzeczne teorie T ∪φ oraz T ∪¬φ. Tę procedurę możnapowtarzać i budować drzewo rozszerzeń teorii T :

T

&&xxT ∪ φ1

vv

T ∪ ¬φ1

((T ∪ φ1, φ2

yy

T ∪ φ1,¬φ2

''

T ∪ ¬φ1, φ2 T ∪ ¬φ1,¬φ2

Każdą gałąź tego drzewa można przedłużać do czasu, gdy na jej końcu (liściu) pojawi siępełna niesprzeczna teoria - taka, której dowodliwą konsekwencją jest dokładnie jedno z każdej pary

16„Mathematical realism, (...) holds that mathematical entities exist independently of the human mind. Thushumans do not invent mathematics, but rather discover it (...) In this point of view, there is really one sortof mathematics that can be discovered; triangles, for example, are real entities, not the creations of the human mind.”- wikipedia, wersja angielska.„W filozofii matematyki (...) realiści twierdzą, że obiekty matematyczne to realnie istniejące lub skonstruowanepoznawczo przedmioty abstrakcyjne. Realizm skrajny, zwany też platonizmem (w węższym znaczeniu) mówi, żeobiekty matematyczne są pozaczasowymi, rzeczywistymi i obiektywnymi bytami, w przeciwieństwie do czasowych,przemijalnych i nie posiadających pełni istnienia przedmiotów zmysłowych i zjawisk.(...)” - wikipedia, wersja polska.„Realizm subiektywny”? Ci, którzy przeczytali i pokochali „Sto lat samotności” G. Marqueza wiedzą w czym rzecz.

17Drugim, równie istotnym powodem sukcesu hilbertowskiej koncepcji, jest ockhamowska oszczędność - prostotajej języka i aksjomatów (widzę już, jak krzywią się ci, dla których nauka matematyki jest koszmarem...). Oto jak- sarkastycznie - pisał o tym L. Susanka: „Axioms are supposed to be so pellucidly, limpidly clear („przejrzyste iklarownie czyste”) that any fool, after understanding our interpretation of their meaning in ordinary mathematicalusage, would acclaim their necessity and validity” [112].

18Hilbert mówił „twór” a nie „byt”. Możemy też mówić „obiekt”. Warto w tym miejscu dodać takie zdanie: Formany philosophers, including Kant, would assert that the correct question is not “What is a thing?” but rather„What is a thing as it appears to us?” [28].

19Zapis ¬φ oznacza negację, zaprzeczenie zdania φ.

Page 48: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 47

przeciwstawnych zdań - (ψ,¬ψ).Obiekt matematyczny opisany przez pełną teorię jest kompletny - dowolne zdanie języka, w

którym sformułowano tę teorię, jest albo prawdziwe (dowodliwe) albo falsyfikowalne (dowodliwajest jego negacja). To cecha opisów obiektów fizycznych - konfrontując nasze sądy z takim obiektemzawsze możemy ocenić, czy są prawdziwe czy fałszywe20. To rodzi pokusę, by takie w pełni określonebyty uznać za matematyczne byty jednostkowe („jedności”). A inne, opisywane przez niepełne teoriepostrzegać jako kolekcje, klasy owych jedności.

Jednak Hilbertowi chodziło o coś więcej: o sprawowanie kontroli nad matematyką. Problem wtym, że teorie mogą być nieskończonymi zbiorami zdań. Jak nad tym zapanować, jak kontrolo-wać? Hilbert skorzystał z genialnego pomysłu Euklidesa - przedstawiania teorii w postaci systemuaksjomatycznego21. System aksjomatów teorii T to jej wyróżniony podzbiór AxT , który jest:

- rozstrzygalny - potrafimy orzec, czy dane zdanie należy do zbioru AxT czy też nie22,- wszystko, co potrafimy dowieść zakładając prawdziwość zdań ze zbioru T powinno pozostać

dowodliwe, jeśli założymy tylko prawdziwość zdań zbioru AxT .

Teorię, dla której potrafimy wskazać taki zbiór aksjomatów nazywamy teorią aksjomatyczną (ak-sjomatyzowalną)23.

Wiedza o matematycznym bycie to potencjalnie nieskończony zbiór zdań. Aksjomaty teorii to jego fini-tarny opis i zaeazam początek procesu poznania - poszukiwania dowodliwych konsekwencji aksjomatów.Inicjacja procesu poznania nowego matematycznego bytu należy do (genialnych) matematyków. To onikreują „byt” proponując jego aksjomatyczny opis. A logika wspomaga i kontroluje proces rozszerzaniawiedzy o tym obiekcie. To zadanie robotników matematyki.W języku teorii informacji (komunikacji) można to ująć tak: przekaz informacji to zbiór stwierdzeń-aksjomatów AxT . Wartość informacyjna tego przekazu to - dzięki logice - zbiór dowodliwych konsekwencjitego przekazu - Con(AxT ).

Przekonanie, że tak można zapanować nad światem matematycznych bytów to jeden z paradyg-matów koncepcji Hilberta. Wyraża wiarę, że można sprawować pełną kontrolę nad przedmiotemswoich badań, że „to co prawdziwe, jest dowodliwe”24.

Postawmy kropkę nad i: w koncepcji Hilberta cała matematyka miała być jednością, bytemmatematycznym opisanym przez pełną aksjomatyzowalną teorię25.

20Przynajmniej tak nam się zdaje...21Dzieło Euklidesa - „Stoicheia geometrias” - opisuje geometrię jako teorię aksjomatyczną. Przywrócenie tego

paradygmatu po wiekach zapomnienia zawdzięczamy niemieckiemu matematykowi M. Paschowi, który (w 1882 roku)zaproponował rozumienie teorii matematycznej jako zbioru zdań [62]. W starożytnej Grecji utożsamiano poznanie zdążeniem do wskazania „istoty” (essence”) badanych zjawisk, rzeczy, procesów. To tłumaczy zamysł Euklidesa byposzukać minimalnego zbioru zdań ujmujących „istotę” geometrii. Tak przynajmniej pisze się o tym w [67].

22Wymóg rozstrzygalności stanie się zrozumiały po lekturze rozdziału „Obliczalność”. Teraz powiedzmy tylko, żeprzekonanie, iż zawsze umiemy rozstrzygać, „czy element należy, czy nie należy do danego zbioru” jest ułudą.

23Taką organizację wiedzy nazywa się naukowo metodą aksjomatyczno-dedukcyjną. „The concept of an ”axiom” isclosely related to the idea of logical irreducibility. Axioms are mathematical facts that we take as self-evident (...).All formal mathematical theories start with axioms and then deduce the consequences of these axioms, which arecalled its theorems. That is how Euclid did things in Alexandria two millennia ago, and his treatise on geometry isthe classical model for mathematical exposition. - G.Chaitin, „The limits of reason” (internet).A.Tarski pisał: „Każda teoria naukowa jest układem zdań przyjętych za prawdziwe, które można nazwać prawamilub twierdzeniami uznanymi” [117].

24Zapewne dlatego Hilbert popularną w tym czasie tezę niemieckiego zoologa E. du Bois-Reymonda: „Ignoramus etignorabimus” (nie znamy i nie poznamy) nazywał krótko „idiotyczną” i przeciwstawił jej swoją -„Wir mussen wissen.Wir werden wissen.” (Musimy wiedzieć. Będziemy wiedzieć.). Ale historia zakpiła sobie z Hilberta równie ostro, jakon ze swojego adwersarza. Więcej o tym w rozdziale poświęconym twierdzeniom Godla.

25We wczesnym okresie pracy naukowej, w 1899 roku, Hilbert „poprawił” Euklidesa, przedstawiając pełny systemaksjomatów dla (klasycznej, euklidesowej) geometrii. To zapewne było dla niego istotną przesłanką przy planowanejaksjomatyzacji całej matematyki.

Dodajmy, że jednym z postulatów Hilberta była aksjomatyzacja... fizyki. Mimo jego odrzucenia, niektórzy i dziś sąprzekonani, że właściwie każda dziedzina nauki powinna być organizowana zgodnie z euklidesowym paradygmatem:„When we are investigating the foundations of a science, we must set up a system of axioms which contains an exact

Page 49: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 48

Marzenie o stworzeniu teorii finalnych ostatecznie rozstrzygających dylematy danej dziedziny poznania,jest tak stare jak nasza cywilizacja. Człowiek „od zawsze” oczekiwał i poszukiwał ostatecznych odpowie-dzi objaśniających otaczający go świat (lub jego fragmenty). Może je dawać religia, może próbować jeznajdować nauka. G. Leibniz pisał: „Największą pomocą dla rozumu byłoby odkrycie niewielu myśli, zktórych wynikałyby w porządku inne nieskończone myśli w ten sam sposób, w jaki z niewielu liczb (...)można wyprowadzić w porządku inne liczby”[30] 26.I do takiej finalnej teorii dążył Hilbert.

Ale to nie tak, że Hilbert miał podaną na tacy całą logikę w dzisiejszym znaczeniu tego słowa.Dość powiedzieć, że G. Boole wydał swoje dzieło „An Investiagtion into The Laws of Thought” opi-sujące algebraicznie najprostszą logikę zdaniową dopiero w 1854 roku27. Budowa języka pierwszegorzędu i związanej z nim logiki została zaledwie zapoczątkowane w pracach G. Frege. Hilbertow-skie odwołanie do logiki było raczej wskazaniem konieczności jej równoległego (do matematyki)rozwijania, a nie wykorzystaniem gotowego i sprawdzonego narzędzia.

Stwierdzenia rzeczywiste i idealne

Jedynym ograniczeniem matematyki Hilberta jest wymóg jej wewnętrznej niesprzeczności. Świa-dom niebezpieczeństw stąd wynikających28 Hilbert sugerował, by w matematyce widzieć dwa świa-ty: świat „real statements” i „ideal statements”. Real statements to jądro matematyki, stwierdzeniaodnoszace sie wprost do przedmiotu badań. Ideal statements to wszelkie stwierdzenia formułowa-ne w języku, w którym te badania prowadzimy. To nie jest jasno zdefiniowany podział: „Hilbertintended to isolate what he viewed as an unproblematic and necessary part of mathematics, anelementary part of arithmetic he called „finitistic mathematics” [?]. „Hilbert’s characterization ofboth finitistic mathematics and real statements are somewhat unclear (...). Nevertheless, it is inany case clear that the real statements include numerical equations and their negations, boundedexistential and universal quantifications of these, and at least some universal generalizations. Theyare thus included in (...) the sentences that logicians nowadays call by Π0

1-sentences” [106]29. Doowego „bezproblemowego” jądra matematyki Hilbert włączał też logikę klasyczną.

Świat idealny jest po to, by łatwiej, jaśniej i głębiej, dowodzić stwierdzeń dotyczących świa-ta realnego30. I nic ponad to - wzbogacenienie języka nie miało prowadzić do wyników, którychnie można by interpretować w realnej matematyce. Rozszerzenie realnej matematyki do światatwierdzeń idealnych miało być konserwatywne (zachowawcze).

Spróbujmy podsumować: oto

Paradygmaty matematyki hilbertowskiej:- jesteśmy w stanie wskazać uniwersalny system aksjomatów,- potrafimy kontrolować niesprzeczność wybranego zbioru aksjomatów31,- to, co niesprzeczne ze wskazanym systemem aksjomatów istnieje, jest prawdziwe,

and complete description of the (...) ideas of that science (...). No statement within the realm of the science (...) isheld to be true unless it can be deduced from the axioms by means of a finite number of logical steps...”[103] str. 9.

26Leibniz pisał też tak: „Należy znaleźć znaki lub symbole dla wyrażenia w sposób jasny i ścisły wszystkich myśli,jak w arytmetyce wyrażone są liczby lub w geometrii linie, aby można było z nimi czynić to samo, co czyni się warytmetyce i geometrii, gdy ma się je jako przedmiot rozumowania. Z tego powodu wszystkie dociekania, które opartesą na rozumowaniu, dokonywane będą przez przemieszczanie tych znaków, przez pewien rodzaj rachunku”.

27George Boole ( 1815 - 1864), angielski matematyk, filozof i logik.28Opowieści o smerfach i Gargamelu są też wewnętrznie niesprzeczne...29Czym są owe „Π0

1-sentences” powiemy w przyszłości.30W opisie filozofii transcendentalnej Kanta w internecie znalazło się zgrabne zdanie: „idealizm transcedentalny

(...) polega na myślowym wykroczeniu poza sferę przedstawień, aby odkryć to, co je konstytuuje”. Nieco inaczej,bardziej w duchu formalizmu, relację między realnym a idealnym składnikiem matematyki opisano w [106] tak: „Thelatter (i.e. real statements - GJ) are finitistically meaningful, or contentual, but the former (i.e. ideal statements -GJ) are strictly speaking just meaningless strings of symbols that complete and simplify the formalism, and makethe application of classical logic possible”.

31„(...) the consistency of the comprehensive formalized system is to be proved by using only restricted, uncontro-versial and contentual finitistic mathematics” [94].

Page 50: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 49

- to, co prawdziwe, jest dowodliwe.- zbiór aksjomatów uniwersalnej teorii - „prawd podstawowych” - to punkt odniesienia do

rozstrzygania o niesprzeczności i prawdziwości innych stwierdzeń- język matematyki dopuszcza kwantyfikacje, pozwala formułować twierdzenia „o istnieniu”.

W szczególności w ramach tej uniwersalnej teorii możemy arbitralnie zadekretować - za pomocąaksjomatów - istnienie pewnych obiektów matematycznych. A hilbertowska równość „niesprzeczność= istnienie” sprawia, że to istnienie się uprawomocni, jeżeli udowodnimy niesprzeczność tej teorii32.

Hilbert i jego współwyznawcy wierzyli, że realizacja takiej wizji matematyki jest możliwa.

„Wir mussen wissen — wir werden wissen! - Musimy wiedzieć, będziemy wiedzieć!”jest manifestem tej wiary33.

Koncepcja Hilberta była w chwili jej powstania niezwykle atrakcyjna. Kreowała naukę uniwersalną. Uosa-biała wiarę, że to jest możliwe. Była obietnicą znalezienia globalnego ładu, ostatecznego rozwiązanianaszych dylematów.A działo się to na przełomie XIX i XX wieku, w jednej z tych nielicznych chwil w historii, kiedy człowiekwierzył w swe nieograniczone możliwości.Oszołomieni sukcesami ludzie nauki byli przekonani, że mogą wszystko. „Co jest rozumne, jest rzeczywi-ste, a co jest rzeczywiste, jest rozumne” - pisał Hegel. Tylko pozazdrościć...Hekatomba wojen światowych, holocaust, gułag, Hiroszima i inne dzieła ludzkiej pomysłowości (nie mylićz umysłowością) - wszystko to było wtedy niewyobrażalne. Niemożliwe34.

4.2 Rola teoria mnogości w koncepcji Hilberta

W ostatnim stuleciu cantorowska teoria mnogości zajęław matematyce na tyle ważne miejsce, że (...) prawo do ist-nienia zyskuje sobie tylko to, co (...) dopuszcza zbudowa-nie modelu w teorii Cantora. W ten sposób cantorowskateoria stała się uniwersalnym światem matematyki.

P. Vopenka [76]

Na przełomie XIX i XX wieku matematycy mieli aż nadto dowodów na istnienie różnorakichpowiązań między różnymi dziedzinami matematyki35. Zauważyli, że pojęcia i teorie formułowanew jednym języku można próbować tłumaczyć na pojęcia i teorie formułowane w innym. Pozwalałoto ujrzeć je w nowym kontekście, co nierzadko przyczyniało się do ich lepszego zrozumienia. Stałosię też jasne, że te związki zostaną lepiej rozpoznane, gdy będziemy dysponować uniwersalnymmetajęzykiem - takim, w którym można interpretować różne języki poszczególnych dziedzin mate-matyki. Uniwersalna teoria postulowana przez Hilberta, winna być sformułowana w tym języku36.

32Można spotkać pogląd, że to właśnie aksjomaty i twierdzenia orzekające o istnieniu odróżniają matematykę odlogiki, bo kreują jej świat.

33Pyszna anegdota mówi, że to stwierdzenie padło w czasie wywiadu radiowego, którego Hilbert udzielił 8.09.1930po przedwczesnym opuszczeniu konferencji w Królewcu. Tymczasem ostatniego dnia konferencji wystąpił Kurt Godel,który przedstawił wyniki wykluczające realizację wizji Hilberta. Jego wystąpienie nie spotkało się z większym zrozu-mieniem. Wzmianki o nim trudno ponoć szukać w materiałach pokonferencyjnych. A jedynym(?) który go zrozumiałi docenił był ... John von Neumann.Sentencja „Musimy wiedzieć. Będziemy wiedzieć” umieszczona jest na nagrobku Hilberta w Getyndze.

34O szczególnej arogancji nauki u schyłku XIX wieku świadczy też taka wypowiedź fizyka Kelvina w 1894 roku:„Nic nowego nie ma już w fizyce do odkrycia. Pozostały tylko coraz bardziej precyzyjne pomiary.”.

35Wystarczy wspomnieć np. o algebraizacji geometrii w wydaniu Kartezjusza.36Ks. J. Dadaczyński opisał istotę tego programu w trzech, lapidarnie sformułowanych, punktach:

- aksjomatyzacja zastanych dyscyplin matematycznych,- budowanie modelu jednej teorii w dziedzinie innej teorii; wówczas można było drugą teorię traktować jako bardziejpodstawową, taką, z której wyprowadzalna jest pierwsza teoria,- wskazanie teorii najbardziej podstawowej, z której wyprowadzalne są pozostałe. [35]

Page 51: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 50

Hilbert sam wskazał teorię odpowiadającą jego wizji: miała to być budowana od początku XXwieku aksjomatyczna teoria zbiorów37.

W [127] teorię mnogości nazwano „urlogiką” i charakteryzowano tak38: to (...) najbardziej prymitywnyformalny język, którego potrzebujemy, gdy chcemy mówić o procesie uprawiania matematyki. Urlogika toten aspekt matematycznej aktywności, która polega na zapisywaniu zdań, zgodnie pewnymi ustalonymiregułami. (...) Tym zdaniom przypisujemy intuicyjnie znaczenia w uniwersum (uniwersach)matematycznych. Niektóre zdania są prawdziwe z uwagi na to, że wyrażają sądy prawdziwe w tymuniwersum. (...)Jeżeli zapytamy matematyka, dlaczego twierdzi, że pewne zdanie φ zapisane na tablicy jest prawdzi-we, to nie odpowie on, że jest prawdziwe, ponieważ jego znaczenie jest prawdziwym stwierdzeniem wmatematycznym uniwersum. Odpowie, że φ jest prawdziwe ponieważ może być udowodnionez „podstawowych zasad” („first principles”). Te podstawowe zasady są nazywane „podstawowymi”ponieważ są postrzegane jako oczywiste (...) .Czy trudno powiedzieć, która zasada jest podstawową zasadą? Jeśli chcemy pozostać na możliwie naj-niższym poziomie to nie powinno to być rozstrzygane jako pytanie matematyczne. Nie wykluczamy, iżkształt listy zasad podstawowych może być przedmiotem sporu. Tak więc (arbitralnie) ustalamy zdania,które nazwiemy aksjomatami urlogiki i uznajemy ich prawdziwość.Jeżeli za urlogikę przyjmiemy pierwszorzędową teorię zbiorów, to zdaniami urlogiki są zdania pierwszegorzędu z jedynym symbolem relacyjnym „∈”. Aksjomatami są aksjomaty ZFC”.

Teoria mnogości i jej język pośredniczą między wyspecjalizowanymi teoriami matematycznymia językiem naturalnym, w którym opisujemy rzeczywistość39.

........

ZFC

Tn

T2

T1

-

PPPPPq-

1

„real world”

'

&

$

%Teoria mnogości to półprzeźroczysta szyba między śwatem matematyki a rzeczywistością. Z jednej stronysą matematycy, którzy obserwują i opisują świat zza szyby teorii mnogości.Z drugiej strony są adepci matematyki - uczniowie i studenci - którym każemy przejść przez czyściecteorii mnogości zanim dostaną prawo wstępu do matematycznego raju...

Relacja między teorią podstawową a rzeczywistym światem nie jest przedmiotem zainteresowa-nia matematyki. To domena filozofii nauki40. Czy teoria mnogości wiernie opisuje rzeczywistość? Aczy do tego dąży? Matematyka jako nauka normatywna chce więcej: chce oddziaływać na rzeczy-

37Budowę teorii mnogości zainicjował G. Cantor pracami opublikowanymi w latach 70-tych XIX wieku. Historycymatematyki twierdzą, że hilbertowskie porządkowanie matematyki wynikało po części z chęci obrony cantorowskiejteorii mnogości przed atakami jego przeciwników: „To co robią Weyl i Brouwer to nic innego jak pójście w śladyKroneckera! Próbują oni uratować matematykę wyrzucając z niej wszystko to, co sprawia kłopot (...) Jeśli zgodzimysię na takie propozycje, to ryzykujemy utratę wielu największych naszych skarbów. (...) Z raju, który stworzył namCantor, nikt nie powinien móc nas wypędzić” - „Uber das Unendliche”, Math. Annalen 95 (1926). Dodajmy, że H.Weil był studentem Hilberta... A jak pisze P. Raatikainen Hilbert zapewne nie studiował prac Brouwera...

38Przedrostek „ur” pochodzi z języka niemieckiego i oznacza mniej więcej to samo co „pierwotny”, „początkowy”.39S.Hawkins i L. Mlodinow w ksiażce „The Grand Design” wprowadzili pojęcie „model-dependend realism” o

którym w wikipedii napisano tak: „Model-dependent realism is a view of scientific inquiry that focuses on the role ofscientific models of phenomena. It claims reality should be interpreted based upon these models, and where severalmodels overlap in describing a particular subject, multiple, equally valid, realities exist. It claims that it is meaninglessto talk about the ”true reality” of a model as we can never be absolutely certain of anything. The only meaningfulthing is the usefulness of the model”. Rzecz dotyczy wprawdzie modeli kosmologicznych ale bez ryzyka nadużyciamożna te uwagi odnieść również do matematyki a w szczególności do teorii mnogości.

40W książce D.C. Denneta Od bakterii do Bacha - o ewolucji umysłów spotykamy ciekawe rozróżnienie: mówi siętam o obrazie manifestującym się świata (wyrażanym w języku naturalnym) i jego obrazie naukowym...

Page 52: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 51

wistość a nie tylko ją odzworowywać. Sukcesy matematycznego modelowania dowodzą, że teoriamnogości dobrze przystaje do rzeczywistości41.

Pięknie, ale... czy ten świat, który zbudowaliśmy, jest rzeczywiście najlepszy z możliwych? Czy matematy-ka nie ponosi części odpowiedzialności za to, że jest on taki, jaki jest? Skąd pewność, że inna matematykanie zafundowałaby nam lepszego świata?

Ale właściwie dlaczego to teoria zbiorów ma być teorią uniwersalną?Kognitywiści kojarzą zbiór ze „schematem wyobrażeniowym pojemnika” [67]42. A To wyjątkowouniwersalny schemat. Kolekcja, mnogość, zestaw, komplet, to - w języku potocznym - synonimysłowa zbiór. A inne - jak np. ciąg, układ - to zbiory wzbogacone o pewną strukturę.

Hilbert chciał finalnej teorii matematycznej. Doskonałej, czyli ockhamowsko oszczędnej. Dlate-go ów uniwersalny schemat wyobrażeniowy musiał znaleźć swój odpowiednik w języku tej teorii.Jednak to, że stał się on jedynym pojęciem podstawowym (pierwotnym) języka teorii mnogościbyło arbitralnym wyborem jej twórców. Dla jednych genialnym, dla innych mniej.

Wszystko co niezmienne, może być łatwo postrzegane jako zbiór. Ale twórcy teorii mnogości chcieli objąćtym pojęciem również „byty”, których istotą jest zmienność. Takim pojęciem jest np. funkcja, zwyklekojarzona z procesem, procedurą, zmianą. W teorii mnogości funkcja jest tylko (specjalnym) zbiorem.

Jeżeli tak, jeżeli zbiór to tylko pewien schemat wyobrażeniowy, to dlaczego mamy ograniczaćsię do zbiorów skończonych? Hilbert mógłby powiedzieć: „jeśli uznanie istnienia - wprowadzeniedo języka - zbiorów nieskończonych nie prowadzi do sprzeczności, to dlaczego mamy je odrzucać?Wszak chcemy zbudować możliwie najobszerniejszy język matematyki.” Wyobrażenie wszystkichliczb naturalnych jako nowej „jedności” - zbioru - nie budzi w nas zasadniczego sprzeciwu. Cowięcej, skoro dzielimy świat stwierdzeń matematyki na „real -” i „ideal statments”, to lokując zbiorynieskończone w sferze matematyki idealnej, unikamy oskarżeń o ingerencję w świat „prawdziwej”matematyki.

Można też uczynić nieskończoność centralnym pojęciem matematyki43.Uznanie nieskończoności aktualnej zadecydowało o kształcie matematyki XX wieku. A wystar-

czyło tylko nieco inaczej interpretować równanie „niesprzeczność = istnienie” by zanegować istnie-nie zbiorów nieskończonych jako sprzeczne z prawem obowiązującym w realnym świecie, w którym„zbiór nie może być równoliczny ze swym właściwym podzbiorem”44. Hilbert i Cantor ignorowaliten argument gdyż, jak ustaliliśmy, w ich koncepcji „niesprzeczność” była wewnętrznym pojęciemmatematycznym a nie zgodnością z doświadczeniem świata obiektów skończonych.

Kłopoty z nieskończonością

Stanowcze poglądy Hilberta przyjęto zapewne z ulgą, ochoczo akceptując pogląd, że zbiorowyzdrowy rozsądek pozwoli uniknąć sprzeczności i tworzenia fałszywych bytów45. Koncepcja Hilbertato „ład i porządek”.Jednak rozwój teorii mnogości przyniósł wyniki które pokazały, że projektuHilberta nie da się w pełni zrealizować.

Oto jeden z nich. Cantor mówił: „zbiorem jest spojenie w całość określonych rozróżnialnychpodmiotów naszej poglądowości czy myśli”. Poincare postulował, by „rozważać jedynie przedmioty,które mogą być zdefiniowane za pomocą skończonej liczby słów”. Jednak szybko okazało się, że

41Jednym z najważniejszych argumentów na rzecz takiej tezy są sukcesy mechaniki kwantowej, która bez matema-tyki nie ma racji bytu.

42Termin „schemat wyobrażeniowy” żywany w kognistywistyce w [14] objaśnia się tak: „(...) umysł wykorzystuje(...) wiele schematów wyobrażeniowych takich jak schemat część-całość (...) schemat centrum-peryferie, schemat planpierwszy-tło, schemat pojemnika”

43Nieskończoność w teorii mnogości definiujemy pozytywnie - „zbiór jest nieskończony, gdy jest równoliczny zeswym właściwym podzbiorem”. A skończoność negatywnie - zbiór jest skończony, gdy nie jest nieskończony.

44To pogląd Galileusza. Również Leibniz uważał to za argument przeciw uznaniu „nieskończonych jedności”.45„Ze wszystkich dóbr rzadkich rozum jest dobrem najsprawiedliwiej podzielonym, bowiem nikt nigdy nie uskarża

się na brak rozumu” - M. Montaigne (wg innych źródeł autorem tego stwierdzenia jest Kartezjusz).

Page 53: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 52

interpretacja pojęcia „zbiór” w duchu teorii mnogości, zmusza do zapomnienia tej cantorowskiejdeklaracji46. I to za sprawą ... Cantora, bo to on udowodnił fundamentalny dla teorii mnogości fakt:

„nieskończony zbiór liczb naturalnych ma nieprzeliczalnie wiele podzbiorów”

Nieprzeliczalność rodziny podzbiorów liczb naturalnych oznacza, że nie można tych podzbiorówponumerować („nazwać”) liczbami naturalnymi. Jest ich więcej niż liczb naturalnych. To odmiennyrodzaj nieskończoności.Dlaczego to jest kłopot? Otóż wszystkie opisy, które można sporządzić np. w języku polskim, możnaponumerować. Wyobraźmy to sobie tak: opis to książka. Może długa, ale zawsze zawierająca tylkoskończenie wiele znaków (liter, znaków interpunkcyjnych, spacji). Możemy te książki-opisy ustawićw kolejkę. Najpierw posegregujemy je według długości (liczby znaków) zaczynając od najkrótszych.Potem każdy ze skończonych zbiorów opisów o tej samej długości porządkujemy alfabetycznie.W ten sposób każdemu opisowi można przypisać jego numer - liczbę naturalną47.

Wszystkie opisy można ponumerować, a rodzinę wszystkich podzbiorów liczb naturalnych nie.To musi oznaczać, że nie każdy taki podzbiór ma identyfikujący go jednoznacznie opis!

Jak „spoić w całość” coś, czego nie potrafimy nazwać, opisać?Teoria mnogości każe akceptować istnienie zbiorów, które nie mają unikatowych opisów w jakimkolwiekjęzyku... I nakazuje uznać różne rodzaje nieskończoności...Teoria mnogości wymaga głębokiej wiary...

Gdyby szło tylko o to, że zbiorów utworzonych z liczb naturalnych jest nieprzeliczalnie wiele, tomożna by na ten wynik machnąć ręką - kogo interesuje „zbiór wszystkich podzbiorów N” - obiektleżący, być może, gdzieś na peryferiach matematyki. Ale okazało się - a pokazał to również Cantor- że nieskończoność zbioru liczb rzeczywistych jest tego samego rodzaju co nieskończoność zbiorupodzbiorów N - zbiór R jest nieprzeliczalny. Tego matematyka nie mogła zlekceważyć.

Liczby rzeczywiste tworzą zbiór nieprzeliczalny, nie mogą więc mieć indywiduowych nazw. Niemogą być nazwami. Czym więc są? „Liczba rzeczywista” to pojęcie abstrakcyjne (sformułowane wjęzyku teorii mnogości), które ma nieprzeliczalnie wiele desygnatów. Stwierdzenie, że te desygnatytworzą aktualnie istniejący nieskończony i nieprzeliczalny zbiór to tylko konsekwencja przyjęciateoriomnogościowych paradygmatów.

Cantor uznał, że ujawnienie „jakościowej różnicy” między nieskończonością zbiorów N i Rto nie kłopot, ale odwrotnie: to drzwi do nowych wspaniałych światów. Bo z jego twierdzeniaw wynika, że w matematyce teorimnogościowej mamy nie jedną, ale nieskończenie wiele różnychrodzajów nieskończoności...48 Dla tych, którzy zawierzyli teorii mnogości, był to przełom. Ukazałsię „matematyczny kosmos”, transcedentny świat matematyki. Raj.

Jednak ten wynik stał się też źródłem poważnych kłopotów. Hilbert chciał by uniwersalnysystem aksjomatów był teorią pełną: sądy prawdziwe winny być dowodliwe, a dla sądu niepraw-dziwego dowodliwe winno być jego zaprzeczenie. Jeśli tak, to w szczególności powinniśmy umiećrozstrzygnąć słynny dylemat - hipotezę continuum:

„czy między przeliczalną nieskończonością liczb naturalnych a nieprzeliczalną nieskończonościązbioru podzbiorów liczb naturalnych jest jakaś istotnie różna od nich nieskończoność?”

To pytanie stało się przekleństwem Cantora i dramatycznie zaważyło na jego życiu. Jego (Can-tora) próby rozwiązania tego problemu okazały się bezowocne. Dopiero kilkadziesiąt lat poźniejGodel a później Paul Cohen udzielili niemiłej (wyznawcom teorii mnogości) odpowiedzi: możnaprzyjąć zarówno odpowiedź pozytywną jak i negatywną. „Można przyjąć” w sensie Hilberta: żadnez tych rozwiązań nie jest sprzeczne z aksjomatami teorii zbiorów...

Skoro tak, skoro teoria mnogości nie jest pełna, to można ją rozszerzyć na dwa różne sposoby:

46Wbrew naiwnym wyobrażeniom, aksjomatyka teorii zbiorów nie formułuje warunków niezbędnych do tego, by„coś” nazwać zbiorem. Czym jest zbiór musimy powiedzieć dopiero wtedy, gdy wskazujemy model teorii zbiorów.

47Powtórzyłem tu wcześniejsze uzasadnienie, że elementy wytwarzane przez jakąkolwiek strukturę rekurencyjnąmożna efektywnie ponumerować.

48Wynika to raczej z dowodu tego twierdzenia. Dowód przedstawimy później.

Page 54: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 53

przyjmując jako dodatkowy aksjomat stwierdzenie o istnieniu tego szczególnego rodzaju nieskoń-czoności, bądź aksjomat temu zaprzeczający. Którą i na jakiej podstawie mielibyśmy uznać zauniwersalną teorię matematyki? Żadną, bo dzięki wynikom Godla wiemy, że ani pierwsza ani druganie może być pełna!49.

Nierozstrzygalność hipotezy kontinuum oznacza, że równość „ dowodliwość (w ZFC) = prawdziwość” jestniemożliwa, jeśli tylko akceptujemy prawo wyłączonego środka które mówi, że albo zdanie φ albo jegozaprzeczenie jest prawdziwe.Matematyki nie da się sformalizować tak, jak chciał Hilbert.

Teoria mnogości nie jest dekalogiem matematyki. Więcej - takiego dekalogu nie ma. Uniwer-sum matematyczne jest ponad to, co potrafimy opisać i objąć finitarną kontrolą. Wszelkie teoriematematyczne obejmują tylko ten fragment świata, który wyznacza ich język.

4.3 Opozycja

Dla wielu nieskończenie wiele nieskończoności to raj. Ale nie dla wszystkich...

”I don’t know what predominates in Cantor’s theory — philosophy or theology, but I am sure that thereis no mathematics there.” - Leopold Kronecker50.„I protest against the use of infinite magnitude as something completed, which is never permissible inmathematics” [82]. - Carl F. Gauss.„Teoria mnogości Cantora to obłęd, perwersja, z której matematyka się kiedyś wyleczy” - H. Poincare.„Czytanie prac Cantora wydaje mi się prawdziwą torturą ... nikt z nas nie ma ochoty iść jego śladem” -Ch. Hermite.„With the work of Dedekind, Peano and Cantor above all, complete infinity was accepted into mainstreammathematics. Mathematics became a faith-based initiative” - E. Nelson [82]..

Cantor wierzył w nieskończoność. Rozróżniał jej trzy rodzaje51: absolut - realizowany tylko wBogu, nieskończoność w świecie stworzonym i nieskończoność in abstracto będąca wielkością mate-matyczną. Pisał: „W każdym z tych przypadków na pytanie o możliwość istnienia nieskończonościaktualnej można odpowiedzieć „tak” lub „nie”; w ten sposób otrzymujemy osiem różnych punktówwidzenia, (...) spośród nich reprezentuję osobiście ten, który we wszystkich trzech przypadkachudziela odpowiedzi bezwzględnie pozytywnej”52.Niemal sto lat później Chaitin pisał: Teoria zbiorów nieskończonych jest w rzeczywistości teologią.(...) Celem Cantora było zrozumienie Boga. Bóg jest transcedentny. Teoria nieskończonych zbiorówma swą hierarchię coraz to większych nieskończoności.(...) Bóg jest daleko, ponieważ jest nieskoń-czony i transcedentny. Możemy próbować iść w Jego kierunku. Ale nigdy nie dojdziemy, bo pokażdej nieskończoności jest od niej większa... [20]

Zapewne to właśnie cantorowską wizję matematyki mieli na uwadze kognitywiści Lakoff i Nunezpisząc o „matematycznym romantyźmie”53 i wskazując - między innymi - na takie cechy roman-tycznego postrzegania matematyki:

- mathematics is transcendent, namely it exists independently of human beings, and structu-res our actual physical universe (...). Mathematics is the language of nature, and is the primary

49Dla ścisłości: przypisywanie Hilbertowi poglądu, że oczekiwał on „pełności” uniwersalnego systemu aksjomatówjest lekkim nadużyciem. W Stanfordzkiej Internetowej Encyklopedii Filozofii w omówieniu koncepcji Hilberta napisanotak: „...The rather imprecise notion of the ‘completeness’ of the axiomatisation, which involves, loosely, showing thatthe axioms can prove all that they „ought” to prove”. (http://plato.stanford.edu/entries/zermelo-set-theory/).

50Pełny opis konfliktu Kroneckera z Cantorem można znaleźć w książce H. Helmanna „Great feuds in mathematics:ten of the liveliest disputes ever”

51Cytuję za artykułem M. Ruckiej „Dotknąć i zobaczyć nieskończoność” dostępnym w internecie52Cantorowska hierarchia nieskończoności sformalizowana jest jako „skala alefów”. Cohen wskazywał na symbo-

liczny charakter tej nazwy - ℵ to pierwsza litera alfabetu hebrajskiego. Dla oznaczenia uniwersum Cantor używałostatniej litery tego alfabetu - taw [23].

53W [67] - romance of mathematics. J. Pogonowski tłumaczy ten termin jako „matematyczną mitologię”.

Page 55: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 54

conceptual structure we would have in common with extraterrestrial aliens, if any such there be,- mathematical proof is the gateway to a realm of transcendent truth54.

Docenienie osiągnięć matematyki teoriomnogościowej nie musi oznaczać, że jest to ostateczna ijedynie słuszna wizja matematyki55. Powtarzając jak mantrę56 hilbertowskie zrównanie cantorow-skiej teorii z matematycznym rajem, akceptujemy granice matematyki kategorycznie wytyczoneprzez tę teorię. To wątpliwe, jak każde apriorycznie przyjęte samoograniczenie.

Matematyka XX wieku oparta na teorii mnogości to matematyka modelowań. To była w dużej mierzekonieczność spowodowana lichotą narzędzi obliczeniowych, jakimi wtedy dysponowaliśmy.Szaleńczy rozwój technologii komputerowych w ostatnim półwieczu przełamał te bariery. Funkcja ponow-nie stała się bardziej procesem niż teoriomnogościową relacją „wejście-wyjście” między argumentem awynikiem. Zaczęliśmy troszczyć się o efektywność tego procesu.Dlatego musimy zajrzeć do „czarnej skrzynki” w której realizowana jest funkcja-proces.Czy matematyka stanie się ponownie nauką o procesach obliczeniowych?

4.4 Czy jest coś oprócz języka?

„Jeśli ktoś widzi to (teorię mnogości - GJ) jako raj, to dlaczego ktoś inny nie może uznać tego zażart?”.

To słowa Wittgensteina, autora „Traktatu logiczno-filozoficznego”, który - jak pisze wikipe-dia - „jest ambitnym projektem ostatecznego ustalenia niepodważalnych relacji między językiem irzeczywistością (...) a także ustaleniem granic możliwości poznawczych filozofii wyrażanej w per-fekcyjnie logicznym języku”57.

Skąd tak ostra, wręcz brutalna, jak na standardy świata nauki, wypowiedź? Wśród tez jegotraktatu, znalazła się, opatrzona numerem 5.6, następująca:

„Granice mego języka wyznaczają granice mojego świata”58

Wittgenstein dostrzegł, co Hilbert zdaje się lekceważyć - to, że każdy język ma swe naturalne inieprzekraczalne ograniczenia59. Hilbert chciał za pomocą rygorystycznego formalizmu i jednej fun-damentalnej teorii wiernie odwzorować matematyczne uniwersum. „Wiernie”, czyli tak, by pojęciadefiniowane w języku uniwersalnej teorii miały jedną jedyną interpretację. Wtedy opis formalnyjest jednocześnie kreacją. To jest sens hilbertowskiej równości „niesprzeczność = istnienie”.

Nie należy oczekiwać od filozofa Wittgensteina matematycznych dowodów głoszonych przezniego tez. Paradoksalnie, takich dowodów dostarczyli sami matematycy. Pojawiły się tzw. twier-dzenia limitacyjne wskazujące nieprzekraczalne granice języka matematyki. Jest ich sporo. Zaliczasię do nich wyniki Godla, twierdzenia Lowenheima-Skolema, prace Turinga, twierdzenie Łosia czyteż wspomniany już wynik Cohena - że poprzestaniemy na niektórych60.

54Więcej o poglądach G.Lakoffa i R.E.Nuneza w [67]. Warto też przeczytać artykuł J.Pogonowskiego [93] polemi-zujący z poglądami tych kognitywistów.

55Skojarzenie z „Końcem historii” Fukuyamy nasuwa się samo... Esej Fukuyamy wywołał gorącą dyskusję wśródpolitologów, socjologów i historyków na całym świecie. Szkoda, że matematycy nie mają podobnego temperamentupolemicznego...

56Wikipedia: „Mantra (...). Jej powtarzanie ma pomóc w opanowaniu umysłu, zaktywizowaniu określonej energii,uspokojeniu, oczyszczeniu go ze splamień. Szczególnie istotną sprawą jest bezpośredni przekaz z ust wykwalifikowa-nego nauczyciela (guru), gdyż tylko wtedy mantra uzyskuje właściwą moc.

57„Traktat” ukazał się w 1921 roku w języku niemieckim a w 1922 roku w języku angielskim. Wittgnstein nadałswojemu dziełu wyjątkową formę: jego treść to zaledwie siedem lapidarnie sformułowanych tez, wspomaganych przezkilkanaście tez dopełniających. Gdyby mierzyć znaczenie dzieła proporcją między głębokością myśli a zwięzłościąsformułowań, to, jak sadzę, to jedyne dzieło Wittgensteina opublikowane za jego życia nie ma sobie równych.

58„Die Grenzen meiner Sprache bedeuten die Grenzen meiner Welt”. Wiele miesięcy po zanotowaniu aniu tegofragmentu trafiłem w książeczce J.Hadamarda „Psychologia odkryć matmatycznych” na takie, warte przypomnieniasłowa dwunastowiecznego filozofa Abelarda: „język jest tworem intelektu a zarazem jego twórcą.”

59Kilkadziesiąt lat później H. M. McLuhan (1911 – 1980), twórca teorii komunikacji, powiedział coś zbliżonego:The medium is the message” - środek przekazu jest przekazem.

60O tych twierdzeniach będzie mowa w dalszej części skryptu.

Page 56: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 55

Język nie kreuje matematycznego uniwersum. Może je tylko opisywać. Zawsze w części, a nie w całości.

Tak oto zbliżyliśmy się do zrozumienia poglądów matematycznych nominalistów. Nominalizmpozostaje w opozycji do matematycznego realizmu. Według nominalistów pojęcia matematyczneto nazwy („flatus vocis”61). Odrzucają założenie realistów (platoników), że tym pojęciom towarzy-szą byty. Źródłem matematyki jest refleksja nad językiem naturalnym rozumianym jako narzędziepoznania. Takich pojęć jak trójkąt, okrąg czy kwadrat starożytni Grecy używali długo przed Eu-klidesem, mierząc co trzeba było zmierzyć i wznosząc wspaniałe budowle. Dodajemy i mnożymyteż od niepamiętnych czasów. Język rachmistrzów i mierniczych został przejęty, uporządkowany apotem wzbogacony przez matematyków. Tak powstała geometria i arytmetyka. I inne teorie62.

Ale matematyka, zgodnie ze wskazaniem Kanta, „nie ogranicza swojego poznania do obszarumożliwego doświadczenia. Dąży do poznania rzeczy samych w sobie, dokonuje operacji abstra-hujących i systematyzujących, czego rezultatem są idee”. W ujęciu nominalistycznym oznacza toprzyzwolenie na tworzenie języków, pojęć i teorii wysoce abstrakcyjnych.

Nominalista prowokowany do dyskusji o istnieniu zbiorów nieskończonych odpowie zapewne jakGauss63: Infinity is nothing more than a figure of speech which helps us talk about limits. Thenotion of a completed infinity doesn’t belong in mathematics. In other words, the only access wehave to the infinite is through the notion of limits and hence, we must not treat infinite sets as ifthey have an existence exactly comparable to the existence of finite sets” 64.

Oto przykład: prędkość to stosunek długości drogi do czasu podróży. Tak wyliczymy średniąprędkość podróży z miasta A do B. Ale wszyscy posługujemy się też pojęciem prędkości chwilo-wej obiektu i wierzymy, że „licznik” w samochodzie nam ją pokazuje. Jednak to nie tak. Prędkośćchwilowa to wielkość graniczna w stosunku do prędkości średniej. Jej zdefiniowanie wymaga nie-skończonego skracania odcinka czasu, w którym dokonujemy pomiaru średniej prędkości. A to, jakjuż wiemy, w rzeczywistości fizycznej jest niemożliwe. Prędkość chwilowa, to abstrakcja, należącado języka modelowania matematycznego65.

Nominalistę nie interesuje pytanie o istnienie zbioru i innych obiektów matematycznych. Oneistnieją jako pojęcia językowe. To, co należy robić, to poszukiwać związków między nimi.

Nie trzeba pytać, co opisuje tak rozumiana matematyka. Ona opisuje to samo, co języki naturalne. Alerobi to bardziej dogłębnie, próbując dociec „istoty rzeczy”. I to w sposób, który zapewnia kontrolę nadprocesem poznania i obiektywny charakter uzyskanej tak wiedzy.

Patrząc na dzieło Cantora i Hilberta z tej perspektywy można uznać, że chodziło właśnie o językumożliwiający budowę jednorodnej i uniwersalnej siatki pojęć zdolnej pokryć całą matematykę.Taka interpretacja ich dzieła nie umniejsza jego znaczenia. Tego nie powie nikt przy zdrowychzmysłach. Matematyka potrzebowała takiego spoiwa by ułatwić transfer idei między jej różnymiobszarami. Z tego punktu widzenia teoria mnogości to genialne osiągnięcie. Bo, jak mówił Poincare:„Matematyka jest sztuką nadawania tej samej nazwy różnym rzeczom”66.Fiasko pełnego programu Hilberta niczego tu nie zmienia.J. H. Friedman na swojej stronie internetowej napisał o teorii zbiorów tak: „This (...) serves as our

61„Flatus vocis” - wyrażenie słowne. Termin wprowadzony przez średniowiecznych nominalistów.62Kognitywiści twierdzą, że pojęcia matematyczne bazują na pojęciach języka potocznego [67]. Np. matematyczne

pojęcie zbioru czy klasy opiera się na „(...) pojęciu zespołu przedmiotów zgromadzonych w ograniczonym fragmencieprzestrzeni” (cytuję za [14]).

63Carl Friedrich Gauss (1777 - 1855) - genialny niemiecki matematyk, fizyk a także astronom.64http://en.wikipedia.org/wiki/Controversy over Cantor’s theory65Jeśli długość drogi przebytej w czasie t opisuje funkcja f(t), to średnią prędkość między chwilą t0 i chwilą t1,

opisuje iloraz f(t1)−f(t0)t1−t0

. Prędkość chwilowa w chwili t0 to wielkość, do jakiej zmierza ten iloraz przy t1 zbliżanymnieskończenie do t0 czyli... pochodna funkcji f w punkcie a. Zatem jeśli ruch pewnego obiektu opisuje funkcja ciągła,która nie ma pochodnej w punkcie a to nie można mówić o prędkości chwilowej tego obiektu w punkcie a.

66W przeciwieństwie do poezji, która jest sztuką nadawania różnych nazw tej samej rzeczy” - jak dodają niektórzy.

Page 57: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 56

best scientific model of mathematical practice” i dalej: „The fact that ZFC is incomplete is totallyirrelevant to whether it is a model of mathematical practice”.

Zdetronizowana przez Godla i Cohena teoria mnogości pozostaje organizatorem matematyki67.

B. Russell w „Principia Mathematica” napisał: „Matematyka jest zupełnie obojętna wobeczagadnienia, czy jej przedmioty istnieją”. To nie rozstrzyga sporu, ale lokuje go tam, gdzie jegomiejsce - poza matematyką68. Nie jest ważne, skąd płynie motywacja. Ważne są rezultaty.

Pablo Picasso mówił: „Sztuka to kłamstwo, które pozwala zbliżyć się do prawdy”. Czy powiedzenie tegosamego o matematyce jest niewybaczalnym świętokradztwem?

4.4.1 O konstruktywiźmie Brouwera (subiektywnie)

To exist in mathematics means to have been constructed by intuitionL. Brouwer

Przyjęliśmy (upraszczając), że wyróżnikiem matematyki Cantora i Hilberta jest uznanie nie-skończoności aktualnej. Czy można myśleć o matematyce bez tego założenia?Matematyka ograniczająca nieskończność do struktur rekurencyjnych jest bliska postulatom mate-matycznego finityzmu. Finityści uznają istnienie obiektów matematycznych gdy dane są „bezpo-średnio” lub dają się skonstruować w skończonej liczbie kroków69. To, zdaniem wielu, zbyt rady-kalne, bo nadmiernie zubaża matematykę.

Ale matematyczny konstruktywizm niejedno ma imię70. Spośród różnych jego odmian najbar-dziej intrygujaca i inspirująca jest koncepcja matematyki L. Brouwera71.

Matematyk ze szkoły hilbertowskiej ma spory kłopot ze zrozumieniem idei Brouwera. Rzecz niew tym, że Brouwer neguje ten czy inny aksjomat teorii mnogości. On neguje wszystko: platońskietwierdzenie, że obiektami matematyki są byty idealne i wiecznotrwałe, euklidesowe założenie o moż-liwości aksjomatycznego opisu matematyki (lub jej fragmentu) i hilbertowskie równości: założoną„niesprzeczność = istnienie” i oczekiwaną „prawdziwość = dowodliwość”.Szukając sposobu ukazania tej fundamentalnej różnicy posłużymy się - jakby inaczej - metaforą.

Malarstwo (...) posługuje się środkami plastycznego wyrazu, np. barwną plamą i linią (...) .Twórczość malarska podlega zasadom właściwym dla danego okresu. Poszukiwanie odmiennychform wyrazu przyczynia się jednak do kształtowania nowych oryginalnych kierunków i niezwykłejróżnorodności dzieł malarskich. - to jest twórczość.

Krytyka sztuki (...) zajmuje się budowaniem kontekstu myślowego nowych zjawisk artystycz-nych, wspomaganiem teoretyczną refleksją oraz interpretacją działań artystycznych; (...) towarzyszyzjawiskom sztuki na zasadzie współuczestnictwa - to jest wiedza o malarstwie.

67G. Kreisler, wybitny logik austriacki, sugeruje by rozróżniać podstawy matematyki od jej organizacji.68Russell to - obok G. Frege i A.N. Whiteheada - jeden z twórców logicyzmu, który widzi istotę matematyki w

badaniu związków przyczynowo-skutkowych między zdaniami (stwierdzeniami) a nie w dyskusjach o zasadności przy-jęcia takich czy innych aksjomatów egzystencjalnych. Stąd niechęć Russella do dyskusji o aksjomatach dekretującychistnienie nieskończonych obiektów. Krakowskim targiem godził się, by ceną za niewłączenie „aksjomatu o istnieniunieskończoności” - nazwijmy go ∃N - do zbioru aksjomatów, była zgoda na rozpatrywanie tez w postaci implikacji∃N → φ - „jeśli założymy istnienie ... , to ...”

69Finitism may be characterised as based on the concept of natural number (or finite, concretely representablestructures) which is taken to entail the acceptance of proof by induction and definition by recursion [121]

70Obszerną informację o różnych odmianach konstruktywizmu można znaleźć w [121] i [120]71Brouwer rozpoczął swą karierę matematyka serią znakomitych rezultów uzyskanych w ramach matematyki hilber-

towskiej (topologii). I to właśnie te wyniki stały się punktem wyjścia do jego własnej koncepcji matematyki. Dodajmy,że Hilbert niezbyt przychylnie przyjmował takie pomysły. Do tego stopnia, że w 1928 roku doprowadził do wyklu-czenia Brouwera z redakcji (editorial board) najbardziej prestiżowego czasopisma tamtych czasów„MathematischeAnnalen”. O tym wszystkim można przeczytać w [86].

Page 58: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 57

Dla Brouwera twórczość matematyczna jest bardziej sztuką niż „aktywnością społeczną”. To suma in-dywidualnych dokonań nielicznych geniuszy a nie rezultat codziennej dłubaniny rzeszy rzemieślników -robotników matematyki.Matematyki - twórczości matematycznej - nie można się nauczyć. Możemy nauczyć się jej języka, po-znać pojęcia i metody badawcze związane z tym czy innym działem matematyki. Ale stąd daleko dotwórczości72.

Brouwer dystansował się od matematycznego formalizmu. „Mathematics (...) is in principleindependent of language. Communication by language may serve to suggest similar thought con-structions to others, but there is no guarantee that these other constructions are the same”73.Każdy matematyk potwiedzi, że formalne zapisanie wyniku matematycznego to tylko ostatni i naj-łatwiejszy etap pracy. Nikt też nie zaprzeczy, że w twórczej grupie matematyków może wytworzyćsię swoisty „team spirit” i jej członkowie mogą przekazywać sobie nie do końca zwerbalizowaneidee. Tak jak muzycy w czasie jam session, o piątej nad ranem74.

Brouwer nie był pierwszy ani jedyny, który odnosił się nieufnie do roli języka w nauce. Wątpilijuż starożytni Grecy75. W XVIII wieku W. von Humboldt76 pisał: „Człowiek postrzega głównieprzedmioty wśród których żyje, a ponieważ jego odczucia i działania zależą od jego precepcji, rzecmożna że odbiera je wyłącznie tak, jak przedstawia je język. (...) każdy społeczny język rysujemagiczny krąg wokół ludzi, do których należy, krąg, z którego nie ma ucieczki oprócz przejściado innego kręgu”77. A w XX wieku Wittgenstein konkludował: „granice mego języka wyznaczajągranice mego świata”. Jednak o ile dla von Humbolta i Wittgensteina ograniczenia wyznaczaneprzez język są obiektywną i nieusuwalną koniecznością, to Brouwer chciał, jak się zdaje, uwolnieniatwórczości matematycznej od tych ograniczeń.

W stanfordzkiej encyklopedii filozofii napisano: „Brouwer (...) stara się przejść między Scylląplatonizmu a Charybdą formalizmu”. Jego stosunek do formalizmu już poznaliśmy. A o platoniźmie- matematycznej transcedencji - jego uczeń i kontynuator, duński logik A.Heyting pisał: „We do notattribute an existence independent of our thought; i.e., a transcendental existence to the integersor to any other mathematical object”78.

Pozbawiony tych fundamentów matematyk bezradnie pyta - jeśli nie to (jest matematyką), to co?

„Mathematical objects, except some initial mental intuitions, are constructions of thehuman mind, based on these initial intuitions” [86].

72„Nie jestem językoznawcą. Jestem znawcą języka” mawiał J.Tuwim. Bardziej naukowo: analitycy twórczościBrouwera dostrzegają w jego koncepcji wpływy E. Husserla (1859-1938), twórcy fenomenologii, który uważał intuicjęza źródło poznania i z rezerwą odnosił się do roli języka w poznaniu. To zdanie może sugerować, że wiem co tofenomenologia. Niestety. Żałuję.Sugestia, że dla Brouwera matematyka jest bardziej sztuką niż nauką jest „autorska” i stworzona wyłącznie na użytektego tekstu.

73Bądźmy precyzyjni: to nie jest wypowiedź Brouwera ale cytat z [121] gdzie znajdujemy opis podstawowychzałożeń koncepcji Brouwera. A sam Brouwer pisał tak: „Język formalny towarzyszy matematyce tak jak mapy pogodytowarzyszą zjawiskom atmosferycznym”. „Logika daje pewność, ale niczego nie kreuje. Intuicja jest kreatywna, alezawodna.” - to z kolei stwierdzenie Poincare, uznawanego przez Brouwera za pre-intuicjonistę.

74To kolejna użyteczna metafora: nikt przecież nie będzie twierdził, że tworzenie muzyki to umieszczanie kropekna pięciolinii... Nikt więc nie powinien twierdzić, że twórczość matematyczna to „pisanie dowodów”.

75Sokrates: jasne jest, że należałoby szukać jakichś innych rzeczy oprócz nazw (...), które ukazywały by nam beznazw, które z nich są prawdziwe.Kratylos: Tak mi się zdaje.S.: Jeśli tak, to wydaje się możliwe poznanie bytów bez nazw.K.: Widocznie. (...)S.: Jeśli więc możliwie najlepiej można poznać rzeczy poprzez nazwy i można je również poznać przez nie same, toktóra z tych form poznania będzie piękniejsza i bardziej prawidłowa? (Platon, Kratylos)

76Wilhelm von Humboldt (1767 - 1835), niemiecki filozof i językoznawca77Cytuję za M. McLuhanem („Galaktyka Gutenberga”), który z kolei cytuje za E.Cassierem („Language and

Myth”).78The intuitonist foundations of mathematics, in Philosophy of mathematics: selected readings, P. Benacerraf and

H. Putnam, Editors. 1983, Cambridge University Press).

Page 59: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 58

Matematyka Hilberta to matematyka pojęć. Matematka Brouwera to matematyka konstrukcji.

Brouwer uważał, że mamy wrodzoną zdolność do tworzenia takich konstrukcji i ich mentalnejakceptacji. Ta zdolność - jak wszystko na tym świecie - nie jest dana wszystkim „po równo”. Cowięcej: możemy błądzić. Dlatego nieco poźniej79 Brouwer wprowadził korektę - zaczął mówić okonstrukcjach kreowanych przez idealnego matematyka: the objects of mathematics are mentalconstructions in the mind of the (ideal) mathematician. Only the thought constructions ofthe (idealized) mathematician are exact.” [121]80. Nie jest to jednak w żadnym razie wprowadzaniewątków transcedentnych, a jedynie próba obiektywizacji pojęcia matematycznej konstrukcji.

Osnową tych konstrukcji są pewne pierwotne pre-intuicje - „primordial intuition of mathema-tics” [3]”. A wśród nich ta najważniejsza - związana z liczbami naturalnymi81:

„One, two, three,..., we know by heart the sequence of these sounds (spoken ordinal numbers)as an endless row, that is to say, continuing for ever according to a law, known as being fixed. (...)These things are intuitively clear”82.

Konstrukcja, jakby na nią nie patrzeć, musi być opisana. Czym różni się opis konstrukcji od opisu własno-ści? Własność jest „wewnętrzna” a konstrukcja jest„zewnętrzna” w stosunku do zastanego języka, do za-akceptowanej wcześniej teorii. Dedekindowskie liczby rzeczywiste są opisane „wewnątrz” teorii mnogości.Brouwerowskie liczby rzeczywiste (o których za chwilę) wychodzą poza świat konstruowanych wcześniejliczb naturalnych, całkowitych, wymiernych83.

Brouwer nie dążył do apriorycznego określenia uniwersalnych kryteriów pozwalających na wery-fikację poprawności konstrukcji matematycznych. Zdaje się mówić, że tę kwestię rozstrzygać należydla każdej konkretnego obiektu matematycznego z osobna. Stwórzmy dzieło - obiekt matematyczny- a dopiero potem dyskutujmy o (matematycznym) sensie, o poprawności konstrukcji, o jej wartości.Czyż nie tak mówi o swoim dziele artysta?

Brouwerowskie Principle of Constructive Existence sformułowano w [86] tak: a mathematicalobject exists if it has been constructed with an accepted constructed method” opatrującdodatkowym komentarzem: „It is non-trivial to say which constructive method is the right one”84.

Pewne wyobrażenie, czym - dla Brouwera - jest konstrukcja matematyczna, da odpowiedź napytanie, co - jego zdaniem - w matematyce Hilberta jest niekonstruktywne?Konsekwencją platońskiego paradygmatu o transcedentnym istnieniu obiektów matematycznychjest to, że każde zdanie matematyczne jest prawdziwe lub fałszywe. Dlatgo akceptacjemy logiczneprawa wyłączonego środka - albo zdanie „A” jest prawdziwe albo jego zaprzeczenie - „nieprawda,że A” - jest prawdziwe. Równoważnie:

Alternatywa „A lub nieprawda, że A” jest prawdziwa, bez względu na kształt zdania A.

W szczególności alternatywa „istnieje obiekt O lub nieprawda, że istnieje obiekt O ” jest zawszeprawdziwa. Dlatego akceptujemy taki oto „dowód istnienia”:

„gdy założenie, że nie istnieje obiekt O prowadzi do absurdu, to ten obiekt istnieje”.

79Koncepcja Brouwera nie powstała w wyniku jednorazowego „aktu stworzenia”. Powstawała przez lata i byłamodyfikowana. Nie ułatwia to jej prezentacji...

80„Ideal mathematician”, „idealized human mind” lub „creating subject, creative subject”.81Początkowo Brouwer traktował również continuum jako taką pierwotną intuicję. Jednak później w jego matema-

tyce pojawiła się konstrukcja tego obiektu.82To zdanie - nie przypadkiem! - znalazło się na jednej z pierwszych stron rozprawy doktorskiej Brouwera. Kilka-

dziesiąt lat później kognitywiści mówią tak: „Niezależnie od kultury oraz wykształcenia, wszyscy ludzie dysponujązdolnością bezrefleksyjnego, natychmiastowego ustalenia, z jaką niewielką liczbą obiektów mają do czynienia (...) Przywiększej liczbie obiektów wymagana jest już pewna refleksja, działania polegające na porządkowaniu i liczeniu” [93].Taki jest też sens stwierdzenia Kroneckera „Liczby naturalne pochodzą od Boga”.

83Świat, w którym skonstruowaliśmy te liczby a nie zbiory tych liczb!84On an intuitionistic view (...), the only thing that can make a mathematical statement true is a proof of the kind

we can give: not, indeed, a proof in a formal system, but an intuitively acceptable proof, that is, a certain kindof mental construction” - M. Dummet, Elements of Intuitionism, The Clarendon Press, Oxford, 1977.

Page 60: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 59

Prawo wyłączonego środka jest źródłem niekonstruktywizmu w matematyce Hilberta.Oto (subtelny) przykład: rozważmy ciąg (an) taki, że an = 1

2n dla „prawie każdej” liczby n. Tenwyjątek robimy dla liczby m takiej, że 2m + 1 jest najmniejszą nieparzystą liczbą doskonałą85.Wtedy przyjmujemy am = 1.Dla matematyka mainstreamowego (an) jest ciągiem Cauchy’ego (w konsekwencji: istnieje liczbarzeczywista wyznaczona przez ten ciąg). Dowodzimy tego tak: oznaczmy przez ND zdanie „istniejenieparzysta liczba doskonała”. Łatwo udowodnimy dwie implikacje: „ND → (an) jest ciągiem Cauchy’ego”oraz „¬ND → (an) jest ciągiem Cauchy’ego”.Stąd implikacja „(ND ∨ ¬ND)→ (an) jest ciągiem Cauchy’ego” jest prawdziwa.Ponieważ - na mocy prawa wyłączonego środka! - (ND ∨ ¬ND) jest zdaniem prawdziwym, to izdanie „ciąg (an) jest ciągiem Cauchy’ego” musi być prawdziwe86.

Konstruktywista nie akceptuje tego dowodu. Dla niego alternatywa (ND∨¬ND) jest prawdzi-wa, gdy potrafimy (konstruktywnie) dowieść prawdziwości jednego z tych dwóch zdań. Konstruk-tywny dowód ND to wskazanie najmniejszej doskonałej liczby nieparzystej. A my, jak dotąd, niewiemy, czy istnieje jakakolwiek liczba nieparzysta doskonała (ani nie umiemy temu zaprzeczyć) .Konstruktywiści zaakceptują ten dowód dopiero wtedy, gdy któregoś dnia ktoś wskaże najmniejsząnieparzystą liczbę doskonałą lub (konstruktywnie) udowodni, że takiej liczby nie ma87.

Powtórzmy: stwierdzenie, że każde zdanie matematyczne jest prawdziwe lub fałszywe jest konsekwencjąakceptacji istnienia transcedentnego i niezmiennego w czasie matematycznego uniwersum.Matematyka Brouwera nie potrzebuje tego założenia. Ta matematyka koncentruje swoją uwagę na mate-matycznej kreacji i poznaniu. Respektuje fakt, że czegoś możemy nie wiedzieć. I nie wyklucza, że będziemyto wiedzieć jutro88.

Konstrukcja jest realizowana w czasie. Czas w konstrukcjach brouwerowskich to „internal, in-tuitive time” [122], „kantowska forma ujmowania zjawisk”. Miarą tak rozumianego czasu są liczbynaturalne.Siłą rzeczy, matematyka niezmiennych bytów lekceważy proces konstrukcji matematycznego obiek-tu. Taka konstrukcja jest tylko (niewymaganym) potwierdzeniem jego istnienia. Pierwotne jest„istnienie logiczne” ([?]). To zdaje się być głównym zarzutem stawianym przez konstruktywistówmatematyce hilbertowskiej. E. Bishop pisał: „Brouwer’s criticisms of classical mathematics wereconcerned with what I shall refer to as „the debasement of meaning”89 Po kilkadziesięciu latachE. Nelson pisał: „There is obviously something inelegant about making arithmetic depend on settheory” [82].

Rekurencyjnie definiowane liczby naturalne są konstruktywne. To fundament i osnowa wszelkichbrouwerowskich konstrukcji. Konstruktywne są też liczby całkowite i wymierne. Jednak fundamen-talnym wyzwaniem dla matematycznego konstruktywizmu było rozwiązanie problemu „konstruk-tywnego continuum”.

Do opisu liczb rzeczywistych Brouwer posłużył się pojęciem spreadu90.

Spread to nie aksjomat. On mówi o regułach konstrukcji podczas gdy aksjomaty mówią o istnieniupewnych obiektów o określonych własnościach.

85Liczba doskonała to liczba naturalna równa sumie swoich dzielników. Np. 6 = 1 + 2 + 3.86Łatwo zauważyć, że w istocie powtórzyłem tu rozumowanie opisane już na str. 191. To, co ważne trzeba powta-

rzać...87Zauważ też, że dopiero wskazanie najmniejszej nieparzystej liczby doskonałej pozwoli na konstruktywny dowód

implikacji ND → (an)jest ciągiem Cauch’ego. Ten przykład przedstawił Dummett [86].88To tłumaczy termin „weak counterexamples” - słabe kontrprzykłady, którym określa się przykłady niekonstruk-

tywnych twierdzeń matematyki teoriomnogościowej wskazywane przez Brouwera.89deprecjacja znaczenia.90Nie znam polskiego matematycznego odpowiednika tego terminu.... Ew. rozpiętość(?). Tak rozumieją ten termin

wszyscy, którzy spłacają kredyty „w walutach obcych”.

Page 61: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 60

Upraszczając (ponad miarę): spread to specyfikacja reguł procesu konstrukcji obiektów ma-tematycznych „określonego typu”. „A spread is not the sum of its elements (...). Rather, a spreadis identifed with its defning rules” [86]91. Stanowi, co może być początkiem tego procesu, a cojego kontynuacją. „A spread M is determined through the spread-law ΛM (...). ΛM decides whichfinite sequences of natural numbers are accepted or not. Namely ΛM :

(i) decides which naturals are admitted as sequences of length 1,(ii) accepts (a1a2, . . . , an), if it accepts (a1, a2, . . . , an, an+1),(iii) decides, for any natural k, whether it accepts (a1, a2, . . . , an, k) or not, if it accepts (a1, a2, . . . , an),(iv) accepts (a1, a2, . . . , an, k), for some k, if it accepts (a1, a2, . . . , an)”92.

Spread to nie zbiór. The notion of spread is one of Brouwer’s most important conceptual innovations, sinceit holds together all constructed sequances, without containing them as a set. The spread conceptderives from Brouwer’s need to avoid the concept of absolutely infnite set.93.

Każdy skończony ciąg zbudowany zgodnie z „prawem spreadu” jest tylko początkowym frag-mentem potencjalnie nieskończonego ciągu. I to te potencjalnie nieskończone ciągi są obiek-tami matematycznymi, opisanymi przez spread. Nie wolno jednak upraszczać myślenia i zastępićpotencjalnie nieskończone ciągi „zwykłymi”, czyli aktualnie nieskończonymi ciągami! Ciąg poten-cjalnie nieskończony to konstrukcja (proces) a ciąg aktualnie nieskończony to „byt transcedentny”-„a spread choice sequence is completely different from a classical sequence, which is a completeobject under the umbrella of classically accepted absolute infinity” [86]94.Potencjalnie nieskończone ciągi są zawsze „niedokończone” - w każdym momencie konstrukcji zna-my tylko ich skończone, początkowe fragmenty. Dlatego o tym, czy „cały obiekt” - potencjalnienieskończony ciąg - ma interesującą nas własność musimy decydować tylko na podstawie znajomo-ści pewnego skończonego, początkowego jego podciągu95:

- partial knowledge of an on-going object intuitionistically means knowledge of an initial partof it.

- knowledge of an on-going object intuitionistically means the gradual and evergrowing partialknowledge of it.Ta zasada znana jest pod nazwą „continuity principle”. Czasem zapisuje się ją tak:

A(α)→ ∃n ∀β (∀i¬nα(i) = β(i)))→ A(β))

(jeżeli ciąg α ma własność A, to każdy ciąg β, którego odpowiednio długi odcinek początkowy jesttaki sam jak w ciągu α, ma również własność A.96)

Skomplikowane i niejasne? Przyjrzymy się spreadowi - specyfikacji konstrukcji brouwerowskichliczb rzeczywistych:

- budowę takiej liczby możemy zacząć od dowolnej liczby wymiernej,- liczba wymierna a może być dopisana jako następna do ciągu a1, . . . , an , o ile |a− an| < 2−n.97

Dwa takie potencjalnie nieskończone ciągi (an) i (bn) są zgodne - wyznaczają tę samą liczbę rze-czywistą - jeżeli znamy procedurę, która dla dowolnej liczby naturalnej k pozwala skonstruować

91Spread jest pojęciem metamatematycznym. Brouwer, inaczej niż Hilbert, wyraźnie oddzielał matematykę odmetamatematyki.

92[86]. To tylko podstawowy fragment pełnej definicji spreadu. Słowo komentrza: pamiętamy, że liczby całkowite,wymierne, słowa, i wszystko to, co można skonstruować w ramach danej struktury rekurencyjnej, można ponumero-wać. Dlatego liczby naturalne w tych ciągach można zastąpić „skończenie konstruowalnymi obiektami”

93Można sobie wyobrazić „uniwersalny spread” - „ zacznij od dowolnej liczby naturalnej i dopisuj dowolną liczbę”.94„Ciąg losowy” o którym tu mowa to taki potencjalnie nieskończony ciąg o którym nie wiemy nic ponad to, co

wynika z „prawa spreadu”. Można - dla danego spreadu - mówić też o tzw. law-like sequences które zbudowane sązgodnie z prawem spreadu i pewną dodatkową regułą. Taką regułą - dla spreadu opisującego liczby rzeczywiste októrym za chwilę - może być np. stwierdzenie „ciąg się stabilizuje od setnego miejsca”. Akceptacja ciągów losowychjako pełnoprawnych konstrukcji i ich rola to jeden z bardziej dyskutowanych punktów matematyki Brouwera.

95I znajomości spreadu, w ramach którego został on utworzony.96Więcej o continuity principle można dowiedzieć się z [4]97Zauważ, że rozważany wcześniej ciąg (gbn) nie spełnia warunków wymaganych przez spread liczb rzeczywistych...

Page 62: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 61

liczbę m ∈ N taką, że |am+s − bm+s| < 2−k dla dowolnej liczby naturalnej s98.

Tak opisane intuicjonistyczne kontinuum różni się sporo od prostej rzeczywistej. Oto przykład99:potrafimy - korzystając np. ze wzoru Leibniza - obliczyć kolejne liczby dziesiętnego rozwinięcialiczby π, π = 3, 14p1 . . . pm . . .. Dlatego dla dowolnej liczby m ∈ N umiemy rozstrzygać, czy zdanieC90(m) - „w ciągu p1 . . . pm występuje dziewięćdziesiąt kolejnych dziewiątek” - jest prawdziwe czyteż nie. Popatrzmy teraz na ciąg br = (brk : k ∈ N) taki, że

brk =

(−1)m

2m istnieje m ¬ k takie, że zdanie C90(m) jest prawdziwe(−1)k

2k w przeciwnym przypadku

Jeśli postrzegamy ten ciąg jako aktualnie nieskończony, to - w matematyce mainstreamowej - łatwopokażemy, że jest on zbieżny i wyznacza liczbę rzeczywistą br taką, że:

br =

0 - gdy zdanie C90(m) nie jest prawdziwe dla żadnej liczby m,

12m > 0 - gdy najmniejsza liczba, dla której zdanie C90(m) jest prawdziwe jest liczbą parzystą,−12m < 0 - w pozostałych przypadkach

I nie przejmujemy się tym, że nie wiemy, którą z tych trzech liczb wyznacza nasz ciąg...Konstrukcja ciągu (brk) jest zgodna ze spreadem-specyfikacją liczb rzeczywistych. Reprezentuje

więc „konstruktywną” liczbę rzeczywistą. Ale nie potrafimy pokazać, że ten ciąg jest zgodny zciągiem stałym (0, 0, . . . , 0, . . .) bo to wymaga rozstrzygnięcia, czy zdanie ∃k C90(k) jest prawdziwe!A tego nie wiemy100. Z tego samego powodu nie potrafimy uzasadnić, że ciąg (brk) wyznacza liczbę

12m (lub −1

2m ) dla pewnej liczby m101.Ciąg (brk) wyznacza więc liczbę rzeczywistą różną od tych trzech liczb w tym sensie, że nie

mamy konstruktywnego dowodu żadnej z trzech oczekiwanych równości. A to oznacza, że w bro-uwerowskim continuum nie obowiązuje prawo trychotomii: nie da się konstruktywnie uzasadnić żedla każdej liczby rzeczywistej a, a = 0 lub a > 0 lub a < 0 . 102

98Warto w tym miejscu przypomnieć sobie jak „zbiór” definiował Martin-Lof.99Przykład pochodzi z artykułu „Intuitionistic Logic” D. Van Dalena (The Blackwell Guide to Philosophica Logic.

Ed. L.Gobble. Blackwell, Oxford, 2001).100W chwili gdy to piszę.101Do czasu, gdy ktoś nie wskaże liczby m takiej, że zdanie C90(m) jest prawdziwe lub wykaże, że takiej liczby nie

ma.102Liczba π i jej rozwinięcie - nieskończony ciąg cyfr, którego każdy skończony początkowy odcinek potrafimy

obliczyć ale, całości nie poznamy nigdy - była chętnie wykorzystywana przez Brouwera do konstrukcji jego „słabychkontrprzykładów”.

Podziwu godna liczba Pitrzy koma jeden cztery jeden.Wszystkie jej dalsze cyfry też są początkowepięć dziewięć dwa, ponieważ nigdy się nie kończy.Nie pozwala się objąć sześć pięć trzy pięć spojrzeniem,osiem dziewięć obliczeniem,siedem dziewięć wyobraźnią,a nawet trzy dwa trzy osiem żartem, czyli porównaniemcztery sześć do czegokolwiekdwa sześć cztery trzy na świecie.

Najdłuższy ziemski wąż po kilkunastu metrach się ury-wa.Podobnie, choć trochę później, czynią węże bajeczne.Korowód cyfr składających się na liczbę Pinie zatrzymuje się na brzegu kartki,potrafi ciągnąć się po stole, przez powietrze,przez mur, liść, gniazdo ptasie, chmury, prosto w niebo,przez całą nieba wzdętość i bezdenność.O, jak krótki, wprost mysi, jest warkocz komety!Jak wątły promień gwiazdy, że zakrzywia się w lada prze-strzeni!

A tu dwa trzy piętnaście trzysta dziewiętnaściemój numer telefonu twój numer koszulirok tysiąc dziewięćset siedemdziesiąty trzeci szóste piętroilość mieszkańców sześćdziesiąt pięć groszyobwód w biodrach dwa palce szarada i szyfr,w którym słowiczku mój a leć, a piejoraz uprasza się zachować spokój,a także ziemia i niebo przeminą,

ale nie liczba Pi, co to to nie,ona wciąż swoje niezłe jeszcze pięć,nie byle jakie osiem,nie ostatnie siedem,przynaglając, ach przynaglając gnuśną wiecznośćdo trwania.

Wisława Szymborska, Liczba Pi

.

Page 63: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 62

Konstruktywizm nie tylko neguje prawo trychotomii ale, konsekwentnie, odrzuca wszystkie udowodnionew oparciu o nie twierdzenia103.Metafora geometryczno-liczbowa nie funkcjonuje w matematyce Brouwera... Jak żyć, (panie premierze)?

Idźmy dalej: chcąc budować konstruktywną analizę matematyczną musimy dysponować poję-ciem (ciągłej) funkcji rzeczywistej. Konstruktywna funkcja nie jest zbiorem. Czym więc jest?

Brouwer pisał: „...by a function...we understand a law...” (pozwalające na przyporządkowaniuargumentowi wartości). Brower nie doprecyzował czym jest to „prawo”. Ale np. dodawanie liczbrzeczywistych - czyli prawo nakazujące z dwóch ciągów-liczb (αn) i (βn) zbudować ciąg (αn + βn)- z pewnością mieści się w brouwerowskim rozumieniu tego terminu.Skoro liczby rzeczywiste są ciągami potencjalnie nieskończonymi, to, konsekwentnie, wartość funkcjif na takiej liczbie-ciągu α powinna być określona na podstawie wiedzy o jego pewnym, skończonymodcinku początkowym. To prowadzi do takiej propozycji doprecyzowania pojęcia brouwerowskiejfunkcji rzeczywistej:

funkcja rzeczywista to reguła przyporządkowująca każdej liczbie rzeczywistej α liczbę rzeczy-wistą Φ(α) w taki sposób, że jeśli α i β są zgodne, to również Φ(α) i Φ(β) są zgodne [86].

Należy to zapewne rozumieć jako zdolność do przekształcenia każdej procedury orzekającej ozgodności ciągów α i β w procedurę orzekającą o zgodności ciągów Φ(α) i Φ(β). Ale to i takjest odległe od tego, czego oczekuje matematyk przyzwyczajony do precyzji języka matematykiHilberta...

A „na końcu” rozważań o konstruktywnym kontinuum czeka nas takie zaskakujące normalnegomatematyka twierdzenie:

Każda funkcja rzeczywista jest ciągła...104

Ale my wiemy, że użyte tu pojęcia mogą być rozumiane zupełnie inaczej niż w matematyceteoriomnogościowej...

Pora na próbę podsumowania. Hilbert czy Brouwer?G. Sambin w artykule Step towards dynamic construtivism105 pisał tak: (...) „brouwerowska filozofiamatematyki (...) jest odrzucana przez większość z uwagi na jej „związki z mistycyzmem”.

Ale czy matematyka Hilberta jest w pełni racjonalna? Czytajmy dalej - już w oryginale: But(...) the real problem is that, if by religion we mean any form of unprovable belief in somethingbeyond our perceptions, then apparently also all other existing philosophies of mathematics arebased no less on religion.(...) Of course we all remain free to belive whatever we wish. In myview the problem with religionis that it has ofen been accepted quite uncritically, in the form of”blind faith”, and this can lead to the making of very bad (...) mistakes. (...) the supposition,dogma even, that an absolute truth must exist and that classical axiomatic set theories such as ZFmust form a part of this truth, has resulted in a number of cultural errors - intelectual atrocitieseven - of which the Banach-Tarski paradox is just another very bad - or excellent - example106.More then just being philosophically shaky ZF has severely impaired our intuition by splitting itfrom what ZF would have us to belive”107. W matematyce Hilberta mistycyzm jest też obecny,ale sprowadza się do jednorazowego „aktu zawierzenia”, czyli uznania zasadności i uniwersalnościpraw klasycznej logiki i aksjomatów teorii mnogości. Potem wszystko jest poukładane. To stwarza

103Takim twierdzeniem jest np. wspominany wcześniej wynik Darboux. Konstruktywnie można dowieść coś takiego:„jeśli f : [a, b]→R jest ciągła i f(a) · f(b) < 0, to dla dowolnej liczby n istnieje c(n) ∈ [a, b] taka, że |f(c(n))| < 1

2n ”(http://plato.stanford.edu/entries /intuitionism/

104https://plato.stanford.edu/entries/intuitionism105http://www.math.unipd.it/ sambin/txt/StepsL.pdf.106„Kulę można pociąć na skończenie wiele kawałków, z których można złożyć dwie kule równe kuli wyjściowej.”

atrocity = bezeceństwo, okropność, ohyda107G.Sambin, Przetłumaczymy (nieudolnie) ostatnie zdanie, bo jest ważne „Bardziej znaczące niż to, że teoria

mnogości Zermelo Freankla jest filozoficznie chwiejna (niepewna) jest to, że okrutnie osłabia ona naszą intuicjęoddzielając ją do tego, w co każe nam wierzyć”

Page 64: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 63

pozór racjonalności. Takie przekonanie żywi większość pracujących matematyków - nikt przecieżnie żąda od rozpoczynających karierę młodych matematyków świadomej akceptacji aksjomatówteorii mnogości... . Wchodzimy w ten świat nieświadomi problemów jakie leżą u jego podstaw. Iwiększość wcale nie chce zmieniać tego stanu rzeczy.W matematyce Brouwera ta niepewność jest bardziej widoczna. Ta matematyka jest sztuką, czyli,z natury rzeczy, jest subiektywna i „mistyczna” - nie tylko w warstwie podstawowych ustaleń alewłaściwie w każdym „akcie twórczym”. .

W chwili powstania teoria mnogości była jednocześnie zachowawcza i rewolucyjna. Zachowaw-cza, bo wierna euklidesowemu paradygmatowi postrzegania matematyki jako teorii aksjomatycznej.Rewolucyjna, bo nie tylko uporządkowała zastaną matematykę, ale otworzyła nowe obszary eks-ploracji matematycznej. Proponując „niekontrowersyjne” (w większości i dla większości) aksjomatyi oferując uniwersalny język stworzyła wrażenie, że to, co zastała, spojone z tym, co oferuje, towymarzone matematyczne uniwersum. Akceptacja hilbertowskiej koherencyjnej teorii istnienia toradykalne odejście od dominującego wcześniej konstruktywizmu108.

Konstruktywizm Brouwera nie może w pełni konkurować z teorią mnogości. H. Weyl, jedenz twórców intuicjonizmu, pisał109: „Mathematics with Brouwer gains its highest intuitive clarity.He succeeds in developing the beginnings of analysis in a natural manner, all the time preservingthe contact with intuition (...) . It cannot be denied, however, that in advancing to higher andmore general theories the inapplicability of the simple laws of classical logic eventually results inan almost unbearable awkwardness110. And the mathematician watches with pain the greater partof his towering edifice111 which he believed to be built of concrete blocks dissolve into mist beforehis eyes.”To prawda. Ale tylko dlatego, że chcemy, by brouwerowski konstruktywizm sprawdził się „na boiskuprzeciwnika”, w świecie matematyki teoriomnogościowej. Być może matematyka Brouwera ma innyobszar badań. Może właściwym miejscem porównań obu wizji matematyki stanie się rzeczywistośćświata ery postindustrialnej, w którym najważniejsza staje się jakość procesów pozyskiwania iprzetwarzania informacji. To wyzwanie, na które będzie musiała odpowiedzieć matematyka XXIwieku. I nie można wykluczyć, że matematyka konstruktywna okaże się na tym polu bardziejskuteczna niż matematyka teoriomnogościowa112.

Rygorystyczny formalizm matematyki Hilberta sprawia, że stała się ona czytelna nie tylko dlanielicznych geniuszy, ale dla szerokiego kręgu robotników matematyki. To ma dobre, ale i złe strony.W 1975 roku Bishop pisał: „There is a crisis in contemporary mathematics, and anybody who hasnot noticed it is being willfully blind. The crisis is due to our neglect of philosophical issues. Thecourses in the foundations of mathematics as taught in our universities emphasize the mathematicalanalysis of formal systems, at the expense of philosophical substance. Thus it is the mathemati-cal profession that tends to equate philosophy with the study of formal systems, which requireknowledge of technical theorems for comprehension. They do not want to learn yet another branchof mathematics and therefore leave the philosophy to the experts. As a consequence, we provethese theorems and we do not know what they mean”. Trudno się nie zgodzić. Najpraw-dopodobniej większość publikowanych prac matematycznych skazana jest na szybkie zapomnienie.Choć formalnie poprawne nie wnoszą niczego do dorobku matematyki. To jest nieuchronna cena

108(...) with the notable exception of geometry, where proof by contradiction was commonly accepted and widelyemployed” - jak napisał A. S. Troelstra w [121].Nie należy jednak arogancko twierdzić, że przed teoria mnogości ciemni ludzie nie znali matematyki... W Borach Tu-cholskich funkcjonuje do dziś Wielki Kanał Brdy zbudowany w latach 1842-1848 (czyli „przed Cantorem”). Przepływwody przez kanał został wymuszony naturalnie, przez różnicę poziomów między jego początkiem i końcem. Kanałma ok. 20 km długości, a ta różnica poziomów to.. 140 cm. Siedem centymetrów spadku na każdy kilometr kanału...Kto i jak to wyliczył? Bez teorii mnogości, continuum Dirichleta i analizy matematycznej Weierstrassa?

109http://plato.stanford.edu/entries/weyl/# DasKon110nieznośne niedołęstwo111gmach112Warto zajrzeć np. na stronę http://www.charlespetzold.com/blog/2008/05/Turing-and-Brouwer.html, gdzie moż-

na odnaleźć ciekawe dywagacje na temat wpływu Brouwera na Turinga.

Page 65: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 4. SPÓR O ISTOTĘ MATEMATYCZNEGO BYTU 64

„demokratyzacji” matematyki, która jest ubocznym skutkiem dominacji koncepcji Hilberta.Można się łudzić, że matematyki Hilberta można się nauczyć. Matematyki Brouwera - nie.

Można się nauczyć rzemiosła, ale nie tworzenia (dzieł sztuki).Wystarczy. I tak napisałem za dużo. „O czym nie można mówić, trzeba milczeć”113.

113L.Wittgenstein.

Page 66: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 5

Język matematyki

Każdy potrafi wysłowić w ojczystym języku różne własności i wskazywać ich desygnaty - obiekty,którym one przysługują. Wykształcenie matematyczne polega m.in. na przyswojeniu specyficzne-go języka umożliwiającego precyzyjny opis zawiłych własności obiektów świata matematycznego.Uczymy się tego słuchając wykładów. Ale wykładowca to - w wiekszości przypadków - pracującymatematyk i ma do języka matematyki stosunek pragmatyczny. Użyje bez wahania symbolu „∀”zawsze, gdy zechce zapisać sąd ogólny (rozpoczynający się od słów „dla każdego”) i gdy uzna, że jestto przydatne. I nie zastanawia się, czy napis na tablicy to formalnie poprawna formuła pierwszegoczy np. drugiego rzędu. Powiedzmy prawdę - czasem nawet tego nie wie.

Trochę żal... Język matematyki ma umożliwić precyzję i jednoznaczność sądów wtedy, gdy zawodzi języknaturalny. W praktyce matematycznej posługujemy się czymś w rodzaju slangu - mieszaniną językanaturalnego i formalnego. Pracując w grupie specjalistów przyjmujemy umowny poziom oczywistości -prawo do pomijania pewnych szczegółów wywodu. To konieczne. Ale niezbywalnym elementem kulturymatematycznej jest, by na każde żądanie słuchaczy wypełnić luki, rozwinąć skróty itp., które znalazły sięw naszej argumentacji. Spory i wątpliwości rozstrzygamy na poziomie formalnego zapisu.

5.1 Języki naturalne i formalne: dwa mity.

„Wiele nowych idei można wyrazić w języku niematematycznym, alewcale nie są przez to łatwiejsze”.

B.Russell, „ABC of Relativity”

Mit pierwszy: „język współczesnej matematyki to w istocie taki sam język jak np. język polski,tylko stosuje się w nim specjalną notację po to, by zapisy były krótsze”.Nieprawda. Języki naturalne są narzędziem komunikacji między ludźmi. Rozumianej nie tylko ja-ko przekaz informacji, ale również emocji i wartości, cokolwiek to oznacza. Bez języka nie jestmożliwe kształtowanie wartości kulturowych i etycznych oraz wzorców zachowań. Miarą rozwojuspołeczności jest jakość języka, którym się ono posługuje1.

Języki naturalne nie powstały w wyniku jednorazowego i świadomego aktu twórczego (pomija-jąc legendę wieży Babel). Są rezultatem długotrwałego, niekończącego się procesu. Zmieniają się wodpowiedzi na nowe potrzeby. Powstają nowe słowa a stare nabierają nowych znaczeń. Strukturajęzyka się nawarstwia. Staje się wieloznaczna a czasem nawet wewnętrznie sprzeczna. Sens wypo-wiedzi jest uwarunkowany sytuacyjnie („kontekstowo”), może też być kształtowany subiektywnieprzez nadawcę i odbiorcę. I to jest piękne2.

Język formalny z założenia nie ma pełnić tych samych funkcji co język naturalny. Jest podpo-rządkowany wybranym działaniom, które ma wspomagać. Dlatego może być prostszy niż naturalny.

1I odwrotnie: zubożenie języka jest objawem jej degradacji.2„Like a bird on a wire, Like a drunk in a midnight choir. I have tried in my way to be free...”

(L. Cohen, Bird on the wire).

65

Page 67: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 66

Języki naturalne „zastajemy”, języki formalne tworzymy. Tworząc, możemy zapewnić sobie pełnąkontrolę nad ich składnią.

Mit drugi: „język matematyki to taki sam język „branżowy” jakimi dysponują inne dziedzinynauki czy zawody.”Nieprawda. To fakt: języki branżowe są w pewnym stopniu przeciwieństwem języków naturalnych,gdyż są tworzone na potrzeby określonej grupy społecznej (zawodu, dziedziny nauki). Mają uspraw-nić komunikację w grupie połączonej wspólnym działaniem. Oferują rozbudowaną, specjalistycznąi - co ważne - jednoznacznie interpretowaną terminologię3.Jednak zapewnienie komunikacji ludziom branży to tylko jedno z zadań języka matematyki. Tenjęzyk jest językiem kreacji pojęć. Jest też językiem argumentacji, uzasadniania sądów. Ma-tematyka nie jest nauką, której hipotezy weryfikuje się doświadczalnie. Dlatego integralną cześciąkażdego języka matematyki jest jego wewnętrzna logika pozwalająca na zobiektywizowaną ocenęzasadności stwierdzeń tego języka i zasadności argumentacji.

5.1.1 Logika języka

Odkrywanie prawd jest zadaniemwszelkiej nauki; zadaniem logiki jestodkrywanie praw prawdziwości.

G. Frege

Mathematics and Logic, historically speaking, ha-ve been entirely different studies. Mathematicshas been connected in Science, Logic withGreek.

B. Russell4

Wypowiedzi G. Frege5 i B. Russella odpowiadają dwóm różnym spojrzeniom na relację międzyjęzykiem a logiką6.

Dla G. Frege prawa logiki są uniwersalne, obiektywne i wspólne dla wszystkich języków. One siętylko w tych językach ujawniają7. „Prawa prawdziwości” to zdania, których prawdziwość wynikawyłącznie z ich kształtu, a nie ich znaczeń. Zadaniem logiki jest ujawnianie takich zdań. Pracana całą wieczność, bo takich zdań jest nieskończenie wiele. Ale Frege genialnie rozwiązał problemadaptując na potrzeby logiki metodę powszechną w matematyce: zbudował system aksjomatycznypozwalający na dowodzenie „praw prawdziwości”8.

Russell mówi coś zgoła odmiennego: „Logic (has been connected) with Greek” - logika to częśćjęzyka.

Komunikacja między ludźmi, to - w dużej części - przedstawianie sądów (stwierdzeń, ocen) wymagających

3Gdy dyplomata mówi „tak” to znaczy „być może”. Gdy mówi „być może” to znaczy „nie”. A gdy mówi „nie” to... nie jest dyplomatą” (Wolter).

4Cytuję za Practical Foundations of Mathematics, P. Taylora.5Gottlob Frege(1848-1952) - jeden z twórców logicyzmu matematycznego. Podstawą matematyki miała być stwo-

rzona przez niego logika predykatów. Tego terminu używa się obecnie jako synonimu terminu logika pierwszego rzędu.6„W XIX wieku popularne było łączenie logiki z teorią poznania(...). Rozumowano tak: logika i teoria poznania

stanowią rodzaje nauki o poznaniu. Można zatem mówić o logice w znaczeniu szerszym (logika formalna plus episte-mologia) i logice w sensie węższym (tylko logika formalna). Ta druga dotyczy formy poznania, natomiast druga jegotreści”. (J. Woleński - „Czym jest logika? - część 1 - Internetowy Serwis Filozoficzny. Nie poprawiłem redakcyjnegobłędu w tym tekście, pozostawiając tę radość czytelnikom.) . My mówimy o logice raczej w tym szerszym znaczeniu.

7Nazwa „Logika” pochodzi od greckiego słowa „logos” (świat).8Klasyczna logika zdaniowa wyróżnia cztery spójniki zdaniowe: koniunkcję - „∧”, alternatywę - „∨”, negację - „¬”

i implikację - „→”. Analiza składniowa zdania polega na ujawnieniu występujących w nim spójników i ich hierarchii.Strukturę zdania opisujemy za pomocą formuł zdaniowych. Np. formuła - schemat zdania „Jeśli pada deszcz, to niepójdziemy na plażę i kupimy lody” to p→ (¬q ∧ r) gdzie p, q, r to zmienne zdaniowe reprezentujące zdania proste -takie, w których nie ma żadnych spójników.Aksjomatyczny system dowodzenia G. Frege składa się z pięciu (schematów) aksjomatów: A → (B → A), (A →(B → C)) → (A → B) → (A → C), (A → (B → C)) → (B → (A → C)), ((A → B) → (¬B → ¬A), A ↔ ¬¬A(litery A,B,C reprezentują tu dowolne zdania). Oprócz wymienionych, są tu aksjomaty „niejawne” - równoważności,pozwalające wyrazić koniunkcję i alternatywę za pomocą implikacji i negacji. Jedyną regułą dowodzenia w tymsystemie jest reguła „modus ponens”: jeżeli zdania A i A→ B są prawdziwe, to i zdanie B jest prawdziwe.

Page 68: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 67

uzasadnienia. Dla Arystotelesa logika zdaniowa to narzędzie wspomagające dyskurs, pozwalające naobiektywną ocenę uzasadnień. Ta obiektywizacja polega na ustaleniu, a potem odwoływaniu się do reguł,opisujących relację logicznej konsekwencji.Logika języka to opis zasad argumentacji - reguł dowodzenia. Te zasady odkrywamy, gdy analizujemyjęzyk naturalny. Te reguły kreujemy, gdy tworzymy języki formalne. Tworząc język równolegle budujemyjego logikę9.

W logice klasycznej, której celem jest ujawnianie praw prawdziwości, konsekwencja jest nadrugim planie: aby pokazać, że „zdanie B jest konsekwencją zdania A”, konstruujemy (np. wsystemie Fregego) dowód stwierdzenia „implikacja A→ B jest zdaniem prawdziwym”.

Czy można uprawiać logikę traktując priorytetowo konsekwencję a nie prawdziwość? W latach20-tych XX wieku zapoczątkowano logikę założeniową - sposób uprawiania logiki koncentrującyuwagę na badaniu konsekwencji. Wśród jej prekursorów byli dwaj Polacy: Jan Łukasiewicz i Sta-nisław Jaśkowski10. Niestety, ich wkład w rozwój logiki założeniowej jest często niezauważany.Więcej szczęścia(?) miał niemiecki logik G. Gentzen (1909-1945), twórca systemu dedukcji natu-ralnej. Gentzen pisał: „Moim głównym celem było stworzenie formalizmu maksymalnie bliskiegorzeczywistemu dowodzeniu”.Paradygmat logiki założeniowej stanowi, że wiedza o logice języka wyraża się przez stwierdzeniapostaci:„zdanie Z jest konsekwencją koniunkcji skończonego zbioru zdań-założeń Γ”.

Symbolicznie: Γ ` Z.

Zadaniem logiki jest dostarczanie reguł wnioskowania postaci:„zdanie T jest konsekwencją Γ, o ileT1 jest konsekwencją Γ1, T2 jest konsekwencją Γ2, ... , Tn jest konsekwencją Γn”

Γ1 ` T1, . . . ,Γn ` TnΓ ` T

formułowanych na podstawie analizy struktury syntaktycznej zdań. I tak np. w gentzenowskim sys-temie dedukcji naturalnej dla klasycznej logiki zdaniowej mamy dwie reguły, związane z implikacją:

Γ ∧A ` BΓ ` (A→ B)

Γ ` (A→ B) Γ ` AΓ ` B

Pierwsza z nich mówi: „implikację A → B można uznać za konsekwencję zbioru zdań-założeń Γ,jeśli tylko wiemy (potrafimy pokazać), że zdanie B jest konsekwencją zbioru Γ ∪ A”. Podobnieodczytujemy drugą z tych reguł.

Analizę pozostałych reguł tego systemu pozostawiam jako przyjemne ćwiczenie. Przyjemne, bo po chwilizastanowienia zauważymy naturalny charakter (większości) tych reguł:

Γ ` A,Γ ` BΓ ` A ∧B

Γ ` A ∧BΓ ` A

Γ ` A ∧BΓ ` B

Γ ` AΓ ` A ∨B

Γ ` BΓ ` A ∨B

Γ ` A ∨B Γ ∧A ` C Γ ∧B ` CΓ ` C

9W praktyce cała klasa języków może mieć wspólną logikę. Przykładem są tu języki pierwszego rzędu o którychjuż wkrótce powiemy więcej.

10In his 1926 seminars, Jan Łukasiewicz raised the issue that mathematicians do not construct their proof bymeans of an axiomatic theory (...) but rather made use of other reasoning methods; especially they allow themselvesto make an „arbitrary assumptions” and see when they lead. Łukasiewicz issued the challange for logicians to developa logical theory that embodied this insight but which yielded the same set of theorems as the axiomatic system thenin existence. This challange was taken up by Stanisław Jaśkowski culminating in his (1934) paper.” - F.J. Pelletier,„A Brief History of Natural Deduction (History of Philosophy of Logic, 20(1999),1-31). Dodajmy, że od 1945 rokuprof. Jaśkowski pracował na Uniwersytecie M. Kopernika w Toruniu a w latach 1959-1962 był jego rektorem.

Page 69: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 68

Γ ∧A ` 0Γ ` ¬A

Γ ` ¬A Γ ` AΓ ` 0

Γ ∧ ¬A ` 0Γ ` A

(0 oznacza tu zdanie zawsze fałszywe).

System dedukcji naturalnej dla klasycznej logiki zdaniowej ma jeden aksjomat (jeden schemataksjomatu), który wygląda tak:

Γ ∧ Z ` Z„ zdanie-konkluzja jest konsekwencją zbioru założeń, jesli tylko wśród nich jest ono samo”

Musimy przyznać, że jest to prawda podstawowa zupełnie innego rodzaju niż aksjomaty systemu Fregego.To jedna z tych nie budzących sprzeciwu „brouwerowskich” intuicji.

Systemy Fregego i Gentzena są równoważne: zdanie A ma dowód w systemie Fregego dokładniewtedy, gdy stwierdzenie 1 ` A jest dowodliwe w systemie Gentzena”11.

Skoro tak, to o co kruszyć kopie?Matematyzacja wielowiekowego dorobku logików i filozofów dokonana przez G. Frege to zamknięcieepoki, w której logika traktowana była przede wszystkim jako składowa filozofii, działanie prowadzą-ce do poznania prawd uniwersalnych, transcedentnych. Dzieło Fregego było konieczne i przydatne,ale raczej porządkujące niż inspirujące12.

Logika założeniowa ponownie otworzyła logikę formułując dla niej nowe cele. Zwróciła uwagęna pragmatyczny aspekt logiki, na proces uzasadniania zdań. Stworzyła podstawy rozwoju logikikonstruktywnej i intuicjonistycznej, o których w Stanfordzkiej Encyklopedii Filozofii napisano tak:„Intuitionistic and constructive logic began when people saw the possibility of reading A→ B, as‘if you give me an A, I will give you a B’, which is a significant departure from the classical reading‘B is true whenever A is”13.

Dzięki Gentzenowi, Łukasiewiczowi i Jaśkowskiemu prawie pół wieku poźniej Y. Girard mógłtak określić cele logiki: „Logic is the study of patterns found in reasoning. The task of the logicianis to set down rules for distinguishing between valid and fallacious inference, between rational andflawed arguments”.

Angielskie słowo reason ma wiele polskich odpowiedników,np. motyw, powód, przekonać, przyczyna,racja, rozsądek, rozum, uzasadnienie, wnioskować, argument a nawet filozofować, logika(?), sąd - jakpodają przyzwoite słowniki. Anglikom łatwiej przyjąć do wiadomości, że „pattern of reasoning” ma wieleznaczeń... .Logika założeniowa określa reguły budowy poprawnych uzasadnień zdań złożonych na podstawie uzasad-nień zdań prostych nie wikłając się w jałowe dyskusje, czym jest uzasadnienie (zdań prostych).Pojęcie konsekwencji zyskało nowy, szreszy sens.

Takie rozumienie zadań logiki pozwala na akceptację współistnienia różnych logik.Ale po co nam one?

111 to zdanie zawsze prawdziwe.Dowodliwość 1 ` A oznacza bezwarunkowe uzasadnienie A.12Większość pracujących matematyków przyjmuje do wiadomości istnienie formalnej logiki i zadowala się informa-

cją, że stosowane przez nich (niesformalizowane) procedury dowodowe nie są sprzeczne z tym, co opisują sformalizo-wane systemy. Studenci matematyki zachowują się podobnie i oceniają zajęcia z logiki jako jedne z najnudniejszych.Powód - oprócz powszechnego wśród studentów przekonania o ich nadprzeciętnych zdolnościach - jest prosty: ich kon-takt z logiką zdaniową ogranicza się najczęściej do poznania klasycznego rachunku zdań. Ale ten rachunek to tylkoalgebraizacja i algorytmizacja logiki zdaniowej oparta na świetnym pomyśle G. Boole’a. Kogo pasjonuje zerojedyn-kowe testowanie formuł zdaniowych za pomocą niemiłosiernie nudnego algorytmu? Kto ze studentów kiedykolwiekwykorzysta fascynujące odkrycie, że formuła zdaniowa (p ∧ (r → (p→ q)) ∨ p)→ ¬p jest prawem rachunku zdań?„A w filmie polskim, proszę pana, to jest tak: nuda... Nic się nie dzieje, proszę pana. Nic. (...) Dialogi niedobre...Bardzo niedobre dialogi są. W ogóle brak akcji jest. Nic się nie dzieje...” („Rejs” M. Piwowskiego).

13http://plato.stanford.edu/entries/logic-linear/. Dosłownie to samo zdanie można znaleźć w artykuleM.Gaboardiego, A.Momigliano i C.Schurmann dostępnym w internecie (http://momigliano.di.unimi.it/teaching/Corsi di Dottorato/Linear Logic/outline.pdf). Autorzy jednak nie wskazują SEF jako źródła... Śmieszne? Mało.

Page 70: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 69

Zdania „Jeśli mam 7 zł, to stać mnie na jasne piwo” oraz„Jeśli mam 7 zł, to stać mnie na ciemnepiwo” można uznać za prawdziwe14. Ale nikt przytomny nie wywnioskuje z tych przesłanek, że „jeślimam 7 zł, to stać mnie na jasne i ciemne piwo”. To oznacza, że klasyczna reguła wnioskowaniaΓ`p,Γ`qΓ`p∧q nie ma tu zastosowania. Tu jest potrzebna logika, w której „realizacja konkluzji powoduje

wyczerpywanie przesłanek”. Ta idea leży u podstaw rozwijanej na potrzeby informatyki teoretycznejlogiki liniowej, o której w nieocenionej Stanfordzkiej Encyklopedii Filozofii napisano tak: „Linearlogic is a refinement of classical and intuitionistic logic. Instead of emphasizing truth, as in classicallogic, or proof, as in intuitionistic logic, linear logic emphasizes the role of formulas as resources.(...) Linear logic begins with a further twist in the reading of ‘A→ B’: read now ‘give me as manyA as I might need and I will give you one B’15.

Inny przykład. Któż zabroni z przesłanki „Jasiu znów zapłacił mandat” wywnioskować, że Jasiujuż kiedyś zapłacił mandat”? Jednak klasyczna logika zdaniowa nas do tego nie upoważnia. Onaformalizuje tylko fragment logiki języka naturalnego16 - nie analizuje wszystkich związków struktu-ralnych między zdaniami tego języka. W szczególności, logika klasyczna traktuje oba przytoczonewyżej zdania jako zdania proste. A żadne zdanie proste nie jest konsekwencją innego zdania proste-go17. Gdyby stworzyć logikę, która frazy „znów” i „kiedyś” traktuje jako spójniki tworzące zdaniazłożone i gdyby dodać aksjomat znów A`kiedyś A , to dwa zdania o przypadkach Jasia byłyby

związane (dowodliwą formalnie) relacją konsekwencji18.

Możemy tworzyć różne logiki dla realizacji różnych celów. To różni współczesne i klasyczne rozumienie -tak rozumiana logika nie jest odkrywaniem prawd uniwersalnych ale kreacją.Nie ma jednej logiki świata. Są tylko logiki naszego poznawania (opisu) świata.

„Logiczny ład świata to nasza modlitwa do piramidy chaosu”19.

Logika jest częścią języka. Jest naszą świadomością jego możliwości poznawczych.

Dodatek: o (drobnym) nieporozumieniu wokół kreski Sheffera

Kreska Sheffera jest bliska tym, którzy znają sieci boolowskie (logiczne). Jest to dwuargumentowyspójnik zdaniowy wprowadzony jako „skrót”:

p|q ≡ ¬(p ∧ q)Zdanie p|q jest prawdziwe gdy zdania p i q wzajemnie się wykluczają - nie są jednocześnie prawdzi-we. Za pomocą tego spójnika można odtworzyć (zdefiniować) wszystkie klasyczne spójniki zdaniowe:

¬p ≡ p|p, p ∧ q ≡ (p|p)(q|q), p ∨ q ≡ (p|q)(p|q).To prowokuje do pytania: jaki kształt przyjęła by logika, gdyby kreska Sheffera była podstawowymi jedynym spójnikiem służącym do konstrukcji zdań złożonych?Pytanie ciekawe, ale ... bezprzedmiotowe. Bo nie ma takiego języka naturalnego, w którym funk-cjonuje kreska Sheffera. Nie ma języka, w którym fraza „p kreska p” zastępuje frazę „nieprawda, żep”. „Odkrycie” kreski Shaffera i jej zastosowanie w projektowaniu sieci boolowskich to efekt wtórnyformalizacji i algebraizacji logiki zdaniowej20. A logika jest logiką języka. Koniec bajki.

14W realiach Torunia początku XXI wieku.15http://plato.stanford.edu/entries/logic-linear/. Jednym z twórców logiki liniowej jest Y. Girard.16Która, najprawdopodobniej, jest wewnętrznie sprzeczna.17Reguły wnioskowania logiki zdaniowej formułowane są w oparciu o analizę struktury syntaktycznej (budowy)

zdań-przesłanek i zdania-konkluzji. A struktura zdań prostych jest „atomem”, jest niewidoczna.18Jeśli ktoś zamiast tworzonego ad hoc przykładu rozszerzenia logiki zdaniowej chciałby czegoś, co rzeczywiście

zajmuje logików to polecam modalną logikę zdaniową w której wyróżnia się frazy „jest konieczne” i „jest możliwe”jako konstruktory zdań złożonych.

19S.Lem, Śledztwo. W oryginale: „matematyczny” a nie „logiczny”. Nieco mniej patetycznie: „(...) język nigdynie jest neutralny. Ludzie lubią myśleć, że odzwierciedla świat. To nieprawda. Słowa odzwierciedlają jedynie naszerozumienie świata, nie rzeczywistość” - G. Lakoff.

20Algebraizacja logiki zdaniowej polega na algorytmicznym obliczaniu wartości formuł zdaniowych w dwuelemento-wej algebrze wartości logicznych (algebrze Boole’a) - (0, 1,∧,∨,¬). Ta algebra jest zupełna co oznacza, że wszystkie

Page 71: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 70

5.2 Język matematyki

Granice mojego języka wyznaczają granice mojego świataL. Wittgenstein

Matematyka Hilberta kontynuuje tradycję platońską: przedmiotem jej zainteresowania są wła-sności wiecznotrwałych i niezmiennych obiektów i (skończonych) układów takich obiektów.

Skoro tak, to dyskusję o języku matematyki trzeba zacząć od próby odpowiedzi na pytanie:

5.2.1 Co to jest „własność”?

„Koń jaki jest, każdy widzi” - czyż ta defincja Benedykta Chmielowskiego21 nie jest najlepszą od-powiedzią, jakiej powinniśmy udzielić pytani o rzeczy oczywiste? Jednak matematyka nie tolerujezbyt wielu oczywistości. Dlatego potraktujemy to pytanie poważnie.Zacznijmy naiwnie: „własność jest po to, by dzielić obiekty na te, które ją mają (czyli desygnatytej własności) i te, które jej nie posiadają”. Nic dziwnego, że teoria mnogości oparta na paradyg-macie „wszystko jest zbiorem” uległa początkowo pokusie utożsamiania własności ze zbiorem jejdesygnatów22. Ta propozycja jest atrakcyjna z kilku powodów:

- nie mnożymy pojęć podstawowych ponad miarę (brzytwa Ockhama),- jest zgodna z naszym doświadczeniem świata fizycznego zbiorów skończonych,- jest zgodna z podstawową zasadą Hilberta - skoro ta równość nie prowadzi do sprzeczności, to

dlaczego jej nie przyjąć?

A jednak... Z całą jaskrawością ujawnia się tu groza niefrasobliwego przenoszenia doświadczeń zeświata skończonego w kosmos zbiorów nieskończonych... Jeśli zgodzimy się, że „być zbiorem” jestwłasnością (a dlaczego nie?), a „własność = zbiór”, to musimy uznać istnienie „zbioru wszystkichzbiorów”. A to doprowadziło Russella do odkrycia paradoksu, znanego dziś jako - jakby inaczej -paradoks Russella.

Zbiór wszystkich zbiorów U ma tę własność, że jest własnym elementem, U ∈ U . A np. N /∈ N- zbiór liczb naturalnych nie ma tej własności. Konsekwentnie, możemy mówić o zbiorze K tychzbiorów, które nie są swoimi elementami:

K = A : A jest zbiorem i A /∈ A

Prosta analiza pokazuje, że...

K ∈ K wtw K /∈ K

To był szok. A nawet dramat23. I koniec tzw. naiwnej teorii zbiorów. Naiwnością było aprioryczne założe-nie, że język opisu uniwersum można stworzyć odwołując się - również w sferze metajezyka - do jedynegopojęcia pierwotnego - zbioru - i jednej zależności między zbiorami - relacji przynależności.

Ten paradoks uświadomił twórcom teorii mnogości konieczność opisania jej podstaw w sposóbnie budzący wątpliwości, czyli jako teorii aksjomatycznej. W szczególności należało doprecyzowaćcantorowski aksjomat wyróżniania - „a set is a collection into a whole of definite, distinct objectsof our intuition or of our thought. The objects are called the elements (members) of the set24.

funkcje typu 0, 1n → 0, 1 można opisać za pomocą formuł zdaniowych. To zapoczątkowało badanie sieci boolow-skich. Kreska Sheffera pełni tu ważną rolę, bo pozwala realizować te sieci jako „struktury jednorodne”, utworzone zbramek „nand”.

21Nowe Ateny - pierwsza polska encyklopedia (1754-56).22To jest tzw. ekstensjonalne rozumienie własności.23G. Frege tuż przed ukończeniem dzieła, które w jego mniemaniu miało stworzyć podstawy matematyki, otrzymał

od Russella list opisujący ten paradoks. Wtedy dopisał do swego dzieła postscriptum: „Uczonego może rzadko spotkaćcoś bardziej niepożądanego niż utrata podstaw akurat w momencie ukończenia pracy...[38].Przytoczone tu sformułowanie paradoksu Russella należy raczej wiązać z osobą E. Zermelo. Russell sformułował gow języku logiki (a nie zbiorów).

24Cytuję za ”Haskell road to Logic, Math and Programming” - K.Doets, J. van Eijek

Page 72: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 71

W poprawionej wersji ten aksjomat mówi, że „własność, którą potrafimy opisać w języku teoriizbiorów wyznacza podzbiór dowolnego zbioru A złożony z elementów zbioru A - desygnatów tejwłasności. To pozwala uniknąć paradoksu Russella: własność (x = x) -„jestem zbiorem równymsamemu sobie” - która wcześniej wyznaczała zbiór wszystkich zbiorów - teraz wyznacza podzbiórdowolnego zbioru A (równy całemu zbiorowi A).

Równość „własność = zbiór” zamieniono na „własność = podzbiór”. Związek między zbioramii własnościami stał się bardziej subtelny niż wcześniej sądzono25.

To wszystko prowadzi do odmiennego, intensjonalnego rozumienia własności: jej niezbywalnymatrybutem jest to, że jest opisana w pewnym języku26.

Jednak pełna swoboda języka opisu własności też jest niebezpieczna:Paradoks Richarda [121]: liczb rzeczywistych, które potrafimy opisać za pomocą skończonejliczby słów języka polskiego jest przeliczalnie wiele. można je więc ponumerować, ustawić w ciąga0, a1 . . . , an, . . . korzystając np. z leksykograficznego uporządkowania ich skończonych opisów.Niech ai0, a

i1ai2 . . . będzie rozwinięciem dziesiętnym liczby ai27. Oznaczmy przez E zbiór wszyst-

kich takich liczb. Rozważmy teraz liczbę b - której rozwinięcie dziesiętne b0, b1b2 . . . wygląda tak:przyjmujemy b0 = a0

0 +1 Dla n ­ 1 przyjmujemy bn = ann+1 jeżeli ann 6= 9 i bn = 0 - w przeciwnymprzypadku. Każdy zgodzi się, że tak opisana liczba b należy do zbioru E (bo właśnie przedsta-wiliśmy jej skończony opis). Ale z drugiej strony b nie może należeć do zbioru E, bo b 6= an dladowolnego n ∈ N !

Kto winien, co zawiodło?28 Przeciwnicy nieskończoności aktualnej powiedzą, że to ona jestźródłem zła - wszak E jest ewidentnie „aktualnie nieskończonym” zbiorem. Konstruktywiści wskażą,że numeracja zbioru E nie jest efektywna: wprawdzie każda skończenie opisywalna liczba ma numer,ale nie potrafimy wskazać skończenie opisywalnej liczby o danym numerze. Taka numeracja nie możewięc być podstawą konstrukcji liczby b.29 Przedstawiony tu opis liczby b nie pozwala na wypisaniejej rozwinięcia dziesiętnego. Czy więc jest opisem?

Konstrukcja ciągu (bn) to przykład definicji impredykatywnej. Russell, twórca tego terminu,ilustrował go takim przykładem: „a typical Englishman is one who possesses all the propertiespossessed by a majority of Englishmen”. W dużym uproszczeniu: predykatywizm (czyli przeci-wieństwo impredykatywizmu) zakazuje formułowania własności, których desygnaty - obiekty o tejwłasności - można określić jedynie odwołując się do całego zbioru desygnatów. Tak jak nasz ciąg(bn), którego opis odwołuje się do zbioru E wszystkich ciągów o skończonym opisie30.

Całkowite odrzucenie definicji impredykatywnych jest trudne, bo zubaża matematykę. G. Fregewłasność N(x) „być liczbą naturalną” definiował tak: zbiór A spełnia formułę N(x) (czyli zbiór Ajest liczbą naturalną) jeżeli A spełnia każdą „własność hierarchiczną”, która jest spełniona przezzbiór pusty ∅. Własność jest hierarchiczna gdy z tego, że przysługuje zbiorowi B wynika, że przy-sługuje też zbiorowi B ∪ B..Ta definicja jest impredykatywna31. Czy teoria mnogości ma ją odrzucić?

25Warto tu wspomnieć o teorii zbiorów von Neumanna–Bernaysa–Godla („NBG set theory”), w której pojęciempierwotnym jest klasa. Własność wyznacza klasę a nie zbiór. Zbiór to element pewnej klasy.

26Konstruktywiści odnosili wymóg „intensjonalności” również do zbiorow: E. Bishop pisał: „a set is not an entitywhich has an ideal existence. A set exists only when it has been defined.”

27Takie rozwinięcie może być nieskończone, np. 13 = 0, 33333 . . .. Gdy jest skończone, to „uzupełniamy” je do

nieskończonego dopisując zera, np. 12 = 0, 500000 . . .

28Powołajmy komisję śledczą...29Borel - konstruktywista - uważał, że porządek na zbiorze E nie jest „właściwie (unambiguously) zdefiniowany”.

O efektywnej numeracji będziemy mówić w rozdziale „Obliczalność”.30Co z tym „typowym Anglikiem”? Jest jasne, że większość Anglików nie ma wszystkich cech które ma większość

Anglików. Zatem, zgodnie z definicją, typowy Anglik musi być jednocześnie... nietypowy.Przykładem ilustrującym niebezpieczeństwa impredykatywizmu jest definicja równości Leibniza: obiekty A i B sąrówne, jeżeli każda własność przysługująca A przysługuje B. I odwrotnie”. Czy „być równym A” jest własnością?

31Definiujemy hierarchiczną własność „bycia liczba naturalną”, odwołując się do ogólnego pojęcia własności hierar-chicznej. Niech nas nie dziwi, że Frege mówi o „własności bycia liczbą naturalną” (a nie zbiorze tych liczb). Frege, jakozwolennik logicyzmu, uznawał prymat własności (definiowanej w logice) nad zbiorem jej desygnatów. Gwoli ścisłości:

Page 73: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 72

Z drugiej strony użycie definicji impredykatywnych może prowadzić do tzw. błędnego koła.Russell sformułował Viciuos Circle Principle (VCP) tak: „Whatever involves an apparent variablemust not be among the possible values of that variable” - nie powołuj bytów, odwołując się w ichdefiniowaniu - bezpośrednio czy pośrednio - do nich samych32.

Jeśli to mało, to proponuję analizę paradoksu Berry’ego: „n jest najmniejszą liczbą naturalną,której nie można opisać (w języku polskim) za pomocą mniej niż stu słów” . Tu przyczyną kłopotujest bezkrytyczne uznanie, że rozumiemy, co to znaczy opis33.

Wystarczy. Teraz lepiej rozumiemy tezę Wittgensteina: badanie własności obiektów (matema-tycznych) zależy od wyboru języka opisu tych własności.

Możemy zmieniać język dostosowując go do aktualnych celów badawczych - to oczywiste. Ale mniej oczy-wiste jest, że można wskazać jeden uniwersalny język pozbawiony ograniczeń jakie mają języki „lokalne”tworzone z myślą o konkretnych zadaniach badawczych.I to, jak się zdaje, jest istotą „sporu” między Wittgensteinem a Hilbertem.

Aby uniknąć kłopotów z rozumieniem opisu własności bytów matematycznych, lepiej zapomniećo wieloznacznych językach naturalnych. Matematyka potrzebuje własnego języka, który będzie wol-ny od tych wad - to jedno z założeń „programu naprawczego” przyjętego i realizowanego przezHilberta i innych matematyków na przełomie XIX i XX wieku.

Popatrzymy, jak to zrobiono.

5.2.2 Genialny wynalazek - formuła„Symbol góruje nad wyrazem nie tylko krótkością i jasnością,lecz ma inną jeszcze zaletę pierwszorzędną dla matematyka:sam przez się nie oznacza nic a nic”

H. Steinhaus34

Formalne języki matematyczne zaczynają się wtedy, gdy pojawia się pojęcie zmiennej (przed-miotowej).

Nie ma tekstu matematycznego bez „x-sów”, „y-greków” i im podobnych symboli, które śnią się po nocachmaturzyst(k)om. Mentalna akceptacja pojęcia zmiennej to dowód pewnej dojrzałości matematycznej.

Wprowadzenie zmiennych pozwala na opis własności obiektów matematycznych za pomocą for-muł. A włączenie formuł do formalnego języka matematyki jest genialnym w swojej prostocie wyna-lazkiem, porównywalnym z wynalezieniem druku35. Aby wyjaśnić, skąd ten entuzjazm popełnimymałe nadużycie i opowiemy o - w rzeczywistości nieistniejących - „formułach języka polskiego”.

Stwierdzenie „być miastem nadwiślańskim” jest niezgrabnym, ale zrozumiałym opisem wła-sności, przysługującej pewnym polskim miastom. Toruń ma tę własność, bo zdanie „Toruń jestmiastem nadwiślańskim” jest prawdziwe. A Poznań jej nie ma.

Sformalizujmy to: formuły zdaniowe tworzymy korzystając z tych samych reguł gramatycznych,które obowiązują przy budowie zdań orzekających. Różnica w tym, że budując formuł używamy,obok słów języka polskiego, specjalnych symboli - zmiennych.

w Stanfordzkiej Encyklopedii Filozofii ten przykład przypisano Poincare.32VCP był dla Russella punktem wyjścia do prac nad teorią typów. Kwestia obecności/nieobecności impredyka-

tywnych definicji w matematyce to jeden z problemów podstaw matematyki, który zajmował uwagę największych:Russella, Poincare, Godla. I nie sądzę, by można uznać, że jest ostatecznie rozstrzygnięta. Więcej na ten temat moznaprzczytać w artykule R. Carnapa „Logicystyczne podstawy matematyki” w [76] i w [39]

33Dodajmy mały smaczek: Berry nie był matematykiem ale bibliotekarzem, który podzielił się swoimi przemyśle-niami z ... Russellem.

35Aby to docenić, wystarczy spróbować przeczytać jakąkolwiek pracę matematyczną z okresu przed upowszechnie-niem tego wynalazku. (...) wynalezienie zmiennych stanowi punkt zwrotny w dziejach matematyki; dzięki symbolomtym człowiek zdobył narzędzie, które utorowało drogę rozwojowi wiedzy matematycznej [117]

Page 74: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 73

Zapis „x jest miastem nadwiślańskim” jest formułą. Jeśli zmienną x zastąpimy nazwą „Toruń",to otrzymamy prawdziwe zdanie „Toruń jest miastem nadwiślańskim". I powiemy, że

formuła ,,x jest miastem nadwiślańskim" jest spełniona przy wartościowaniu x := Toruńalbo, równoważnie:

obiekt o nazwie Toruń ma własność opisaną przez naszą formułę.

A gdy za zmienną x wstawimy nazwę „Poznań", to otrzymamy sąd fałszywy - nasza formuła niejest spełniona przy wartościowaniu x := Poznań.

Formuła to schemat reprezentujący zdania uzyskiwane z niej za pomocą mechanicznej procedury za-stępowania zmiennej przedmiotowej nazwą obiektu.Te zdania to instancje tej formuły.

Formuła jest opisem własności. Jeśli formuła φ(x) opisuje własność W a zdanie-instancja otrzymana przezzastąpienie zmiennej x nazwą obiektu O jest prawdziwe, to obiekt O ma własność W .

Dodajmy kolejny element do tej układanki. Własność „bycia miastem nadwiślańskim” badaliśmyw odniesieniu do zbioru polskich miast. Ale nic nie stoi na przeszkodzie by pytać, które z miasteuropejskich ma tę własność. Tę samą własność można badać w różnych kontekstach wyznaczanychprzez zakres zmienności zmiennych występujących w formule.

Matematyk powie - w różnych modelach języka36 .

Własność może być atrybutem pojedynczego obiektu, ale też wyróżnikiem pary, trójki czyskończonego ciągu obiektów. Np. własność „x jest miastem mniejszym niż y" przysługuje parze(Toruń, Poznań), bo ta formuła jest spełniona przy wartościowaniu [x := Toruń, y := Poznań] .A nie jest spełniona przy wartościowaniu [x := Warszawa, y := Toruń].Nie ma istotnej różnicy między opisem jedno- i wieloargumentowych własności za pomocą formuł.Poza tą, że opisując własności par używamy formuł z dwiema zmiennymi. Opisując własności trójekobiektów użyjemy trzech zmiennych. I tak dalej.

Skoro formuły to schematy zdań, to nie dziwi, że do budowy formuł złożonych umożliwiającychopis złożonych własności używamy spójników znanych z logiki zdaniowej. W ten sposób zbudujemynp. formułę „(x jest miastem nadwiślańskim) ∧ (x jest siedzibą uniwersytetu)”. Ocena,czy taka formuła jest spełniona np. przy wartościowaniu [x := Toruń] (czy Toruń ma tak opisanąwłasność) wymaga tylko elementarnej umiejętności obliczania wartości logicznej zdania złożonego(i pewnej wiedzy o Toruniu).

Nasze intuicje związane z przypisywaniem obiektom własności zostały w ten sposób - poprzezwprowadzenie pojęcia formuły i jej spełniania - sformalizowane. Mamy język opisu własności.

Kolejny krok, zbliżający nas do formalnego języka matematycznego, to wprowadzenie do opisuwłasności specjalnych symboli. I tak jeśli umówimy się, że symbol „>” zastępuje frazę ,,jestwiększy od", to przydługi zapis ,,x jest większy od y" zastąpimy zgrabnym x > y.

Ot, cała tajemnica...

5.2.3 Równie genialny pomysł - termy

Są dwa sposoby identyfikowania obiektu. Pierwszy - przez opis jego własności. Drugi - poprzez nazwę.

Są dwie kategorie nazw. Najprostsze to identyfikatory nadawane obiektom bez szczególnegouzasadnienia. Nazwa-identyfikator Toruń jednoznacznie wskazuje pewne polskie miasto37. Nazwyzłożone - pojawiają się wtedy, gdy zauważymy (udowodnimy), iż pewna własność pary (trójki,etc.) elementów ma charakter funkcyjny. Np. własność opisana np. formułą ,,x jest ojcem y"

36Precyzyjną definicję modelu języka poznamy w przyszłości.Teraz wystarczy nam kojarzenie „modelu” z aprio-rycznym wyznaczeniem zakresu zmienności zmiennych przedmiotowych.

37Znawcy przedmiotu powiedzą, że mówimy tu o nazwach własnych: „Karol to po prostu ten, kto został nazwanyKarolem, i nie można na podstawie takiej definicji stwierdzić, komu jeszcze mogłaby taka nazwa przysługiwać”(wikipedia)..

Page 75: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 74

- ma charakter funkcyjny, bo każdy człowiek ma jednego ojca. Dlatego można wprowadzić dojęzyka złożoną nazwę ojciec(Bolesława Chrobrego) wskazującą osobnika, któremu przypisaliśmywcześniej identyfikator - Mieszko I38.

Podobnie funkcjonują nazwy w matematyce. Prześledźmy jak to działa w arytmetyce.Liczby naturalne - numerały - to identyfikatory. Własności „z jest sumą liczb x i y" i „z

jest iloczynem liczb x i y" mają charakter funkcyjny - suma i iloczyn dwóch liczb są wyzna-czone jednoznacznie. Zastępując zwroty „jest sumą" i „jest iloczynem” symbolami „+” i „·”możemy do języka arytmetyki wprowadzić złożone nazwy takie jak np. 2+2 czy też 3·11 identyfiku-jące jednoznacznie pewne liczby. Nic też nie stoi na przeszkodzie by - korzystajac z konstruktorównazw - „+” i ·” - budować dowolnie skomplikowane nazwy - np. 2 · (3 + 8), (7 + 3) · (2 + 1).

Stąd tylko krok by pojąć, czym w językach formalnych matematyki są schematy nazw zwanetermami. To wyrażenia budowane tak jak nazwy złożone, z tą różnicą, że do ich budowy używamy- obok nazw-identyfikatorów - tych samych zmiennych przedmiotowych, które odegrały tak istotnąrolę w budowie formuł. Np. napis (x + 3) · y jest termem arytmetycznym - schematem nazwy wjęzyku arytmetyki. Nazwa złożona to teraz term w którym nie ma zmiennych - term domknięty.

Podobnie jak formuła, term to schemat reprezentujący klasę złożonych nazw, które uzyskamy zastę-pując zmienne w nim występujące termie przez identyfikatory39.

Nazwy wskazują obiekty. Można je wstawiać - w procesie wartościowania formuł - w miejscezmiennych. Np. możemy pytać, czy formuła x ¬ y jest spełniona przy wartościowaniu [x := 2 +2, y := 3] (nie jest). To oczywiste.Natomiast podstawiając w formule za zmienne przedmiotowe termy zawierające zmienne tworzymynowe formuły. Np. x ¬ y x+ z ¬ y · (x+ 1). (podstawiliśmy tu term x+ z w miejsce z a termy · (x+ 1) w miejsce y).

Wprowadzenie termów do języka matematyki stwarza też możliwość budowania specyficznychformuł zwanych równościami. Są to napisy kształtu t = p gdzie t i p są termami. Np. x+y = y+2·x .Dzięki temu możemy mówić o własnościach „opisywanych równościowo”.

Wprowadzenie termów wzbogaca składnię formalnych języków matematyki.Co to daje? Nic, gdy mamy na uwadze li tylko siłę języka - wszystko, co powiemy w języku pierwszegorzędu z termami da się wyrazić w języku, w którym ich nie ma.Ale język jest nie po to, by był, ale po to, by się nim posługiwać. I z tego punktu widzenia wzbogaceniejęzyk o termy jest bardzo istotne.Oto przykład: dwie formuły arytmetyczne - suma(x, y, z) ∧ suma(x, y, t) → (z = t) oraz x + y = y + xopisują przemieność dodawania. W drugiej formule użyliśmy termów, w pierwszej nie.Który opis jest bardziej przyjazny?

5.3 Diabelska sztuczka - kwantyfikatory

Kwantyfikatory niewątpliwie służą do pogarszania samopoczucia studentów...

Wprowadzenie zmiennych prowadzi do wzbogacenia składni języka formuł - obok koniunkcji,alternatywy, negacji i implikacji pojawia się nowy rodzaj konstruktorów - kwantyfikatory.

Zacznijmy tak: gdy obu zmiennym występującym w formule:

„x jest miastem większym od każdego miasta y"

38Zauważmy, że ojciec(Mieszka I) (który niewątpliwie istniał) jest identyfikowany tylko przez taką złożoną nazwę,a nie przez przypisaną mu nazwę własną.

39W lingwistyce (niematematycznej) zamiast o termach mówi się o formułach nazwowych. My ten drugi terminbędziemy używać w nieco innej, niż rozpatrywana teraz, sytuacji.A. Tarski w [117] używa terminów funkcja zdaniowa i funkcja nazwowa.

Page 76: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 75

przypiszemy wartości - np. [x := Warszawa, y := Gdynia] - to otrzymamy stwierdzenie:„Warszawa jest miastem większym od każdego miasta Gdynia"

pozbawione nie tylko wartości logicznej, ale i sensu.

Przyczyną zamieszania jest fraza „dla każdego” poprzedzająca zmienną y, która zasadniczo zmieniłarolę tej zmiennej. Logicy powiedzą, że została ona związana przez kwantyfikację. Zmienna x pozostaławolna. Nowa formuła nie opisuje już własności pary obiektów (co sugeruje liczba zmiennych), ale własnośćpojedynczego obiektu (bo tylko jedna zmienna jest wolna, niezwiązana).

Zapiszmy naszą formułę tak, by wyraźnie wskazać zmienną związaną:

„dla każdego y: x jest miastem większym od miasta y"

a frazę „dla każdego y” zastąpmy specjalnym symbolem - kwantyfikatorem uniwersalnym40:

∀y (x jest miastem większym od miasta y)

Ta formuła jest spełniona przy wartościowaniu [x := Warszawa] w modelu „polskie miasta” wtedy,gdy formuła o dwóch zmiennych wolnych powstała przez pominięcie kwantyfikacji:

„x jest miastem większym od miasta y"jest spełniona dla każdego wartościowania postaci [x := A, y := M ] gdzie za M możemy wstawićdowolne polskie miasto41 .To jest nie tylko zgodne ze zdrowym rozsądkiem. To jest też opis procedury orzekania o spełnianiuformuł tego kształtu:

aby sprawdzić, czy formuła ∀y φ(x, y) jest spełniona dla wartościowania zmiennej wolnej [x :=A] uwalniamy ją od kwantyfikatora uniwersalnego i testujemy spełnianie formuły φ(x, y) dlawszystkich wartościowań postaci [x := A, y := M ] , gdzie za M przyjmujemy kolejno wszystkieobiekty rozważanego modelu.

Jeśli przy wszystkich takich wartościowaniach formuła φ(x, y) jest spełniona, to pierwotnaformuła ∀y φ(x, y) jest spełniona przy wartościowaniu [x := A].

Jest jeszcze drugi kwantyfikator - egzystencjalny (oznaczany symbolem ∃): formułę

„x jest większe od pewnego miasta y”

zapiszemy - porządkując składnię i wprowadzając symbol „­” - tak:

„∃y:(x jest większe od y") lub „∃y(x ­ y)”

Procedurę sprawdzania spełnialności formuły tego kształtu opiszemy tak:

aby sprawdzić, czy formuła ∃yφ(x, y) jest - w badanym modelu! - spełniona dla wartościowaniazmiennej wolnej [x := A] , realizujemy następującą procedurę:

- uwalniamy od kwantyfikatora egzystencjalnego zmienną y,- oceniamy spełnialność formuły φ(x, y) dla wartościowań postaci [x := A, y := M ] wstawiajac

za M kolejno wszystkie obiekty rozważanego modelu. Jeśli choćby przy jednym z tych wartościowańformuła φ(x, y) jest spełniona, to uznajemy, że formuła ∃y φ(x, y) jest spełniona przy wartościowaniu[x := A].

Wprowadzenie kwantyfikacji umożliwia opis - za pomocą formuł - własności nowego typu: takich, którychspełnianie przez wskazany obiekt (obiekty) zależy od „kontekstu” - od tego, jaki ogół obiektów aktualnierozważamy. Od modelu.To różni logikę zdaniową i logikę pierwszego rzędu. Prawdziwość zdania „Toruń jest miastemnadwiślańskim” nie zależy od tego, czy jako model wskazaliśmy zbiór wszystkich miast polskich czyeuropejskich. Ale to jest istotne dla oceny prawdziwości zdania ,,∀y( Warszawa ­ y)"Ocena spełnialności formuły w której występują kwantyfikatory wymaga oglądu całego modelu.

40Gdzieś(?) wyczytałem, że ten symbol wprowadził G. Gentzen. Nie tak dawno, bo w 1935 roku.41Zauważ, że spełnianie tej formuły istotnie zależy od wyboru modelu! W modelu „polskie miasta” formuła jest

spełniona przy wartościowaniu [x := Warszawa] a w modelu „miasta europejskie” już nie!

Page 77: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 76

Język formalny, w którym funkcjonują zmienne przedmiotowe i ich kwantyfikacja to tzw. językpierwszego rzędu uznawany powszechnie za podstawowy język matematyki42:

5.3.1 Nowy rodzaj zdań

W formule ∀x ∃y (x < y) nie ma zmiennych wolnych - obie zmienne x, y są tu związane przezkwantyfikatory. Takie formuły to zdania. Ale nieco inne niż te, które otrzymamy zastępując wolnezmienne w formule bezkwantyfikatorowej nazwami obiektów. Takie zdania to sądy jednostkowe.Opisują fakty - Jan jest podróżnikiem" , 1 + 1 = 343.

Natomiast zdania „∀x (x jest młody → x lubi podróżować)” czy też ∀x∃y x ¬ y mówią„coś innego”. Ale co?Najpierw odpowiemy jak formaliści. Skoro zdania to formuły to możemy pytać, czy zdanie jestspełnione przy wartościowaniu zmiennych wolnych w nim występujących. Tyle, że w zdaniu nie mazmiennych wolnych - wszystkie są związane! To musi (a przynajmniej powinno) budzić niepokój:jak wartościować zmienne, których nie ma? Formaliści - czerpiąc pełnymi garściami z teorii mnogo-ści - odpowiadają: wartościowanie to funkcja określona na zbiorze Free(φ) wszystkich zmiennychwolnych danej formuły φ o wartościach w rozważanym modelu:

wartościowanie : Free(φ) −→ model

Gdy φ jest zdaniem, to zbiór Free(φ) jest ... pusty! To nie boli formalistów: wiemy (wiedzą ci,którzy znają podstawy teorii mnogości), że funkcja ∅ → model istnieje i - dla ustalonego modelu -jest jedna jedyna!Tyle formaliści. Ale racja bytu formuł polega na tym, że opisują własności. Formuła o n zmien-nych wolnych opisuje własność n-elementowych ciągów. Zdanie opisuje własności... 0-elementowych(pustych) ciągów? Próba tłumaczenia, co to jest „własność pustego ciągu elementów”, skazana jestna porażkę.Znaczenie zdań trzeba tłumaczyć inaczej:

Zdania opisują cechy własności44

Oto przykład. Własność par ludzi opisana przez formułę „y jest matką x” ma oczywistą cechę -każdy człowiek ma matkę45. Tę cechę własności „y jest matką x”opiszemy za pomocą sekwencjidwóch kwantyfikatorów - „∀x ∃y y jest matką x”.

Przykład bardziej naukowy: studenci matematyki wiedzą (bo muszą), że aby własność par ele-mentów mogła być nazwana równoważnością, musi być zwrotna, symetryczna i przechodnia. Jeżelidana relacja jest opisana przez formułę r(x, y) to te cechy opisujemy - korzystając z kwantyfikatorów- tak: ∀x,y r(x, y) (zwrotność), ∀x,y r(x, y)→ r(y, x) (symetryczność) i ∀x,y,z r(x, y)∧r(y, z)→r(x, z) (przechodniość).

Jednak kwantyfikatory mogą znaleźć się nie tylko na początku, ale też wewnątrz formuły, jak np.w zdaniu ∀x p(x) → ∃x r(x) . Trochę trudniej uwierzyć, że takie zdanie opisuje „cechy własności”.A jednak. Wynika to z takiego oto twierdzenia o preneksowej (przedrostkowej) postaci normalnej:

„dowolne zdanie języka pierwszego rzędu φ jest równoważne zdaniu w preneksowej postacinormalnej tzn. zdaniu, w którym wszystkie kwantyfikatory zgrupowane są na początku:

φ ≡ Q1x1. . . Qnxnψ

gdzie każde Qi to kwantyfikator uniwersalny bądź egzystencjalny a formuła ψ jest bezkwantyfika-torowa”

Kwantyfikatory umożliwiają konstrukcję nowego rodzaju zdań - zdań opisujących cechy własności46.

42Precyzyjną definicję języka pierwszego rzędu podamy w rozdziale „Wokół koncepcji prawdy Tarskiego”.43W literaturze takie zdania języka pierwszego rzędu nazywa się czasem zdaniami bazowymi - ground sentences.44Mówię o „cechach własności” by uniknąć niezręcznego zwrotu „własność własności”. Może lepiej byłoby mówić o

„cechach (skończonej) rodziny własności” , bo przecież w zdaniu można użyć jednocześnie kilku symboli relacji, np.∀x (r(x)→ p(x)) -„ każdy obiekt posiadający własność r(x) ma również własność p(x)”. Ale to nie jest istotne.

45Zapomnijmy na chwilę o Adamie...

Page 78: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 77

Za pomocą sądów jednostkowych można jednoznacznie opisać dowolny skończony obiektmatematyczny. Wystarczy zadbać, by każdy element takiego obiektu miał swą indywiduową nazwę.Np. trójelementowy zbiór liniowo uporządkowany opiszemy w języku korzystającym z jedynegobinarnego symbolu relacyjnego „¬” i trzech stałych a, b, c . Jego „teoria” - zbiór zdań LO3 opisującygo jednoznacznie wyglada tak:

LO3 = a ¬ b, a ¬ c, b ¬ c,¬(b ¬ a),¬(c ¬ a).... - darujmy sobie wypisywanie do końca tego, cooczywiste.

Ale to ubogie: kolekcja sądów jednostkowych, nawet kompletna, to nie jest wiedza matema-tyczna! To jedynie mało efektywny opis. I co najistotniejsze dla matematyki swobodnie operujacejnieskonczonością: z oczywistych powodów nie można tej „faktograficznej” metody stosować w od-niesieniu do obiektów nieskończonych.

Badanie modeli nieskończonych umożliwia język pierwszego rzędu. Zamiast nadawać indywidu-owe nazwy elementom takiego obiektu (co np. w przypadku liczb rzeczywistych i tak jest niemożli-we) wyróżniamy i nazywamy pewne interesujące nas w danym momencie własności - relacje międzyelementami badanego obiektu. Poznanie obiektu polega na odnajdywaniu cech tak wyróznionychwłasności - cech, które można opisać w języku pierwszego rzędu.

„Aby badać matematykę, badamy jej przybliżenia wyrażone w językach pierwszego rzędu” - R. Drake47

Matematycy nie badają przedmiotów, lecz stosunki między przedmiotami- H. Poincare [90].

Logika zdaniowa to logika sądów jednostkowych. W tej logice relacja konsekwencji jest bardzosłaba. Wnioski jakie można w tej logice wyprowadzić z danego zbioru aksjomatów - sądów jednost-kowych - nie są od nich zbyt odległe. To każe wątpić w sens organizowania wiedzy matematycznejw postaci teorii aksjomatycznych pisanych w „logice rzędu zero”.

Relacja konsekwencji w logica języka pierwszego rzędu jest zdecydowanie silniejsza.

Oto spektakularny przykład. Trzy zdania:

∀x,y,z x(yz) = (xy)z,∀x xe = x ∧ ex = x,∀x∃y xy = yx = e

to znana wszystkim matematykom teoria grup. Jeśli tę teorię postrzegać jako teorię rzędu zero,to jej konsekwencje są żadne, gdyż te trzy zdania są - w logice zdaniowej - zdaniami prostymi. Niesą proste, gdy postrzegamy tę teorię jako teorię pierwszego rzędu. Wówczas jej zbiór konsekwencjito bogata (pierwszorzędowa) teoria grup - całkiem spora książka.

Kwantyfiktory w logice załozeniowej

Nasz język i jego logikę ukształtowało doświadczenie świata skończonego. W tym świecie możnamówić, że „kwantyfikacja uniwersalna to uogólniona koniunkcja, a egzystencjalna to uogólnionaalternatywa”. Kwantyfikacja jest tu tylko usprawnieniem, optymalizacją języka48.

Wchodząc z tym naiwnym wyobrażeniem w świat matematyki obiektów nieskończonych nagleodkrywamy, że jesteśmy bezradni jeśli za sens działania matematycznego uznajemy orzekanieo spełnialności formuł. Bo przecież „aby orzec, czy formuła ∀y φ(x, y) jest spełniona dla war-tościowania [x := A] testujemy spełnianie formuły φ(x, y) dla wszystkich wartościowań postaci[x := A, y := M ] , gdzie za M przyjmujemy kolejno wszystkie elementy rozważanego modelu(...)”.

46Tak można opisać rolę kwantyfikatórw w logice klasycznej w której obowiązuje m.in. prawo wyłączonego środka.Twierdzenia o preneksowej postaci normalnej nie da się udowodnić bez wykorzystania tego prawa.

47On the Foundations of Mathematics in 1987, Logic Colloquium’87, 1987.48To nie do końca prawda: nawet w świecie obiektów skończonych, formułując sądy rozpoczynane od frazy „dla

każdego” oczekujemy ich uzasadnienia bardziej zwięzłego niż kolejne uzasadnianie poszczególnych przypadków. Czyzaakceptujemy uzasadnienie sądu „każdy współcześnie żyjący człowiek ma swojego tatusia” przez osobne rozpatry-wanie kilku miliardów przypadków?

Page 79: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 78

To jest wykonalne gdy mamy na uwadze model skończony. Ale gdy model jest nieskończony, to ta-ka weryfikacja spełnialności formuły ∀y φ(x, y) będzie trwała wiecznie, bo wymaga nieskończonejliczby testów. Bez sensu49.

W świecie skończonych modeli definicje spełniania formuł postaci ∀y φ(x, y) i ∃y φ(x, y) są jednocześnieopisem intuicyjnie prostych procedur weryfikacji spełniania.W świecie modeli nieskończonych - w matematyce - te definicje są już tylko opisem zadania do wykonania.Jego rozwiązaniem musi być czymś innym niż cierpliwą weryfikacją spełnialności formuły przy kolejnychwartościowaniach zmiennych.

Odpowiedzią na to wyzwanie są formalne systemy dowodzenia dla logiki pierwszego rzędu -takie, w których „dowodliwość formuły” oznacza jej spełnianie w dowolnym modelu przy dowolnymwartościowaniu. Ale wystarczy spojrzeć na jakikolwiek taki system formalny by się zniechęcić:reguły dowodzenia związane z kwantyfikatorami są zazwyczaj odległe od naszych intuicji. I tak np.rozszerzając system dedukcji naturalnej dla logiki zdaniowej o reguły:

Γ ` φΓ ` ∀xφ

Γ ` ∀xφΓ ` φ[x := t]

Γ ` φ[x := t]Γ ` ∃x φ

Γ ` ∃xφ Γ ∪ φ ` ψΓ ` ψ

otrzymamy system dedukcji naturalnej dla logiki pierwszego rzędu (w pierwszej i ostatniej regulezmienna x nie może być wolna w formułach ze zbioru Γ i w formule ψ. W drugiej i trzeciej - treprezentuje dowolny term.).

A może wiązanie kwantyfikacji z „nieskończoną koniunkcją i alternatywą” nie jest zasadne?Możetrzeba rozumieć rolę kwantyfikatorów zupełnie inaczej?Takie nowe spojrzenie na rolę kwantyfikacji proponuje logika założeniowa: kwantyfikacja jest tuwprost powiązana z fundamentalnym (w tej logice) pojęcięm konsekwencji.

Konsekwencja w założeniowej logice zdaniowej to relacja między zdaniami50 A jak rozumiećrelację konsekwencji między formułami? Skoro formuły opisują własności, to odpowiedź nasuwasię sama: ψ ` φ oznacza, że każdy skończony ciąg elementów posiadający własność opisaną przezformułę ψ, ma też własność opisaną przez φ.Jednak ta odpowiedź ma sens (i jest zgodna z naszą intuicją51) tylko wtedy, gdy formuły ψ i φopisują własności skończonych ciągów tej samej długości tzn. gdy w formułach ψ i φ mamy tesame zmienne wolne. A jeśli ten warunek nie jest spełniony?

Wtedy do akcji wkraczają... kwantyfikatory.Oto inspirujące przykłady: „jeśli x jest żoną y, to - w konsekwencji - x jest kobietą”. To samo, alenieco inaczej: „jeśli istnieje y taki, że x jest żoną y, to x jest kobietą”. Zapiszmy to formalnie:

żona(x, y) ` kobieta(x) ⇔ ∃y żona(x,y) ` kobieta(x)

Po prawej stronie równoważności mamy formuły mające te same zmienne wolne (jedną zmienną x).A po lewej już nie.Podobnie konsekwencją stwierdzenia (formuły) „x jest mistrzem” (świata w boksie) jest stwierdze-nie „x jest lepszy od y”. Dla jakiegokolwiek y. Teraz zamiast słowa „jakikolwiek” wystarczy użyćsłowa „każdy” by otrzymać drugą równoważność, angażującą tym razem kwantyfikator uniwersalny:

mistrz(x) ` lepszy(x, y) ⇔ mistrz(x) ` ∀y lepszy(x, y)

I tutaj formuły po prawej stronie mają wspólną jedną zmienną wolną, a w formułach po lewejstronie liczby zmiennych wolnych są różne.

Te przykłady ilustrują kluczowe dla logiki założeniowej równoważności wyznaczające rolę kwan-tyfikatorów w tej logice:

49Równie pozbawione sensu jest mówienie o „kolejnym” wybieraniu elementów modelu, gdy jest nim np. nieprze-liczalny zbiór liczb rzeczywistych.

50Tę realcję oznaczaliśmy symbolem Γ ` A - str. 23951„Logika jest pewna, ale nie tworzy niczego. Intuicja jest zawodna, ale twórcza” - H. Poincare

Page 80: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 79

„dla dowolnych formuł φ(x) i ψ(x, y) (odpowiednio z jedną i dwoma zmiennymi wolnymi52):

(∗∃) ψ(x, y) `x,y φ(x) ⇔ ∃y ψ(x, y) `x φ(x)

(∗∀) φ(x) `x,y ψ(x, y) ⇔ φ(x) `x ∀y ψ(x, y) 53

Dodaliśmy wskaźniki do symbolu „`” by zademonstrować, że relacja konsekwencji ` w logicepierwszego rzędu jest w istocie rodziną relacji `x1,...xn - po jednej dla każdego skończonego zbioruzmiennych wolnych. Kwantyfikacja jest tym, co łączy te relacje.

Kwantyfikatory pozwalają mówić o relacji konsekwencji między formułami o różnej liczbie zmiennychwolnych poprzez redukcję do - intuicyjnie prostej - relacji konsekwencji między formułami o tej samejliczbie zmiennych wolnych.

I to jest to. Skąd pewność, że to własciwa interpretacja? Spójrzmy na kwantyfikację od stronysemantycznej. Otóż dla dowolnych zbiorów A,B można wyróżnić dwie (sugestywnie oznaczane)funkcje ∀B,∃B : 2A×B → 2B definiowane tak:54 dla dowolnego o podzbioru C ⊆ A×B

∀B (C) = b ∈ B : (a, b) ∈ C dla dowolnego a ∈ A,∃B (C) = b ∈ B : (a, b) ∈ C dla pewnego a ∈ A

Pomóżmy sobie rysunkiem:55

??

??∀B(C)∃B(C)

C

B ×A

Zbiory ∀B(C) i ∃B(C) można opisać „zewnętrznie”- bez wskazywania ich elementów i unikajac fraz„dla kazdego”, „dla pewnego”:

- ∀B(C) to największy podzbiór B taki, że zbiór ∀B(C)×A - jest zawarty w C.- ∃B(C) to najmniejszy podzbior B, taki, że C zawiera się w D ×A.

∀B(C)×A ⊆ C ⊆ ∃B(C)×AMożemy też charakteryzować (jednoznacznie wyznaczyć) zbiory ∀B(C) i ∃B(C) poprzez takie otorównoważności: dla dowolnych zbiorów C ⊆ A×B i D ⊆ B:

C ⊆ A×D wtw ∃B(C) ⊆ DA×D ⊆ C wtw D ⊆ ∀B(C).

Nie lekceważmy tych równoważnych sformułowań definicji - w przyszłości okaże się, jak ważne sa one dlazrozumienia istoty kwantyfikacji.

Gdy zakresem zmienności zmiennych wolnych w formułach ψ(x, y) i φ(x) jest pewien zbiór A-czyli zbiór desygnatów formuły φ(x, y) to pewien podzbiór [[φ(x, y)]] ⊂ A2, a zbiór desygnatówformuły φ(x) to podzbiór [[φ(x)]] ⊆ A - to powyższe równoważności przybiorą taki kształt:

52To, że ograniczamy się do formuł z jedną i dwiema zmiennymi wolnymi podyktowane jest li tylko chęcią uprosz-czenia formalnego opisu. Ważne jest, że druga formuła ma o jedną zmienną wolną więcej niż pierwsza

54Rola tych funkcji nie jest eksponowana w matematycznej edukacji. Szkoda.Przypomnijmy, że symbolem 2X oznaczamy rodzinę wszystkich podzbiorów zbioru X.

55Nie ma to jak metafory geometryczne... .

Page 81: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 80

[[ψ(x, y)]] ⊆ A× [[φ(x)]] ⇔ ∃[[ψ(x, y)]] ⊆ [[φ(x)]]

A× [[φ(x)]] ⊆ [[ψ(x, y)]] ⇔ [[φ(x)]] ⊆ ∀[[ψ(x, y)]]

Podobieństwo do wcześniejszych równoważności (∗∃) i (∗∀) nie wymaga komentarza... .

Dlaczego studenci nie kochają kwantyfikatorów?

Studenci wskażą też inną przyczynę braku sympatii do kwantyfikatorów: to trudności związane zbudowaniem wyobrażenia o cechach własności opisywanych przez formuły zawierające kwantyfika-tory. Gdy w formule jest tylko pojedynczy kwantyfikator to zbudowanie intuicji z nią związanejjest banalnie proste. Nie jest to też trudne gdy kwantyfikatory są dwa: ∀x∃yφ(x, y) - „dla każdegoelementu a (rozważanego zbioru) można wskazać element b taki, że para (a, b) ma własność opisanąprzez formułę φ(x, y)”. Równie łatwo uchwycimy „sens” formuły ∃x∀yφ(x, y).Schody się zaczynają56, gdy w formule buszuje całe stado kwantyfikatorów i to w sposób zagnież-dżony. Co to znaczy? Np. w zdaniu ∃y(∀z(∃s(x + s)w = y + z))) w zasięgu kwantyfikatora ∃yznalazła się (jest „zagnieżdżona”) formuła z kwantyfikatorem ∀z(. . .) a wewnątrz niej - w zasięgukwantyfikatora ∀z - jest zagnieżdżona formuła z kwantyfikatorem ∃s . Stopień kwantyfikatorowytego zdania to liczba 3. A stopień kwantyfikatorowy zdania ∀x∃y∀z∃t (xz = yt) to 4 . To proste.

Im większa głębokość zagnieżdżenia kwantyfikatorów w formule tym trudniej o intuicję doty-czącą własności przez nią opisywaną. Wielu studentów ma już kłopot ze zbudowaniem intuicjizwiązanej z pojęciem granicy funkcji opisywanej formalnie za pomocą „koszmarnej” formuły:

∀x (x > 0→ (∃y ∀z (z > y → |f(z)− g| < x))

A to dlatego, że stopień kwantyfikatorowy tej formuły jest równy 3 57.Liczba schodów generała Wieniawy odpowiada głębokości zagnieżdżenia kwantyfikatorów...

A teraz wyobraźmy sobie formułę, której stopień kwantyfikatorowy to np. 17...58.

Czy potrzebna jest nam ta niczym nieograniczona możliwość budowania skomplikowanych for-muł, których sens umyka naszej percepcji? Czy sądy matematyczne formułowane za pomocą zdań,w których głębokość zagnieżdżenia kwantyfikatorów jest równa tysiąc, są istotne, ważne? Jeśli po-myślimy, to dojedzimy do wniosku że to problem ... pozorny. Z języka korzystamy stosownie dopotrzeb. Niesposób przewidzieć, jak bardzo złożone formuły będą kiedyś komuś potrzebne. Ale zdrugiej strony, język polski też nie ogranicza a priori długości sensownych wyrazów czy zdań ajakoś nikt dotąd nie wpadł na pomysł tworzenia tysiącliterowych wyrazów czy też zdań złożonychz tysiąca słów. Człowiek jest zazwyczaj rozsądny. I pragmatyczny.Sensowne jest podobne, ale jednak inne pytanie: „jakie mogą być skutki ograniczenia złożonościformuł”?. Dlatego logicy rozważają „słabsze logiki ” - takie w których użycie kwantyfikatorów jestograniczone. Dotyczy to np. jednej z podstawowych teorii - arytmetyki59.

Dotatek: czy można pozbyć się kwantyfikatorów?

Bez wątpienia, to kwantyfikatory odpowiadają za to, że logika pierwszego rzędu (i, pośrednio, ma-tematyka) stała się zniechęcająca dla zwykłych śmiertelników. Dostrzegano to już w starożytności.

56„Skończyły się żarty, zaczęły się schody” - to słynne powiedzenie generała Wieniawy-Długoszewskiego. Jedna zwersji tej anegdoty mówi, że wypowiedział je gdy założył się, iż wjedzie konno po schodach na piętro hotelu Bristol.Inna, że wtedy, gdy - lekko zużyty - miał zejść z tychże schodów...

57Ta formuła definiuje „granicę funkcji f : R → R w +∞”. Liczba rzeczywista a jest taką granicą, jeżeli ta formułajest spełniona przy wartościowaniu [g := a] .

58W matematyce ograniczonej do zbiorów skończonych stopień kwantyfikatorowy decyduje o złożoności proceduryweryfikującej spełnialność formuł. Weryfikując spełnialność formuły stopnia n wywołujemy wielokrotnie podproceduręweryfikującą jej podformułę „stopnia n−1”. To sprawia, że weryfikacja spełnialności formuł wysokiego stopnia w mo-delu skończonym staje się niemiłosiernie skomplikowana... . Warto tu też wspomnieć o grach Ehrenfreuchta-Freese’gow sposób niezwykły wiążących istnienie strategii wygrywającej dla pewnych matematycznych gier, z rozważanym tuproblemem komplikowania formuł przez zagnieżdżanie kwantyfikatorów.

59O czym powiemy (krótko) w rozdziale „Arytmetyka”.

Page 82: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 81

Kwadrat logiczny zdefiniowany i rozważany przez Arystotelesa to opis zależności między czteremazdaniami: ∀x (φ(x) → ψ(x)), ∃x (φ(x) ∧ ψ(x)), i ich negacjami - ¬∀x (φ(x) → ψ(x)), ¬∃x (φ(x) ∧ψ(x)), . Kwadrat logiczny opisuje m.in., które pary utworzone z tych zdań są wzajemnie sprzeczne,wykluczające się czy też dopełniające Opanowanie tego fragmentu logiki pierwszego rzędu jest dlawiększości studentów prawa koszmarem w najczystszej postaci ... 60

Skoro kwantyfikatory są tak mało przyjaznym narzędziem opisu cech własności, to czy nie moż-na zastąpić ich „czymś lepszym” (zyskując dozgonną wdzięczność studentów)?Zacznijmy od przykładu: cechy definiujące relację równoważności - zwrotność, symetryczność i prze-chodniość - opisaliśmy korzystając z kwantyfikacji. Alternatywny opis jest możliwy gdy przejdziemy„piętro wyżej” i wykorzystamy do opisu cech relacji operatory działające na tychże relacjach. Ta-kim operatorem jest np. operator składania relacji - złożenie relacji R,S to relacja R S taka,że a (R S) b wtedy, gdy istnieje c takie, że aR c i c S b. Wówczas klasyczny opis przechodniościrelacji - ∀x,y,z xRy ∧ yRz → xRz - można zastąpić równością R R = R. A gdy chcemy w podobnysposób opisać symetrię relacji, należy skorzystać z operatora odwracania relacji61. Relacja R jestsymetryczna, gdy R−1 = R .

Ten przykład pokazuje, o co chodzi w tzw. algebrach relacyjnych. „Relation algebra algebraizesthe fragment of first-order logic consisting of formulas having no atomic formula lying in the sco-pe of more than three quantifiers. That fragment suffices, however, for Peano arithmetic and theaxiomatic set theory ZFC” (wikipedia). Oznacza to mniej więcej tyle, że za pomocą operatorówpodobnych do tych, których użyliśmy wyżej i zbudowanych z ich pomocą równań można opisać tecechy własności, których klasyczny opis wymaga co najwyżej trzech zagnieżdżonych kwantyfikato-rów. Tylko, że... mało kto z tej możliwości korzysta. Może jednak język „z kwantyfikatorami” maswoje zalety?

Warto też, w kontekście dyskusji o kwantyfikatorach i wywoływanych przez nie kłopotach,przypomnieć sławne twierdzenie o eliminacji kwantyfikatorów udowodnione przez A.Tarskiego.Zacznijmy tak: wszyscy pamiętamy ze szkoły takie twierdzenie: „równanie ax2 + bx + c = 0 marzeczywiste rozwiązanie dokładnie wtedy, gdy b2 − 4ac ­ 0”

Logik powie, że to twierdzenie mówi o równoważności formuł ∃x (x1x2 + x2x+ x3 = 0) oraz

x22− 4x1x3 ­ 0 , w modelu (R,+, ·, 0, 1,¬)62. Dzięki tej równoważności trudne zadanie - stwierdze-

nie, czy istnieje pierwiastek rzeczywisty trójmianu - sprowadzamy do sprawdzenia prostej nierów-ności. Sens uproszczenia w tym, że formułę z kwantyfikatorem zastąpiliśmy równoważną - w tymszczególnym modelu! - formułą bezkwantyfikatorową... . Eliminacja kwantyfikatorów - zastępowanieformuły przez formułę równoważną o mniejszym stopniu zagnieżdżenia - to upraszczanie.Skłonni jesteśmy przypuszczać, że przytoczony przykład to sytuacja szczególna. To nie do końcaprawda - A. Tarski udowodnił takie oto zdumiewajace twierdzenie:

Dla dowolnej formuły φ języka pierwszego rzędu ze słownikiem zawierającym jeden symbolrelacyjny dwuargumentowy „¬”, dwuargumentowe symbole operacyjne +, ·,− i stałe 0, 1 istniejeformuła bezkwantyfikatorowa ψ, która jest jej równoważna w modelu (R,+, ·, 0, 1,¬)”

Opisując pierwszorzędowe własności tego podstawowego obiektu matematyki, możemy się obyćbez kwantyfikatorów! Życie (matematyka zajmującego się liczbami rzeczywistymi) jest piękne!

Ostudźmy ten entuzjazm. Dowód twierdzenie Tarskiego jest opisem procedury zastępowania danejformuły przez formułę bezkwantyfikatorową, równoważną jej w modelu (R,+, ·, 0, 1,¬). Tyle tylko,że ta procedura jest niesłychanie złożona, co czyni ją praktycznie bezużyteczną. Jak bardzo bezu-żyteczną? Wiemy, że procedura zerojedynkowej weryfikcji tautologii w klasycznej logice zdaniowejma złożoność wykładniczą: gdy w formule mamy n zmiennych zdaniowych to sprawdzenie, czy jest

60Nie tylko dla prawników. Również dla studentów matematyki lektura wykładu „Logika dla prawników” jestsporym wyzwaniem.

61aR−1b dokładnie wtedy, gdy bRa.62Tzn. formuła (∃x x1x

2 +x2x+x3 = 0) jest spełniona przy wartościowaniu x1 := a, x2 := b, x3 := c] (czyli trójmianax2 + bx+ c ma pierwiastek rzeczywisty dokładnie wtedy, gdy druga formuła jest spełniona - gdy b2 − 4ac ­ 0.

Page 83: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 82

ona tautologią, wymaga 2n testów. A to np. dla n = 20 oznacza nieskromną wielkość 220.Złożoność procedury Tarskiego jest nieporównywalnie większa: nie można jej ograniczyć żadną

liczbą postaci 2222...

.... 63.

Kwantyfikatory to nie jest diabelski wynalazek - wprowadził je do logiki Gottlob Frege.Kwantyfikatory nie są źródłem trudności. One tylko ujawniły naturalne trudności tkwiące w języku wktórym używamy fraz „dla każdego” i „istnieje”.

5.3.2 Trzeci wymiar języka

Powszechnie przyjętym zwyczajem w matematyce jest operowanie - w językach formalnych - nic niemówiącymi, „neutralnymi” symbolami. Skutkiem tego jest odarcie zapisów sporządzanych w języ-ku formalnym z kontekstu (emocjonalnego, kulturowego). To trudne do zaakceptowania. Dlategoformalizacja języka matematyki to dla wielu przeszkoda wysoka jak K264. Porównajmy: zapis

∀x (s(x) −→ (∀y p(y)→ ∃z (d(z) ∧m(z, y) ∧ k(z, x))))

nie wywołuje żadnych skojarzeń. Jest, mówiąc wprost, okropny... A przecież przy odrobinie dobrejwoli można uznać, że jest to zapis zdania:

„Każdy żeglarz ma w każdym porcie dziewczynę, która go kocha”tyle, że pozbawiony pozamatematycznego kontekstu...65

Porzućmy dyskusję o urokach (trudach) życia żeglarzy i zajmijmy się czymś serio. Oto formalnateoria, w której użyliśmy dwóch symboli relacji jednoargumentowych - „p, l” - i jednego symbolurelacji dwuargumentowej - „∈”:

∀x(p(x) ∨ l(x) ∧ ¬(p(x) ∧ l(x))

∀x,y (x ∈ y)→ (p(x) ∧ l(y)),

∀x,y (p(x) ∧ p(y) ∧ (x 6= y))→ ∃z (x ∈ z) ∧ (y ∈ z)∀x,y (p(x) ∧ l(y) ∧ ¬(x ∈ y))→ ∃z (z||y) ∧ (x ∈ z)

z||y jest skrótem formuły (l(y) ∧ l(z) ∧ ¬(∃w (w ∈ x) ∧ (w ∈ y))

∃x,y,z (x 6= y) ∧ (x 6= z) ∧ (y 6= z) ∧ ∀w (l(w)→ (x /∈ w) ∨ (y /∈ w) ∨ (z /∈ w))

Oczy bolą a rozum śpi... Można „to” przeczytać, ale tej lekturze nie towarzyszy żadna intuicja.A teraz powiedzmy to samo inaczej: geometria afiniczna to teoria operująca dwoma pojęciamipierwotnymi - „punkt” i „prosta”66 - i opisująca cechy własności „punkt leży na prostej” (repre-zentowanej przez formułę x ∈ y)67. A formułę-skrót z||y czytamy: „proste z i y są równoległe”.

Aksjomaty geometrii afinicznej sformułujemy teraz - w języku polskim - tak:

Ax I. Dla dowolnej pary różnych punktów istnieje dokładnie jedna prosta przez nie przecho-dząca.Ax II. Dla dowolnej prostej P i punktu a poza tą prostą istnieje dokładnie jedna prosta prze-

chodząca przez a i równoległa do P .Ax III. Istnieją trzy punkty nie leżące na jednej prostej.

Nasza wyobraźnia została pobudzona - „widzimy” punkty i linie. Odtąd nie uwolnimy się od tejgeometrycznej interpretacji. To dobrze i źle. Dobrze, bo bez wyobraźni nie ma twórczości. Źle,

63Pięknie to brzmi po angielsku: „its time complexity is greater than all finite towers of powers of 2.”Idea dowodu twierdzenia o eliminacji kwantyfikatorów jest zwodniczo prosta: pokazuje się, że w rozważanej sytuacjimożna zastąpić każdą formułę kształtu ∃xφ - gdzie φ jest koniunkcją formuł atomowych i ich zaprzeczeń - przezpewną formułę bezkwantyfikatorową.

64K2 (8611m) drugi najwyższy szczyt na świecie.65s(x) ≡ ,,x jest żeglarzem", p(y) ≡ ,,y jest portem". Itd...66Formuła p(x) jest spełniona przy wartościowaniu [x := a] gdy a jest punktem, a formuła l(x) - gdy a jest linią.67Możemy też, równoważnie, mówić o własności „prosta przechodzi przez punkt”.

Page 84: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 83

bo dominacja jednej interpretacji przeszkadza. Np. wtedy, gdy napotkamy twierdzenie o istnieniemodelu tej teorii, która ma cztery punkty i sześć linii68. Ale wystarczy tylko trochę ostrożności, bynie dać się zaprowadzić zbyt daleko w stronę specyficznych cech tak wyróżnionego modelu.

Rozwój teorii matematycznej to nie tylko odnajdywanie logicznych konsekwencji aksjomatów tejteorii za pomocą mozolnie budowanych formalnych dowodów, ale też rozbudowa języka. Takie po-jęcia jak liczba parzysta, liczba pierwsza, doskonała, najmniejszy wspólny dzielnik nie są potrzebnedo sformułowania aksjomatów arytmetyki69. Ale bez żadnych wątpliwości należą do jej języka. Tenowe nazwy to „skróty” zastępujące złożone formuły czystego języka arytmetyki . Np. stwierdzenie„n jest liczba pierwszą” zastępuje formułę arytmetyczną (x > 1)∧∀y (∃z x = y· → (y = 1∨ y = x).

Wprowadzanie nazw-skrótów nakrywających złożoną treść jest koniecznością. Tylko dzięki temu możemypokonać trudności związane z interpretacją skomplikowanych formuł, w których stopień zagnieżdżeniakwantyfikatorów jest zbyt wysoki, by były one dla nas czytelne.

Jeszcze jeden przykład. Zdanie: dla dowolnej liczby (naturalnej) istnieje liczba pierwsza, którajest od niej większa” w czystym języku arytmetyki zapiszemy tak:

∀z ∃x ((z < x) ∧ (x > 1) ∧ ∀y (∃z x = y· → (y = 1 ∨ y = x))

Rozum śpi... Jeśli jednak wprowadzimy pojęcie „liczba pierwsza” - dodając do języka arytmetykiskrót - formułę prime(x) wraz z równoważnością prime(x) ↔ (x > 1) ∧ ∀y (∃z x = y· → (y =1 ∨ y = x) - to to samo zdanie zapiszemy w sposób zdecydowanie bardziej przyjazny:

∀z∃x (z < x) ∧ prime(x)

„Odpowiednie dać rzeczy słowo”... Trafnie wybrane pojęcie uruchamia skojarzenia. A kojarzenieto jeden z podstawowych elementów procesu twórczego myślenia. Twórcze zdolności mózgu (siecineuronowej) zależą nie tyle od liczby neuronów, ale od powiązań między nimi. Używany nie tylko wmatematyce zwrot „kluczowe pojęcie” można rozumieć dosłownie, jako klucz do nowych obszarówbadań. Jeden z moich mistrzów mawiał: „w matematyce definicje są równie ważne jak twierdzenia.A nawet ważniejsze.”

Tak buduje się „trzeci wymiar” języka teorii matematycznych. To próba odzyskania zagubionego kontek-stu, wzbogacenia formalnego zapisu o warstwę wyobrażeniową.Twórczość matematyczna dzieje się w trzecim wymiarze języka. Ockhamowska oszczędność jest pożądanatylko przy formułowaniu podstaw teorii. Język badań może i powinien być „nadmiarowy”.Kant uważał zdolność tworzenia pojęć (czyli rozszerzania języka poprzez nazwy) za istotę naszego inte-lektu70.

Przestrzeń pojęć matematycznych nie jest dyskretna. Zależności i związków między różnymipojęciami matematycznymi nie można sprowadzać wyłącznie do konsekwencji logicznej. Te związkisą bardziej subtelne. Być może o tej nieuchwytnej strukturze języka matematyki myślał Lakatos,gdy pisał: To tworzywo czasami jasne... a czasem niewyraźne... które jest matematyką...”71.W odróżnieniu od beznamiętnego języka formalnego, w tym trzecim wymiarze komunikacji mate-matycznej jest miejsce na subiektywizm. Matematyka nie jest izolowana, jest uprawiana w pewnymkontekście kulturowym. A „możliwość uchwycenia tego samego sensu dokonuje się prawie automa-tycznie (...) pomiędzy ludźmi z tego samego kręgu kulturowego” - napisał trafnie Z. Król w esejuRozwój pojęcia zbioru” (internet). Wyobraźnia matematyków poszukujących nazw wywołującychpożądane skojarzenia jest nieograniczona. Mamy „wiązki”„,snopy”, „źdźbła”, „kiełki” , „orbity”,

68Trudno to sobie wyobrazić, ale można skonstruować analizując wnikliwie aksjomaty geometrii afinicznej. Potraktujto jako zadanie.

69Nie należą do „jądra” języka artymetyki. O „jądrze” i „powłoce” języków matematyki będziemy tu jeszcze mowić.70Natomiast zdolność wyciągania wniosków wybiegających poza materiał doświadczenia za istotę rozumu.71Imre Lakatos (1922 - 1974) – węgierski filozof matematyki.

Page 85: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 84

„kołczany” „semirury”, „atlasy” „łańcuchy”, „przestrzenie nakrywające” itp. Poza gronem wta-jemniczonych te nazwy budzą uśmiech, respekt i ... skutecznie budują legendę matematyki72.

Trzeci wymiar języka jest też... nadużywany. Nazwanie „zbioru, który nie jest równoliczny ze swoimwłaściwym podzbiorem” zbiorem skończonym nie ma żadnego formalnego uzasadnienia. To świadomyzabieg, który ma uruchomić pożądane skojarzenia i wpoić przekonanie, że to teoriomnogościowe pojęcieopisuje rzeczywistą skończoność.Podobnie nazwanie elementów najmniejszego zbioru induktywnego liczbami naturalnymi jest niczyminnym, jak narzuceniem wyobrażenia, że w języku teorii mnogości nie opisujemy, ale kreujemy liczbynaturalne.Ale czy wyobrażamy sobie uprawianie matematyki teoriomnogościowej bez tych skojarzeń?

Tę nieusuwalną różnicę między (subiektywnym) językiem twórczości a (obiektywnym) językiemdokumentowania i rozpowszechniania jej rezultatów dostrzegał już Platon. Pisał: „...ten wynalazekniepamięć w ludzkich duszach posieje, bo człowiek, który się tego wyuczy, przestanie ćwiczyć pa-mięć; zaufa pismu i będzie sobie przypominał wszystko z zewnątrz, ze znaków obcych jego istocie.(...) Uczniom swoim dasz tylko pozór mądrości, a nie mądrość prawdziwą. Posiada bowiem wielkieoczytanie bez nauki i będzie im się zdawało, że wiele umieją (...); to będą mędrcy z pozoru a nieludzie mądrzy naprawdę73.Pismo jest formalizacją zubażającą pierwotny przekaz. Żaden zapis formalny nie odda subtelnejwiedzy o strukturze matematyki w stopniu choćby zbliżonym do tego, jak potrafi to robić mistrz wczasie wykładu. Zgodzi się z tym każdy, kto miał szczęście uczestniczyć w dobrym wykładzie czytwórczym seminarium74. Jego uczestnicy biorą udział w pełnym emocji i wahań procesie dochodze-nia do rezultatu, do wyniku matematycznego. Pozostali skazani są na nużącą lekturę drukowanychsprawozdań, czyli prac naukowych75

Umiejętne posługiwanie się trzecim wymiarem języka matematycznego, ma też ogromne znaczenie wnauczaniu matematyki. Nie wolno uczyć matematyki w sposób przesadnie sformalizowany - to pewnaklęska.„Środek przekazu jest przekazem”. Również w matematyce76.

Opowieść o „trzecim wymiarze języka” uczynimy bardziej naukową gdy odwołamy się do semio-tyki którą w wikipedii nazywa się „ogólną teorię znaków”. Jej twórca - Ch. W. Morris - wyróżniałtrzy składowe semiotyki - syntaktykę, semantykę i pragmatykę. O syntaktyce i semantyce mó-wimy tu dużo, o pragmatyce - poza tym skromnym rozdziałem - nic. „Pragmatyka bada relacjezachodzące między znakiem a jego użytkownikami” (wikipedia). Nie da się ukryć - formalistycz-nie postrzegana matematyka te relacje lekceważy. Trzeci wymiar języka jest próbą wypełnienia tejluki. W informatyce jest już inaczej - nie wystarczy zaprojektować kolejny język programowania -trzeba go jeszcze sprzedać. A to oznacza, że trzeba się starać by był on „user friendly” - przyjaznyużytkownikowi...77

72Czasem jest dziwnie: dlaczego po angielsku mówimy „field” a po polsku „ciało”? Trudno zrozumieć Anglików...73Platon, Fajdros. Cytuję za [73]. Tamże można odnaleźć też takie zastanawiające zdanie: „język jest metaforą w

tym sensie, że nie tylko przechowuje lecz przenosi doświadczenia z jednej formy w drugą”.74Podkreślam: „uczestniczyć”, a nie „być obecnym”. Dobry wykład to pewną interakcja między wykładowcą a

słuchaczami. Za jakość wykładu odpowiedzialni są w części studenci...75Kilkanaście wieków po Platonie Goethe napisał: „Słowo umiera pod piórem...” (Faust).76Nie mogę się powstrzymać by nie zachęcić do lektury jeszcze jednego tekstu McLuhana: „Joyce, Mallarme i prasa”

[73] w którym można znaleźć np. takie stwierdzenie: „Druk zwielekrotnił liczbę uczonych ale pomniejszył zarazem ichspołeczną i polityczną rolę. (...) Jeśli tradycja rękopisu zachęcała do encyklopedyzmu, to kultura książkowa w sposóbnaturalny skłaniała się do specjalizacji. Istniało dostatecznie dużo książek, by czytanie stało się pełnoetetowymzajęciem oraz zapewniało całej klasie uczonych zupełne zamknięcie się w sobie i życie w izolacji. W końcu liczbaksiążek była na tyle wystarczająca, żeby rozdzielić czytającą społeczność na wiele nie komunikujących się ze sobągrup. (...) naszą kulturę cechuje duży stopień nieznajomości znaczenia i kierunków jej rozwoju”..

77Być może to właśnie informatyka uświadomiła naukowcom, iż kończy się w nauce era „splendid isolation” w którejbariera językowa oddzielająca ich od reszty śmiertelników była uważana za coś oczywistego i niemal niezbędnego...

Page 86: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 85

5.4 Skąd się biorą teorie?

Matematyk jest wynalazcą, nie odkrywcą.L. Wittgenstein78

Z formalnego punktu widzenia stworzenie podstaw nowej teorii matematycznej to rozszerzenielogiki języka przez przyjęcie aksjomatów specyficznych - zdań, których prawdziwość nie wynika zich struktury a jest apriorycznie przyjętym założeniem.

Jak się rodzą teorie? Euklides aksjomatyzując geometrię był przekonany, iż jest to nauka opisu-jąca byty idealne (platońskie). Transcedentne, ale odnoszące się do rzeczywistości. Używając sfor-mułowania R. Penrose, geometria Euklidesa była dla starożytnych Greków logiczną koniecznością[85] - jedynym możliwym opisem (fragmentu) rzeczywistości. Jednak powstanie innych geometriiw XIX wieku sprawiło, że teorie matematyczne przestały być traktowane jako „logiczne konieczno-ści” wynikające z apriorycznego założenia, że istnieje „jedynie słuszny” opis świata (uniwersum).Matematyk przestał być odkrywcą a stał się wynalazcą.

Teorie aksjomatyczne odnoszące się wprost do rzeczywistości tworzone są też współcześnie.Spróbujemy powiedzieć „coś” o tak motywowanych działaniach matematyków później, gdy będzie-my mówili o kategoriach i toposach79. Teraz ograniczymy się do „teorii mainstramowych” - takich,których formułowanie nie wyprowadza poza świat wyznaczony przez teorię mnogości.Zazwyczaj punktem wyjścia do określenia nowej teorii jest coś, co J. Pogonowski nazywa w [91]modelem zamierzonym80 . Takim modelem dla arytmetyki są liczby naturalne. A wśród modelizamierzonych dla teorii grup były zapewne zbiory symetrii obiektów geometrycznych.Jak to działa? Na pewnym etapie badania klasy obiektów zamierzonych K ktoś - twórczy ma-tematyk lub ich grupa - nabiera przekonania, że warto wyroznic i zbadać własności, które mająpewne wspólne cechy we wszystkich obiektach klasy K . Pierwszorzędowy opis tych cech to zbióraksjomatów specyficznych Ax(K) - zaczątek „teorii pierwszego rzędu klasy K” 81.

Np. struktury uporządkowane to obiekty matematyczne, w których wyróżniono własność parelementów opisywaną frazą „x poprzedza y”. To oznacza, że w języku opisu i badań tych strukturpowinna znaleźć się dwuargumentowa formuła opisująca poprzedzanie - np. taka: „x ¬ y”. „Jawniewidoczne” cechy relacji poprzedzania to zdania:

„jeśli x poprzedza y i y poprzedza x to x = y”: ∀x∀y (x ¬ y ∧ y ¬ x→ x = y)oraz

„jeśli x poprzedza y a y poprzedza z, to x poprzedza z”: ∀x,y,z (x ¬ y ∧ t ¬ z → x ¬ z).Tak powstała teoria quasiporządków.

W swoich wyborach matematycy kierują się doświadczeniem i intuicją. Ale intuicja bywa zawodna ( Poin-care). Na jedną teorię, która znajduje trwałe miejsce w matematyce, przypada kilkanaście (kilkadziesiąt?)odrzuconych i zapomnianych... . O tym, które teorie zostaną zaakceptowane decyduje ich celowość.

Celowość jest niezbywalnym warunkiem uprawiania nauki82.

Celem matematyków jest poznanie zbioru Th(K) wszystkich zdań prawdziwych we wszystkich

78„Uwagi o podstawach matematyki”. W 1939 roku Wittgenstein prowadził wykład poświęcony podstawom mate-matyki, którego słuchaczem był A.Turing, jedna z głównych postaci tego tekstu.

79Ale wcale nie jest pewne, czy to się uda.80ang. „intended model”.81Ważną - z psychologicznego punktu widzenia - cechą teorii aksjomatycznej decydującą o jej akceptacji jest też

(względna) prostota wybranych aksjomatów. Matematycy, podobnie jak wielu filozofów, żywią głębokie przekonanie,że to, co ważne, może (musi) być wyrażone prosto. Trafnie (choć z dużą dozą sarkazmu) pisał o tym L. Susankaw [112]: „Axioms are supposed to be so pellucidly, limpidly (przejrzyście i klarownie) clear that any fool(...) wouldacclaim their necessity and validity”.

82Korzystając z okazji, młodym adeptom nauki uprzejmie donoszę, że celem nie jest„zrobienie” doktoratu czyhabilitacji... . Dodajmy dla porządku, że konieczność celowości działania w matematyce jest negowana przez konwen-cjonalistów. Najbardziej radykalny spośród nich, Edouard Le Roy (1870-1954), uważał, że nauka jest subiektywnymtworem naukowca. Umiarkowanym zwolennikiem konwencjonalizmu był Poincare, który (upraszczam!), uznawał swo-bodę wyboru systemów aksjomatycznych. Konwencjonalistą był też polski filozof, Kazimierz Ajdukiewicz.

Page 87: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 86

modelach z klasy K. Podstawą hilbertowskiej wizji matematyki było przekonanie, że dla dowolnejklasy K można wskazać (rozstrzygalny) zbiór Ax(K) tak, by każde zdanie prawdziwe w klasie Kbyło dowodliwą konsekwencją tych aksjomatów:83

Th(K) = Con(Ax(K))

Sądzono, że dla każdego pojedynczego obiektu A - takiego jak np. liczby naturalne z dodawa-niem i mnożeniem - możliwa jest równość Th(A) = Con(Ax(A)) dla odpowiednio dobranegorozstrzygalnego zbioru aksjomatów Ax(A). To miała być realizacja paradygmatu „istnienie (mate-matycznego) bytu = niesprzeczny i pełny opis”.

Te marzenia zniweczył Godel - opowiemy o tym nieco później. Dziś wiemy, że - poza wyjątko-wymi sytuacjami - zamiast oczekiwanej równości mamy tylko zawieranie - Con(Ax(K)) ( Th(K) .

Nie wszystko, co prawdziwe, jest dowodliwe... „Aksjomatyczna kontrola” nad matematyką okazała sięniemożliwa...

Zbiór dowodliwych konsekwenci aksjomatów - Con(Ax(K)) - jest nieskończony84 Może się więczdawać, że rozwój każdej teorii aksjomatycznej to proces nieskończony. Ale teorie powstają, żyją -dłużej lub krócej - i ... umierają. Niesposób bowiem twierdzić, że udowodnienie każdego twierdzeniaoznacza rozwój teorii85 Ważne są tylko te twierdzenia, które są ważne. Teoria wyczerpuje się gdyspołeczność matematyków uzna, że wszystko co ciekawe (istotne) zostało już - w tej teorii - udo-wodnione. I nie próbujmy nawet ustanowić kryterium ważności86.Matematycy wiedzą czego chcą.Wprawdzie współistnienie obu czynników - swobody twórczej jednostek i społecznej akceptacji ichpracy - czasem zgrzyta (pewne ważne wyniki nie od razu zostają docenione a obiektywny osądspołeczny zamienia się (lokalnie) w ład korporacyjny), ale przecież to działa. Od tysięcleci....

To, że formalna logika jest mało przydatna w ocenie celowości teorii czy wagi matematycznegowyniku specjalnie nie dziwi. Dziwić może kolejne stwierdzenie, że logika ma niewiele wspólnegoz procesem dowodzenia twierdzeń. Weyl jako podstawowy element procesu poznania wskazywałintuicję, pozostawiając dowodzeniu jedynie rolę weryfikatora poprawności. Stefan Banach87 pisał:„Dobry matematyk potrafi dostrzegać fakty, matematyk wybitny – analogie między faktami, zaśmatematyk genialny – analogie między analogiami.” Dowodzenie to proces angażujący naszą wie-dzę, doświadczenie, inteligencję i intuicję. W procesie przeszukiwania wielowymiarowej przestrzenimatematyki ujawnia się ludzki intelekt. A czasem geniusz88. Formalny zapis dowodu to tylko doku-mentacja, opis rezultatu działania, nie informujący w żaden sposób o jego przebiegu89. Sporządzanyzazwyczaj post factum, gdy redagujemy artykułu przeznaczony do publikacji.Studenci zakuwający formalne zapisy dowodów nie mają szans na zrozumienie matematyki. Niewidzą najważniejszego - jak dowód powstawał. „To really understand something, I believe that onemust discover it oneself, not learn it from anyone else” - G. Chaitin.

Być może o tych nierozpoznanych procesach myślał Wittgenstein sprzeciwiając się programowi logicyzacjimatematyki i Lakatos nazywający matematykę nauką quasi-empiryczną [77]90?

83Bez warunku rozstrzygalności zbioru aksjomatów problem jest trywialny!- wystarczy za aksjomaty przyjąć wszyst-kie zdania prawdziwe w klasie K.

84Potencjalnie nieskończony: udowodnione dotąd twierdzenia są - coraz większą - częścią zbioru „potencjalniedowodliwych” twierdzeń.

85Dowodzenie twierdzeń niczego nie wnoszących do rozwoju teorii to tzw. przyczynkarstwo. Jest to pokłosie obo-wiązującej od kilkudziesięciu lat w świecie nauki zasady „publikuj albo giń”.

86Próby polegające na mierzeniu wagi wyniku liczbą cytowań artykułu, w którym go opublikowano są tylko dowo-dem postępującej biurokratyzacji nauki.

87Stefan Banach (1892-1945) najwybitniejszy polski matematyk, jeden z twórców lwowskiej szkoły matematycznej.88„Gauss opowiadając o pewnym twierdzeniu, które usiłował bezskutecznie dowieść przez szereg lat, pisał: „w końcu

(...) udało mi się osiagnąć rezultat i to nie dzięki moim bolesnym wysiłkom, ale za sprawą łaski Boga... - J.Hadamard,Psychologia odkryć matematycznych.

89„ ... dowód formalny ma dla nas sens tylko dlatego, że u jego źródeł jest dowód nieformalny” - S.Krajewski, Czymatematyka jest nauka humanistyczną.

Page 88: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 5. JĘZYK MATEMATYKI 87

Istota twórczości matematycznej wymyka się formalizacji.

Czy intuicja i niedookreślone zdolności matematyczne są dziś, w epoce nowoczesnych technologii,niezbędne? Może wystarczy dla danej teorii zbudować program, który będzie generował kolejnocoraz to dłuższe dowody a rolę człowieka ograniczyć tylko do wyboru tych twierdzeń, które uznaza interesujace?

To niedorzeczność. Lepiej: to kwestia skali. Istotne twierdzenia to znikomy, niewyobrażalniemały ułamek tego, co formalnie dowodliwe. Równie dobrze można nauczyć komputer składanialiterek i oczekiwać, że kiedyś przedstawi nam taki tekst, a my go odnajdziemy w morzu bełkotu:

And sometimes when the night is slow,The wretched and the meek,We gather up our hearts and go,A Thousand Kisses Deep.91

W tym porównaniu nie ma żadnej przesady...Matematyka jest nauką. Nauka jest sztuką wyboru i doboru. Wyboru celu i doboru środków. Tegokomputer nie potrafi.

Uniwersum matematyczne to domena intuicji i twórczości.Język matematyki i jego logika to tylko pewność i kontrola

5.4.1 Dodatek: zmienne w informatyce

Czy zmienna w informatyce jest tym samym, co w matematyce? To zależy. Jeżeli myślimy np. oprogramowaniu deklaratywnym, to tak. Ale jeśli mamy na uwadze najpopularniejsze programowa-niu imperatywne (np. w Javie) to już nie. Nawet zdecydowanie nie.Język matematyki to język zdań orzekających, których semantyką jest wartość logiczna. Formułyto schematy zdań. Język programowania imperatywnego - jak sama nazwa wskazuje - to język pole-ceń, zdań rozkazujących. Semantyką polecenia jest zmiana stanu (komputera). Taki stan to wektorzłożony z zawartości wielu miejsc w jego pamięci -„kontenerów”. W zapisie imperatywnego pro-gramu „zmienna” pojawia się jako identyfikator (nazwa, adres) takiego kontenera a podstawowympoleceniem programowania imperatywnego jest instrukcja przypisania - włożenie do kontenera odanej nazwie konkretnej wielkości. Zawartość kontenera wskazywanego przez daną zmienną możebyć wielokrotnie zmieniana w procesie realizacji programu. A to, jak widać, ma się nijak do rolijaką przypisujemy zmiennym w logice i matematyce92.

90W języku Beatlesów brzmi to tak:Hey, Jude, don’t make it badTake a sad song and make it betterRemember to LET HER INTO YOUR HEARTThen you can start to make it better”91A czasem, gdy wlecze się noc, nieszczęśni i wyciszeni, zabieramy nasze serca i wędrujemy, w głębię tysiąca

pocałunków. - L. Cohen, A thousand kisses deep (fragment)92Użycie wspólnego terminu dla tak odmiennych funkcjonalnie pojęć jest przyczyną dramatycznego zamieszania w

głowach studentów informatyki, Nie tylko nie rozróżniają ról zmiennych w matematyce i informatyce (programowaniuimperatywnym), ale - w ogromnej (przerażającej) większości przypadków żadnej z nich nie rozumieją.Probabliści też nieźle zamieszali: u nich „zmienna losowa” to nazwa... pewnej funkcji.

Page 89: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 6

Arytmetyka

(...) in the study of the foundation of mathematics, arithmetic andset theory are two of the most important first-order theories; inde-ed, the usual foundational development of mathematical structuresbegins with the integers as fundamental and from these constructsmathematical constructions such as the rationals and the reals.

S. Buss [17]

Popatrzymy, jakie cechy struktury liczb naturalnych Russell uznał za kluczowe [96]:

- „zero nie jest następnikiem żadnej liczby”,- „każda liczba różna od zera jest następnikiem dokładnie jednej liczby”,- „wszelka własność, która przynależy zeru oraz następnikowi każdej liczby, która posiada tę

własność, przynależy wszystkim liczbom”,

Dwa pierwsze stwierdzenia to opis struktury rekurencyjnej odpowiedzialnej za generowanie liczbnaturalnych - zero to wielkość początkowa, a następnik to konstruktor1.

Trzecie zdanie to zasada indukcji2. Jej sens można ująć tak: uznanie struktur rekurencyjnychoznacza zgodę na konstruowanie potencjalnie nieskończonych zbiorów. Kto tej maszynerii będzieużywał, chciałby też dysponować narzędziem umożliwiającym orzekanie o wspólnych własnościachobiektów, jakie w ten sposób zbuduje.

W języku struktur rekurencyjnych zasadę indukcji formułujemy tak:

„jeśli wielkości początkowe mają pewną własność W i zastosowanie konstruktora do obiektówposiadających własność W tworzy obiekt posiadający tę własność, to mamy prawo twierdzić, że

każdy obiekt utworzony za pomocą tej struktury rekurencyjnej ma własność W 3 .

Czym jest zasada indukcji? Odpowiedź nie jest jednoznaczna. Russell traktował indukcję jakoniezbywalny składnik definicji liczb naturalnych. Podobnie Poincare - on uznawał tę zasadę jakoistotę intuicyjnego wyobrażenia tych liczb.Odpowiadając na to pytanie „wewnątrz” teorii mnogości nie mamy wątpliwości: to jest łatwe doudowodnienia twierdzenie, które mówi o szczególnej własności najmniejszego zbioru induktyw-nego N4: jeżeli A ⊆ N jest podzbiorem takim, że:- ∅ ∈ A,- dla dowolnego zbioru B: jeśli B ∈ A to również B ∪ B ∈ A,

to A = N.1Odpowiedni rozdział poświęcony liczbom naturalnym w [96] to „Ciąg liczb naturalnych”, a nie „Zbiór liczb

naturalnych”...2Zasada indukcji to nie wynalazek XIX wieku. Ślady jej użycia mozna odnaleźć już w pracach arabskiego mate-

matyka Al-Karaji’ego (tego, od którego pochodzi nazwa „algebra”).3Zasadę indukcji odniesioną do dowolnych struktur rekurencyjnych nazywamy „indukcją strukturalną”.4Przypomnijmy, że najmniejszy zbiór induktywny to - dla teoriomnogościowców - zbiór liczb naturalnych.

88

Page 90: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 6. ARYTMETYKA 89

Dla zwolenników teorii mnogości ten wynik jest potwierdzeniem, że najmniejszy zbiór induktywny jestzbiorem liczb naturalnych.Dla sceptyków ten wynik jest jedynie konieczny - bez niego nie można by mówić, że teoriomnogościowadefinicja opisuje liczby naturalne.

W tym teoriomnogościowym twierdzeniu termin „własność” został zastąpiony przez „podzbiór”.To jest zgodne z ekstensjonalnym rozumieniem własności. Intensjonalne rozumienie tego terminumusi być poprzedzone zdefiniowaniem języka w którym chcemy opisywać własności liczb natural-nych. Takim językiem jest „od zawsze” język arytmetyki.

6.1 Język arytmetyki

Język arytmetyki to znane ze szkoły wyrażenia (czyli termy) i formuły arytmetyczne. Teraz opi-szemy go w sposób uporządkowany, jako przykład języka pierwszego rzędu.

Rekurencyjny język termów (wyrażeń) arytmetycznych - WA - opisujemy tak:

x ∈WAx ∈ Zm,

0 ∈WA

t ∈WA

succ(t) ∈WA

t1, t2 ∈WA

(t1 + t2) ∈WA

t1, t2 ∈WA

(t1 · t2) ∈WA

gdzie Zm to ustalony zbiór zmiennych przedmiotowych5)

Będziemy pisać n zamiast succ(succ(. . . (succ(0) . . .))︸ ︷︷ ︸n

. Np. 2 zamiast succ(succ(0)) .

Najprostsze, („atomowe”) formuły arytmetyczne to równości i nierówności - napisy postaci(t = p) lub (t ¬ p), gdzie t i p to termy.

Formuły arytmetyczne budujemy rekurencyjnie z formuł atomowych: jeżeli napisy φ i ψ są formu-łami, to formułami są też napisy:

(φ ∧ ψ) , (φ ∨ ψ) , (φ→ ψ) ,¬φ , ∀xφ , ∃xφ

W formułach ∀xφ , ∃xφ zmienna x jest związana.Zdanie arytmetyczne to formuła, w której wszystkie zmienne są związane.

Formuły arytmetyczne opisują, a jakże, własności arytmetyczne: „własność opisana przez formułęφ(x1, . . . , xn) przysługuje liczbom naturalnym m1, . . . ,mn wtedy i tylko wtedy, gdy formułaφ(x1, . . . , xn) jest spełniona dla wartościowania [x1 := m1, . . . xn := mn]”6

Np. formuła even(x) ≡ ∃y (x = y+ y) opisuje „własność parzystości” - jest spełniona przy warto-ściowaniu [x := m] wtedy, gdy liczba m jest parzysta. Jej zaprzeczenie - formuła ¬(∃y x = y + y))- opisuje nieparzystość. A formuła prime(x) ≡ (x > 1)∧ (∀y (∃z x = yz)→ (y = 1∨ y = x)) opisujewłasność „jestem liczbą pierwszą”.

I to o własnościach arytmetycznych należy myśleć czytając russellowską definicję indukcji matematycznej.

Zdania arytmetyczne opisują cechy własności arytmetycznych. I tak zdanie ∀x(prime(x) ∧even(x))→ (x = 2) orzeka, że jedyną parzystą liczbą pierwszą jest 2.

Interpretując własność ekstensjonalnie, nazwiemy podzbiór A ⊆ Nk arytmetycznym wtedy,gdy jest on zbiorem desygnatów pewnej formuły arytmetycznej φ(x1, . . . , xk) - zbiorem ciągówliczb posiadających własność opisaną przez tę formułę7.

5Przyjmujemy, że będą to końcowe litery alfabetu x, y, z, . . . używane w razie potrzeby wraz z indeksami, np.x1, x2, y2, z4 . . ..

6Tu i dalej napis φ(x1, . . . , xn) oznacza, że mamy do czynienia z formułą, której zmienne wolne są w zbiorzex1, . . . , xn.

7Oczywiście nie każdy podzbiór N jest arytmetyczny: zbiorów arytmetycznych jest nie więcej niż napisów-formuł,czyli „tylko” przeliczalnie wiele.

Page 91: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 6. ARYTMETYKA 90

Język arytmetyki ma swój model zamierzony(inaczej: standardowy): jest to najmniejszy zbiórinduktywny N8.

Zbiór zdań arytmetycznych prawdziwych w standardowym modelu liczb naturalnychto arytmetyka zupełna.

Arytmetykę zupełna - Th(N) jest pełna - dla dowolnego zdania arytmetycznego φ albo ono albojego zaprzeczenie należy do Th(N) - jest prawdziwe bądź fałszywe w modelu standardowym.

To stwierdzenie wydaje się oczywiste. Ale tylko wtedy, gdy akceptujemy aprioryczne stwierdzenie, że każdezdanie opisujące własności pojedynczego obiektu matematycznego musi być prawdziwe czy fałszywe.A dlaczego nie? Zamiast odpowiedzieć, zapytam: a dlaczego tak?9

6.2 Ważne pytanie

Czy potrafimy orzekać, że własność opisana przez formułę arytmetyczną φ(x1, . . . , xk) przysługujewybranemu ciągowi liczb naturalnych (m1, . . . ,mk)?

czy potrafimy poznać całą arytmetykę zupełną?

- orzekać, czy dane zdanie arytmetyczne jest prawdziwe w modelu standardowym?Użyłem terminu „orzekanie” bo jest on intuicyjnie jasny i jednocześnie - jak się zdaje - nie ma wżadnym matematycznym języku swego formalnego odpowiednika. A jeśli tak, to możemy podrążyć:

Jak należy rozumieć słowo „orzekać”?

Już wspominałem, że Zermelo za niezbywalny atrybut „własności” uważał naszą zdolność do orze-kania, czy przysługuje ona badanemu obiektowi matematycznemu10. Wierzono, że prawda (mate-matyczna) jest poznawalna, a kłopoty z orzekaniem o niej wynikają li tylko z naszej niedoskonałościi słabości metod badawczych.

Tak było ponad sto lat temu. A dziś?

6.2.1 Orzekać = rozstrzygać?

W odróżnieniu od orzekania, termin rozstrzyganie ma ściśle określony sens matematyczny. To jestkluczowe pojęcie matematycznej teorii obliczalności.

Problem spełniania dla formuły arytmetycznej φ(x) jest rozstrzygalny11, jeżeli istnieje proce-dura, która dla dowolnej liczby naturalnej n, da - po skończonej liczbie kroków - odpowiedź „tak”,jeżeli formuła φ(x) jest spełniona przy wartościowaniu [x := n] i „nie” - w przeciwnym wypadku.Taką procedurę nazywamy rozstrzygajacą.Mówimy wtedy, że własność opisana przez formułę φ(x) jest rozstrzygalna a samą formułę φ(x)nazywamy rozstrzygalną12.

Co to jest „procedura”? Matematyczną definicję poznamy później. Teraz poprzestanę na nieco mniejprecyzyjnym wyjaśnieniu.Procedura to proces realizowany w czasie dyskretnym, krok po kroku i odbywający się według ściśle okre-ślonych i posiadających skończony opis reguł. Taki proces może się zakończyć po wykonaniu skończonejliczby kroków, ale nie musi. Może trwać wiecznie13.

8To oczywisty żart. Modelem zamierzonym jest zbiór liczb naturalnych rozumianych niezależnie od teoriomnogo-ściowego opisu - np. konstruktywnie. A wspomniamy wyżej to „tylko” teoriomnogościowy model zamierzony.

9Wrócimy do tego pytania, gdy będziemy lepiej przygotowani.10Pisze o tym J. Pogonowski w artykule „Projekt Logiki Infinitarnej Ernsta Zermela” zamieszczonym w internecie.11lub: rekurencyjny12Ograniczamy się tu do formuł o jednej zmiennej wolnej. Ale to nie jest istotne ograniczenie.13Ale procedura rozstrzygająca musi być procesem skończonym, bo zawsze ma dać odpowiedź - „tak” lub „nie”!

Page 92: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 6. ARYTMETYKA 91

Czy każda własność arytmetyczna jest rozstrzygalna?Opanowanie procedur rozstrzygających o własnościach opisanych przez formuły atomowe - równościi nierówności - to zmartwienie uczniów najmłodszych klas: „czy para liczb (3, 5) ma własnośćopisaną przez formułę-nierówność x ·y ¬ succ(x+y)?” Oczywiście nie; wystarczy obliczyć wartościobu wyrażeń dla wartościowania [x := 3, y := 5] by otrzymać fałszywe zdanie 15 ¬ 9.Komplikowanie formuł przez użycie koniunkcji, alternatywy i negacji nic nie zmienia: własnościopisane przez formuły bezkwantyfikatorowe są rozstrzygalne. To jest łatwy świat.

Co się dzieje, gdy pojawiają się kwantyfikatory? Czy istnienie procedury rozstrzygającej o spełnia-niu formuły ψ(x, y) gwarantuje istnienie takiej procedury dla formuły φ(x) ≡ ∃yψ(x, y)?Najpierw odpowiemy brutalnie: nie gwarantuje. A potem trochę bardziej optymistycznie: gwaran-tuje istnienie nieco słabszej procedury, tzw. procedury sprawdzającej. Co to znaczy?

Szukając odpowiedzi na pytanie: „czy istnieje liczba naturalna n która ma własność opisanąformułą ∃yψ(x, y)?” możemy kolejno pytać i rozstrzygać: „czy para (n, 0) ma własność opisanąprzez formułę ψ(x, y)?”, „czy para (n, 1) ma tę własność?” itd. Jeśli istnieje liczba m taka, żepara (n,m) spełnia formułę ψ(x, y), to ją kiedyś znajdziemy. I zakończymy pracę dając pozytywnąodpowiedź na postawione pytanie.Ale odpowiedź negatywną można dać jedynie po zakończeniu nieskończonej weryfikacji. A tooznacza, że negatywnej odpowiedzi nie mamy prawa udzielić. Nigdy.

Ta procedura już nie rozstrzyga - ona tylko sprawdza:

Spełnialność formuły φ(x) jest częściowo rozstrzygalna14, gdy istnieje procedura, która dladowolnej liczby naturalnej n da po skończonej liczbie kroków odpowiedź „tak”, jeżeli jest onaspełniona przy wartościowaniu [x := n] i nigdy nie skończy pracy („nie zatrzyma się”) w przeciwnymwypadku. Taką procedurę nazywam sprawdzajacą.Jeśli taka procedura istnieje to mówimy, że własność opisana przez formułę φ(x) jest sprawdzalnaa formułę φ(x) nazywamy sprawdzalną15.

Procedura rozstrzygająca informuje zarówno o sukcesie jak i o porażce. Procedura sprawdzająca - tylkoo sukcesie.Rozróżnienie między rozstrzyganiem a sprawdzaniem napotyka na psychologiczny opór. Z prostego po-wodu - nie możemy odwołać się tu do doświadczeń z realnego świata obiektów skończonych.W tym świecie każda własność jest rozstrzygalna16. Własności które nie są rozstrzygalne a jedynie spraw-dzalne ujawiają się wtedy, gdy zaakceptujemy istnienie zbiorów nieskończonych. W świecie matematyki.

Wyróżnienie sprawdzalnych własności dziwi, bo przeczy to prawu wyłączonego środka. A nas wychowanotak, że jesteśmy skłonni świat widzieć tak, jak porucznik Zubek ... 17.

Proszę na czas dalszej lektury tego rozdziału, uwierzyć:istnieją sprawdzalne własności arytmetyczne, które nie są rozstrzygalne18

Na pozór stwierdzenie to nie zagraża myśleniu o podstawach matematyki. Ale to tylko pozór.Przypuśćmy, że formuła φ(x) jest sprawdzalna, ale nie rozstrzygalna. Rozważmy jej zaprzeczenie -formułę ¬φ(x). Okazuje się, że dla tej formuły nie ma nawet procedury sprawdzającej!Dlaczego? Niech P1 będzie procedurą sprawdzającą dla formuły φ(x). Załóżmy chwilowo, że mamy

14Lub: częściowo rekurencyjna.15Nasz przykład nie jest przypadkowy. Dowiedziono, że „formuła φ(x) jest sprawdzalna dokładnie wtedy, gdy

jest ona równoważna formule postaci ∃y ψ(x, y), gdzie ψ(x, y) jest formułą rozstrzygalną.”. Formuły nazwane tusprawdzalnymi nazywane są w literaturze przedmiotu formułami pozytywnie obliczalnymi..Jeśli kwantyfikator egzystencjalny zastąpimy uniwersalnym, to na pytanie :„czy liczba n ma własność opisaną przezformułę ∀y ψ(x, y)?” możemy - stosując opisaną procedurę -uzyskać jedynie odpowiedź negatywną (gdy znajdę liczbęm, taką, że para (n,m) nie ma własności opisanej przez ψ(x, y). Formuła ∀y ψ(x, y) jest „negatywnie obliczalna” Totrudno zaakceptować: wszak chcemy, by nasze poznanie miało charakter pozytywny...

16Pomijam tu niefrasobliwie wątpliwości zgłaszane przez fizyków kwantowych.17Porucznik Zubek, bohater „kultowego” serialu „07 zgłoś się” miał zwyczaj twierdzić, że na każde pytanie można

odpowiedzieć: „tak” lub „nie”. Do czasu, gdy ktoś go spytał: „Czy przestał Pan bić żonę?”18Przykłady podamy poźniej, gdy będziemy w stanie takie stwierdzenie uzasadnić.

Page 93: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 6. ARYTMETYKA 92

też procedurę sprawdzającą P2 dla formuły ¬φ(x). Wtedy wystarczy - dla danej liczby naturalnejn - uruchomić obie procedury jednocześnie. Uruchamiamy i ... spokojnie czekamy. Spokojnie, bojedna z tych procedur musi się zatrzymać! Nie wiemy która, nie wiemy kiedy, ale jedna z nich musisię zatrzymać. Jeśli będzie to P1, to formuła φ(x) jest spełniona dla wartościowania [x := n] .Jeśli P2, to spełniona jest jej negacja. A to oznacza, że formuła φ(x) nie jest spełniona dla tegowartościowania.Mamy, czego nie chcieliśmy - procedurę rozstrzygającą dla formuły φ(x). Wbrew założeniu. Todowodzi, że własność opisana przez formułę ¬φ(x) nie jest sprawdzalna!19

Są własności, które potrafimy opisać w języku arytmetyki, a których nie potrafimyproceduralnie weryfikować. Nawet połowicznie, czyli tylko sprawdzać! Nie dlatego, że brak namwiedzy czy umiejętności: takiej procedury sprawdzającej po prostu nie ma! Niewiarygodne, ale prawdziwe.Postulat Zermelo jest niemożliwy do spełnienia. Nawet w odniesieniu do własności arytmetycznych...

Dodajmy kilka uwag, by uniknąć nieporozumień.1. Procedura weryfikacji polegająca na kolejnym sprawdzaniu: „czy 0, 1, . . . ma własność opisanąprzez formułę ∃yψ(x, y)?” nie wyczerpuje możliwości sprawdzania spełnialności formuł tego kształ-tu. Ale nie zmienia to faktu, że są formuły, które nie są sprawdzalne.2. Brak procedury rozstrzygającej (sprawdzającej) dla danej formuły nie oznacza, że jesteśmy bez-radni, gdy dla konkretnej liczby chcemy sprawdzić, czy ona ma własność opisywaną przez tęformułę. Np. potrafimy rozstrzygnąć, czy dla liczby 100 istnieje para większych od niej liczb pierw-szych bliźniaczych. Podobnie uporamy się z tym problemem dla n = 10000. Ale prawdopodobnieużyjemy w obu przypadkach innych argumentów, innych środków - nie korzystaliśmy uniwersalnejprocedury, skutecznej dla dowolnej liczby naturalnej. Dlatego do dziś nie potrafimy rozstrzygnąć,czy „dla każdej liczby naturalnej istnieje para liczb pierwszych bliźniaczych od niej większych”.

3. A może problem w tym, że zajęliśmy się spełnianiem formuł a nie prawdziwością zdań? Niestety...:

Twierdzenie [Prawda arytmetyczna jest niesprawdzalna]Nie istnieje procedura sprawdzająca, czy dane zdanie jest twierdzeniem arytmetyki zupełnej Th(N)- zbiór zdań arytmetycznych prawdziwych w N jest nierozstrzygalny.

Gdyby taka procedura AR istniała, to dla dowolnej formuły arytmetycznej φ(x1, . . . , xn) możnaby utworzyć procedurę sprawdzająca jej spełnialność20.Pokażemy jak można by to zrobić: dla dowolnie wybranych liczb naturalnych n1, . . . , nk tworzymyzdanie φ(n1, ..., nk) (zastępując wolne zmienne xi przez numerały ni) i korzystając z procedury ARsprawdzamy, czy jest prawdziwe.Ale prawdziwość tego zdania w standardowym modelu matematyki jest równoważna spełnianiuformuły φ(x1, . . . , xk) przy wartościowaniu [x1 := n1, . . . xk := nk] !!! .Opisane postępowanie „zbuduj zdanie φ(n1, . . . , nk) i uruchom procedurę AR” jest procedurąsprawdzającą dla dowolnej formuły φ... Sprzeczność!

6.2.2 Orzekać = dowodzić?

Sprowadzenie procesu poznania do procedur rozstrzygających i sprawdzających może się wydać bar-barzyńskim uproszczeniem. Oponenci powiedzą, że matematyczna weryfikacja prawdziwości zdańodbywa się przez dowodzenie a nie przez jakieś tam procedury. Mogą mieć nadzieję, że dowódkonkretnego zdania, który zawdzięczamy geniuszowi tego czy innego matematyka, to coś istotnieodmiennego od bezdusznych procedur.

Czy rzeczywiście? Przyjrzyjmy się problemowi bliżej. Zacznijmy od tego, że terminy ,rozstrzy-galność” i „sprawdzalność” możemy odnieść nie tylko do własności arytmetycznych ale i do języków:

19Na marginesie: jesli zrozumiałeś, to łatwo udowodnisz, że każda pełna aksjomatyczna teoria jest rozstrzygalna.20A to, jak ustaliliśmy, jest niemożliwe.

Page 94: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 6. ARYTMETYKA 93

- język J jest rozstrzygalny, gdy istnieje procedura, która dla dowolnego słowa v da - po skoń-czonej liczbie kroków - odpowiedź „tak”, jeżeli v ∈ J i „nie” - w przeciwnym wypadku,

- język J jest sprawdzalny („częściowo rozstrzygalny”), gdy istnieje procedura, która dla dowol-nego słowa v da - po skończonej liczbie kroków - odpowiedź „tak”, jeżeli v ∈ J i nigdy nie skończypracy („nie zatrzyma się”) w przeciwnym wypadku21

Aby mówić o dowodzie, musimy mieć język (stwierdzeń) i system formalny. Zbiór aksjomatów ireguły dowodzenia takiego systemu muszą być „pod kontrolą” - język stwierdzeń, zbiór aksjomatówi reguły muszą być rozstrzygalne22. To zapewnia, że

Zbiór dowodów w danej teorii aksjomatycznej jest rozstrzygalny23

Umiemy - jak chciał Hilbert - kontrolować (czyli rozstrzygać), czy dany zapis jest poprawnymdowodem. To jest podstawa matematycznego działania.

W konsekwencji otrzymujemy jeszcze ciekawsze, wręcz fundamentalne stwierdzenie:

Dla dowolnej teorii aksjomatycznej (z rozstrzygalnym zbiorem aksjomatów ) zbiór zadańdowodliwych jest zbiorem sprawdzalnym.

Zdanie φ jest dowodliwe, gdy istnieje jego dowód. Procedura poszukiwania dowodu twierdzeniaφ może wyglądać tak: tworzymy - w określonej kolejności - coraz to dłuższe dowody. Po wygenero-waniu każdego dowodu sprawdzamy, czy jego ostatnim stwierdzeniem jest φ. Jeśli tak, to kończymy(z sukcesem) procedurę sprawdzającą. Jeśli nie, to generujemy kolejny dowód. I tak dalej. Gdyzdanie φ nie ma dowodu, to takie postępowanie nigdy się nie skończy...24.

Nie udało się ... . Przyjęcie równości „orzekanie = dowodzenie” nie oddaliło nas od procedural-nego charakteru orzekania o spełnialności formuł i prawdziwości zdań25.Jeśli ktoś będzie się nadal upierał, że ta równość nie jest obowiązkowa, to odpowiem krótko: innerozumienie orzekania wyprowadza nas poza matematykę.

Sprawdzalność zbioru dowodliwych twierdzeń jest szczęśliwym (dla matematyki) kompromisem między„trywialnością” rozstrzygalności a bezradnością wobec dowolnych zbiorów. Oto jak pisał o tym von Neu-mann w 1927 roku (cytuję za [104]): „(. . . ) it appears that there is no way of finding the general criterionfor deciding whether or not a well-formed formula is provable. (We cannot at the moment establish this.Indeed, we have no clue as to how such a proof of undecidability would go.) (...) The undecidability iseven a conditio sine qua non for the contemporary practice of mathematics,(...) The very day on whichthe undecidability does not obtain any more, mathematics as we now understand it would cease to exist;it would be replaced by an absolutely mechanical prescription (...) by means of which anyone could decidethe provability or unprovability of any given sentence.”W 1927 roku... Dziś już wiemy, że taki dzień nigdy nie nadejdzie...

6.3 Twierdzenie Godla - po raz pierwszy

Hilbert chciał pełnej, finitarnej kontroli nad matematyką. Uważał, że każdą teorię T można za-ksjomatyzować - wskazać rozstrzygalny podzbiór AxT ⊂ T taki, że Con(T ) = Con(AxT ) - zbiorydowodliwych konsekwencji teorii T i zbioru AxT są takie same26.

21Ponieważ nasza definicja „procedury” jest nieformalna, to i wszystkie powyższe definicje są równie grzeszne.Formalnie poprawne definicje tych pojęć pojawią się w rozdziale „Obliczalność”.

22Na marginesie: czy można złagodzić wymagania i żądać tylko by zbiór aksjomatów teorii był sprawdzalny? Toproblem pozorny: W. Craig udowodnił (dla teorii pierwszego rzędu), że każdy sprawdzalny zbiór aksjomatów możnazawsze zastąpić zbiorem rozstrzygalnym tak, że zbiór dowodliwych zdań pozostanie niezmieniony.

23Wynika to wprost z definicji dowodu - ciągu stwierdzeń budowanego z aksjomatów za pomocą reguł dowodzenia.24Sporo tu uproszczeń, ale nie gubimy istoty tego uzasadnienia.25Powtórzę: to jednak nie oznacza, że proces dowodzenia ma coś wspólnego z automatycznym generowaniem coraz

to dłuższych dowodów.26O koncepcji Hilberta pisałem w rozdziale „Spór o istotę matematycznego bytu”.

Page 95: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 6. ARYTMETYKA 94

Czy arytmetyka zupełna Th(N) ma aksjomatyczne przedstawienie? Czy potrafimy wskazaćrozstrzygalny zbiór zdań AxN prawdziwych w N i taki, że Con(AxN) = Th(N)?

Odpowiedź właściwie już znamy27 ale... jeszcze chwila.Najbardziej znaną propozycją aksjomatyzacji teorii Th(N) jest aksjomatyka sformułowana przezG. Peano28:

Aksjomaty:

1. ∀x,y (succ(x) = y) → ¬(y = 0)

2. ∀x,y (succ(x) = succ(y)) → (x = y)

3. (schemat indukcji); dla dowolnej formuły arytmetycznej φ(x) aksjomatem jest zdanie:(φ(0) ∧ (∀x φ(x)→ φ(succ(x))⇒ ∀x φ(x)

4. ∀x x+ 0 = x,

5. ∀x,y x+ succ(y) = succ(x+ y)

6. ∀x x · 0 = 0,

7. ∀x,y x · succ(y) = x · y + x

8. ∀x,y x ¬ y ↔ ∃z x+ z = y

Ten zbiór zdań-aksjomatów oznaczamy symbolem PA. Piszemy PA ` φ jeżeli formuła φ posiadadowód w tym systemie, φ ∈ Con(PA).

Wystarczy conieco wiedzieć o matematyce by się przekonać, że w standardowym modelu aryt-metyki wszystkie aksjomaty Peano są prawdziwe - N jest modelem tej teorii. Również każde zdaniewywodliwe z tych aksjomatów należy do arytmetyki zupełnej29:

PA ` φ =⇒ φ ∈ Th(N)

Czy odwrotna implikacja jest też prawdziwa, czy każde zdanie arytmetyczne prawdziwe w modelustandardowym jest logiczną konsekwencją aksjomatów Peano?

φ ∈ Th(N) ?=⇒ PA ` φTo nie jest prawda. A to dlatego, że w dyskusji o interpretacji terminu „orzekanie” przedstawi-liśmy dwa twierdzenia:

I. nie istnieje procedura sprawdzająca przynależność zdania arytmetycznego do zbioru Th(N),

II. istnieje procedura sprawdzająca, czy zdanie posiada dowód w systemie PA.

Wniosek może być tylko jeden: zbiory Th(N) i Con(PA) nie są równe!

istnieją zdania prawdziwe w modelu standardowym N, które nie mają dowodu wsystemie aksjomatycznym PA

Jeśli tak, to może trzeba podjąć próbę wskazania innego niż PA systemu aksjomatów dla teoriiTh(N)? Nic z tego. Jeżeli zamienimy system PA przez jakikolwiek inny rozstrzygalny zbiór Axto zbiór Con(Ax) pozostanie sprawdzalny. Skoro zbiór Th(N) jest niesprawdzalny, to równośćCon(Ax) = Th(N) jest niemożliwa! I to jest głęboki sens twierdzenia Godla:

arytmetyka zupełna nie jest aksjomatyzowalna30

27Czy potrafisz ją sformułować?28G. Peano, matematyk włoski (1858-1932) zaproponował ten aksjomatyczny opis arytmetyki w 1889 roku. Dla

zaspokojenia historycznej ciekawości; w ujęciu Peano wszystko „zaczyna się” nie od zera, ale od jedności.29Gwoli ścisłości, uzasadnienie tego stwierdzenia wymagało by podania reguł dowodzenia. Pozwalam sobie na tę

małą nieścisłość zapewniając jednocześnie, że nie kłamię.30Ten znakomity wynik Godla funkcjonuje pod nazwą „twierdzenia o niezupełności arytmetyki” co może prowadzić

do nieporozumień. Jeśli już, to to twierdzenie mówi, że arytmetyka Peano - zbiór Con(PA) - nie jest teorią pełną.Ale to nieco tmniej niż stwierdzenie, że pełna teoria Th(N) nie jest aksjomatyzowalna.

Page 96: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 6. ARYTMETYKA 95

Limitacyjny charakter twierdzenia Godla

Twierdzenie Godla nie jest twierdzeniem o słabościach języka arytmetyki. Ono wskazuje nieprze-kraczalne ograniczenie języków pierwszego rzędu.W czym rzecz? Argumenty użyte w dowodzie twierdzenie Godla są tego rodzaju, że jakolwiek niewzbogacimy język arytmetyki (dodając nowe stałe, symbole operacyjne i relacyjne które będziemydowolnie interpretować w N), to każda próba aksjomatyzacji zbioru zdań sformułowanych w tymjęzyku i prawdziwych w N skazana jest na porażkę - zawsze znajdą się zdania prawdziwe w N, anie dowodliwe. Nic się też nie zmieni, gdy zechcemy np. opisać własności zbioru liczb całkowitychze standardowo definiowanym dodawaniem i mnożeniem w języku bogatszym od języka arytmetykii pozwalającym wyróżnić liczby naturalne - zbioru zdań prawdziwych w tej strukturze na da się wpełni opisać za pomocą teorii aksjomatycznej31 .

Teraz jesteśmy bliżej zrozumienia zdania, które pojawia się często w omówieniach twierdzenia Godla:„jeśli uprawiamy matematykę w której wykorzystujemy liczby naturalne, to tej matematyki nie możnazaksjomatyzować w języku pierwszego rzędu - zastąpić „prawdziwości” zdań tej matematyki przez ich„dowodliwość”.

Co więcej, twierdzenie Godla mówi, że w języku arytmetyki (ani w żadnym bogatszym językupierwszego rzędu) nie można za pomocą teorii aksjomatycznej zapisać informacji jednoznacznieidentyfikującej standardowy model liczb naturalnych.Wyjaśnijmy i to32. Jeśli φ jest arytmetycznym zdaniem prawdziwym w N i nie ma dowodu w PA,to jego zaprzeczenie - zdanie ¬φ - też nie ma takiego dowodu33. Zatem teoria PA ∪ ¬φ jestniesprzeczna, czyli - na mocy twierdzenia Godla-Henkina - ma model który jest też modelem teoriiPA34. Ten nowy model jest różny od modelu standardowego i arytmetycznie rozróżnialny (przezzdanie φ). To dowodzi, że teoria PA nie identyfikuje jednoznacznie modelu standardowego.Zastąpienie aksjomatów Peano jakimkolwiek mocniejszym systemem aksjomatów nic tu nie zmieni...

Marzenie Hilberta o sprawowaniu pełnej kontroli nad matematyczną prawdą legło w gruzach...Oczekiwanie, że każdy obiekt matematyczny ma swój unikatowy opis w języku pierwszego rzędu, którybędziemy kontrolować dzięki równości „prawdziwość = dowodliwość”, musi pozostać niespełnione.

Dodatek 1: niestandardowy model arytmetyki

„Naturalne wyobrażenie liczb naturalnych” jest naszą preintuicją. Tak mocno zakorzenioną, żetrudno wyobrazić sobie inne, niestandardowe modele arytmetyki Peano. Ale spróbujmy.Rozszerzmy język arytmetyki dodając do niego nową stałą „c”. Rozszerzmy też aksjomatykę Peanododając przeliczalny zbiór zdań S = (succn(0) ¬ c) : n ∈ N. Standardowy model PA nie jestmodelem tak rozszerzonej teorii - to jasne35.Dla dowolnego skończonego podzbioru S0 ⊂ S łatwo wskazać model teorii PA∪S0 - wystarczy w Ninterpretować stałą c jako odpowiednio dużą liczbę. Skoro tak, to każda skończona podteoria teoriiPA∪S jest niesprzeczna. Zatem i cała teoria jest niesprzeczna36. Dlatego - na mocy wykorzystanego

31Jeśli zrozumiałeś, co jest istotą dowodu twierdzenia Godla to zgodzisz się z tym stwierdzeniem. Jeśli tego niewidzisz, to przeczytaj ponownie przedstawiony tu szkic dowodu.

32Wyjaśnienie jest nieco powierzchowne. Na dodatek odwołujemy się do twierdzeń, których jeszcze nie rozważaliśmy.Trudno, ten tekst tak ma.

33Zdania dowodliwe w PA są prawdziwe w N.34Model teorii to model języka arytmetyki, w którym wszystkie zdania tej teorii są prawdziwe. Model większej

teorii jest zatem modelem każdej teorii od niej mniejszej.Twierdzenia Godla-Henkina, które mówi, że każda niesprzeczna teoria ma model jeszcze nie znamy. Ale poznamy.

35W N nie ma liczby większej od każdej liczby postaci succn(0).36W dowodzie dowolnego twierdzenia korzystamy tylko ze skończonego podzbioru PA ∪ S. Stąd jeśli zdanie ewi-

dentnie fałszywe ma dowód w tej teori (czyli teoria PA∪S jest sprzeczna), to i skończona podteoria złożona ze zdańwykorzystanych w tym dowodzie też jest sprzeczna. Zatem jeśli każda skończona podteoria PA∪S jest niesprzeczna,to i ona jest niesprzeczna.

Page 97: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 6. ARYTMETYKA 96

już raz twierdzenia Godla-Henkina - ta teoria ma model. Oznaczmy go przez N1.

Ten model jest różny od standardowego, gdyż element c1, który jest w nim interpretacją stałejc, nie może być otrzymany z zera za pomocą następnika w skończonej liczbie kroków!Idźmy dalej: c1 musi mieć następnik - c1 + 1 - i poprzednik (bo nie jest zerem) c1 − 1. Mówiącobrazowo, istnieje obustronnie nieskończony łańcuch - „świta” liczby c1:

. . . c1 − n, . . . , c1 − 2, c1 − 1, c1, c1 + 1, c1 + 2, . . . , c1 + n, . . .

(naukowo: wraz z c1 pojawia się zbiór o typie porządkowym ω∗ + ω) a wszystkie liczby z tej świtysą większe od standardowych. Muszą też istnieć iloczyny: 2c1 = c1 +c1 , 3c1 = 2c1 +c1 itd. Każdyelement postaci nc1 otoczony jest własną świtą - zbiorem typu ω∗ + ω.To nie wszystko: ponieważ zdanie „każda liczba naturalna jest parzysta lub nieparzysta” jest zda-niem arytmetycznym dowodliwym w PA, to w N1 musi istnieć liczba niestandardowa c2 < c1 taka,że c2 +c2 = c1 gdy c2 jest parzysta lub ... (dokończ). c2 też ma swoją świtę typu ω∗+ω. Oczywiściec1 + c2 jest gdzieś pomiędzy c1 i 2 · c1 . I tak dalej...

Zakończmy ten wywód baaardzo naukowo: model N1 ma typ porządkowy ω + (ω∗ + ω)η ...37

Ten powszechnie przywoływany przykład niestandarowego, teoriomnogościowego medelu arytmetyki Pe-ano ma pewną słabosć, której jakoś nikt nie chce zauważyć. Jaka to wada, dowiesz się w rozdziale „Pewnaszczególna teoria - ZFC”

Twierdzenie Parisa-Harringtona

Czy znamy przykłady zdań arytmetycnych, które jest prawdziwe w N a nie jest dowodliwe w PA?Pierwszy taki przykład wskazał Godel i o nim będziemy wkrótce mówili. Ale jego złożony charak-ter38 sprawił, że nie wszyscy byli nim zachwyceni. Oczekiwano bardziej „konkretnego” przykładu.Dostarcza go (zmodyfikowane) twierdzenia Ramseya.

W „wersji fabularnej” twierdzenie Ramsey’a brzmi tak: „na to, aby wśród uczestników przyjęciamożna było z absolutną pewnością wskazać m-osobową grupę taką, że wszyscy jej członkowie sięwzajemnie znają lub nikt nie zna nikogo z pozostałych członków grupy, nie trzeba dokonywaćjakiejkolwiek „analizy jakościowej” listy gości: wystarczy zaprosić odpowiednio dużą grupę osób”.A jego modyfikacja (wzmocnienie) to dodanie warunku: „tę grupę można wybrać tak, że conajmniejjeden z jej członków pojawi się na przyjęciu wśród pierwszych m gości”.

Powiedzmy to samo w języku grafów. Dwukolorowy graf pełny o zbiorze wierzchołków V tograf, w którym każda para wierzchołków jest połączona pojedynczą niezorientowaną krawędzią -powiedzmy, białą lub czerwoną. Pełny podgraf takiego grafu uzyskamy wskazując dowolny podzbiórV0 ⊆ V wraz ze wszystkimi krawędziami łączącymi te wierzchołki. Taki podgraf jest jednokolorowy(monochromatyczny), jeżeli wszystkie jego krawędzie jednakowego koloru.

Twierdzenie Ramseya mówi, że dla dowolnej liczby naturalnej m można wskazać taką liczbę R(m)że każdy dwukolorowy graf pełny o R(m) wierzchołkach zawiera pełny jednokolorowy podgraf om wierzchołkach.

A zmodyfikowane twierdzenie Ramsey’a dodaje, że: numer najmniejszego wierzchołka tego jedno-kolorowy podgrafu jest nie większy niż m - niezależnie od (wcześniejszej) numeracji wierzchołków.

Twierdzenie Parisa-Harringtona mówi, że:zmodyfikowane twierdzenia Ramsey’a jest prawdziwe, ale nie da się go dowieść

w ramach arytmetyki Peano37Zaintrygowanym i nieco skołowanym podpowiem: uporządkowanie niestandardowych liczby naturalnych w tym

modelu jest takie samo, jak uporządkowanie iloczynu kartezjańskiego Q×Z przez relację zdefiniowaną tak: (q1, z1) (Q2, z2) gdy q1 < q2 lub q1 = q2 oraz z1 ¬ z2. W szczególności: ten zbiór nie ma elementu najmniejszego - nie manajmniejszej niestandardowej liczby naturalnej.

38Oczywiście charakter zdania a nie Godla.

Page 98: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 6. ARYTMETYKA 97

To zdanie można znaleźć w popularnych opracowaniach opowiadających o wyniku Godla. Czy-telnik, który dotarł do tego miejsca artykułu jest już wystarczajaco skołowany i zmęczony byprzyjąć to zdanie „do wiadomości” uznając, że są w matematyce rzeczy niedostępne zwykłymśmiertelnikom39... To błąd. Bo powinien zadać przynajmniej dwa pytania:

- co wspólnego ma twierdzenie o grafach z arytmetyką?- jeśli tego twierdzenie nie umiemy dowieść, to skąd wiemy, że jest prawdziwe?Spróbujmy odpowiedzieć. (Zmodyfikowane) twierdzenie Ramseya sformułowane tu w języku

grafów można też zapisać jako zdanie sformułowane w języku teorii mnogości. Uznajemy je za praw-dziwe, bo jest teoriomnogościowym twierdzeniem - dowodliwą konsekwencją aksjomatów ZFC. Tojest odpowiedź na drugie pytanie.Odpowiedź na pierwsze, wymaga wykorzystania twierdzenia, które szczegółowo omówimy później.Otóż można pokazać, że istnieje pewna szczególna „translacja” języka teorii mnogości na językarytmetyki40.W szczególności formalne teoriomnogościowe zdanie - zapis (zmodyfikowanego) twier-dzenia Ramsey’a można przetłumaczyć na zdanie arytmetyczne.I to zdanie-tłumaczenie nie ma dowodu w arytmetyce Peano. To wszystko41.

Teoriomnogościowy dowód twierdzenia Parisa-Harringtona jest zbyt złożony byśmy mogli o nimrozmawiać w sposób tu przyjęty. W zamian opowiemy o dowodzie twierdzenia Ramsey’a.Podzielimy go na dwie części: teraz przedstawimy dowód nieskończonego twierdzenia Ramsey’a:

„każdy pełny dwukolorowy grafK∞ którego wierzchołkami są wszystkie liczby naturalne zawierajednokolorowy podgraf o nieskończonej liczbie wierzchołków”.

a dowód „wersji skończonej” przedstawimy później, gdy będziemy lepiej przygotowani42.Zaczynamy: najpierw zauważmy, że dla dowolnej liczby m conajmniej jeden ze zbiorów

Bm = l > m : krawędź łącząca m i l w K∞ jest białaCm = l > m : krawędź łącząca m i l w K∞ jest czerwona

jest nieskończony.Zdefiniujemy rekurencyjnie ciąg liczb naturalnych a0, a1, . . . , an, . . . wraz z ciągiem nieskonczo-

nych zbiorów A0, A1, . . . , An, . . . tak:przyjmujemy a0 = 0 i

A0 =

B0 B0 jest nieskończony

C0 w przeciwnym przypadku

Gdy mamy już określoną parę (an, An) to przyjmujemy:- an+1 = minAn

An+1 =

Ban+1 ∩An Ban+1 ∩An jest nieskończony

Can+1 ∩An w przeciwnym przypadku

Elementy ciągu a0, a1, . . . , an, . . . można rodzielić tworząc podzbiory: B i C:

an ∈ C gdy Aan = Can i an ∈ B gdy Aan = Ban .

Ten spośród zbiorów B,C który jest nieskończony, jest poszukiwanym nieskończonym zbioremwierzchołków jednokolorowego podgrafu K∞...I to kończy dowód nieskończonego twierdzenia Ramseya.

39To, niestety, cecha wielu artykułów popularyzujących matematykę. Nie tyle ją objaśniają, co budują jej mit.40O szczegółach powiemy rozdziale ”Pewna szczególna teoria - ZFC”41Wiem, że to nie jest zbyt jasne. Bo nie może. Zainteresowanych odsyłam do pracy J.Parisa i L.Harringtona A

mathematical incompletness in Peano Arithmetics dostępnej w interncie. Mniej zaawansowanym nie polecam.42W rozdziale „Pewna szczególna teoria - ZFC”.

Page 99: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 7

Obliczalność

Calculemus! (Obliczmy to!) - G. Leibniz.

Without a deeper understanding of the nature of calculation and under-lying processes, neither the scope of undecidability and incompletenessresults nor the significance of computational models in cognitive sciencecan be explored in their proper generality. [104]

Jak dotąd, mówiąc o procedurach rozstrzygających i sprawdzających polegaliśmy na naszejintuicji. Pogłębiona dyskusja o wynikach Godla wymaga większej precyzji. Stąd pomysł, by naj-pierw przybliżyć pojęcie „obliczalności”, gdyż rozstrzygalność i częściowa rozstrzygalność to pojęciawtórne w stosunku do obliczalności.

Są (conajmniej) trzy sposoby definiowania obliczalności. Jeśli uważamy teorię obliczalności zaintegralną część matematyki teoriomnogościowej, to zazwyczaj zaczynamy od przedstawienia defi-nicji obliczalności w sensie Kleene’ego. Ponieważ się z tym nie zgadzam, zacznę inaczej: od definicjiobliczalności Alana Turinga1.

7.1 Maszyna Turinga

These machines are humans who calculate.L. Wittgenstein2

Jak opisać interakcję między aktywnym sprawcą a biernym otoczeniem? Sprawca obserwuje pewien frag-ment otoczenia i na podstawie uzyskanej informacji może zmienić to miejsce i swój stan a potem przenieśćuwagę na inny punkt otoczenia. I tak dalej... . Czyż nie tak działamy?

Maszyna Turinga to genialny w swej prostocie opis tej interakcji. Turing założył - trochę wopozycji do matematycznego mainstreamu - że interakcja to proces dyskretny (a nie ciągły), deter-ministyczny i odbywa się wśród „bytów skończonych”.Język opisu wybrany przez Turinga jest skrajnie ockhamowski. W jego modelu otoczenie reprezen-towane jest przez słowo nad alfabetem binarnym 0, 13 zapisane na dyskretnej i podzielonej naodrębne pola, potencjalnie nieskończonej taśmie, zgodnie z zasadą „w jednym polu jeden znak”.Sprawca - maszyna - ma w każdej chwili określony stan wybrany spośród skończonego i ustalonegoa priori zbioru. Maszyna obserwuje w każdej chwili pracy jedno pole taśmy. Pojedynczy krok pracymaszyny to - określona a priori - deterministyczna reakcja na to, jaki znak jest w obserwowanympolu i w jakim jest ona stanie. Skutkiem pojedynczego kroku jest zmiana stanu maszyny, zmianazapisu w obserwowanym polu i ruch - o jedno pole w prawo lub w lewo w stosunku do dotąd ob-serwowanego4.

1Alan Mathison Turing (1912 - 1954) – angielski matematyk, jeden z twórców podstaw informatyki.2Philosophy and Psychology.3Informatycy mówią, że 0 i 1 to bity. A „bit” to skrót od angielskiego binary digit.4Może się zdarzyć, że maszyna nie zmieni zapisu i tylko przesunie się w prawo lub w lewo. Może też się nie ruszyć.

98

Page 100: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 99

Zachowanie maszyny Turinga opisuje skończony zbiór instrukcji - zapisów postaci:

(qi, α)→ (qj , β,move)

gdzie qi, qj to stany - elementy skończonego i ustalonego dla danej maszyny zbioru Q = q1, . . . , qn,α, β ∈ 0, 1,⊥5 a move ∈ Left, Right, NoMove.Instrukcję czytamy tak: „jeśli maszyna w stanie qi obserwuje pole w którym jest α, to przejdziew stan qj , zapisze β, i zacznie obserwować pole znajdujące się po lewej lub prawej stronie dotądobserwowanego - zależnie od wartości parametru move”6.Założenie, że działanie maszyny jest deterministyczne oznacza, że każda para (q, α) ∈ Q×0, 1,⊥pojawia się po lewej stronie w co najwyżej jednej instrukcji.

Maszyn Turinga jest wiele: tyle, ile jest możliwych skończonych zbiorów instrukcji. Ten zbiórmożemy postrzegać jako program sterujący pracą maszyny.

Maszyna Turinga T rozpoczyna pracę obserwując pierwszą literę pojedynczego słowa binarnegov zapisanego na taśmie. Jej praca to sekwencyjne wykonywanie instrukcji. Jeśli w pewnym mo-mencie maszyna znajdzie się w stanie q i obserwować będzie pole ze znakiem α , a w zbiorze jejinstrukcji nie ma takowej o poprzedniku (q, α), to praca maszyny się kończy - maszyna T zaakcep-towała słowo v. Słowo binarne w zapisane w tym momencie na taśmie to rezultat działania (lub:wynik obliczenia) maszyny T na słowie v , co zapisujemy T (v) = w.

Oznaczmy przez L(T ) język złożony ze słów, które akceptuje maszynaT - język akceptowanyprzez T . Jeśli słowo v /∈ L(T ) , to proces poszukiwania rezultatu obliczenia jest nieskończony -maszyna T nie zatrzymuje się, pracuje wiecznie7.

W opisie maszyny Turinga nie padło słowo „funkcja”. Pojawi się teraz, ale jako pojęcie pomocnicze:„funkcja częściowa8 realizowana przez maszynę T to funkcja fT działającą na słowach binarnych taka,że dla danego słowa v:

fT (v) =

T (v) v ∈ L(T )−maszyna T się zatrzymujejest nieokreślona v /∈ L(T )−maszyna T pracuje wiecznie,

„nie zatrzymuje się”.

W definicji Turinga istotą jest proces obliczenia. Funkcja fT to tylko opis rezultatu tego procesu.

Możemy teraz sformułować podstawową definicję:

Funkcja częściowa f : 0, 1∗ → 0, 1∗ jest obliczalna jeżeli potrafimy skonstruować maszynęTuringa T taką, że f = fT - „istnieje maszyna Turinga , która realizuje tę funkcję.”

Proponowany przez Turinga opis relacji między „sprawcą” a „otoczeniem” jest ascetyczny dobólu. Przekonamy się jak bardzo, próbując zbudować maszynę realizującą prostą akcję np. po-dwajanie słowa zapisanego na taśmie. Nieco poluzujmy. Przede wszystkim alfabet binarny „nadktórym” pracuje taka maszyna, można zastąpić dowolnym skończonym alfabetem. To oznacza, żepojęcie obliczalności można odnieść do funkcji typu f : A∗ → A∗ , gdzie A to dowolny skończo-ny alfabet. Ostatecznie powiemy, że funkcja częściowa φ : A∗ → B∗ jest obliczalna, jeśli istniejemaszyna Turinga T działająca „nad alfabetem A ∪B” taka, że φ = fT .

Maszyny Turinga „działają na tekstach i zwracają teksty”9. Opisane uogólnienia nie zmienają

5Znak „⊥” służy do oznaczenia tych pól taśmy, w których nic nie zapisano - nie ma w nich ani 0 ani 1.6Gdy wartość tego parametru to NoMove, to nadal będzie obserwować to samo pole.7Przykład. Jednostanowa maszyna z trzema instrukcjami (q, α) → (q, α,NoMove) gdzie α ∈ 0, 1,⊥ nigdy się

nie zatrzyma - nie akceptuje żadnego słowa. A jednostanowa maszyna z jedną instrukcją (q, 0) → (q, 0, NoMove)zaakceptuje słowo „11” a nie zatrzyma się na słowie „00”.

8Funkcja częściowa ze zbioru A do zbioru B nie dla każdego argumentu - elementu zbioru A - zwraca wartość(element zbioru B). Odejmowanie traktowane jako funkcja typu N×N → N jest funkcją częściową, bo np. różnica1− 3 nie jest liczbą naturalną.

9Piszac ten tekst mam na ekranie komputera okno edycyjne i podgląd wydruku. Stukając w odpowiedni klawiszuruchamiam maszynę Turinga (program), który zamienia tekst z okna edycyjnego na tekst-wydruk. By utożsamićpojęcia „słowo” i „tekst” wystarczy do alfabetu języka polskiego - dołożyć wszelkie znaki interpunkcyjne i spację .

Page 101: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 100

istoty obliczalności: działanie maszyny T korzystającej z alfabetu A można zawsze zrealizować zapomocą innej maszyny T2 operującej nad alfabetem binarnym. Nieco dokładniej: dla dowolnegoskończonego alfabetu A istnieją funkcje obliczalne kodA : A∗ → 0, 1∗ i dkodA : 0, 1∗ → A∗

takie, że fT = dekodA ·fT2 ·kodT - aby obliczyć wartość fT na słowie v najpierw je kodujemy, potemuruchamiamy maszynę T2 na tym kodzie, a na koniec dekodujemy słowo binarne T2(kod(v))10.

Teraz jesteśmy gotowi na przyjęcie formalnych definicji języka rozstrzygalnego i rozpoznawal-nego:

język L ⊆ A∗ jest rozstrzygany (rekurencyjny) jeżeli funkcja λL :→ 0, 1∗ taka, że dla dowol-nego słowa v ∈ L:

λL(v) =

1 w ∈ L0 w przeciwnym wypadku

jest obliczalna11.Język L ⊆ A∗ jest rozpoznawalny (sprawdzalny, rekurencyjnie przeliczalny) jeżeli funkcja częściowaλcL : A∗ → 0, 1∗ taka, że dla dowolnego v ∈ A∗:

λcA(v) =

1 v ∈ Lnieokreślona v /∈ L

jest obliczalna12.

Można komplikować pojęcie maszyny Turinga, przyjmując, że ma ona nie jedną, ale np. dwietaśmy - „wewnętrzną” i „zewnętrzną” - i w każdej chwili obserwuje po jednym polu na każdej znich. Reaguje na zawartość obu pól przchodząc do nowego stanu, zmieniając zapisy w obu polach iwykonując niezależne ruchy na obu taśmach - zgodnie z określonymi a priori instrukcjami. Taśmazewnętrzna - tak jak w maszynie jednotaśmowej - reprezentuje otoczenie: z niej odczytujemy danei na niej umieszczamy wynik obliczenia. Taśmę wewnętrzną możemy traktować jako - potencjalnienieskończoną! - pamięć, służącą do czasowego przechowywania informacji przydatnych w procesieobliczenia13. Wydaje się, że dwutaśmowe maszyny mogą więcej niż jednotaśmowe. Ale nie: każdąfunkcję, która można zrealizować za pomocą maszyny dwutaśmowej, można zrealizować korzystającz maszyny jednotaśmowej 14 .

Te uwagi są potrzebne tylko po to, by łatwiej było nam przyjąć do wiadomości, że maszyna Turinga (nadalfabetem binarnym) to genialnie prosta propozycja formalizacji pojęcia procedury.Model Turinga nie jest modelem technicznym „urządzenia służącego do obliczeń”15. To model ideowy,czyli koncentrujący naszą uwagę na tym, co jest istotą procesu obliczenia.

Odtąd będziemy wymiennie posługiwali się pojęciami „procedura”, „program” i „maszyna Tu-ringa”.

Wówczas dowolny tekst - np. „Pan Tadeusz” - stanie się pojedynczym słowem nad tak rozszerzonym alfabetem.10Procedurę kodowania można opisać tak: ustalmy najpierw binarne kodowanie liter alfabetu A dbając o to, by

dla każdej pary różnych liter a, b ∈ A słowo kodA(a) nie było podsłowem początkowym słowa kodA(b) (i vice versa).To zawsze jest możliwe. Wówczas dla dowolnego słowa v = a1 . . . an ∈ A∗ , kodA(v) = kodA(a1) . . . kodA(an).A komplementarną dla takiego kodowania funkcję dekodującą wymyśl sam.

11Funkcję λL nazywamy funkcją charakterystyczną języka L.12Kłopot z wyborem adekwatnej i wywołujacej oczekiwane skojarzenia nazwy dla takich zbiorów bierze się stąd, że

jest to sytuacja obca naszemu doświadczeniu ukształowanemu w świecie obiektów skończonych (czyli rozstrzygalnych).Na marginesie: konia z rzędem temu kto wyjaśni, dlaczego angielski termin „recursively enumerable” przetłumaczy-lismy jako rekurencyjnie przeliczalny a nie rekurencyjnie policzalny... .

13Np. funkcję podwajania słowa można za pomocą dwutaśmowej maszyny zrealizować tak: 1. przepisz słowo v ztaśmy zewnętrznej na wewnętrzną. 2. Przejdź na koniec słowa v na taśmie zewnętrzenej. 3. Przepisz kopię słowa v ztaśmy wewnętrznej na zewnętrzną. Bardzo proste.A teraz spróbuj zrealizować podwajanie słów korzystając z maszyny jednotaśmowej.

14To nie jest aż tak strasznie dziwne: informacje (słowa) zapisane na dwóch taśmach można łatwo zapisać na jednejtaśmie rezerwując np. dla pierwszego słowa miejsca parzyste, a dla drugiego - nieparzyste.

15Bardziej na takie miano zasługuje model von Neumanna opisujący architekturę komputera.

Page 102: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 101

Nierozstrzygalność problemu stopu

Wiemy już dość, by zająć się fascynującym fenomenem - „nierozstrzygalnością problemu stopu”.Każdy z nas słyszał o „zapętleniu programu” - nasz komputer zwariował i bez końca realizujepewien program16. Czyż nie byłoby pięknie (wygodnie), gdyby komputer był wyposażony fabryczniew program PS, który - uruchomiany przed właściwym programem T - odpowiadałby na pytanie,czy po uruchomieniu T na wskazanym zestawie danych v ten program się zatrzyma, czy też sięzapętli? Dlaczego żaden geniusz z Doliny Krzemowej o tym nie pomyślał?

Do formalnego opisu problemu stopu wykorzystamy pojęcie kodu maszyny. Kod maszyny Tto słowo binarne kod(T ), które otrzymamy w wyniku translacji tekstu - opisu zbioru instrukcjimaszyny T - na słowo binarne17.

Nasz problem sformułujemy teraz tak:

- „czy istnieje maszyna Turinga PS taka, że dla dowolnej maszyny T i słowa binarnego v:

PS(< kod(T ), v >) = 1 gdy maszyna T zatrzyma się rozpoczynając pracę ze słowem v zapisa-nym na taśmie i PS(< kod(T ), v >) = 0 - w przeciwnym przypadku?”18

Odpowiedź brzmi „nie”. To jest sens słynnego „twierdzenia o nierozstrzygalności problemu stopu”.

Niech nas nie zwiedzie prostota sformułowania problemu. Jego rozwiązanie przez A. Turinga to jedno naj-piękniejszych i najważniejszych osiągnieć ludzkiego intelektu w XX wieku (a może nie tylko...). Wyznacza,podobnie jak wyniki Godla, granice naszego panowania nad tym, co tworzymy.Możemy projektować procesy obliczeniowe i realizować je za pomocą komputerów. Ale nie mamy żadnejszansy na pełną nad nimi kontrolę. Nie możemy rozstrzygać o wszystkim.

Dowód tego twierdzenia jest piękny, bo prosty. Przypuśćmy, że taka maszyna PS istnieje iwykorzystajmy ją do zbudowania nowej maszyny PS∞ działającej tak:

PS∞(v) =

1 PS(< v, v >) = 0

nie kończy pracy PS(< v, v >) = 1

Jak zachowa się maszyna PS∞ na własnym kodzie? Łatwo sprawdzić, że obliczenie PS∞(kod(PS∞))jest procesem skończonym dokładnie wtedy, gdy jest procesem ... nieskończonym!19

Nie ma procedury rozstrzygającej dla problemu stopu. Ale mamy banalnie prostą proceduręsprawdzającą - wystarczy uruchomić maszynę T ze słowem v zapisanym na taśmie i czekać...

W ten sposób spełniłem złożoną wcześniej obietnicę:

Język złożony ze słów postaci < kod(T ), v > i takich, że maszyna T zatrzyma się rozpoczynając pracęze słowem v to przykład języka rozpoznawalnego (sprawdzalnego), który nie jest rozstrzygalny.

Przyjrzyjmy się ważnej konsekwencji tego rozróżnienia. W matematyce teoriomnogościowej ma-my bezwarunkowe przyzwolenie, by - kiedy tylko zechcemy - daną funkcję częściową φ : A → Bzastąpić funkcją wszędzie określoną φt : A→ B∪∞ zwracającą „komunikat o błędzie” w sytuacji,gdy wartość φ(a) jest nieokreślona:

φt(a) =

φ(a) wartość φ(a) jest określona

∞ w przeciwnym przypadku

16Najczęściej jest to jednak rezultat błędu popełnionego przy budowie programu a nie złośliwość komputera.17Np. za pomocą opisanej wyżej funkcji kod0,1. Nie muszę dodawać, że takie kodowanie zawsze istnieje.18Symbol < kod(T ), v > oznacza tu słowo binarne - kod pary słów binarnych (kod(T ), v). Możemy np. przyjąć

< v, kod(T ) >= 00 . . . 0︸ ︷︷ ︸|kod(T )|

1kod(T )v

gdzie symbol |kod(T )| oznacza długość słowa kod(T ).19W tym dowodzie jest drobna luka. Ale zaręczam - wszystk jest OK. Jeśli ktoś zauważył tę lukę, to dobrze (o nim

świadczy). A jeśli wie, jak ją wypełnić, to jeszcze lepiej.

Page 103: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 102

Tak nie można postępować w świecie funkcji obliczalnych. Dlaczego? Przypuśćmy, że język L ⊂ A∗jest rozpoznawalny, ale nie rozstrzygalny. Gdyby opisaną wcześniej obliczalną funkcję częściowąλcL : A∗ → 0, 1∗ można było zastąpić wszędzie określoną funkcją obliczalną (dodając komunikato błędzie), to otrzymalibyśmy funkcję działającą tak:

λL(v) =

1 v ∈ L∞ v /∈ L

A to - na mocy definicji - oznacza, że język L jest... rozstrzygalny. Sprzeczność (założyliśmy, że Ljest tylko rozpoznawalny)!

W świecie funkcji obliczalnych mamy dwa rodzaje nieokreśloności.Funkcja fT : A∗ → B∗ ma nieokreśloność „jawną” gdy język L(T ) (złożony ze słów akceptowanychprzez T ) jest rozstrzygalny. Wtedy przed rozpoczęciem obliczenia możemy rozstrzygać, czy będzie onoskończone czy też będzie trwało wiecznie. I wtedy możemy uzupełnić funkcję fT do totalnej funkcjiobliczalnej dodając „komunikat o błędzie”20.Jeśli język L(T ) jest tylko rozpoznawalny, to nieokreśloność funkcji obliczalnej fT jest „niejawna”.

7.1.1 Klasyfikacja języków Chomsky’ego revisited

Klasyfikacja języków Chomsky’ego21 odwoływała się do kształtu opisujących je gramatyk. Teraz jąpowtórzymy, ale odwołujac się do akceptorów - mechanicznych urządzeń orzekających o przynależ-ności słowa do języka. W roli akceptorów wystąpią... maszyny Turinga.

Twierdzenie wiążące maszyny Turinga z klasyfikacją języków Chomsky’ego wygląda tak:

Język L jest akceptowalny przez pewną maszynę Turinga T 22 dokładnie wtedy, gdy można goopisać za pomocą pewnej gramatyki kombinatorycznej.

Podpowiedzmy, skąd ten wynik: procedurę sprawdzającą, czy słowo w należy do języka L(G) (czyligenerowanego przez gramatykę G), można opisać tak: produkujemy kolejno wszystkie możliwewyprowadzenia, zaczynając od tych długości jeden, potem długości dwa itd.. Jeśli w ∈ L(G), tow pewnym momencie znajdziemy wyprowadzenie tego słowa i skończymy pracę. A jeśli w /∈ L(G),to... Formalizacja tego pomysłu prowadzi do zbudowania maszyny Turinga TG akceptującej językL(G) (tzn. L(G) = L(TG)).

Jeżeli za paradygmat matematycznego konstruktywizmu uznamy sprawdzalność kreowanych kolekcji -obiektów, które czynimy przedmiotem naszych badań - to musimy przyjąć, że uniwersalnym narzędziemich tworzenia są specyficzne struktury rekurencyjne - gramatyki kombinatoryczne.

Zawężanie klasy języków zgodnie z hierarchią Chomsky’ego (języki kontekstowe, bezkonteksto-we, regularne) musi oznaczać, że akceptujące je urządzenia są coraz prostsze. Skoro jednak maszynaTuringa jest prosta jak czajnik, to na czym polega jej upraszczanie?

Mówiąc najprościej - na ograniczeniu relacji maszyny ze światem zewnętrznym (reprezentowa-nym przez słowo zapisane na taśmie). Język opisany przez gramatykę kontekstową jest akceptowanyprzez tzw. liniowo ograniczone maszyny Turinga. Taka maszyna sprawdzając przynależność słowaw do języka czyta i modyfikuje w czasie pracy tylko te pola, które są zajęte przez słowo w23.

Języki rozstrzygalne to te, które są akceptowane przez liniowo ograniczone maszyny Turinga.

Również i w tym przypadku łatwo o sugestię, skąd taki wynik: gdy gramatyka G jest konteksto-wa, to zastosowanie jakiejkolwiek produkcji nie skraca długości wyprowadzanego słowa. Załóżmy

20Z „jawną” nieokreślonością mamy do czynienia np. w prypadku ograniczonego odejmowania liczb naturalnych:odejmowanie n−m jest nieokreślone (niewykonalne) gdy n < m.

21O której mówiliśmy w rozdziale poświęconym strukturom rekurencyjnym22Tzn. L = L(T ).23„Nieograniczona” maszyna Turinga może w trakcie takiej analizy swobodnie korzystać z całej taśmy notując na

niej to, co potrzebne do obliczenia.

Page 104: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 103

- upraszczając, ale nie zmieniając istoty rozumowania - że zastosowanie każdej produkcji istot-nie zwiększa długość wyprowadzonego słowa. Jeśli tak, to z góry wiemy, kiedy zatrzymać processprawdzania przynależności dla słowa w długości np. 10: jeśli wypisanie wszystkich wyprowadzeńo długości ¬ 10 nie da oczekiwanego rezultatu, to możemy skończyć pracę - słowo w nie należy dojęzyka L(G). A wyprowadzeń ograniczonej długości jest skończenie wiele...

W ten sposób opisana wcześniej procedura sprawdzająca czy w ∈ L(G) zmieniła się - dlagramatyk kontekstowych - w rozstrzygającą...24.

Zawężenie rozważań do klasy języków kontekstowych wprowadza nas do raju w którym językomtowarzyszą procedury rozstrzygające o przynależności słowa do języka. Czego chcieć więcej? Po cokomu gramatyki bezkontekstowe i regularne?To raj pozorny: te procedury dla języków kontekstowych mogą być bardzo złożone, przez co bezuży-teczne w praktyce. Gdy ograniczymy się do gramatyk bezkontekstowych, to złożoność tych procedurznacząco maleje - staje się wielomianowa25. I dopiero te języki znajdują praktycznne zastosowaniew informatyce26.

Języki bezkontekstowe są akceptowane przez automaty ze stosem. Maszyny Turinga akceptującejęzyki regularne to tzw. automaty skończone. Prostota weryfikacji przynależności słowa do językaregularnego polega na tym, że słowo jest przeglądane tylko jednokrotnie, z lewa na prawo. Liczbakroków procesu weryfikacji jest równa długości sprawdzanego słowa.

Klasyfikacja Chomsky’ego to nie tylko wewnętrzna sprawa lingwistyki matematycznej. To wistocie klasyfikacja problemów, które możemy rozsądzać proceduralnie. Oto przykład: graf skoń-czony można zakodować jako słowo np. numerując jego wierzchołki a krawędzie przedstawiając jakopary liczb (kody początku i końca krawędzi). Np. słowo (nad alfabetem złożonym z cyfr, przecin-ków i dwóch rodzajów nawiasów) < 1, 2, 3, 4, (1, 2), (3, 4) > może być rozpoznane jako kod grafuo czterech wierzchołkach i dwóch krawędziach. Co istotne, pewne własności grafu G można terazprzetłumaczyć na własności syntaktyczne jego kodu. Np. istnienie pętli przy każdym wierzchołkuoznacza - w naszym systemie kodowania - że kod grafu G wraz z podsłowem „n” musi zawieraćpodsłowo „(n, n)”. Każda taka własność grafu wyróżnia pewien podzbiór kodów, pewien język.Tym samym rozstrzygnięcie „czy graf ma daną własność” sprowadzamy do sprawdzenia, czy jegokod należy do języka wyznaczonego przez tę własność. Możliwość zaangażowania w to sprawdzaniekomputera (maszyny Turinga) zależy od tego, czy język odpowiadający tej własności potrafimyopisać za pomocą gramatyki. A złożoność problemu zależy od tego, jaka jest ta gramatyka...

Wystarczy rzeczy ponazywać, by zakwalifikować rozważany problem do pewnej „klasy trudności”...27.

Na koniec mały test: czy wyobrażamy sobie, ile jest binarnych maszyn Turinga o danej liczbiestanów? To się da oszacować:

liczba maszyn Turinga o n stanach = (9n+ 1)3n

24Jeśli zrozumiałeś, to zgodzisz się z takim stwierdzeniem: „gdyby możliwe było określenie stałej proporcji międzydługością twierdzenia a maksymalną długością jego dowodu, to teorie matematyczne byłyby rozstrzygalne”.

25Najkrócej: zgodzimy się, że długość procesu weryfikującego przynależność słów do języka zależy od długościbadanego słowa. Jeśli ta zależność jest opisywana przez funkcję wykładniczą f(n) = 2n to mówimy o złożoności wy-kładniczej procedury. A jeśli ta zależność jest opisywana np. przez funkcję f(n) = n3 to złożoność jest wielomianowa.

26Niektórym to wciąż mało: wyróżnia się podklasy języków bezkontekstowych LL(k) i LR(k): dopiero dla takichjęzyków mamy procedury o satysfakcjonującej efektywności.Dlaczego to jest ważne? Przecież chcemy, by komputer szybko sobie radził z automatyczną weryfikacją syntaktycznejpoprawności programów...

27Ponad wszystkie wasze uroki –Ty! poezjo, i ty, wymowo –Jeden wiecznie będzie wysoki:

* * * * * * * * * * * * * * * *Odpowiednie dać rzeczy słowo!

C.K.Norwid, Za wstęp(ogólniki)

Page 105: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 104

Np. mamy „tylko” 196 maszyn dwustanowych... A to ponad... 47 milionów... A maszyn o 10 stanachjest 9130. Kosmos...28. Warto sobie to uświadomić zanim się powie, że to, co skończone, jest wgruncie rzeczy trywialne...

7.1.2 Maszyna uniwersalna

Opisując działanie maszyny Turinga przedstawiłem procedurę - „instrukcję użycia” dowolnej ma-szyny Turinga. Skoro uznaliśmy, że maszyna Turinga to sformalizowany odpowiednik procedury, tomusimy zapytać - czy i tej szczególnej procedurze odpowiada jakaś maszyna?Tak. I to bardzo ważna: jest to uniwersalna maszyna Turinga U . Jej uniwersalność polega na tym,że jest zdolna symulować pracę dowolnej maszyny Turinga.Trochę szczegółów. Wiemy, że każda maszyna T ma swój binarny kod - słowo kod(T ) a każdą paręsłów (kod(T ), v) można zakodować jako pojedyncze słowo binarne - np. tak:

< v, kod(T ) >= 00 . . . 0︸ ︷︷ ︸|kod(T )|

1kod(T )v

gdzie symbol |kod(T )| oznacza długość słowa kod(T ). To pozwala użyć słowa < kod(T ), v > jakodanych do pracy innej maszyny.

Maszyna uniwersalna U symuluje pracę maszyny T na danym słowie v w ten sposób, że roz-poczynając pracę ze słowem < kod(T ), v > daje ten sam rezultat, co maszyna T rozpoczynającapracę ze słowem v zapisanym na taśmie 29:

U(< kod(T ), v >) = T (v)

Częścią naszej codziennej aktywności jest realizacja pewnych procedur, „postępowanie zgodne z instruk-cją”. Każdy z nas jest po części uniwersalną maszyną Turinga.Trzeba mieć nadzieję, że jesteśmy czymś więcej, niż taką maszyną.„Jeśli oczekujemy od maszyny bezbłędnego działania, nie możemy żądać, by jednocześnie była inteligent-na” - A. Turing, odczyt w dniu 20.02.1947 [60]

Paradoks Berry’ego revisited

Powiedzmy słowo o fascynującym wyniku, związanym ze wspomnianym już paradoksem Berry’ego:„n to najmniejsza liczba naturalna, której nie da się opisać za pomocą mniej niż czterdziestu

słów”.

Komentując ten paradoks pisałem, że jego matematyczna analiza wymaga wstępnego ustalenia„czym jest opis” (liczby naturalnej).Liczba naturalna jest nazwą - słowem. Możemy więc sprowadzić problem do pytania: czym jest opiszdania (słowa) za pomocą innego zdania (słowa)?Kołmogorov30 zaproponował taką oto, satysfakcjonującą konstruktywistów, definicję:

„opis słowa w to para słów (kod(T ), v) gdzie v jest słowem a T - maszyną Turinga, taką, żeT (v) = w” 31.Korzystając z maszyny uniwersalnej U powiemy: opis słowa w to słowo < kod(T ), v > takie, że:

U(< kod(T ), v >) = w

Opis (kod) słowa w musi zawierać w sobie informację, jak je odczytać.Cóż po opisie, którego nikt nie rozumie? Wspomnij J. F. Champolliona32

Słowo „2+ 2” jest częścią opisu liczby 4. Drugą częścią jest opis procedury dodawania, która wszyscymamy w głowach...

28To prawda, że niektóre spośród tych maszyn są „równoważne” (liczą to samo), ale nie o to chodzi.29Szczegółowy opis kodowania maszyn i budowy uniwersalnej maszyny można znaleźć np. w [85].30A. N. Kołmogorow, (1903 - 1987) – rosyjski matematyk, współtwórca teorii prawdopodobieństwa.31Zauważ, że zgodnie z oczekiwaniami (i zdrowym rozsądkiem) każde słowo w jest własnym opisem, gdyż istnieje

„maszyna kopiująca” COPY (czyli taka, że fCOPY (w) = w dla dowolnego słowa w).

Page 106: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 105

Przeformułujmy nieco zagadkę Berry’ego nie zmieniając jej sensu: „ berry(n) jest „najwcze-śniejszym” słowem binarnym, którego nie można opisać za pomocą słowa o długości mniejszej niżdana liczba n”33. Ta definicja słów berry(n) jest ich konstruktywnym opisem jeśli - zgodnie z nasządefinicją opisu - istnieje maszyna Turinga BERRY taka, że dla dowolnej liczby naturalnej n:

U(< kod(BERRY ), bin(n) >) = berry(n)

gdzie bin(n) to słowo - zapis binarny liczby n.

Problem w tym, że taka maszyna... nie istnieje! Aby to pokazać wystarczą dwie obserwacje:

1. Skoro przyjęliśmy, że < kod(T ), v) >= 00 . . . 0︸ ︷︷ ︸|kod(T )|

1kod(T )v , to

(∗) | < kod(BERRY ), v > | ¬ |v|+ cB

(tu i dalej przez |w| oznaczamy długość słowa w).

gdzie cB = 2 · |kod(BERRY )|+ 1 jest stałą zależną wyłącznie od maszyny BERRY .

2. Wprost z definicji słowa berry(n) wynika, że:

(∗∗) n < min(berry(n))

gdzie min(berry(n)) do długość najkrótszego opisu słowa berry(n).

Łącząc obie nierówności otrzymamy nierówność:

n < min(berry(n)) ¬ | < kod(BERRY ), bin(n) > | ¬ |bin(n)|+ cBczyli

n− |bin(n)| ¬ cBktóra powinna być prawdziwa dla dowolnej liczby naturalnej n. Ale to jest niemożliwe, gdyż różnican− |bin(n)| rośnie nieograniczenie!34

Skoro nie ma procedury pozwalającej na konstrukcję słowa wskazanego przez Berry’ego, to nie ma iparadoksu Berry’ego...Tak konstruktywizm poradził sobie z paradoksem Berry’ego. Inni nie do końca uznają konieczność sko-jarzenia „opisów” z obliczalną procedurą ich odczytów. Nie muszą, ale...

Definicja Kolmogorova pozwala za miarę złożoności słowa w uznać długość jego najkrótszegokodu - słowa < kod(T ), v > . Ale można też rozumieć ją nieco inaczej - jako minimalną liczbęstanów maszyny Turinga T zdolnej wygenerować w, tzn. takiej, że U(< kod(T ), ε >) = w, gdzie εto słowo puste. W [21] G. Chaitin pokazał, że ta liczba - wraz ze wzrostem długości słowa v zbliżasię do wartości wyrażenia |v|

2log2|v| ...

7.2 Funkcje obliczalne

Turing widział obliczenie jako proces przetwarzania słów. Nie tylko on. W pracy „Relatives ofRobinson Arithmetic”35 traktującej o teorii składania(?) A. Grzegorczyka36 napisano tak: „Grze-

32Jean F. Champollion przywrócił nam, po wiekach milczenia, informację zawartą w hieroglifach egipskich... .33Zbiór słów binarnych można liniowo uporządkować tak: pierwszym kryterium jest długość słowa a drugim - dla

słów jednakowej długości - porządek leksykograficzny: 0 ¬ 1 ¬ 00 ¬ 01 ¬ 10 ¬ 11 ¬ 000 ¬ .... „Najwcześniejsze”słowo w zbiorze, to pierwsze słowo w tym porządku.

34Dla mniej zaawansowanych matematycznie: jeżeli liczbę 10 zwiększymy dziesięciokrotnie, to długość jej dziesięt-nego zapisu wzrośnie tylko o jeden znak, gdy zwiększymy stukrotnie - zapis się wydłuży dwa znaki. Łatwo się zgodzić,że w żaden sposób nie można ograniczyć różnicy między wielkością liczby a długością jej dziesiętnej reprezentacji. Iwszystko to pozostaje prawdziwe, j gdy zapis dziesiętny zastapimy binarnym.Matematycznie: ciąg ((n− log2n) : n ∈ N) rośnie nieograniczenie.Dodajmy dla porządku: przedstawiony dowód to modyfikacja dowodu twierdzenia Kołmogorova, które orzeka, żefunkcja min przyporządkowująca słowu długość jego najkrótszego kodu, nie jest obliczalna.

35V. Svejdar, The Logica Yearbook 2008 , pp. 253-263, College Publications, London, 2009.36„theory of concatenations”

Page 107: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 106

gorczyk’s motivation to study the theory of concatenation is philosophical.When reasoning orwhen performing a computation, we deal with texts. Our human capacity to per-form these intellectual tasks depends on our ability to discern texts. Then it isnatural to define notions like undecidability directly in terms of texts, without reference to naturalnumbers.”.

Oczywiście można mówić o funkcjach obliczalnych działających na liczbach naturalnych. Choćbydlatego, że - jak już ustaliliśmy - liczby naturalne to słowa:

funkcja częściowa φ : Nk → N jest obliczalna gdy istnieje maszyna Turinga T nad alfabetembinarnym taka, że dla dowolnego k-elementowego ciągu liczb naturalnych (n1, . . . nk),

φ(n1, . . . nk) = m wtw fT (11 . . . 1︸ ︷︷ ︸n1

0 11 . . . 1︸ ︷︷ ︸n2

0 . . . 0 11 . . . 1︸ ︷︷ ︸nk

) = 11 . . . 1︸ ︷︷ ︸m

)

7.2.1 Funkcje obliczalne według Kleene’ego

Obliczaność funkcji działających na liczbach naturalnych można też zdefiniować bez odwołań domaszyn Turinga. Taką niezależną definicję zaproponował S.C.Kleene37.

Funkcje, które a priori uznajemy za obliczalne, to:

- rzutowania; Πnk : Nn → N, (Πn

k(x1, . . . , xk, . . . , xn) = xk),- funkcja następnika; succ : N→ N,- funkcja stała; 0 : N→ N , tzn. 0(n) = 0 , dla dowolnej liczby n.

Funkcje obliczalne to te, które można otrzymać z tych bazowych funkcji obliczalnych za pomocąwielokrotnego stosowania trzech konstruktorów:

1. składanie funkcji:

((gi : Nni −→ N; i = 1, . . . k), f : Nk −→ N) =⇒ f(g1, . . . , gk) : Nn1+···+nk −→ N

2. rekursji prostej38: korzystając z danej funkcji g : N ×N −→ N i liczby a ∈ N definiujemynową funkcję h taką, że:

- h(0) = a ,- h(succ(n)) = g(h(n), n)

W szczególności: dodawanie, mnożenie definiowane są w ten sposób, czyli są to funkcje obliczalne39.W konsekwencji każda funkcja wielomianowa jest obliczalna.

3. miminum efektywnego: dla danej funkcji obliczalnej f : N ×N → N i dowolnie wybranejliczby naturalnej m możemy rozpatrywać równanie:

(∗) f(m, y) = 0

Nową funkcję g : N −→ N definiujemy przyjmując, że

g(m) = c

gdzie c to najmniejsze rozwiązanie równania (∗) i ponadto dowolnej liczby naturalnej a ¬ y wartośćf(m, a) jest określona. Stosujemy tu efektowny zapis:

g(x) = µy(f(x, y) = 0)

37Stephen Cole Kleene (1909-1994) - matematyk amerykański. W 1934 roku Godel wygłosił w Princeton wykład,którego słuchaczem był m.in. młody Kleene. Godel, szukając formalnej definicji obliczalności, zdefiniował klasę funkcjiznanych dziś jako funkcje prymitywnie rekurencyjne. W czasie tego wykładu Godel sformułował pewne propozycjerozszerzenia tej klasy. I, jak pisze R. Murawski w [80], tak rozszerzona klasa pokrywa się z klasą funkcji obliczalnychzdefiniowaną ostatecznie przez Kleene’ego.

38Ograniczam się do przedstawienia bardzo uproszczonej definicji schematu rekursji.39Z zastrzeżeniem, które czasowo ukryjemy pod hasłem ”Twierdzenie Tennenbauma” a wyjaśnimy poźniej.

Page 108: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 107

Funkcje obliczalne budowane bez użycia operatora minimum efektywnego to funkcje prymitywnierekurencyjne.

Prostota środków użytych do konstrukcji funkcji obliczalnych jest zwodnicza - funkcje obliczalneczasem są bardzo niebanalne. Pięknym przykładem jest słynna funkcja Ackermanna40:

A(0, x) = x+ 1;A(n+ 1, 0) = A(n, 1);A(n+ 1, x+ 1) = A(n,A(n+ 1, x))

Wygląda niewinnie, ale... spróbuj obliczyć wartość A(4, 2)41.

Definicja operatora minimum efektywnego to w istocie opis procedury obliczania wartości funk-cji µy(f(x, y) = 0) : „dla danego argumentu m ∈ N testujemy równość f(m, y) = 0 kolejno dlay = 0, 1, 2, . . ., aż do chwili, gdy wynik testu będzie pozytywny. Znaleziona tak liczba ymin jestwartością funkcji µy(f(x, y) = 0) dla argumentu m”.Oczywiście nie można wykluczyć, że testowanie równości f(m, y) = 0 da zawsze - dla y = 0, 1, 2, . . .- odpowiedź negatywną42. Wartość funkcji µy(f(x, y) = 0) na argumencie m nie jest wtedy okre-ślona, bo proces jej poszukiwania jest nieskończony. A to oznacza że wśród funkcji obliczalnych wsensie Kleene’ego są też funkcje częściowe43.

W języku Kleene’ego możemy też zdefiniować pojęcia rekurencyjnego i rekurencyjnie przeli-czalnego podzbioru liczb naturalnych (które, w sposób oczywisty, odpowiadają, w teorii maszynTuringa, rozstrzygalnym i rozpoznawalnym językom):

Podzbiór A ⊆ Nk jest rekurencyjny („rozstrzygalny”), jeżeli jego funkcja charakterystyczna λA :Nk → N taka, że dla dowolnego ciągu (n1, . . . , nk) ∈ Nk:

λA(n1, . . . , nk) =

1 (n1, . . . , nk) ∈ A0 w przeciwnym wypadku

jest obliczalna.Podzbiór A ⊂ Nk jest rekurencyjnie przeliczalny („sprawdzalny”, „rozpoznawalny”) jeżeli jego

częściowa funkcja charakterystyczna λcA : Nk → N definiowana tak:

λcA(n1, . . . , nk) =

1 (n1, . . . , nk) ∈ Anieokreślona w przeciwnym wypadku

jest obliczalna.Dodajmy, że w języku Kleene’ego twierdzeniu o istnieniu uniwersalnej maszyny Turinga odpowiadatakie oto twierdzenie: istnieje numeracja funkcji obliczalnych jednej zmiennej (φn : n ∈ N) orazfunkcja obliczalna dwóch zmiennych φU taka, że φU (n,m) = φn(m).

To wszystko.

40Ackermann był uczniem Hilberta. Dodajmy, że to nikt inny tylko Hilbert zainicjował poważne badania nadobliczalnością: dziesiąty punkt jego słynnego programu to pytanie o istnienie „algorytmu” (procedury) rozwiązywaniadowolnego równania diofantycznego.

41A(4, 2) = 265536−3. Ten niesamowicie szybki wzrost funkcji Ackermanna jest punktem wyjścia do udowodnienia,że nie jest ona prymitywnie rekurencyjna (choć, na pozór, „podwójna rekurencja” użyta w jej opisie nie jest takodległa od zwykłej rekurencji)...

42Troszkę dziwny przykład: rozważmy funkcję µy(succ(y) = 0) ? Można ją interpretować jako „nieokreśloną liczbęnaturalną” bo związana jest ona z nieskończonym (czyli bezskutecznym) procesem poszukiwania rozwiązania równaniasucc(y) = 0 w zbiorze liczb naturalnych.To nie jest aż tak dziwne jak się zdaje. Badanie semantyk operacyjnych języków programowania w których obecnyjest operator punktu stałego (odpowiedzialny za rekursję) zaczyna się od dodania do zbioru liczb naturalnych Nelementu ⊥ reprezentującego „undefined element”. Zainteresowanych odsyłam np. do pracy G.D. Plotkin, LCF as aprogramming language, Theoretical Comp. Sci. (1977), 223-255.

43W języku Kleene’ego można próbować mówić o „jawnej” i „niejawnej” nieokreśloności częściowej funkcji obli-czalnej. Jednak teraz to rozróżnienie nie jest tak łatwe do zauważenia jak w języku maszyn Turinga. To jeszcze jednakonsekwencja nieobecności w pojęcia „proces obliczenia” w języku Kleene’ego.

Page 109: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 108

Liczby czy słowa, Turing czy Kleene?

Definicja Kleene’ego w żaden sposób nie objaśnia, dlaczego właśnie tak zdefiniowane funkcje uzna-jemy za obliczalne. Nie odpowiada na pytanie, czym jest obliczenie. Wprawdzie definicje konstruk-torów funkcji obliczalnych kojarzą się z pewnymi konstrukcjami programistycznymi ale to niewieletłumaczy44.

Obie definicje - Turinga i Kleene’ego - opisują tę samą klasę funkcji: zastępując liczby słowami(numerałami) można dowolną funkcję obliczalną w sensie Kleene’ego zrealizować za pomocą pewnejmaszyny Turinga. I odwrotnie: numerujac słowa nad alfabetem A, opiszemy działanie dowolnejmaszyny Turinga T przekształcające słowa za pomocą odpowiedniej funkcji obliczalnej45.

To nie oznacza, że można lekceważyć definicję Kleene’ego, uznać za wtórną w stosunku do opisu obli-czalności zaproponowanego przez Turinga. Ta definicja to precyzyjny opis klasy funkcji obliczalnych wjęzyku mainstreamowej matematyki.Dzięki Kleene’emu termin „obliczalność” mógł pojawić się w badaniach matematycznych głównego nurtu.A to okazało się ważne dla samej matematyki. Przekonamy się o tym gdy będziemy mówić o dowodzietwierdzenia Godla.

Może się zdawać, że rozważanie dylematu - liczby czy słowa, formalizm Kleene’ego czy maszynyTuringa - to przysłowiowe dzielenie włosa na czworo. Ale to zbyt proste (prostackie), bo ignorujefundamentalną różnicę między tymi dwoma językami opisu funkcji obliczalnych.

Maszyny Turinga opisują obliczenia jako dziejące się w czasie procesy realizowane przez fizyczne urzą-dzenia. Funkcje obliczalne to - w tej teorii - jedynie opis rezultatu tych procesów.Formalizm Kleene’ego jest opisem rekurencyjnej struktury klasy funkcji obliczalnych. Pojęcie „procesuobliczenia” jest tu nieobecne, przywoływane jedynie nieformalnie.Te teorie są komplementarne. Obie mówią o obliczalności, ale koncentrują uwagę na różnych wątkach.

Fundamantalna różnica między językami obu panów polega na tym, że mówiąc o maszynachTuringa (procesach obliczeniowych) operujemy pojęciem (dyskretnego) czasu jako pojęciem pier-wotnym, nie wymagającym zdefiniowania. Czas jest tu brouwerowską pierwotną pre-intuicją. I tobrzydzi mainstreamowych ortodoksów.

W teorii Kleene’ego tak rozumiany czas jest nieobecny. Odwołujemy się do niego tylko, wte-dy, gdy próbujemy zbudować intuicje związane z formalnymi pojęciami46. Dlatego np. w językuKleene’ego trudno sformułować i rozważać fundamentalny dla teorii obliczalności problem stopu47.

Jeszcze jeden przykład: dla dowolnej maszyny Turinga T łatwo sobie wyobrazić (zbudować) jejn-tą aproksymację - maszynę Turinga T (n), która działa tak jak T , lecz zatrzymuje się zawsze pon krokach obliczenia48. To banalna obserwacja. Ale niech nie umknie naszej uwadze, że definiującmaszynę T (n) odwołujemy się do czasu - proces obliczenia realizowany przez T „ucinamy” po n-krokach!Istnienie ciągu maszyn aproksymujących (T (n) : n ∈ N) pozwala na łatwe udowodnienie dwóchważnych twierdzeń:

„każda częściowa funkcja obliczalna f jest aproksymowalna przez ciąg (fn) totalnych funkcjiobliczalnych”.

44Składanie funkcji to sekwencyjne wykonywanie programów, operator minimum efektywnego odpowiada pętlitypu „while”. Schemat rekursji odpowiada pętli typu „for” jeżeli funkcję h : N→ N wyznaczoną rekurencyjnie przeza ∈ N i g : N2 → N będziemy obliczać iteracyjnie, czyli budując ciąg par liczb naturalnych generowany przez funkcjęφ : N2 → N2 taką, że φ(n,m) = (g(n,m), succ(m)) i element (a, 0). wówczas h(n) to pierwsza współrzędna paryφn(a, 0). To nie tylko intuicja, to - w przybliżeniu - sens twierdzenia Bhoma-Jacopiniego.([13])

45W to nie trzeba wierzyć, to można dowieść. Ale taki dowód wymaga bardziej precyzyjnego języka niż ten, którymsię tu posługujemy. Zainteresowanych odsyłam do dowolnej monografii poświęconej teorii obliczalności.

46Wyjaśniając sens operatora minimum efektywnego pisałem: „„dla danego argumentu m ∈ N testujemy równośćf(m, y) = 0 kolejno dla y = 0, 1, 2, . . ., aż do chwili...”.

47Spróbuj...48Wystarczy dodać do maszyny-procedury T „licznik kroków” i wykorzystać go do zatrzymania maszyny.

Page 110: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 109

„każdy język sprawdzalny jest sumą przeliczalnego łańcucha coraz to większych języków roz-strzygalnych”

Te twierdzenia mają oczywiście swoje odpowiedniki „w języku Kleene’ego”. Ale dowody tychtwierdzeń w teorii Kleene’ego nie są już tak banalnie proste49.

Te przykłady zdają się sugerować, że język Turinga jest „lepszy” od języka Kleene’go. No tospróbujcie wyróżnić klasę funkcji pierwotnie rekurencyjnych w języku maszyn Turinga...

Nawet te skromne uwagi wystarczają by zrozumieć, co oznacza komplementarność obu teorii. A możenawet więcej: czy zgodne współistnienie obu teorii nie daje powodu by wątpić w sens poszukiwania„uniwersalngo języka” matematyki?

7.2.2 Numeracja i efektywna numeracja

Przywołane twierdzenie o aproksymacji działania maszyny T za pomocą maszyn T (n) pozwalaudowodnić kolejne ważne twierdzenie:

„języki sprawdzalne to te, które można efektywnie ponumerować”.

Co to znaczy? Efektywna numeracja języka L ⊆ A∗ to dowolna totalna funkcja obliczalnaf : N → A∗ taka, że dla dowolnego słowa w , w = f(n) dla pewnej liczby naturalnej n dokładniewtedy, gdy w ∈ L .

Udowodnienie, że każdy język posiadający efektywną numerację jest sprawdzalny, jest proste50.Znacznie ciekawszy jest dowód implikacji odwrotnej.Najpierw ponumerujmy litery alfabetu: A = (a0, a1, . . . , an). Ponumerujemy - ustawmy w kolejkę- słowa nad tym alfabetem korzystając z dwóch kryteriów porównawczych: pierwsze kryteruim todługość słowa (słowo krótsze jest przez dłuższym) a słowa jednakowej długości ustawiamy w kolejkękorzystając z porządku leksykograficznego wyznaczonego przez numerację alfabetu51.Wykorzystamy też znaną numerację zbioru wszystkich par liczb naturalnych:

(n,m) < (n1,m1) ↔ ((n+m) < (n1 +m1)) ∨ (((n+m) = (n1 +m1)) ∧ (n < n1)))52

Skoro język L ⊆ A∗ jest sprawdzalny, to L = L(T ) dla pewnej maszyny Turinga. Zgodnie zustaloną kolejnością par sprawdzamy, czy słowo v o numerze n należy do języka L(T (m)) ⊆ L(T ).Rozstrzygalność języka L(T (m)) gwarantuje, że każdy taki test jest procesem skończonym.W pierwszym kroku sprawdzamy, czy słowo puste jest w L(T (0)). Jeśli tak, to słowu pustemunadajemy numer 0 i zapamiętujemy, że odtąd „pierwszym wolnym numerem” jest liczba 1 i roz-poczynamy kolejny test. W przeciwnym przypadku - gdy ε /∈ L(T (0))- rozpoczynamy kolejny testpamiętając, że „pierwszym wolnym numerem” jest nadal zero.Załóżmy, że po wykonaniu testów dla wszystkich par, które - w opisanym porządku - poprzedzająparę (no,mo), ponumerowaliśmy już k słów języka L, tzn. „pierwszym wolnym numerem” jest terazk + 1. W kolejnym kroku sprawdzamy, czy słowo w o numerze no należy do języka L(T (mo)) Gdytest jest pozytywny, to ... . Jeśli rozumiesz w czym rzecz, to z łatwością dokończysz opis procedury.Jeśli nie - przeczytaj ponownie pewne fragmenty powyższego tekstu53.

Dobrym testem zrozumienia istoty efektywnej numeracji jest samodzielne uzasadnienia takiego

48Udowodnij te twierdzenia. To łatwe.To jest też dobry moment by uświadomić sobie subtelności związane z pojęciem procedury. Pomyślmy tak: dowolnyjezyk L ⊆ A∗ jest suma łańcucha skończonych języków Ln = w ∈ L : długośćw ¬ n. Te języki są skończone,czyli rozstrzygalne. Istnieją więc maszyny Turinga Tn akceptujące języki Ln. Stąd, aby sprawdzić czy w ∈ L wy-starczy sprawdzić, jaka jest długość w (powiedzmy n) i uruchomić maszynę Tn... Czyż nie jest to opis proceduryrozstrzygajacej o przynależności słowa do języka L? Nie! A to dlatego, że w tej pesudoprocedurze odwołujemy się donieskończonego zbioru maszyn Turinga co wymaga operowania aktualnie nieskończoną pamięcią...

49Spróbuj...50Obliczaj kolejno wartości f(n) ... .51Wygląda to tak: ε(słowo puste), a0, a1, . . . , an, a0a0, a0a1, . . . , anan, a0a0a0, . . .). To tylko początek...52(0, 0) < (0, 1) < (1, 0) < (0, 2) < (1, 1) < (2, 0) < (0, 3) < (1, 2) < (2, 1) < . . .53Grozi zapętlenie!

Page 111: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 110

stwierdzenia: „jeśli język L jest rekurencyjnie przeliczalny ale nie rekurencyjny(!), to żadna jegoefektywna numeracja nie może być zgodna z jakąkolwiek numeracją całego zbioru A∗”54. Spróbuj!

Ten przykład pokazuje niedowiarkom, że poza teorią mnogości jest miejsce na matematykę, na dowodzeniei na niebanalne pomysły.Jeśli jednak ktoś będzie się upierał, że „prawdziwy” dowód tego twierdzenia musi być przedstawiony wjęzyku Kleene’ego, to trudno. „Pana Tadeusza” też można czytać w chińskim przekładzie...

Rezygnując z obliczalności funkcji numerującej f : N → A∗ otrzymamy definicję języka nume-rowanego. Jak jest różnica?Taką „zwykłą” numerację ma każdy język nad skończonym alfabetem (a tylko takie tu rozpatru-jemy)55. A numerację efektywną tylko niektóre. Istnienie zwykłej numeracji języka L oznacza, żekażde słowo tego języka ma swój numer. Ale to nie oznacza, że zawsze - dla wskazanej dowolnieliczby n - potrafimy podać słowo o tym numerze. To jest możliwe tylko wtedy, gdy numeracja słówjest efektywna.

Różnicę między numeracją a efektywną numeracją dobrze ilustruje taki przykład. Wiemy jużdość by się zgodzić, że jednoargumentowych totalnych funkcji obliczalnych, jest przeliczalnie wiele56.Można więc je ponumerować, „ustawić w ciag”: (f1, f2, . . . , fn, . . .). Jednak żadna taka numeracjanie może być efektywna! Gdyby taka efektywna numeracja istniała, to można by zdefiniować obli-czalną funkcję φ : N→ N taką, że dla dowolnej liczby n, φ(n) = fn(n)+1. A to oznacza, że φ 6= fndla każdej liczby n. Otrzymaliśmy sprzeczność, która jest dowodem naszego twierdzenia57.

Istnienie efektywnej numeracji maszyn Turinga (częściowych funkcji obliczalnych) ujawnia jeszcze jednąuniwersalną cechę liczb naturalnych: można je uważać za (ekstremalnie krótkie) „kody programów”.Językiem matematyki obliczeń - teorii obliczalności - są liczby naturalne.

7.3 Maszyny Turinga z wyrocznią

W starożytnej Grecji zasłużoną sławą cieszyła się wyrocznia w Delfach, która ogłaszała swe przepowied-nie ustami kapłanki Pytii. Pytania mogły dotyczyć wszystkich dziedzin życia. O co mógł pytać Pytięmatematyk?

Wyobraźmy sobie, że wyrocznia w Delfach ma sekcję matematyczną dysponującą bankiem infor-macji o wszelkich funkcjach określonych na słowach binarnych. Przyjmijmy, że maszyna Turinga Tma stan „zapytaj wyrocznię” i gdy znajdzie się w tym stanie, pyta Pytię: „jaka jest wartość funkcjiD : 0, 1∗ → 0, 1 (którą Ty znasz a ja nie), na słowie, które w tej chwili jest na taśmie?” Od-powiedź Pytii umieszcza w obserwowanym polu taśmy i kontynuje automatyczną pracę. W trakciepojedynczego obliczenia, wyrocznia może być pytana wielokrotnie58 .

Przypuśćmy, że Pytia potrafi rozstrzygać problem stopu: Wówczas każda (częściowa) funkcjaobliczalna jest obcięciem pewnej totalnej funkcji, obliczalnej z pomocą tej wyroczni59.

54Numeracja f : N → L ⊆ A∗ języka L jest zgodna z numeracją g : N → A∗ zbioru A∗ jeżeli dla dowolnych liczbnaturalnych n,m g(n) ¬ g(m)→ f(n) ¬ f(m).

55Bo każdy taki język jest zbiorem przeliczalnym56Każda taka funkcja jest realizowana przez pewną maszynę Turinga. A maszyn Turinga jest przeliczalnie wiele.57Ponieważ φ jest obliczalna to powinna wystąpić w ciągu (f1, f2, . . . , fn, . . .) czyli φ = fm dla pewnej liczby m.

Ale wówczas fm(m) = φ(m) = fm(m) + 1... .Aby nie było zbyt prosto: takie rozumowanie zawodzi, gdybyśmy chcieli pokazać, że nie można efektywnie ponume-rować wszystkich częściowych funkcji obliczalnych z N do N...

58Dla ścisłości dodajmy, że Pytia odpowiadając korzysta zawsze z tej samej funkcji D.Jeżeli komuś przychodzi do głowy chytry plan, by zadając Pytii kolejne pytania uzyskać pełną informację o funkcji D,to błądzi. Argumentów funkcji D - słów binarnych - jest nieskończenie wiele. Zadając dowolnie dużo, ale zawsze tylkoskończenie wiele pytań, zawsze będziemy w sytuacji, w której nieskończona część opisu tej funkcji będzie nieznana.A każdy, nawet nie wiadomo jak wielki skończony fragment nieskończoności jest wobec niej niczym...

59Czy to jasne?

Page 112: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 111

Czasem słyszymy, że maszyny z wyrocznią to model interakcyjnego procesu, w którym operator co pewienczas podejmuje decyzje wyznaczające kierunek dalszych (wykonywanych automatycznie) obliczeń.Wątpię. Tak by było, gdyby przy każdym powtórzeniu obliczenia operator podejmował identyczne decyzje.Ale czy to nie przeczy istocie interaktywności?„Jeśli oczekujemy od maszyny bezbłędnego działania, nie możemy żądać, by jednocześnie była inteligent-na” - A. Turing.

W języku Kleene’ego definicja funkcjiD-obliczalnych, czyli odwołujących się do funkcji-wyroczniD : 0, 1n → 0, 1, jest banalnie prosta: wystarczy ową funkcję D dodać do zbioru bazowychfunkcji obliczalnych... Zero mitologii.

Różne wybory funkcji-wyroczniD dają różne klasy funkcjiD-obliczalnych. Nieobliczalność funk-cji D1 jest istotnie głębsza od nieobliczalności funkcji D, gdy każda funkcja D-obliczalna jest teżD1-obliczalna ale nie odwrotnie. Są różne „stopnie nieobliczalności”. Te stopnie tworzą uporządko-waną strukturę, tzw. poset Turinga. Ten poset jest nie tylko nieskończony, ale i nieprzeliczalny.

Tę „hierarchię nieobliczalności” można zdumiewająco elegancko związać z pewną klasyfikacjąformuł arytmetycznych, w prenexowej postaci normalnej.

Najprostsze formuły arytmetyczne to formuły bezkwantyfikatorowe i takie, w których mamyjedynie ograniczoną kwantyfikację60. Tę klasę oznaczamy przez ∆0

0 (lub Σ00 czy też Π0

0).Kolejne klasy Σ0

n i Π0n definiujemy rekurencyjnie:

- jeśli φ ≡ ∃∃ . . . ∃ψ i ψ ∈ Π0n , to φ ∈ Σ0

n+1,- jeśli φ ≡ ∀∀ . . . ∀ψ i ψ ∈ Σ0

n , to φ ∈ Π0n+1.

Związek tej klasyfikacji formuł z maszynami Turinga z wyrocznią opisują dwa twierdzenia:1. formuły arytmetyczne z klasy ∆0

0 opisują podzbiory rekurencyjne,2. Niech, jak poprzednio, λcφ : Nk → N oznacza (częściową) funkcje charakterystyczną zbioru

desygnatów formuły φ(x1, . . . , xk).Formuła φ ∈ Σ0

n+1 dokładnie wtedy, gdy istnieje formuła ψ ∈ Π0n taka, że funkcja λcφ jest obliczalna

przez maszynę Turinga korzystającą z funkcji charakterystycznej λψ jako wyroczni.Podobnie można charakteryzować formuły z klasy Π0

n+1.

W szczególności:- formuły arytmetyczne z klasy Σ0

1 opisują podzbiory rekurencyjnie przeliczalne61,- formuły z klasy Π0

n opisują własności z częściowo rozstrzygalną negatywną weryfikacją62.

W ten sposób sformalizowaliśmy (przynajmniej w odniesieniu do formuł arytmetycznych) naszewcześniejsze stwierdzenie „kwantyfikatory to diabelski wynalazek”. Irracjonalna niechęć studentówdo kwantyfikatorów znalazła racjonalne usprawiedliwienie...

Nasza dyskusja o twierdzeniu Cantora (o nieprzeliczalności rodziny podzbiorów liczb naturalnych) suge-rowała, że to nazbyt liberalna teoriomnogościowa definicja podzbioru pozbawia nas możliwości ich opisu.Mogło się zdawać, że ograniczenie tego pojęcia do zbiorów opisywalnych w języku arytmetyki to rozsądnyi bezpieczny pomysł.A jednak ... . Język arytmetyki okazał się zbyt bogaty: własności opisywalne w języku arytmetyki są nietylko nierozstrzygalne ale wypełniają „nieskończoną skalę różnych rodzajów nierozstrzygalności”.

60Uwaga techniczna: już wiemy, że każda formuła jest równoważna formule w preneksowej postaci normalnej - takiej,w której kwantyfikatory są zgrupowane na początku - Qx1 . . . Qxs ψ, gdzie formuła ψ jest bezkwantyfikatorową.Teraz jednak dopuszczamy, że w ψ są kwantyfikatory ograniczone. Ograniczona kwantyfikacja to formuły kształtu∀x¬t φ, ∃x¬t φ , gdzie φ jest bezkwantyfikatorowa a t to term w którym nie ma zmiennej x. Te napisy to skróty:∀x¬t φ ≡ ∀x (x ¬ t → phi , ∃x¬t φ ≡ ∀x x ¬ t ∧ φ. Np. formuła ∃x<n∃y<n xy = n ∧ (x 6= 1) ∧ (y 6= 1) to formułaopisująca liczby złożone.

61Możemy to samo powiedzieć tak: „zbiór A ⊆ Nn jest rekurencyjnie przeliczalny dokładnie wtedy, gdy istniejezbiór rekurencyjny B ⊆ Nn+k taki, że: (a1, . . . , an) ∈ A dokładnie wtedy, gdy istnieją liczby (b1, . . . , bk) takie, że(a1, . . . , an, b1, . . . bk) ∈ B”.

62Domyśl się, co to znaczy.

Page 113: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 112

Teraz widzimy, jak naiwne było przekonanie E. Zermelo, że można pogodzić postulat rozstrzy-galności własności formułowanych w języku matematyki z koncepcją Cantora i logiką Fregego...

7.3.1 Arytmetyki słabsze niż PA

Czy to nie skłania do refleksji, że język arytmetyki jest jednak zbyt obszerny? Czy nie należyrozważy ć słabszych arytmetyk - teorii, w których można dowieść mniej, niż w arytmetyce Peano?Takie próby czyniono ograniczając siłę najbardziej kontrowersyjnego aksjomatu Peano - schematuindukcji. Jeśli całkowicie odrzucić ten aksjomat a w zamian dodać taki:

∀x ¬(x = 0)→ (∃y x = succ(y))

to otrzymamy arytmetykę Robinsona. Ona formalizuje to, co wypracowano przez wieki używającliczb naturalnych do kolejkowania i zliczania, zanim zaczęto myśleć o uniwersalnych własnościachstruktury liczb naturalnych.Ta arytmetyka jest słaba63. Np. nie można w niej dowieść przemienności dodawania, chociaż -uwaga! - można w niej dowieść, że 2 + 3 = 3 + 2 64

Skoro artytmetyka Robinsona jest słabsza od PA to nie jest pełna. I, co ciekawsze, nawet ona nieda się rozszerzyć do pełnej aksjomatycznej teorii65.

Inne arytmetyki słabsze od PA pozwalają na ograniczone korzystanie z indukcji. Definiujemyje odwołując się do przedstawionej wyżej klasyfikacji formuł arytmetycznych:

arytmetyka IΣ0n (IΠ0

n) to arytmetyka Robinsona + aksjomat indukcji ograniczony do formuł zklasy IΣ0

n (IΠ0n).

Np. w arytmetyce I∆00 można korzystać ze schematu indukcji jedynie dla formuł bezkwantyfikato-

rowych lub z kwantyfikatorami ograniczonymi.

Co ciekawe, ta hierarchia koresponduje z dwoma innymi, opartymi również na ograniczonym sto-sowaniu innych schematów dowodzenia (które są też dopuszczalne w PA).Pierwszy to zasada minimum: „wśród liczb posiadających własność opisaną przez formułę φ(x)istnieje liczba najmniejsza (jeśli tylko choćby jedna liczba ma tę własność)”.

∃x φ(x) → ∃y (φ(y) ∧ ¬(∃z z < y ∧ φ(z))

Drugi to „schemat podstawiania” który jest też oczywisty, ale nie potrafię go zręcznie wysłowić:

∀x<t ∃y φ(x, y)→ ∃z ∀x<t∃y<z φ(x, y)

Dla dowolnej klasy formuł K ∈ Σ0n,Π

0n : n ∈ N oznaczmy przez LK i BK rozszerzenia

teorii I∆0 odpowiednio o zasadę minimum lub schemat podstawiania, ograniczone do formuł zklasy K. W [17] można znaleźć diagram opisujący zależności między tak definiowanymi słabymiarytmetykami:

63Ale jednak silniejsza do arytmetyki równościowej którą opisaliśmy wcześniej.64Jeśli do N dodamy dwa elementy a, b i przyjmiemy, że succ(a) = a, succ(b) = b oraz zdefiniujemy dodawanie i

mnożenie tak:

+ n a b

m m+ n b aa a b ab b b a

· 0 n(> 0) a b

0 0 a bm(> 0) 0 m · n a b

a 0 b b bb 0 a a a

to otrzymamy model arytmetyki Robinsona, w którym zdania ∀x ¬(x = succ(x)), ∀x,y x+ y = y + x, ∀x 0 + x =0, ∀x 0 · x = 0 są fałszywe. To znaczy, że prawdziwości tych zdań nie można dowieść bez aksjomatu indukcji.

65Z uwagi na swą prostotę arytmetyka Robinsona traktowana jest jako „wzorzec” teorii, której nie można rozszerzyćdo aksjomatycznej pełnej teorii.

Page 114: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 113

IΣ0n+1

BΣ0

n+1

oo // BΠ0n

IΣ0noo // IΠ0

noo // LΣ0

noo // LΠ0

n

(T → S) oznacza, że aksjomaty S są dowodliwe w T - teoria S jest słabsza niż T 66

Powtórzmy pytanie: czy należy korzystać z kwantyfikacji bez żadnych ograniczeń? Zwolennicyhilbertowskiej wizji matematyki chcą pełnej arytmetyki, a wszelkie kłopoty stąd wynikające sądla nich „istotą matematycznego poznania”. Drugą skrajność reprezentują finityści, którzy (niecoupraszczając) chcą samoograniczenia do klasy Π0

1.W kontekście tych dyskusji warto też przytoczyć hipotezę Friedmanna67(cytuję za wikipedią):

„Every theorem published in the Annals of Mathematics whose statement involves only finitarymathematical objects (i.e., what logicians call an arithmetical statement) can be proved in EFA68.

EFA - „Exponential (or elementary) Function Arithmetic” - to arytmetyka Robinsona wzboga-cona o rekurencyjną definicję potęgowania:

x0 = 1 ,xsucc(n) = xn · x

oraz o aksjomat indukcji ograniczony do formuł z klasy ∆00.

Jest jeszcze teoria PRA - Primitive Recursive Arithmetic?69. Jest to teoria bezkwantyfikato-rowa co oznacza, że aksjomaty PA piszemy bez kwantyfikatora uniwersalnego, a schemat indukcjizapisujemy tak: dla dowolnej formuły bezkwantyfikatorowej φ(x):

(φ(x)[x := 0] ∧ (φ(x)→ φ(x)[x := succ(x)]))→ φ(y)70

Ponadto dla każdej funkcji prymitywnie rekurencyjnej dodajemy - jako aksjomaty PRA - defi-niującą ją parę równań rekurencyjnych.

Teoria PRA jest uznawana przez wielu (konstruktywistów) za formalny odpowiednik hilbertowskiej ma-tematyki „real statements”.

Czy nie powinniśmy zatem uznać postulaty konstruktywistów i ograniczyć matematykę doPRA? Nie sądzę. Brak procedury rozstrzygającej (sprawdzającej) o spełnianiu danej własnościnie oznacza, że zawsze, w każdym pojedynczym przypadku poszukiwania odpowiedzi na pytanie:„czy dana liczba (układ liczb) ma daną własność arytmetyczną?” skazani jesteśmy na porażkę. Byćmoże niektórzy spośród nas właśnie w rozwiązywaniu takich „punktowych” (lokalnych) problemówupatrywać będą sensu matematyki.

Co robić?71 Nic. Wystarczy być świadomym różnorodności matematyki.

66Zależności te zostały pokazane przez Parsonsa, Parisa i Kirby’ego ([17]). Wydały mi się na tyle ciekawe, żepostanowiłem je tu przedstawić.

67Harvey Friedmann (1948 - ) , logik amerykański, zapoczątkował tzw. matematykę odwrotną. Sens „odwrócenia”polega na tym, że zamiast pytać o konsekwencje ustalenego zbioru założeń (aksjomatów) pytamy, co jest niezbędnedo udowodnienia takiego czy innego twierdzenia.

68Annals of Mathematics to jedno z najbardziej prestiżowych czasopism matematycznych. Cytowane twierdzenienie musi być w tej chwili w płni zrozumiałe. Spróbujemy je nieco rozjaśnić w następnych rozdziałach.

69Inaczej: arytmetyka Skolema.70Więcej informacji o PRA można znaleźć w [94]71W.I.Lenin.

Page 115: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 114

7.3.2 Krok w bok: rekurencja, iteracja i... matematyka eksperymentalna

Rekurencja czy iteracja? Ciąg iteracyjny elementów zbioru A wyznaczony przez element a ∈ A ifunkcję-generator h : A → A to funkcja φ(a,h) : N → A taka, że φ(a,h)(m) = hm(a). Mówiąc odefinicji Kleene’ego pokazaliśmy, jak funkcję definiowaną rekurencyjnie obliczać iteracyjnie. Jestteż jasne, że każdy ciąg iteracyjny można opisać rekurencyjnie72.Dla pracującego matematyka rozstrzygnięcie dylematu „iteracja czy rekurencja” to tylko kwestiasmaku - wyboru sposobu opisu. Ale gdy zaczniemy mówić o implementacji - czyli o algorytmachrekurencyjnych i iteracyjnych - to te pojęcia nie są już tak równoważne. Ale zostawmy te dylematy.

Iteracja(„iteratio”) to powtarzanie - wielokrotne użycie funkcji-generatora. Matematyków odczasów Zenona z Elei interesowało, co się stanie, gdy daną iteracyjną konstrukcję powtarzać bę-dziemy „nieskończenie wiele razy”73. I choć współczesna analiza matematyczna dostarcza wielunarzędzi badania zbieżności ciągów i szeregów, to jednak wciąż jest to pole na którym możemywykazać się matematyczną wyobraźnią74.

Na przykład zbiór Cantora powstaje tak: domknięty odcinek [0, 1] dzielimy na trzy części -[0, 1

3 ], (13 ,

23), [1

3 , 1] - i wyrzucamy środkowy, otwarty odcinek. Powtarzamy tę procedurę w stosunkudo dwóch pozostałych odcinków. I tak dalej... Czy potrafimy wyobrazić sobie ostateczny efektnieskończonej realizacji tej rekurencyjnej procedury? 75

Konstrukcje iteracyjne ilustruje się zazwyczaj przedstawiając jej kilka (kilkanaście) pierwszychkroków. Resztę, chcąc nie chcąc, pozostawia się owej matematycznej wyobraźni76. Ten szczególnyrodzaj wyobraźni to dumny (i trochę arogancki) wyróżnik klanu matematyków77. Najpierw rzecz(obiekt matematyczny) sobie wyobrażamy, a dopiero potem formalnie opisujemy. Niejawnie zakła-damy, że powtarzalność kroków konstrukcyjnych objawia się jako pewna regularność budowanegow ten sposób obiektu. Wierzymy, że analiza kilku, kilkudziesięciu - „wystarczająco wielu” - pierw-szych kroków ujawni wszelkie subtelności i pozwoli wyobrazić sobie graniczny rezultat tego procesu.Jeśli nie, to jest to nasza wina, bo „zabrakło nam wyobraźni”.

Czyżby? Pojawienie się komputerów kazały zwątpić i w ten „psychologiczny” paradygmat mate-matycznego poznania.

W latach siedemdziesiątych XX wieku za sprawą Beniot Maldenbrota w matematyce pojawiłysię fraktale. Najprościej: są to podzbiory płaszczyzny otrzymywane jako graniczne rezultaty nie-skończonych procesów iteracyjnych.

72Jeśli tylko zgodzimy się na użycie schematu rekursji do opisu funkcji typu Nk → A a nie, jak w definicjiKleene’ego, tylko dla funkcji typu Nk → N . Spróbuj, to łatwe.

73Nie tylko matematyków: Hasło „zbieżność” w polskiej wikipedii zaczyna się od zdania: „Zbieżność, przez wieleiteracji, oznacza proces zmierzania do określonej wartości, w czasie; lub zmierzania do określonego punktu, lubwspólnego punktu widzenia, opinii lub sytuacji.”

74Jeden z najstarszych wyników dotyczących zbieżności szeregów to wynik Nicole Oresme który pokazał, że sumującodpowiednio wiele początkowych wyrazów ciągu ( 1

n: n ∈ N) możemy otrzymać liczbę większą od dowolnej, zadanej

z góry liczby (naukowo: szereg harmoniczny 1 + 12 + 1

3 + 14 + · · · jest rozbieżny). Jego pomysł był genialnie prosty -

Oresme wyobraził sobie cały ciąg i pogrupował jego wyrazy tak:

1 +12

+(1

3+

14

)+(1

5+

16

+17

+18

)+ · · · > 1 +

12

+(1

4+

14

)+(1

8+

18

+18

+18

)+ . . .

Działo się to chwilę po bitwie pod Płowcami.75Czyli wielkość graniczną, do której przybliżają nas kolejne kroki iteracyjnej konstrukcji. Pomóc można sobie na

dwa sposoby: punkty tego zbioru to liczby, które w rozwinięciu trójkowym nie mają jedynek. Inny sposób to odwołaniesię do charakteryzacji topologicznej: ten zbiór to jedyna przestrzeń topologiczna, która jest zwarta, metryzowalna,zerowymiarowa i doskonała... Żartuję? Trochę.Podobną konstrukcją jest dywan Sierpińskiego. Z tą różnicą, że rzecz dzieje się nie na prostej, ale na płaszczyźnie.Punktem wyjścia jest kwadrat [0, 1] × [0, 1] który dzielmy na dziewięć (3x3) mniejszych i równych kwadratów iusuwamy (otwarty) środkowy. A potem stosujemy tę samą procedurę do każdego z ośmiu mniejszych kwadratów(http://pl.wikipedia.org/wiki/Dywan Sierpińskiego).

76„Zdaje mi się, że widzę... gdzie? Przed oczyma duszy mojej” - W. Szekspir, Hamlet.77Hilbert poinformowany, że jeden z jego studentów porzucił matematykę na rzecz poezji powiedział: „To dobrze.

Miał zbyt mało wyobraźni jak na matematyka.”.

Page 116: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 115

Fraktal zwany dziś zbiorem Maldenbrota - opisujemy tak: dla dowolnej liczby zespolonej z tworzy-my iteracyjny ciąg M(z) = (z0 = z, z1 = z2

0 + z, . . . , zn+1 = z2n + z, . . .)78 Taki ciąg może zbiegać

do pewnego punktu płaszczyzny lub uciekać w nieskończoność - może być rozbieżny. To zależy odwyboru początkowej liczby (punktu) z. Zbiór Maldenbrota tworzą te liczby, dla których opisanyciąg jest zbieżny.

Udowodniono, że ciąg M(z) jest rozbieżny, gdy jakikolwiek punkt tego ciągu znajdzie się pozakołem o środku w początku układu współrzędnych i promieniu 2.Jakikolwiek... tylko który? Wiemy już tyle, by zgodzić się, że to kryterium jest podstawą dla stwo-rzenia procedury sprawdzającej czy liczba-punkt nie należy do zbioru Maldenbrota.W tamtym czasie komputery były już na tyle sprawne, by Maldenbrot mógł zrealizować taki otoeksperyment. Dla wybieranych kolejno (losowo) liczb-punktów79 z generujemy podciągi początkoweciągów M(z) określonej długości. Jeżeli taki podciąg M(z) wykroczy poza koło o promieniu 2, tooznacza, że punkt z nie jest w zbiorze Maldenbrota. Zaznaczając te punkty-liczby czarnym pikselemna białej płaszczyźnie uzyskujemy przybliżony obraz zbioru Maldenbrota. Sam zbiór Maldenbrotajest wielkością graniczną dla tak konstruowanych zbiorów80.Sens takiej aproksymacji ujawni się dopiero wtedy, gdy testowi zbieżności ciągów M(z) poddamywystarczająco liczny zbiór punktów, a testowane podciągi będą odpowiednio długie. Ręczne prze-prowadzenie testów dla np. losowo wybranych 50 punktów i podciągów długości 50 (co za robota...)powie nam niewiele (nic) o wyglądzie zbioru Maldenbrota. Na ich podstawie nie zbudujemy wy-obrażenia tego zbioru.Ale od czego są komputery? One mogą cierpliwie i szybko realizować tę procedurę dla tysięcypunktów i podciągów niewspółmiernie dłuższych. W internecie można znaleźć liczne galerie frak-tali (ich przybliżeń). Są to grafiki o niepokojącej urodzie81. To rodzaj twórczości plastycznej, którąw pełni może odczytać jedynie matematyk. Bo tylko matematyk kojarzy te grafiki z procesamirekurencyjnymi i zaduma się nad fenomenem tej „granicznej” konstrukcji...

Są też inne, mniej znane, związane z rekurencją i iteracją eksperymenty S. Wolframa, któreopisał w książce „New Kind of Science” - [133]. Najprostsze z nich dotyczą automatatów ko-mórkowych. Taki automat to - w najprostszej wersji- urządzenie, zdolne w rekurencyjny sposóbprzekształcać informację zapisaną w postaci binarnego słowa na nieskończonej w obu kierunkachtaśmie. W każdym kroku rekurencyjnym zmianie ulegają wszystkie pola taśmy. Reguły opisującezmianę wartości dowolnego pola taśmy są lokalne; nowa wartość pola o adresie a82 zależy od ak-tualnej zawartości pól o adresach (a− 1, a, a+ 1). Zatem działanie takiego automatu da się opisaćjako funkcja f : 0, 13 → 0, 1. Stąd wynika, że mamy tylko 28 = 256 różnych automatów ko-mórkowych. Zabawka... Ale Wolfram - być może inspirowany fraktalami - sprawdził - za pomocąkomputera! - co otrzymamy, gdy wyniki pracy automatu komórkowego przedstawimy graficznie napłaszczyźnie. Linie (wiersze) tej płaszczyzny to biało-czarne ciągi odpowiadający kolejnym stanomtaśmy, na której pracuje taki automat83.Łatwo się domyślić, że ciekawy obraz otrzymamy dopiero wtedy, gdy narysujemy nie 5 czy 10 liniia np. 1000 czy 10000. Komputer to potrafi. W ten sposób powstało 256 obrazów. Część z nich jestdość banalna, ale część naprawdę fascynująca. Np. obraz generowany przez automat komórkowyo numerze 30 to trójkąt (wypełniony czarnymi i białymi punktami) którego lewa strona jest wpewnym sensie regularna a prawa wydaje się być absolutnym chaosem... Dlaczego?

Jednak wartość prac Wolframa nie tylko w prezentacji tych komputerowych eksperymentów. W

78Mówimy tu o liczbach zespolonych ale w gruncie rzeczy chodzi tu o punkty płaszczyzny. Użycie liczb zespolonychdaje jedynie możliwość prostego (czyli matematycznego) opisu tej konstrukcji.

79Z okręgu o środku w (0, 0) i promieniu 2.80Tak powie konstruktywista dla którego zbiór Maldenbrota to tylko idea, gaussowska wielkość graniczna. Ale już

np. Penrose w [85] nie ma żadnych wątpliwości i pisze: zbiór Mandelbrota nie został wymyślony, lecz odkryty. Takjak Mount Everest, zbiór Maldenbrota po prostu istnieje!” Oj, chyba jednak nie tak „po prostu”... A porównanie zMount Everest kiepskie.

81Dodajmy, że łatwo wprowadzić do reprezentacji graficznej kolor.82Możemy przyjąć, że pola tej taśmy mają przyporządkowane adresy - liczby całkowite83http://mathworld.wolfram.com/CellularAutomaton.html

Page 117: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 116

rozdziale „The need for a New Intuition” Wolfram napisał: „ The pictures (...) show that it takesonly simple rules to produce highly complex behaviour. Yet at first this mayseem almost impossibleto belive. For it goes against some of our most basic intuition about the way things normally work.”A tam, gdzie zawodzi intuicja potrzebny jest ... eksperyment. 84

Matematyka XXI wieku nauką (w części) eksperymentalną?

7.4 Obliczanie to przepisywanie85

Preludium: redukcyjne obliczenia arytmetyczne

„Liczby naturalne służą do zliczania i kolejkowania”. Do stworzenia tego uniwersalnego systemu nazwwystarcza zero i operacja następnika. Jednak człowiek chciał zliczać sprawniej i szybciej - zaczął dodawaći mnożyć. To oznaczało konieczność zapisywania sum i iloczynów liczb. Tak pojawiły się nowe nazwy -wyrażenia (termy) arytmetyczne.Język nazw został rozszerzony. Jego jądro - liczby naturalne reprezentowane przez numerały- zostały oto-czone przez wyrażenia arytmetyczne. Tej rozbudowie języka nie towarzyszyło jednak rozszerzenie zbioruznaczeń. Siłą rzeczy pewne nazwy muszą znaczyć „to samo”. Dwa wyrażenia arytmetyczne zaczęliśmynazywać równoważnymi gdy mają tę samą wartość, „znaczą to samo”. Np. wyrażenia 4+12 oraz 2 ·(3+5)są równoważne. A oba są synonimami nazwy-numerału 16.To wszystko już powiedzieliśmy86. Ale czy powiedzieliśmy wszystko?

Wyjaśnienie terminu „synonim” w polskiej wikipedii zaczyna się tak: synonim to „wyraz lubdłuższe określenie równoważne znaczeniowo innemu, lub na tyle zbliżone, że można nim zastąpićto drugie”. Na przykład w języku polskim frazy-wyrażenia „siedziba UMK”, „miejsce urodzinKopernika”, „Toruń” uznamy za równoważne, gdyż identyfikują to samo miasto.

Matematyk czytający to wikipediowe wyjaśnienie prawdopodobnie poprzestanie na pierwszymzdaniu. Uzna, że matematycznym odpowiednikiem synonimu jest dobrze mu znane pojęcie równo-ważność wyrażeń. A może nawet wspomni o logice równościowej bo przecież wie, że istnieją formalnesystemy pozwalające dowodzić równoważności wyrażeń arytmetycznych87.

Ale to samozadowolenie skutecznie zepsuł Stanisław Lem pisząc: „Czy pan zna dowód Peanai Russella na to, że dwa a dwa jest cztery? Zajmuje bitą stronę znaków algebraicznych. Wszyscybawią się, i ja się bawię...”88

Można oczywiście arbitralnie (i nieco arogancko) odmówić nie-matematykowi Lemowi prawawypowiadania się o matematyce. Ale rzecz w tym, że Lem ... ma rację. Spróbujemy to pokazać.

Jeśli przeczytamy do końca objaśnienie terminu „synonim” w wikipedii, to napotkamy takiezdanie: „Synonim nie jest inną nazwą desygnatu, jest wyrazem bliskoznacznym”.Otóż to. Wśród trzech synonimicznych wyrażeń - „siedziba UMK”, „miejsce urodzin Kopernika”,„Toruń” - to ostatnie jest wyróżnione. Dwa pozostałe są równoważne, bo można je zredukować dowspólnej dla nich podstawowej (kanonicznej) nazwy89.

84(Elementarne) automaty komórkowe Wolframa to jedynie najprostsza wersja modelowania różnych scenariuszyrozwoju. Np. jeżeli komórkę umiescimy na płaszczyżnie, to ma ona już nie dwóch ale ośmiu sąsiadów, którzy mogęwpływać na zmiany jej stanu, na jej „życie”. Stanów też może być więcej niż dwa. Zainteresowanym proponujęprzeszukanie internetu pod hasłem ”Conway’s game of life”.

85Ten podrozdział ma charakter pomocniczy: ma nam pomóc zrozumieć następny - o λ-rachunku.86W rozdziale Nieskończoność kontrolowana. Przypomnijmy, że n = succn(0) = succ(succ(. . . (succc︸ ︷︷ ︸

n

(0).

87O równoważności w strukturach rekurencyjnych mówiliśmy w rozdziale „Nieskończoność kontrolowana”.88Stanisław Lem (1921-2006) polski pisarz-futurolog a także filozof. Cytat pochodzi z jego książki „Śledztwo”89Zróbmy test: poprośmy pierwszą grupę ludzi o wskazanie synonimu wyrażenia „siedziba UMK” a drugą, rów-

noliczną, o wskazanie zamiennika wyrażenia ”Toruń”. Założę się, że liczba osób w pierwszej grupie, która wybierze„Toruń” będzie nieporównywalnie większa od liczby osób w drugiej grupie, którzy wybiorą odpowiedź „siedziba

Page 118: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 117

Podobnie wyrażenia 2 · (3 + 1) i 2 · 2 + 4 są równoważne, bo ich wspólną wartością jest numerał 8.

Równoważność wyrażeń arytmetycznych jest wtórna w stosunku do ich sprowadzalności(redukcji) do wspólnego podstawowego wyrażenia.„Rzeczy, które są równe tej samej rzeczy, są wzajemnie równe” - Euklides90.

Tak przygotowaliśmy się do lektury fragmentu wstępu do książki „Proof and Types” Y. Girarda[41]. Przeczytajmy uważnie:

„ There is a standard procedure for multiplication, which yields for the inputs 27 and 37 theresult 999. What can we say about that? A first attempt is to say that we have an equality

27× 37 = 999

This equality makes sense in the mainstream of mathematics by saying that the two sides denotethe same integer (...). This is the denotational aspect, which is undoubtedly correct, but it missesthe essential point:

There is a finite computation process which shows that the denotations are equal. It is anabuse91 (and this is not cheap philosophy - it is a concrete question) to say that 27×37 equals 999,since if the two things we have were the same then we would never feel the need to state theirequality. Concretely we ask a question, 27 × 37, and get an answer, 999. The two expressionshave different senses and we must do something (...) to show that these two senses have the samedenotation.

„Sensem” wyrażenia 27 × 37 jest to, że wskazuje ono na konieczność dokonania obliczenia -znalezienia jego wartości. Możemy wciąż pisać 27 × 37 = 999 pamiętając jednak, że nie jest tozapis symetryczny. To może lepiej pisać 27× 37)→ 999 92 ?

W Prologu - języku programowania logicznego - zadając pytanie „4 is 2+2” otrzymamy odpowiedź truea na pytanie „2+2 is 4” - false...

Redukcję wyrażeń arytmetycznych można opisać formalnie nadspodziewanie prosto: wystar-czy potraktować równania rekurencyjne - równości opisujące dodawanie i mnożenie93 jako regułyobliczeniowe (reguły redukcji). Zapiszemy je dostosowując oznaczenia do ich nowej roli:

x+ 0 x x 0 0x+ succ(y) succ(x+ y) x succ(y) (x y) + x

Reguły tworzą system redukcji (przepisywania) termów (wyrażeń) arytmetycznych 94.Jak je czytać? Np. regułę „x + succ(y) succ(x + y) ” odczytujemy tak: „wyrażenie kształtux + succ(y) można zredukować do wyrażenia succ(x + y)” - bez względu na to, jakie wyrażeniaarytmetyczne wstawimy za zmienne x i y. Np. 3 + succ(succ(2)) succ(3 + succ(2)) .Podobnie interpretujemy pozostałe reguły.

Te reguły wolno użyć w dowolnym kontekście, stosując mechanizm dopasowywania95 Stąd np.succ(3 + succ(2)) succ(succ(3 + 2)), gdyż

- wyróżnione podkreśleniem podwyrażenie można „dopasować” do poprzednika reguły x+succ(y) succ(x+ y) przez podstawienie [x := 3, y := 2],- zastępujac to podwyrażenie na zmodyfikowany przez to samo podstawienie następnik tej reguły- wyrażenie succ(x+ y)[x := 2, y := 3] - otrzymamy wyrażenie succ(succ(2 + 3)).

UMK”. Tak będzie, bo „Toruń” jest podstawowym („normalnym”, „kanonicznym”) wyrażeniem w klasie równoważ-nych mu wyrażeń. To przekonuje, że asymetryczny termin „redukcja” ( wyrażenia-synonimu do nazwy) lepiej opisujetę sytuację niż symetryczna równoważność.

90To „prawo Euklidesa” nazywa się czasem słabą przechodniością.91nadużycie92Odeszliśmy tu od kowencji nakazującej odrózniac liczby naturalne odwyrazeń je reprezentujacych - numerałów.93Patrz: opis systemu dowodzenia równoważności wyrażeń arytmetycznych (str. 195).94ang. term rewriting system.95ang. pattern matching.

Page 119: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 118

I jest tak, jak chciał Lem:

2 + 2 = 2 + succ(1) succ(2 + 1) = succ(2 + succ(0)) succ(succ(2 + 0)) succ(succ(2)) = 4

Nie trzeba „całej bitej strony”, wystarczą dwie linijki...

7.4.1 Systemy redukcji wyrażeń

Trzeba przyznać Lemowi rację: dowodzenie równoważności wyrażeń arytmetycznych jest wtórne wstosunku do obliczalnia ich wartości. Zapominanie o tym komplikuje życie.

Czy tak jest zawsze, czy równoważność wyrażeń dowolnego języka jest wtórna w stosunku doich (odpowiednio definiowanej) wartości?Pytanie warte uwagi. Ale jak rozumieć „wartość wyrażenia” gdy język wyrażeń artymetycznych za-stąpimy wyrażeniami (slowami) dowolnego języka? W zgodzie z poczynionymi sugestiami możemyzaproponować taką quasi definicję: „wartość wyrażenia w to wyrażenie v do którego można zredu-kować (sprowadzić) w i które nie jest dalej redukowalne”. Ale jak rozumieć „redukcję wyrażeń”?

Wprowadźmy formalizm, który pozwoli na jednoczesne rozpatrywanie równoważności i redukcjiwyrażeń. Niech ρ ⊂ A∗ × A∗ będzie dowolnym rozstrzygalnym zbiorem par słów. Zbiór ρ możnatraktować jako zbiór bazowy dla relacji równoważności słów rρ - najmniejszej relacji zawierającej ρ,która jest zwrotna, symetryczna i przechodnia oraz spełnia warunek kongruentności: „dla dowolnychsłów w, v, z ∈ A∗: jeżeli w rρ v to również wz rρ vz”.

Ten sam zbiór ρ może też posłużyć jako zbiór reguł redukcji pewnego systemu redukcji słów.Powiemy, że:96.

- słowo v redukuje się jednokrokowo do słowa w - v → w - gdyi dla pewnych słów z1, z2 ,v = z1az2, w = z1bz2 oraz a ρ b,

- słowo v redukuje się do w - v →∗ w - gdy v = v1 → v2 . . .→ . . .→ vk = w ,97

- słowo v jest nieredukowalne (lub: jest w postaci normalnej), jeżeli nie można wskazać słowaw ∈ A∗ takiego, że v → w.

- słowo w jest wartością słowa v” - w = wartρ(v) - jeżeli v →∗ w i w jest w postaci normalnej98.

Nasze pytanie - „czy równoważność słów jest wtórna w stosunku do równości ich wartości”możemy teraz sformulować tak: czy dla dowolnych słów v, w ∈ A∗

v rρ w wtw wartρ(v) = wartρ(w) ???

Odpowiedź jest ... negatywna. Choćby dlatego, że nie w każdym systemie redukcji wszystkiesłowa mają jednoznacznie wyznaczoną wartość99.Ale aby można było odpowiedzieć pozytywnie, wystarczy, by rozważany system miał dwie własności:

I. Własność diamentu: dla każdej trójki elementów a, b1, b2 takiej, żea →∗ b1 , a→∗ b2 istnieje c ∈ A taki, że b1 →∗ c , b2 →∗ c:

a∗

b1

b2∗

c

96Wprowadzane tu pojęcia to slownik teorii systemów przepisywania termów (ang. term rewriting system ([6]) atakże semi Thue systems.

97W szczególności v →∗ v.98W literaturze mówimy raczej w jest postacia normalną słowa v)99Skonstruuj sam system redukcji w których pewne słowa nie maja wartości lub mają ich wiele. To proste.

Page 120: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 119

Własność diamentu100 gwarantuje, że dowolne słowo ma co najwyżej jedną postać normalną.II. Silnie normalizowalność: nie można w takim systemie realizować nieskończonych obliczeń - niemożna budować nieskończonych ścieżek redukcji v1 → v2 → · · · → vn → · · · .Ta własność gwarantuje, że każde słowo ma conajmniej jedną postać normalną.

Jeśli rozważany system redukcji ma obie te własności, to każde słowo ma wyznaczoną jedno-znacznie wartość i nasze jest tak, jak oczekujemy: „dowolne dwa słowa są równoważne dokladniewtedy gdy mają tę samą wartość (postać normalną)”.

Dowód tego twierdzenia jest prosty jeśli tylko przytomnie zauważymy, że v rρw dokładnie wtedy,gdy istnieje łączący te słowa skończony „zygzak”:

v

v2

(· · · )∗

##∗

w

∗v1 v3 (· · · )

( liczba załamań zygzaka jest dowolna) Gdy nasz system ma własność diamentu, to każdy zygzakłączący dwa dowolne słowa można (prawie) rozprostować:

v∗

v3∗

~~

v5∗

~~

w∗

!!

!!

Czyli v rρw gdy te słowa mają wspólny redukt. Dalej już z górki... .

Twierdzenie piękne, ale wniosek jeszcze piękniejszy:„jeżeli system redukcji (ze zbiorem reguł redukcji ρ ma obie opisane wyżej własności, to problem

równoważności dla relacji rρ jest rozstrzygalny”!

- wystarczy uruchomić procedurę równoległej redukcji obu słów, która - wobec przyjętych założeń- musi zakończyć się wskazaniem ich postaci normalnych. Gdy są one równe, to wyrażenia sąrównoważne. Jeśli nie, to nie... .

Opisany wcześniej system redukcji wyrażeń arytmetycznych ma własność diamentu i jest sil-nie normalizowalny. Wyrażenie arytmetyczne jest w postaci normalnej dokładnie wtedy, gdy jestpostaci succn(0). A to oznacza, że:

problem równoważności wyrażeń arytmetycznych jest rozstrzygalny

Tymczasem opisana wcześniej procedura dowodzenia równoważności jest tylko procedurą sprawdzającą...Zastępując proste obliczanie wartości wyrażenia 2 + 2 skomplikowanym dowodzeniem równoważności2 + 2 = 4 „strzelamy z armaty do wróbla - „take a sledgehammer to crack a nut”Czy kpiąc z „dowodu Peana i Russella, że dwa a dwa jest cztery” Lem to wiedział, czy tylko przeczuwał?101

100Angielska nazwa - „diamond property” - to odwołanie do karcianych skojarzeń - „diamond” to „karo”. A dlaczegotak - wystarczy spojrzeć na rysunek ilustrujący tę definicję. O takich systemach mówi się też, że spełniają warunekChurcha-Rossera.

101Bądźmy sprawiedliwi - krytyka Lema nie jest w pełni trafiona. Arytmetyka, której częścią jest przedstawionysystem dowodzenia równoważności, nie ma zastąpić rachunków. Arytmetyka jest nauką o rachunkach.

Spektakularnego przykładu ukazującego korzyści jakie daje arytmetyka dostarcza anegdota o młodym Gaussie,któremu nauczyciel (zapewne o skrywanych skłonnościach sadystycznych) kazał obliczyć sumę stu pierwszych liczbnaturalnych. Zamiast liczyć, Gauss pomyślał, czy wyrażenie 1 + 2 + . . . + n nie można zastąpić wyrażeniem równo-ważnym i prostszym. Odkrył, że jest to wyrażenie n(n+1)

2 i zamiast tracić czas na ogłupiające rachunki mógł pograćw piłkę...

Page 121: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 120

Bonus: nierozstrzygalność problemu równoważności słów

Własność diamentu i silna normalizowalność gwarantują „lokalną” rozstrzygalność problemu rów-noważności słów, tzn. dla ustalonego systemu (A, ρ). Ale skąd wiemy, że to twierdzenie jest w ogólepotrzebne? Może istnieje uniwersalna procedura rozstrzygająca problem równoważności słów bezwzględu na to, jaki system redukcji rozważamy?Takiej procedury nie ma. Tę negatywną odpowiedź uzasadnimy odwołując się do ... maszyn Turingai nierozstrzygalności problemu stopu.

Z każdą maszyną Turinga T można związać skończony zbiór par słów ρT nad alfabetem 0, 1,⊥, ?∪Q (gdzie Q to skończony zbiór stanów maszyny T ) opisany tak:- dla każdej instrukcji postaci (qi, α)→ (qj , β, Left) do zbioru ρT włączamy parę (qiα, βqj) . Gdyα = ⊥ to dodatkowo włączamy parę (qi?, qi⊥?)dla każdej instrukcji (qi, α)→ (qj , β, Left) dołączamy cztery pary (sqiα, qjsβ) , gdzie s ∈ 0, 1,⊥oraz (?qiα, ?qi⊥β).

Traktując zbiór ρT jako zbiór reguł redukcji otrzymamy system redukcji „symulujący” obliczenierealizowane przez maszynę T : „maszyna T zatrzyma się rozpoczynając pracę ze słowem binarnymv dokładnie wtedy gdy ?q0v?→∗ w1 qk w2 ” gdzie q0 to stan początkowy a qk - końcowy.Darujmy sobie szczegóły102.Wniosek może być tylko jeden: gdyby istniała uniwersalna procedura rozstrzygająca o równoważ-ności słów, to problem stopu byłby również rozstrzygalny”A to, jak wiemy, jest niemożliwe... .

7.5 λ-rachunekThe λ-calculus is a type free theory about func-tions as rules, rather then as graphs [8]

λ-rachunek to uniwersalny system redukcji wypracowany przez A. Churcha103.Tak jak maszyna Turinga jest ockhamowskim opisem dyskretnej interakcji z otoczeniem, tak λ-rachunek jest równie genialnym opisem obliczeniowej aktywności człowieka. Obserwowalnym efek-tem liczenia (obliczania pisemnego) jest przekształcanie napisów zgodnie z przyjętymi a prioriregułami przepisywania. Wydaje się, że takich reguł jest ogromnie wiele i że zależą one od rodzajuobliczenia (czy mnożymy, dodajemy ...). Geniusz Churcha w tym, że skonstruował język i wskazał... pojedynczą(!) regułę redukcji pozwalającą na na realizację dowolnych obliczeń104.

Prezentację λ-rachunku poprzedzimy przypomnieniem mało znanej konwencji notacyjnej zwanejλ-notacją105. Przypuśćmy, że interesuje nas funkcja przyporządkowująca każdej liczbie rzeczywistejjej kwadrat. Pracujący matematycy postąpią wtedy tak:

- najpierw wiążą z badaną funkcją nazwę = f : R −→ R ,- następnie z tą nazwą wiążą opis rozważanej funkcji - f(x) = x2.

Nauczyciel Gaussa uczył rachunków. Miał pecha (szczęście), że na jego lekcji pojawił się genialny matematyk.Obliczanie wartości wyrażeń to rachunki. Wiedza o tym, które wyrażenia są równoważne to arytmetyka.

102Dla zainteresowanych: w dowodzie tego twierdzenia kluczowa jest obserwacja, że

?q0v?→∗ w1 qk w2 dokładnie wtedy, gdy (?q0v?, w1 qk w2) ∈ rρTgdzie rρT jest równoważnością generowaną przez ρT .Dowód implikacji „⇒” jest oczywisty bo relacja rρT jest realizowana za pomocą „zygzaka”. A implikacja odwrotna,wynika z faktu, że obliczenie realizowane przez maszynę Turinga jest deterministyczne: dla dowolnego stanu q i literyα istnieje co najwyżej jedna instrukcja o poprzedniku (q, α). Tym samym redukcja słowa zawierającego jedną literę-stan - o ile istnieje - jest wyznaczona jednoznacznie. Dlatego jedyny możliwy zygzak łączący słowa ?q0v? i w1 qk w2

to „ścieżka redukcji” od pierwszego do drugiego słowa.103Alonzo Church (1903 - 1995) amerykański logik i matematyk. Wymieniając tylko Churcha krzywdzę wielu jego po-

przedników i współpracowników (Frege, Russell, Curry, Schonfinkel, Kleene, Rosser). O historii powstania λ-rachunkumożna przeczytać w artykule J.P.Seldina [101], który jest (był) dostępny w internecie a także w [19].

104Szczegółową prezentację λ-rachunku można znaleźć np. w [6].105W istocie λ-notacja ma swoje źródło właśnie w pracach Churcha.

Page 122: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 121

λ-notacja to konwencja, pozwalająca łączyć wprowdzenie nazwy funkcji z jej opisem. I tak np.rozważaną funkcję oznaczamy w tej konwencji jako λx x2.

Opis działania funkcji zawarty w takiej nazwie jest wykorzystywany przy obliczaniu jej wartościna zadanym argumencie w najprostszy sposób - poprzez odwołanie do prostego przepisywania:

(λx x2)(3) x2[x := 3] 32 → 9

Tyle o λ-notacji. Przejdźmy do λ-rachunku. Church założył, że do budowy uniwersalnego językaobliczeń redukcyjnych wystarczą dwa konstruktory wyrażeń: aplikacja i właśnie λ-abstrakcja.

Język λ-termów ze zbiorem zmiennych X definiujemy (rekurencyjnie) tak:

x ∈ λ-termsx ∈ X M,N ∈ λ-terms

MN ∈ λ-terms(aplikacja)

x ∈ X,M ∈ λ-termsλx.M ∈ λ-terms

(abstrakcja)

Operator abstrakcji wiąże zmienne - zmienna x jest związana w termie λx.M .

W składni λ-rachunku nie ma żadnych mechanizmów kontroli stosowania konstruktora aplikacji. W szcze-gólności - λ-term może być aplikowany sam do siebie.Przypomnij sobie dyskusję o samostosowalności maszyn Turinga...

Jedyną regułą opisywanego systemy redukcji jest tzw. β-redukcja:

(λx.M)N →β M [x := N ] (β − rule)106

Pojedynczy krok obliczenia redukcyjnego λ-termu (β-redukcja) to wykorzystanie tej reguły „wdowolnym kontekście”: np.

x(λx.(λy.yx)(λz.zz))→β x(λy.(yλz.zz))

(podkreślony podterm to redex - podterm, do którego zastosowaliśmy β-redukcję). Obliczenie

redukcyjne to ciąg - skończony lub nie - takich kroków107. Dla przykładu:

(λx.(λy.(λz. (λw.xz))y))ab→β (λy.(λz (λw.az))y)b→β (λz (λw.az))b→β λw.ab

Pięknie... Ale ktoś zniecierpliwiony tymi formalnymi sztuczkami zada proste pytanie: jakie jestznaczenie λ-termów? Co wyraża β-redukcja?

Odpowiedź jest brutalna: nic nie wyraża.

λ-rachunek - w odróżnieniu od hilbertowskich teorii aksjomatycznych - nie był budowany jako opis pewnejklasy teoriomnogościowych „modeli zamierzonych”.(...) „Curry’s use of combinators was connected very closely to his philosophy of mathematics: for him aformal system was not a description of some pre-existing objects(...)” [19]108.Świadomość tej fundamentalnej odmienności jest niezbędna, jeżeli chcemy zrozumieć tę matematykę...

λ-rachunek to uniwersalne środowisko, w którym można realizować dowolne procesy obliczenio-we. Tylko tyle i aż tyle.By to pojąć, popatrzmy jak w tym środowisku odtworzyć działania w dwuelementowej algebrzeBoole’a wartości logicznych. Dwie wartości logiczne - prawdę i fałsz reprezentujemy w λ-rachunkujako pewne (nieredukowalne) λ-termy:

true ≡ λx.(λy.x) false ≡ λx.(λy.y)

106Napis M [x := N ] to λ-term powstały z M przez zastąpienie każdego wolnego wystąpienia zmiennej x termem N107W opisie obliczenia redukcyjnego pominęliśmy α-konwersję - operacje przemianowywania zmiennych związanych

pozwalającą unikać tzw. „konfliktu zmiennych” ([6]).108Haskell Curry (1900-1982) amerykański matematyk, współtwórca λ-rachunku.

Page 123: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 122

Dlaczego tak? Jest to powiązane z rolą, jaką wartości logiczne odgrywają w procesie deklarowania (kon-strukcji opisów) funkcji. Wartości logiczne są wykorzystywane przy „deklarowaniu warunkowym” czyli wdeklaracjach o schemacie if ... then ... else....Jeśli ten schemat „zrealizujemy” jako λ-term WMN :

if W then M else N ≡ WMN

to λ-termy przypisane napisom true i false wypełnią swoją rolę:

if true thenM elseN ≡ λx.(λy.)xMN →∗β Mif false thenM elseN ≡ λx.(λy.)yMN →∗β N

„Nie pytaj o znaczenie. Pytaj o użycie” - L. Wittgenstein109.

Operację negacji zaprogramujemy („zaimplementujemy”) tak:

not ≡ λt.(t false true)„Sens” negacji w tym, że zmienia ona wartości logiczne - true na false i odwrotnie, I tak jest:łatwo pokazać, że β-redukcja λ-termu ukrytego pod skrótem not true doprowadzi do jego postacinormalnej, którą okazuje się być λ-term ... false!

not true →∗β falsePodobnie not false →∗β true110

Podobnie utworzymy λ-termy reprezentujące operacje and, or, implies - tak, że np. andtrue true −→∗β true oraz or true false −→∗β true. W ten sposób zaimplemantujemy - w ję-zyku λ-termów i za pomocą β-redukcji - dwuelementową algebrę Boole’a wartości logicznych [6].Czego chcieć więcej?

Podobnie wykorzystamy λ-rachunek do implementacji działań na liczbach naturalnych. Te liczbysą tu reprezentowane przez numerały Churcha: liczbie n przyporządkowujemy λ-term:

n ≡ λx.λy. x(. . . x(x︸ ︷︷ ︸n

(y) . . .))

Gdy teraz z operacją następnika succ zwiążemy λ-term λnfx.nf(fx) to - jak się domyślamy -proces β-redukcji termu-aplikacji succ 0 doprowadzi do numerału 1.A gdy przyjmiemy + ≡ λmnfx.mf(nfx) to - co stwierdzamy zapewne z ulgą - term-aplikacja+ 2 2 jest redukowalny do numerału 4 ... .Za mnożenie „odpowieda” λ-term λmnfx.m(fn)x111 .

Powtórzmy: nie ma sensu pytanie o „znaczenie” λ-termów. Liczy się to, że potrafimy za ich pomocąliczyć112.

Przejdźmy do puenty. Najpierw definicja:

funkcja (częściowa) f : Nk → N jest λ-definiowalna jeżeli można skonstruować (domknięty)λ-term F taki, że dla dowolnych liczb naturalnych n1, . . . , nk:

Fn1 . . . nk −→∗β f(n1, . . . , nk)

o ile wartość f(n1, . . . , nk) jest określona. W przeciwnym wypadku proces redukcji λ-termu Fn1 . . . nkjest nieskończony113.

Fundamentalne twierdzenie, które pozwala traktować λ-definiowalność jako kolejny, równoważnyopis obliczalności mówi, że:

109Pomyśl o ... fortepianie. Czy sens ma pytanie o jego znaczenie, czy o użycie?110Zgodnie z obietnicą, pomijam szczegółowe opisy tych rachunków.111Inne przykłady: succ ≡ λnfx.f(nfx), potęgowanie exp ≡ λmnfx.mnfx, funkcja k-argumentowa stale równa

zeru Zk ≡ λm1 . . .mk.0112Zwróćmy uwagę na zabawny szczegół: true = λx.(λy.x) = 1... Czyżbyśmy mieli tu do czynienia z fundamental-

nym odkryciem matematycznym?113Nieco dokładniej: λ-term Fn1 . . . nk nie posiada tzw. czołowej postaci normalnej - head normal form([6]) .

Page 124: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 123

Klasa funkcji λ-definiowalnych to dokładnie klasa wszystkich funkcji obliczalnych.

λ-term F odpowiadający funkcji obliczalnej f to jej „program” w języku λ-rachunku. Term Fn1 . . . nkjest wszystkim, czego potrzebujemy by obliczyć wartość f(n1, . . . , nk) korzystając z β-redukcji.λ-rachunek jest językiem programowania114..β-redukcja ma własność diamentu ale nie jest silnie normalizująca - mogą się tu zdarzać

nieskończone obliczenia. Tak, jak w przypadku maszyn Turinga. I chyba nikogo już nie dziwi, żeproblem - „czy λ-term ma postać normalną” - jest nierozstrzygalny.

I jeszcze cytat z [6]. Ważne rzeczy trzeba powtarzać ...

„The lambda calculus is a type free theory about functions as rules, rather then as graphs.”Function as rules” is the old fashioned notion of function and reffers to the process of goingfrom arguments to value (...). The idea usually attributed to Dirichlet, that functions couldalso be considered as graphs (...) was an important mathematica contribution. Nevertheless theλ-calculus regards functions again as a rules in order to stress their computational aspects.”

7.5.1 Glossa: skąd się wziął λ-rachunek?

Około 1928 roku A. Church podjął próbę budowy systemu formalnego z intencją uczynienia zfunkcji pojęcia pierwotnego115. System miał być ockhamowski, ograniczający pierwotne pojęcia dominimum. Stąd w systemie Churcha jest tylko jedna operacja (konstruktor wyrażeń) - aplikacja -i jeden unarny predykat - „`”116.

Te wyrażenia miały opisywać „funkcje”117. Aplikacja - operatora do argumentu - miała byćrealizowana za pomocą metaoperacji „podstawienia wyrażenia w miejsce zmiennej”. Przyjęto, żeaplikacja jest nieograniczona - każde wyrażenie jest aplikowalne do każdego. Nawet do siebie samego.Ale to wymagało wprowadzenia mechanizmu kontroli nad zmiennymi: jeżeli w wyrażeniu M sązmienne x, y, to czy jego aplikacja do N ma być realizowana jako podstawienie za zmienną x czy zazmienną y? λ-abstrakcja to taki mechanizm: wyrażenia λxM(x, y) i λyM(x, y) są różne nie tylkosyntaktycznie ale i funkcjonalnie:

λxM(x, y)N →M [x := N ] λyM(x, y)N →M [y := N ]

Ów wymóg kontroli operacji podstawiania sprowadza do się do warunku kombinatorycznej zu-pełności aplikacji: każdy term M , w którego budowie użyto zmiennej x powinien być równoważnytermowi postaci Mx, gdzie term M nie zawiera już z x jako zmiennej wolnej. Ponieważ λ-abstrakcjawiąże zmienne możemy przyjąć M ≡ λxM . Rzeczywiście:

(λxM)x→M [x := x] ≡M .

System Churcha, aspirujący do roli systemu podstawowego, miał - właśnie z tego powodu! - zawieraćw sobie również „metamatematykę”. Już wyjaśniam. W tym systemie mówi się o równoważności

114Dokładniej: to core language większości (jeśli nie wszystkich) języków programowania funkcyjnego m.in. Haskella.115Prekursorem takiego myślenia był Moses Shonfinkel (1889-1942) - logik rosyjski, twórca pokrewnej logiki kombi-

natorycznej. Shonfinkel chciał poprawić logikę Fregego tak, by wyeliminować z niej to kłopotliwe wiązanie zmiennnychprzez kwantyfikatory. Oto przykład: „normalnie” przemienność działania + opisujemy zdaniem ∀x∀y x + y = y + x.Ale możemy wprowadzić operator („kombinator”), powiedzmy P , taki, że P (+)(x, y) = +(y, x) i używać go do opisuprzemienności zamiast kwantyfikatorów. Można próbować wskazać minimalny zbiór takich operatorów pozwalającyw podobny sposób opisywać to, co w ujęciu klasycznym wymaga angażowania kwantyfikatorów. Schonfinkel wskazałtaki dwuelementowy zbiór K,S. Schonfinkel proved that K and S (...) stated a form of combinatory completenessresult : (...) that from K and S, together with a logical operator equivalent to a universally quantified Sheffer stroke(...) , one can generate all formulas of predicate logic without the use of bound variables ([19]).

116Opis systemu Churcha pochodzi z pracy [24]. Curry sugeruje, że napis ` U można czytać „U is asserted”. A jakto tłumaczyć na polski to Twój problem, Czytelniku...

117W stanfordzkiej internetowej Encyklopedii Filozofii napisano tak (http://plato.stanford.edu/entries/lambda-calculus/): „The notion of function or operation at work in the λ-calculus is an intensional one.” co oznacza, żejest bardziej programem-procesem obliczenia niż (teoriomnogościową) funkcją-relacją między danymi (argumentami)a wynikami realizowaną przez ten program.

Page 125: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 124

λ-termów, M = N . Ten napis to metawyrażenie - to nie jest λ-term. Church chciał „uwewnętrznić”równoważność. Chciał, by w systemie istniał term - stała Eq - taki, że M = N wtw gdy ` EqMN.Podobnie zakładał istnienie termu P ∗ uwewnętrzniającego implikację i regułę modus ponens, coopisywał tak:

(` P ∗UV ∧ ` Ux) →x ` V xPomińmy detale118. Ważne jest to, że jednoczesny wymóg kombinatorycznej zupełności (λ-abstrakcji)i funkcjonalnej zupełności (istnienia P ∗) doprowadził do wewnętrznej sprzeczności systemu - para-doksu odkrytego przez Kleene’ego i Rossera, a zwanego dziś paradoksem Curry’ego.

Z pierwotnego zamysłu Churcha ocalał tylko fragment - λ-rachunek.

7.5.2 Maszyny Turinga a λ-rachunekRzecz jest tylko stanem procesu. Niczym więcej.Widząc rzeczy z osobna nie widzimy niczego.

Obliczenie - zarówno w ujęciu Turinga jak i Churcha - to proces przetwarzania informacji. Cote dwie teorie mają ze sobą wspólnego a czym się różnią?

Maszyny Turinga to realizacja inżynieryjnego podejścia do obliczenia: dla konkretnego zadania bu-dujemy od podstaw odpowiednią maszynę tzn. definiujemy zbiór instrukcji - „program”. Żadenkrok obliczenia - zmiana konfiguracji - nie zostanie wykonany, jeśli w programie nie ma odpowied-niej instrukcji. „For normally, we start from whatever behaviour we want to get then try to designa system will produce it. Yet to do this reliably119 we have to restrict ourselves to systems who-se behaviour we can readily understand and predict (...) - pisał S. Wolfram opisując realizacjęobliczenia w maszynie Turinga [133].

Ale już w następnym zdaniu Wolfram napisał: „But unlike engineering nature operates undernot such constrains”. λ-rachunek jest bliżej owej „natury”. To uniwersalny język z uniwersalnąregułą redukcji, środowisko, w którym mogą dziać się wszelkie procesy obliczeniowe. Realizującobliczenie w λ-rachunku nie troszczymy się o ustanowienie reguł redukcji. Tu jest jedna jedyna idana a priori reguła - β-redukcja. Nasza rola ogranicza się do zadeklarowania λ-termu - programu.

Realizując obliczenie „w stylu Turinga” (budując maszynę) musimy zaprojektować każdy pojedynczy krokobliczenia i sterowanie sekwencją kolejnych kroków. To paradygmat programowania imperatywnego.

Realizując obliczenie w λ-rachunku nie mamy wpływu na przebieg procesu obliczenia120. My go tylkoinicjujemy wskazując wyrażenie-λ-term, którego redukcja będzie realizacją interesujęcego nas obliczenia.Tylko wykorzystujemy środowisko stworzone przez λ-rachunek i β-redukcję. To paradygmat programo-wania deklaratywnego .

W praktyce nikt - poza studentami, którzy są do tego przymuszani - nie rozwiązuje zadańobliczeniowych korzystając z maszyn Turinga czy λ-rachunku. Wystarczy spojrzeć na odrażającykształt λ-termów lub spróbować skonstruować maszynę Turinga realizującą mnożenie liczb natu-ralnych by wybić sobie z głowy takie pomysły. To nie są języki programowania.

Język maszyn Turinga i język λ-termów to języki bazowe („ideowe”) dla dwóch grup językówprogramowania - języków imperatywnych i funkcyjnych. Język bazowy to, w terminologii angiel-skiej, core language. Core to jądro, rdzeń a nawet... dusza121.

Ockhamowska zwięzłość opisu składni języka jest pożądana, gdy prowadzimy podstawowe bada-nia nad „siłą języka”. Przestaje być cnotą, gdy chcemy tego języka używać. Dlatego języka bazowy,

118Odsyłam do [24].119Wiarygodnie120Dokładniej: nie mamy możliwości ustalania strategii redukcji dla każdego obliczenia osobno. W praktyce o wyborze

strategii decydujemy na etapie budowy kompilatora dla języka programowania opartego na λ-rachunku.121Nie należy utozsamiać języka bazowego z językiem „niskiego poziomu”, językiem wewnętrznym. Core language”

to raczej „teoretyczny odpowiednik” rozważanego języka programowania.

Page 126: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 125

ta osnowa, musi być otoczony przez shall language - powłokę, ułatwiającą korzystanie z tego, cooferuje język bazowy. Język powłoki ma być przyjazny, user friendly122.W przypadku języków imperatywnych nowe wyrażenia to najczęściej nazwy makrooperacji: podjednym poleceniem ukrywamy pewną sekwencję instrukcji realizowanych przez maszynę Turinga-Ale program napisany w takim języku wypełnia tę samą funkcję co maszyna Turinga - sterujesekwencyjnym procesem obliczenia.W językach programowania funkcyjnego nieczytelne λ-termy zastępujemy przyjaznymi (czytelny-mi) deklaracjami. Najprostsze deklaracje to nazwy-skróty jak np. słowa true, false, not napisyn czy też fraza „if... then... else... ” których znaczenia - przypisane im λ-termy - opisywa-liśmy. Te nazwy należą do powłoki λ-rachunku. Ale nie tylko. W języku powłoki - np. w Haskellu- można używać deklaracji, których „tłumaczenie” na λ-termy jest czymś więcej niż prostym roz-winięciem skrótów.N. w Haskellu można deklarować funkcje korzystając ze schematu rekursji. Deklaracja mnożenia -funkcji mult wygląda tak:

mult (x,0) = 0mult (x,succ(y)) = mult(x,y) + x

Ta deklaracja jest tłumaczona na takie oto wyrażenie:

mult Y (λmxy. if (y = 0) then 0 else (mx (y − 1)) + x)

gdzie Y to operator punktu stałego - specjalny λ-term, taki, że Y F →∗β F (Y F ) dla dowolnegoλ-termu F 123.

7.5.3 Dodatek: nieco więcej o λ-rachunku

Powiedzieliśmy, że aby zaimplementować w λ-rachunku działanie funkcji obliczalnej f : Nk → Nnależy wskazać λ-term Ff taki, że dla dowolnych liczb naturalnych n1, . . . , nk:

Ffn1 . . . nk −→∗β f(n1, . . . , nk)

dokładnie wtedy, gdy wartość f(n1, . . . , nk) jest określona.

Jednak nic nie jest tu określone jednoznacznie:- β-redukcja nie jest procesem deterministycznym,- numerały - λ-termy reprezentujące liczby naturalne - można definiować na różne sposoby124

- λ-term Ff - „program dla funkcji f” - można skonstruować na wiele sposobów.

Jeśli można coś robić na wiele sposobów, to można to robić lepiej lub gorzej. Aby lepiej implemen-tować funkcje obliczalne trzeba poznać możliwości λ-rachunku.

Proces β-redukcji jest niedeterministyczny bo może się zdarzyć (zdarza się często), że w danymλ-termie można wskazać wiele redeksów - podtermów, do których można zastosować β-redukcję. Np.λ-term λx.((λy.xy)z)w można jednokrokowo zredukować zarówno do (λx. xz)w jak i do (λy.wy)zbo są w nim dwa różne redeksy (wskaż je).Przebieg obliczenia i jego rezultat zależy od strategii wyboru redeksów. Np. strategia lewostronnakaże w każdym kroku redukcji wybierać redeks położony najbardziej na lewo (liczy się położeniepierwszego znaku redeksu). Ta strategia jest normalizująca - zapewnia zakończenie procesu β-redukcji λ-termu odnalezieniem jego postaci normalnej - o ile taka postać istnieje. Dlatego naszepodstawowe twierdzenie o realizowalności obliczeń w λ-rachunku można uzupełnić zdaniem „(...)gdzie redukcja Ffn1 . . . nk −→∗β f(n1, . . . , nk) realizowana jest zgodnie ze strategią lewostronną”..

122W języku angielskim mówi się o „cukrze syntaktycznym”- syntactic sugar. To trochę przypomina sytuację, którąnazwaliśmy trzecim wymiarem języka matematyki - tam i tu chodzi o to, by język praktycznych działań był bardziejprzyjazny dla użytkownika..

123Wyrażenie które przyporządkowaliśmy wyrażeniu mult nie jest ostatecznym rezultatem translacji haskellowejdeklaracji na „czysty” λ-term. Powinniśmy jeszcze zastąpić symbol Y λ-termem λf.(λx.f (x x)) (λx.f (x x)) iwyeliminować inne „nieczyste” części tego napisu.

124Numerały Churcha to tylko jedna z możliwości. Można też np. tak:

Page 127: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 126

Aby przyspieszyć obliczenie można próbować zastosować redukcję równoległą. Np. w termie((λx.xt)N)(λx.xs)M) są dwa rozłączne ,redeksy - ((λx.xt)N) oraz (λx.xs)M) - i możemy je zre-dukować równocześnie (do termów Nt i Ms). To jest strategia parallel outermost.Można też próbować skracać drogę redukcji wyrażenia do jego wartości-postaci normalnej. Wiado-mo, że proces lewostronnej β-redukcji dowolnego λ-termu dzieli się na dwie fazy:

- najpierw, tak długo jak to możliwe, wykorzystujemy tzw. redeks czołowy (head redex),- jeśli ta faza procesu jest skończona - otrzymamy term bez redeksu czołowego125 to rozpoczyna

się drugi etap β-redukcji w którym wykorzystujemy inne redeksy.Redeks czołowy w λ-termie - o ile istnieje - łatwo odnaleźć. Dzięki temu ta pierwsza faza procesuβ-redukcji jest „szybka”. To stwarza pokusę, by inaczej zdefiniować wartość wyrażenia-λ-termu -uznać, że jest nią owa czołowa postać normalna126.Można też ograniczyć język modelowania redukcyjnych procesów obliczeniowych do tzw. λI-termów127.Mimo ograniczenia składni, podstawowe twierdzenie o λ-definiowalności wszystkich funkcji obli-czalnych pozostaje prawdziwe, choć oczywiście wymaga nowej definicji numerałów i odmienneejreprezentacji funkcji obliczalnych [7].

To z konieczności skrótowe (a z winy autora - chaotyczne) naszkicowanie problematyki ba-dawczej związanej z λ-rachunkiem ma jedynie uświadomić, że ... istnieje matematyka poza teoriąmnogości. I to nie jest matematyka peryferyjna. Wręcz przeciwnie, wraz z rozwojem technologiiinformatycznych taka matematyka nabiera coraz większego znaczenia128.

7.6 Hipoteza Churcha i twierdzenie Tennenbauma

Obliczalność można definiować jeszcze inaczej, np. za pomocą algrytmów Markowa129. Ale skądpewność, że tak różnie opisywana obliczalność wyróżnia funkcje, które „rzeczywiście są obliczalne”?

Nie można oczekiwać matematycznego rozstrzygnięcia tej kwestii. Wszak dopiero po przyjęciujednej z proponowanych definicji, obliczalność przestaje być pojęciem intuicyjnym, staje się ter-minem matematycznym. Można tylko pokusić się o dowód, że te różne definicje obliczalności sąrównoważne - wskazują tę samą klasę funkcji. I to zrobiono.Wielość i różnorodność tych równoważnych definicji obliczalności potwierdza, że nasze intuicje zwią-zane z obliczalnością ujmują istotę rzeczy. A skoro próby matematyzacji tego pojęcia dają zawszeten sam rezultat, to możemy zaakceptować słynną hipotezę Churcha:

każda definicja obliczalności respektująca podstawowe, „pozamatematyczne” ustalenia okaże sięrównoważna tym definicjom, które już znamy.

To piękne stwierdzenie wymaga jednak uzupelnienia. Uważny czytelnik zauważył, że definicjaKleene’ego pozwala wyróżnić formalnie klasę funkcji obliczalnych w dowolnym modelu arytmetykiPeano. Wiemy, że takich, istotnie różnych, modeli jest wiele. Czy to oznacza, że jest też wieleróżnych „obliczalności”?Nic z tego. Mówi o tym niezwykłe twierdzenie Tennenbauma [55]:

„istnieje tylko jeden model arytmetyki Peano w którym dodawanie i mnożenie są obliczalne(w sensie Turinga)” .

Ten model to liczby naturalne rozumiane tak, jak chcą tego konstruktywiści - jako rekurencyjniedefiniowany uniwersalny zbiór nazw.

125Tzw. czołową postać normalną - head normal form.126Nawiązuję tu do tzw. leniwej ewaluacji λ-termów [1].127λI-termy tworzą podzbiór zbioru λ-termów, co jest skutkiem ograniczenia stosowania operatora abstrakcji λx.

do termów zawierających wolną zmienną x.128Dodajmy, że tzw. λ-rachunek z typami - zawężenie λ-rachunku poprzez wprowadzenie mechanizmu ograniczają-

cego stosowanie aplikacji i abstrakcji - jest zalążkiem intensywnych badań nad nieklasycznymi logikami. Może jeszczeuda się o tym intrygującym fragmencie nowoczesnej matematyki (informatyki teoretycznej?) opowiedzieć.

129https://www.encyclopediaofmath.org\index.php\ Normal algorithm

Page 128: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 127

To bardzo ważne twierdzenie w kontekście dyskusji o podstawach matematyki. Mówi, że obliczalność niejest pojęciem, które można jednoznacznie opisać w języku arytmetyki czy też w języku teorii mnogości.Ale

Obliczalność jest pojęciem absolutnym- w odróżnieniu od tych pojęć, które są definiowane w teorii mnogości i np. w geometrii.A przecież obliczalność to bez żadnych wątpliwości pojęcie matematyczne...

7.6.1 Obliczalność funkcji rzeczywistych

Jeśli rozumiemy obliczalność tak jak Turing, Kleene i Church, to zgodzimy się, że można mówić oobliczalności funkcji działających na liczbach całkowitych i wymiernych. Ale mówienie o obliczal-ności funkcji rzeczywistych, czyli typu R → R, wydaje się pozbawione sensu - liczb rzeczywistychnie można ponumerować i kodować za pomocą słów130. A numeracja („nazwanie”) argumentów jestwarunkiem sine qua non obliczalności. Z drugiej strony nawet proste kalkulatory potrafią obliczaćsinusy, cosinusy czy pierwiastki kwadratowe. Jak rozumieć taką „obliczalność”?.

Funkcja ze zbioru A do B to - w języku teorii mnogości - podzbiór iloczynu kartezjańskiego A×Bspełniający pewne warunki. Taka definicja funkcji jest, w kontekście rozważań o obliczaności funkcji,w sposób oczywisty nadmiarowa131. Ale to nam nie przeszkadza - my i tak interesujemy się tylkotakimi funkcjami, którymi się interesujemy. Gdy mowa o funkcjach rzeczywistych, przedmiotemzainteresowania są głównie funkcje ciągłe.

Skorygujmy więc nieco nasze pytanie: jak rozumieć obliczalności funkcji ciągłych?Już ustaliliśmy132, że funkcja ciagła jest jednoznacznie wyznaczona przez swoje działanie na liczbachwymiernych. To podpowiada proste rozwiązanie:

„In mathematical analysis, given a continuous function f and a real number x, we cannotcompute f(x) directly. Instead, we can approximate f(x) by computing f(x0) for some ra-tional number f(x0) close enough to x. f(x) can be taken as a result of infinite computations(f(x1), f(x2), ..., f(xk), ...), where the distance between x and xk is less than 1

k .133

Jeżeli termin „funkcja” wiążemy z procedurą obliczania wartości, to mówienie o funkcjach ciągłych zR do R jest pewnym skrótem myślowym, idealizacją. W istocie mówimy o pewnych funkcjach ciągłychokreślonych na liczbach wymiernych i wartościach rzeczywistych134.

Jeśli tak, to możemy zaakceptować taką oto próbę definicji funkcji ciągłej obliczalnej:funkcja ciągła f : R → R jest obliczalna, jeżeli istnieje funkcja obliczalna φf określona na liczbachwymiernych taka, że dla dowolnej liczby rzeczywistej a i dowolnego ciągu wymiernego (an) aprok-symującego a, ciąg φf (an) jest ciągiem przybliżeń f(a).Ale czy to zamyka problem?135

130Bo jest ich nieprzeliczalnie wiele.131Twórcy teorii mnogości dbali o to, by definicje podstawowych pojęć - relacji, funkcji itp. - formułowane w

uniwersalnym (w ich rozumieniu) języku teorii mnogości, obejmowały wszystko, co w zastanej matematyce byłopostrzegane jako relacja czy funkcja: „Althuogh a function is by definition a set of ordered pairs this is not usually aparticular helpful way to think about functions. In set theory, it often is” ([132]). „In set theory” należy czytać: „wbadaniach podstaw matematyki”.

132rozdziale „Przestrzeń - matematycznie”.133„A Logical Framework for Convergent Infinite Computations” ( Wei Li, Shilong Ma, Yuefei Sui, and Ke Xu) -

http://arxiv.org/abs/cs/0105020134Matematyk-topolog powie: zbiór liczb rzeczywistych (z „naturalną” topologią) jest przestrzenią ośrodkową - ma

przeliczalny zbiór gęsty złożony z liczb wymiernych. I dlatego funkcje rzeczywiste ciągłe są wyznaczone jednoznacznieprzez swoje działanie na liczbach wymiernych.

135Nasza propozycja grzeszy naiwnością. Odwołujemy się w niej do dowolnego ciągu liczb wymiernych aproksymu-jącego argument - daną liczbę rzeczywistą a. Taki ciąg - funkcja z N do Q - może być obliczalna lub nie. Jeśli liczbaa nie ma „obliczalnej” aproksymacji, jest nieobliczalna, to trudno mówić o obliczaniu wartości jakiejkolwiek funkcjiw tym punkcie. Tego typu wątpliwości prowadzą do innych, bardziej wyrafinowanych definicji obliczalności funkcjirzeczywistych. Np. takiej: A partial function f : Q → R is upper semicomputable (...) if there exists a computablefunction φ : Q× N→ Q (...) such that for all x ∈ Q: limk→∞ φ(x, k) = f(x) and ∀k ∈ N : φ(x, k + 1) ¬ φ(x, k) [18].

Page 129: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 128

7.6.2 Algorytmy kwantowe - krótko

Czy hipotezę Churcha można podważać? Uzasadnieniem tych wątpliwości jest, dla wielu, pojawie-nie się komputerów i algorytmów kwantowych.W 1982 roku R. Feynman (fizyk, noblista) zauważył, że współczesna technologia komputerowa niejest zdolna do efektywnego symulowania systemów kwantowych. Zasugerował że komputer zbudo-wany w oparciu o mechanikę kwantową byłby zdolny do realizacji takiego zadania. W 1985 rokuDavid Deutsch rozważał teoretyczny model takiego komputera i sugerował, że może on efektywnieobliczać problemy, które nie są obliczalne przez tradycyjny komputer. Pojęciowo możliwe jest, żeprzynajmniej dla pewnych problemów, komputer kwantowy wykracza poza maszyny Turinga. Ideata spotkała się z szerszym zainteresowaniem, gdy w 1994 r. Peter Shor odkrył nowy kwantowyalgorytm faktoryzacji dużych liczb, działający w czasie wielomianowym136.[123].

Algorytm Shora (podobnie jak inne algorytmy kwantowe) jest probabilistyczny: nie możemybyć pewni, że wynik obliczenia jest prawidłowy. Tak więc twierdzenie, że następuje tu zanego-wanie hipotezy Churcha jest nonsensem. Ale - być może - jest to przyczynek do rewizji naszychwyobrażeń o obliczalności. Może trzeba uznać, że normą są algorytmy probablistyczne a algoryt-my deterministyczne są jedynie szczególnym (szczęśliwym) wyjątkiem? To, że nie otrzymujemypewnej odpowiedzi na oznacza, że taki algorytm jest bezużyteczny: można przecież sprawdzić, czyrozwiązanie wskazane przez komputer jest prawidłowe (co jest łatwiejsze niż znalezienie rozwiąza-nia). A jeśli nie, to uruchomić algorytm (probablistycznego) poszukiwania ponownie. Cóż z tego,że powtarzamy czynność, jeżeli ten algorytm jest wystarczająco szybki...

Ale to zupełnie inna bajka...137.

7.7 Liczba Ω Chaitina

Liczba Ω Chaitina to jedno z niewielu pojęć współczesnej matematyki, które może pochwalić sięzainteresowaniem mediów jako „coś” niesłychanie tajemniczego i ważnego, bo wskazującego granicenaszego poznania138.Spróbujmy opowiedzieć o liczbie Ω we właściwej kolejności. Czyli najpierw o faktach.

Język J ⊆ 0, 1∗ jest bezprefiksowy jeżeli żadne właściwe podsłowo początkowe słowa w ∈ J nienależy do J139.

Języki bezprefiksowe wyróżnia twierdzenie, które na pierwszy rzut oka zdaje się jedynie mate-matyczną ciekawostką: „dla dowolnego języka bezprefiksowego L:

(∗)∑w∈L

2−|w| ¬ 1

(gdzie |w| to długość słowa w). Dowód nierówności (∗) jest zaskakująco prosty. Rozważmy, napoczątek, skończony bezprefiksowy język L0 = w1, . . . wn . Niech n = max|wi| : wi ∈ L.Zbudujmy pełne drzewo binarne wysokości n. Gałąź tego drzewa reprezentuje słowo wi, jeżeli wijest podsłowem początkowym słowa utworzonego z etykiet wierzchołków tej gałęzi 140. Każda gałąźreprezentuje co najwyżej jedno słowo języka L0 (bo jest on bezprefiksowy) a każde słowo wi ma

136Chodzi o wskazanie liczb pierwszych, których iloczynem jest dana liczba. Klasyczne algorytmy są powolne cosprawia, że „rozkład na liczby pierwsze” jest powszechnie stosowanym zabezpieczeniem kryptograficznym.

137I wcale nie jestem pewien, czy to co napisałem powyżej jest prawdą...138Patrz np. http://www.wykop.pl/ramka/489991/liczba-omega-metafizyka-matematyki-gregory-chaitina139Podsłowo słowa w jest właściwe, gdy jest istotnie krótsze od w.140Pełne drzewo binarne wysokości n to drzewo, w którym każdy wierzchołek, który nie jest liściem, ma dokładnie

dwa potomki (etykietowane przez 0 i 1) i które ma 2n liści. Etykietą korzenia jest słowo puste. Gałąź ścieżka prowa-dząca od korzenia do pewnego liścia.Przykład. Pełne drzewo binarne wysokości 2 wygląda tak:

Page 130: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 129

dokładnie 2n−|wi| reprezentujących je gałęzi141. Stąd:

n∑i=1

2(n−|wi|) ¬ 2n

Dzieląc obie strony nierówności przez 2n, otrzymamy nierówność Krafta: dla dowolnego skoń-czonego zbioru słów w1 . . . , wn języka bezprefiksowego L:

n∑i=1

12|wi|

¬ 1

142. Nierówność (∗) to prosta konsekwencja tej obserwacji - wszak nieskończony język jest wielkościągraniczną dla swoich coraz to większych, skończonych fragmentów.

Rozważmy szczególny język bezprefiksowy:

PF = 0|w|1w : w ∈ 0, 1∗Łatwo zbudować maszynę Turinga TPF , taką, że TPF (0j1w) = w dla dowolnego słowa 0j1w ∈ PFi która nie kończy pracy, gdy w chwili jej rozpoczęcia na taśmie jest słowo spoza języka PF .Zbudujmy teraz nową maszynę UBP - sekwencyjne złożenie TFP i uniwersalnej maszyny Turinga U- która działa tak: dla danego słowa v najpierw oblicza TPF (v) a gdy to obliczenie jest skończonei daje jako wynik słowo w, to rozpoczyna się obliczenie U(w).Maszyna UBP symuluje pracę maszyny U : dla dowolnego słowa w

U(w) = UBP (0|w|1w)

(proces przekształcania słowa w przez maszynę T jest skończony dokładnie wtedy, gdy procesprzekształcania słowa 0|w|1w przez TPB jest skończony i wtedy wyniki tych procesów są jednakowe).Maszyna UBP może więc symulować pracę dowolnej maszyny Turinga.Możemy wreszcie zdefiniować liczbę Ω Chaitina:

Ω =∑w∈LU

2−|w|

gdzie LU to (bezprefiksowy) język akceptowany przez maszynę UBP .Na mocy udowodnionego twierdzenia Ω ¬ 1.

Tyle o definicji. Pora na interpretację - co mówi liczba Ω? Dla języka skończonego w1, . . . , wnliczba

n∑i=1

12|wi|

=∑ni=1 2(n−|wi|)

2n

opisuje stosunek liczby gałęzi reprezentujących słowa tego skończonego języka do liczby wszystkichgałęzi w pełnym binarnym drzewie o wysokości n (równej 2n).

Podobna „drzewiasta” reprezentacja słów nieskończonego języka LU wymaga użycia pełnegonieskończonego drzewa binarnego. I jesteśmy skłonni uwierzyć Chaitinowi gdy twierdzi, iż liczba

ε

ww0

1

0 1 0 1

. Pierwsza z lewej gałąź reprezentuje zarówno słowo 0 jak i 00. Ale język bezprefiksowy zawiera tylko jedno z nich.141Np. w drzewie binarnym wysokości 2 słowo 0 ma dwie („pierwsze z lewej”) reprezentujące gałęzie.142Dodajmy, że twierdzenie odwrotne jest też prawdziwe: jeżeli 2−n1 + · · · + 2−nk ¬ 1, to istnieje bezprefiksowy

skończony zbiór słów o długościach odpowiednio n1, . . . nk.

Page 131: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 130

Ω opisuje prawdopodobieństwo, że w losowo wybranym ciągu binarnym jego pewne podsłowo po-czątkowe należy do języka akceptowanego przez UBP . Równoważnie: jest to prawdopodobieństwozatrzymania się tej maszyny przy losowo wybranym nieskończonym słowie binarnym143.

To, co w liczbie Ω jest najbardziej fascynujące to fakt udowodniony przez Chaitina:

..liczba Ω jest nieobliczalna (nie jest obliczalna”).

Liczba Π jest rzeczywistą liczbą niewymierną, ale jest obliczalna: można wyznaczyć dowolnie długi odcinekpoczątkowy jej rozwinięcia dziesiętnego (binarnego) korzystając choćby ze wzoru Leibniza:

∞∑n=0

(−1)n

2n+ 1=

11− 1

3+

15− 1

7+

19− · · · = π

4

Nieobliczalność liczby Ω oznacza, że nie ma procedury pozwalającej wyliczyć dowolnie długi odcinekpoczątkowy jej binarnego rozwinięcia144.

Skąd to wiemy? Jak zwykle w takich sytuacjach145 dowodzimy przez sprzeczność - pokażemy,że istnienie takiej procedury rozstrzygało by problem stopu dla uniwersalnej maszyny UBP (co jestoczywiście niemożliwe).

Przyjmijmy, że znamy taką procedurę P . Korzystając z P zbudujemy procedurę rozstrzygającączy maszyna UBP akceptuje dowolne słowo v.Załóżmy, że |v| = n. Korzystając z P generujemy odcinek początkowy binarnego rozwinięcia Ωdługości n : 0.ω1ω2, ω3 . . . ωn. Przygotujmy też licznik L i nadajmy mu początkową wartość 0.Słowa binarne można ustawić w kolejkę: 0, 00, 01, 10, 11, 000, . . .. Korzystając z tego uporządkowaniaustawmy w kolejkę wszystkie pary (w,m) , gdzie w ∈ 0, 1∗,m ∈ N146 . Potem po kolei - dla każdejpary (w,m) - rozstrzygamy, czy maszyna UBP realizując program w, zatrzyma się po m krokach.

Jeżeli tak, to do licznika L dodajemy wartość 2−|w|, a słowo w dodajemy do specjalnego schowka.Jeśli nie, to testujemy kolejną parę.Pracujemy tak długo, aż wartość licznika L stanie się większa od 0.ω1ω2, ω3 . . . ωn (to się musi kiedyśzdarzyć!). Jeśli w tym momencie w schowku jest słowo v to znaczy, że maszyna UBP akceptuje v.Jeśli nie, to mamy pewność, że... nigdy go nie zaakceptuje! Dlaczego? Bo akceptacja słowa długościn musiałaby zmienić jedną z pierwszych n liczb binarnego rozwinięcia liczby Ω. Sprzeczność!

Dla porządku dodajmy: liczb Ω jest (conajmniej) tyle, ile różnych uniwersalnych maszyn Turinga.Liczb nieobliczalnych jest nieprzeliczalnie wiele. Ale liczba Ω jest jedną z nielicznych, które znamy147

Jeśli Ω jest nieobliczalna, to czy jest sens pytać o obliczalność funkcji ciągłej f na takim argumencie?A może liczby rzeczywiste obliczalne to konstruktywna wersja ciała liczb rzeczywistych?148

143Więcej nauki, mniej wiary: zbiór nieskończonych ciągów binarnych 0, 1ω można uczynić przestrzenią mierzalną(probablistyczną), czyli wyróżnić σ-algebrę zbiorów - zdarzeń losowych) wraz z miarą - funkcją przyporządkowującątym zdarzeniom losowym wartości z przedziału [0, 1] (ich prawdopodobieństwa). Ta miara musi spełnić pewne (oczy-wiste) warunki, (zwane aksjomatami Kołmogorova).... Każde skończone słowo w ∈ 0, 1∗ wyznacza w tej przestrzenizdarzenie losowe - zbiór w0, 1ω złożony z tych nieskończonych ciągów, które rozpoczynają się od w . Temu zdarzeniuprzypisujemy miarę 2−|w|. Zainteresowanych szczegółami odsyłam do [18].

144Co jednak nie wyklucza możliwości obliczenia konkretnej ilości liczb początkowych tego rozwinięcia.Oryginalna definicja liczby obliczalnej pochodzi od Turinga: „A real number is computable if its digit sequence canbe produced by some alghoritm or Turing machine. The alghoritm takes an integer n ­ 1 as input and produces then− th digit of the real number’s decimal expansion as output” (wikipedia). Oczywiście można też definiować liczbyobliczalne korzystając z innych opisów obliczalności, np. algorytmów Markowa.

145Gdy teza jest „negtywna”.146Podobnie jak kolejkujemy pary liczb naturalnych - „przekątniowo”.147Taką liczbę powiązaną wprost z nierozstrzygalnością problemu stopu wskazał też Turing. Ale Ω jest „ładniejsza”.148Zachęcające jest to, że obliczalne liczby rzeczywiste tworzą ciało, które ma takie same własności pierwszorzędowe

jak klasyczne cantorowskie ciało liczb rzeczywistych. Zainteresowanym potrafię tylko podpowiedzieć jedno hasłoszczegółowe - Specker sequence i ogólne - constructive analysis - (https:// www.encyclopediaofmath.org/index.php/Constructive analysis).

Page 132: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 131

Więcej o liczbie Ω

Skąd ta fascynacja liczbą Ω? Najprościej byłoby odesłać czytelnika do artykułu G. Chaitina „Thelimits of Reason”149 co zapewne odebranoby jako przyznanie się do porażki. To nie jest odległe odprawdy - nie wiem, czy stać mnie na coś więcej niż powtórzenie tez tego artykułu. Ale spróbuję.Chaitin włączył liczbę Ω do dyskusji o relacji między rzeczywistością (matematyczną) a jej możli-wym opisem. Pyta o relację między „faktem” a opisującym ten fakt „prawem naukowym” przywo-łując klasyczną tezę Leibniza: „a theory has to be simpler then the data it explains, otherwise itdoes not explain anything”. To koresponduje też z kantowskim wezwaniem do szukania istoty nieprzez coraz to dokładniejszy ogląd, ale przez formułowanie idei czystego rozumu.Dla Chaitina miarą prostoty jest ... złożoność Kołmogorova: „Alghoritmic information (...) is defi-ned by asking what size of computer program is necessary to generate the data”... W [21] tłumaczyto tak150: „wyobraźmy sobie obserwatora, który co sekundę rejestruje jeden z dwóch faktów - np.„obiekt emituje światło” lub „obiekt nie emituje światła”. Efekt tej obserwacji może zapisywać wpostaci ciągu binarnego (który (...) jest potencjalnie nieskończony). Naukowiec analizuje ten ciągdoszukując się prawidłowości w jego budowie. Ale co to znaczy? Można się zgodzić, że ciąg jest cha-otyczny151 jeżeli nie ma lepszego sposobu jego wyliczenia niż niż jego wypisanie. Ale to oczywiścienie jest satysfakcjonujące z „naukowego punktu widzenia”. Z drugiej strony, jeśli naukowiec jestw stanie wskazać metodę pozwalającą użyć programu do wygenerowania tego ciągu i ten programjest relatywnie krótszy od niego, to jesteśmy zgodni uznać, że nie jest on „patternless”. Jest dalekoidąca analogia między tym przykładem a tym, jak naukowcy myślą naprawdę. Np. teoria opartao skromną liczbę faktów (aksjomatów) jest lepsza (łatwiej akceptowalna jako prawdziwa) niż ta,która ma ich ogromnie wiele.

„Niekompresowalne” słowo - np. binarne rozwinięcie Ω - jest faktem, niczym więcej. Natomiastliczba Π generowana przez prosty program zawiera mało informacji, ale dlatego - paradoksalnie -jest „prawem naukowym”. Liczba Π staje się obiektem matematyki dzięki temu, że jest nie tylkofaktem, ale jest też opisana jako „prawo naukowe”.

Nieobliczalność liczby Ω oznacza, że znając początkowy odcinek jej rozwinięcia (czyli umiejącrozstrzygać o zatrzymywaniu się dowolnej, ale skończonej liczby programów) nie możemy rozstrzy-gnąć, jak wyglądają wszystkie cyfry tego rozwinięcia - dla dowolnej liczby n istnieją programydłuższe, o których zatrzymywaniu nie można wnioskować na podstawie wiedzy o zatrzymywaniusię programów długości mniejszej niż n. „An infinite number of bits of Ω constitute mathematicalfacts (whether each bit is a 0 or a 1) that cannot be derived from any principles simpler than thestring of bits itself”. I to, zdaniem Chaitina, upoważnia do stwierdzenia, że „Given any finite setof axioms, we have an infinite number of truths that are unprovable in that system. Mathematicstherefore has infinite complexity, whereas any individual theory of everything would have only finitecomplexity and could not capture all the richness of the full world of mathematical truth”.

Przyznam, że nie do końca rozumiem. Jeśli owa „teoria wszystkiego” ma obejmować arytmetykę,to nic w tym stwierdzeniu nowego w stosunku do wyników Godla... O cóż więc chodzi? Czy tylkowskazanie innych niż godlowskie argumentów przeciw istnieniu uniwersalnej teorii?

149Scientific American 294, No. 3 (March 2006), pp. 74-81, dostępny również w internecie (http://www.cs.auckland.ac.nz/ chaitin/sciamer3.html)

150W moim swobodnym tłumaczeniu151W oryginale: „patternless”

Page 133: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 132

7.7.1 Wielki Wybuch i Collapsing

Nad zrębem planety, pośród gwiezdnej nocyszereg alefów w nieskończoność pełzniei nieskończoność unieskończonionazawiera sama w sobie przez siebie zdradzonakłęby, kłęby, kłęby tytanów

i rogate, i rogate widma (...)lecz myśl ta czyja? samo się nie myślitak jak grzmi samo i samo się błyskapunkt się sprężył w ”n” wymiarów przestrzeńi przestrzeń klapła jak przekłuty balon.

S.I. Witkiewicz (Witkacy)

Świat matematyki obliczeń można opisać tak152:

- jego obiektami są zbiory numerowane - pary (A, pA : N → A), gdzie pA jest częściową funkcją„na” - elementy obiektów są ponumerowane, mają swoje nazwy.

Morfizmy, czyli związki między takimi obiektami (A, pA) i (B, pB) opisujemy jako funkcje f : A→B, które można zrealizować korzystając z numeracji elementów jej dziedziny i kodziedziny - możnawskazać funkcję obliczalną φ : N→ N taką, że pB · φ = f · pA 153.

Zbiory liczb całkowitych i wymiernych to zbiory numerowane. Za podstawowymi działaniamina tych liczbach stoją znane wszystkim procedury obliczeniowe. Ale zbiorem numerowanym jestteż np. ciało Q(

√2)154 choć zawiera ono - obok wszystkich liczb wymiernych - nieskończenie wiele

liczb niewymiernych. To pokazuje, że dla procesu obliczenia nie jest ważny „matematyczny sens”napisów które on przetwarza. Liczy się to, że liczby ze zbioru Q(

√2) mają reprezentację pozwa-

lającą je dodawać i mnożyć korzystając z (redukcyjnych) procedur dodawania i mnożenia liczbwymiernych155.

Funkcje obliczalne to silnik świata zbiorów numerowanych - każdemu morfizmowi musi towa-rzyszyć procedura obliczeniowa. Zbiór liczb naturalnych i funkcje obliczalne to „jądro” tego świata.Kategoria zbiorów numerowanych to „powłoka”.

Dzieło Hilberta i Cantora to matematyczny „Wielki Wybuch” - wyjście poza kategorię zbiorów nu-merowanych. Mówiąc obrazowo, obiekt matematyczny „urwał się z uwięzi” - z pary (A, pA : N→ A)pozostał tylko zbiór A. Uwolnienie zbiorów od wymogu nazywania ich elementów i akceptacja „nie-konstruktywnych konstruktorów” nowych zbiorów156 wymusiło uznanie nieskończonej skali nieskoń-czoności. Hilbertowska koncepcja istnienia zaludniła wszechświat matematyczny abstrakcyjnymiobiektami157. Matematycy kreowali coraz to nowe byty przekonani, że nowe teorie lepiej tłumacząproblemy, które ujawniały dawne158. Ta matematyka, ten „raj Cantora”, służy już nie obliczeniom,ale modelowaniu rzeczywistości.Różnicę między modelowaniem a obliczaniem widać wyraźnie, gdy popatrzymy jak traktuje się wobu matematykach funkcję.

- -argumenty wartości

„blackbox”

152W przyszłości zamiast o „świecie” będziemy mówili o kategorii zbiorów numerowanych. Ale teraz jeszcze niewiemy, co to kategoria. Użyte poniżej terminy „obiekt”, „morfizm” należą o słownika tej teorii.

153W literaturze „zbiory numerowane” znane są też pod nazwą modest ω-sets [49] ( „modest” = „skromny”. Pięknanazwa...). Funkcjonuje również inna nazwa - PER - „Partial Equivalence Relations” (pozwalam sobie tu na drobnenieścisłości). Wszystko to są światy (kategorie) rozważane w teorii realizowalności o której coś tu jeszcze powiemy.

154Najmniejsze podciało liczb rzeczywistych zawierające liczby wymierne i√

2. To jest algebraiczne rozszerzenieciała Q. Jego elementy to liczby rzeczywiste postaci a+ b

√2 gdzie a i b to liczby wymierne.

155Zadanie: opisz system redukcji pozwalający na proceduralne obliczanie sum i iloczynów w Q(√

2). Oczywiściejedną z reguł musi być redukcja

√2 ·√

2→ 2.156Mówimy tu np. o teoriomnogościowym aksjomacie istnienia zbioru wszystkich podzbiorów danego zbioru157Ale napisałem... Witkacy zobowiązuje.158S.G.Simpson w [105] dzieli matematyka na „zwykłą” i tę, która swoje istnienie zawdzięcza wyłącznie teorii

mnogości.

Page 134: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 133

Teoria mnogości każe widzieć funkcję jako (specyficzną) relację między argumentami a warto-ściami: proces przyporządkowywania argumentom ich wartości jest - dla matematyka teoriomnogo-ściowego - niewidoczny, ukryty w czarnej skrzynce. Jego uwagę zajmuje badanie zależności - relacji- między argumentami i wartościami funkcji. Chcemy widzieć, czy funkcja rzeczywista jest rosnąca(malejąca), ciągła, różniczkowalna, czy ma miejsca zerowe, czy jest bijekcją, czy ma punkty stałeitp. itd.

To jest matematyka modelowania.

Tymczasem u Turinga i Churcha przedmiotem badań jest proces obliczenia. Funkcja rozumianatak, jak ją definiuje teoria mnogości, jest w obu teoriach pojęciem pomocniczym, wykorzystywanymdo opisu rezultatów procesu. Istotą opisu procesu jest opis zmienności rzeczy. „Stan rzeczy” jestjedynie obrazem chwilowym procesu. Ta sama rzecz może należeć do wielu procesów jednocześnie.To nie rzeczy, to procesy są wieczne. Wskazywanie początku czy końca procesu to zabieg sztuczny,związany li tylko z naszymi próbami ich badania.

Koncentracja uwagi XX-wiecznych matematyków na modelowaniu była po części konieczno-ścią, skutkiem uświadomienia sobie ograniczonych możliwości obliczeniowych człowieka. Dopieropojawienie się komputerów i ich nieprawdopodobnie szybki rozwój159 pozwoliło, więcej, wymusiłorewizję poglądów.„Pozwoliło” bo matematycy dostali narzędzie do prowadzenia obliczeń o złożoności przekraczają-cej najśmielsze wyobrażenia. W wielu, nawet bardzo abstrakcyjnych, badaniach matematycznychpojawił się wątek obliczeniowy. I „eksperymenty obliczeniowe”.„Wymusiło” , gdyż powszechne stało się oczekiwanie, że matematyka wesprze postęp technologicz-ny wiedzą teoretyczną dotyczacą obliczeń. Oczekiwano, że matematycy zajrzą do czarnej skrzynki.Zaryzykuję twierdzenie, że na przełomie XX i XXI wieku obserwujemy w matematyce narodzinytrendu, który można określić jako „matematyczny collapsing”160. Objawia się to ciągle zwiększa-jącym się zainteresowaniem międzynarodowej społeczności matematyków problemami związanymiz procesem obliczania161.

To nie znaczy, że jest jakakolwiek opozycja między liczeniem a modelowaniem. Liczenie musiczemuś służyć. Jest warte trudu gdy „ma sens”. Dostarczycielem sensu jest świat zewnętrzny. Nietylko świat fizyczny ale i ten, który wykreowała matematyka modelując rzeczywistość.

Człowiek potrzebuje komputera by sprawnie liczyć.Komputer potrzebuje kogoś, kto go sensownie użyje.

A to, że te czasem jedna z tych matematycznych aktywności czasem dominuje nad drugą niepowinno dziwić. Ten świat tak ma.

Zamiast puenty: nieco bardziej wyrafinowany Lem

Czy Pan wie, że matematycy do udowodnienia, iż każdy niepusty podzbiór liczb naturalnych maelement najmniejszy, potrzebują wyrafinowanej formy matematycznej indukcji? Pan się bawi i jasię bawię...”. Lem tego nie powiedział. A mógłby. Bo przecież normalny człowiek zaakceptuje (lubsam wymyśli) prościutką procedurę odnajdywania najmniejszego elementu w niepustym zbiorzeA ⊆ N. Tę procedurę można opisać w trzech krokach:1. Przyjmijmy k = 02. Rozstrzygnijmy, czy k ∈ A. Jeśli tak, to k jest poszukiwaną najmniejsza liczba w zbiorze A. Jeśli

159Prawo Moore’a?160Słowo „collapsing” ma wiele znaczeń w większości o pejoratywnym zabarwieniu (krach, upadek, rabunek, zała-

manie, OKLAPNIĘCIE). Tu używam tego terminu w znaczeniu jakie nadali mu fizycy kwantowi i autorzy hipotezdotyczących przyszłości wszechświata - collapsing to odwrócenie procesu Wielkiego Wybuchu - wszechświat zapadasię do stanu o skrajnie wysokiej gęstości.

161Tym zmianom towarzyszy polityka wielu państw i międzynarodowych korporacji, polegająca na finansowymwspieraniu takich badań.

Page 135: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 134

nie przejdź do 3.3. Przyjmijmy k := k + 1 i wróćmy do 2.

Ale ta procedura ma sens tylko dla konstruktywnie rozumianych liczb naturalnych i przy zało-żeniu, że A to rozstrzygalny podzbiór N! Chcąc udowodnić to twierdzenie dla dowolnego podzbioruliczb naturalnych - definiowanych teoriomnogościowo - musimy sięgnąć po inne środki. Tylko ...czy to interesuje kogokolwiek poza matematykami? No bo cóż nam po informacji, że zbiór A maelement najmniejszy, skoro nie potrafimy rozstrzygać, czy dana liczba naturalna do niego należy?

7.8 Złożoność obliczeniowa czyli o pragmatyce języka obliczeń

. Pragmatyzm to, jak głosi Słownik Języka Polskiego, „postawa życiowa polegająca na trzeźwej oce-nie sytuacji i podejmowaniu wyłącznie działań, które zapewniają skuteczność”. Z drugiej strony, jakjuż wspominaliśmy, encyklopedia opisuje pragmatykę jako „jeden z trzech działów semiotyki (oboksemantyki i syntaktyki) (...) Pragmatyka traktuje o relacji między znakiem a odbiorcą (interpreta-torem). Sklejmy to w jedno: pragmatyk, myśląc o języku, jest zainteresowany jego funcjonalnością,pożytkiem wynikającym z jego użycia.O pragmatyce języka matematyki już mówiliśmy i będziemy jeszcze mówić. Teraz spróbujemy po-wiedzieć coś o pragmatyźmie w kontekście badań nad obliczalnością.

Teoria obliczalności mówi czym jest proces obliczenia i oferuje narzędzia jego opisu. Ustanawiafundamentalny podział zadań obliczniowych na rozstrzygalne i nierozstrzygalne162. Informacja, żedany problem jest rozstrzygalny to jednak - z praktycznego (pragmatycznego) punktu widzenia -trochę mało. Cóż nam po procedurze rozstrzygajacej, której realizacja jest niemiłosiernie długa? Otoprzykład: logika zdaniowa jest rozstrzygalna. Ale aby wykazać, że zdanie zbudowane z n prostychzdań jest prawem logiki zdaniowej - jest prawdziwe przy każdym wartościowaniu zdań prostychw nim występujących - należy wykonać 2n testów. Gdy w zdaniu są tylko trzy zdania proste,to wystarczy osiem testów, 8 = 23. Gdy tych zdań jest dwadzieścia, to liczba testów wzrasta do220 czyli nieco więcej niż milion. A liczba niezbędnych testów przy zdaniu zlożonym ze stu zdańprostych - 2100 - jest trudna do wyobrażenia...163

Efektywnością procesów obliczeniowych zajmuje się teoria złożoności164

Jak mierzyć efektywność maszyn Turinga - procesów obliczeniowych? Jak rozumieć „trudność”problemów? Intuicja podpowiada, że czas pracy maszyny Turinga - liczba pojedynczych kroków -jest zależna od wielkości danych - długości słowa zapisanego na taśmie w chwili rozpoczęcia pracy.Dlatego zgodzono się, by złożoność czasową maszyny T opisywać jako funkcję timeTL : N → Ntaką, że dla dowolnej liczby naturalnej n, timeTL(n) to maksymalna liczba kroków pracy jakąwykona maszyna T rozpoczynając pracę z zapisanym na taśmie jakimkolwiek słowem długości n165

Jednak dla pragmatycznie usposobionych robotników informatyki pełna znajomość funkcji timeTwcale nie jest najważniejsza. Oni chcą używać takich funkcji do porównań efektywności różnychmaszyn Turinga, różnych algorytmów.Odpowiedzią na to zapotrzebowanie jest skala złożności obliczeń. Pomysł jest genialnie prosty:ustalmy pewien skończony zasób „wzorcowych” funkcji sm : N→ R : m = 1, 2, . . . , k. Powiemy, że

„maszyna T jest w klasie O(sm) gdy ciąg wartości (timeT (n) : n ∈ N) wraz ze wzrostem nstaje się coraz bliższy ciągowi liczb (c · s(n) : n = 1, 2, . . .) gdzie c to pewna dodatnia stała”166

162Opisuje też pewną hierarchię nierozstrzygalności o czym mówiliśmy przedstawiając maszyny Turinga z wyrocznią.163Gdyby w ciągu sekundy wykonywać milion testów, to realizacja tego algorytmu zajmie 40169423 miliardów

lat! Przyznam - nie sprawdzałem tych rachunków. Napisałem to na podstawie danych zawartych w anonimowymopracowaniu dostępnym w internecie. Jeśli nawet pomyliłem się o 10 miliardów lat - who care about?

164Odtąd, aż do końca podrozdziału rozważamy wyłącznie zawsze zatrzymujace się maszyny Turinga.165Można też opisywać złożoność maszyny Turinga odwołując się do długości taśmy niezbędnej do wykonania

obliczenia. To jest tzw. złożoność pamięciowa. Ale tu mówimy wyłącznie o złożoności czasowej.166n to długość słowa zapisanego na taśmie w chwili rozpoczęcia pracy. Inaczej mówiąc: maszyna T jest w klasieO(sm) gdy ciąg ułamków ( timeT (n)

s(n) : n = 1, 2, . . .) ma skończoną i dodatnią granicę. Tak opisywaną złożoność nazywasię złożonością asymptotyczną.

Page 136: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 135

By taka skala złożoności była użyteczna, musi odwoływać się do powszechnie znanych i dobrzeprzebadanych funkcji. Dlatego osnową skali złożoności są nierówności które zna każdy absolwentszkoły podstawowej:

log2n < . . . < n < . . . < n2 < n3 < . . . < 2n < n! < nn

które są prawdziwe dla prawie wszystkich liczb naturalnych.

Złożoność (czasowa) maszyny Turinga T jest logarytmiczna (odpowiednio: liniowa, wielomia-nowa, wykładnicza, ...) gdy T należy do klasy O(log2n) ,(odpowiednio: O(n), O(nm) dla pewnegom ∈ N , O(2n), . . .).167

Są tu ważne subtelności. Łatwo np. zauważyć (sprawdzić), że nawet tysiąckrotne (milionowe)zwielokrotnienie szybkości działania - zastąpienie maszyny T przez realizującą tę samą funkcję ob-liczalną maszynę T1 i taką, że timeT (n) = 1000 ·timeT1(n) - nie jest istotne dla oceny złożoności - temaszyny są w tej samej klasie złożoności. Podobnie nie jest istotne, czy czas pracy mierzymy liczbąpojdynczych kroków pracy maszyny czy w tysiącach takich kroków168. Dlatego tę definicję złożono-ści można stosować „w skali makro” - do dowolnych procedur: wystarczy zgodzić się, jakie operacjewykonywane w trakcie ich realizacji uznamy za elementarne i mierzyć czas liczbą tych operacji.Np. w algorytmach sortowania list taką operacją elementarną może być porównanie sąsiednich ele-mentów listy169 Dlatego definicja złożoności procedur jest wolna od niepożądanych uwarunkowańzwiązanych z ich implementacją - od tego, czy do rzeczywistego obliczenia realizowanego użyjemyszybszego (droższego) czy też wolniejszego komputera.

Zastąpienie maszyny (procedury) inną, „liczącą to samo”, lecz o mniejszej złożoności uwidocznionej wopisanej tu skali, jest zmianą jakościową - istotnie różną od zmiany wynikającej z zastąpienia komputeraprzez nowy, szybszy komputer. To jest istota zaproponowanej skali złożoności obliczeniowej.Tu ilość nie przechodzi w jakość....

Najmniej złożone - najbardziej efektywne - są maszyny Turinga (procedury) o złożoności lo-garytmicznej czyli należące do klasy O(log2n)170. Procedury, których złożoność jest liniowa czyteż wielomianowa są „użyteczne w praktyce”171. Ale gdy złożoność maszyny jest wykładnicza toefektywność takiej maszyny (procedury) staje się mocno wątpliwa... .

Aby tę wątpliwość uzasadnić potrzebujemy dobrego przykładu.

„W świątyni Benares w Hanoi (...) znajduje się płytka z brązu, na której umocowane są trzydiamentowe igły (...) . Na pierwszą z nich, w chwili stworzenia świata, Bóg nadział - 64 złote krążkiz otworami (...), jeden na drugim, malejąco, od największego do najmniejszego. Odtąd bez przerwy,we dnie i w nocy, kapłani przenoszą krążki z pierwszej igły na trzecią przestrzegając niewzruszonychpraw Brahma. Te prawa są proste: krążki przenosimy pojedynczo nigdy nie pozostawiając ich winnych miejscach niż nadziane na jedna z trzech igieł i nigdy, na żadnej z igieł, nie wolno położyćwiększego krążka na mniejszy. Kapłani skończą pracę, gdy przeniosą krążki na się trzecią igłę 172.

Przeniesienie n+1 krążków wymaga dwukrotnie więcej ruchów niż przeniesienie n krążków orazjednego dodatkowego ruchu173 Stąd łatwo wyliczyć, że przeniesienie n krążków wymaga... 2n − 1

167Wszystkie te definicje nie grzeszą precyzją, ale taką konwencję przyjęlismy w tym tekście... .168Matematycznie: twierdzenie o liniowym przyspieszaniu mówi, że „jeśli język L jest rozpoznawany przez maszynęT o złożoności czasowej timeT to może być rozpoznany przez maszynę Tc o złożoności czasowej opisanej wzoremtimeTc(n) = c · timeT (n) + (1 + c)n, gdzie c > 0”.

169Sortowanie listy polega na ustawieniu jej elementów zgodnie z określonym a priori porządkiem liniowym, np.[1, 3, 7, 2, 4] [1, 2, 3, 4.7].

170Pomijając rzadko spotykane procedury, które bez względu na rozmiar danych wykonują tę samą liczbę operacji.Np. procedura rozstrzygająca czy dana lista liczb zaczyna się od 1 w żaden sposób nie zależy od długości listy.

171Problem przynależności słowa do języka regularnego ma złożoność liniową gdyż, jak pokazaliśmy, urządzeniemakceptującym jest automat skończony który przegląda słowo na taśmie tylko raz, od lewej do prawej. A algorytmErley’a dla języków bezkontekstowych ma złożoność wielomianową

172http://www.math.edu.pl/wieza-hanoi. To legenda. Tak naprawdę tę opowiastkę wymyślił francuski matematykF.Lucas (1883)

173Procedurę przenoszenia można opisać rekurencyjnie tak: aby przenieść n + 1 krążków z I do III należy: 1.

Page 137: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 7. OBLICZALNOŚĆ 136

ruchów - złożoność tej procedury jest wykładnicza.

Kapłani mają do przeniesienia 64 krążki, czyli muszą wykonać 264− 1 przeniesień... - „roughly 585billion years to finish, which is about 42 times the current age of the Universe”. .

Ale umiemy coś więcej niż tylko oceniać złożoność znanych algorytmów. Potrafimy oszacowaćzłożoność pewnych rozstrzygalnych problemów i wskazywać nieprzekraczalne „dolne ograniczenie”złożoności algorytmów rozwiązujących ten problem. Ciekawie robi sie wtedy, gdy pojawia się tzw.luka algorytmiczna - gdy wyznaczone dolne ograniczenie złożoności problemu jest istotnie mniejszeod najlepszego aktualnie znanego algorytmu rozwiązującego ten problem. Tak jest np. w przypadkuproblem minimalnego drzewa rozpinającego w grafie174. Znamy tu algorytmy o złożonosci wielomia-nowej i jednocześnie wiemy, że ograniczenie dolne jest liniowe. Nikt je nie znalazł dotąd algorytmuo takiej złożoności. Istnienie luki jest wyzwaniem: albo zrewidujemy znane dolne ograniczenie alboznajdziemy lepszy algorytm.

Innym wyzwaniem w teorii złożoności jest równość P = NP .Czy w danym skończonym zbiorze liczb całkowitych a1, . . . , an można wskazać taki podzbiór, żesuma jego elementów jest równa zero? Ten problem jest oczywiście rozstrzygalny. Jednak „pesymi-styczna złożonośc” oczywistego algorytmu rozwiązującego ten problem - „sprawdź wszystkie moż-liwe podzbiory” ma złożoność wykładniczą (ze względu na liczbę elementów rozważanego zbioru).Ale czy istnieje algorytm rozwiązujący ten problem w czasie wielomianowym? Tego nie wiadomo.

Wygenerowanie rozwiązania wymaga zastosowania - zgodnie z dzisiejszą wiedzą - algorytmuwykładniczego. Natomiast sprawdzenie czy rozwiązanie pozytywne dostarczone przez taki algorytmjest poprawne jest dużo prostsze - wymaga zastosowania algorytmu o złożoności wielomianowej (anawet liniowej). To oznacza, że nasz problem należy do klasy NP . Ale, jak już powiedzieliśmy, niewiemy, czy nie należy też do klasy P problemów rozstrzygalnych w czasie wielomianowym.Więcej: choć brzmi to nieprawdopodobnie, nie wiadomo czy istnieje jakikolwiek problem należącydo klasy NP , który nie należy do klasy P - nie wiadomo czy prawdziwa jest równość P = NP !

Wskazanie problemu który pozwoli zanegować tę równość (lub udowodnienie, że takowego brak)to jeden z tzw. problemów milenijnych za którego rozwiązanie którego można otrzymać okrągłymilion dolarów. Do pracy, junacy!

przenieść n krążków (leżących na największym, (n + 1)-szym) z igły I do II korzystając z igły III, 2. przenieśćnajwiększy krążek z I na III,3. przenieść n krążków z igły II do III korzystając z igły I .

174Drzewo rozpinające grafu G, to podgraf be cykli który zawiera wszystkie wierzchołki grafu G. Gdy krawędziomgrafu G przypisano długości, to minimalne drzewo rozpinające to te, w którym suma długości krawędzi jest minimalna.

Page 138: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 8

Twierdzenia Godla

Kurt Godel (1906-1978) – genialny austriacki logik i matematyk. W 1931 roku opublikował pracę „Uberformal unentscheidbare Satze der Principia Mathematica und verwandter Systeme. I” w której sformu-łował twierdzenie „o niezupełności arytmetyki”.Godel konsekwentnie przyznawał się do realizmu matematycznego: „Obiekty i fakty matematyczne, lubprzynajmniej coś z nich, istnieją obiektywnie i niezależnie od naszych aktów mentalnych i decyzji (...)przedmioty i twierdzenia matematyki są tak samo obiektywne i niezależne od naszych wolnych wyborówi twórczych działań, jak to ma miejsce w świecie fizycznym.”1

Mniej znany jest fakt, że Godel zajmował się też teorią względności, a jego bliskim przyjacielem w Prin-ceton był Albert Einstein. Jak podaje Wikipedia, Godel po emigracji do USA starał się o obywatelstwoamerykańskie. A to zależało m.in. od wyniku egzaminu ze znajomości konstytucji. Godel, przygotowu-jąc się rzetelnie, odkrył, że jest ona wewnętrznie sprzeczna i miał zamiar to udowodnić przed komisjąegzaminacyjną. Na szczęście jego przyjaciele na to nie pozwolili..

8.0.1 Niezupełność PA - pierwsze twierdzenie Godla

Nasz wcześniejszy dowód twierdzenia Godla przeprowadziliśmy przy założeniu, że formuły aryt-metyczne mogą opisywać zbiory nierozstrzygalne. Teraz pokażemy, że to założenie było słuszne.Udowodnimy twierdzenie:

„Każda funkcja obliczalna f : Nk −→ N jest arytmetyczna”- można wskazać formułę arytmetyczną φf (x1, . . . , xk, xk+1) taką, że dla dowolnych liczb natural-nych m1, . . . ,mk, n:

formuła φf jest spełniona przy wartościowaniu [x1 := m1, . . . xk := mk, xk+1 := n] dokładniewtedy, gdy f(m1, . . . ,mk) = n.

Dla dowolnego procesu obliczeniowego związana z nim relacja „wejście-wyjście” wiążąca dane i wynik jestopisywalna w języku arytmetyki.

Ten wynik ma istotne znaczenie, bo z niego łatwo wynika to, co nas interesuje:

„każdy zbiór rekurencyjnie przeliczalny A ⊆ Nk jest arytmetyczny”

- można wskazać formułę arytmetyczną φA(x1, . . . , xk) taką, że (n1, . . . , nk) ∈ A wtedy, gdy formułaφA(x1, . . . , xk) jest spełniona przy wartościowaniu [x1 := n1, . . . , xk := nk].

Dowód tego twierdzenia jest żmudny i nudny. Ale pewien jego fragment naprawdę warto prze-analizować - zobaczmy, jak sobie poradzono ze schematem rekursji.Niech zatem h : N −→ N będzie funkcją taką, że:

- h(0) = a- h(succ(n)) = g(h(n), n)

1Cytuję za J. Golińską „Matematyka według Godla” - artykuł odnaleziony w internecie

137

Page 139: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 138

gdzie g jest funkcją arytmetyczną. A to oznacza mniej więcej tyle:

(*) h(s) = w wtw, gdy istnieją liczby naturalne k0, k1, . . . , kstakie, że k0 = a, ks = w oraz kj+1 = g(j, kj) dla dowolnego 0 ¬ j < s.

Aby uzyskać oczekiwany rezultat, wystarczy tę równoważność zapisać jako formułę arytmetyczną.Zacznijmy naiwnie:

(h(s) = w) ⇔ ∃k0∃k1 , . . .∃ks k0 = a ∧ (∀j<s kj+1 = g(kj , j)) ∧ ks = w)

Pozornie wszystko jest OK. Ale ten napis to nie jest formuła arytmetyczna - zmienna s nie możeokreślać liczby kwantyfikatorów egzystencjalnych (po prawej stronie równoważności).To można poprawić2. Z pomocą przychodzi nam tu słynna godlowska „beta-funkcja” (która jestarytmetyczna):

β(m,n, j) = (m mod (n(j + 1) + 1))

Ta funkcja koduje skończone ciągi dowolnej długości za pomocą par liczb, pozwalając jednocześnieodtworzyć pierwotny ciąg3.Korzystając z funkcji β równość h(s) = w możemy opisać tak:

(h(s) = w) ⇔ ∃n,k (β(n, k, 0) = a ∧ (∀0¬j<s β(n, k, succ(j)) = g(β(n, k, j), j) ∧ β(n, k, s) = w))

Obecność zmiennej s „pod kwantyfikatorem” jest odtąd tylko skrótem redakcyjnym. Można gorozwinąć uzyskując formułę arytmetyczną w (prawie) krystalicznie czystej postaci... .

„Prawie”, bo w formule po prawej stronie równoważności mamy pozaarytmetyczne symbole funk-cyjne g i β. Ale można je zastąpić formułami arytmetycznymi - założyliśmy to o g i jest to oczywistedla β. Teraz wystarczy przywołać tradycje benedyktyńskie i cierpliwie przepisać powyższą charak-teryzację równości h(s) = w w „czystym” języku arytmetyki:

h(s) = w ⇔ ∃n,k (φβ(n, k, 0, a) ∧ φβ(n, k, s, w) ∧∧ ∀0¬j<s ∃u,v (φβ(n, k, succ(j), v) ∧ φβ(n, k, j, u) ∧ φg(u, j, v) )).

(gdzie formuły (φg(x, y, z) i φβ(x, y, z, t) opisują odpowiednio funkcję g i funkcję β.)

A to oznacza, że funkcja h jest arytmetyczna!

Tyle o rekursji. I to jest krytyczny punkt dowodu. Reszta jest rutyną.

Rzeczywiście, nudnawe... Dodajmy tylko pewną uwagę: definiując, w krytycznym momencie dowodu,funkcję β, korzystaliśmy z obu działań - dodawania i mnożenia. Gdyby rozpatrywać słabsze arytmetyki -np. arytmetykę Presburgera w której nie ma mnożenia, to otrzymamy teorię rozstrzygalną - każdy zbióropisywalny w tak zubożonej arytmetyce jest rozstrzygalny.A niektórzy mówią, że mnożenie to tylko „skrócony zapis dodawania”...4

A teraz najważniejsze: jeśli formuła φ opisuje zbiór rekurencyjnie przeliczalny który jednak niejest rekurencyjny, to jego dopełnienie jest zbiorem, który nie jest rekurencyjnie przeliczalny. Ale jestarytmetyczny, bo opisany przez formułę ¬φ ! To chcieliśmy wiedzieć: istnieją formuły arytmetyczne,opisujące zbiory, które nie są rekurencyjnie przeliczalne5. Konsekwentnie:

Są takie formuły arytmetyczne, dla których nie ma procedury sprawdzającej ichspełnialność

2I to jest krytyczny punkt dowodu...3Dla każdego skończonego ciągu k0, . . . , ks można wskazać parę (n,m) taką, że β(n,m, j) = kj dla j = 0, 1, 2 . . . , s”

[108]. Np. dla ciągu (2, 0, 1, 2) wystarczy przyjąć m = 3 i n = 10. Wzorca dla tego kodowania można doszukać się wsłynnym „chińskim twierdzeniu o resztach”.

4Formuły arytmetycznej mn = k nie można zastąpić równoważną, w której użyto tylko dodawania.5Zbiory arytmetyczne można scharakteryzować jako te, które da się zbudować ze zbiorów rozstrzygalnych za

pomocą operacji uzupełnienia zbioru i rzutowania.

Page 140: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 139

Ponieważ już wiemy, że:

- formuła φ(x1, . . . , xm) jest spełniona w N przy wartościowaniu [x1 := n1, . . . , xm := nm]dokładnie wtedy, gdy zdanie φ(succn1(0), . . . , succnm(0)) jest prawdziwe w tym modelu,

- istnieje procedura sprawdzająca, czy zdanie posiada dowód w systemie PA,

to po raz drugi - ale już bardziej świadomie - każdy może poczuć się (na chwilę) jak Godel isformułować olśniewający wniosek:

Istnieją zdania arytmetyczne prawdziwe w modelu standardowym, które nie posiadają dowoduw systemie PA.

8.0.2 Powrót do źródeł(...) pomimo mojego wielkiego podziwu dla tego matematyka pierw-szej wielkości, jakim był Hilbert, nigdy nie mogłem zrozumieć w jakisposób uwierzył on, że maszyna mogłaby udzielić automatycznie od-powiedzi na wszystkie problemy diofantyny. Dlatego jestem bardzozadowolony, że Matijasiewicz wykazał, iż było to niemożliwe...

J. Dieudonne [27]

Jak wspominałem, to Hilbert zainicjował badania nad obliczalnością, umieszczając w swoimprogramie tak sformułowany dziesiąty postulat:

„Given a Diophantine equation with any number of unknown quantities and with rationalintegral numerical coefficients: To devise a process according to which it can be determined ina finite number of operations whether the equation is solvable in rational integers6. Jeśli się wto wczytać, to widać, że Hilbert pyta o rozstrzygalność problemu istnienia całkowitoliczbowychrozwiązań równań diofantycznych7.

W 1972 roku (czterdzieści lat po wynikach Godla) J. Matijasiewicz przedstawił negatywnerozwiązanie tego problemu. Uczynił to tak, że otworzył drogę do nowych, zaskakujących wyników.

Zacznijmy prościutko: z wielomianem P (x, y) = 2x2 − 3xy − 2y2 możemy związać zbiór n ∈N : N |= ∃y 2n2 − 3ny − 2y2 = 0. Wiemy już dość, by się zgodzić, że jest to zbiór rekurencyjnieprzeliczalny.To z kolei pozwala wyobrazić sobie, jak można dowieść twierdzenia, że „każdy zbiór diofantyczny -zbiór rozwiązań równania diofantycznego - jest rekurencyjnie przeliczalny”.

Matyjasiewicz pokazał, że i odwrotna implikacja jest prawdziwa:

„każdy zbiór rekurencyjnie przeliczalny jest zbiorem diofantycznym”- dla dowolnego zbioru rekurencynie przeliczalnego S istnieje wielomian PS(x, y1, . . . , yk) taki, żeliczba naturalna n jest w zbiorze S dokładnie wtedy, gdy PS(n,m1, . . . ,mk) = 0 dla pewnych liczbcałkowitych m1, . . . ,mk .

Skoro są zbiory rekurencyjnie przeliczalne które nie są rekurencyjne, to oczekiwania Hilberta sąniemożliwe do spełnienia.

Jedną z najbardziej intrygujących konsekwencji wyniku Matijasiewicza można opisać tak: wie-dząc tyle, ile wiemy, łatwo się zgodzimy, że wszystkie zbiory rekurencyjnie przeliczalne możnaefektywnie ponumerować. Trochę trudniej - nie widząc dowodu - przyjąć do wiadomości, że możnatę numerację wybrać tak, że relacja „n należy do rekurencyjnie przeliczalnego zbioru o numerzem” jest rekurencyjnie przeliczalna. Ale tak jest.Stąd - dzięki twierdzeniu Matijasiewicza - wynika, że istnieje .... uniwersalne równanie diofantycz-ne U(x, y, z1, . . . , zk) = 0 - dowolną procedurę sprawdzającą można zastąpić pytaniem o istnienierozwiązanie tego równania! Dokładniej:

6Równanie postaci f(x1, x2, . . . , xn) = 0 gdzie f jest wielomianem ze współczynnikami całkowitymi nazywa się(algebraicznym) równaniem diofantycznym.

7Diofantos z Aleksandrii, żył w III wieku naszej ery.

Page 141: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 140

„liczba n należy do zbioru rekurncyjnie przeliczalnego o numerze m dokładnie wtedy, gdy ist-nieją liczby naturalne m1, . . . ,mk takie, że

U(n,m,m1, . . . ,mn) = 0

Czy to kamień filozoficzny matematyki?8Bez szaleństw - to tylko odpowiednik uniwersalnej maszynyTuringa w języku równań diofantycznych.Z drugiej strony, skoro zbiór konsekwencji dowolnej pierwszorzędowej teorii jest rekurencyjnie przeliczalny,to z każdą taką teorią można związać pewne równania diofantyczne a dowodzenie twierdzeń zastąpićrozwiązywaniem takich równań. Czy to np. oznacza, że „stopień komplikacji” teorii można mierzyć zapomocą stopnia (liczby zmiennych) stowarzyszonego równania?Te są ważne pytania. Uświadamiają, co się kryje pod tak łatwo definiowanymi terminami jak „uniwersalnerównanie diofantyczne” czy „uniwersalna maszyna Turinga”.

Jak wygląda to uniwersalne równanie? Ile ma zmiennych, jaki stopień? Odsyłam do [52].

8.1 Zdanie godlowskie G

Już dwukrotnie „udowodniliśmy” twierdzenie o istnieniu arytmetycznych zdań prawdziwych (w N)ale niedowodliwych (w PA). Ale, pomijając dość enigmatyczne twierdzenie Parisa-Harringtona, niewskazaliśmy żadnego takiego zdania. Spróbujmy wypełnić tę lukę.

Paradoks kłamcy przyprawiał o ból głowy już starożytnych Greków. Modyfikując nieco oryginalną wersjęsformułujemy go tak: spróbujmy ocenić wartość logiczną zdania: ,,Zdanie, które teraz wypowiadam,jest fałszywe". Nie trzeba być przesadnie wnikliwym, by dostrzec, że jest ono prawdziwe dokładniewtedy, gdy ... jest fałszywe.Przyczyna kłopotu w tym, że to zdanie orzeka samo o sobie. A jak głosi mądrość ludowa - „nie możnabyć sędzią we własnej sprawie”9.

Paradoks kłamcy każe unikać zdań orzekających o sobie samych. Wydaje się, że to proste10.Jednak tego założenia nie można utrzymać już w wypadku arytmetyki! A to dlatego, że formułyarytmetyczne można efektywnie ponumerować11.Ustalmy taką numerację i popatrzmy na (straszne) tego skutki. Przyjmijmy oznaczenia:

- przez φn(x) oznaczamy formułę arytmetyczną (z jedną wolną zmienną) o numerze n,- symbolem num(ψ(x)) oznaczamy numer formuły ψ(x) 12

Dla dowolnej formuły φn(x) możemy rozważać szczególne zdanie - φn(n). I to jest właśnie „zastosowanieformuły do samej siebie” w sformalizowanej postaci.

Dla dowolnej formuły ψ(x) możemy teraz utworzyć nową formułę ψ(y) - taką, która jest spełnionaprzy wartościowaniu [y := n] wtedy, gdy liczba n jest numerem pewnej formuły z jedną zmiennąwolną, a zdanie ψ(num(φn(n)) jest prawdziwe w modelu standardowym13.

Formuła ψ(y) ma swój numer: możemy więc skonstruować zdanie

G(ψ) ≡ ψ(num(ψ(y))

i udowodnić kluczowy lemat o diagonalizacji:

8Kamień filozoficzny to substancja poszukiwana przez alchemików, pozwalająca na zamianę metali w złoto.9To nie tylko mądrość ludowa. Tak uważali m.in. Poincare i Russell.

10L. Wittgenstein o paradoksie kłamcy pisał tak: „Jest to jałowa sztuka! - jest to gra językowa (...). Podobnesprzeczności stają się interesujące tylko dlatego, że przysparzały ludziom udręki.” (Uwagi o podstawach matematyki).

11Bo jest to język rekurencyjny.12Niestety, nie da się tu uniknąć zupełnie formalnych zapisów....Odtąd, w całym rozdziale, będę też pomijać „pod-

kreślenia”, pozostawiając domyślności czytelnika rozstrzygniecie, czy n to liczba czy reprezentujący ją numerał.13ψ(y) ≡ ∃x (s(x, y)∧ψ(x)) gdzie z kolei s(x, y) to formułą arytmetyczna opisującą (częściowo rozstrzygalny) zbiór

par (n,m) takich, że n to numerem formuły arytmetycznej o jednej zmiennej wolnej, a m jest numerem zdania φn(n).

Page 142: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 141

„zdanie G(ψ) jest prawdziwe w modelu standardowym dokładnie wtedy, gdy jego numer mawłasność opisaną przez formułę ψ(x): :

(∗) N |= G(ψ) wtw N |= ψ(x)[[x := num(G(ψ))]

Uff... .

Popatrzmy co wyniknie z tego dziwnego lematu, gdy umiejętnie dobierzemy formułę ψ(x):

Przykład I. Przypuśćmy, że „prawda jest definiowalna w arytmetyce” - istnieje formuła arytme-tyczna true(x) taka, że: zdanie φ jest prawdziwe (w modelu standardowym) dokładnie wtedy, gdyzdanie true(num(φ)) jest prawdziwe:

(∗∗) N |= φ wtw N |= true(num(φ))

Wstawmy zaprzeczenie - formułę ¬true(x) - do równoważności (∗) w miejsce formuły ψ:

N |= G(¬true(x)) wtw N |= ¬true(num(G(¬true(x))))

i wykorzystajmy równoważność (∗∗) dla zdania G(¬true(x)):

N |= G(¬true(x)) wtw N |= true(num(G(¬true(x)))

Lewe strony obu równoważności są równe, więc prawe są równoważne! A to znaczy, że:

zdanie G(¬true(x)) jest prawdziwe w modelu standardowymwtedy i tylko wtedy gdy

... zdanie G(¬true(x)) nie jest prawdziwe w tym modelu!

Sprzeczność! Skoro tak, to formuła true(x) nie istnieje. Zbiór Th(N) zdań prawdziwych w modelustandardowym nie jest arytmetyczny14. A to oznacza, że nie jest sprawdzalny!

To jest nowy dowód niezupełności arytmetyki Peano.Jeśli ktoś się łudził, że „dowodliwość w systemie aksjomatycznym” nie wyczerpuje możliwości poznaniaprawdy (ograniczonego choćby do sprawdzania) to właśnie się ich pozbył. Przynajmniej w przypadkuarytmetyki.

Przykład II. Zrealizujemy (wreszcie) obietnicę: wskażemy prawdziwe, ale niedowodliwe zdaniearytmetyczne.Zbiór (numerów) zdań dowodliwych PA jest rekurencyjnie przeliczalny, czyli arytmetyczny. Istniejeformuła arytmetyczna dow(x) opisująca ten zbiór. Przyjmijmy, że dla dowolnego zdania φ będziemypisać (φ) zamiast dow(num(φ)). Tak więc dla dowolnego zdania φ mamy równoważność:

(∗ ∗ ∗) N |= (φ) wtw PA ` φPopatrzmy, co wynika z równoważności (∗) i (∗∗∗) dla zdania G ≡ G(¬dow(x)). Z równoważności(∗ ∗ ∗) otrzymamy:

N |= (G) wtw PA ` GRównoważne są też zaprzeczenia obu zdań:

N |= ¬(G) wtw nieprawda, że PA ` G

Korzystając z równoważności (∗) dla formuły ¬dow(x), otrzymamy

N |= G wtw N |= ¬(G)

Połączmy dwie ostatnie równoważności w jedną:

(∗ ∗ ∗∗) N |= G wtw nieprawda, że PA ` G

„zdanie G jest prawdziwe w modelu standardowym dokładnie wtedy, gdy nie ma dowodu w PA.”Ale zdanie G nie może mieć dowodu w PA! Gdyby miało, to zgodność systemu PA względem Ngwarantowała by, że N |= G czyli, na mocy (∗ ∗ ∗∗) .... G nie ma dowodu w PA15.

14To twierdzenie w literaturze znane jest jako „twierdzenie Tarskiego”.15Nasza wniosek, że G nie ma dowodu jest słuszny pod warunkiem, że PA jest niesprzeczny. Możemy pomyśleć o

całej sytuacji nieco inaczej: albo PA jest systemem niezupełnym albo jest sprzeczny.

Page 143: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 142

Zdanie G jest prawdziwe w N i nie ma dowodu w systmie PA.

Zdanie G przeszło do historii pod nazwą zdania godlowskiego. Obietnica została spełniona...Przy okazji, zdanie ¬G również nie ma dowodu w PA16.

Aby jednak nam się nie wydawało, że wszystko jest tak banalnie proste, proponuję spojrzeć na stronę:

http : //tachyos.org/godel/Godel statement.html

by sprawdzić, jak wygląda zdanie G zapisane w czystej postaci. To pomoże zrozumieć, jak istotny jestprzywoływany tu wielokrotnie „trzeci wymiar” języka matematyki pozwalający na wprowadzanie skrótówi nazw wyróżniających to, co ważne...

Ważny wniosek

Twierdzenie Godla nie dotyczy tylko arytmetyki. Zbiór konsekwencji dowolnej teorii aksjomatycznejT jest zawsze sprawdzalny. Można ponumerować słowa języka, w którym napisano teorię T tak, żezbiór numerów słów dowodliwych jest rekurencyjnie przeliczalny, czyli arytmetyczny. To oznacza, żeistnieje formuła arytmetyczna dowT (x), która jest spełniona przy wartościowaniu [x := n] dokładniewtedy, gdy zdanie o numerze n jest dowodliwą konsekwencją teorii T .Tak więc zamiast pokazywać wprost że T ` φ, można próbować pokazać, że zdanie dowT (num(φ))jest prawdziwe w N. To można osiągnąć konstruując dowód arytmetyczny zdania dowT (num(φ))- pokazując, że PA ` dowT (num(φ))17

To jednak nie oznacza, że dla dowolnej teorii T ` φ dokładnie wtedy, gdy PA ` dowT (num(φ)).Np. dla T = ZFC wynika to z udowodnionego właśnie twierdzenia o niezupełności arytmetyki....18

8.1.1 O praprzyczynie pewnych niemożnościGolibroda z Sewilli goli wyłącznie tych mężczyzn,którzy nie golą się sami. Czy goli swą własną brodę?

Matematycy często-gęsto mówią o metodzie przekątniowej, której autorstwo przypisuje się Can-torowi. Jej zastosowanie prowadzi do zaskakujących, wręcz paradoksalnych rezultatów. Spróbujemyopisać istotę tej metody najprościej jak można.

Dla dowolnej relacji r ⊆ A×A podzbiór C ⊆ A nazwiemy r-definiowalnym, jeżeli można wskazaćelement c ∈ A taki, że

C = a ∈ A; (c, a) ∈ r

Okazuje się, że bez względu na to, jak wybierzemy relację r ⊆ A2, można wskazać podzbiór P ⊆ A,który nie jest r-definiowalny. Jest to zbiór

P = a ∈ A : ¬((a, a) ∈ r)

Zbiór P nazywać będziemy zbiorem paradoksalnym dla relacji r19.

Proste? Bardzo. Zaskakuje dopiero to, jak wiele słynnych dowodów to w istocie wykorzystanietego, że „zbiór paradoksalny nie jest r-definiowalny” dla odpowiednio dobranej relacji r.Przekonajmy się.

I. Paradoks Russella. Zakładając istnienie zbioru wszystkich zbiorów U , możemy potraktowaćrelację przynależności „∈” jako relację na tym zbiorze. Wówczas russellowskie stwierdzenie (które

16Wiesz dlaczego?17Można też do „arytmetyzacji” dowodzenia użyć innej teorii, np. teorii słabszej niż PA. To jest zapewne sens

stwierdzenia Friedmanna, które wcześniej cytowaliśmy.18Wiesz dlaczego?19To twierdzenie funkcjonuje w literaturze pod nazwą lemat przekatniowy.

Page 144: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 143

prowadzi do sprzeczności): „kolekcja a ∈ U ; a /∈ a jest zbiorem” to jedynie inaczej wysłowionestwierdzenie: „zbiór ∈-paradoksalny jest ∈-definiowalny”...20.

II. Twierdzenie Cantora o nieprzeliczalności zbioru wszystkich podzbiorówliczb naturalnych.Dla dowolnej funkcji f : N −→ 2N określmy relację rf ⊆ N×N tak:

(n,m) ∈ rf wtw n ∈ f(m)

Zbiory rf -definiowalne to podzbiory N postaci f(m), gdzie m to dowolna liczba naturalna.

Gdyby funkcja f była „na” (co jest warunkiem przeliczalności zbioru 2N), to każdy podzbiór liczbnaturalnych byłby definiowalny. Zbiór rf -paradoksalny też. I to wykorzystał Cantor.

III. Twierdzenie Tarskiego (o niedefiniowalności prawdy arytmetycznej).Przyjmijmy, że ustalona jest pewna efektywna numeracja formuł arytmetycznych (jednej zmiennej)ψ → num(ψ). Zdefiniujmy relację na zbiorze formuł jednej zmiennej:

φ r ψ dokładnie wtedy, gdy N |= φ(num(ψ))

Zbiór paradoksalny składa się teraz z takich formuł φ, że zdanie φ(num(φ)) jest fałszywe wN. Gdyby istniała formuła Tarskiego true(x) (i tym samym formuła false(x) ≡ ¬true(x)), toformuła false(x) (utworzona w sposób opisany na początku podrozdziału poświęconego zdaniomgodlowskim) opisywała by zbiór paradoksalny.

IV. Arytmetyka Peano nie jest rozstrzygalna - nie istnieje procedura rozstrzygająca, czy zdaniearytmetyczne ma dowód w PA. Gdyby tak było, to relacja

r = (n,m) ∈ N2 : nto numer formuły jednej zmiennej i zdanieφn(m) jest prawdziwebyłaby zbiorem rozstrzygalnym. Tym samym zbiór paradoksalny dla tej relacji jest też rozstrzygal-ny, czyli arytmetyczny, opisany przez formułę ψ(x). Potrafisz dokończyć? Powinieneś... .

V. Niemożliwości w teorii obliczalności. Tak jak zawsze, przez kod(T ) oznaczamy binarny kodmaszyny Turinga T . Rozważmy prostą relację między takimi maszynami:

T ρT1 jeżeli maszyna T zatrzymuje się rozpoczynając pracę ze słowem kod(T1) zapisanym nataśmie (symbolicznie: T (kod(T1)) ↓).

Zbiór paradoksalny tworzą teraz te maszyny Turinga, które nie zatrzymują się pracując nawłasnym kodzie (symbolicznie: T (kod(T )) ↑). Skorzystajmy z tej relacji.

Va. Nierozstrzygalność problemu stopu: nie istnieje maszyna PS taka, że dla dowolnej maszynyT i słowa v:

PS(< kod(T ), v >) =

1 gdy T (v) ↓0 w przeciwnym wypadku

Gdyby taka maszyna istniała, to można by łatwo skonstruować maszynę PS∞, opisującą zbiórparadoksalny (tzn. PS∞(kod(T )) ↓ dokładnie wtedy, gdy T (kod(T )) ↑)21.

Vb. Twierdzenie Rice’a: żadna nietrywialna semantyczna własności maszyn Turinga22 nie jestrozstrzygalna.Przypuśćmy, że maszyna TP rozstrzyga o własności semantycznej P. Korzystając z niej zbudujemy

20Przywołajmy też mniej znaną, „funkcyjną” wersję paradoksu Russella przypisywaną Hilbertowi. Załóżmy, żeuniwersum matematyczne składa się z funkcji i zawiera conajmniej dwa różne obiekty-funkcje - „0” i „1” i żepodstawową operacją jest aplikacja funkcji do funkcji. Przyjmijmy, że „wszystko można aplikować do wszystkie-go” ((plato.stanford.edu/entries/paradoxes-contemporary-logic)). Zdefiniujemy relację r tak: (a, b) ∈ r jeżeli ab = 0Wówczas jeśli tylko dopuścimy (oczywistą) możliwość definiowania funkcji „by cases” (przez przypadki, to skonstru-ujemy funkcję f taką, że fx = 0, if xx 6= 0 oraz fx = 1, if xx = 0 która, wbrew naszemu twierdzeniu, definiuje zbiórparadoksalny dla relacji r .

21Powarzamy tu argumenty użyte w dowodzie nierozstrzygalności problemu stopu (w rozdziale „Obliczalność”).22Własność P maszyn Turinga jest semantyczna, gdy nie rozróżnia maszyn akceptujących ten sam język. A nie-

trywialna, gdy ma ją choćby jedna maszyna Turinga.Maszyna TP rozstrzygająca o tym, czy pewna maszyna M ma własność P „pracuje” na kodzie tej maszyny.

Page 145: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 144

maszynę Turinga Tρ opisującą zbiór ρ-paradoksalny w taki oto sposób:niechMP będzie pewną maszyną o własności P23. Dla dowolnej maszyny T budujemy nową maszynęT której działanie na słowie v to kolejne wykonanie dwóch podprocedur:1. uruchamiamy obliczenie T (kod(T )). Jeżeli ten proces się nie kończy, to i praca T na słowie v sięnie kończy. W przeciwnym wypadku:2. uruchamiamy maszynę MP na słowie v.

Jeśli T nie zatrzymuje się na własnym kodzie, to T akceptuje pusty język (nigdy się nie za-trzymuje). W przeciwnym wypadku T akceptuje ten sam język co MP czyli - w tym wypadku- ma własność P24 . Tym samym sprawdzenie, czy T nie zatrzymuje się na v jest równoważnesprawdzeniu, czy T nie ma własności P. A to potrafi maszyna TP . 25

I tak stworzyliśmy maszynę opisującą zbiór ρ-paradoksalny26.

Wynik Rice’a jest smutny - pokazuje, że żadna nietrywialna własność zbiorów rekurencyjnie przeliczal-nych nie jest rozstrzygalna. W szczególności omawiana wcześniej hierarchia języków Chomsky’ego nie maalgorytmicznego wsparcia: nie sposób proceduralnie rozstrzygnąć, czy dowolny język rekurencyjnie prze-liczalny jest regularny (bezkontekstowy, pusty)... Nie potrafimy też rozstrzygać czy języki akceptowaneprzez maszyny T1 i T2 są równe27.

„Relacja”, „negacja”, „zbiór definiowalny i paradoksalny” - te nazwy sugerują wysoce wyrafino-wany logiczny kontekst twierdzenia o istnieniu zbioru paradoksalnego. Ale to jest w istocie banalnetwierdzenie, które można sformułować korzystając z najprostszej, naiwnej teorii mnogości:

„jeżeli zbiór B ma conajmniej dwa elementy, to żadna funkcja typu A → (A → B) nie jestfunkcją „na”.Rzeczywiście, gdy tylko f : B → B jest funkcją bez punktu stałego28, to dla dowolnej funkcjiφ : A→ (A→ B) odwzorowanie df (φ) : A→ B takie, że dla dowolnego a ∈ A:

df (φ)(a) = f(φ(a)(a))

nie jest w zbiorze φ(A) (gdyby df (φ) = φ(c) to, w szczególności, φ(c)(c) = df (φ)(c) = f(φ(c)(c)) 6=φ(c)(c)).

A nasza wyjściowa obserwacja dotyczyła sytuacji, gdy B = 0, 1 a f = ¬.I to wszystko. Zero metafizyki29.

„Cantor, Russell, Turing, Tarski a nawet Godel w jednym stali domu”... Zadziwiające, jak różnie inter-pretowano skutki tej prostej obserwacji.Paradoks Russella zmusił do rewizji poglądów na temat relacji między „własnością” a „zbiorem”.Ale gdy Cantor korzystając z metody przekątniowej odkrył konieczność uznania nieskończonej skali nie-skończoności, nie zmieniło to poglądów w kwestii akceptacji nieskończoności aktualnej. Przeciwnie - dlawielu wynik Cantora to esencja teorii mnogości.

23Jej istnienie zapewnia nietrywialność własności P24To tu wykorzystujemy to z pozoru dziwne założenie o semantycznym charkaterze własności P.25Uważny czytelnik zauważył, że to konstrukcja wymaga by maszyna akceptująca zbiór pusty nie miała własnościP. Ale to na szczęście nie jest istotna trudność...

26Pomijając techniczne szczegóły.27Ciekawostka: w pracy The Ricean objection: An analogue of Rice’s theorem for first-order theories. Log.J. IGPL

16, No. 6, 585-590 (2008) I.Carboni Oliveira i W. Carnielli udowodnili twierdzenie wzorowane na twierdzeniu Rice’adla teorii arytmetycznych pierwszego rzędu: jeżeli P jest pewną własnością takich teorii i pewna skończenie aksjoma-tyzowalna teoria ma tę własność, to P jest nierozstrzygalna. Pięknie, ale ... w 2009 ukazała się praca obu Autorów,którzy przyznali się do błędu...(Erratum to „The Ricean objection: An analogue of Rice’s theorem for firstordertheories”. Log. J. IGPL 17, No. 6, 803-804 (2009).

28Tzn. f(b) 6= b dla dowolnego b ∈ B.29Już po napisaniu tego fragmentu znalazłem informację, że istnienie zbiorów paradokslanych nie umknęło uwadze

Russella (http://plato.stanford.edu/entries/paradoxes-contemporary-logic). A w [66] tak sformułowane twierdzenienazwano twierdzeniem Cantora.Mały sprawdzian na koniec: korzystając z powyższego twierdzenia pokaż to, co już wiemy: „nie istnieje efektywnanumeracja totalnych funkcji obliczalnych (jednej zmiennej)”

Page 146: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 145

Wykorzystanie tej samej metody w teorii obliczalności nikogo nie zbulwersowało: przyjęto, że te wynikiwyznaczają „granice obliczalności”. I nikt nie wpadł w ekstazę i nikt nie histeryzował...Jakkolwiek to nie zabrzmi, śmiem twierdzić, że twierdzenia Turinga i Godla są z wyższej niż twierdzenieCantora, półki. Wynik Cantora jest wewnętrznym twierdzeniem teorii mnogości - wystarczy odrzucićaksjomat istnienia zbioru złożonego ze wszystkich podzbiorów dowolnego ustalonego zbioru, by pozbawićto twierdzenie znaczenia.Tymczasem wynik Turinga odnosi się do elementarnie opisywanego procesu dyskretnej interakcji. To,podobnie jak wynik Godla, twierdzenie limitacyjne, wskazujące nieprzekraczalne granice poznania.

8.2 Niesprzeczność arytmetyki Peano - drugie twierdzenie Godla

Wskazując zdanie arytmetyczne, które nie ma dowodu w arytmetyce Peano wykazaliśmy jej nie-sprzeczność30. Innym dowodem niesprzeczności PA jest istnienie teoriomnogościowego modelu. Jed-nak oba te dowody niesprzeczności PA są „zewnętrzne” - korzystaliśmy w nich z teorii mnogości.Te dowody mówią jedynie, że „arytmetyka Peano jest niesprzeczna, o ile teoria mnogości jestniesprzeczna”. To są warunkowe dowody niesprzeczności PA.

Czy można udowodnić niesprzeczność arytmetyki Peano „wewnętrznie”, korzystając tylko z tej teorii?Gdyby tak było, to bylibyśmy „mniej relatywistyczni” w swoim myśleniu o istnieniu matematycznym.

Uściślijmy: z chwilą, gdy wprowadziliśmy do rozważań numerację formuł, formułę dow(x) ioperator :

(φ) ≡ dow(num(φ))

możemy dla dowolnego zdania arytmetycznego ψ stawiać dwa (różne) pytania:

- czy ¬(PA ` ψ) - „czy nie istnieje dowód zdania ψ?”- czy PA ` ¬(ψ) - „czy mamy dowód w PA, że zdanie ψ nie ma dowodu?”

To nie zabawa w słowa. W obu wypadkach oczekujemy odpowiedzi uzasadnionych przez dowody, ale wróżnych systemach dowodzenia:W pierwszym wypadku, dopuszczamy dowód w pewnym „zewnętrznym” systemie dowodzenia,W drugim przypadku chodzi o dowód „wewnętrzny”, korzystający tylko z tego, co oferuje PA.

Zdanie arytmetyczne ψ możemy wybrać dowolnie. Wybierzmy równość (0 = succ(0)).

Wewnątrzny dowód niesprzeczności teorii PA to odpowiedź na pytanie: czy PA ` ¬(0 = 1)?Godel pokazał, że odpowiedź na to pytanie jest negatywna.

Ważna subtelność: istnienie „wewnętrznego” dowodu zdania ¬(0 = 1) nie gwarantuje niesprzecz-ności PA! To oczywiste: jeśli PA jest sprzeczna to można dowieść w niej wszystko.Co zatem udowodnił Godel? Pokazał, że niesprzeczność PA nie może być „wewnętrznie potwierdzona”.

Drugie twierdzenie Godla - szkic dowodu

Przedstawienie w sposób poglądowy drugiego twierdzenia Godla jest zdecydowanie trudniejsze (dlamnie) niż podobnie uproszczony opis pierwszego twierdzenia. Ale spróbuję31.Zastosujemy wybieg: zamiast atakować problem wprost pokażemy, że

PA ` (¬(0 = 1)→ G)

30Teoria jest niesprzeczna, gdy nie można w niej dowieść jednocześnie pewnego zdania i jego zaprzeczenia. Równo-ważnie: nie można udowodnić wszystkiego (gdyż z fałszu - koniunkcji p ∧ ¬p - wynika wszystko).

31Niestety, dowód jest bardzo sformalizowany. Mniej zaawansowani mogą go sobie darować,

Page 147: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 146

To wystarczy: gdyby PA ` ¬(0 = 1) to - korzystając z reguły odrywania - moglibyśmy twierdzić,że PA ` G . A to, jak wiemy, jest niemożliwe.

W dowodzie wykorzystamy własności operatora , znane pod angielską nazwą derivability con-ditions Hilberta-Bernaysa:

1. jeżeli PA ` φ , to PA ` (φ),

2. PA ` ((φ)→ (φ))

3. PA ` ((φ) ∧(φ→ ψ)→ (ψ)) (równoważnie: PA ` (φ→ ψ)→ ((φ)→ (ψ)) )

Skorzystamy też ze szczególnej właściwość zdania godlowskiego G32:

PA ` (G↔ ¬(G)) (+)

Wykorzystując (1) do implikacji PA ` ((G)→ ¬G) . otrzymamy:

PA ` ((G)→ ¬G) (a)

a korzystając z warunku (2) dla zdania G otrzymamy

PA ` ((G)→ ((G)) (b)

Wykorzystując (a) i (3): otrzymamy

PA ` ((G))→ (¬G) (c)

Ostatecznie, łącząc (b) i (c) otrzymamy:

PA ` (G)→ (¬G) (d)

Ponieważ w sposób oczywisty PA ` G→ (¬G→ (0 = 1))33 to - na mocy (1)- otrzymamy

PA ` (G→ (¬G→ (0 = 1)))stąd, dzięki (3), otrzymujemy

PA ` (G)→ ((¬G)→ (0 = 1))lub, równoważnie

PA ` (¬G)→ ((G)→ (0 = 1)) (f)

Korzystając z tautologii (p→ (q → r)↔ ((q → p)→ (q → r) otrzymamy z (f):

PA ` ((G)→ (¬G)))→ ((G)→ (0 = 1)) (g)

i - już widać koniec ! - z (d), (g) korzystajac z reguły odrywania otrzymamy

PA ` (G)→ (0 = 1)czyli

PA ` ¬(0 = 1)→ ¬(G)teraz, korzystając z (+), otrzymamy

PA ` ¬(0 = 1)→ G

Uff, koniec!!!34

Dodajmy na koniec coś, co jeszcze bardziej podnosi znaczenie wyniku Godla: nie tylko arytmetyka Pe-ano nie jest w stanie potwierdzić własnej niesprzeczności. To cecha każdej teorii bogatszej od PA. Wszczególności, teoria mnogości - ZFC - nie jest w stanie potwierdzić swojej niesprzeczności.

32Tego nie udowodniliśmy: w dowodzie pierwszego twierdzenia Godla była mowa tylko o nieco słabszej równoważ-ności. Ale, proszę uwierzyć (sprawdzić), że ta równoważność jest też dowodliwa.

33p→ (¬p→ false) to tautologia.34Jaka ulga... Ale to jedynie szkic, zarys dowodu. To co najistotniejsze - -warunki Hilberta-Bernaysa czy własnosć

(+) pozostały tu bez dowodu.

Page 148: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 147

Herakles walczący z Hydrą

„Drugie zadanie Heraklesa polegało na tym, by pokonać wielogłową Hydrę odcinając jej kolejnowszystkie głowy. Ale ucięcie jednej głowy powodowało prawie zawsze odrastanie kilku nowych głów- zgodnie z regułami, które opiszemy za chwilę.Czy Herakles może pokonać Hydrę bez względu na to, jak wiele głów ma ona na początku walki?”

Niech H(1), H(2), . . . ,H(n), . . . będzie ciągiem opisującym liczbę głów Hydry: H(n) = liczba głów„po n-tym cięciu Heraklesa”. Hydra zginie, gdy H(n0) = 0 dla pewnej liczby n0 ∈ N.

Łatwo się zgodzić, że konstrukcja ciągu liczb naturalnych W (n) takiego, że:

(*) dla dowolnego m ∈ N istnieje m1 > m takie, że W (m) > W (m1)

musi kończyć się osiągnięciem zera35. Stąd pomysł, by rozwiązać problem Heraklesa konstruującciąg W (n) który spełnia warunek (*) i majoryzuje ciąg H(n)36.

Pomysł dobry, ale ... niewykonalny. Stanie się to jasne, gdy poznamy „reguły odrastania głów”.Te reguły opiszemy wyobrażając sobie Hydrę jako graf-drzewo. Głowy Hydry to liście drzewa (wierz-chołki bez potomków) wieńczące „szyje” - gałęzie drzewa. Nazwijmy „ojcem” wierzchołka w tenwierzchołek, który go bezpośrednio poprzedza. A „ojciec ojca w” - o ile istnieje - to „dziadek w”.Pomóżmy sobie przykładem - oto graf reprezentujący pewną trójgłową Hydrę.

a b c

d

e

k

Wierzchołek d jest ojcem a i b, a e dziadkiem tych wierzchołków. k to korzeń. Wierzchołek c niema dziadka.Reguły odrastania głów Hydry po n-tym cięciu Herkulesa opisujemy tak:

- jeżeli odcinana głowa-wierzchołek nie ma dziadka, to nic nie odrasta,- w przeciwnym wypadku do „dziadka” głowy odciętej przez n-te cięcie Heraklesa zostaje dołą-

czonych n kopii tego, co zostało dziadkowi po odcięciu jednej głowy-wnuka:Kolejny rysunek ilustruje zmianę Hydry-drzewa po drugim cięciu Heraklesa, w którym odciął

on głowę a.

•a b c b1 b2 c

d d1 d2

e e

k k

Gdy w kolejnym ruchu Herakles odetnie głowę „c”, to nic nie odrośnie.35Ta obserwacja wydaje się oczywista. Jest to konsekwencja twierdzenia, iż każdy niepusty podzbiór liczb natural-

nych ma element najmniejszy. A z kolei to stwierdzenie jest konsekwencją (drugorzędowej) zasady indukcji. Tego sięnie da dowieść korzystając tylko z aksjomatyki Peano!

36Tzn. H(n) ¬W (n) dla dowolnego n.

Page 149: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 148

Wbrew wcześniejszym zapowiedziom zbudujemy ciąg majoryzujący ciąg H(n) i spełniającywarunek (∗). Ale nie będzie to ciąg liczb naturalnych a ciąg liczb porządkowych:

Liczby porządkowe klasyfikują zbiory dobrze uporządkowane. Najprostsze liczby porządkowe to liczbynaturalne - liczba naturalna n to liczba porządkowa zbioru 0 ¬ 1 ¬ · · · ¬ n−1. ω to liczba porządkowazbioru liczb naturalnych uporządkowanego przez relację ¬. ω + 1 to liczba porządkowa zbioru N, doktórego dołożono element - powiedzmy ? - jako element największy:

0 ¬ 1 ¬ 2 ¬ . . . n ¬ n+ 1 ¬ · · · · · · ¬ ?I tak dalej... . Liczby porządkowe umiemy nie tylko dodawać, ale również mnożyć i potęgować.Można je też porównywać:

0 < 1 < 2 < . . . < n < n+ 1 < · · · · · · < ω < ω+ 1 < . . . < ω+ n < . . . < ω+ ω < . . . < ωω < . . .

Liczb porządkowych jest nieskończenie wiele37. Dla nas ważna jest liczba ε0, o której wystarczy nam terazwiedzieć, że jest większa od wszystkich liczb porządkowych tu rozważanych.

Udekorujemy wierzchołki drzewa-Hydry zgodnie z taką regułą rekurencyjną:- wszystkie liście (czyli głowy Hydry) oznaczamy przez 0,- jeśli wszystkie wierzchołki dla których wierzchołek w jest ojcem są oznaczone są odpowiednio

przez liczby porządkowe α1, . . . , αn i α1 ­ α2 ­ . . . ­ αn , to wierzchołkowi w przypisujemy liczbęωα1 + ωα2 · · ·+ ωαn 38

Tę numerację wierzchołków wybrano tak, by liczba porządkowa etykietująca korzeń drzewa „pocięciu” była zawsze mniejsza od przypisanej mu przed cięciem. I większa od liczby liści - główHydry.

•a0 b0 c0 b01 b02 c0

d2 d11 d1

2

eω2

e(ω+ω)

kωω2+1

kω(ω+ω+1)

Proszę uwierzyć (lub policzyć): tak jest zawsze, bez względu na to, który łeb Hydry utnie He-rakles.Wniosek? Ciąg liczb porządkowych etykietujących kolejno korzeń drzewa-Hydry jest istotnie ma-lejący i majoryzuje nasz ciąg H(n).

I teraz najważniejsze. Przyjmijmy, że uznajemy za „prawo matematyki” indukcję pozaskończonądla liczby ε0, czyli uznamy za prawdziwe takie stwierdzenie39:

jeśli zbiór A liczb porządkowych ¬ ε0 zawiera 0 i dla dowolnej liczby porządkowej α < ε0

prawdziwa jest implikacja:jeśli β ∈ A dla dowolnej β < α, to α ∈ A

to zbiór A zawiera wszystkie liczby porządkowe < ε0.

Jeśli tak, to łatwo pokażemy - podobnie jak dla zwykłej indukcji drugorzędowej - że każdyniepusty zbiór liczb porządkowych mniejszych niż ε0 ma element najmniejszy. A stąd wynika, że:

każdy malejący ciąg liczb porządkowych < ε0 musi osiągnąć 0!37Więcej: „Nie istnieje zbiór wszystkich liczb porządkowych” (paradoks Buriali-Fortiego)38ω0 = 139Teoria zbiorów ZF (nawet bez aksjomatu wyboru!) pozwala traktować prawo indukcji pozaskończonej jako twier-

dzenie - potrafimy je dowieść w ramach tej teorii.

Page 150: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 149

Herakles zawsze zabije Hydrę... Bez względu na to, ile i jak „rozłożonych” ma ona głów i jakąstrategię odcinania głów wybierze Herakles....

Mniejsza o Heraklesa. To tylko przykład problemu sformułowanego w języku arytmetyki, którego rozwią-zanie wymaga „czegoś więcej” - w tym przypadku liczb porządkowych i indukcji pozaskończonej.Ale dlaczego twierdzimy, że jest to „prawda”? To jest tylko „prawda teoriomnogościowa”...

Pora na konkluzje, czyli dwa ważne zdania:

1. Kirby i Paris pokazali, że niesposób dowieść w PA iż Herakles zwycięży Hydrę40

2. Korzystając z tych samych środków - liczb porządkowych i indukcji pozaskończonej dla liczbporządkowych < ε0 - G. Gentzen dowiódł niesprzeczności arytmetyki pierwszego rzędu.

8.3 Próba bilansuEither mathematics is too big for the human mindor the human mind is more then a machine

K. Godel41

Pozornie prosty język arytmetyki okazał się zbyt mocny: pozwala na formułowanie zdań, którychprawdziwości nie można potwierdzić dowodem. Prawda arytmetyczna wymknęła się spod kontroli.Z drugiej strony, arytmetyka Peano (i jakakolwiek teoria obszerniejsza od niej) okazała się zbytsłaba, by dowieść własnej niesprzeczności.

Jak wytłumaczyć nieco histeryczny ton, tak często obecny w dyskusjach o wynikach Godla?42

To zapewne skutek akceptowanego przez większość (świadomie lub podświadomie) realizmu mate-matycznego. Realiści przyjmują, że byty matematyczne dziedziczą po obiektach świata fizycznegopodstawową cechę: własność sformułowana w adekwatnym języku przysługuje, albo nie, danemuobiektowi43 - teoria pojedynczego obiektu matematycznego musi być pełna. Jeśli tak, to twierdze-nie Godla o niezupełności jest nielichym kłopotem, bo rozbja w proch i pył paradygmat matematykihilbertowskiej - przekonanie o możliwości pełnego i aksjomatycznego opisu każdego obiektumatematycznego.

I dlatego R. Penrose uznał twierdzenia Godla za „śmiertelny cios zadany formalizmowi”, zaporażkę programu Hilberta44.

Hilbert nie chciał rewolucji, chciał uporządkować zastaną matematykę. Temu miała służyć for-malizacja: „all the propositions that constitute mathematics are converted into formulas, so thatmathematics proper becomes an inventory of formulas (...). The axioms and provable propositions(...) are copies of the thoughts constituting customary mathematics as it has developed till now”[94]45 Centrum uporządkowanej matematyki miała być arytmetyka. Może niekoniecznie cała aryt-metyka peanowska ale jej „bezproblemowa” część. Matematyka „rzeczywista”46 Katastrofa, jakąbył wyniki Godla, zdarzyła się więc w „samym centrum miasta” a nie na jego peryferiach. To mu-siało zaboleć...

40Podobnie rzecz się ma z ciągami Goodstaina: można je zdefiniować w języku arytmetyki, ale udowod-nienie, że każdy taki ciąg musi zbiegać do zera wymaga wykorzystania idukcji pozaskonczońej - patrz np.http://en.wikipedia.org/wiki/Goodstein’s theorem.

41http://math2033.uark.edu/wiki/index.php/Kurt Godel42Twierdzenia Godla jest szeroko komentowane i interpretowane również poza matematyką. Nie podejmuję tego

wątku z dwóch powodów. Po pierwsze, brak mi kompetencji. Po drugie, ręce opadają wobec ogromu niekompetencjii „swobody interpretacynej” prezentowanej przez wielu dyskutantów. Ale zainteresowanych odsyłam np. do [60].

43Również w odniesieniu do obiektów świata rzeczywistego (np. kwantowego) to przekonanie jest dość naiwne...44Ponieważ nie z całą argumentacją Penrose’a się zgadzam nie będę jej tu przedstawiał. Zainteresowanych odsyłam

do [85].45Nie mylmy programu Hilberta z listą 23 problemów matematycznych przedstawionych przez niego na Międzynaro-

dowym Kongresie Matematyków w Paryżu w 1900 roku (choć drugi problem na tej liście - („udowodnić niesprzecznośćaksjomatów arytmetyki”) - jest jednym z elementów tego programu). Ten program powstawał przez lata, a dojrzałąformę osiągnął około roku 1920.

46„Real statements” i „ideal statements” - patrz str. 48.

Page 151: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 150

Matematyka zdań rzeczywistych miała być obudowana matematyką zdań idealnych. Gdyby przy-jąć, barbarzyńsko upraszczając, że zdania rzeczywiste to arytmetyka, a idealne to teoria mnogości,to rzecz jest jasna: w teorii mnogości potrafimy dowieść niesprzeczności PA (czego PA nie potrafi).To oznacza, że rozszerzenie arytmetyki do teorii mnogości nie jest konserwatywne47.

Czy tego chcieli twórcy teorii mongości? Nie wiemy (raczej nie). Ale musimy sie z tym pogodzić.

Twierdzenie Godla wykluczające możliwość wewnętrznego potwierdzenie niesprzeczności jakiejkol-wiek teorii zawierającej arytmetykę skazuje nas na immanentny relatywizm w ustalaniu niesprzecz-ności. To też mogło „fundamentalnie zaboleć” - wszak niesprzeczność to hilbertowskie istnienie. Alejuż np. R. Symullya’n pisał beztrosko: „Nie jest tak, że nie potrafimy dowieść niesprzeczności aryt-metyki: to arytmetyka nie potrafi dowieść swej niesprzeczności”. [107]. Potrafimy, jeśli skorzystamyz teorii mnogości. No tak, a w ten sposób nie uzyskamy pewności niesprzeczności matematyki ajedynie uświadamiamy sobie jej wewnętrzne zależności48.

Relatywizm zamiast absolutnej prawdy? Dlaczego nie? Relatywizm pozbawia pewności, ale w zamiandaje gwarancję ciągłego rozwoju. Większą, niż poszukiwanie jednej, jedynie słusznej prawdy.

Co robić?49 Realiści nie znajdują dobrej odpowiedzi. Ale wyjdźmy poza matematyczny realizm ispójrzmy na wyniki Godla inaczej. Już w początku XVIII wieku George Berkeley (1685 - 1753)sformułował słynne równanie:

esse = percipito, co istnieje = to, co jest postrzegane

Postrzeganie matematyczne to dowodliwość... . W matematyce nie ma prawdy. Jest tylko do-wodliwość50. „Zgodność twierdzeń z rzeczywistością” to kwestia pozamatematyczna.

Obiekt matematyczny jest tym, co o nim wiemy - potrafimy dowieść. I nic dziwnego,że użycie różnych języków daje różne rezultaty51? „Mój język wyznacza granice mego poznania” -L. Wittgenstein.

Jeśli tak, to twierdzenie o niezupełności arytmetyki traci swój dramatyczny charakter. Jestważne, ale nie rujnuje matematyki. Czy rozpoznawanie siły języka i porównywanie siły opisu różnychjęzyków, nie jest częścią procesu poznania?

Nie podzielam poglądu, że wyniki Godla to klęska formalizmu. To tylko koniec pewnych złudzeń.Paradoksalnie, to forsowany przez Hilberta formalizm i związany z nim rygoryzm matematycznyzmusił do nadania precyzyjnego matematycznego znaczenia takim terminom jak „prawdziwość”,„dowodliwość”, „rozstrzygalność”. czy „opisywalność” i badanie zależności między nimi.

Te badania przyniosły fantastyczne rezultaty. Ale też ukazały nieprzekraczalne ograniczeniajęzyka matematyki i metody aksjomatycznej. To zmusiło do rewizji pogladów na temat tego, czymwłasciwie jest matematyka. I to jest wielka zasługa Hilberta choć te rezultaty są okazały się odległeod z jego wyobrażeń, jego wizja matematyki. Odtąd matematyka nie może już być tak aroganckopewna, że „musimy wiedzieć i będziemy wiedzieć”. 52.

47Zainteresowanych bardziej finezyjnymi rozważaniami o związkach twierdzenia Godla z podziałem matematyki na„rzeczywistą” i idealną” odsyłam do [106]

48Sparafrazujmy złośliwie wypowiedź R. Symullyana: ,Nie jest tak, że nie potrafimy dowieść niesprzeczności mate-matyki: to matematyka nie potrafi dowieść swej niesprzeczności”.

49W.I. Lenin50Żaden matematyk nie ośmieli się powiedzieć, że twierdzenie jest prawdziwe, jeśli nie zna jego dowodu.51Co w języku suahili można powiedzieć o różnych rodzajach śniegu tak precyzyjnie opisywanych przez Eskimosów

(prawdopodobnie)?52Potwierdzeniem roli Hilberta w zainicjowaniu tych badań jest to że na liście 23 najważniejszych problemów -

zadań matematyki w XX wieku umieścił on m.in. rozstrzygnięcie hipotezy continnum (I problem), udowodnienie nie-sprzecznosci arytmetyki (II problem) czy też wskazania procedury rozwiązywania dowolnych równań diofantycznych(X problem).

Page 152: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 8. TWIERDZENIA GODLA 151

Na koniec uwaga: to, że arytmetyka Peano (i każda teoria aksjomatyczna ją zawierająca) oka-zała się nierozstrzygalna, komentuje się czasem tak: „to i dobrze, bo cóż ciekawego w świecie,gdzie o wszystkim rozstrzyga komputer”. Nie tak prosto. Dla wspomnianej wcześniej rozstrzygal-nej arytmetki Presburgera53 udowodniono taki oto fakt (Fischer i Rabin (1974)):„Każdy algorytmrozstrzygający, czy twierdzenie jest dowodliwe w arytmetyce Presburgera, musi wykonać w pesy-mistycznym przypadku co najmniej 22cn kroków” (gdzie n jest długością twierdzenia a c > 0 jestpewną stałą.) Dla porównania: analogiczne oszacowanie dla rachunku zdań wynosi 2n...

Z drugiej strony, jak gdzieś wyczytałem, podobno Hilbert nigdy nie zacytował wyników Godla...53Przypomnijmy, że jest to teoria złożona tych formuł arytmetycznych, które są prawdziwe w N ale w których

budowie nie używamy mnożenia.

Page 153: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 9

Wokół koncepcji prawdy Tarskiego

Powiedzieć, że istnieje, o czymś, czego nie ma, jestfałszem. Powiedzieć o tym, co jest, że jest, a o tym,czego nie ma, że go nie ma, jest prawdą.

„Metafizyka”, Arystoteles

„Wedle klasycznej definicji prawdy, prawdziwe lub fałszywe mogą być myśli. Niektórzy uważają,że myśl, jako przedmiot w umyśle, (...) niedostępny publicznie, nie może być nośnikiem prawdy.Publicznie dostępne mogą natomiast być przedmioty myśli. Według wielu filozofów są nimi:

- sądy (propositions), czyli przedmioty abstrakcyjne (...) . Sąd jest obiektywną treścią zdaniaoznajmującego, aczkolwiek między sądami a zdaniami nie zachodzi wzajemnie jednoznaczna odpo-wiedniość. Ten sam sąd można wyrazić za pomocą różnych zdań (np. w różnych językach), to samozdanie, przy różnych okazjach, może wyrażać różne sądy. (...) Można wątpić, (...) czy sądy spełnia-ją powszechnie akceptowane w ontologii Parmenidesa kryterium istnienia (istnieć = zachowywaćtożsamość, być identycznym z samym sobą). Takich wątpliwości nie budzą zdania, ponieważ sąprzedmiotami fizycznymi: napisami lub ciągami dźwięków. (...) Koncepcja, wedle której nośnikamiprawdy są zdania, znakomicie pasuje do języków rachunków logicznych i teorii matematycznych.Natomiast zdania języka potocznego mają tę niemiłą cechę, że zawierają wyrażenia okazjonalne, naprzykład „ja”, „dziś”, „tu”, „to”, które przy różnych okazjach mają różne znaczenia. Zdania takie,na przykład „Dzisiaj jest piątek”, jest czasem prawdziwe, zaś przez sześć dni w tygodniu fałszywe.Żeby uniknąć kłopotów z okazjonalnością, W.V.O. Quine (...) zaproponował, żeby zdania językapotocznego uznać za skróty zdań wiecznych.

Zdanie wieczne jest to takie zdanie, w którym nie występują wyrażenia okazjonalne i dlategoich prawdziwość nie zależy od tego, kto je wypowiada, kiedy, ani gdzie (...)1

Wystarczy. Widać, jak wielu ustaleń trzeba po to tylko, by zacząć dyskusję o „prawdziwości”.Nie jestem aż tak naiwny (zarozumiały) by podjąć próbę odpowiedzi na pytanie „czym jest prawdai jak ja poznawać?”. Zainteresowanych odsyłam np. do (niematematycznego) dzieła J. Wolańskiego„Epistemologia. Poznanie, prawda, wiedza, realizm”. Moje ambicje ograniczam do naszkicowaniapodstawowych ustaleń i wskazania wątpliwości związanych z „prawdą matematyczną”. Dlatego zprzytoczonego fragmentu wybieram tylko jedno zdanie:

„Koncepcja, wedle której nośnikami prawdy są zdania, znakomicie pasuje do języków rachunkówlogicznych i teorii matematycznych.”2

9.1 Koncepcja Tarskiego

Zdanie prawdziwe to zdanie, które wyraża, że tak a tak rzeczysię mają, i rzeczy mają się tak właśnie. - A. Tarski3

1Fragmenty wykładu A. Groblera - (http:// adam-grobler.w.interia.pl/Epi4.html).2„W zdaniu myśl wyraża się w sposób zmysłowo postrzegalny” - L.Wittgenstein.3Alfred Tarski (1901-1983) polski matematyk i filozof pochodzenia żydowskiego, od 1939 roku w USA.

152

Page 154: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 153

Zadowalamy się szukaniem prawdy w odpowiedniościmiędzy zdaniami w umyśle a rzeczami, o które chodzi.

G.W. Leibniz (Nowe rozważania).

Dyskusja nad pojęciem prawdy w słynnej pracy Tarskiego „The semantical conception of true”[118] zaczyna się tak:(...). Consider the sentence ”snow is white.” We ask the question under what conditions this sentenceis true or false. It seems clear that if we base ourselves on the classical conception of truth, we shallsay that the sentence is true if snow is white, and that it is false if snow is not white. Thus, if thedefinition of truth is to conform to our conception, it must imply the following equivalence:

The sentence ”snow is white” is true if, and only if, snow is white.

Let me point out that the phrase ”snow is white” occurs on the left side of this equivalence inquotation marks, and on the right without quotation marks. On the right side we have the sentenceitself, and on the left the name of the sentence.

Employing the medieval logical terminology we could also say that on the right side the words”snow is white” occur in suppositio formalis4, and on the left in suppositio materialis5. It is hardlynecessary to explain why we must have the name of the sentence, and not the sentence itself, onthe left side of the equivalence. For, in the first place, from the point of view of the grammarof our language, an expression of the form ”X is true” will not become a meaningful sentenceif we replace in it ’X’ by a sentence or by anything other than a name – since the subject of asentence may be only a noun or an expression functioning like a noun. And, in the second place,the fundamental conventions regarding the use of any language require that in any utterance6 wemake about an object it is the name of the object which must be employed, and not the objectitself. In consequence, if we wish to say something about a sentence, for example, that it is true,we must use the name of this sentence, and not the sentence itself. The problem of the definitionof truth obtains a precise meaning and can be solved in a rigorous way only for those languageswhose structure has been exactly specified. For other languages – thus, for all natural, ”spoken”languages – the meaning of the problem is more or less vague7, and its solution can have onlyan approximate character. Roughly speaking, the approximation consists in replacing a naturallanguage (or a portion of it in which we are interested) by one whose structure is exactly specified,and which diverges from the given language ”as little as possible”.

Aby wyeliminować niejasności spowodowane, być może, zmaganiami z obcym językiem, dodaj-my podobny fragment z pracy A. Tarskiego „Truth and Proof” (z moimi skrótami):

Weźmy pod uwagę pewne zdanie w języku polskim, którego sens nie budzi wątpliwości, np.zdanie ”śnieg jest biały”. Umawiamy się, że zdanie to będziemy oznaczać przez „8”. Stawiamysobie pytanie: co mamy na myśli mówiąc, że „8” jest zdaniem prawdziwym lub też jest zdaniemfałszywym? (...) , mówiąc że „8” jest zdaniem prawdziwym, mamy po prostu na myśli, że śnieg jestbiały, a mówiąc, że „8” jest zdaniem fałszywym, mamy na myśli, że śnieg nie jest biały. Eliminując„8” uzyskujemy następujące sformułowania:

(1) ”śnieg jest biały” jest zdaniem prawdziwym wtedy i tylko wtedy, gdy śnieg jest biały;(1’) ”śnieg jest biały” jest zdaniem fałszywym wtedy i tylko wtedy, gdy śnieg nie jest biały.(...) Możemy uważać (1) i (1’) za cząstkowe definicje terminów ”prawdziwy” i ”fałszywy” - za

definicje tych terminów w odniesieniu do pewnego konkretnego zdania. Zauważmy, że (1), podobniejak (1’), ma postać narzuconą definicjom przez reguły logiki (...) - postać równoważności logicznej.Lewa strona (równoważności) jest to definiendum, czyli zwrot, którego znaczenie jest wyjaśnioneprzez definicję; prawa strona jest to definiens, czyli zwrot, który wyjaśnia to znaczenie. W obecnymprzypadku definiendum jest następującym wyrażeniem:

”śnieg jest biały” jest zdaniem prawdziwym;4GJ: „Brane w znaczeniu formalnym”5GJ: „Brane w znaczeniu materialnym”6wypowiedź7niejasny

Page 155: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 154

definiens zaś ma postać: śnieg jest biały.

Na pierwszy rzut oka może się wydać, że zdanie (1) traktowane jako definicja zawiera podstawowybłąd, znany jako błędne koło. Chodzi o to, że pewne słowa, np. ”śnieg”, występują („,) po obustronach równoważności. W rzeczywistości jednak występują one tam w zupełnie różnych rolach.

Prawa strona zawiera słowo „śnieg” jako syntaktyczną część: definiens jest zdaniem, a sło-wo „śnieg” jest jego podmiotem. Lewa strona jest również zdaniem. Głosi ono, że prawa stronajest zdaniem prawdziwym. Podmiotem tego zdania jest nazwa zdania stojącego po prawej stronieutworzona przez ujęcie go w cudzysłów. (...) Wyrażenie ujęte w cudzysłów powinno być traktowa-ne gramatycznie jako pojedyncze słowo nie mające części syntaktycznych. W szczególności słowo”śnieg”, nie jest jego częścią syntaktyczną (...) Logik średniowieczny powiedziałby, że w definiens„śnieg” występuje in suppositione formalis, w definiendum zaś in suppositione materialis. Słowa,które nie są syntaktycznymi częściami definiendum, nie mogą jednak być źródłem błędnego koła iniebezpieczeństwo błędnego koła znika.8

Uchwyćmy, co najistotniejsze:1. Tarski nie próbuje definiować prawdy. Jego celem jest określenie zasad, na których powinno sięopierać dociekanie o prawdziwości zdania9. Dodajmy: zdania języka formalnego (pierwszego rzędu)a nie naturalnego.2. Istotą koncepcji Tarskiego jest rozdział języka zdań, których prawdziwość nas interesuje odjęzyka, w którym tej prawdziwości chcemy dociekać10.

9.2 Syntaktyka - składnia języka pierwszego rzędu

Define a full logic to be a language, together with adeductive system and a semantics.

S. Shaprio [103]

Budowę języka pierwszego rzędu zaczynamy od arbitralnego ustalenia słownika (sygnatury) -zbioru symboli relacyjnych - R , symboli operacyjnych - Ω i stałych - C. Z każdym symbolemrelacyjnym i operacyjnym wiążemy liczbę naturalną zwaną jego argumentowością (arnością)11

Przyjmijmy, że Σ = (R = (Rn : n ∈ N), C,Ω = (Ωn)) jest takim ustalonym słownikiem.Z symboli operacyjnych, stałych i zmiennych przedmiotowych budujemy termy: 12

- zmienne i stałe to termy,- jeżeli t1 . . . , tk są termami i q ∈ Ωk, to napis q(t1, . . . , tk) jest termem.

Z symboli relacyjnych i termów budujemy formuły. Najpierw formuły atomowe. Są to:

- równości (t1 = t2) ,- napisy postaci r(t1, . . . , tn), gdzie r ∈ Rn a t1, . . . tn są termami.

Z formuł atomowych konstruujemy - rekurencyjnie - formuły złożone korzystając ze spójnikówzdaniowych i kwantyfikatorów:

- jeżeli napisy φ i ψ są formułami, to są nimi również napisy ¬φ, (φ ∧ ψ), (φ ∨ ψ) oraz (φ→ ψ),- jeżeli napis φ jest formułą a x jest zmienną przedmiotową, to napisy ∀xφ, ∃x φ są formułami (wktórych zmienna x jest teraz związana)

8„Scientific American”, t. 220, 1969, nr.6 w tłum. J. Zygmunta (tłumaczenie dostępne w internecie)9„What is for a proposition to be true”.

10Znawcy przedmiotu mówią, że koncepcja prawdy Tarskiego wpisuje się w ogólne pojęcie „korespondencyjnegopojęcia prawdy”. Autorstwo tego terminu J. Wolański przypisuje Joachimowi, filozofowi brytyjskiemu z początkuXX wieku. Ale źródeł tej koncepcji można doszukiwać się u Arystotelesa. Tarski określenia „korespondencyjna”,„sematyczna”, „klasyczna” (teoria prawdy) uznawał za synonimy. Istotą tej koncepcji jest to, że „prawdziwość” jestłącznikiem między słowami a światem.

11Słownik dobieramy stosownie do celu badań. Np. gdy chcemy mówić o porównywaniu elementów, to powinniśmydysponować predykatem dwuargumentowym (zazwyczaj sugestywnie oznaczanym przez „¬”).

12Termy to schematy nazw - formuły nazwowe (str. 73). Termy domknięte (te, w których nie ma zmiennych) tonazwy złożone. „Stałe” to nazwy proste.

Page 156: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 155

I tak, jeżeli np. p, q, r są symbolami relacyjnymi odpowiedniej arności a x, y, z - zmiennymiprzedmiotowymi, to napis

∀x(∃y(p(x) ∨ q(x, y))→ (∃z ¬r(z, z)))jest poprawnie zbudowaną formułą.

Zdanie pierwszego rzędu to formuła, w której wszystkie zmienne są związane.

Logika pierwszego rzędu to język formuł wraz z jego wewnętrzną logiką - systemem dowodzenia. Tę logikęoznaczamy symbolem FOL („First Order Logic”)13.

9.3 Modele logiki pierwszego rzędu

Zdanie może być prawdą lub fałszem tylkodzięki temu, że jest obrazem rzeczywistości

L. Wittgenstein

Prawdziwość zdania polega na jego zgodności( korespondencji) z rzeczywistością”

A. Tarski

Pierwotny model logiki

Modelem każdego języka jest nasz świat. Skromniej - fragment rzeczywistości, który jest źródłemznaczeń dla formalnie poprawnych wyrażeń. Jeżeli w języku polskim jest fraza „śnieg jest biały” todlatego, że rzeczywistość pozwala na interpretację terminów „śnieg” i „biały”14.Możemy zamienić rzeczywistość fizyczną na rzeczywistość cywilizacyjną czy też kulturową - wszaknasze języki nie ograniczają się do opisu zjawisk fizycznych. Jednak, by być w zgodzie z Tarskim,jedno założenie jest niezbywalne: język, któremu chcemy nadać znaczenia nie może być częścią tegoświata, w którym będziemy szukać jego znaczeń.

Przypisywanie napisom (słowom) znaczeń nie jest proste. Przynajmniej w odniesieniu do ję-zyków naturalnych. Spory interpretacyjne - „co on (ona) chciała przez to powiedzieć”?- są nieod-łącznym atrybutem procesu komunikowania (kłótni). Ta cecha języków naturalnych dopuszczającasubiektywizm interpretacji jest nam niezbędna jak tlen15. Ale nie wtedy, gdy chodzi o obiektywnyprzekaz adresowany „do wszystkich”. Stąd potrzeba ścisłego zdefiniowania, co rozumiemy przezinterpretację, czyli model języka pierwszego rzędu:

Skończony model języka pierwszego rzędu sygnatury Σ to dowolny skończony i niepusty zbiórA, w którym zinterpretowano każdy n-argumentowy symbol relacyjny r jako pewien podzbiórrA ⊆ An = A× · · · ×A︸ ︷︷ ︸

n

, każdy n-argumentowy symbol operacyjny q jako funkcję q : An → A a

każdej stałej c ∈ C przyporządkowano element cA ∈ A:

A =(A, (rA : r ∈ R), (qA : q ∈ Ω), (cA : c ∈ C)

)13„The notion of formal system is the central concept in any formalistic view of mathematics. Such a system is

characterized by the fact that the process of proof is specified by explicitly stated rules. The initial conventionsspecifying such a formal system (...) will consist of three kinds of conventions (...):- First we shall have conventions stating what the objects of the theory, which I shall call its terms, shall be. Theseconventions will consist of a list of primitive terms, a list of operations for the formation of further terms and a setof rules of formation describing how new terms are to be formed from the primitive ones (...).”- Next we have conventions specifying a set of propositions, which I shall call elementary propositions, concerningthe terms. Ordinarily (...) an elementary proposition is formed by applying a predicate to the appropriate number ofterms as arguments.- Finally we have specifications determining which of the elementary propositions are true. A certain set of theseelementary propositions, called axioms, are stated to be true outright; and specific rules of procedure are given whichare to determine how the derivation of new elementary theorems is to proceed. This process amounts to a recursivedefinition of the elementary theorems” - H. Curry [24]. FOL nazywana jest też logiką (lub rachunkiem) predykatów.

14Gdyby Tarski nie urodził się w Polsce a np. w Egipcie, to nie uczynił by swoim sztandarowym przykładem zdania„śnieg jest biały”...

15Mówiąc naukowo: formalny język matematyki stara się pominąć to, co językoznawcy nazywają pragmatyką języka.

Page 157: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 156

Model języka to wyróżnienie pewnego zespołu ekstensjonalnie rozumianych własności czyli (pod)zbiorówskończonych układów elementów wskazanego a priori skończonego zbioru A. Definiując model „posado-wiony na zbiorze A” przypisujemy tym wyróżnionym własnościom nazwy - symbole relacyjne.Nazywanie jest początkiem poznania.

Podzbiór [[φ]] ⊆ An przyporządkowany formule φ(x1, . . . , xn) o n zmiennych wolnych w modeluA to zbiór desygnatów własności opisanej przez tę formułę.Opiszemy to przyporządkowanie w sposób nieco odmieny od powszechnie przyjętego16. Zaczniemytak: wskazanie (skończonego) zbioru A - to de facto wyróżnienie pewnej elementarnej struktury -rodziny zbiorów i funkcji, na którą składają się:

- wszelkie skończone potęgi kartezjańskie zbioru A - zbiory An,- rodziny zbiorów (Sub(An) : n ∈ N) złożone z podzbiorów tych kartezjańskich potęg wraz z

operacjami sumy, przekroju dopełnienia i implikacji,- opisane wcześniej funkcje ∀n,∃n : An → An−1 17,

Interpretację formuł w modelu A opiszemy (rekurencyjnie) odwołując się do tej struktury:

- [[r(x1, . . . , xn)]] = rA , dla każdego symbolu relacyjnego r ∈ R,

- [[x = y]] = (a, a) : a ∈ A,dla dowolnych formuł φ(x1, . . . , xn), ψ(x1, . . . , xn):

- [[φ ∧ ψ]] = [[φ]] ∩ [[ψ]] , [[φ ∨ ψ]] = [[φ]] ∪ [[ψ]] , [[φ→ ψ]] = [[(φ)]]→ [[ψ]],

- [[¬φ]] = ¬[[φ]] (= An \ [[φ]]),

- [[∀xnφ(x1, . . . , xn−1, xn)]] = ∀n([[φ(x1, . . . , xn)]]) , [[∃xnφ(x1, . . . , xn−1, xn)]] = ∃n([[φ(x1, . . . , xn)]]).

Powiemy, że:- formuła φ(x1, . . . , xn) jest prawdziwa w modelu A gdy [[φ]] = An,- formuła φ(x1, . . . , xn) jest spełniona w modelu A gdy [[φ]] 6= ∅ 18

- ciąg elementów (a1, . . . , an) ∈ An ma własność opisaną przez formułę φ(x1, . . . , xn) gdy należy dopodzbioru [[φ]] 19.

Semantyka dowolnego zdania φ (formuły bez wolnych zmiennych) to podzbiór zerowej potęgikartezjańskiej A0 czyli - na mocy definicji - zbioru jednoelementowego20. A0 ma tylko dwa podzbiory- zbiór pusty i zbiór A0. Jeżeli [[φ]] = A0 to mówimy, że zdanie φ jest prawdziwe. W przeciwnymprzypadku jest fałszywe.

Ostatecznie możemy zaproponować taką semantyczną definicję prawdziwości:zdanie języka pierwszego rzędu jest prawdziwe, gdy jest prawdziwe w każdym (skończonym)

modelu tego języka.

Zero metafizyki...

Kolejna definicja nie wymaga komentarza:

modelem teorii T nazywamy każdy model, w którym wszystkie zdania zbioru T są prawdziwe.

Spełnialność formuł i prawdziwość zdań w pojedynczym skończonym modelu są rozstrzygalne.

16Aby nieco uprościć formalny opis reguł rządzących tym przyporzadkowaniem (nie gubiąc wszak istoty rzeczy...)zakładamy - na chwilę! - że w słowniku Σ rozważanego języka nie ma symboli operacyjnych ani stałych.

17Operacje sumy, przekroju i dopełnienia wszyscy znają. A implikację definiujemy tak: dla dowolnych podzbiorówB,C ⊆ An ,B → C = a ∈ An : jeżeli a ∈ B, to a ∈ C (= ¬B ∪ C) . Funkcje związane z kwantyfikacją opisałemwcześniej (str. 79). Wprawdzie nieco zmieniłem oznaczenia ale nie zmieniłem sensu (wystarczy przyjąć B = An−1 bydostrzec, że nic się w istocie nie zmieniło).

18Oczywiście φ jest prawdziwa dokladnie wtedy, gdy ¬φ nie jest spełniona.19Logicy mówią też, że wtedy formuła φ(x1, . . . , xn) jest spełniona przy wartościowaniu [x1 := a1, . . . xn := an], i

piszą A |= φ(x1, . . . , xn)[x1 := a1, . . . xn := an].20Zerową potęgą liczby jest 1. Zerową potęgą zbioru jest zbiór jednoelementowy.

Page 158: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 157

Skończonych modeli języka jest przeliczalnie wiele21. Zatem zbiór zdań, które nie są prawdziwejest rekurencyjnie przeliczalny. Gdyby zbiór zdań prawdziwych był też rekurencyjnie przeliczalnyto moglibyśmy rozstrzygać o tak rozumianej matematycznej prawdzie.Niestety. B. Trakhtenbrot22 pokazał, że:

„jeżeli w rozważanym języku pierwszego rzędu mamy choćby jeden symbol relacyjny, który niesą jednoargumentowy, to zbiór zdań prawdziwych we wszystkich skończonych modelach tego językanie jest rekurencyjnie przeliczalny”.

Prawdziwość zdań języka pierwszego rzędu definiowana poprzez odwołanie do skończonych modeli niejest dowodliwa. W żadnym hilbertowskim systemie dowodzenia!23

9.3.1 Teoriomnogościowe modele języka pierwszego rzędu

By powiedzieć, czym jest teoriomnogościowy model języka pierwszego rzędu, wystarczy powtórzyćdefinicję modelu skończonego, pomijając słowo „skończony”.

Niezbyt fascynujące. Wręcz nudne24. Ale ten prosty zabieg jest jednak mniej prosty, niż sięzdaje. A to dlatego, że w modelu nieskończonym - w odróżnieniu od modelu skończonego - zbiórdesygnatów dowolnej formuły nie musi być rozstrzygalny!

Wprowadzając do rozważań o „prawdziwości zdań” modele nieskończone przekraczamy cienką czerwonąlinię między matematyką obliczeń a teoriomnogościową matematyką Cantora i Hilberta. Model przestajebyć „konkretem” w którym o prawdziwości zdań możemy rozstrzygać za pomocą procedur obliczeniowych.Procedur obiektywnych w tym sensie, że niezależnych od języka opisu modelu25.Czy to nie podważa sensu rozważania fundamentalnego problemu prawdziwości zdań w dowolnymteoriomnogościowym modelu?

9.3.2 Jeszcze jedno twierdzenia Godla„Aby badać matematykę, badamy jej przybliżenia wy-rażone w językach pierwszego rzędu” - R. Drake.

Wrócimy do tego pytania już za chwilę26. Ale najpierw zajmijmy się tym co równie istotne i oczym można mówić bez wnikania w te subtelności.

Modele skończone to podklasa wszystkich modeli teoriomnogościowych danego języka. Ponieważpowiedzieliśmy („uznaliśmy paradygmat”), iż „zdanie jest prawdziwe, gdy jest prawdziwe w każdymmodelu”, to zdań prawdziwych jest teraz mniej niż przed chwilą, gdy prawdziwość definiowaliśmyodwołując się do modeli skończonych.

Zmieniając definicję modelu zmieniamy pojęcie prawdy... „Zdanie może być prawdą lub fałszemtylko dzięki temu, że jest obrazem rzeczywistości” pisał Wittgenstein. Czy zmieniliśmy „rzeczywistość”?

Prawda definiowana przez odwołanie do modeli skończonych nie jest dowodliwa. Co się zmieni potej „ucieczce do przodu”? Czy teraz możliwa jest wymarzona przez Hilberta równość (semantyczna)prawdziwość = (syntaktyczna) dowodliwość?

Uporządkujmy terminolgię. Przyjmijmy, że (Ax,RFOL) jest pewnym systemem dowodzenia dla

21Można je ustawić w kolejkę, ponumerować.22Boris (Boaz) Avraamovich Trakhtenbrot (1920-2016) rosyjski logik pochodzenia żydowskiego.23Zdania dowodliwe tworzą zawsze zbiór rekurencyjnie przeliczalny.24Poloniusz: Cóż czytasz, mości książę? Hamlet: Słowa, słowa, słowa.25Model skończony możemy „włożyć do komputera” i rozstrzygać o prawdziwości zdań za pomocą odpowiednich

programów. Model nieskończony już nie.26W podrozdziale „Nominalizm Tarskiego”.

Page 159: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 158

logiki pierwszego rzędu27. Sformułowanie jakiejkolwiek niesprzecznej aksjomatycznej teorii pierw-szego rzędu T to w istocie wskazanie nowego systemu dowodzenia o zbiorze aksjomatów Ax ∪ T .Zbiór T to aksjomaty specyficzne, a zbiór Ax to aksjomaty logiczne tej teorii28.

Dla każdej teorii T która ma teoriomnogościowe modele, można mówić o dwóch rodzajachkonsekwencji:

zdanie φ jest konsekwencją logiczną (syntaktyczną) T , gdy ma dowód w systemie formalnym(Ax ∪ T,RFOL). Piszemy wówczas T ` φ i mówimy, ze zdanie φ jest - w teorii T -dowodliwe.

zdanie φ jest konsekwencją semantyczną T , gdy jest prawdziwe w każdym teoriomnogościowymmodelu teorii T . Piszemy wówczas T |= φ i mówimy, że zdanie φ jest - dla teorii T - prawdziwe30.

Implikacja (T ` φ) =⇒ (T |= φ) - „to, co dowodliwe, jest prawdziwe” - funkcjonuje pod nazwą„twierdzenia o zgodności”. Zgodność jest niezbędna, by logika mogła pełnić oczekiwaną rolę: jakisens - poza polityką - ma dowodzenie głupstw (zdań fałszywych)?31.

Twierdzenie o zgodności „obowiązuje” dla dowolnej teorii pierwszego rzędu.

Spełnienie hilbertowskiego postulatu sprawowania finitarnej kontroli nad (teoriomnogościową)matematyką sprowadza się do pytania: czy odwrotna implikacja

T |= φ =⇒ T ` φjest prawdziwa? Jeśli tak jest, to teorię T nazywamy zupełną.

Czy logika pierwszego rzędu jest mocno zupełna tzn. czy dowolna teoria pierwszego rzędu jestzupełna? Odpowiedź jest pozytywna a zawdzięczamy ją ... Godelowi.

Między dwoma twierdzeniami Godla - o niezupełności arytmetyki i zupełności FOL nie ma sprzeczności.Upewnijmy się, że to rozumiemy:Pierwsze twierdzenie mówi, że zdania arytmetyczne prawdziwe w pojedynczym modelu - standardowymmodelu liczb naturalnych von Neumanna - nie muszą być dowodliwe.A twierdzenie o zupełności odniesione do arytmetyki Peano mówi tyle, że każde zdanie prawdziwe wewszystkich modelach tej teorii, ma dowód w PA.To tylko potwierdza, co już wiemy: PA nie jest teorią kategoryczną - ma wiele modeli32.

Oryginalny dowód twierdzenia o mocnej zupełności logiki pierwszego rzędu przedstawiony przezGodla był tak skomplikowany, że zrozumiało go niewielu. Wśród nich zapewne Henkin, który za-proponował własny, oryginalny dowód. W istocie Henkin udowodnił więcej - pokazał, że:

jeżeli teoria jest niesprzeczna, to posiada model teoriomnogościowy.

Czy teoria musi być niesprzeczna? Pytanie na pozór absurdalne: skoro w ramach sprzecznej teorii możnadowieść wszystkiego, to po co się nią zajmować? Jeśli wiemy, że teoria jest sprzeczna, to należy jąporzucić.

A jeśli nie wiemy? Godel pokazał, że jesteśmy skazani na taką niewiedzę - niesprzeczność teorii (wystar-czająco bogatej, czyli zawierającej arytmetykę) jest zawsze względna. Dowód niesprzeczności

27Takich (równoważnych) systemów dla FOL jest wiele. Ich opisy można znaleźć w podręcznikach logiki. Wystarczyteż przeszukać internetu pod hasłem „first order logic”. Konkretny kształt wybranego systemu nie jest dla nas w tejchwili ważny. Powiedzmy tylko, że wszelkie prawa klasycznego rachunku zdań obowiązują w FOL.

28Dlaczego teoria to jedynie rozszerzenie zbioru aksjomatów? Dlaczego tworząc teorię nie dodajemy również „spe-cyficznych” reguły dowodzenia? Nieco upraszczając: w zbiorze reguł każdego hilbertowskiego systemu dowodzenia dlaFOL jest reguła odrywania - „modus ponens”29. Dzięki niej można każdą potencjalną „specyficzną” regułę dowodzeniap1...pkk

zastąpić kolejnym aksjomatem specyficznym p1 ∧ . . . ∧ pk → k.30Nie zapominajmy jednak, że ta prawdziwość to w istocie dowodliwość w ramach teorii mnogości.31Kant pisał: Prawda jest zgodnością poznania z jego przedmiotem.. Jeśli „poznaniem” jest dowodzenie w języku

teorii a „przedmiotem” - teoriomnogościowe modele, to twierdzenie o zgodności jest realizacją postulatu Kanta.32Oba twierdzenia - o zupełności FOL i niezupełności PA - Godel przedstawił na konferencji we wrześniu 1930 roku

w Królewcu. Pierwsze twierdzenie przedstawił w obecności Hilberta, który - jak się można domyślać - przyjął tenwynik z ogromną satysfakcją. I wyjechał. Tymczasem tuż przed końcem konferencji Godel wystąpił ponownie, tymrazem z twierdzeniem o niezupełności arytmetyki. Może lepiej, że Hilbert wyjechał...

Page 160: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 159

takiej teorii musi odwoływać się do innej, której niesprzeczność jest równie wątpliwa33. Czy powinni-śmy zajmować się teoriami, których niesprzeczność nie jest pewna? Pytanie bez głębszego sensu jeśliprzypomnieć, że tysiące matematyków codziennie korzysta z teorii mnogości...

Istotę dowodu Henkina można opisać tak: jeśli teoria T napisana w języku sygnatury Σ mamodel A, to można ją rozszerzyć do maksymalnej i niesprzecznej teorii TA - zbioru wszystkichzdań prawdziwych w A. Co więcej, dla dowolnego zdania postaci ∃x φ(x) ∈ TA istnieje elementaφ ∈ A taki, że formuła φ(x) jest spełniona przy wartościowaniu [x := aφ]. Tym samym A możebyć traktowany jako model języka sygnatury Σ wzbogaconej o nową stałą cφ

34 a zdanie φ(cφ)(otrzymane z φ(x) przez zastąpienie zmiennej x stałą cφ) jest prawdziwe w A.

Henkin odwrócił kierunek myślenia: pokazał, że każą niesprzeczną teorię T można uzupełnić domaksymalnej niesprzecznej teorii Tm napisanej w języku rozszerzonym o nowe stałe i takiej, żekażde zdanie egzystencjalne ∃x φ(x) w Tm ma „świadka” - stałą cφ taką, że zdanie φ(cφ) ∈ Tm.I zrobił to bez założenia, że teoria T ma model35.Druga część dowodu jest już łatwiejsza(sic!) - Henkin pokazał, jak zbudować model teorii T korzy-stając ze stałych występujących w zdaniach teorii Tm

Jak z twierdzenia Henkina wydedukować zupełność dowolnej teorii pierwszego rzędu?Przyjmijmy, że pewne zdanie φ jest prawdziwe we wszystkich modelach teorii T a nie jest konse-kwencją logiczną tej teorii. Wówczas teoria T ∪ ¬φ jest niesprzeczna36 a więc - na mocy twier-dzenia Henkina - ma model A. Ale w tym modelu byłoby prawdziwe zdanie φ (gdyż A to też modelT ) i jego zaprzeczenie ¬φ. A to jest niemożliwe.

Twierdzenie o mocnej zupełności FOL i twierdzenie Godla-Henkina cieszy zwolenników hilbertowskiejkoncepcji matematyki, gdyż mogą je uznać za dowód dwóch fundamentalnych dla nich równości:

niesprzeczność (teorii) = istnienie (modelu) prawdziwość = dowodliwość

Dodatkową radość sprawia im fakt, że ten dowód wymaga uznania nieskończoności aktualnej.Wszystko się pięknie składa w całość... I tylko ta niezupełność arytmetyki...

Zbiór konsekwencji dowolnej teorii aksjomatycznej T jest częściowo rekurencyjny. To wiemy. Amoże jest on wręcz zbiorem rekurencyjnym? Nie ma tak dobrze. Mówi o tym twierdzenie Churcha:

Logika pierwszego rzędu jest nierozstrzygalna - nie istnieje procedura pozwalająca rozstrzygać,czy dowolne zdanie pierwszego rzędu jest konsekwencją danej teorii T .

Church skorzystał tu ze znanej nam już metody sprowadzania problemu (o którego nierozstrzy-galności chcemy orzec) do innego, o którym wiemy, że jest nierozstrzygalny. W roli tego drugiegowystąpił ponownie problem stopu a właściwie pewna jego odmiana - problem „ czy maszyna Mzatrzyma się, rozpoczynając pracę z pustą taśmą”37. Szkic dowodu: z każdą maszyną Turinga o Mwiążemy zdanie φM (w odpowiednio dobranej sygnaturze) które ma model dokładnie wtedy, gdymaszyna M nie zatrzyma się rozpoczynając pracę z pustą taśmą. Zupełność FOL pozwala zapisaćtę równoważność tak: maszyna M nie zatrzyma się rozpoczynając pracę z pustą taśmą dokładniewtedy, gdy ¬φM nie ma dowodu. Gdybyśmy potrafili rozstrzygać czy dowolne zdanie ma dowód,to potrafilibyśmy również rozstrzygać problem stopu...38

33Wskazanie (konstrukcja, udowodnienie istnienia) teoriomnogościowego modelu danej teorii pierwszego rzędu jesttakim „zewnętrznym”, bo odwołującym się do teorii mnogości, dowodem jej niesprzeczności.

34Wystarczy tę stałą interpretować jako element aφ.35Dowód istnienia rozszerzenia Tm nie ma nic wspólnego z przedstawieniem procedury konstrukcji takiego rozsze-

rzenia. Henkin wykorzystał tu jeden z aksjomatów teorii zbiorów - pewnik wyboru.Gdyby ten dowód był konstruktywny, to nie byłoby żadnego problemu np. ze znalezieniem przeliczalnego modeluteorii zbiorów... (chyba, że jest ona sprzeczna).

36Gdyby była sprzeczna, to T ∪ ¬φ ` ⊥, czyli T ` ¬¬φ i tym samym T ` φ , wbrew założeniu.37Gdyby ten problem był rozstrzygalny to i ogólny problem stopu byłby rozstrzygalny. A to nie jest prawda.38Istota dowodu to (żmudna) konstrukcja zdania φM . Zainteresowanych szczegółami odsyłam np. do pracy Unde-

cidability of First-Order Logic (G.Bezhanishvili, L.S. Moss) dostępnej w internecie.

Page 161: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 160

9.3.3 Ograniczenia języka pierwszego rzędu

Twierdzenia Godla wskazały nieprzekraczalne ograniczenia języka pierwszego rzędu jako narzędziaopisu (nietrywialnej, czyli zawierającej arytmetykę) matematyki.Analiza koncepcji modelu teoriomnogościowego pozwala na ujawnienie dalszych. O pewnych jużwspomnieliśmy (twierdzenie Trakhtenbrota, twierdzenie Churcha o nierozstrzygalności FOL). Do-dajmy do tej listy ograniczeń jeszcze dwa.

RównośćGdyby tożsamość uznać za stosunek między tym, co „a” i „b” oznaczają, to(a = b) nie różniłoby się chyba od (a = a) jeżeli tylko (a = b) jest prawdą.Wyrażało by się w ten sposób pewien stosunek rzeczy do siebie samej,mianowicie taki, w jakim każda rzecz pozostaje sama do siebie, żadna zaśnie pozostaje do żadnej innej. Przez (a = b) chce się pewnie powiedzieć,że „a” i „b” oznaczają to samo, ale wtedy mówi się właśnie o znakachstwierdzając między nimi pewien stosunek.

„Sens i znaczenie” - G. Frege

Zajmijmy się dotąd pomijanymi termami i formułami-równościami termów.W modelach teoriomnogościowych termy - schematy nazwowe - interpretujemy jako funkcje:

semantyką termu o n zmiennych wolnych t(x1, . . . , xn) w modelu posadowionym na zbiorze A jestpewna, definiowana rekurencyjnie, funkcja t : An → A 39.

Semantyką formuły atomowej - równości termów t1(x1, . . . , xn) = t2(x1, . . . , xn) - jest zbiórciągów (a1, . . . , an) ∈ An takich, że elementy t1(a1, . . . , an) i t2(a1, . . . , an) są równe.

[[t1 = t2]] = (a1, . . . , an) ∈ An : t1(a1, . . . , an) = t2(a1, . . . , an)

Niech to nam nie umknie: równość w matematyce teoriomnogościowej nie jest „absolutna” lecz jestpojęciem definiowanym wewnątrz teorii mnogości40.Utożsamianie tej równości z wyimaginowaną, transcedentną równością obowiązującą w matematycznymuniwersum to tylko kolejny przejaw wyobrażenia, że teoria mnogości opisuje owo uniwersum..

Równość to relacja o szczególnym statusie. Jest uwidocznione w aksjomatyce FOL - są tamzdania-aksjomaty gwarantujące zwrotność, symetryczność, przechodniość i kongruentność równo-ści41 i aksjomat gwarantujący „wymienność” równych termów w formułach: (t1 = t2 → φ(. . . , t1, . . .)↔φ(. . . , t2, . . .) dla dowolnej formuły φ . Dlatego mówiąc o logice pierwszego rzędu używamy częstobardziej precyzyjnego określenia: logika pierwszego rzędu z równością.Czy wyróżnianie równości spośród innych symboli relacyjnych jest konieczne? Dlaczego nie traktuje-my równości jako jednego z wielu równouprawnionych symboli relacyjnych a pożądaną interpretacjętej relacji-równości nie wymusimy przez odpowiednie aksjomaty?Wypisane powyżej aksjomaty tego nie gwarantują42. Dodanie jakichkolwiek nowych aksjomatówpróbujacych „opisać równość” też nic nie da. Np. w języku, którego słownik to jeden jedyny dwuar-gumentowy symbolem relacyjny r niesposób wskazać formułę „bez równości”, która jest spełniona

39Semantykę najprostszych termów - q(x1, . . . , xn) gdzie q to n-argumentowy symbol operacyjny - determinujedefinicja modelu. Krok rekurencyjny opiszemy tak: gdy t(x1, . . . xn) = q(t1, . . . , tm) , to dla dowolnych elemen-tów a1, . . . , an ∈ A, t(a1, . . . an) = qA(t1(a1, . . . an), . . . , tm(a1, . . . , an) gdzie qA : An → A jest semantyką m-argumentowego symbolu operacyjnego q w rożwazanym modelu.

40Więcej o tym już wkrótce. Teraz powiedzmy tylko, że teoriomnogościowa równość jest zadekretowana i opisanaw postaci aksjomatu ekstensjonalności..

Skoro funkcje-semantyki termów nie muszą być obliczalne to zbiór - semantyka formuły atomowej t1 = t2 w danymmodelu-interpretacji - nie musi być rozstrzygalny ani nawet sprawdzalny. Takiej równości możemy tylko próbowaćdowodzić - w ZFC!.

41Patrz podrozdział „Więcej niż przykład - równoważność kontrolowana” - str. 195 .42Gdyby „równość” w aksjomatyce Peano była tylko relacją spełniającą te aksjomaty, to modelem tej teorii był-

by zbiór N z operacjami następnika, dodawania i mnożenia, w którym semantyką „równości” jest relacja mod2 -mmod2n wtw m− n jest liczbą parzystą.

Page 162: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 161

w modelu jednoelementowym i nie jest spełniona w dwuelementowym modelu A = (a, b, rA),gdzie rA = a, b × a, b.Natomiast formuła ∀x,y x = y jest spełniona tylko w modelu jednoelementowym... .

„Zamierzonej interpretacji” równości nie da się zagwarantować „syntaktycznie”.

Skończoność modeli teoriomnogościowych

Twierdzenie o zupełności to nie jedyna ważna konsekwencja twierdzenia Henkina. Inna to twier-dzenie o zwartości43.Dowód to konstrukcja finitarna - w jakimkolwiek dowodzie T ` φ wykorzystujemy tylko skończeniewiele aksjomatów teorii T 44. Dlatego sprzeczna teoria T - taka, w której dowodliwe jest zdaniefałszywe - musi zawierać skończoną i sprzeczną podteorię. Odwróćmy to: teoria jest niesprzeczna,jeśli tylko każdy jej skończony fragment jest niesprzeczny. Teraz, dzięki henkinowskiej równości„niesprzeczność teorii = istnienie modelu”, możemy sformułować twierdzenie o zwartości:

Jeżeli każdy skończony fragment teorii T ma model, to i cała teoria T ma model45

Co ciekawe, stąd już wynika, że każda teoria T , która ma dowolnie duże modele skończone, musimieć ... model nieskończony! Wystarczy rozważyć teorię T∞ = T ∪ φn : n ∈ N , gdzie

φn ≡ ∃x1,...,xn ∀i,j¬n xi 6= xj

Zdanie φn jest prawdziwe w modelu A wtedy, gdy ma on więcej niż n elementów. Zatem każdyskończony fragment teorii T∞ ma model. Tym samym - właśnie na mocy twierdzenia o zwartości -cała teoria T∞ ma model. A ten model musi być nieskończony!Przyjmując T = ∅. wnioskujemy, że:

skończoność nie jest opisywalna w języku pierwszego rzędu 46

Co więcej, w języku pierwszego rzędu nie potrafimy rozróżniać różnych rodzajów nie-skończoności. Mówi o tym takie oto twierdzenie Lowenheima-Skolema47:

„Jeśli teoria pierwszego rzędu ma jakikolwiek model nieskończony, to ma modele nieskończonedowolnej mocy”.

Uświadomijmy sobie (najprostsze) konsekwencje:- istnieje ciało przeliczalne, które ma wszystkie pierwszorzędowe własności ciała liczb rzeczywi-stych48,- istnieje obiekt mocy continuum (i każdej mocy większej), który jest modelem aksjomatyki Peano- łącznie z aksjomatem indukcji!- jeśli ZFC ma model, to ma również model przeliczalny. W tym modelu muszą być... zbiory nie-przeliczalne. Sprzeczność?49

Twierdzenie Godla o niezupełności pokazało, że język pierwszego rzędu jest zbyt słaby by jed-noznacznie opisywać nieskończone obiekty matematyczne. Twierdzenia Lowenheima-Skolema idzie

43Wspomnieliśmy już o tym twierdzeniu opowiadając o niestandardowym modelu arytmetyki Peano.44Nie wyprowadzajmy stąd wniosku, że każda teoria może być zastąpiona przez skończoną teorię!45Analogiczne twierdzenie obowiązuje dla logiki zdaniowej - „zbiór formuł zdaniowych jest spełniony, jeśli tylko

każdy jego skończony podzbiór jest spełniony”. Dowód tego twierdzenia wymaga jedynie wykorzystania indukcji ipewnej pomysłowości. Zachęcam. Baaardziej zaawansowanym podpowiem, że ten wynik jest też konsekwencją zwar-tości przestrzeni topologicznej 0, 1ω (przestrzeni Cantora).Większość matematyków kojarzy „zwartość” z topologią: („topologia jest zwarta, jeżeli część wspólna dowolnej nie-skończonej rodziny zbiorów domkniętych jest pusta tylko wtedy, gdy pewna jej skończona podrodzina ma przekrójpusty”). Jeśli oznaczymy przez Mod(T ) klasę modeli teorii T , to twierdzenie o zwartości możemy zapisać tak:

Mod(T ) = ∅ ⇔ istnieje skończony podzbiór T0 ⊂ T taki, że Mod(T0) = ∅46Bardziej precyzyjnie: w języku danej pierwszorzędowej teorii T nie można sformułować warunku gwarantującego

skończoność jej wszelkich teoriomnogościowych modeli. Nie ma tu żadnej sprzeczności z tym, że w teorii ZFC możemyzdefiniować zbiory skończone... .

47Albert T. Skolem (1887 -1963) – matematyk norweski. Leopold Lowenheim (1878 - 1957) - matematyk niemiecki.48Temu nie powinieneś się bardzo dziwić: mówilimy już, iż obliczalne liczby rzeczywiste są ciałem, które ma takie

same pierwszorzędowe własności jak ciało wszystkich liczb rzeczywistych. A liczb obliczalnych jest przeliczalnie wiele...49To tylko paradoks Skolema. Wrócimy do niego później.

Page 163: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 162

dalej: mówi, że ten język jest „ślepy na kolory nieskończoności”: nie widzi cantorowskiej skali nie-skończoności50.

9.4 Nominalizm Tarskiego

Jestem nominalistą (...). Jestem radykalnym anty-platonikiem.Reprezentuję surowy naiwny rodzaj anty-platonizmu (...) .

Bardzo trudno żyć z tą postawą filozoficzną (...) zwłaszcza, gdycoś zwane teorią mnogości stanowi jego hobby.

A. Tarski51

9.4.1 Zbiorowa hipnoza?

Wróćmy do pytania: co się właściwie stało, gdy od modeli skończonych przeszliśmy do modeliteoriomnogościowych?Nie potrafimy rozstrzygać o spełnianiu formuł i prawdziwości zdań w nieskończonych modelachteoriomnogościowych. To każe postawić fundamentalne pytanie: jak należy rozumieć stwierdzenie„zdanie φ jest prawdziwe (w każdym teoriomnogościowym modelu teorii T”)? Odpowiedź wymagacałkowitej zmiany wyobrażenia o tym, czym są modele teoriomnogościowe. To nie jest „coś” co jestpodobne do modeli skończonych, tylko uwolnione od wymogu skończoności.

Model teorimnogościowy języka pierwszego rzędu to jego interpretacja w języku teorii mno-gości. Definicja modelu to specyfikacja warunków które musi spełniać taka interpretacja by możnają było uznać za sensowną.

„Sensowna” interpretacja to taka, która umożliwia przetłumaczenie zdań-aksjomatów teorii Tnapisanej w przedmiotowym języku, na zdania w języku teorii mnogości. To pozwala (a właściwiezmusza) by „prawdziwość zdania φ” rozumieć - definiować - tak:

„ zdanie φ jest prawdziwe (w każdym modelu teorii T ) gdy jego translacja - zdanie tr(φ) zapisanew języku teorii mnogości - jest dowodliwe w systemie formalnym w którym obok aksjomatów ZFCjako aksjomaty specyficzne traktowane są translacje zdań-aksjomatów teorii T”.

Prawdziwość w modelach skończonych oparta na rozstrzygalności jest w pewnym sensie uniwersalna boodwołuje się do (uniwersalnego) pojęcia obliczalności.Prawdziwość w modelach nieskończonych to dowodliwość w ZFC.Matematyka Cantora i Hilberta utożsamia „prawdziwość” z „dowodliwością” a „istnienie” z „niesprzecz-nością” z aksjomatami ZFC.Henkinowski dowód istnienia teoriomnogościowych modeli teorii pierwszego rzędu to tylko dowód „hil-bertowskiego istnienia” - potwierdzenie, że operowanie takim pojęciem w matematyce jest niesprzeczne zaksjomatami ZFC. To tylko argument na rzecz tezy, że teoria mnogości jest (może być) teorią podstawowądla wszelkich teorii pierwszego rzędu.Rzeczywista relacja między „prawdziwością” i ,istnieniem” a „dowodliwością w ZFC” jest kwestią poza-matematyczną.

Dostrzeganie bliskiego podobieństwa między modelami skończonymi a modelami (interpreta-cjami) teoriomnogościowymi to jakaś zbiorowa hipnoza. Dziedzictwo platonizmu i wiary twórcówteorii mnogości, że jest ona opisem transcedentnie istniejącego „matematycznego uniwersum” adowodliwość w ramach tej teorii jest synonimem „uniwersalnej prawdy matematycznej”52. Możnaim wybaczyć te marzenia (złudzenia) ale dziś, po wynikach Godla, Cohena, Lowenheima-Skolema,

50Logicy mówią, że teoria jest kategoryczna gdy ma jeden - z dokładnościa do izomorfizmu - model. Żadna teoriapierwszego rzędu posiadająca nieskończony model nie jest kategoryczna. Dlatego mówi się też o teoriach kategorycz-nych w mocy α (gdzie α to liczba kardynalna) - takich, które mają dokładnie jeden model mocy α..

51Cytuję za J. Wolańskim ([133], str. 183).51Wróć na małą chwilkę do str. 50.52Swoje robi też teoriomnogościowa edukacja matematyczna stawiająca wóz przed koniem czyli traktująca zbiory

skończone jako (trywialną) podklasę wszystkich zbiorów.

Page 164: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 163

Turinga i innych... . Ludzie, przecież istnienie zbiorów skończonych nie podlega dyskusji podczasgdy nie mamy żadnej matematycznej pewności, czy ZFC cokolwiek opisuje!!!53

Ktoś powie, że to herezja. „Taką to by na stos, na co jej durny los, dajcie chłopcy ten kagań-czyk”...54 Ale nie sam przecież „błądzę”. Skolem pisał: „(...) I believed that it was so clear thataxiomatization in terms of sets was not a satisfactory ultimate foundation of mathematics that ma-thematicians would, for the most part, not be very much concerned with it. But, in recent times, Ihave seen (...) that so many mathematicians think that these axioms of set theory provide the ideafoundation for mathematics; therefore, (...) the time has come to publish a critique”[23].

Jeśli to nie tak, to czy oprócz krytyki konstruktywiści nie powinni się pokusić o „konstruktyw-ną” definicję modelu?Takie próby podejmowano. Logika Herbranda różni się od logiki pierwszego rzędu wyłącznie defi-nicją modelu. Modele są tu przeliczalne a każdy element takiego modelu ma swoją nazwę. Zainte-resowanych odsyłam np. na stronę internetową http://www.cs.uic.edu/ hinrichs/herbrand/html/index.html. Ale nie oczekujmy zbyt wiele bo - jak piszą Autorzy strony - „(...) part of the motiva-tion for building the website was the frustration brought about by looking for and failing to findgeneral results on this logic”.

9.4.2 Nominalizm

Aby przestać się dziwić prezentowanym tu poglądom wystarczy przypomnieć, że hilbertowskafromalistyczno-platońska koncepcja matematyki nie jest jedyna.

Postrzeganie modelu teoriomnogościowego jako interpretacji danego języka pierwszego rzedu wjezyku teorii mnogości zbliża nas do pogladów nominalistów. Oto co pisał (nominalista) Tarski:

„(...) rozważając zagadnienie definicji prawdy (...) musimy używać dwóch różnych języków.Pierwszy z nich jest językiem „o którym mówimy” (...) : poszukiwana definicja prawdy stosujesię do zdań tego właśnie języka. Drugi z nich jest językiem w którym „mówimy o” pierwszymi w terminach którego pragniemy skonstruować definicję prawdy dla języka pierwszego.Pierwszy z nich to język przedmiotowy, drugi nazywać będziemy metajęzykiem.” [118]

W matematyce mainstreamowej metajęzykiem dla wszelkich jezyków pierwszego rzędu jest język teoriimnogości a ZFC jest „metateorią”55.

Metajęzykiem dla ZFC jest język matematycznego uniwersum, który jest częścią naszego języka opisurzeczywistości.

Przyjrzyjmy się jak to działa.Teoria grup Gr to teoria pierwszego rzędu korzystająca ze słownika, który zawiera dwa symbole:operacji binarnej - „+” i stałej - „0”. Ta teoria to trzy zdania:

- ∀x,y,z x+ (y + z) = (x+ y) + z,- ∀x x+ 0 = 0 ∧ 0 + x = x- ∀x∃y x+ y = 0 ∧ y + x = 0

Jednak większość pracujących matematyków używa takiej definicji: „grupa to dowolny zbiór G wrazz funkcją ⊕ : G×G→ G i wyróżnionym elementem 0 ∈ G takimi, że:

- ∀x,y,z∈G x⊕ (y ⊕ z) = (x⊕ y)⊕ z,- ∀x∈G x⊕ 0 = 0 ∧ 0⊕ x = x- ∀x∈G∃y∈G x⊕ y = 0 ∧ y ⊕ x = 0

53Nie wiemy, czy ta teoria ma „model”.54A.Osiecka, Wariatka tańczy.55patrz str. 50. W pewnej monografi,i której Autor próbuje przybliżyć tę tamatykę infornatykom, napisano tak:

„To provide semantics for a logical system means to provide a compiler that converts each logical statement in theformal language into a mathematical statement.

Page 165: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 9. WOKÓŁ KONCEPCJI PRAWDY TARSKIEGO 164

Definicja stworzona na użytek pracujących matematyków to zapisana w uproszczony sposóbtranslacja aksjomatów teorii Gr na - nieco wzbogacony - język teorii mnogości56

To wzbogacenie polegana wprowadzeniu dodatkowych stałych G,⊕, 057. Trójka (G,⊕, 0) tointerpretacja języka teorii grup - model teoriomnogościowy.

Oznaczmy tak ustalony zbiór zdań - teorię - przez GrSet.

Dwie teorie: Gr i ZFC +GrSet napisane są w różnych językach. Potrafimy tłumaczyć formułyjęzyka teorii grup na formuły teoriomnogościowe. Można też tłumaczyć dowody. I jest tak, że jeślizdanie Z jest konsekwencją teorii Gr, to jego translacja jest konsekwencją teorii ZFC + GrSet.To, co nazywaliśmy twierdzeniem o zgodności jest w istocie oczywistym wymogiem poprawnościtranslacji (interpretacji).

Twierdzenie o zupełności w wersji nominalistycznej wysłowimy tak:„jeśli translacja zdania Z ma dowód w ZFC +GrSet, to zdanie Z ma dowód w Gr”.

ZFC +GrSet to postrzeganie teorii grup w „teoriomnogościowym kontekście”. To otwiera możli-wość jej wzbogacania przez dodawanie do niej nowych teoriomnogościowych warunków. Mo-żemy np. zażądać by stała G reprezentowała zbiór skończony i tym samym zainicjować teorie grupskończonych - badanie konsekwencji teorii ZFC + GrSet wzbogaconej o ten warunek58 Tak roz-szerzony „teoriomnogościowy kontekst” teorii grup powiększa nasze możliwości badawcze, pozwalana udowodnienie „prawd” dotyczących wyłącznie grup skończońych59

A o „konkretnych” teoriomnogościowych modelach teorii grup mówimy wtedy, gdy stałe G,⊕, 0 sądefiniowalne w ZFC. Np. gdy G to zbiór liczb całkowitych, ⊕ to zwykłe dodawanie a 0 to zero.

I to te „konkretne” przykłady (wraz z licznymi przykładami modeli skonczonych) przyczyniają się doutrwalania wyobrażenia, że wszystkie teoriomnogościowe modele to „byty” istniejące gdzieś w matema-tycznym uniwersum... .

Powiedzmy szczerze: większości pracujących matematyków nie interesują różnice między Gr iZFC +GrSet. Teoria mnogości to ich naturalne środowisko w którym żyją i pracują. Nie bawi ichrozróżnianie, co jest dowodliwe w Gr a co w ZFC +GrSet. Myślą o grupach jako o szczególnychobiektach matematycznego uniwersum spełniających określone warunki. Utożsamiają „dochodzeniedo prawdy” z teoriomnogościowym i - na dodatek - dalece niesformalizowanym dowodzeniem.

Te uwagi dotyczą nie tylko teorii grup i jej teoriomnogościowych modeli. Standardowy modelarytmetyki to - dla nominalistów - jedna z możliwych interpretacji arytmetyki Peano w ZFC. Tomodel „konkretny” bo wyznaczony przez najmniejszy zbiór induktywny jednoznacznie zdefiniowanyw ZFC60.

Nominalizm uwalnia nas od jałowych dyskusji o zależności między „dowodliwością” i „prawdziwością”.Dyskusję o zależności między tymi pojęciami umieszcza tam, gdzie jej miejsce - poza matematyką.Nominalizm jest skromniejszy, mniej zarozumiały niż matematyka Cantora i Hilberta61.

56„Uproszczony”, bo np. wierne tłumaczenie drugiego aksjomatu teorii Gr powinno wyglądać tak:∀x (x ∈ G)→ (x⊕ 0 = x) ∧ (0⊕ x) = x)

57Możemy też przyjąć, że to są zmienne. Wtedy tłumaczeniem aksjomatów są formuły - ale to nie problem. Jednakgdy traktujemy te symbole jako stałe, jest ociupinkę prościej.

58Warunek „skończoności modelu” da się opisać w języku teorii mnogośxi ale nie da sie go wyrazić w języku teoriiGr.

59Klasyfikacja prostych grup skończonych to jedno z największych osiagnięć algebry w XX wieku. Aby uświadomićsobie bogactwo i głębię tej teorii wystarczy wiedzieć, że pełna klasyfikacja tych grup to dzieło ponad stu autorówzawarte w ok. 500 pracach liczących w sumie kilkanaście tysięcy stron (C.Buciński, M.Łuba O klasyfikacji skończonychgrup prostych (http://main3.amu.edu.pl/wiadmat/037-052.cb.wm38.pdf)).

60Twierdzenie Godla o niezupełności arytmetyki Peano nominalista odczyta tak: „są zdania arytmetyczne, które niemają dowodu w arytmetyce Peano, i takie, że ich interpretacje wyznaczone w modelu wyznaczonym przez najmniejszyzbiór induktywny N mają dowód w ZFC”. A twierdzenie Parisa-Harringtona jest przykładem takiego zdania.

61„Jestem skrajnym anty-platonikiem...” - A. Tarski .

Page 166: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 10

Pewna szczególna teoria - ZFC

Matematyka jest logiką nieskończonego.Ernst Zermelo

„Set Theory is the mathematical science of the infinite. It studies propertiesof sets, abstract objects that pervade the whole of modern mathematics. Thelanguage of set theory, in its simplicity, is sufficiently universal to formalizeall mathematical concepts and thus set theory, along with Predicate Calculus,constitutes the true Foundations of Mathematics”.

Stanford Encyclopedia of Philosophy (internet)

Znamy już wyjątkową rolę przypisaną teorii mnogości (teorii zbiorów1) w mainstreamowej ma-tematyce. Pora przyjrzeć się bliżej tej szczególnej pierwszorzędowej teorii.

Aksjomatyczna teoria mnogości nie jest wyłącznym dziełem Cantora2. Cantor operował zbiorami w sposóbnazywany dziś naiwną teorią mnogości. Ujawnienie tych naiwności (np. omawianego wcześniej paradoksuRussella „odkrytego” w 1901 roku) uświadomiło teoriomnogościowcom potrzebę ścisłej aksjomatyzacjiich teorii.Pierwszą dojrzałą propozycję aksjomatyzacji przestawił E. Zermelo w 1908 roku.Aksjomaty, które ukształtowały się w wyniku tych prób i zyskały społeczną (matematyków) akceptację isą obecnie najczęściej używane, noszą nazwę aksjomatów Zermelo-Fraenkela (ZF ). Miało to miejsce około1930 roku. Jeśli dodatkowo uwzględnimy słynny aksjomat wyboru, to otrzymamy tzw. aksjomatykę ZFC.

Struktura języka teorii mnogości

Słownik języka ZFC to tylko jeden jedyny dwuargumentowy symbol relacyjny „∈”3. Stąd formułyatomowe w tym języku to albo x = y albo x ∈ y , gdzie x i y to zmienne przedmiotowe. Relację„∈” zwykliśmy nazywać relacją przynależności4.

Termin „teoria zbiorów” jest wielce mylący. Ta teoria to pierwszorzędowy opis cech relacji przynależnościktóre są niezbędne, by ogół obiektów powiązanych tą relacją nazwać zbiorami.Matematycy nie badają przedmiotów, lecz stosunki między przedmiotami; z ich punktu widzenia daneprzedmioty można zastąpić innymi, jeśli tylko nie zmieni to stosunków między nimi. Nie interesuje ichtreść, a tylko forma - H. Poincare [90].

1Autorstwo terminu „zbiór” przypisuje się Platonowi.2Pracę, którą uznaje się za początek jej tworzenia Cantor opublikował w 1874 roku.3Ten symbol po raz pierwszy pojawił się w 1889 w pracy G. Peano.4To jest niczym niewymuszona, ale zamierzona interpretacja symbolu „∈”. Napis x ∈ y czytamy: „element x należy

do zbioru y”. Czy tego chcemy czy nie, to arbitralne przypisanie symbolowi wybranego znaczenia ukierunkowuje(zawęża) nasze myślenie o teorii mnogości i jej modelach. W szczególności, takie odczytanie symbolu „∈” sugeruje,że mamy tu dwie kategorie obiektów - elementy i zbiory. W warstwie formalnej teorii nie ma żadnych podstaw dotakiego rozróżnienia. Jest tylko jedno pojęcie podstawowe - zbiór. Elementem zbioru może być tylko inny zbiór.

165

Page 167: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 166

Tę dominację potwierdza jeden z aksjomatów ZFC - aksjomat ekstensjonalności: (a = b)↔ ∀c (c ∈a↔ c ∈ b). Równość zbiorów jest wtórna w stosunku do przynależności5.

Aksjomat ekstensjonalności wydaje się niekontrowersyjny. Jest zgodny z doświadczeniem świata zbiorówskończonych. A przecież jego skutkiem jest zgoda na nierozstrzygalność równości zbiorów. Czy wynikiTuringa i Godla nie powinny skłonić do rewizji tego aksjomatu?Teorię, która ma być podstawą matematyki, sprowadzono do opisu cech jednej jedynej relacji... . Być możezdecydowało o tym przekonanie o transcedentnym istnieniu idealnego świata matematyki. Idealnego, czyli- jak chcieli Spinoza i Leibniz - wywodzącego się z „jednej podstawowej zasady”.

W słowniku języka ZFC nie ma stałych i symboli operacyjnych. Dlatego w warstwie podsta-wowej tego języka nie ma żadnych termów, żadnych nazw. Ale język ZFC ma swą powłokę, któraczyni go strawnym, bo zbliża do języka naturalnego7. I w tej powłoce pojawiają się nazwy (pojęciateoriomnogościowe) i formuły nazwowe. Popatrzmy, jak je tworzymy.

Aksjomat zbioru pustego to zdanie ∃x∀y¬(y ∈ x) - „istnieje zbiór, do którego nic nie należy”. Takizbiór jest jedyny, co pozwala wprowadzić do języka nazwę - stałą „∅”8 . To cukier syntaktyczny:np. można teraz niemiłą formułę ∃x(y ∈ x ∧ ∀z ¬(z ∈ x)) zastąpić znacznie prostszą - y ∈ ∅.

Aby uczynić zadość wymogom naukowej powagi, zamiast o dosypywaniu cukru syntaktycznego powinni-śmy mówić o zachowawczym (konserwatywnym) rozszerzaniu języka - takim, które nie wpływa na pojęciemodelu języka poddanego temu zabiegowi9.

Podobnie, korzystając z aksjomatu nieskończoności, uzasadnimy wprowadzenie do języka stałej„N” reprezentującej zbiór liczb naturalnych10.

Aksjomat pary11 pozwala na wprowadzenie dwuargumentowego konstruktora nazw - „ , ”. Napisx, y to formuła nazwowa. Pozwala to tworzyć złożone formuły nazwowe - np. x, x, y (którąz kolei zastępujemy skrótem (x, y) i nazywamy parą uporządkowaną) i nazwy - np. 2 ∼= ∅, ∅12.

Aksjomat sumy - ∀x∃y∀z (z ∈ y) ↔ ∃t ((t ∈ x) ∧ (z ∈ t)) - i aksjomat zbioru potęgowego -∀a∃s (x ∈ s) ⇔ (∃b (b ∈ a) ∧ (x ∈ b)) - pozwalają na wprowadzenie do języka formuł nazwowychpostaci

⋃(ti : i ∈ x) oraz 2x.

Niewyczerpywalnym źródłem formuł nazwowych jest aksjomat wyróżniania (komprehensji)13:dla dowolnej formuły teoriomnogościowej φ(x, y1, . . . , yk):

∀y1,...,yk∀a∃b∀x ((x ∈ b)↔ (x ∈ a) ∧ φ(x, y1, . . . , yk)).

To pozwala związać z każdą formułą teoriomnogościową φ(x, y1, . . . , yk) formułę nazwowąx ∈ a : φ(x, y1, . . . , yk) (w której zmienne wolne - parametry - to a, y1, . . . yk. Ale nie x!).

Np. Iloczyn kartezjański zbiorów a × b to formuła nazwowa - czyli pojęcie teoriomnogościowe!

5ZFC można rozpatrywać jako teorię bez równości definiując ją równość jako „skrót” formuły ∀c (c ∈ a ↔ c ∈b) ∧ ∀d (a ∈ d↔ b ∈ d). To jest zgodne z prawem Leibniza : „dwa obiekty sa równe, gdy każdą własność przypisanąpierwszemu z nich można przypisać drugiemu i vice versa”6Uwaga: definiowanie równości a = b jako skrótu formuły∀c c ∈ a↔ c ∈ b nie wystarczy: te dwie formuły są równoważne tylko w „ZFC z równością”!

7„Keep in mind that most ordinary mathematical proofs are not written in any formal system: they are just writtenin natural language using accepted methods of reasoning” - wpis w dyskusji o twierdzeniu Parisa-Harringtona naforum internetowym.

8Tzn. ZFC ` (∀y¬(y ∈ x1)∧∀y¬(y ∈ x2))→ x1 = x2. Takim samym dowodem jednoznaczności należy poprzedzićwprowadzenie wszelkich indywiduowych nazw do (powłoki) języka ZFC.

9To, co tu opisujemy można uznać za nieformalną prezentację szczególnego przypadku tzw. rozszerzenia Skolema.10Aksjomat nieskończoności to zdanie ind(x) ≡ (∅ ∈ x)∧∀a (a ∈ x)→ (a∪a) ∈ x . Teoria mnogości definiuje

zbiór liczb naturalnych jako najmniejszy zbiór induktywny.nat(x) ≡ ind(x) ∧ ∀y (ind(y)→ y ⊆ x)

11∀x,y∃z(∀t(t ∈ z)⇔ ((t = x) ∨ (t = y))12Symbolu ∼= używamy tu dla zaznaczenia że obie formuly nazwowe (nazwy) są synonimami.13Żadne ze znanych mi objaśnień znaczenia słowa komprehensja nie jest dla mnie przekonujące. Najbardziej podoba

mi się słownikowe objaśnienie angielskiego słowa comprehension: to zasięg a także... rozumienie(!). Dodajmy, żewybitny współczesny filozof D. Dummett każe rozróżniać „rozumienie” od zrozumienia (understanding).

Page 168: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 167

- które opisujemy tak:14

a× b = x ∈ 22a∪b : ∃c∃d c ∈ a ∧ d ∈ b ∧ x = (c, d)

Język powłoki to język pracujących matematyków. Jądro języka teorii mnogości to domena tych, którzyzajmują się podstawami matematyki.

„Zbiory”15 które mają indywiduowe nazwy są dostępne w tym sensie, że tylko dla nich moż-na formułować teoriomnogościowe twierdzenia odnoszące się do pojedynczych „zbiorów”. Dlategomamy twierdzenia o zbiorze liczb naturalnych (rzeczywistych itp.) czy o „zbiorze” wszystkich pod-zbiorów N. Można też formułować twierdzenia dla definiowalnych klas zbiorów - takich, które sąidentyfikowane przez pewną formułę nazwową. Dlatego możemy dowodzić - w ZFC - twierdzeń o„zbiorach” przeliczalnych (wśród których jest nieprzeliczalnie wiele zbiorów bez nazw). Na przy-kład: „iloczyn kartezjański dwóch „zbiorów” przeliczalnych jest przeliczalny”.

Formuły nazwowe i nazwy indywiduowe pełnią rolę termów - można je użyć do konstrukcjiformuł. I tak np. poprawną równością jest napis y = x ∈ 0, 1 : (x = 0) ∨ CH, gdzie CH tozdanie-hipoteza continuum16.

Zatrzymajmy się. „Zbiór” x ∈ 0, 1 : (x = 0)∨CH choć ewidentnie skończony, nie jest rozstrzygalny!No bo czy 1 to element tego „zbioru”?Sprzeczność? W żadnym razie. To nie zbiór, to nazwa - „zbiór”. Nie umiemy dowieść - w ZFC - że maon jeden (czy dwa) elementy. Nieporozumienie wynika stąd, że utożsamiamy nazwę (pojęcie językowe) zjej desygnatem (którego istnienie wymaga wskazania modelu ZFC). To wszystko.

Dlaczego tyle uwagi przywiązujemy do języka teorii mnogości? Dlatego, że ... nie mamy nicinnego. Matematycy teoriomnogościowi pracują tylko i wyłącznie w języku teorii mnogości.Wszelkie „dowody istnienia” uprawniają jedynie do niesprzecznego rozszerzenia języka budowanegowokół „czystego” języka teorii mnogości. „Istnienie to niesprzeczność” - tak, jak chciał Hilbert17.Dziś, gdy wiemy nieco więce,j możemy powiedzieć: istnienie matematyczne to udowodniona - wZFC - niesprzeczność. Ale czy istnienie dowodu istnienia obiektu oznacza istnienie jego konstrukcji?

Źródło niekonstruktywizmu ZFC - aksjomat wyboru

Aksjomat wyboru budził i budzi wiele kontrowersji, choć jego sformułowanie jest proste: dla do-wolnej rodziny niepustych i rozłącznych zbiorów (ai : i ∈ I) istnieje zbiór b ⊂

⋃i∈I ai który ma

dokładnie jeden wspólny element z każdym ze zbiorów ai.To jest oczywista oczywistość gdy myślimy o skończonych rodzinach skończonych zbiorów. Ale

nie w świecie zbiorów nieskończonych - szczególnie gdy patrzy się na jego konsekwencje którymisą m.in. lemat Kuratowskiego-Zorna18 i twierdzenie o możliwości dobrego uporządkowania dowol-nego zbioru19. Twierdzenia, które dowodzimy korzystając z tego aksjomatu są niekonstruktywne -orzekają o istnieniu pewnych obiektów (elementów maksymalnych w posecie, dobrego porządku wkażdym zbiorze) ale nie mówią jak te obiekty wskazać (skonstruować).20 .

Koronnym dowodem wskazującym na „odpowiedzialność” aksjomatu wyboru za matematycz-ny niekonstruktywizm jest wynik Diaconescu (z 1974 roku), który pokazał, że konsekwencją jego

14Napis „a× b” jest kolejnym skrótem zastępującym złożoną formułę nazwową i wprowadzonym do języka powłokiw trosce o jego funkcjonalność.

15Będę przez jakiś czas pisał „zbiory” w cudzysłowie by zbyt szybko nie wrócić do wyobrażeń, że jest to coś innegoniż pojęcie językowe. Ale po pewnym czasie cudzysłowy znikną.

16Hipotezę-continuum można zapisać formalnie, jako zdanie pierwszego rzędu języka teorii mnogości.17Dodatkowym powodem naszego zainteresowania językiem teorii mnogości jest to, że choć większość matematyków

używa tego go na co dzień, to rzadko kto zastanawia się nad jego strukturą. Nie pierwsi, nie ostatni...„U licha! jużprzeszło 40 lat mówię prozą, nic o tym nie wiedząc” - pan Jourdain w sztuce „Mieszczanin szlachcicem” Moliera.

18Niepusty poset, w którym każdy łańcuch jest ograniczony z góry, ma element maksymalny.19Tzn. tak, by każde dwa elementy były porównywalne a w każdym niepustym podzbiorze istniał element naj-

mniejszy.20Pomyśl o dobrym porządku w zbiorze liczb rzeczywistych...

Page 169: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 168

uznania jest... prawo wyłączonego środka: ZFC |= P ∨ ¬P !Przyjrzyjmy się dowodowi [40]. Dla dowolnego zdania P możemy utworzyć dwa proste zbiory:

A = x ∈ 0, 1 : (x = 0) ∨ P , B = x ∈ 0, 1 : (x = 1) ∨ P

Na mocy aksjomatu wyboru istnieje funkcja f : A,B → A ∪ B = 0, 1 taka, że f(A) ∈A, f(B) ∈ B . Stąd wyprowadzimy sprytnie serię prawdziwych zdań:

((f(A) = 0) ∨ P ) ∧ ((f(B) = 1) ∨ P ) f(A) 6= f(B) ∨ P .P → (A = B) P → (f(A) = f(B)) f(A) 6= f(B)→ ¬P .

A z dwóch ostatnich zdań wynika, że P ∨ ¬P 21.

Wyjątkowość wyniku Diaconescu polega na tym, że pokazuje iż aksjomat logiczny - prawo wyłączonegośrodka - jest konsekwencją pewnego aksjomatu specyficznego rozważanej teorii - pewnika wyboru.Logika jest częścią matematyki...22

Ten wynik zaskakuje, jak sądzę, również matematyków. Ale do wyobraźni „zwykłych ludzi”bardziej przemawia wspominane wcześniej twierdzenie Banacha-Tarskiego:„kulę można pociąć naskończenie wiele kawałków, z których można złożyć dwie kule identyczne z kulą wyjściową”. Tow sposób oczywisty niedorzeczne stwierdzenie staje się dowodliwe jeśli tylko uznamy istnienie nie-mierzalnych kawałków kuli... A istnienie zbiorów niemierzalnych to jeszcze jedna konsekwencjaaksjomatu wyboru.Szczęśliwie, nie trzeba znać teorii miary by to zrozumieć - przynajmniej w odniesieniu do pod-zbiorów liczb rzeczywistych. Wystarczy się zgodzić, że miarą zbioru A ⊂ R jest liczba rzeczywistanieujemna i spełnione winny być proste warunki:

- miarą odcinka jest jego długość,- jeśli A ⊆ B, to miara A jest mniejsza-równa mierze zbioru B,- miara sumy rozłącznych zbiorów jest sumą ich miar,- dla dowolnego zbioru A wszystkie zbiory Ar = a + r : a ∈ A, gdzie r to dowolna liczba

rzeczywista, mają tę samą miarę.

Okazuje się, że - jeśli uznajemy aksjomat wyboru! - nie można zdefinować miary zbiorów spełniającejte warunki i tak, by każdy zbiór C ⊂ [0, 1] posiadał miarę.Pokażemy to. Podzielmy odcinek [0, 1] na rozłączne i niepuste podzbiory Ai tak, że dwie liczbyrzeczywiste znajdą się w tym samym zbiorze Aj , gdy różnią się o liczbę wymierną23. Korzystając zaksjomatu wyboru utworzymy zbiór C zawierający po jednym elemencie z każdego ze zbiorów Ai.Ten zbiór nie może mieć miary, jest niemierzalny! Wystarczy rozważyć rodzinę „przesunięć” C -zbiorów Cq = r = c+ q : c ∈ C, gdzie q ∈ Q∩ [−1, 1]. Zbiory Cq są parami rozłączne i - co łatwopokazać -

(∗) [0, 1] ⊆⋃q∈[−1,1]C

q ⊆ [−1, 2]

Miary wszystkich zbiorów Cq są równe mierze zbioru C. Gdyby C miał miarę, to z (∗) wynika,że musiała by to być taka liczba dodatnia, że dowolna jej krotność jest nie większa niż 3.A to jest niemożliwe24.

Wniosek: wprowadzając jakąkolwiek miarę (spełniającą opisane warunki) musimy się pogodzićz istnieniem zbiorów niemierzalnych. A stąd już bliżej do twierdzenia Banacha-Tarskiego...

Stąd sugestia, by ograniczyć aksjomat wyboru do przeliczalnych rodzin niepustych i rozłącznychzbiorów (tzw. przeliczalny aksjomat wyboru). J. Diedonne: „(...) jeśli wyrzuci się pewnik wyborudla zbiorów nieprzeliczalnych, a zachowa się jego przeliczalny wariant, to można osiągnąć ważnecele przy pomocy innych aksjomatów (...). Przykładem jest aksjomat Solovaya (...) który mówi, że

21Formuła ((r ∨ p) ∧ (r → ¬p))→ (p ∨ ¬p) jest prawem intuicjonistycznej logiki zdaniowej.22Twierdzenie Diaconescu wyjasnia dlaczego nie stworzono - na wzór arytmetyki intuicjonistycznej - intuicjoni-

stycznej wersji ZFC... . Ale istnieje IZF - intuicjonistyczna wersja ZFC pozbawionej aksjomatu wyboru.23Zbiory Ai to klasy abstrakcji relacji równoważności ρ takiej, że aρb gdy różnica a− b jest liczbą wymierną.24Przy odrobinie dobrej woli można powyższe uznać za szkic konstrukcji zbioru Vitaliego, niemierzalnego względem

miary Lebesque’a.

Page 170: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 169

wszystkie podzbiory Rn są mierzalne w sensie w jakim rozumiał to Lebesgue. Dla wielu analitykówbyłoby to o wiele przyjemniejsze niż ogólny pewnik wyboru25..

10.1 Modele ZFCSet theory is a subject which inspires two conflicting emotions (...) On the one hand,everyone is familiar with the basic concepts, so that no technical preparation is necessary.Further, every one has his own personal view about the nature of sets (...), They may feelthat the “official” exposition of set theory, i.e., all of mathematics, using formal systemsand particular axiom systems, has little relevance to their work (...). On the other hand,the existence (...) of surprising results has to some extent shattered the complacency26ofmany mathematicians, and there is an unjustified aura of mystery and awe that tends tosurround the subject. In particular, the existence of many possible models of mathematicsis difficult to accept so that a possible reaction may very well be that somehow axiomaticset theory does not correspond to an intuitive picture of the mathematical universe, andthat these results are not really part of normal mathematics.

P.Cohen - The discovery of forcing27

Teoria zbiorów nie mówi, co jest zbiorem. To trzeba powiedzieć dopiero wtedy, gdy wskazujemy modeltej teorii. Zbiory to elementy takiego modelu28.

10.1.1 ZFC, ZFC− i arytmetyka Peano

Wskazanie modelu ZFC jest ... trudne. Aby zrozumieć, co jest źródłem trudności rozpatrzmynajpierw teorię ZFC− którą otrzymamy z ZFC zastępując aksjomat nieskończoności jego zaprze-czeniem. Ta teoria opisuje zbiory skończone29.

Rozpatrzmy nieco bardziej wnikliwie zależności między trzema teoriami - ZFC, ZFC− i aryt-metyką Peano - PA.

Najmniejszy zbiór induktywny to teoriomnogościowy model PA - odwołując się do tego zbiorupotrafimy przetłumaczyć formuły arytmetyczne na formuły teoriomnogościowe tak, że tłumaczeniaaksjomatów Peano są dowodliwe w ZFC. Ponieważ obie teorie są pierwszorzędowe30, to tłumaczeniezdania arytmetycznego dowodliwego w PA jest dowodliwe w ZFC:

PA ` φ −→ ZFC ` tr(φ)Tak należy rozumieć stwierdzenie, że teoria mnogości jest rozszerzeniem arytmetyki. Albo, że arytmetykajest częścią ZFC.

To wiemy. A jeśli nawet nie, to się specjalnie nie dziwimy. Ciekawsze jest to, że istnieje „trans-lacja odwrotna” - z języka teorii zbiorów do języka arytmetyki.Pomysł jest zaskakująco prosty: każda liczba naturalna ma rozwinięcie dwójkowe: n = a020+a121+a222 + . . . + ak2k. To pozwala określić taką relację na zbiorze liczb naturalnych: „m n wtedy,gdy na m-tym miejscu binarnego rozwinięcia liczby n jest jedynka” - np. 2 5, ale ¬(1 5) gdyż5 = 1 · 20 + 0 · 21 + 1 · 22.. Relacja „” jest rozstrzygalna, czyli można ją opisać za pomocą formuły

25Milioner ma przeliczalnie wiele par butów i przeliczalnie wiele par skarpetek. Stąd wynika, że ma przeliczalniewiele butów i skarpetek. Ale dowód jednego z tych faktów wymaga wykorzystania pewnika wyboru. Którego? [40]

25shattered the complacency = rujnuje samozadowolenie27Rocky Mountain Journal of Math., vol.32 no 4., 200228„In Zermelo-Fraenkel set theory, the notion of what consitutes a set is not really defined, but rather is taken

as a basic concept. The Zermelo-Fraenkel axioms describe the properties of sets and the set-theoretic universe. Forinstance, if X is an infinite set, the Power Set Axiom tells us that there is a set, 2X (...). But the other axioms donot tell us very much about the members of 2X , or give any indication as to how big a set this is.” -K.J.Devlin -http://projecteuclid.org/euclid.pl/1235419480.

29Ciekawostka: ZFC− jako niesprzeczna teoria pierwszego rzędu nie może mieć tylko jednego (nieskończonego)modelu - nie opisuje jednoznacznie tego, co wydaje się wręcz „fizyczne” - uniwersum zbiorów skończonych.

30Czyli w obu przypadkach korzystamy z tych samych aksjomatów logicznych i reguł dowodzenia.

Page 171: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 170

arytmetycznej (o dwóch zmiennych wolnych). Przypisując atomowej formule teoriomnogościowej„x ∈ y” formułę arytmetyczną „x y” umożliwiamy tłumaczenie języka teorii mnogości na językarytmetyki.

Ta translacja była by tylko ciekawostką, gdyby nie to, że po tym tłumaczeniu aksjomaty teoriiZFC− są dowodliwe w PA [53]!

Każde teoriomnogościowe twierdzenie dotyczące zbiorów skończonych (niekorzystające z aksjomatu nie-skończoności) można sformułować w języku arytmetyki i dowieść korzystając z aksjomatyki Peano.Arytmetyka to matematyka zbiorów skończonych31..

Istnienie tej translacji oznacza, że w każdym modelu PA możemy zbudować model ZFC−.Matematyk konstruktywista powie tak: „teoria ZFC− posiada model budowany niezależnie odteorii mnogości. Jest nim konstruktywnie definiowany zbiór liczb naturalnych wraz z relacją ”.

10.1.2 Kłopoty (to moja specjalność)...

Wskazanie modelu ZFC jest trudne... .Już wiemy, że przyczyną kłopotów ze wskazaniem teoriom-nogościowego modelu ZFC jest akceptacja aktualnej nieskończoności.

Skoro tak, to może trzeba „zapomnnieć” o tym problemie? Nic z tych rzeczy. Jeśli wierzymy,że pierwszorzędowa teoria ZFC jest niesprzeczna, to - na mocy twierdzenia Godla-Henkina - musimieć teoriomnogościowy model: jego istnienie jest równoważne niesprzeczności ZFC. A to jużnie jest temat do żartów...Model teoriomnogościowy to para (A,∈A), gdzie A to zbiór, a „∈A” to relacja binarna na zbiorzeA wybrana tak, by spełnione były wszystkie aksjomaty ZFC. Wówczas elementy zbioru A możemynazwać zbiorami - w tym modelu.

Ale A ma też być zbiorem, czyli elementem innego modelu teorii ZFC!

„Innego”, bo zbiór A nie może być swoim własnym elementem. Wyklucza to jeden aksjomatów ZFC -aksjomat regularności: „każdy niepusty zbiór zawiera (jako element) zbiór, który jest z nim rozłączny”:

∀x(x 6= ∅ ⇒ ∃y(y ∈ x ∧ y ∩ x = ∅))Ten aksjomat nie jest intuicyjnie oczywisty. Ale to z niego wynika, iż żaden zbiór nie zawiera samegosiebie jako elementu32..

Aby wskazać jakikolwiek teoriomnogościowy model ZFC musimy dysponować innym modelemtej teorii ...Uh Houston, we’ve had a problem...33 .

Universum von Neumanna

Całokształt naszej tzw. wiedzy (...) jest tworemczłowieka i styka się z doświadczeniem tylko wzdłużswoich krawędzi - W.V.Quine

Pracujący matematyk powie: przecież mamy uniwersum von Neumanna34.

31Tę translację wykorzystano by pokazać, że twierdzenie Parisa-Harringtona nie ma dowodu w PA.Można teraz postrzegać tę relację między PA i ZFC jako ilustrację hilbertowskiego podziału matematyki na „realną”i „idealną”: dowody teoriomnogościowych twierdzeń nieodwołujących się do nieskończoności są możliwe w PA, ale wZFC są „bardziej eleganckie”. Warto by to stwierdzenie poprzeć eleganckim przykładem elegancji. Ale nie potrafię.

32Jedynym elementem zbioru a jest a. Gdyby a ∈ a, to jedyny element zbioru a nie jest z nim rozłączny. Tenaksjomat pozwala też uniknąć paradoksu Russella.

33„Huston, mamy problem” - to słowa astronauty J.Swigerta po tym, gdy na pokładzie Apollo 13 wybuchł pojemnikz tlenem...

34Na marginesie: niektórzy - np. K. Wójtowicz w pracy O hipotezie continnum (Zagadnienia Filozoficzne w NauceXXII, 1998 (35-52) - przypisują tę konstrukcję E. Zermelo.

Page 172: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 171

Przyjrzyjmy się sprawie bliżej. Osnową konstrukcji von Neumanna są liczby porządkowe. Jakwszystko w tym świecie, te liczby to „zbiory”35. Najprostsze spośród nich to liczby naturalne.Każda liczba porządkowa α ma swój następnik - liczbę α∪α. Liczby - następniki to liczby izolo-wane. Pozostałe to liczby porządkowe graniczne. Taką liczbą jest np. ω - „zbiór” wszystkich liczbnaturalnych. Istnieją liczby porządkowe ω + 1, ω + 2, . . . , ω + ω, ω · ω, . . . ωω, . . .36.

Ale liczby porządkowe nie tworzą „zbioru”. To słynny paradoks Burali-Fortiego: gdyby przy-jąć, że istnieje „zbiór” wszystkich liczb porządkowych Ord , to „zbiór” γ =

⋃Ord byłby liczbą

porządkową. Stąd γ ∈ γ , a to przeczy aksjomatowi regularności.

Uniwersum von Neumanna V to wielkość graniczna, aproksymowalna przez „zbiory” V0 ⊆ V1 ⊆· · ·Vα ⊆ · · · indeksowane liczbami porządkowymi. Zbiory Vα definiowane są „rekurencyjnie”:37

V0 = ∅, Vα+1 = 2Vα , Vβ =⋃α∈β Vα (dla liczby granicznej β)

Kusi, by napisać(∗) V =

⋃α∈Ord

gdzie Ord to kolekcja wszystkich liczb porządkowych.Skoro jednak Ord nie jest „zbiorem”, to i V nie jest „zbiorem”38.

Dla tak opisanej klasy V dowodzi się twierdzenia, które ma potwierdzać, że zasługuje on na mianouniwersum matematyki teoriomnogościowej - każdy „zbiór” należy do V .

Jedyną wadą V jest to, że jest zbyt dużym obiektem, by być zbiorem...

Wszystko się pięknie ułożyło.... Skąd więc wątpliwości?Ta naracja prowadzona jest w duchu matematycznego realizmu (platonizmu). A przecież powie-dzieliśmy tylko tyle, że w ZFC można dowieść kilku twierdzeń:

ZFC ` dla każdego „zbioru”-liczby porządkowej α istnieje zbiór” Vα o określonych własnościachZFC ` „każdy „zbiór” jest elementem pewnego „zbioru” Vα:ZFC ` -nie istnieje „zbiór” liczb porządkowych.

Użycie frazy „istnieje zbiór Vα” sugeruje, że udowodniliśmy istnienie pewnych zbiorów.Nic z tych rzeczy: pokazaliśmy tylko, że w każdym ((teoriomnogościowym) modelu ZFC moż-na wyróżnić zbiory Vα o opisanych własnościach. Konstrukcja von Neumanna wzbogaca naszą wiedzę owszelkich potencjalnych teeoriomnogościowych modelach ZFC: każdy taki model ma strukturę od-wzorowującą hierarchię „zbiorów” VαAle nie udowodniliśmy istnienia jakiegokolwiek teoriomnogościowego modelu ZFC!

Czy to oznacza, że użycie terminu „uniwersum” w odniesieniu do tej konstrukcji jest „mylnymbłędem”? Nie sądzę.

Wystrarczy przyjąć punkt widzenia nominalistów by uznać, że klasa V jest modelem ZFC. Ale niejest to model teoriomnogościowy ( w sensie Tarskiego). To model wewnętrzny - inner model wykreowanywewnątrz języka ZFC39

Tak więc - w pewnym uproszczeniu - modelem ZFC jest ... ZFC (dla nominalistów).

35Liczba porządkowa to „zbiór” α, który jest tranzytywny - ∀y,z z ∈ y ∧ y ∈ α→ z ∈ α - liniowy - ∀x,y x, y ∈ α→(x ∈ y)∨(y ∈ x) i dobrze ufundowany - ∀y y ⊆ α→ ∃z z ∈ y∧∀t t ∈ y → ¬(t ∈ z). Własność „być liczbą porządkową”jest definiowalna w języku teorii mnogości.

36Dodajmy, że dowód istnienia np. liczby ω + ω wymaga użycia niewspominanego dotąd aksjomatu zastępowania.37Nie pierwszy raz twórcy teorii mnogości odwołują się do konstrukcji obecnych w świecie obiektów skończonych

i adaptują je do działań w świecie obiektów nieskończonych. Można powiedzieć - to odważne i genialne. Albo, żebezpodstawne i bezsensowne. My zauważymy skromnie: rozszerzenie procesu konstruowania rekurencyjnego na liczbyporządkowe nieskończone oderwało ten proces od czasu. Czas można mierzyć („taktować”) liczbami naturalnymi(rozumianym konstruktywnie). Ale trudno sobie wyobrazić nieskończone liczby porządkowe w roli „skali czasu”.

38ZFC gwarantuje jedynie istnienie sumy rodziny „,zbiorów” indeksowanej przez „zbiór”. Równość (∗) należyczytać tak: zbiór należy do klasy V dokładnie wtedy, gdy należy do pewnego „,zbioru” Vα.

39„An inner model is a definable proper class that is a model of ZF (such that every subset of it is a subset of amember of it).” [40]. „Definiowalne klasy” to te, które są wyznaczone przez teoriomnogościowe formuły. Formalnądefinicję wewnętrznego modelu można znaleźć np. w [69].

Page 173: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 172

Matematyczne uniwersum nie jest rzeczywistością - ani fizyczną, ani transcedentną. To część„świata intelektualnego”40. Wyznający ten pogląd nominaliści nie mają żadnego problemu z ak-ceptacją modelu wewnętrznego.

Wychowanym w duchu platońskiego realizmu teoriomnogościowców konstrukcja von Neumannastwarza pewien „psychologiczny komfort”, ułatwiający budowanie wyobrażenia uniwersum zbiorów.I z ulgą przyjmują do wiadomości, że jeśli do aksjomatów ZFC dodać jeszcze jeden dekretującyistnienie tzw. silnie nieosiągalnych liczb porządkowych większych niż ω, to dla każdej takiej liczbyα, Vα jest modelem ZFC - uniwersum Grothendiecka41.

Jedno jest pewne: konstrukcja von Neumanna nie wnosi nic - lub niewiele - do dyskusji oniesprzeczności ZFC. „The question of the formal consistency of ZFC must remain a matter offaith unless and until a formal inconsistency is demonstrated”.Z niesprzecznością ZFC mamy większy kłopot niż się zdaje na pierwszy rzut oka. To, co już wiemypozwala bowiem na przyjęcie do wiadomości takiego twierdzenie:

„jeśli teoria ZFC jest niesprzeczna, to ma model U , w którym można wskazać przeliczalnyzbiór M , który jest również modelem ZFC” [132]42.

Dowodząc tego twierdzenia pokazujemy też, że:

- każda liczba porządkowa w M jest liczbą porządkową w U , ale nie odwrotnie - liczb porząd-kowych w M jest istotnie mniej niż w U43,

- podzbiory zbioru A w M to zbiory postaci B∩M , gdzie B jest podzbiorem A w U - podzbiorówdowolnego zbioru A ∈M jest istotnie mniej, niż podzbiorów tego samego zbioru w U .

W konsekwencji, konstrukcja von Neumanna w małym modelu M jest „krótsza i chudsza” niż wdużym. „Krótsza”, bo liczb porządkowych wykorzystanych w konstrukcji VM =

⋃VMα jest mniej

niż w konstrukcji V U =⋃V Uα . I „chudsza”, gdyż VM

α+1 = 2VαM = 2VαU ∩M ⊂ · · · ⊂ Vα+1U

Wnioski? Zachęcam do prób formułowania własnych. Podsumowanie? Oto wypowiedź, która -moim zdaniem - genialnie ujmuje istotę problemu.

„Kiedy ktoś proponuje teorię dotyczącą jakiegoś typu przedmiotów, jesteśmy skłonni wyobrażaćsobie, że nasze zrozumienie jego słów będzie przebiegało w dwóch etapach: po pierwsze, musimyzrozumieć czym są te przedmioty; po drugie, musimy pojąć, co mówi o nich teoria. Tak jednak niejest, bowiem

„zrozumienie czym są przedmioty, jest w głównej mierze po prostu opanowaniemtego, co mówi o nich teoria” - W.V.Quine44

Zamknięci w teoriomnogościowym raju zapominamy, że uprawianie matematyki jest jedną z wielu ak-tywności człowieka, jedną z wielu dziedzin nauki. Uczestniczymy w tej grze nie jako doskonały „podmiotpoznawczy” ale jako gracz, którego zalety, wady i ograniczenia wpływają na rezultat tego działania.

Na marginesie: o co chodzi w twierdzeniu Cantora?

Zbiór liczb naturalnych jest w obu opisanych modelach - „małym ” M i „dużym” U - ten sam. Alezbiory potęgowe - 2NM w M i 2NU w U są istotnie różne.

40Tak ładnie napisał Yu.I. Manin w podręczniku A Course in Mathematical Logic.41To dodatkowe założenie jest niesprzeczne z ZFC w tym sensie, że jeżeli tylko ZFC jest niesprzeczna to i teoria

wzbogacona o ów dodatkowy aksjomat jest niesprzeczna. To jest wynik Godla. To jest ładna ilustracja wcześniejszegostwierdzenia: „w ZFC nie można dowieść niesprzeczności tej teorii ale można to zrobić w teorii bogatszej”.

42To - po cześci - wynika z twierdzenia Lowenheima-Skolema. Zbiorami modelu M są te zbiory z modelu U , któresą elementami M . „Duży” model U , zawiera „mały”, przeliczalny model M . W [132], to twierdzenie jest punktemwyjścia do omówienia metody forcingu P. Cohena.

43Definicja liczb porządkowych nie przesądza, że w każdym teoriomnogosciowym modelu musi być ich „tyle samo”!44Willard Van Orman Quine (1908-2000) - amerykański filozof nauki. Zainteresowanym polecam wyjątkowo ob-

szerną informację na temat poglądów Quine’a w polskiej wikipedii (skąd też zaczerpnąłem poniższy cytat z artykułu„Słowo i przedmiot”). Czy ta wypowiedź Quinna nie koresponduje z przytaczanymi tu wielokrotniesłowami Wittgen-steina „Mój język wyznacza granicę mego poznania?”

Page 174: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 173

Ten pierwszy - widziany w modelu U - jest przeliczalny. A postrzegany wewnątrzM - nieprzeliczalny.

A więc jak? Można „ponumerować” elementy zbioru 2NM czy nie?To pytanie nie ma matematycznego sensu. Twierdzenie Cantora nie mówi o absolutnym numerowaniuale o równoliczności zbiorów w danym modelu ZFC (czyli o istnieniu odpowiednich bijekcji). W M niemamy bijekcji między zbiorami N i 2NM a taka bijekcja jest w U ... .Nic więcej nie można powiedzieć. Nic więcej nie wolno powiedzieć.To jest ostrzeżenie, by wyników teoriomnogościowych nie interpretować „życzeniowo” (nadmiarowo)...

10.1.3 Twierdzenie Łosia

Dowód „istnienia” pary modeli U i M jest zbyt skomplikowany technicznie bym odważył się gotu przedstawiać. Szczęśliwie można wskazać inne twierdzenie, które równie efektownie ujawniasubtelności teorii mnogości. To twierdzenie Łosia.

W bibliotece Wydziału Matematyki i Informatyki Uniwersytetu M. Kopernika w Toruniu można obejrzećkarykaturę prof. Jerzego Łosia, na której został on przedstawiony jako człowiek z głową w chmurze znapisem „abstrakcja”.Czym sobie na to zasłużył? Prawdopodobnie jest to związane z jego słynną konstrukcją ultraproduktumodeli i twierdzeniem z nim związanym. Spróbujemy opowiedzieć o tym znakomitym wyniku i jego roliw rozważaniach dotyczących matematycznego uniwersum.

Preludium

Twierdzenie Łosia, na pozór, nie brzmi sensacyjnie: mówi o tym, że dowolny model języka pierw-szego rzędu A można rozszrzyć, zanurzyć w „dużo większy” model AU , który ma dokładnie tesame pierwszorzędowe własności. Ale zmienimy zdanie, gdy poznamy szczegóły tej konstrukcji ikonsekwencje tego twierdzania.Zaczniemy od małej wprawki. Matematycy mówią, że dwa ciągi liczb naturalnych (ni : i ∈ N) oraz(mi) - są „równe prawie wszędzie” gdy ni = mi zawsze, poza skończoną liczbą przypadków:

(ni) =pw (mi) wtw gdy zbiór i ∈ N : ai 6= bi jest skończony.np. ciąg (1, 2, 3, 4, 4, 4, . . .) i ciąg (3, 5, 1, 4, 4, 4, 4, . . .) są równe prawie wszędzie.)

Z każdym ciągiem (ni) zwiążemy teraz nową „jedność” - zbiór oznaczany przez [(ni)] i złożony ztych ciągów, które są mu „równe prawie wszędzie”:

[(ni)] = (mi) : (ni) =pw (mi)oczywiście ciagi równe prawie wszędzie wyznaczaja te samą nowa „jedność” - np. [(1, 2, 3, 4, 4, 4, . . .)] =[(3, 5, 1, 4, 4, 4, 4, . . .)

Oznaczmy przez Nks zbiór tak zdefiniowanych, nowych „jedności”45.Możemy teraz wykorzystać działania na zbiorze liczb naturalnych do określenia (nazywanych

tak samo) działań na elementach zbioru Nks. Np. dodawanie zdefiniujemy tak:

[(ni)] + [(mi)] = [(ni +mi)]np. [(1, 2, 3, 4, . . .)] + [(2, 4, 6, 8 . . .)] = [(3, 6, 9, 12 . . .)46

Możemy też „przenieść” na zbiór N sk relację „mniejsze-równe”:

([(ni)] ¬ [(mi)]) wtw gdy zbiór N \ i :∈ N : (ai, bi) ∈ r jest skończony,

W ten sposób rozszerzyliśmy standardowy model arytmetyki Peano - strukturę (N,+, ·,¬) - nowastruktura jest istotnie większa.

Jeśli zrozumieliśmy istotę tej konstrukcji to zgodzimy się, że można ją przeprowadzić dla do-wolnego modelu języka pierwszego rzędu A = (A, (qA), (rA), (cA)):

45Matematycznie: relacja ”=pw” to równoważność, a zbiór Nks to wyznaczony przez nią zbiór ilorazowy.46Zdefiniuj podobnie mnożenie elementow zbioru Nsk

Page 175: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 174

- najpierw na zbiorze ciągów elementów A określamy relacje „równosci prawie wszędzie”: (ai) =p

w(b1) wtw gdy zbiór i ∈ N : ai = bi jest koskończony47

- następnie tworzymy nowy zbiór Aks którego elementami są zbiory [(ai)] = (bi) : ai =pw bi- „przenosimy” wszystkie operacje i relacje i stałe z modelu A na zbiór Aks w sposób uprzednio

opisany. Np. gdy q to operacja trójargumentowa, to q([(ai)], [(bi)], [(ci)]) = [(q(ai, bi, ci)].48

W ten sposób zbudujemy nowy, większy model AksZałóżmy teraz, że A jest modelem pewnej teorii pierwszego rzędu T . I zapytajmy: czy nowy modelAks jest też modelem tej teorii?Odpowiedź jest ... negatywna. Skoro tak, to dlaczego zajmujemy się tą szczególną transformacją?Bo to tylko preludium - wystarczą niewielkie (sic!) zmiany, by opisana transformacja A Aksnie wyprowadzała poza klasę modeli tej teorii - wystarczy zamienić filtr zbiorów koskończonych naultrafiltr. I to jest ten „krytyczny moment” na drodze do twierdzenia Łosia.

Ultrafiltry i ultrapotęgi

Wyjaśnijmy, czym jest ultrafiltr. Przekrój (część wspólna) dwóch koskończonych zbiorów jestkoskończony. Dowolny zbiór zawierający w sobie zbiór koskończony jest koskończony. To znaczy, żerodzina wszystkich koskończonych zbiorów liczb naturalnych jest filtrem49. Ale nie jest ultrafiltermbo każdy ultrafiltr U musi spełniać dodatkowy warunek: dla dowolnego zbioru A ⊆ N, albo Anależy do U albo jego dopełnienie - zbiór N \A należy do U .

Filtr zbiorów koskończonych nie spełna tego warunku50. Ale ten filtr - jak każdy inny filtr -można powiększyć, zanurzyć w ultrafiltr.

Przykrą okolicznością jest to, że nie potrafimy wskazać żadnego takiego ultrafiltru!Skąd więc pewność, że istnieją? Mają ją ci, którzy akceptują aksjomatykę teorii zbiorów wraz z pewnikiemwyboru. To ten aksjomat gwarantuje, że dowolny filtr można rozszerzyć do ultrafiltru51.

Powtórzymy teraz opisaną wcześniej transformację dowolnego modelu A zastępując filtr zbio-rów koskończonych zawierajacym go ultrafiltrem U . Otrzymany w ten sposób nowy model AU toultrapotęga modelu A. Możemy teraz sformułować

Twierdzenie Łosia: „model A i jego ultrapotęga AU są elementarnie równoważne”

co oznacza, że dowolne zdanie pierwszego rzędu φ jest prawdziwe w modelu A dokładnie wtedy,gdy jest prawdziwe w modelu AU W szczególności, gdy A jest modelem pewnej teorii T , to i AUjest też modelem T .

Model A i jego ultrapotęga - model AU - są nierozróżnialne w języku pierwszego rzędu.Różne są tylko ich nośniki - zbiory, na których są posadowione.

Ktoś zirytowany nagromadzonymi tu zawiłościami i powierzchownością opisu może oczekiwać, że zarazzilustruję tę konstrukcję w prosty sposób, np. zakładając, że model A jest skończony. Płonne nadzieje: wtakim przypadku cała ta konstrukcja się trywializuje - AU = A.Konstrukcja Łosia to czysta abstrakcja - nie ma sensu bez pełnej akceptacji nieskończoności...

10.2 Konsekwencje twierdzenia Łosia

Ten na pozór czysto techniczny wynik jest źródłem wielu odkrywczych zaskoczeń52. Zacznijmy odnajprostszego. Oznaczmy przez NU ultrapotęgę zbioru N względem pewnego właściwego ultrafiltru

47To taka mała innowacja: zbiór A ⊂ N jest koskończony, gdy jego dopełnienie - zbiór N \ A - jest skończony. Zautrudnienia przepraszamy.

48Oczywiście w tym opisie pomijamy szereg istotnych technicznych trudności.49Nazywanym filterm Frecheta. O filtrach wspomnieliśmy wcześniej, dyskutując o kontinuum.50Ani zbiór liczb parzystych ani zbiór liczb nieparzystych nie jest (ko)skończony.51Ultrafiltry to maksymalne (względem relacji zawierana) filtry. W dowodzie istnienia makshymalnych filtórw -

ultrafiltrów - korzystamy z lematu Kuratowskiego-Zorna.52Lub zaskakujących odkryć.

Page 176: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 175

U53. NU - jako struktura elementarnie równoważna z N - jest modelem arytmetyki Peano.

Elementy NU są wyznaczone przez ciągi liczb naturalnych - (n0, n1, n2, . . .) Ciągi stałe -(n, n, n, . . .) - wyznaczają liczby standardowe w NU . Ale oprócz nich w NU jest nieprzeliczalniewiele liczb niestandardowych. Taką liczbą wyznacza np. ciąg (0, 1, 2, . . .) .Każda liczba niestandardowa jest większa od wszystkich liczb standardowych.

Zero jest liczbą standardową. Następnik liczby standardowej jest standardowy. To zdaje się przeczyćpeanowskiemu aksjomatowi indukcji, bo przecież podzbiór liczb naturalnych o tych własnościach powinienbyć zbiorem wszystkich takich liczb...Ale zasada indukcji opisana w aksjomatyce Peano dotyczy jedynie podzbiorów arytmetycznych!Nie ma tu żadnej sprzeczności - jedyne, co możemy wywnioskować, to stwierdzenie, że pojęcie „liczbastandardowa” nie jest definiowalne języku arytmetyki... .I choć to przeczy naszej intucji, można pogodzić zasadę indukcji z nieprzeliczalnością zbioru NU ...

Zatrzymajmy się na chwilę po to, by wyraźnie sobie uświadomić, obiekt NU istnieje tylko w „hilbertow-skim sensie”. Nie znamy przecież ani modelu ZFC ani konkretnego przykładu ultrafiltru. NU to pojęcieopisane w języku ZFC niesprzeczne z aksjomatami tej torii. Gdyby odrzucić aksjomat wyboru to tego„obiektu” by nie było.Pamiętajmy o tym czytając dalsze fragmenty tego tekstu w których mowa o ultrapotęgach54.

Zastąpmy liczby naturalne rzeczywistymi i rozważmy ultrapotęgę RU . Tu też można wyróż-nić standardowe i niestandardowe liczby rzeczywiste. Liczby standardowe to klasy ciągów stałych[(a, a, a, . . . a)]. Nie trzeba być specjalnie bystrym, by zauważyć że wśród liczb niestandardowychmożna wyróżnić dwie podklasy:

- „nieskończenie duże” - większe od wszystkich liczb standardowych. Taką liczba jest np. [(1, 2, 3, . . .)]- „nieskończenie małe” - niestandardowe liczby dodatnie mniejsze od wszystkich standardowychliczb dodatnich. Taka liczbę wyznacza np. ciąg (1, 1

2 ,13 , . . .)

R można zanurzyć w RU : a a∗ = [(a, a, . . .)]. Liczb w RU jest „więcej”.Konstrukcja Dedekinda liczb rzeczywistych miała wypełnić wszelkie luki między liczbami wymiernymina prostej rzeczywistej. Zatem po dorzuceniu liczb niestandardowych też ich nie powinno być. A jednak:wystarczy pomyśleć o przekroju wyznaczonym przez parę zbiorów z których jeden składa się wszystkichliczb ujemnych i nieskończenie małych dodatnich a drugi to jego dopełnienie55.Metafora geometryczno-liczbowa - utożsamienie liczb z punktami prostej- jest tylko metaforą... .

Liczb w RU jest więcej. Ale (pierwszorzędowe) własności tych matematycznych obiektów - R iRU - są dokładnie takie same56.

Czy struktura RU to tylko ciekawostka?W drugiej połowie XVII wieku Leibniz i Newton budowali podstawy analizy matematycznej ko-rzystając bez większych skrupułów z liczb nieskończenie małych: „liczba γ jest nieskończenie mała,jeżeli −a < γ < a dla dowolnej liczby rzeczywistej a > 0”. Leibniz zakładał, że wokół każdejliczby rzeczywistej rozciąga się monada - chmura złożona z liczb, które nie są rzeczywiste, ale sąnieskończenie bliskie a - „infinitely close to a”57.

53Ultrafiltr jest właściwy gdy ma w nim żadnego zbioru skończonego.54Wystarczy wpisać w internecie hasło „ultraprodukt” by przekonać się, jak wiele uwagi matematycy - nie tylko

logicy i algebraicy - poświęcają temu „nieistniejącemu” obiektowi.55Przypomnijmy: przekrój - para odpowiednich zbiorów (A,B) wskazuje lukę, gdy zbiór „mniejszych” liczb nie ma

elementu największego a drugi zbiór, złożony z „większych” liczb - najmniejszego.Mówiąc naukowo, pojawienie się nowych luk w RU to jedynie dowód, że „ciągłość” - taka, jaką definiuje Dedekind -nie jest własnością, która można opisać w języku pierwszego rzędu.

56Zauważ, że istnienie nieskończenie małych liczb w RU dowodzi, że nie da się sformułować prawa Archimedesa -∀x∈R∃n∈N n · x > 1 w języku pierwszego rzędu... .

57Termin „monada” nie jest wewnętrznym pojęciem matematyki. To centralne pojęcie filozoficznej koncepcji Le-ibniza: „Tam zaś, gdzie nie ma części, nie jest możliwa ani rozciągłość, ani kształt, ani podzielność. Monady te sątedy właściwymi atomami natury i jednym słowem pierwiastkami rzeczy.” (G. W. Leibniz, Monadologia).. Tym, comogło inspirować Leibniza, było wynalezienie pod koniec XVI wieku mikroskopu optycznego. Mikroskop odkrył przed

Page 177: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 176

Porządkując matematykę twórcy teorii mnogości zarządzili jej arytmetyzację - budowę wszelkichzbiorów liczbowych „na bazie” liczb naturalnych i za pomocą konstruktorów wskazanych w aksjo-matach ZFC. Tak wprowadzono do matematyki teoriomnogościowej liczby całkowite, wymierne irzeczywiste. Wydawało się, że konstrukcja tych ostatnich zaspokaja wszelkie oczekiwania - za ichpomocą zdefiniowano matematyczne continuum i uprawomocniono geometryczno-liczbową meta-forę prostej rzeczywistej. A gdy Weierstrass zaproponował swój precyzyjny ε-δ formalizm z ulgąogłoszono, że „nieskończenie małe” (których Leibniz nigdy zadowalająco nie opisał formalnie) sązbędne58. Cantor odrzucił te „bakcyle cholery infekujące matematykę”. Tak samo postąpili twórcynowoczesnej analizy matematycznej. Nie bacząc na to, że zastępując leibnizowskie intuicje defini-cjami zapisanymi w języku ε-δ (rojącymi się od kwantyfikatorów), odseparowali matematyków od„zdrowej reszty społeczeństwa”. Byli przekonani, że czynią dobro.

Wynik Łosia podważa tę pewność. Konstrukcja ultrapotęgi RU umożliwia precyzyjne zdefinio-wanie nieskończenie małych liczb rzeczywistych. To oznacza, że można wrócić do idei Leibniza iuprawiać analizę matematyczną w RU zamiast w R. I takie próby podjęto - tak powstała analizaniestandardowa59.

Spróbujmy pokazać, co różni języki standardowej i niestandardowej analizy matematycznej.Analiza matematyczna bada własności (ciągłych) funkcji rzeczywistych. Każdą funkcję f : R → Rmożna rozszerzyć do funkcji f∗ : RU → RU przyjmując f∗([(ri)]) = [(f(ri)]. Twierdzenie Łosiagwarantuje, że każda pierwszorzędowa własność funkcji f przysługuje też funkcji f∗. I vice versa.

W analizie standardowej, aby zrozumieć ciagłość funkcji trzeba najpierw pojąć czym jest gra-nica funkcji w punkcie60 - bariera nie do przeskoczenia dla zdrowej części społeczeństwa.Tymczasem korzystając z zanurzenia R w RU możemy powrócić do intuicyjnie prostej, „leibnizow-skiej” charakteryzacji ciągłości: „funkcja f : R → R jest ciągła w punkcie a ∈ R, dokładnie wtedy,gdy nieskończenie mała zmiana argumentu powoduje nieskończenie małą zmianę wartości funkcji”:

∀y a∗ ≈ y ⇒ f∗(a∗) ≈ f∗(y)

(gdzie a∗ = [(a, a, . . .)] a zapis a∗ ≈ y oznacza, że różnica a∗ − y jest nieskończenie małą liczbą):Podobnie rzecz się ma z pojęciem pochodnej funkcji ciągłej f w punkcie a. W analizie standar-

dowej to granica ilorazu różnicowego. W niestandardowej to część standardowa liczby

f∗(a∗ + α)− f∗(a∗)α

gdzie α to dowolnie wybrana nieskończenie mała (różna od zera)61.

Wystarczy zajrzeć do jakiejkolwiek monografii poświęconej analizie niestandardowej62, by sięprzekonać, że prowadzenie rachunków (dowodzenie) w języku Leibniza jest w wielu przypadkachłatwiejsze niż w języku Weierstrassa63.

Renesans idei Leibniza pod postacią analizy niestandardowej jest tak udany, że niektórzy (np. K. Godel)mówili i mówią o niej jako o analizie matematycznej XXI wieku...

uczonymi niedostępny dotąd świat nieskończenie małych obiektów. Bezzasadna konfabulacja? H. Keisler wyjaśniającw [54] podstawowe pojęcia analizy niestandardowej używa terminu „mikroskop” gdy mówi o monadach i „teleskop”- gdy mówi o galaktykach (galaktyka liczby a to zbiór b : |b− a| jest standardowa.

58Karl Weierstrass (1815-1897) - matematyk niemiecki.59Za twórcę analizy niestandardowej uważa się matematyka amerykańskiego, A. Robinsona. Trochę dziwi, że nie-

którzy autorzy zapominają o roli twierdzenia Łosia w budowie podstaw analizy niestandardowej.60Patrz str. 3761Część standardowa liczby [(ai)] to liczba [(a, a, . . .)] taka, że różnica tych liczb jest nieskończenie mała. Ponieważ w

deginicji pochodnej nieskończenie mała α jest wybierana dowolnie, to może się zdarzyć, że tak definiowana pochodnaw punkcie nie istnieje. I bardzo dobrze, bo to samo mówi nam analiza standardowa. (patrz str. 46)

62Np. Elementary Calculus, an infinitesimal approach H. J. Keislera - dostępna w internecie.63„Łatwość” czy „trudność” to kategorie subiektywne. Sugerowałem, że miarą trudności pojęcia może być stopień

zagnieżdżenia kwantyfikatorów w zdaniu je opisującym („schody generała Wieniawy”). A po przetłumaczeniu definicjiformułowanych w języku Weiersrassa na język analizy niestandardowej kwantyfikatorów z reguły ubywa.

Page 178: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 177

Zastosujmy teraz konstrukcję Łosia do (istniejącego hipotetycznie) modelu ZFC. Oznacznygo przez Set a przez SetU oznaczmy nowy model ZFC - jego ultrapotęgę względem właściwegoultafiltru U .Elementami - czyli zbiorami! - w tym modelu są klasy abstrakcji ciągów zbiorów z Set. Oczywiście:

[(A1, . . . , An, . . .)] = [(B1, . . . , Bn, . . .)] wtw i ∈ N : Ai = Bi ∈ U

[(A1, . . . , An, . . .)] ∈ [(B1, . . . , Bn, . . .)] wtw i ∈ N : Ai ∈ Bi ∈ UWiększość teoriomnogościowych konstrukcji w SetU realizowana jest „po współrzędnych”. Np.

para złożona ze zbiorów [(A1, . . . , An, . . .)] i [(B1, . . . , Bn, . . .)] to zbiór [((A1, B1), (A2, B2) . . .)].

A funkcja to klasa abstrakcji ciągu funkcji w Set64

W SetU istnieje - jak w każdym modelu ZFC - zbiór liczb naturalnych (najmniejszy zbiórinduktywny). To zbiór NU = [(N, . . . ,N, . . .)].

Czujny czytelnik zauważył, że zbiór liczb naturalnych w SetU oznaczyłem symbolem, którymwcześniej oznaczaliśmy ultrapotęgę N względem U w Set. Rzeczywiście, te obiekty mają te sameelementy. Tak samo - „po współrzędnych”- definiujemy dodawanie i mnożenie. Zatem - czy te zbio-ry są tym samym?To pytanie jest pozbawione sensu. Te obiekty należą do dwóch różnych modeli ZFC, dwóch od-rębnych światów. Łatwiej to pojąć gdy zauważymy, że te dwa zbiory mają istotnie różne rodzinypodzbiorów! Liczby standardowe są podzbiorem ultrapotęgi NU w Set natomiast ... nie tworzą pod-zbioru zbioru liczb naturalnych w SetU ! Można bowiem pokazać, że każdy podzbiór NU zawierającywszystkie liczby standardowe musi zawierać pewną liczbę niestandardową.

Część zbioru, która nie jest jego podzbiorem? Kolejny paradoks?W żadnym razie. Aksjomaty ZFC nie dają żadnych podstaw do stwierdzenia, że podzbiorem zbioru jestkażda, wyróżniona w jakikolwiek sposób kolekcja jego elementów, jego część.

Skoro liczby standardowe nie tworzą podzbioru NU , to nie da się ich opisać w języku teorii mno-gości65. To zaskakujace stwierdzenie jest konsekwencją takiego oto ogólniejszego i równie zastana-wiającego, twierdzenia: „każda przeliczalna rodzina zbiorów ([Ai] : i ∈ N) w SetU taka, że każdyskończony przekrój [A0] ∩ · · · ∩ [Ak] jest niepusty, ma ... niepusty przekrój”.

Rzeczywiście? Przecież łatwo udowodnimy - w ZFC!- że istnieją przeliczalne rodziny zbiorów, które niemają tej własności - np. rodzina odcinków (0, 1n ). To jednak nie przeczy naszemu twierdzeniu, bo - wbrewpozorom - nie jest ono sformułowane w języku teorii mnogości! „Przeliczalność” jest tu rozumiana „ze-wnętrznie”: rodzina ([Ai] : i ∈ N) nie jest indeksowana przez liczby naturalne w SetU ale przez elementy„zewnętrznego” (np. definiowanego konstruktywnie) zbioru liczb naturalnych na którym posadowionyjest ultrafiltr U 66.

Gdy dla dowolnego nieskończonego i przeliczalnego (w sensie zewnętrznym!) podzbioru D =⊂NU utworzymy przeliczalną rodzinę podzbiorów [(Dn)] ⊂ NU taką, Dn to zbiór wszystkich liczbnaturalnych (w sensie wewnętrznym!) w D , które są większe od standardowej liczby [(n, n, . . . , )],to - na mocy tego twierdzenia - w zbiorze D musi być niestandardowa liczba naturalna!

W modelu zamierzonym standardowe liczby naturalne to te, które są elementami uniwersalnego systemu

64Nie wszystko jest tak banalnie proste. Np. sprawdzenie, czy SetU spełnia aksjomat ekstensjonalności - równo-ważność A = B wtw ∀C (C ∈ A)↔ C ∈ B) - wygląda tak (zarys dowodu):

[(Ai)] = [(Bi)] wtw, gdy i ∈ N : Ai = Bi ∈ U a gdy [(Ci)] ∈ [(Ai)] to j : Cj ∈ Aj ∈ U . Stąd j : Cj ∈ Aj =Bj ∈ U i, konsekwentnie, k : Ck ∈ Bk ∈ U czyli [(Ci)] ∈ [(Bi)] .

Gdy [(Ai)] 6= [(Bi)], to i ∈ N : Ai 6= Bi ∈ U czyli jeden ze zbiorów i ∈ N : Ai ) Bi , i ∈ N : Ai ( Bi jest wU . A to pozwala na skonstruowanie zbioru [(Ci)] który należy tylko do jednego z tych dwóch zbiorów.

65To wynika z aksjomatu wyróżniania.66Z tego samego powodu nie powinniśmy też mówić o niepustości przekroju rodziny ([(Ai)] : i ∈ N (taki przekrój

może nie istnieć) ale jedynie o tym, że te zbioru mają wspólny element.

Page 179: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 178

nazw. Można je skonstruować w skończonym czasie (w skończonej liczbie kroków) rozpoczynającod zera i korzystając z operacji następnika - na pustej kartce kolejno stawiamy kreski, jedna po drugiej.Twierdzenie Łosia pokazuje, że tej charakteryzacji nie da się zapisać w języku pierwszego rzędu. Jak-kolwiek to nie zabrzmi, trzeba powiedzieć, że ta pierwotna definicja liczb naturalnych nie należy doteoriomnogościowej matematyki...

Zaskoczeń ciąg dalszy:I. Zbiór liczb naturalnych - taki, jakim go definiuje teoria mnogości - jest dobrze uporządkowa-ny przez relację „¬”: każdy jego niepusty podzbiór ma element najmniejszy. A przecież w NU

nie ma najmniejszej liczby niestandardowej! Sprzeczność? Nie: te liczby - jako dopełnienie liczbstandardowych w NU - nie tworzą podzbioru.

II. Definiowana teoriomnogościowo liczba naturalna jest skończonym zbiorem. Jej elementami sąwszystkie mniejsze od niej liczby naturalne - n = 0, 1, . . . , n−1 . Ale każda liczba niestandardowa,ma... nieskończenie wiele elementów! Np. wszystkie standardowe liczby są elementami zbioru - liczbyniestandardowej [(0, 1, 2, . . .)] . Sprzeczność? W żadnym razie. W teorii mnogości zbiór skończonyto taki, który nie jest równoliczny ze swym właściwym podzbiorem. Nic więcej.

Definiowana w ZFC skończoność jest pojęciem zależnym od modelu.W szczególności taka definicja skończoności nie gwarantuje, że każdy zbiór skończony można opróżnić wskończonym czasie wyjmując kolejno po jednym elemencie67.

III. Skoro liczby niestandardowe nie tworzą podzbioru, to przyporządkowanie f : NU → 0, 1takie, że:

f(n) =

1 n− niestandardowa

0 n− standardowa

nie jest funkcją - w rozumieniu teoriomnogościowym - w SetU 68. Ale to przyporządkowanie jestfunkcją w Set.

IV. W SetU nie potrafimy rozstrzygać o równości liczb naturalnych. Np. nie wiemy, czy liczba[(0, 1, 0, 1, 0, 1, . . .)] to zero czy następnik zera - to zależy od tego, czy zbiór liczb parzystych należydo ultrafiltru U .

Skoro równość liczb naturalnych nie jest rozstrzygalna, to czy o jakichkolwiek funkcjach działających natym zbiorze, można mówić, że są obliczalne?

V. Liczby naturalne to skończone liczby porządkowe. Jeśli są one różne w Set i SetU , to i liczbyporządkowe w obu modelach są różne.

Obiekty SetU reprezentowane przez ciągi stałe - [(A,A, . . .)] - to zbiory standardowe. Możnawięc - w tym modelu - mówić o standardowych i niestandardowych elementach zbioru, standardo-wych funkcjach itp. i zauważyć - na przykład - takie ciekawostki:

- każdy nieskończony zbiór SetU ma niestandardowe elementy,- wszystkie elementy zbioru skończonego w SetU są standardowe dokładnie wtedy, gdy ten zbiór

jest standardowy.

Model Set można zanurzyć w SetU poprzez przyporządkowanie A [(A,A, . . .)].Istnieje też zanurzenie odwrotne - model SetU można zanurzyć w Set. Wystarczy skorzystać zultraproduktu modeli 69.

67Ilustrując działanie zasady indukcji, często używamy takiego przykładu: „w urnie jest skończenie wiele kul nume-rowanych liczbami naturalnymi. Na miejsce jednej wyjmowanej kuli wolno włożyć skończenie wiele kul o numerachniższych niż numer wyjętej kuli. Pokaż, że takie postępowanie musi - po skończonym czasie - doprowadzić do opróż-nienia urny”. Akurat... spróbuj tak opróżnić urnę, w której jest jedna kula o numerze [(0, 1, 2, . . .)]...

680 to [(0, 0, . . .)] i 1 = [(1, 1, . . .)].69Ultraprodukt to pojęcie tylko trochę ogólniejsze od ultrapotęgi modelu Punktem wyjścia do jego budowy jest

Page 180: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 179

Zanurzenie SetU w Set to przyporządkowanie każdemu zbiorowi [(Ai)] ∈ SetU ultraprodukturodziny zbiorów (Ai) . Jednak nie każda funkcja w Set między ultraproduktami rodzin (Ai) i (Bi)jest ultraproduktem rodziny zbiorów-funkcji (fi) takiej, że [(fi)] jest funkcją z [(Ai)] do [(Bi)] wSetU .

10.3 Matematyczne uniwersum

Strasznie nam się skomplikowała ta opowieść o modelach ZFC ... . Jak w tym kontekście interpre-tować wynik Łosia?„Zbiór” jako pojęcie pierwotne ZFC nie jest definiowany w tej teorii. Tymczasem w języku natural-nym próbujemy to pojęcie definiować. Próbował Cantor, próbowali kognitywiści. Mimo niejasności- wszak język naturalny nie ma precyzji języków formalnych - żywimy przekonanie, że to pojęciema swoją jednoznacznie określony zakres. Twórcy teorii mnogości chcieli te niejasne wyobrażeniazastąpić opisem w formalnym języku pierwszego rzędu. Klasa desygnatów nieprecyzyjnego pojęcia„zbiór” miała odtąd być opisana jako model ZFC. I - jak się zdawało (chciało) - jako model jedyny.Niesprzeczność ZFC - niedowodliwa w ZFC - wymusza istnienie jej „małych modeli”70. Twier-dzenia Lowenheima-Skolema i Łosia pokazały, że tych małych modeli jest wiele (jeśli tylko istniejechoćby jeden). Można było mieć nadzieję, że wszystkie te małe modele są zawarte w jednym du-żym „uniwersalnym” modelu (którego elementy tworzą klasę a nie zbiór). Ale twierdzenie Łosiatemu przeczy - niesposób zanurzyć modele Set i SetU w jeden większy model tak, że zbiory liczbnaturalnych z obu modeli pozostaną - po tym zanurzeniu - zbiorami liczb naturalych.

10.3.1 Model zamierzony ZFC„One common confusion about models of ZFC stems from thetactic expectation that (...) we are supposed to suspend allour proconceptions about sets when beginning to studyof ZFC.71

„One should not allow the (fairly sensible) idea that set theory can be a foundation for mathe-matics to bounce one into thinking that one has to start entirely inside Set Theory and pull oneselfup into Mathematics by one’s bootstraps. That is not sensible. (...) On the contrary: it is perfectlyreasonable—indeed essential — to approach the construction of the cumulative hierarchy armedwith the primitive idea of ordinal72.

Matematyka nie zaczęła się od Cantora i Hilberta. Tworząc ur-teorię - ZFC - jako cel stawialisobie oni uporządkowanie zastanej matematyki. To był ich model zamierzony. I jest nim nadal choćdziś - właśnie za sprawą ZFC - to matematyczne uniwersum jest nieporównywalnie większe odtego, które zastali twórcy teorii mnogości.

To, że ZFC przyczyniła się do rozbudowy uniwersum nie oznacza, że wchłonęła swój model zamierzony!W tym modelu wszystkie liczby naturalne są standardowe - konstruowane z zera za pomocą operacjinastępnika. Są emanacją (dyskretnego) czasu. Tego ZFC nie potrafi opisać.W tym modelu skończoność rozumiemy tak, jak w świecie rzeczywistym. W konsekwencji, budowanez liczb naturalnych liczb całkowite, wymierne a nawet rzeczywiste czy zespolone, interpretujemy w tymświecie jednoznacznie. A dzięki kartezjańskiemu utożsamieniu punktów z ciągami liczb również przestrzeńeuklidesowa „wymiaru n” jawi się nam jako pojęcie „jednoznacznie określone”.W tym świecie podstawowe obiekty są konstruowalne.

rodzina modeli (Ai : i ∈ N) . Elementami ultraproduktu są klasy ciagów [(ai : i ∈ N)] takich, że ai ∈ Ai dla każdegoi ∈ N. Działania i relacje określamy tak, jak w przypadku ultrapotęgi - „po współrzędnych”.Dodajmy, że twierdzenie Łosia odnosi się do ultraproduktu modeli a nie tylko do ultrapotęgi pojedynczego modelu.

70Małych w tym sensie, że „elementy tego modelu tworzą zbiór”.71T. Y. Chow, A beginner’s guide to forcing, Contemporary Mathematics, tekst dostępny również w internecie.72The Axioms of Set Theory T. Forster - artykuł dostępny w internecie.

Page 181: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 180

Takie wyobrażenie matematycznego uniwersum jest rozszerzeniem ZFC o „aksjomat istnieniamodelu zamierzonego”. Oczywiście, ten „aksjomat” ma charakter odmienny od pozostałych. Jestraczej aktem wiary - wyrazem przekonania, że uprawianie matematyki ma sens. P. Cohen pisał:„The axiom of standard models, i.e., that there is a standard model, is slightly stronger than theconsistency of the system. Nevertheless, I feel that one must work with standard models if one isto have any kind of reasonable intuitive understanding”. [23].

Można też bardziej „psychologicznie”:„Jeżeli za urlogikę przyjmiemy pierwszorzędową teorięzbiorów, to zdaniami urlogiki są zdania pierwszego rzędu z jedynym symbolem relacyjnym „∈”.Aksjomatami są aksjomaty ZFC. Nieformalnie interpretujemy te aksjomaty jako stwierdzenia omatematycznych obiektach konstruowanych jako zbiory. A ponieważ matematyczne obiekty niesą a priori zbiorami, pewna reinterpretacja jest dokonywana w naszych umysłach.Jednakże jest to zgodne z ideologią matematyczną która przyjmuje, że nie jest ważne czym sąobiekty ale jakie są relacje między nimi” [127]

„Życie jest formą istnienia białka tylko w kominie coś czasem załka” - A. Osiecka... .

Twierdzenie Łosia nie jest odkryciem alternatywnych uniwersów. Ono tylko wskazuje ograniczenia ZFCi języka pierwszego rzędu jako języa opisu tego uniwersum73.

J. Pogonowski w artykule „Jak żyć z paradoksem Skolema” (dostępnym w internecie) pisał:„Trudno jest sensownie mówić o jedynym, zamierzonym modelu teorii mnogości. Problem ten niespędza jednak snu z powiek pracującym matematykom – posługują się oni swobodnie pojęciamimnogościowymi, pozostawiając filozoficzne rozterki związane z podstawami teorii mnogości logi-kom”. Ten trzeźwy pogląd i sugestia, że to właściwa postawa matematyka, ma swoje pragmatyczneuzasadnienie74. Jednak go nie podzielam: uważam, że ZFC ma model zamierzony 75.

Oto przykład godny uwagi. Wskazując po raz pierwszy niestandardowy model arytmetyki ar-gumentowałem tak: „każdy skończony podzbiór teorii PA ∪ succn(0) < c : n ∈ N ma model -jest nim N z „odpowiednio dużą” liczbą nc wskazaną jako interpretacja stałej c. Zatem, na mocytwierdzenia o zwartości, cała ta teoria ma model. Ale nie może nim być N, gdyż „nie istnieje liczbanaturalna większa od każdej liczby postaci succn(0)”76.Czyżby? Przecież w niestandardowy modelu ZFC - SetU - niestandardowa liczba id = [(0, 1, 2, . . . , n . . .)]jest większa od każdej standardowej liczby [(. . . , n, n, . . .)] = succn(0). Zatem to rozumowanie niejest poprawne. Bardziej precyzyjnie: nie można tego stwierdzenia udowodnić w ZFC !

To rozumowanie jest jednak w pełni poprawne gdy mamy na uwadze nasz „model zamierzo-ny” ZFC, w którym każda liczba naturalna jest konstruowalna z zera za pomocą następnika wskończonej liczbie kroków... .

Uznajemy ZFC za ur-teorię ale matematykę uprawiamy w jej modelu zamierzonym.

Ta teza może się wydawać kontrowersyjna. Nawet błędna. Ale o czym myślimy mówiąc „zbiórfromuł”? Jak rozumiemy stwierdzenie, że „słowo to skończony ciag liter”? Przecież nie jest tak, żenajpierw wskazujemy pewien teoriomnogościowy model ZFC a dopiero potem interpretujemy te

73W artykule „Podstawy Matematyki w wieku XX” (dostępnym w internecie) znalazłem takie stwierdzenie jegoAutorów (W. Marek i J.Mycielski): „ G. Cantor (...) udowodnił, że wszystkie przedmioty, które rozważają matematycy,można rozumieć jako zbiory. (...) Na przykład, za pomocą pojęcia zbioru łatwo zdefiniować pojęcie liczby naturalnej”.Nie rozumiem. Naprawdę. Zgodzę się, że można je opisywać. Ale nie definiować.

74(...) a correct philosophical position of a true mathematician should be:- platonism – on weekdays – when I’m doing mathematics (otherwise, my „doing” will be inefficient),- formalism – on weekends – when I’m thinking „about” mathematics (otherwise, I will end up in mysticism). To -nieco zmanipulowany - cytat z R. Hersh, Some Proposals for Reviving the Philosophy of Mathematics, Advances inMathematics, 1979, vol. 31.

75W artykule P. Gładkiego „Program Hilberta” (dostępny w internecie), przypisano Hilbertowi pogląd, że: „wmetamatematyce rozumowanie musi opierać się na intuicyjnym pojęciu liczby całkowitej a nie na arytmetyce sfor-malizowanej”. Jeśli tak, to mamy po swojej stronie ważnego sojusznika...

76str. 95

Page 182: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 181

i inne metamatematyczne stwierdzenia. Jedyną możliwą odpowiedzią jest odwołanie się do pier-wotnego modelu zamierzonego w którym interpetacja takich pojęć jak „skończoność” czy „liczbanaturalna” jest uniwersalna a nie teoriomonogościowa.

Użyjmy trafnego, choć nieco archaicznego określenia: słownik metamatematyki jest zrozumiały„sam przez się”.

Postulat niezależnego istnienia modelu zamierzonego jest zgodny z pojmowaniem matematykiw duchu realizmu (platonizmu): jest potrzebny, bo „uniwersum” to coś więcej niż język. Skorosformalizowana teoria nie jest w stanie jednoznacznie go opisać, to zgadzamy się, że opis uniwersumtrzeba uzupełnić dodając „nieformalne” aksjomaty... . Model zamierzony jest potrzebny realistomjak tlen, bo nadaje sens ich matematycznym działaniom77.

Internal v. external

„Wewnętrzny - zewnętrzny...”. Robi się naprawdę niemiło, gdy uświadomimy sobie, że we wielufundamentalnych twierdzeniach pojawiają się modele budowane z formuł co oznacza (nieuprawnio-ne) utożsamienia zbioru formuł rozumianego jako realny zbiór napisów ze zbiorem definiowanymteoriomnogosciowo. Tak jest np. w opisanym wcześniej twierdzeniu Henkina o zupełności.

Te subtelności mogą mało obchodzić pracujących matematyków którzy są jednocześnie realistami, czyliinteresuje ich głównie matematyka modelu zamierzonego.Ale mówiąc o podstawach matematyki nie możemy być obojętni wobec tych pytań. To nieuchronna kon-sekwencja tego, że liczby naturalne są unierwsalnym systemem pozwalającym kodować słowa dowolnegojęzyka (w szczególności języka matematyki) i jednocześnie są głównym przedmiotem badań prowadzonychza pomoca języka - matematyki.

Oto przykład. Uniwersum Godla78 to „odchudzona” wersja uniwersum von Neumanna: to re-kurencyjnie definiowana rodzina coraz to większych „zbiorów” (Lα : α ∈ Ord). Punkt wyjścia jesttaki sam: L0 = V0 = ∅. Gdy „zbiór” Lα jest już zdefiniowany, to dla każdej formuły φ definiujemy„zbiór” Lφα+1 złożony z tych „zbiorów”, które są opisane przez formułę φ i parametry ze zbioruLα

79. PrzyjmujemyLα+1 =

⋃φ∈Form

Lφα

gdzie Form to (zewnętrzny), przeliczalny zbiór formuł. Dla liczb porządkowych granicznych przyj-mujemy Lα =

⋃β<α Lα. Ostatecznie

L =⋃

α∈OrdLα

Krytyczna dla tej konstrukcji jest definicja „zbioru” Lα+1 : aksjmat sumy dopuszcza tworzenie sum„zbiorów” (Ai : i ∈ I) gdy kolekcja indeksów - I - jest „zbiorem”... . W [69] znajdujemy takizapis: „Godel’s construction relies on the central concept of definability, that requires to manipu-late formulas within the set-theoretic universe, (...) For that, we need to internalizethe language of formulas of ZF in ZF, by constructing a particular denumerable set Formwhose elements—called (...) codes of formulas—are intended to represent external formulas as sets.Przedstawione tam rozwiązanie problemu - uwewnętrznienie zbioru formuł poprzez zdefiniowanie„zbioru” Form - jest zbyt skomplikowane technicznie bym mógł je tu szczegółowo omawiać.

Aby uniknąć tych zawiłości możemy przyjąć, że konstrukcja Godla jest realizowana w modeluzamierzonym, w którym formuły tworzą zbiór przeliczalny i w ten sposób uniknąć tego problemu.Ale czy to jest satysfakcjonujące rozwiązanie? 80

77„He’s a real nowhere man, sitting in his Nowhere Land, making all his nowhere plans for nobody. Doesn’t havea point of view, Knows not where he’s going to (...) - The Beatles.

78Constructible Godel universe”. Nie należy mylić tego pojęcia z „kosmologicznym” uniwersum Godla.79Odwołujemy się tu do aksjomatu wyróżniania.80W uzupełnieniu: przyjmijmy, że godlowskie konstruktywne uniwersum L jest poprawnie zdefiniowane w ZFC.

Page 183: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 182

10.3.2 Superstruktury i niestandardowe uniwersa

Relacja między „wewnętrznym” a „zewnętrznym” nie zawsze rozumiana jest tak, jak to tu opisali-śmy. Popatrzmy jak interpretuje się te pojęcia w teorii niestandardowych uniwersów.Skąd one? Teorię ZFC poprzedzała tzw. naiwna teoria zbiorów. Jej jądrem były zbiory liczbowekonstruowane na bazie liczb naturalnych. Zbiory potęgowe - zbiory złożone z podzbiorów - używano„stosownie do potrzeb”, w ograniczonym zakresie. Wydawało się, że ekspansja teorii mnogości ode-brała takiemu myśleniu o matematyce rację bytu. Ale zniszczenie marzeń dokonane przez Godla,Cohena i innych, sprawiło, że zaczął się kształtować (kiełkować) pogląd, iż objęcie pojedyncząaksjomatyczną teorią całego matematycznego uniwersum - rozumianego jako „całość, ogół” - niemusi być priorytetem matematyki. Może właśnie dlatego na jednej ze stron wikipedii można zna-leźć takie zdanie: „In mathematics (...) a universe is a collection that contains all the entities onewishes to consider in a given situation”.. To oznacza - jakkolwiek dziwnie to nie zabrzmi -że dopuszczamy istnienie wielu uniwersów.

Pomyślmy o uniwersum Cantora jako o bycie potencjalnym, w duchu Arystotelesa. Uprawiając swojąmatematykę, korzystamy z jego fragmentu ale ze świadomością, że to co w owym uniwersum jest pozatym fragmentem jest nieograniczone.Wcześniej sugerowałem, że tak można myśleć o potencjalnej nieskończoności liczb naturalnych i że po-dobnie można myśleć o potencjalnej możliwości budowania i wykorzystywania dowolnie skomplikowanychformuł języka pierwszego rzędu. I tak też można (należy) myśleś o cantorowskim uniwersum81.

Do tych bliżej niesprecyzowanych „lokalnych” uniwersów nawiązuje pojęcie superstruktury82. Tojakby „krótsza wersja” konstrukcji von Neumanna z tą różnicą, że punktem wyjścia do jej budowynie jest zbiór pusty tylko dowolnie ustalony bazowy zbiór indywiduuów (atomów, ur-elementów).My wybierzemy zbiór liczb rzeczywistychR. Superstruktura o bazieR to przeliczalna suma zbiorówV (R) =

⋃n∈N Vn(R), gdzie V0(R) = R, Vn+1(R) = Vn(R) ∪ 2Vn(R).

V (R) to model języka teorii zbiorów ale nie jest to model ZFC83. Są tu dostępne wszelkie obiekty -liczby i zbiory - niezbędne do uprawiania analizy matematycznej. Mamy zbiórR i jego wszelkie pod-zbiory. Możemy mówić o parach uporządkowanych84 co pozwala mówić o (skończonych) iloczynachkartezjańskich, funkcjach, relacjach itd. Ale nie mamy wszystkiego co „istnieje” w ZFC:

„Superstructures are universes for the practice of mathematics”. Są one tworzone „na bazie” teorii mno-gości co należy rozumieć - mniej więcej - tak: wolno korzystać ze wszelkich konstrukcji uprawnionychw ZFC jednak pod warunkem, że nie wyprowadzają one poza rodzinę zbiorów wskazaną w definicji tejsuperstruktury. I nie wszystko musi tu być zbiorem... .

Superstrukturę V (R) można rozszerzyć tworząc niestandardowe uniwersum. Dla dowolnie wy-branego ultrafiltru U (np. na zbiorze N). ograniczona ultrapotęga V (R)Ur to podzbiór „zwykłej”ultrapotęgi: ciąg (fn) wyznacza element [(fi)] ∈ V (R)Ur tylko wtedy, gdy wszystkie elementy tegociągu należą do jednego ze zbiorów Vm(R).Para (V (R), V (R)Ur ) wraz z zanurzeniem a ∈ V (R) a∗ = [(a, a, . . .)] ∈ V (R)Ur to właśnie

Wówczas L ⊆ V - to dość łatwo pokazać. Ale czy istotnie mniejsze? Tego nie wiemy: równość V = L jest aksjomatemniesprzecznym z ZFC tzn. nie potrafimy - w ZFC dowieść rowności L = V anie jej zaprzeczyć... . Podobnie jak tobyło z hipotezą continuum.

81Rozsądny wykładowca nie zaczyna wykładu o teorii mnogości od prezentacji aksjomatów. Pierwszy wykład zaczy-na się mniej wiecej tak: wykładowca mówi „ustalmy pewien zbiór V ”. I opisuje podstawowe operacje na podzbiorachtego zbioru. Ów apriorycznie ustalony zbiór V to lokalne uniwersum „które zawiera to wszystko, co chcemy rozważaćw danej sytuacji. My postąpilismy podobnie mówiąc o modelach FOL i strukturach (str. ??).

82Tę nieprzyzwoicie krótką notkę o niestandardowych uniwersach sporządziłem głównie w oparciu o pracę [81]pomijając szereg istotnych szczegółów, które jednak nie są istotne dla zrozumienia istoty rzeczy.

83Zauważ, że teoriomnogościowa konstrukcja zbioru liczb naturalnych czy rzeczywistych „nie mieści się w V (R)” .Ale te liczby są obecne w tej superstrukturze jako „pojęcia prymitywne”: „in analysis a real number is always handledas a primitive entity rather than as a set” - [81]

84Ponieważ (x, y) = x, x, y

Page 184: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 183

niestandardowe uniwersum85.Elementy V (R)Ur to zbiory niestandardowe. Zbiory postaci a∗ nazywamy zbiorami standardo-

wymi. Zbiory wewnętrzne to elementy zbiorów standardowych a pozostałe to zbiory zewnętrzne.Jednak te nazwy nie mają wiele wspólnego ze znaczeniami, jakie słowom „wewnętrzny” i „ze-

wnętrzny” nadaliśmy poprzednio. W rozważanym tu przypadku rzecz można wyjaśnić tak: su-perstruktura V (R) to świat „standardowej” analizy matematycznej, jej przedmiot badań. Jej za-nurzenie w uniwersum V (R)Ur to nie zmiana przedmiotu badań a jedynie stworzenie kontekstuposzerzającego nasze możliwości poznawcze: „The typical strategy in nonstandard analysis is asfollows. Assume we want to prove (or disprove) some conjecture P about the real numbers (...).Formalize P as a first order formula φ. It can happen that it is easier to decide P in some nonstan-dard model where additional tools may be available (for instance, infinitesimals), rather than inthe standard model. Once the property P, as formally expressed by the formula φ, has been proved(or disproved) in nonstandard model, by transfer it is true (or false) in the standard structure aswell [81]

Dodatek: twierdzenie Ramsey’a revisited

Twierdzenia Łosia pozwala nam spełnić obietnicę i dokończyć dowód twierdzenia Ramsey’a: „dladowolnej liczby naturalnej n istnieje liczba R(n) taka, że każdy skończony, pełny dwukolorowy grafo R(n) wierzchołkach zawiera jednokolorowy podgraf o n wierzchołkach”86.

Wykorzystamy udowodnioną wcześniej nieskończoną wersję tego twierdzenia87 i twierdzenieŁosia w jego „pełnej wersji”. Ta pełna wersja mówi o własnościach ultraproduktu rodziny modeliΠU (An : n ∈ N)88 i pozwala na stwierdzenie, że każde zdanie φ prawdziwe we wszystkich modelach(An : n ∈ N) jest prawdziwe w ultraprodukcie Π(An : n ∈ N).

Pełne grafy dwukolorowe to modele pewnej teorii pierwszego rzędu89 a własność „dwukolorowygraf nie zawiera jednokolorowego podgrafu o m wierzchołkach” jest opisywalna w języku tej teorii.

Dowodzimy „przez sprzeczność”: przyjmijmy, że dla pewnej liczby naturalnej m nie istniejeliczba R(m) o żądanej własności. To oznacza, że dla każdej liczby naturalnej n można wskazaćpełny dwukolorowy graf Kn o n wierzchołkach w którym nie ma jednokolorowego podgrafu o mwierzchołkach.Zbudujmy ultraprodukt rodziny ΠU (Kn : n ∈ N) względem dowolnego właściwego ultrafilru U . Namocy twierdzenia Łosia, ten obiekt dziedziczy wszystkie pierwszorzędowe własności wspólne dlawszystkich modeli (Kn : n ∈ N). Jest więc pełnym dwukolorowym grafem i nie w nim jednokolo-rowego podgrafu o m wierzchołkach.Ten graf-ultraprodukt jest nieskończony i przeliczalny. Zatem - na mocy „nieskończonej wersji”twierdzenia Ramsey’a - musi zawierać nieskończony jednokolorowy pełny podgraf. Tym samymzawiera taki podgraf o m wierzchołkach.Ta sprzeczność upoważnia do stwierdzenia, że udowodniliśmy twierdzenie Ramsey’a.

Dodajmy jeszcze jedną uwagę godną uwagi czytelnika. Oczywiście R(2) = 2. Łatwo wyliczyć, żeR(3) = 6. Ale na pytanie o liczbę R(5) potrafimy dziś odpowiedzieć tylko tyle, że 43 ¬ R(5) ¬ 49 . . ..

To zaskakuje. Jak to możliwe, że dysponując potężnymi komputerami i obliczeniami rozpro-szonymi nie umiemy spośród siedmiu liczb wybrać tej jednej właściwej? Czy nie można rozwiązaćtego problemu poprzez testowanie? No to policzmy. Liczba przypadków, które trzeba przetestować

85Przypomnijmy, że inne niestandardowe uniwersa otrzymamy zastępując zbiór R dowolnym zbiorem X.86Przypomnijmy: to twierdzenie interesuje nas dlatego, że jego nieco wzbogacona wersja - twierdzenie Parisa-

Harringtona - to przykład zdania niedowodliwego w PA a dowodliwego w ZFC.Zapisany tu „dowód” jest, jak zawsze, tylko szkicem, zarysem dowodu.

87„Każdy nieskończony, pełny dwukolorowy graf zawiera jednokolorowy nieskończony podgraf” - str. 97 .88Elementami ultraproduktu są klasy abstrakcji ciągów (an : an ∈ An) definiowane tak, jak w przypadku ultrapo-

tęgi. Działania są określone „po współrzędnych”. Podpowiem, że ultrapotęga modelu A to ultraprodukt rodziny Aitakiej, że An = A dla dowolnego n ∈ N .

89Spróbuj samodzielnie sformułować tę teorię.

Page 185: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 184

dla np. n = 45 to - szacunkowo - liczba podzbiorów zbioru par, jakie można utworzyć korzysta-jąc z 45 elementów. A to - „w przybliżeniu” - 2(452)...90 Można podejrzewać, że ten niesłychanieszybki wzrost „ciągu Ramsey’a” jest przyczyną niedowodliwości twierdzenia Ramsey’a (w wersjiParisa-Harringtona) w arytmetyce Peano...91.

10.3.3 Wilk w owczej skórze

Wyobraźmy sobie alternatywną historię matematyki. Przypuśćmy, że Cantor, lub ktoś równie ge-nialny, zamiast budować teorię mnogości wpada na pomysł, by stworzyć ur-teorię rozszerzającnieco język arytmetyki Peano. I w tym nowym języku formułuje teorię, którą - dla odróżnienia odpierwszorzędowej arytmetyki Peano - nazywa arytmetyką drugiego rzędu92 .

To rozszerzenie ogranicza się do wprowadzenia nowego rodzaju zmiennych reprezentującychpodzbiory N 93. Dla odróżnienia od zmiennych przedmiotowych - x, y, z, . . . - nowe zmienne ozna-czamy dużymi literami - X,Y, Z, . . .. W konsekwencji pojawiają się nowe formuły atomowe: dladowolnego termu arytmetycznego t i zmiennej drugiego rzędu X, napis t ∈ X jest taką formułą.Formuły złożone budujemy z atomowych tak samo, jak w języku pierwszego rzędu.

Nowa teoria - SOA - to rozszerzenie aksjomatyki Peano o trzy aksjomaty sformułowane w takrozszerzonym języku:- aksjomat indukcji:

∀X (0 ∈ X) ∧ (∀x (x ∈ X → succ(x) ∈ X)→ ∀x (x ∈ X)

- aksjomat wyróżniania: dla dowolnej „drugorzędowej” formuły φ(x, y1, . . . , yk, Y1, ...Ym) nie zawie-rającej wolnej zmiennej X94:

∃X∀x (x ∈ X)↔ φ(x, y1, . . . , yk, Y1, . . . , Ym))

- aksjomat ekstensjonalności:

∀X,Y X = Y ↔ ∀x (x ∈ X ↔ x ∈ Y )

Tak jak w przypadku ZFC, aksjomat wyróżniania pozwala na wprowadzenie do języka SOAformuł nazwowych. To napisy postaci

x : φ(x, y1, . . . , yk, Y1, . . . , Ym)

( gdzie y1, . . . , yk, Y1, . . . , Ym to zmienne wolne - parametry tej formuły nazwowej).

Co można w tej matematyce wyrazić? Co można badać? Popatrzmy na proste przykłady:

1. Formuła x = x wprowadza do języka SOA nazwę (= bezparametrową formułę nazwową) x :x = x. Zastąpimy ją symbolem N i będziemy nazywać „uniwersum” ponieważ

SOA ` ∀x x ∈ N oraz SOA ` ∀X X ⊆ N

A jak ktoś bardzo chce, to może nazwać N zbiorem liczb naturalnych...

2. Formuła nazwowa x : ¬(x ∈ Y ) (z parametrem Y ) sprawia, że w SOA dysponujemy pojęciemdopełnienia (definiowalnego) zbioru. Możemy do języka SOA wprowadzić skrót ¬Y dla tej formułynazwowej i np. próbować pokazać, że

SOA ` ∀Y ∀x (x ∈ Y ) ∨ (x ∈ ¬Y )

Nie jest też żadnym zaskoczeniem, że możemy mówić o nazwach (z parametrami X,Y ) X ∪ Y ,X ∩ Y . Możemy konstruować sumy i przekroje...

90Szacując nieco dokładniej: 2990. Ale to niewiele zmienia...91„Wyobraźmy sobie, że wroga cywilizacja napada na Ziemię i żąda od nas wyznaczenia dokładnej wartości liczby

R(5), gdyż w przeciwnym razie zniszczy planetę. Co powinniśmy zrobić, aby uniknąć zagłady? Powinniśmy zmobi-lizować wszystkich matematyków, informatyków i programistów, zaprogramować wszystkie komputery na świecie ispróbować znaleźć żądaną wartość. A co, jeśli kosmici zażądają wyznaczenia liczby R(6)? Wówczas powinniśmy raczejspróbować... zniszczyć najeźdźców.” (P.Erdos (1913-1996) - matematyk węgierski)

92Second Order Arithmetics - SOA. SOA jest obecna w matematyce niemalże tak długo jak teoria mnogości.93Inaczej: zmienne drugiego rzędu.94To zastrzeżenie jest istotne: w przeciwnym wypadku dla φ(x) ≡ ¬(x ∈ X) otrzymamy sprzeczność.

Page 186: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 185

3. Oznaczmy term arytmetyczny (n+m)2 + n sugestywnym skrótem (n,m). To oznacza wprowa-dzenie do języka SOA pojęcia pary uporządkowanej - formuły nazwowej x : x = (n,m) 95

W konsekwencji możemy konstruować w SOA iloczyny kartezjańskie:

Y × Z = x : ∃y,z (y ∈ Y ) ∧ (z ∈ Z) ∧ (x = (y, z))

a potem - korzystając z pojęcia podzbioru - wprowadzić do SOA pojęcia relacji i funkcji96.

4. Zbiory skończone można charakteryzować tak: zbiór jest skończony, gdy na trasie każdej nie-skończonej podróż po jego punktach musi znaleźć się punkt odwiedzony conajmniej dwa razy”. Tęcharakteryzację można zapisać w języku SOA w postaci niezbyt miłej formuły:

Finite(Y ) ≡ ∀X (Tr(X) ∧ Succ(X,Y )→ Fix(X,Y ) ∨ Y = ∅).gdzie Tr(X), Succ(X,Y ), F ix(X,Y ) to skróty:

Tr(X) ≡ ∀x,y,z (x, y) ∈ X ∧ (y, z) ∈ X → (x, z) ∈ X,Succ(X,Y ) ≡ ∀x∈Y ∃y∈Y (x, y) ∈ X,Fix(X,Y ) ≡ ∃x∈Y (x, x) ∈ XW SOA można mówić o zbiorach skończonych. Ale nie ma tu zbioru wszystkich podzbiorów N.

Pominiemy opowieść, jak w SOA definiować zbiory liczb całkowitych i wymiernych, jak zdefiniowaćliczby rzeczywiste97. Mając w głowie to, co dotąd powiedzieliśmy o funkcjach ciagłych, nie dziwimysię zbytnio, że w SOA można te funkcje definiować i badać 98 To wystarczy by uprawiać sensownąmatematykę w obszarze wyznaczonym przez arytmetykę drugiego rzędu.SOA to teoria pośrednia między arytmetyką a teorią mnogości: PA jest podteorią SOA a SOAumiemy interpretować w ZFC.99. Jaka jest matematyka SOA? Jaka jest „siła” tej teorii?

Pięknie napisał o tym S.G. Simpson we wstępie do książki „Podsystemy SOA” [105]: „Szcze-gólnie interesuje nas pytanie, które aksjomaty orzekające o istnieniu są niezbędne do udowodnieniaznanych twierdzeń matematycznych100. Zakres tego pytania (...) zawęzimy dzieląc matematykę nadwie części. Pierwsza część to matematyka teoriomnogościowa (set-theoretic mathematics) a drugąnazwiemy zwykłą (ordinary) matematyką. Przez matematykę teoriomnogościową rozumiemy te jejdziedziny, które zbudowano po teoriomnogościowej rewolucji (...) takie jak topologia ogólna, analizafunkcjonalna, algebra nieskończonych struktur, i oczywiście abstrakcyjna teoria zbiorów. Do zwykłejmatematyki zaliczamy dziedziny wcześniejsze od teorii mnogości - geometrię, teorię liczb, topologięzupełnych przestrzeni ośrodkowych, logikę matematyczną i teorię obliczalności. Rozróżnienie mię-dzy matematyką teoriomnogościową i zwykłą jest, z grubsza, rozróżnieniem między „matematykąnieprzeliczalną” i „matematyką przeliczalną”. Możemy też zażądać, żeby do „matematyki prze-

95SOA ` ∀m,n,k,l ((m + n)2 + n = (k + l)2 + l) → ((m = k) ∧ (n = l)). Para liczb naturalnych jest jednoznaczniereprezentowana przez pojedynczą liczbę - kod pary.

96fun(F,X, Y ) = F ⊆ X × Y ∧ ∀x∃!y (x, y) ∈ F .97Wykorzystując ciągi Cauchy’ego liczb wymiernych.98„(...) for the behaviour of a continuous function is dictated by its values at rational points, so we can implement

such functions as sets of pairs of rationals. But pairs of rationals can be implemented by natural number codes, socontinuous functions over the reals also again can be implemented at the level of sets of naturals. (...) In summary, theclassical analysis of ordinary functions can be reconstructed in SOA (...)which, of course, is why SOA is sometimes justcalled „analysis”- P.Smith, Induction and Predicativity (http://philpapers.org/rec/SMIIAP-2. Dodajmy, że „zbiórliczb rzeczywistych” to nie jest pojęcie matematyki budowanej na bazie SOA!

99O interpretacji jednej teorii w drugiej mówiliśmy w podrozdziale „Nominalizm Tarskiego”. Darujmy sobie szcze-gółowy opis interpretacji SOA w ZFC. Powiedzmy tylko, że tłumacząc formuły SOA na formuły teoriomnogościo-we wykorzystujemy definiowany w ZFC zbiór N (najmniejszy zbiór induktywny) a w trakcie tłumaczenia formułdodajemy informację o zakresie zmiennych występujących w tej formułe. Np. formułę x ∈ X tłumaczymy tak:(x ∈ N) ∧ (X ∈ 2N) ∧ (x ∈ X). Termin „interpretacja” oznacza, że wszystkie aksjomaty SOA są przy takimtłumaczeniu stwierdzeniami dowodliwymi w ZFC.

100To jest pytanie charakterystyczne dla tzw. matematyki odwrotnej - („matematyki na opak”): „reverse mathe-matics is a program in mathematical logic that seeks to determine which axioms are required to prove theorems ofmathematics. Its defining method can briefly be described as ”going backwards from the theorems to the axioms”,in contrast to the ordinary mathematical practice of deriving theorems from axioms.” (wikipedia)

Page 187: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 186

liczalnej” włączyć nieprzeliczalne zupełne przestrzenie ośrodkowe101 Stąd, na przykład, badanieciągłych funkcji rzeczywistych jest częścią zwykłej matematyki . (...)

SOA to ur-teoria tej zwykłej matematyki. Jak napisał L. Kołodziejczyk102: „W arytmetycedrugiego rzędu można nie tylko bardzo dużo wyrazić, ale i dużo udowodnić. Praktyka pokazuje,że niemal każde twierdzenie, z którym można się zetknąć w ciągu pierwszych kilku lat studiówmatematycznych, można udowodnić w SOA, jeśli tylko można je w ogóle wysłowić w jej języku. Oprzykłady twierdzeń wyrażalnych, lecz niedowodliwych w SOA (a dowodliwych w ZFC) wcale nietak łatwo”.

Jeśli tak, jeśli SOA jest wystarczająco bogata by opisywać zwykłą matematykę, to dlacze-go uznajemy za podstawę matematyki obszerniejszą teorię ZFC z jej wysoce abstrakcyjnymi (idyskusyjnymi) aksjomatami? Dlaczego nie jest nią SOA?

10.3.4 Dlaczego ZFC?

Nadmiarowość języka ZFC w stosunku do zadań „zwykłej matematyki” nie jest problemem pra-cujących matematyków. Kłopoty z tą teorią rozpatrywaną in extenso to zmartwienie stosunkowowąskiej grupy badaczy podstaw matematyki. A jeśli podstawowcy znajdą jakąś sprzeczność w ZFC?No cóż, przyjdzie czas, będzie rada.

Używanie argumentów dotyczących funkcjonalności języka i wygody użytkownika wydaje sięnie przystawać do poważnej nauki. Czyżby? Przypomnijmy jeszcze raz słowa L.Susanki: „Axiomsare supposed to be so pellucidly, limpidly clear („przejrzyste i klarownie czyste”) that any fool,after understanding our interpretation of their meaning in ordinary mathematical usage, wouldacclaim their necessity and validity”. A S.Hawkins i L. Mlodinow w książce „Grand Design” pisząco swej koncepcji „model-dependent realism” podali następujące kryteria „dobrego modelu” (cytujęza wikipedią): „A model is a good model if it:

Is elegant,Contains few arbitrary or adjustable elements,Agrees with and explains all existing observations,Makes detailed predictions about future observations that can disprove or falsify the model if

they are not borne out. If the modifications needed to accommodate new observations become toobaroque, it signals the need for a new model.”103

Dlatego ZFC od stu lat króluje w świecie matematyki. Pracujący matematycy są w ogromnejwiększości zadowoleni z takiego stanu rzeczy. Bardzo zadowoleni. J. Dieudonne, wybitny matema-tyk francuski, w 1982 roku pisał tak: „System, który przyjmowany jest obecnie przez co najmniej95% matematyków, to powszechnie znana teoria Zermelo–Fraenkla, (...) . System ten odpowiadadokładnie potrzebom wszystkich matematyków z wyjątkiem oczywiście logików oraz tych, którychpostawa filozoficzna uniemożliwia przyjęcie przesłanek wymaganego stylu, to znaczy tzw. mate-matyków intuicjonistów i konstruktywistów. (...) Filozofowie i logicy (...) wierzą, że matematycyinteresują się tym, co oni robią. Należałoby wyprowadzić ich z błędu, nie jest to bowiem prawdą i90% matematyków śmieje się z tego, co robią wszyscy logicy i filozofowie razem wzięci.” Nadziejaw tym, że jednak 5% matematyków dopuszcza myśl o istnieiu matematyki odmiennej od tej, którejpodstawą jest teorią mnogości... Gotów jestem się założyć, że w niedalekiej przyszłości ten procentbędzie raczej rósł niż malał...

101Taką przestrzenią jest prosta rzeczywista jeśli za odległość między liczbami-punktami x, y przyjmiemy wartośćbezwzględną ich różnicy - |x− y|. Wówczas liczb wymierne to gęsty przeliczalny podzbiór tej przestrzeni co oznacza,że dowolnie blisko dowolnej liczby rzeczywistej jest liczba wymierna.

102W artykule o przydługim tytule „Jak pokazać, że coś ma elementarny dowód nie pokazując tego dowodu” -artykuł dostępny w internecie.

103Nie dajmy się nabrać: słowo „model” odnosi się tu do teorii matematycznych (za pomoca których próbujemymodelować rzeczywistość). I nie ma nic wspólnego z teoriomnogościowym modelem teorii...

Page 188: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 10. PEWNA SZCZEGÓLNA TEORIA - ZFC 187

SOA jako teoria drugiego rzędu

Uznajmy prymat ZFC i popatrzmy z tej perspektywy na SOL.W języku pierwszego rzędu równość jest wyróżniona - ma ustaloną interpretację w każdym teo-riomnogościowym modelu104. W SOA mamy jeszcze drugą tak wyróżnioną relację - przynależność(elementu do zbioru). To cecha charakterystyczna nie tylko SOA ale wszelkich teorii odwołującychsię do języka i logiki drugiego rzędu105.Czy to znaczy, że - wbrew wcześniejszym twierdzeniom - ZFC to teoria drugiego rzędu? W żadnymrazie. W teorii mnogości operujemy zmiennymi, termami i relacjami „na jednym poziomie”. Zapisx ∈ y ∧ y ∈ z jest poprawny. W języku drugiego rzędu mamy dwa rodzaje zmiennych - zmiennymiprzedmiotowe i zbiorowe. Zapis x ∈ X jest poprawny tylko wtedy, gdy x to zmienna indywiduowaa X - zmienna drugiego rodzaju. Zapis x ∈ Y ∧ Y ∈ Z jest niepoprawny106 Można powiedzieć, żew SOA (i innych teoriach drugiego rzędu) relacja przynależności „∈” jest „spłaszczona” - możnamówić tylko o przynależność liczby naturalnej do podzbioru uniwersum - zbioru liczb naturalnych.W teorii mnogości nie ma tego ograniczenia - każdy zbiór może być elementem innego zbioru.

Język drugiego rzędu jest w oczywisty sposób interpretowalny w języku ZFC. Dlatego bezwiększego oporu przyjmujemy, że takie teorie „mają sens” w matematyce teoriomnogościowej. SOLjest „słabsza” od ZFC, ale dzięki wyróżnionej roli symbolu „∈” bardzo jej bliska. I pewnie dlategoW.V.Quine nazwał SOL „teorią zbiorów w owczej skórze”107.

Ale logika drugiego rzędu ma poważną wadę - nie jest zupełna. Czy jest więc logiką?Twierdzenie o zupełności to dla wielu niezbywalny atrybut logiki. „(...) The motivation behind thedemand for the completeness of a proper logic can be reconstructed as follows: Logical consequenceis intuitively taken to be a semantic notion. (...) It is therefore the formal semantics, i.e. the modeltheory, that captures logical consequence. The deductive system merely gives us a bunch of inferencerules. If completeness fails this shows that the deductive system does not properly capture logicalconsequence” [94].Odpowiedzią na postawione pytanie jest twierdzenie Lindstroma: „logika pierwszego rzędu jestnajsilniejszą logiką, która jest zupełna i dla której można udowodnić twierdzenie o zwartości”.

104W języku teorii mnogości (aksjomat ekstensjonalności).105SOL = Second Order Logic106Logikę drugiego rzędu można powiązać z (prostą) teorią typów Russella. Idea tej teorii to hierarchizacja wyrażeń i

wielkości matematycznych za pomocą pojęcia typu. Najprostszy typ „wielkości indywiduowych” ma rząd 1, rząd typuzbiorów tych indywiduów to 2, rząd typu zbiorów wielkości rzędu 2 to 3... itd. Język n-tego rzędu dopuszcza, mówiąc wdużym uproszczeniu, użycie i kwantyfikację zmiennych, których zakresem zmienności są wielkości co najwyżej n-tegorzędu. „Dowolne wyrażenie zawierające zmienną związaną jest wyższego typu niż ta zmienna” - B.Russell.

107„Second Order Logic is a set theory in sheep’s clothes” lub „SOL is Set Theory in disguise”.

Page 189: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 11

Logika intuicjonistyczna

11.1 Konsekwencja i implikacja

Teoria modeli v. teoria dowoduTeoria modeli, której podstawą jest korespondencyjna teoria prawdy Tarskiego to, zdaniem

wielu, dominująca część współczesnej logiki matematycznej. Niektórzy skłonni są nawet uznawaćrówność logika = teoria modeli1.Nie wszyscy. Y. Girard o „tradycji Tarskiego” pisał tak: „This tradition is distinguished by anextreme platitude2: the connector „∨” is translated by „or”, and so on. This interpretation tells usnothing particularly remarkable about the logical connectors: its apparent lack of ambition is theunderlying reason for its operationality. We are only interested in the denotation, true or false, of asentence (...). Once again, this definition is ludicrous3 from the point of view of logic, but entirelyadequate for its purpose. The development of Model Theory shows this” [41].

To samo nieco inaczej: „teoria modeli jest, być może, ciekawa, ale przechodzi obok tego, cojest istotą logiki”. Dla Girarda logika to: „(...) study of patterns found in reasoning. The task ofthe logician is to set down rules for distinguishing between valid and fallacious inference, betweenrational and flawed arguments”4.

Girard w centrum logiki stawia teorię dowodu a dla teorii modeli rezerwuje miejsce (co najwyżej)na jej peryferiach. Ale chodzi o coś więcej - o uznanie, że podstawowym zadaniem logiki jest refleksjanad zasadami uzasadniania sądów5.

O tej podstawowej różnicy w rozumieniu zadań logiki wspominaliśmy wcześniej wiążąc - symbo-licznie - te dwa różne stanowiska z nazwiskami Fregego i Russella6. Koncepcja Fregego traktującapriorytetowo „odkrywanie praw prawdziwości” to - w odniesieniu do logiki zdaniowej - badanie da-nego a priori modelu zamierzonego, który z kolei jest emanacją wiary, że w świecie platońskich ideifunkcjonuje „idealna” logika. Ten model - algebra wartości logicznych - to dwuelementowy zbiórtrue, false na którym zdefiniowano operacje logiczne - koniunkcję, alternatywę i negację. Opisytych operacji nie budzą kontrowersji, bo są zgodne z rolą spójników „i”, „lub”, „nieprawda, że...”w językach naturalnych. Platońska idealizacja wyraża się tu w założeniu, że zdaniom orzekającymjest zawsze przyporządkowana jedna z dwóch wartości logicznych - prawda lub fałsz7.

1Tak to przynajmniej wygląda w programach studiow matematycznych.2ang. banał3groteskowy, niedorzeczny4Niestety, nie potrafię wskazać źródła tego cytatu. Przepraszam. Proszę też nie przywiązywać wagi do sformułowań

„banał”, „niedorzeczność” , „widoczny brak ambicji” które znalazły się w cytowanym tekście, a które należą raczejdo języka polityki niż matematyki. Język Girarda różni się znacznie od beznamiętnego języka ogromniej większościprac matematycznych. Ten Pan tak ma.

5Termin „reasoning” ma wiele odpowiedników w języku polskim: rozumowanie, argumentacja, uzasadnienie, wy-wód i parę innych.

6W rozdziale „Język matematyki” str. ??7To jest tzw. zasada dwuwartowości.

188

Page 190: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 189

Język formuł zdaniowych to - u Fregego - język opisu tego szczególnego obiektu a formalne sys-tem dowodzenia to tylko narzędzie odnajdywania zdań prawdziwych. Do girardowskich „wzorcówargumentacji” - „patterns of reasoning” - sięgamy tu wtedy, gdy chcemy uzasadnić, że „prawdziwośćzdania A jest konsekwencją prawdziwości zdania B (zdań B1, . . . , Bk)”. W tej logice „wzorce argu-mentacji” można utożsamić z regułami dowodzenia. Jedna z nich zasługuje na szczególną uwagę.To reguła modus ponens8:

B,B → A

A

Mamy tu nowy konstruktor formuł zdaniowych - implikację. Napis B → A czytamy zazwyczajtak: „jeśli B (jest zdaniem prawdziwym) to A (jest zdaniem prawdziwym)” lub „A, o ile B” coutwierdza nas w przekonaniu, że implikacja jest opisem konsekwencji.

Implikacja jest swego rodzaju „uwewnętrznieniem” konsekwencji: „aby A było konsekwencją B, wystarczyby zdanie B było prawdziwe i - niezależnie od B - zdanie B → A” też było prawdziwe”. W ten sposóbkonsekwencja stała się wtórna w stosunku do prawdziwości a jej badanie częścią procesu „odkrywaniapraw prawdziwości”.

Zgodnie z zamysłem Fregego, ten nowy konstruktor zdań trzeba opisać jako kolejną operację wmodelu zamierzonym. Implikację zdefiniowano tak:

B A B → A

1 1 11 0 00 1 10 0 1

(0 to fałsz, 1 to prawda).

To uwewnętrznienie konsekwencji jest ... nadmiarowe: jedna z dwu implikacji - B → A i A → B- jest zawsze - dla dowolnych zdań A, B - prawdziwa9. Tym samym jedno ze zdań: „jeśli Kasiaprzypaliła zupę, to w Krakowie pada deszcz” i „jeśli w Krakowie pada deszcz to Kasia przypaliłazupę” jest - w myśl tej logiki! - prawdziwe. Gdyby upierać się, że prawdziwość implikacji odpowia-da istocie relacji konsekwencji, to musielibyśmy uznać istnienie przyczynowo-skutkowego związkumiędzy kulinarnymi umiejętnościami Kasi a średnią opadów w Krakowie (lub odwrotnie)10.Jednak to nie oznacza zanegowania reguły modus ponens jako (zewnętrznego) opisu konsekwencji.Ta reguła korzysta z implikacji tylko w „pozytywnym” przypadku, odpowiadającym powszechnieakceptowanemu rozumieniu konsekwencji11

Dodanie implikacji jako kolejnej operacji w algebrze Boole’a jest w istocie bezproduktywne:implikacja B → A w logice klasycznej to synonim alternatywy ¬B ∨A. Można bez niej żyć. Możnazapisać regułę odrywania w postaci B,¬B∨A

A i czytać tak :„aby stwierdzić, że A jest prawdziwewystarczy pokazać, że B jest prawdziwe i jedno z dwóch zdań - ¬B i A - jest prawdziwe”. A to niejest szczególnie wnikliwa obserwacja... .

8Reguła odrywania. O szczególnej roli tej reguły świadczy to, że można zbudować systemy dowodzenia dla kla-sycznej logiki zdaniowej, w której jest ona jedyną regułą dowodzenia.

9Formuła (A→ B) ∨ (B → A) jest prawem klasycznej logiki zdaniowej - „prawem prawdziwości”.10W internecie można znaleźć cyfrową kopię książki T. Kotarbińskiego „Elementy teorii poznania, logi-

ki formalnej i metodologii nauk” (Lwów 1929) (http://www.ifispan.waw.pl/bibfis/news/zbiory/gallery/ margina-lia/KotEl/index.html ). Ten egzemplarz, zgodnie z ówczesnymi zwyczajami, jest upstrzony na marginesach dopiska-mi czytelników dokumentującmi ich wątpliwości związane z definicją implikacji. Kotarbiński był świadom, że jest toodejście od intuicyjnego rozumienia frazy „jeżeli B, to A” jako orzeczenia o istnieniu pewnego związku przyczynowo-skutkowego, gdyż (pięknie) napisał: „W tym miejscu grożą bardzo poważne nieporozumienia między rachunkiem zdańa Czytelnikiem”.Na marginesie : pięknie by było, gdyby i dziś studenci ujawniali swoje wątpliwości, nawet zapisując je na marginesachstudiowanych (?) dzieł. Ale studenci nie mają na to czasu, bo się uczą (zaliczają). Jednak można ich usprawiedliwić:to postawa pragmatyczna, bo „uczenie się” to wszystko, czego od nich się wymaga.

11Tzn. aby skorzystać z tej reguły w dowodzie prawdziwości zdania A trzeba dowieść prawdziwości dwóch zdań:pewnego zdania B i implikacji B → A. Implikacja o fałszywym poprzedniku nas tu nie interesuje.

Page 191: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 190

Po co nam uwewnętrznienie konsekwencji? Bez niego konsekwencja jest pojęciem metajęzykowym a regułamodus ponens „prawem transcedentnym” nie podlegającym badaniu. Tak było na początku - w logiceArystotelesa (sylogistyce) nie ma zdań-implikacji (?)12.Te „kłopoty z implikacją” to skutek apriorycznego założenia istnienia dwuelementowej algebry wartościlogicznych i budowa logiki zdaniowej - języka, systemów dowodzenia - „wokół” tego obiektu.

Jeśli przyjmiemy koncepcję Russella (a właściwie Łukasiewicza, Jaśkowskiego, Gentzena i Gi-rarda) unikniemy tego zamieszania. W tej koncepcji przedmiotem badań jest proces dowodzenia(uzasadniania) więc nie musimy opisywać konsekwencji odwołując się do prawdziwości zdań.W systemie dedukcji naturalnej konsekwencja jest reprezentowana przez sekwenty B1, . . . , Bk ` Aa reguły dowodzenia związane z implikacją wyglądają naturalnie:

Γ ∧A ` BΓ ` (A→ B)

Γ ` (A→ B) Γ ` AΓ ` B

i „same z siebie” nie upoważniają do wniosków jakie przed chwilą wyprowadzaliśmy.

Coś tu nie gra - wszak w systemie dedukcji naturalnej dowodliwe są wszystkie prawa logiki zdaniowej awśród nich kontrowersyjna alternatywa (A→ B) ∨ (B → A) i równoważność (B → A)↔ (¬B ∨A).To prawda. Ale dowodliwość tych formuł to rezultat wykorzystania reguł tego systemu związanych zinnymi spójnikami logicznymi (a nie reguł bezpośrednio odnoszących się do implikacji). I to tam kryjesię założenie, że interesuje nas tylko jeden jedyny model zamierzony języka formuł zdaniowych.

11.2 Źródła logiki intuicjonistycznej

W matematyce Hilberta i Cantora continuum R to zbiór punktów-liczb rzeczywistych. Każdypodzbiór A ⊆ R ma swoje dopełnienie - zbiór ¬A = a ∈ R : ¬(a ∈ A) . To konsekwencjaaksjomatu wyróżniania. Ponieważ ZFC korzysta z klasycznej logiki w której obowiązuje prawowyłączonego środka, to zdanie postaci (a ∈ A) ∨ (a ∈ ¬A) jest zawsze prawdziwe. Tertium nondatur13.

Czy rzeczywiście? Przypomnijmy koncepcję kontinuum opisującą ten obiekt jako splątaną ro-dzinę par liczb wymiernych (d, e) takich, że d < e14. Konsekwentnie, przez podstrukturę tak definio-wanego continuum powinniśmy rozumieć dowolną rodzinę takich wymiernych par. A przynależnośćliczby rzeczywistej do takiej podstruktury winniśmy definiować tak:

- punkt a należy do podstruktury A = (dn, en) : n ∈ N gdy potrafimy wskazać parę liczbwymiernych (d, e) ∈ A taką, że d < a < e (czyli (d, e) aproksymuje a),

- a /∈ A gdy potrafimy wskazać parę (b, c) która aproksymuje a i jednocześnie jest „rozłączna”z każdą parą z A15.

Nietrudno spostrzec, że przy tych ustaleniach klasyczna dychotomia logiczna „A lub nieprawda,że A” - przestaje obowiązywać: nie można pokazać, że 0 ∈ (0, 1) ani że 0 /∈ (0, 1)...

To my stanowimy co jest uzasadnieniem prostych zdań 0 ∈ (0, 1), ¬(3 ∈ (1, 2)). Czy mamy do tego prawo?„Mathematics does not depend on logic; on the contrary, logic is part of mathematics” (Brouwer). To myskonstruowaliśmy ten szczególny obiekt matematyczny i tym samym mamy prawo określić logikę językajego opisu16.

12To trochę nieodpowiedzialne - nie znam historii logiki na tyle dogłębnie, bym był pewien tego, co tu napisałem.13Trzeciej możliwości nie ma: albo zdanie jest prawdziwe albo fałszywe (a wtedy jego zaprzeczenie jest prawdziwe).

Formalnie: formuła zdaniowa A∨¬A jest prawdziwa bez względu na wartość logiczną zdania A. To prawo to kolejnakonsekwencja założenia, że klasyczna logika jest dwuwartościowa. Autorstwo tego prawa przypisuje się Arystotelesowi.

14Liczbę rzeczywistą rozumiemy wtedy jako wielkość graniczną aproksymowaną przez zstępujący ciąg takich par -patrz rozdział „Przestrzeń - matematycznie”.

15Tzn. nie może się zdarzyć, że (b < dn < c < en) dla jakiejkolwiek pary (dn, en) ∈ A.

Page 192: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 191

Odrzucenie prawa wyłączonego środka jest trudne, bo jest ono wpisane w powszechnie akceptowanysposóboglądu świata. To uwarunkowanie kulturowe. Wprawdzie w naszym pięknym świecie ta zasada nie zawszesię sprawdza, ale tym chętniej wierzymy, że obowiązuje w platońskim świecie idealnych bytów.I nie dziwi,że to prawo jest obecne w matematyce Hilberta, która miała ten idealny świat opisywać.

Brouwer odżegnywał się od matematycznej transcedencji. W jego matematyce istnieje tylko to,co konstruowalne a prawdziwe to, co konstruktywnie uzasadni0ne. Prawdziwość zdania nie jest jegoatrybutem niezależnym od naszej aktywności - wymaga uzasadnienia. A przecież może się zdarzyć,że nie umiemy uzasadnić ani zdania A ani jego zaprzeczenia ¬A. Oto przykład: określmy ciąg liczbwymiernych (gn : n ∈ N) tak:

gn =

1 hipoteza Goldbacha jest prawdziwa,17

0 przeciwnym wypadku.

Ten ciąg Cauchy’ego wyznacza pewną liczbę rzeczywistą. Ta liczba „istnieje”. Posiłkując się kla-syczną logiką udowodnimy to istnienie tak: oznaczmy zdanie „hipoteza Goldbacha jest prawdziwa”skrótem HG. Wówczas:

HG→ (1 = lim gn)→ ∃x(x = lim gn),¬HG→ (0 = lim gn)→ ∃x(x = lim gn).

Zatem (HG ∨ ¬HG) → ∃x(x = lim gn). Ponieważ - na mocy prawa wyłączonego środka! - po-przednik tej implikacji jest prawdziwy, to i następnik jest prawdziwy: istnieje liczba rzeczywistawyznaczona przez ciąg (gn).

Ale ta liczba nie jest konstruktywną liczbą rzeczywistą. Wiemy o niej niewiele - czy potrafimynp. orzec, czy jest ona mniejsza od 1

2?

Można rozumieć nadzieje Hilberta że te dylematy znikną, gdy stworzymy matematyczny raj -zupełną teorię pozwalającą dowieść prawdziwości dowolnego zdania A lub jego zaprzeczenia. Teorię,w której dowodliwość będzie tożsama z transcedentną prawdziwością. Ale dziś, gdy znamy wynikiTuringa, Godla i Cohena wiemy, że to niemożliwe.

Dlatego, mówią konstruktywiści, powinniśmy odrzucić prawo wyłączonego środka. W ten sposóbzaistniała logika intuicjonistyczna, powszechnie kojarzona z brouwerowską wizją matematyki.

11.2.1 Formalizacja zdaniowej logiki intuicjonistycznej„Constructivism is the point of view that mathematical objectsexist only in so far they have been constructed and that proofsderive their validity from constructions” [12]

W matematyce Hilberta wszystkie teorie mają część wspólną - klasyczne aksjomaty logiczne.Logika poprzedza matematykę, jest od niej niezależna. Wierzymy, że ta logika jest trafnie wybraną pod-stawą opisu platońskiej rzeczywistości matematycznej. Ale właściwie dlaczego?

Brouwer nie utożsamiał konstruktywnego uzasadnienia z formalnym dowodzeniem. Konstruk-tywne uzasadnienie to, jak twierdzą niektórzy, pojęcie pierwotne jego matematyki [110]. Dlategonie dziwi, że wyodrębnienie z tej matematyki jej logicznego fragmentu i jego formalizacja na wzóri podobieństwo logiki klasycznej, nie jest jego dziełem. To dzieło jego ucznia, A. Heytinga - twórcylogiki intuicjonistycznej18.

16O przywiązaniu do prawa wyłączonego środka świadczy nasz język. Alternatywę (a = b) ∨ (a 6= b) (czyli(a = b) ∨ ¬(a = b)) zwykliśmy czytać: a i b są równe lub nierówne”. To oznacza prymat terminu „równe”, boprzedrostek „nie” traktowany jest dopełniająco. Aby przywrócić symetrię, przeczytajmy tę formułę tak: „a i b sąrówne lub są rozróżnialne”. Teraz oba człony alternatywy jednakowo domagają się uzasadnienia. I trochę mniej pew-ne, że te stwierdzenia wzajemnie się dopełniają. Pojęcie „rozróżnialności” - apartness - jest badane w ramach logikiintuicjonistycznej [37].

17„Każda liczba naturalna parzysta większa od 2 jest sumą dwóch liczb pierwszych”. Ta hipoteza, jak dotąd, niedoczekała się dowodu.

18Arend Heyting (1898-1980) holenderski matematyk i logik. Brouwer nie cenił zbytnio pomysłu Heytinga nazy-wając (podobno) jego prace „bezpłodnymi ćwiczeniami”. Ale stało się... .

Page 193: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 192

Obie logiki - klasyczna i intuicjonistyczna - to logiki tego samego języka. Pierwsza opisuje jakwartość logiczna zdania zależy od jego struktury i wartości logicznych jego składowych. Druga mainny cel: mówi jak - w zależności od struktury zdania - winno wyglądać jego uzasadnienie.

Te oczekiwania wobec kształtu konstruktywnych uzasadnień funkcjonują w literaturze pod na-zwą BHK - postulatów19. W odniesieniu do logiki zdaniowej sformułowane są tak:

implikacja. „uzasadnienie formuły B → A to procedura, która zastosowana do jakiegokolwiekuzasadnienia B buduje uzasadnienie zdania A”koniunkcja. „uzasadnienie formuły A∧B to para uzasadnienień (dA, dB) - odpowiednio dla formułA i B”,alternatywa. „uzasadnienie alternatywy A∨B to albo uzasadnienie zdania A albo uzasadnieniezdania B”

Negacji brak, bo została zdegradowana - to tylko implikacja A → ⊥ , gdzie ⊥ symbolizuje zdaniebez uzasadnienia:

¬A ≡ A→ ⊥Dlatego uzasadnieniem negacji ¬A jest procedura, która falsyfikuje każdą próbę (konstruktywnego)uzasadnienia A.

Postulat dotyczący alternatywy nie dopuszcza wyjątków: uzasadnienie formuły A∨¬A wymagaalbo uzasadnienia A, albo wskazania procedury falsyfikującej każdą próbę takiego uzasadnienia... .Prawo wyłączonego środka nie obowiązuje.

BHK-postulaty przywracają impikacji podmiotowość: B → A nie jest już synonimem alternatywy ¬B∨A.

Niech B = „w rozwinięciu dziesiętnym liczby π jest 20 kolejnych siódemek” a A = „w rozwinięciu dziesięt-nym π jest 19 kolejnych siódemek”. Implikacja B → A jest w sposób oczywisty konstruktywnie zasadna.A co z uzasadnienem alternatywy ¬B ∨A zgodnym z BHK-postulatami?20

Te postulaty są sformułowane w duchu logiki założeniowej - nie mówią, czym jest uzasadnienie zdańprostych. Mówią tylko, jak konstruować uzasadnienie zdania złożonego odwołując się do uzasadnień zdańprostych, z których jest ono zbudowane21..

Uzupełnijmy tę prezentację BHK-postulatów ważnym zdaniem: „A proof of an atomic propositionA is given by presenting a mathematical construction in Brouwer’s sense that makes A true”.

Formalizacja logiki to związanie z nią systemu dowodzenia. Potrzeba tylko skromnej modyfikacjiklasycznego systemu dedukcji naturalnej, by otrzymać taki system dla zdaniowej logiki intuicjoni-stycznej - wystarczy odrzucić jedną jedyną regułę odpowiedzialną za budowanie dowodów poprzez„doprowadzanie do sprzeczności”:

Γ,¬A ` ⊥Γ ` A

Formuła A jest prawem zdaniowej logiki intuicjonistycznej o ile sekwent (o pustym poprzedniku)` A posiada dowód w tak zmodyfikowanym systemie dedukcji naturalnej.

19Lub BHK - interpretacji. B- Brouwer, H- Heyting, K- Kołmogorow.21Ten przykład podał A. Heyting [37].21Dla dopełnienia obrazu dodajmy ładne porównanie obu logik, przedstawione przez P. Urzyczyna w wykładzie

„From Tarski to Girard” (dostępnym w internecie):Tarski: The logical value paradigm.

Formula = a declarative assertion about some „reality”.Correctness criterion = truth (logical value).Semantics has priority over proof. Proof = just a tool; its shape is not essential, we only ask if one exists.Logic = determining if a sentence is true.The role of a logical connective = define the truth of a compound sentence in terms of the values of its components.

Brouwer: The construction paradigmReasoning is primary, semantics is just a tool.Correctness criterion = construction.The role of a logical connective = express a construction of a compound sentence in terms of constructions of itscomponents..

Page 194: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 193

Pięknie ... . Długą opowieść o nowej logice sprowadziliśmy do odrzucenia jednej jedynej reguły dowodzeniai arbitralnego stwierdzenia, że po tym zabiegu zamiast o dowodzeniu można mówić o „konstruktywnychuzasadnieniach”. Ale właściwie dlaczego?22

Różnica jest głębsza: w logice klasycznej sekwent B1, . . . , Bk ` A interpretujemy tak: zdanie A jestprawdziwe jeśli tylko zdania B1, . . . , Bk są prawdziwe” a w logice intuicjonistycznej tak: - „potrafimyzbudować hipotetyczny dowód A w oparciu o hipotetyczne dowody B1, . . . , Bk”. To, że w obu sytuacjachkorzystamy z tego samego formalnego zapisu to tylko „przypadek”.Jeśli szukasz argumentu, że matematyka to coś więcej niż manipulacja napisami, to właśnie go znalazłeś...

Ważkim argumentem na rzecz pomysłu Heytinga jest to, że rozbudowując nieco składnię (me-ta)języka sekwentów stworzymy system, w którym równolegle do budowy dowodu formuły genero-wany jest opis jego uzasadnienia. Te opisy to - poznane przy okazji omawiania teorii obliczalności- λ-termy(!). Wystarczy sekwenty zastąpić napisami postaci k1 : B1, . . . , kn : Bn ` a : A , któreczytamy tak: „a jest uzasadnieniem formuły A zbudowanym w oparciu o uzasadnienia k1, . . . , knformuł B1, . . . , Bn”23. Trzeba też trochę zmodyfikować aksjomaty i reguły takiego systemu: jedynyschemat aksjomatu wygląda teraz tak:

Γ ` x : A(x : A) ∈ Γ

i stwierdza oczywistość: „jeśli zakładamy, że formuła A ma uzasadnienie x , to możemy uznać, żex jest uzasadnieniem formuły A” 24

Reguły związane z implikacją mają teraz taką postać:

Γ ` m : B → A, Γ ` b : B

Γ ` mb : A(app)

Γ ∪ x : B ` t : A

Γ ` λx:B t : B → A(abs)

Reguła (app) mówi: „jeśli m jest uzsadnieniem implikacji B → A a b - uzasadnieniem B, to napis mbuznajemy za opis uzasadnienia formuły A”Reguła (abs) : „jeśli potrafimy - korzystając z hipotetycznego uzasadnienia x : B - skonstruować uza-sadnienie t formuły A, to takie postępowanie uznajemy za uzasadnienie implikacji B → A i oznaczamysymbolem λx:B t”„Operator λ wiąże zmienne” - w wyrażeniu λx:B t zmienna x jest związana co oznacza, że uzasadnienieopisane przez to wyrażenie nie jest już hipotetyczne (o ile w t nie ma innych niezwiązanych zmiennych).

Wykorzystanie aplikacji i abstrakcji do budowy wyrażeń opisujących uzasadnienia implikatyw-nego fragmentu zdaniowej logiki intuicjoninstycznej to sens tzw. izomorfizmu Curry’ego-Howarda25.

I tak np. korzystając z aksjomatu x : A ` x : A i reguły (abs) wyprowadzimy sekwent ` λx:Bx :A → A . λ-term λx:A x to opis najprostszego uzasadnienia implikacji A → A - procedury „nie róbnic” (z uzasadnieniem A by otrzymać uzasadnienie A)26.A biorąc za punkt wyjścia aksjomat x : A, y : B ` x : A zbudujemy λ-term λx:A(λy:Bx) opisującyuzasadnienie formuły A→ (B → A). I tak dalej...

22Być może to właśnie było powodem rezerwy Brouwera wobec poczynań Heytinga... . Przypomnijmy, że dlaBrouwera „konstruktywne uzasadnienie” było pojęciem pierwotnym, czyli w pewnym sensie nieopisywalnym. To nieułatwia dyskusji... .

23„Let us write “a : A” for „a is a construction that establishes A” [108]. Jedno z możliwych znaczeń słowa„establish” to „ustanawiać”. My używamy terminu „uzasadnienie” czy też „konstruktywne uzasadnienie” traktującje jako odpowiednik „ustanowienia”.

24Symbol x jest tu zmienną języka opisu uzasadnień. Zapis „x : A” reprezentuje hipotetyczne uzasadnienie A.25Implikatywny fragment intuicjonistycznej logiki zdaniowej obejmuje formuły budowane ze zmiennych zdaniowych

tylko za pomocą spójnika implikacji (a nie koniunkcji, alternatywy czy negacji).Uwaga: λ-termy tu użyte różnią się nieco od wcześniej poznanych. Ale to nie jest teraz istotne (korzystamy tu zpewnej odmiany λ-rachunku - tzw. λ-rachunku z typami a la Church).

26„β-redukcja’ λ-termów może być w tej nowej sytuacji interpretowana jako upraszczanie („normalizacja”) opisówuzasadnień. Nasze stwierdzenie „nie rób nic” usprawiedliwione jest przez β-redukcję (λx:A x)a→β a .

Page 195: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 194

Rozbudowując język λ-rachunku można rozszerzyć izomorfizm Curry-Howarda i budować opisyuzasadnień wszelkich formuł zdaniowych. Np. reguły dotyczące koniunkcji wyglądają wówczas tak:

Γ ` a : A Γ ` b : BΓ `< a, b >: A ∧B

Γ ` t : A ∧BΓ ` Π1t : A

Γ ` t : A ∧BΓ ` Π2t : B

co - jak widać - wymaga rozszerzenia składni λ-rachunku o konstruktor pary i dwa „rzutowania”.Nie opiszemy tu kolejnych wersji-rozszerzeń izomorfizmu Curry-Howarda27. A to dlatego, że

wcale nie jest pewne, czy w trakcie kolejnych rozszerzeń nie gubimy tego, co chcemy rozumiećprzez konstruktywne uzasadnienie: „Until around 1990 there was a widespread consensus to theeffect that „there is no Curry-Howard isomorphism for classical logic.” However, at that time T.Griffin made a pathbreaking discovery which have convinced most critics that classical logics havesomething to offer the Curry-Howard isomorphism” [108]...

Nowa rola negacji

W klasycznej logice implikacja to synonim formuły wykorzystującej negację. Tu jest odwrotnie:negacja ¬A to skrót implikacji A → ⊥. Ale warto się jej przyjrzeć, bo to ujawni nie tylko różniceale i subtelne związki między logiką klasyczną i intuicjonistyczną.

Klasyczne prawo podwójnej negacji - równoważność A ↔ ¬¬A - nie obowiązuje w logice in-tuicjonistycznej - to wiemy28. Ale jest nim implikacja A → ¬¬A. Uzasadnimy to nieformalnie,odwołując się do BHK-interpretacji.

Uzasadnienie formuły ¬¬A - to procedura, umożliwiająca falsyfikację wszelkich procedury spro-wadzających do absurdu uzasadnienia A (uff...). Dlatego każde uzasadnienie A wyznacza taką otoprocedurę uzasadnienia ¬¬A: „każdemu kto twierdzi, że ma procedurę sprowadzania dowolnegouzasadnienia A do absurdu, pokaż to uzasadnienie A”. To, bezdyskusyjnie, jest uzasadnieniemimplikacji A→ ¬¬A .

Jeszcze ciekawsza jest implikacja ¬¬¬A→ ¬A. Uzasadnieniem ¬¬¬A jest procedura - nazwijmyją Pr - pozwalająca zanegować każde uzasadnienie ¬¬A. Ale, jak pokazaliśmy, każde uzasadnienieA daje się łatwo przekształcić w uzasadnienie ¬¬A. Zatem procedura Pr musi falsyfikować dowolneuzasadnienie formuły A czyli jest uzasadnieniem formuły ¬A ... . W konsekwencji równoważność¬¬¬A↔ ¬A jest prawem logiki intuicjonistycznej29 .

Ale najciekawsze jest to, co o negacji w logice intuicjonistycznej mówi twierdzenie Glivenki:30

„formuła A jest prawem klasycznej logiki zdaniowej dokładnie wtedy, gdy jej podwójna negacja- ¬¬A - jest prawem logiki intuicjonistycznej.”

Klasyczna równoważność A↔ ¬¬A zostaje zastąpiona przez „równoważność dowodliwości” tych formułw obu rozważanych logikach.

Stąd jeśli tylko formuła zdaniowa A jest stabilna (czyli - w logice intuicjonistycznej - A↔ ¬Bdla pewnej formuły B) to jest ono prawem intuicjonistycznej logiki zdaniowej dokładnie wtedy, gdyjest prawem klasycznej logiki zdaniowej31.

Logikę klasyczną od intuicjonistycznej różni arbitralne założenie, że każda formuła zdaniowa jest stabilna(bo zawsze B ↔ ¬¬B). Wyłącznie.Wychowani w tradycji klasycznej skłonni jesteśmy traktować logikę intuicjonistyczną jako ciekawostkę,niegroźną dewiację pozbawioną większego (matematycznego) znaczenia. Wynik Glivenki pozwala mówić,że jest odwrotnie: logika klasyczna jest tylko „wersją” logiki intuicjonistycznej, znajdująca zastosowaniewtedy, gdy ograniczamy się do zdań stabilnych32.

27Zainteresowanych odsyłam do [108] (Rozdział IV).28To takie małe kłamstwo - udowodnimy to dopiero za chwilę, gdy będziemy mówić o modelach Kripkego.29Można rzec, że w logice intuicjonistycznej „przez sprzeczność” dowodzimy tylko stwierdzeń negatywnych...30Valery Glivenko (1896-1940), matematyk ukraiński31Jeśli ¬B ma intuicjonistyczny dowód, to ma go też równoważna formuła ¬¬¬B . A to - na mocy twierdzenia

Glivenki - oznacza, że ¬B ma klasyczny dowód.

Page 196: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 195

11.3 Semantyka Kripkego

„Kripke theory is a theory of „possible worlds”(internet)

Przeciwstawiając logikę klasyczną logice intuicjonistycznej sugerowałem, że w tej drugiej niema czegoś takiego jak model zamierzony. To prawda. Ale to nie wykłucza istnienia modeli.

Model Kripkego33 intuicjonistycznej logiki zdaniowej to dowolny zbiór częściowo uporządkowany(poset) (V,¬). Wartościowanie zmiennych w modelu (V,¬) to przyporządkowanie każdej zmiennejzdaniowej p (należącej do ustalonego a priori zbioru zmiennych zdaniowych Zm) domkniętego wgórę podzbioru Vp ⊆ V 34.

Model Kripkego wraz z wartościowaniem p Vp to jeden możliwych scenariuszy rozwoju „świata wie-dzy”. Stany wiedzy są reprezentowane przez elementy V a zapis v ¬ w oznacza, że wiedza w stanie vjest mniejsza niż w stanie w.Domknięty w górę podzbiór V1 ⊂ V reprezentuje zasób wiedzy dostępnej we wszystkich stanach tegopodzbioru. Zbiór V reprezentuje „wiedzę powszechną” - poziom wiedzy dostępny we wszystkich stanach.Zbiór pusty to poziom wiedzy nieosiągalny w żadnym stanie.Zbiór Vp związany ze zmienną zdaniową p w rozpatrywanym scenariuszu to zasób wiedzy wystarczający(niezbędny) do uzasadnienia zdania reprezentowanego przez tę zmienną (w tym scenariuszu).Teoriomnogościowy zapis „v ∈ Vp” należy czytać tak: „stan wiedzy v pozwala na uzasadnienie p” lubkrótko: „ v uzasadnia p”35.

Wartościowanie p Vp można rozszerzyć, wiążąc z dowolną formułą zdaniową A domknięty wgórę zbiór VA ⊆ V , zgodnie z taką rekurencyjną definicją:

V⊥ = ∅,v ∈ VA∧B ↔ v ∈ VA oraz v ∈ VB,v ∈ VA∨B ↔ v ∈ VA lub v ∈ VB,v ∈ VA→B ↔ dla dowolnego w ­ v , jeżeli w ∈ VA, to również w ∈ VB .W szczególności V¬A to największy podzbiór domknięty w górę rozłączny z VA.

Zbiór VA reprezentuje minimalny zasób wiedzy wystarczający do uzasadnienia zdania reprezen-towanego przez formułę A przy wartościowaniu p Vp .

Na szczególną uwagę zasługuje interpretacja zbioru VA→B:

v ∈ VA→B jeżeli w tym stanie wiemy dość, by każde hipotetyczne uzasadnienie A przekształcić w hi-poteteczne uzasadnienie B co rozumiemy tak: jeśli tylko w przyszłym stanie w ­ v uzasadnimy A, tobędziemy zdolni przekształcić to uzasadnienie A w uzasadnienie B .Stąd VA ⊆ VB dokładnie wtedy, gdy VA→B = V .Zbiór VA↔B = VA→B ∧ VB→A reprezentuje najmniejszy zasób wiedzy pozwalający hipotetyczne uzasad-nienia A przekształcać w hipotetyczne uzasadnienia B i vice versa.V⊥ = ∅ - w każdym modelu36..

Formuła A jest uzasadniona w stanie v przy wartościowaniu p Vp gdy v ∈ VA . Jest uzasad-niona w modelu (V,¬) gdy jest uzasadniona w każdym jego stanie przy każdym wartościowaniu.

32Warta uwagi ciekawostka: formuła zdaniowa A jest rozstrzygalna gdy (A ∨ ¬A) jest prawem logiki intuicjoni-stycznej a stabilna gdy ¬¬A→ A jest takim prawem. „Rozstrzygalność” i „stabilność” to nie są - wbraw pozorom -pojęcia równoważne, bo implikacja (¬¬A→ A)→ (A ∨ ¬A) nie jest prawem logiki intuicjonistycznej!

33Saul Aaron Kripke (1940- ) - amerykański logik i filozof.34Vp jest domknięty w górę, gdy (v ∈ Vp) ∧ (v ¬ w)⇒ (w ∈ Vp). Dla ścisłości: czasem modelem nazywa się parę -

poset + wartościowanie zmiennych.35Logicy piszą v p zamiast v ∈ Vp i nazywaja tę relację forsingiem co odpowiada angielskiemu terminowi

„forcing”. Forsing to „wymuszanie”. Wolę mówić o „umożliwianiu”.36Nigdy nie osiągniemy stanu wiedzy, pozwalającego uzasadnić fałsz. Chyba, że jesteśmy szaleńcami (politykami)...

Page 197: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 196

Fundamentalne twierdzenie o zupełności mówi, że:„formuła zdaniowa A jest prawem logiki intuicjonistycznej dokładnie wtedy, gdy jest uzasad-

niona w każdym modelu Kripkego.”

„Zdanie Z jest prawem logiki intuicjonistycznej gdy jego uzasadnienie w dowolnym modelu nie wymagażadnej wiedzy - bez względu na to, jak określimy minimum wiedzy niezbędne do uzasadnienia zdańprostych występujących w Z zdanie to ma uzasadnienie”.

Spójrzmy na prosty model Kripkego:

2 p, q 3 r

1 p

OO

0

cc

FF

i wartościowanie zmiennych p, q, r takie, że Vp = 1, 2, Vq = 2, Vr = 3. To oznacza np. że wstanie 2 „wiemy” (potrafimy uzasadnić) p i „wiemy” q , a w stanie 0 „nie wiemy nic”.W tym modelu:

1. V¬¬q = 1, 2 czyli V¬¬q 6= Vq. To potwierdza, że „prawo podwójnej negacji” - formuła¬¬p↔ p - nie jest prawem logiki intuicjonistycznej.

2. Nierówność Vp∨V¬p 6= V pokazuje, że prawo wyłączonego środka nie obowiązuje w tej logice.3. Vq→p = V natomiast V¬q∨p = 2, 3 - równoważność (A→ B)↔ (¬A∨B) nie jest prawem

logiki intuicjonistycznej37 .4. 0 /∈ V(p→r)∨(r→p) - formuła (p→ r) ∨ (r → p) nie jest prawem logiki intuicjonistycznej 38.

Każdy model Kripkego (V,¬) wyznacza lokalną logikę L(V,¬). Jej prawami są formuły uzasad-nione w tym modelu. Ta logika ma miłą sercu mainstreamowców cechę - posiada własną matrycęwartości logicznych którą jest zbiór wszystkich domkniętych w górę podzbiorów V .

Przykład. Dwuelementowy poset (0, 1, 0 ¬ 1) ma trzy domknięte w górę podzbiory -∅ ⊂ 1 ⊂ 0, 1 czyli wyznacza logikę z trójelementową matrycę wartości logicznych39. Oznaczającte wartości odpowiednio przez 0 ¬ 1

2 ¬ 1, „rachunek wartości” tej logiki można opisać tak:v ∧ w = min(v, w), v ∨ w = max(v, w) , a implikację B → A tak:

B \A 0 12 1

0 1 1 112 0 1 11 0 1

2 1

Nietrudno teraz wyobrazić sobie logikę, którą otrzymamy zastępując dwuelementowy łańcuch 0 ¬ 1łańcuchem n-elementowym... .

Jednoelementowy model Kripkego wyznacza klasyczną logikę zdaniową40.

37To zwalnia nas z konieczności ekwilibrystycznego tłumaczenia, że jedno ze zdań „Jeśli Kasia przypaliła zupę tow Krakowie pada deszcz” i jeśli w Kakowie pada deszcz, to Kasia...” jest prawdziwe.

38Korzystając z modeli Kripkego można np. pokazać, że: „jeśli alternatywa A ∨ B jest prawem logiki intuicjoni-stycznej, to jest nim również formuła A lub formuła B”.Szkic dowodu: gdy żadna z formuł A, B nie jest takim, to -na mocy twierdzenia o zupełności - istnieją modele Kripkego (V A,¬A) i (V B ,¬B) falsyfikujące te formuły. ModelKripkego falsyfikujący alternatywę A ∨ B zbudujemy dodając do rozłącznej sumy V A ∪ V B nowy, „najmniejszy”element „0” (zachowujemy porządki w zbiorach V A i V B . Przyjmujemy, że elementy z V A nie są porównywalne zelementami z V B i vice versa. 0 jest mniejsze od każdego elementu z V A ∪ V B .)

39Jest to jedna z wielu logik trójwartościowych. Inne to np. logiki Kleene’ego, Łukasiewicza, Bochwara i Posta.40Jednoelementowy poset ma dwa podzbiory domknięte w górę. Jedną z tych wartości nazywamy „prawdą” a drugą

- „fałszem”. Zero metafizyki. Jednoelementowy model Kripkego to - nieco inaczej opisany - omawiany wcześniej modelzamierzony logiki klasycznej - dwuelementowa algebra wartości logicznych.

Page 198: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 197

W jednoelementowym modelu Kripkego wiedza jest niezmienna (transcedentna?). To świat platoński. Tukażde zdanie, któremu można przypisać wartość logiczną, jest prawdziwe lub fałszywe bez względu nato, czy umiemy to uzasadnić.

W odróżnieniu od logiki klasycznej, zdaniowa logika intuicjonistyczna nie ma uniwersalnego,skończonego modelu Kripkego (V,¬) - takiego, że prawa logiki L(V,¬) są dokładnie takie same,jak prawa logiki intuicjonistycznej41.Mamy tu tylko nieco słabsze twierdzenie:

„formuła zdaniowa A jest prawem logiki intuicjonistycznej dokładnie wtedy, gdy jest uzasad-niona w każdym skończonym modelu Kripkego”.

To wystarczy by pokazać, że intuicjonistyczna logika zdaniowa jest rozstrzygalna42.

Logika klasyczna szuka uniwersalnych praw prawdziwości: schematów zdań (formuł zdaniowych) praw-dziwych bez względu na wartość logiczną zdań prostych w nich występujących.Logika intuicjonistyczna koncentruje uwagę na relacji konsekwencji - szuka odpowiedzi na pytanie, jakuzasadnienie zdania złożonego zależy od uzasadnień zdań prostych i nie stroni przy tym od rozważania„hipotetycznych uzasadnień”. Pytanie o wartość logiczną zdania jest tu na drugim planie.

Heytingowska logika intuicjonistyczna to wspólny rdzeń logik wyznaczonych przez modele Kripkego. Alogika klasyczna jest tylko jedną z nich.„Logika mówi o każdej możliwości i wszystkie możliwości są jej faktami (...). Jeżeli mogę pomyśleć przed-miot w kontekście stanu rzeczy, to nie mogę go pomyśleć poza możliwością tego kontekstu.” - L. Witt-genstein.

11.3.1 Semantyka algebraiczna i topologiczna

Dzięki opowieści o „stanach wiedzy”, modele Kripkego trafiają do naszej wyobraźni. To ważne- z psychologicznego punktu widzenia („trzeci wymiar języka”...). Ale do formalnego określeniasemantyki formuł w modelu (V,¬), wystarczy znajomość struktury jego „zasobów wiedzy” repre-zentowanych przez domknięte w górę podzbiory modelu .Tę strukturę rozpoznano i nazwano: domknięte w górę podzbiory dowolnego modelu Kripkego toalgebra Heytinga (zwana też „kratą brouwerowską”):

Algebra Heytinga to poset (H,¬) z elementem największym - > - i najmniejszym - ⊥ - w którymkażda para elementów (a, b) ma kres górny - a ∨ b - dolny - a ∧ b oraz tzw. pseudodopełnienie -a→ b definiowane jako największy element taki, że a ∧ (a→ b) ¬ b43

To prowokuje do niezależnego zdefiniowania semantyki intuicjonistycznej logiki zdaniowej wdowolnej algebrze Heytinga - bez odwołań do „posetu stanów wiedzy”. I tak zrobiono: jest to tzw.semantyka algebraiczna logiki intuicjonistycznej. A to, co najważniejsze pozostało niezmienione:

„formuła A jest prawem logiki intuicjonistycznej dokładnie wtedy, gdy jest prawdziwa w dowol-nej algebrze Heytinga - przy każdym wartościowaniu przyporządkowana jej jest wartość >)”44

Algebra Heytinga to nie sztuczny twór stworzony tylko na użytek badań nieklasycznych logik.Te algebry są ściśle związane z przestrzeniami topologicznymi poprzez takie oto twierdzenie:„rodzina zbiorów otwartych T dowolnej przestrzeni topologicznej (X, T ) jest algebrą Heytinga”45.

41Można wskazać pojedynczy nieskończony „niwersalny” model Kripkego (V,¬). Ale ten model nie jest aniprzydatny ani specjalnie interesujący.

42Wystarczy równolegle realizować dwie procedury sprawdzające: pierwszą, polegajacą na poszukiwaniu skończo-nego modelu Kripkego falsyfikującego badaną formułę A. Drugą próbującą skonstruować jej dowód. Jedno (dokładniejedno) z tych postępowań musi zakończyć się sukcesem... .

43Równoważnie: dla dowolnych elementów a, b, c ∈ H: c ∧ a ¬ b wtw c ¬ a→ b.44Wyjaśnienie, dlaczego definiowanie semantyki bezpośrednio w algebrach Heytinga jest warte uwagi poznamy

wtedy, gdy w kolejnym rozdziale będziemy zajmowali się toposami.45> = X, ⊥ = ∅ . „∧” to przekrój, „∨” to suma. U → V to suma zbioru U i wnętrza zbioru X \V . W szczególności¬U to wnętrze zbioru X \ U .

Page 199: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 198

Nasze najważniejsze twierdzenie może przyjąć teraz taką postać:

formuła A jest prawem intuicjonistycznej logiki zdaniowej jeżeli jest prawdziwa w algebrzeHeytinga zbiorów otwartych dowolnej przestrzeni topologicznej.a nawet taką skrajną postać:

„formuła A jest prawem intuicjonistycznej logiki zdaniowej dokładnie wtedy, gdy jest prawdziwaw pojedynczym modelu - algebrze Heytinga otwartych podzbiorów prostej rzeczywistej” [108].

Początkujący studenci poznają prawa klasycznej logiki zdaniowej i uczą się jak je interpretować w algebrzeBoole’a podzbiorów dowolnego zbioru. Gdyby edukację matematyczną rozpoczynać od intuicjonistycznejlogiki zdaniowej należało by tę algebrę Boole’a zastąpić „algebrą Heytinga otwartych podzbiorów dowolnejprzestrzeni topologicznej”46.

11.4 Logika intuicjonistyczna pierwszego rzędu

H: I have just proved ∃xA(x),B: Congratulations! What is it?H: I don’t know. I assumed ∀x ¬A(x) and derived a contradiction.B: Oh. You proved ¬∀x ¬A(x) . That’s what I said.”

„H” chwali się dowodem istnienia obiektu o własności opisanej formułą A(x) - pokazał, że braktakiego obiektu prowadzi do sprzeczności. Jego oponent - „B” - twierdzi, że w ten sposób wykazałon jedynie, że nie jest możliwe, by żaden obiekt nie miał tej własności... . Skąd ten spór47?

W obu logikach - klasycznej i intuicjonistycznej - uznajemy równoważność ∀x¬A(x)↔ ¬∃xA(x).- „to, że żaden element nie ma własności A(x) jest równoważne stwierdzeniu, że nie istnieje element,który ma tę własność”. Negując obie strony tej równoważności otrzymamy nową równoważność -¬∀x ¬A(x)↔ ¬¬∃xA(x). Do tego momentu panowie się zgadzają.Wierny klasycznej logice matematyk hilbertowski - „H” - wykorzysta teraz prawo podwójnej negacji- ¬¬A→ A - i uzna kolejną równoważność: ∃xA(x)↔ ¬∀x ¬A(x) - „obiekt o własności A(x) wtedy,gdy nie jest prawdą, że żaden obiekt nie ma własności A(x)”.A pan „B” - matematyk brouwerowski - nie uznaje tego prawa. Stąd ten spór48.

W klasycznej logice sąd pozytywny, przesądzający o istnieniu, jest równoważny sądowi negatywnemu.Zważywaszy rolę, jaką w matematyce Hilberta przypisano formalnym dowodom istnienia, to dość ryzy-kowne... .A wszystko to za sprawą „tertium non datur”.Czy mamy obowiązek akceptować bezkrytycznie takie prawa? Hilbert też miał wątpliwości. Pisał: (...)„law of the excluded middle” should not be uncritically adopted as logically unproblematic” . Ale osta-tecznie jednak stwierdził: „the application of tertium non datur can never lead to danger”. [94]

W logice pana „B” „statement ∃xA(x) is regarded as a partial communication, to be sup-plemented by providing an element a which satisfies A(x)” [121] . Koniec opowiastki.

BHK-postulaty dotyczące kwantyfikatorów sformułowano tak:kwantyfikator uniwersalny. „konstruktywnym uzasadnieniem formuły ∀x φ(x) jest procedura,która pozwala na przekształcenie konstrukcji dowolnego elementu a w konstruktywne uzasadnieniezdania φ(x)[x := a].kwantyfikator egzystencjalny. „uzasadnienie ∃x φ(x) to procedura, która konstruuje elementa i przekształca jego konstrukcję w uzasadnienie formuły φ(x)[x := a]”.

46Algebra Boole’a to algebra Heytinga w której prawdziwa jest dodatkowa równość: a → b = ¬a ∨ b. I to już niepowinno nas dziwić... .

47Przytoczony tu dialog otwiera artykuł E. Nelsona „Understanding intuitionism”.48Konsekwencją odrzucenia implikacji ¬∀x ¬A(x) → ∃xA(x) jest też to, że konstruktywiści rozróżniają pojęcia:

zbioru niepustego - ¬∀y ¬(y ∈ x) i zbioru zamieszkałego - ∃y y ∈ x.

Page 200: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 199

Czym jest ów „element a” przywoływany w sformułowaniach obu BHK-postulatów? „a ∈ Dwhere D is the domain of discourse (over which the variable range)” [110]. Termin „domain ofdiscourse” można tłumaczyć jako „dziedzina, przedmiot rozważań”. To konstruowalny obiekt ma-tematyczny, w którym umiemy interpretować język rozważanych formuł. Jego elementy muszą miećswoje nazwy, opisy. To niezbędne by można było mówić o czymś takim jak φ(x)[x := a].

„Uzasadnienie” jest zależne od rozważanej dziedziny.„(...) “proof” should not be understood in the senseof a formal proof in some logical calculus (...) rather as an informal basic notion(like truth in case ofclassical logic)” - napisano w [110] opisując to, co nazwaliśmy tu uzasadnieniem.Wbrew mylącemu skojarzeniu - uzasadnienie to „proof” a proof to dowód - to zdanie lokuje pojęcieuzasadnienia po tej samej stronie, po której jest „prawdziwość” - po stronie semantycznej.

BHK-postulaty to nie aksjomaty49. To drogowskaz którym mamy się kierować konstruując kolej-ne „domains of discourse” i związane z nimi pojęcie uzasadnienia. Przykładem takiego rozumieniaBHK-postulatów jest realizowalność Kleene’ego o której opowiemy za chwilę.Jednak matematyce trudno poprzestać na enigmatycznych postulatach: oczekujemy formalizacji in-tuicjonistycznej logiki pierwszego rzędu - stworzenia systemów dowodzenia, takich, że dowodliwośćformuły gwarantuje istnienie jej uzasadnienia w każdej „dziedzinie rozważań”, w której to pojęciejest zgodne z BHK-postulatami50.

Poprzestaniemy na zapewnieniu, że takie systemy stworzono51. To może skłaniać do stwierdze-nia, że dowody budowane w tych systemach są konstruktywne. Argumentem wspierającym tę tezęjest taki oto wynik:

„zdanie ∃x ψ(x) jest dowodliwe w systemie dedukcji naturalnej pozbawionym reguły dowodzeniaprzez sprzeczność dokładnie wtedy, gdy istnieje term t taki, że formuła ψ(x)[x := t] jest dowodliwa”.Ów term wskazuje (nazywa) elementy, które realizują BHK-postulat dla zdań postaci ∃xψ(x).

Pomożmy sobie analizując paradoks pijaka, który rozpowszechnił R. Symullyan. Zdanie ”thereis someone in the pub such that, if he is drinking, then everyone in the pub is drinking.” wydaje sięabsurdalne. Ale - paradoksalnie - jest prawdziwe w klasycznej logice. To zdanie zapisane formalniewygląda tak: ∃x (p(x)→ ∀y p(y)). Jest tu tylko pojedynczy jednoargumentowy symbol relacyjny pco oznacza, że teoriomnogościowym modelem tego języka jest każda para zbiorów (A,Ap ⊆ A)52.To zdanie jest prawdziwe w każdym teoriomnogościowym modelu. Wystarczy osobno rozpatrzyćdwie rozłączne i dopełniające się klasy modeli: klasa pierwsza to modele, w których Ap = A („wszy-scy piją”). Druga, to modele w których Ap 6= A („jest ktoś niepijący”). W modelach z pierwszejklasy następnik implikacji jest prawdziwy. W drugim przypadku wyskazując niepijącego osobnikaa0 ∈ A \ Ap sprawiamy, że poprzednik rozważanej implikacji jest fałszywy przy wartościowaniu[x := a0]. A to wystarczy do uzasadnienia prawdziwości rozważanego zdania.Na mocy twierdzenia o zupełności logiki klasycznej zdanie prawdziwe w każdym teoriomngościo-wym modelu ma dowód53. Jednak to zdanie nie ma dowodu „intuicjonistycznego”. Gdyby miało,to - na mocy przywołanego wyżej twierdzenia - dowodliwa byłaby też formuła p(z)→ ∀xp(x) którączytamy „jeśli ktokolwiek w pubie jest pijący to wszyscy piją”54. A w to trudno uwierzyć... 55.

49W [109] te postulaty określono jako „informal semantics”.50Pewnie dlatego, że wszyscyśmy wychowali się w tradycji Tarskiego...51Nieco upraszczając, dowodzenie intuicjonistyczne różni się od klasycznego tym, że rezygnujemy z „dowodzenia

przez sprzeczność”. Np. taki system otrzymamy wyrzucając z klasycznej dedukcji naturalnej regułę Γ,¬A`⊥Γ`A .

52W szczególności, modelem jest każdy pub rozumiany jako zbiór ludzi z wyróżnionym podzbiorem pijących.53Dowodzimy osobno zdań ∀y p(y) → (∃x (p(x) → ∀y p(y))) oraz ¬∀y p(y) → (∃x (p(x) → ∀y p(y))). A potem

wystarczy scalić oba dowody korzystając z prawa wyłączonego środka.54Jest tak, ponieważ jedyne termy w rozważanym języku to zmienne.55Udowodnione twierdzenie sprawia, że BHK-postulat dla zdań egzystencjalnych formułuje się czasem tak: whenever∃xφ(x) is provable then φ(t) is provable for some term t”.

Page 201: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 200

11.4.1 Arytmetyka intuicjonistyczna

Z każdą klasyczną teorią T można skojarzyć jej intuicjonistyczną wersję - teorię T i56. Formalizacjaintuicjonistycznej logiki - stworzenie adekwatnych systemów dowodzenia - rodzi pokusę powtórzeniaklasycznej gry między syntaktyką i semantyką, między dowodliwością a prawdziwością zdań.

Czym jest model teorii intuicjonistycznej? To może być każdy teoriomnogościowy model T . Aleto zgrzyta: posługiwanie się różnymi logikami: intuicjonistyczną - gdy mówimy o syntaktyce - iklasyczną - gdy mowa o modelu i spełnianiu - to nie najlepszy pomysł. To niespójne.

Można też definiować pojęcie modelu intuicjonistycznej teorii T i „na nowo”. Takie próby po-dejmowano. I osiągano zamierzone cele57.

Ostatecznie można zechcieć zastąpić klasyczną teorię mnogości przez „intuicjonistyczną teorięzbiorów”. Jednak nie może to być teoria ZFCi bo, jak wiemy, konsekwencją aksjomatu wyboru jestprawo wyłączonego środka. Intuicjonistyczną teorię zbiorów trzeba zbudować inaczej. I to zrobiono.Ale i to nie wydaje się przesadnie interesujące i zgodne z brouwerowską wizją matematyki58. Trzebabardziej radykalnych propozycji - takich jak teoria toposów.

Zanim poznamy toposy (wkrótce) zajmijmy się tym co bezsporne: rozważanie intuicjonistycz-nych wersji klasycznej teorii ma niewątpliwie sens wtedy, gdy ta teoria jest wtórnym opisem pew-nego konstruowalnego obiektu matematycznego.Sztandarowym przykładem takiej teorii jest arytmetyka.

Arytmetyka Peano korzysta ze wsparcia klasycznej logiki pierwszego rzędu. O arytmetyce intu-icjonistycznej (arytmetyce Heytinga - HA) mówimy wtedy, gdy tę klasyczną logikę zastąpimy jejintuicjonistycznym odpowiednikiem59.

Te dwie arytmetyki są „równoważnie niesprzeczne”60 - jedna jest niesprzeczna dokładnie wte-dy, gdy druga jest niesprzeczna. Jest to konsekwencja twierdzenia udowodnionego przez Gentzenai Godla (które można traktować jako uogólnienie twierdzenie Glivenki): dla dowolnej formuły aryt-metycznej φ istnieje formuła arytmetyczna φN taka, że

„formuła φ ma dowód w klasycznej arytmetyce Peano dokładnie wtedy, gdy formuła φN madowód w arytmetyce intuicjonistycznej” 61. To oznacza, że i ta arytmetyka nie może dostarczyćdowodu własnej niesprzeczności...

Różnica między arytmetyką klasyczną i intuicjonistyczną jest bardziej subtelna niż się wydaje. Np. teteorie są równoważne gdy ograniczymy się do zdań postaci ∀x∃y α(x, y), gdzie α(x, y) jest formułą bez-kwantyfikatorową62.

Podsumujmy ten krótki rozdział przywołaniem znakomitego (choć mało eksponowanego) twier-dzenia, które usprawiedliwia ograniczenie omawiania logiki intuicjonistycznej pierwszego rzędu do

56Częścią każdej klasycznej teorii pierwszego rzędu T jest klasyczna logika pierwszego rzędu - FOL. Teorię T i

otrzymamy zastępując FOL logiką intuicjonistyczną pierwszego rzędu.57Modeli powinno być „więcej” by umożliwić udowodnienie twierdzenia o zupełności dla intuicjonistycznych teorii

pierwszego rzedu - to, co prawdziwe w każdym modelu jest dowodliwa konsewkencją T i. Można zajrzeć np. do [108]by znaleźć wprowadzenie w tę tematykę.

58Przekonywałem, że relacja „syntaktyka - semantyka” to - w ujęciu Tarskiego - swoista gra językowa. A takie grynie były w kręgu zainteresowań Brouwera. Ale może nie mam racji... .

59HA = PAi. Zazwyczaj jednak ułatwiamy sobie życie dodając - jako nowe aksjomaty - pary równości definiującewszystkie funkcje prymitywnie rekurencyjne. „In principle one could base an axiomatisation of constructive arithmeticon the basic operations 0, succ , addition and multiplication and equality as the only predicate. However, this hasthe disadvantage that developing elementary number theory (...) would involve a lot of coding. Therefore, we preferto take all primitive recursive algorithms as basic constants and postulate their defining equations as axioms” [110].Takie rozszerzenie teorii jest konserwatywne - dodanie tych nowych aksjomatów nie zwiększa możliwości dowodzeniaw arytmetyce intuicjonistycznej.

60„Classical and intuitionistic arithmetic are equiconsistent.”61Godel-Gentzen translation -przyporządkowanie φ φN - nie jest, jak w twierdzeniu Glivenki, „podwójną

negacją”. Jest bardziej skomplikowane [37]. Dodajmy ciekawostkę: gdyby implikacja - „double negation shift” -∀x ¬¬φ(x)↔ ¬¬∀x φ(x) była prawem logiki intuicjonistycznej, to można by przyjąć φN = ¬¬φ. Ale tak nie jest.

62PA ` ∀x∃y α(x, y) dokładnie wtedy gdy HA ` ∀x∃y α(x, y) - to twierdzenie udowodnione przez Kreislera [37]

Page 202: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 201

przedstawienia arytmetyki intuicjonistycznej. Dla dowolnej formuły pierwszego rzędu jej arytme-tyczna instancją nazwiemy każdą formułę otrzymaną przez zastąpienie symboli operacyjnych ter-mami arytmetycznymi a relacyjnych - formułami arytmetycznymi. Twierdzenie o którym mowaorzeka, że:

formuła φ jest prawem intuicjonistycznej logiki pierwszego rzędu dokładnie wtedy, gdy w HAdowodliwa jest jej każda arytmetyczna instancja.

Powrót do źródeł?63

11.4.2 Realizowalność Kleene’ego

Realizowalność Kleene’ego to propozycja nowego spojrzenia na semantykę języka arytmetyki zry-wająca z „tradycją Tarskiego”64. Nie ma tu mowy o spełnianiu formuły i prawdziwości zdań. Cojest w zamian? Uzasadnienie.Odmienność propozycji Kleene’ego uświadamiamy sobie boleśnie, gdy ufni w swą matematycznąwiedzę zajrzymy nieopatrznie do dedykowanej specjalistom pracy traktującej o tej idei. Szybko sięzniechęcimy: podstawową frazą, którą operuje się w tych pracach to stwierdzenie: „liczba naturalnan realizuje formułę arytmetyczną ψ(x1, . . . , xk)”.... Ki czort?

Realizowalność to implementacja BHK-postulatów odwołująca się do teorii obliczalności.„Uzasadnienie (arytmetycznego) zdania musi być zrealizowane proceduralnie”.

Semantyka zdania to zbiór takich uzasadnień. Kleene utożsamił pojęcie procedury z maszynę Turin-ga lub, równoważnie, z częściową funkcję obliczalną65. Maszyny Turinga (częściowe funkcje obliczal-ne) można efektywnie ponumerować. Nic się więc nie zmieni gdy powiemy, że w modelu Kleenee’egosemantyką zdania arytmetycznego φ jest pewien zbiór liczb naturalnych - numerów maszyn Turinga,które to zdanie realizują66. Ot i cała tajemnica... . Piszemy:

n `real ψ wtw gdy n-ta maszyna Turinga realizuje zdanie arytmetyczne ψ.

Formalna definicja relacji „`real” to zapis BHK-postulatów w języku teorii obliczalności. Do jejsformułowania potrzebujemy pewnej numeracji maszyn Turinga: przyjmijmy, że φn : N→ N ozna-cza funkcją częściową realizowaną przez n-tą maszynę Turinga w ustalonej numeracji. Skorzystamyteż z kodowania par - obliczalnej bijekcji ( , ) : N×N→ N67 .

Liczba n realizuje zdanie ψ - n `real ψ - jeżeli:

- ψ jest prawdziwym zdaniem atomowym - równością termów domkniętych - i n = 0.- ψ ≡ α ∧ β i n = (n1, n2), gdzie n1 realizuje α a n2 realizuje β,- ψ ≡ α ∨ β i n = (0, n1), gdzie n1 realizuje α albo n = (1, n2), gdzie n2 realizuje β,- ψ ≡ α→ β i dla dowolnego m realizującego α, φn(m) realizuje β,68

- ψ ≡ ¬α i n realizuje α→ (0 = 1)69,- ψ ≡ ∃x α(x) i n = (n1, n2), gdzie n1 realizuje zdanie α(x)[x := n2],- ψ ≡ ∀x α(x) i φn(m) realizuje zdanie α(x)[x := m] dla dowolnej liczby m.[131]

63W artykule Realizability, An Historical Essay (dostępnym w internecie) J. van Oosten pisze, że wprawdzie tendowód przedstawił D.H.J de Jong w nieopublikowanym artykule (w 1969r.) ale odniósł tylko „częściowy sukces”.Autorstwo pełnego dowodu van Oosten przypisuje sobie. O zawiłej historii tego twierdzenia można przeczytać wartykule Intermediate logics and the de Jongh property (współautor: De Jongh) dostępnym w internecie.

64Pojęcie realizowalności zostało zdefiniowane przez Kleene’ego w pracy „On the interpretation of intuitionisticnumber theory” Journal of Symb. Log, vol. 10, no. 4, 1945

65Z oczywistych powodów Kleene utożsamia procedury ze zdefiniowanymi przez niego funkcjami obliczalnymi.66realize to „realizować” lecz także „urzeczywistniać”. W niektóry pracach zamiast zwrotu „n realizes ψ” pisze się

„n is an evidence of ψ.” czy nawet n is a witnessof ψ” .67Możemy np. przyjąć, (m,n) = 1

2 (m+ n)(m+ n+ 1) + n.68Dokładniej: „φn(m) jest określone i realizuje β”.69Równość (0 = 1) to arytmetyczna reprezentacja zdania fałszywego. Skoro żadna liczba nie realizuje równości

(0 = 1) to zdanie postaci ¬A albo nie ma żadnego uzasadnienia (gdy A ma uzasadnienie), albo jego uzasadnieniemjest każda liczba naturalna. Co więcej: albo zdanie A jest uzasadnione albo uzasadniona jest jego negacja.

Page 203: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 202

Dwie uwagi. 1. Równość domkniętych termów arytmetycznych - takich, w których nie ma zmien-nych - jest rozstrzygalna. Można przyjąć, że maszyna Turinga rozstrzygająca o równości takichtermów ma numer 0 70.2. Regułę dotyczącą realizacji alternatywy interpretujemy tak: maszynie, która najpierw rozpozna-je czy słowo napisane na taśmie jest alternatywą formuł arytmetycznych a następnie uruchamiamaszynę o numerze n1 która realizuje pierwszy składnik tej alternatywy nadajemy numer - kodpary (0, n1). A maszynie, która w drugiej fazie pracy uruchamia maszynę o numerze n2 realizującądrugi składnik nadajemy numer (1, n2)71.Podobnie interpretujemy pozostałe reguły.

Zdanie jest uzasadnione (realizowalne) jeżeli istnieje realizująca je liczba naturalna.Formuła α(x1, . . . , xn) jest realizowalna gdy uzasadnione jest zdanie ∀x1,...,xn α(x1, . . . , xn).

Formuła α(x1, . . . , xn) jest uzasadniona gdy istnieje procedura φ która dla każdego naboru liczb natu-ralnych (m1, . . . ,mn) oblicza liczbę φ(m1, . . . ,mn) realizującą zdanie α(x)[x1 := m1, . . . , xn := mn]. Niemożna wykluczyć istnienia formuła α(x) dla której każde ze zdań α(x)[x := m] jest uzasadnione przezpewną liczbę nm a formuła α(x) nie ma uzasadnienia.W koncepcji Tarskiego spełnianie formuł jest pierwotne, a prawdziwość zdań - wtórna. Tu jest odwrotnie:najpierw mówimy o uzasadnieniu zdań, a dopiero potem o uzasadnieniu formuł. Stwierdzenie, że formułato wspólny schemat rodziny zdań - instancji tej formuły ma tu głębszy sens niż w logice klasycznej.

Jaki jest związek między realizowalnością a prawdziwością zdania arytmetycznego? Wiemy jużdość by rozumieć, że to pytanie wymaga doprecyzowania. Można to zrobić na kilka sposobów.Spróbujmy:I. „Wersja logiczno-klasyczna”: Czy każde zdanie arytmetyczne, które jest instancją prawa klasycz-nej logiki pierwszego rzędu, jest realizowalne?Odpowiedź jest ...negatywna: przyjmijmy, że A to zbiór par liczb (m,n) takich, że „m-ta maszynaTuringa pracując na własnym kodzie zatrzyma się po n krokach”. Ten zbiór jest rozstrzygalny ajego funkcja charakterystyczna - λA - jest prymitywnie rekurencyjna. To oznacza, że - w językuHA - zbiór A jest opisany przez formułę atomową - równość λA(x, y) = 1.

Alternatywa ∀x(∃y (λA(x, y) = 1) ∨ ¬(∃y (λA(x, y) = 1) jest oczywiście prawdziwa. Ale nie mauzasadnienia bo to oznaczało by rozstrzygalność problemu stopu!72

Jeśli tak, to negacja zdania ∀x(∃y (λA(x, y) = 1)∨¬(∃y (λA(x, y) = 1) jest uzasadniona, choć jest zaprze-czeniem prawa klasycznej logiki...Czy to sprzeczność? W żadnym razie. To tylko potwierdzenie, że pewne prawa klasycznej logiki mogą niemieć konstruktywnej realizacji w rozumieniu takim, jak to zaproponował Kleene.

II. Pytanie: „czy formuły dowodliwe w PA są zawsze uzasadnione” jest - w świetle powyższegowyniku - bezzasadne. Ale możemy zapytać: „czy każda formuła arytmetyczna dowodliwa w HAma uzasadnienie?”. Tak!:

„każda formuła która ma dowód w arytmetyce intuicjonistycznej jest uzasadniona” 73

W szczególności realizowalne są aksjomaty Peano. Np. realizowalnosć aksjomatu indukcji - α(0) ∧(∀n (α(n)→ α(n+1)))→ ∀n α(n) - dowodzimy tak: jeśli liczba k realizuje zdanie α(0) a m realizuje

70To nie jest aż tak istotne. W [48] przyjęto, że prawdziwą równość termów domkniętych t = p realizuje liczba n,która jest wspólną wartością tych termów. A w [109] napisano enigmatycznie: „For basic assertions A it is intentionallyleft unspecified what are their witnesses

71To oznacza, że dana maszyna Turinga może mieć wiele numerów. Ale to nie problem.Zauważ, że informacja o istnieniu procedury realizującej jeden z dwóch składników altrnatywy φ ∨ ψ bez wskazania,który to składnik, nie gwarantuje istnienia opisanej wyżej procedury!

72Uzasadnieniem tego zdania jest funkcja obliczalna φ taka, że dla dowolnej liczby n, φ(n) = (0, k0), gdzie k0 jestuzsadnieniem zdania ∃y (λA(n, y) = 1) (czyli pokazuje, że maszyna o numerze n się zatrzymuje) lub φ(n) = (1, k1)gdzie k1 uzasadnia zdanie ¬(∃y (λA(n, y) = 1)) - „maszyna o numerze n się nie zatrzymuje”.

73Można powiedzieć więcej: „(..) the proof of φ gives us a recipe for construction of a realizer” [87].

Page 204: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 203

zdanie ∀n (α(n)→ α(n+ 1)) , to aksjomat indukcji jest realizowany przez liczbę s(k,m) która jestnumerem funkcji rekurencyjnej definiowanej tak:

φs(0) = k,φs(k,m)(n+ 1) = φm(φs(k,m)(n))

- liczbą, realizującą ten aksjomat jest numer funkcji rekurencyjnej, która każdej parze < k,m >przyporządkowuje liczbę s(k,m).74

Jednak nie każde uzasadnione zdanie jest dowodliwe w arytmetyce intuicjonistycznej75. Takimzdaniem jest prawo Markova76.

Prawo Markova

Paradygmaty konstruktywizmu Markova:- The objects of mathematics are algorithms. Algorithms are meant in a mathematically precise sense inthe sense that they should be presented as „words” in some finite alphabet of symbols.- Limitations due to finite memory capacity are disregarded, the length of symbol strings is unbounded(though always finite).- Logically compound statements not involving ∃,∨ are understood in a direct way, but existential state-ments and disjunctions always have to be made explicit.If it is impossible that an algorithmic computation does not terminate, we may assumethat it does terminate 77.

Ostatni paradygmat to prawo Markova: „jeśli jest niemożliwe, by praca algorytmu była nie-skończona, to jest skończona”. Dla wychowanych w kręgu klasycznej logiki ten postulat wydajesię „oczywistą oczywistością” - wystarczy skorzystać z prawa podwójnej negacji: „nieprawda, żenieprawda, że praca algorytmu jest skończona praca algorytmu jest skończona”. Tego nie uznająkonstruktywiści78.

Prawo Markova można formalnie zapisać tak:

(∗) (∀y (r(y) ∨ ¬r(y)) ∧ ¬¬∃x r(y))→ ∃x r(y)

gdzie r(y) to formuła arytmetyczna opisująca własność „rozważany algorytm (maszyna Turinga)pracując na własnym kodzie zatrzyma się po y krokach”

Schemat logiczny tego zdania to formuła

(∗∗) (∀x (a(x) ∨ ¬a(x)) ∧ ¬¬∃x a(x))→ ∃x a(x)

która jest oczywiście prawem klasycznej logiki. Jednocześnie ta formuła nie ma dowodu w arytme-tyce intuicjonistycznej [37]79

Ale każda formuła arytmetyczna-instancja schematu (∗∗) jest realizowalna!Dowód (nieformalny, dla przypadku, gdy ta implikacja jest zdaniem): opiszemy procedurę prze-kształcającą uzasadnienie poprzednika tej implikacji w uzasadnienie jej następnika. Uzasadnieniem

74To samo nieco inaczej: uzasadnieniem aksjomatu indukcji jest procedura-schemat rekursji.75Implikacja odwrotna - „istnienie uzasadnienia” „dowodliwość w HA” - jest prawdziwa tylko dla prawie nega-

tywnych (almost negative) formuł - takich, które są zbudowane z formuł atomowych i formuł postaci ∃x t = s jedynieza pomocą → , ∧ oraz kwantyfikatora ∀ [111].

76A.A. Markov (1903-1979) - twórca tzw. rosyjskiego konstruktywizmu matematycznego. Ojciec A. Markova (o tymsamym imieniu) (1856-1922) to równie znakomity matamatyk rosyjski, znany z dokonań w zakresie teorii prawdopo-dobieństwa (procesy Markova).

77A.E.Troelstra, D. van Dalhen, Constructivism in Mathematics, vol 1, Elsevier, 1988)78Suppose that someone tells us that it is impossible that the machine never halts, do we know that it indeed

halts? Markov argued ‘yes’. The decision procedure for the halting in this case consists of turning on the machine andwaiting for it to halt. An intuitionist would not buy the argument. When somebody claims that a Turing machinewill stop, the natural question is ‘when?’ We want an actual bound on the computation time. Reading ‘the machinehalts at time x’ for A(x), the above formulation exactly covers Markov’s argument. In fact, in Markov’s case A(x) isprimitive recursive [37]..

79Należy to rozumieć tak: formuły-instancje schematu (∗∗) otrzymamy zastępując a(x) konkretną formułą arytme-tyczną (tak samo, jak np. w przypadku indukcji matematycznej). „Niedowodliwość” tego schematu oznacza, że niekażda taka formuła-instancja jest dowodliwa w HA.

Page 205: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 11. LOGIKA INTUICJONISTYCZNA 204

poprzednika jest para procedur:- procedura φ, która dla dowolnej liczby n wskazuje to spośród pary zdań (a(n),¬a(n)) które

jest uzasadnione80,- stwierdzenie, że istnieje uzasadnienie zdania ∃x a(x). Istnieje, ale nie znamy jego konstrukcji!81.

Jeśli tak, to łatwo opisać procedurę uzasadniajacą ∃x r(x) - wystarczy kolejno urochamiać proceduręφ dla 0, 1, . . . tak długo, aż znajdziemy liczbę, dla której zdanie a(n) jest uzasadnione. Drugie zpowyższych założeń gwarantuje, że poszukiwanie tej liczby musi zakończyć się sukcesem....

Jeśli tak, to może należy zrewidować poglądy i dodać schemat (∗∗) -prawo Markova - do aksjomatówarytmetyki intuicjonistycznej? Jednak trudno ten schemat uznać za aksjomat specyficzny, gdyż w jegosformułowaniu nie odwołujemy się do żadnych pojęć arytmetycznych. To by jednak oznaczało, że jestto nowy aksjomat logiczny „poprawionej” logiki intuicjonistycznej pierwszego rzędu Ale czy ten jeden -ważny, ale tylko jeden - model upoważnia do takiej zmiany?

Przeciwko tej rewolucji przemawia też to, że wprawdzie prawo Markova - Markov principle -nie jest dowodliwe w HA ale niewiele (na pozór) różniąca się od niego

reguła Markova - jest zgodna z tą teorią: dla dowolnej formuły a(x)

„jeżeli HA ` ∀x(a(x) ∨ ¬a(x)) ∧ ¬¬∃x a(x) to również HA ` ∃x a(x)” - [37],[108]

Warto choć przez chwilę zadumać się nad różnicą między prawem a regułą Markova...

80Nieco ogólniejsza uwaga: jeśli formuła ∀xa(x) ∨ ¬a(x) jest uzasadniona, to własność opisana przez formułę a(x)jest rozstrzygalna.

81To jest ważne: uzasadnienie podwójnej negacji ¬¬∃x a(x) jest istotnie „słabsze” niż uzasadnienie ∃xa(x). Wartoto przemyśleć... . Dodajmy w tym miejscu „niepokojącą” uwagę: uzasadnieniem podwójnej negacji - zdania ¬¬φ - jestalbo każda liczba, albo żadna. „realizability interpretation is not interesting for doubly negated formulas (because suchformulas have no ’computational content’. It is closely related to Godel double negation formula” - [87]. Przyznam,że nie w pełni rozumiem...

Page 206: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 12

Kategorie, funktory i toposy

Zwycięstwem będzie przede wszystkimDobrze widzieć z dalekaWszystko widzieć z bliskaI żeby wszystko miało nowe imię.

G. Apollinaire

„Categories, initially a convenient way of formulating exact sequences, diagram chasing andaxiomatic homology for topology, aquired independent life in the work of Ehresmann (...) in France,and in United States in the work of Kan and McLane, and in a group around Eilenberg (...) .Then in 1963 Lawvere embarked on the daring project of a purely categorical foundations of allmathematics” [68].

12.1 Język kategorii

„Mathematics is the art of giving the same nameto different things”

H. PoincareTeoria kategorii oferuje schemat poznawczy pozwalający opisywać różne fragmenty matema-

tycznego uniwersum. Dostarcza też narzędzi do badania związków między tak opisanymi „mate-matycznymi światami”.

Te światy to kategorie. A związki między nimi opisują funktory.

Kategoria to obiekty i morfizmy. Z każdym morfizmem związana jest para obiektów - jego dziedzinai kodziedzina. Piszemy „f : A → B” i mówimy, że „f jest morfizmem z obiektu A do obiektu B”.Morfizmy składamy - jeżeli f : A → B i g : B → C), to ich złożeniem jest morfizm gf : A → C.Składanie jest łączne1. Z każdym obiektem A związany jest morfizm identycznościowy idA : A→ Ataki, że fidA = f = idBf dla dowolnego f : A→ B2.

Aksjomatyka ZFC to zbiór stwierdzeń arbitralnie dekretujących istnienie pewnych obiektów matema-tycznych: „istnieje zbiór pusty”, „istnieje zbiór induktywny” itd. Ona kreuje rzeczywistość.Aksjomaty teorii kategorii to tylko wskazanie warunków, jakie muszą być spełnione, by dany fragmentrzeczywistości postrzegać i badać jako „kategorię”.Teoria kategorii organizuje poznanie matematyczne. Epistemologia v. ontologia?

Kategorię tworzą zbiory i funkcje. Kategorią są przestrzenie topologiczne z funkcjami ciągłymijako morfizmami. Algebraik będzie zainteresowany kategoriami grup, pierścieni, modułów. Logik -kategorią algebr Boole’a czy też algebr Heytinga.

1f(gh) = (fg)h dla dowolnej trójki składalnych morfizmów.2Wzajemnie jednoznaczna odpowiedniość między obiektami i morfizmami identycznościowymi pozwala skreślić

termin „obiekt” z listy pojęć pierwotnych teorii kategorii pozostawiając na niej jedynie terminy „morfizm” i „złożeniemorfizmów”. Ale to podejście baaaardzo formalistyczne.

205

Page 207: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 206

Ale to nie znaczy, że obiektami kategorii muszą być zbiory wyposażone w struktury „tego samegorodzaju”3. Np. każdy graf skierowany może być potraktowany jako kategoria: obiektami są tuwierzchołki grafu, a morfizmy tej kategorii to ścieżki - (pewne) skończone ciągi zgodnie skierowanychkrawędzi. W szczególności kategorią jest dowolny poset (zbiór częściowo uporządkowany) (P,¬) -obiektami są tu elementy zbioru P a (jedyny) morfizm z a do b istnieje wtedy, gdy a ¬ b. Liczbynaturalne można traktować jako jednoobiektową kategorię, w której te liczby są morfizmami, askładanie jest realizowane jako dodawanie. Kategorią może być niemalże wszystko...4.

Budując uniwersalną - w zamierzeniu - teorię mnogości, jej twórcy musieli rozstrzygnąć raz nazawsze pewne dylematy, nadając tym rozstrzygnięciom status aksjomatów. Teoria kategorii jestwolna od obowiązku rozstrzygania wszelkich dylematów ontologicznych. Dopuszcza współistnienieświatów matematycznych - kategorii - w których te kwestie rozstrzygane są odmiennie. Można -obok kategorii wszystkich zbiorów Set5 w której akceptujemy nieskończoną skalę nieskończoności- rozpatrywać kategorię zbiorów skończonych Setf w której nieskończoność jest nieobecna. Możnateż wyróżnić kategorię zbiorów przeliczalnych - matematykę z jednym rodzajem nieskończoności.Nie trzeba już upychać całej matematyki w jednym uniwersalnym modelu.

Wyróżnienie fragmentu matematycznego uniwersum jako kategorii nie oznacza jego odsepero-wania od reszty matematyki. Przeciwnie: to, że różne fragmenty matematyki opisujemy korzystającz tego samego schematu, ułatwia poszukiwanie i opis związków między nimi.

Te związki opisujemy i badamy za pomocą funktorów.

Funktor F : C→ D to odwzorowanie między kategoriami respektujące ich podstawową strukturę: obiektyprzeprowadza na obiekty a morfizmy na morfizmy, zachowując ich składanie oraz identyczności6.

Jeżeli kategorie są lokalnymi światami matematycznymi, to funktory pozwalają na interpretację jednegoświata w drugim. Funktory są różne: mogą „zanurzać” (jedną kategorię w drugą), potrafią „zapomi-nać” (strukturę obiektów), ustalać równoważność między kategoriami. Funktory potrafią „zachowywać”i „kreować” własności obiektów. Są mądrzejsze niż funkcje...7.

Najciekawsze są te funktory, które działają między mocno różniącymi się światami-kategoriami.Takie konfrontowanie różnych dziedzin matematyki prowadzi często do niebanalych, a nawet zaska-kujących, odkryć. Np. wyróżnienie („odkrycie”) pewnych funktorów między kategorią przestrzenitopologicznych i kategorią grup pozwoliło na badaniu struktur topologicznych za pomocą narzędzialgebraicznych8.

Przedstawiając teorię ZFC opisałem (starałem się ...) mechanizm poszerzania języka teorii mno-gości. Te rozszerzenia były konserwatywne w tym sensie, że wprowadzeniu nowego pojęcia zawszetowarzyszyło twierdzenie o istnieniu obiektu-desygnatu tego pojęcia9. Wszystkie tak wprowadzanepojęcia są interpretowalne w każdym modelu ZFC. To było konieczne - wszak ta teoria miała miećjeden model zamierzony - uniwersum.

Struktura języka kategorii jest inna. W jego warstwie postawowej pojęć jest mało - „obiekt”,„morfizm” , „złożenie morfizmów” i „morfizm identycznościowy”. I tylko one muszą być interpreto-

3Takie kategorie nazywamy konkretnymi.4W pewnej monografii (prawdopodobnie w książce „Algebraic theories” E. Manesa, ale nie jestem pewny) jako

przykład podano kategorię, której jedynym obiektem jest R. Nixon a morfizmem ... banan. (Richard Nixon to przydentUSA o wątpliwej sławie.). Uniwersalny charakter języka kategorii jednych cieszy bardziej, innych mniej. W monografiipoświęconej topologii algebraicznej N.E.Steenrod nazwał teorię kategorii „abstrakcyjnym nonsensem”... .

5Bardziej precyzyjnie: kategoria zbiorów to dowolnie wybrany model ZFC. W tej kategorii morfizmy to funkcje.6Jeśli g : A→ B w C, to F (g) : F (A)→ F (B). F (idA) = idF (A) oraz F (gf) = F (g)F (f).7Dla Eilenberga i Mc Lane’a, twórców teorii kategorii, funktor był pojęciem podstawowym:„It should be observed

that the whole concept of a category is essentially an auxiliary one. Our basic concepts are essentially those of afunctor and of a natural transformation... .The idea of a category is required only by the precept that every functorshould have a definite class as domain and a definite class as range, for the categories are provided as the domainsand ranges of functors.” - General Theory of Natural Equivalences’, Transactions of the AMS, 58, pp. 239—94.

8Te badania to domena topologii algebraicznej. Można też wygłosić „stwierdzenie odwrotnie”: badania w zakresietopologii algebraicznej i osągnięte wyniki były istotnym impulsem rozwoju teorii kategorii.

9Hipoteza continuum jest tu wyjątkiem. Są i inne, ale ważne jedynie dla „podstawowców”.

Page 208: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 207

walne w każdej kategorii. Drugą warstwę tworzą pojęcia interpretowalne tylko w pewnych modelachtej teorii. To sprawia, że język kategorii umożliwia klasyfikację lokalnych matematycznych światów:pewne kategorie są ubogie, bo interpretujemy w nich tylko podstawowe pojęcia. Inne są bogatsze,bo pozwalają na interpretację pojęć „drugiej (i wyższych) warstw” języka10.

Granice

Ważnym pojęciem tej „drugiej warstwy” języka jest granica diagramu. Cóż to takiego?Diagram to graf, którego wierzchołki są etykietowane przez obiekty rozważanej kategorii a krawędzie- przez działające między mimi morfizmy. Diagram może wyglądać np. tak11:

A0φ // A1

A2

ψ

OO

(ten diagram jest posadowiony na grafie z trzema wierzchołkami i dwiema krawędziami). A stożeknad tym diagramem możemy narysować tak:

A0φ // A1

A2

ψ

OO

D

f1

::

f2

44f0

GG

Formalnie: stożek nad tym diagramem to obiekt D wraz z morfizmami fi : D → Ai takimi, że„wszystkie trójkąty są przemienne” - φf0 = f1, ψf2 = f1.Granica tego diagramu to stożek uniwersalny (C, (Πi : C → Ai : i = 1, 2, 3)) - taki, że dla każdegoinnego stożka (D, (fi : D → Ai)) istnieje dokładnie jeden morfizm f : D → C dla którego wszystkienowopowstałe trójkąty są przemienne (tzn. Πi · f = fi dla i = 1, 2, 3):

A0φ // A1

C

Π0

OO

Π2 // A2

ψ

OO

Df

>>

f2

44f0

GG

Opisana tu granicę nazywamy pullbackiem (pary morfizmów (φ, ψ) )12

Aby mówić o dowolnych diagramach i ich granicach wystarczy nasz przykładowy graf zastąpićjakimkolwiek - skończonym lub nieskończonym - multigrafem skierowanym13. Dalej bez zmian -granica to stożek uniwersalny nad danym diagramem.

Mówiąc o granicach nie tylko rysujemy diagramy, ale też ochoczo korzystamy z języka geometrii - mówimyo „przemiennych trójkątach”, „stożkach”, „prostokątach” itp., itd. To nie jest konieczne.Ale czy bez tych geometrycznych metafor łatwiej zrozumieć, czym jest granica?

10Można też powiedzieć tak: język kategorii ujawnia (proponuje) pewną hierarchię pojeć matematycznych.11Kategoryści uwielbiają rysować, przepraszam, ilustrować swoje konstrukcje rysunkami-diagramami. Jedną z tech-

nik dowodzenia nazwali nawet „diagram chasing” - „bieganie po diagramie”.12Na ostatnim rysunku brak dwóch morfizmów - f1 : D → A1 i Π1 : C → A1. To zgodne z ockhamowska zasadą:

skoro Π1 = φΠ0 = ψΠ2 (i podobnie f1 = ... ), to po co komplikować rysunek dodając coś, co już na nim jest?Kategorysta powie krótko: „ten prostokąt jest pullbackiem”. Niestety, mimo starań nie wymyślono satysfakcjonującegopolskiego odpowiednika tej nazwy... .

13„Multi” gdyż dopuszczamy istnienie krawędzi równoległych (czyli o tym samym początku i końcu).

Page 209: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 208

Grafy - bazy diagramów - można wybierać dowolnie. Dlatego granic jest nieograniczenie, wręczniewyobrażalnie wiele. Ale teoria kategorii oferuje twierdzenie, które niespodziewanie wprowadzaw tym kosmicznym chaosie „platoński ład”:

„jeżeli w rozważanej kategorii istnieją wszelkie ekwalizatory i (skończone) produkty, to istniejąw niej też wszelkie (skończone) granice”.

- Produkty to granice diagramów dyskretnych, czyli posadowionych na grafach bez krawędzi14.

- Ekwalizator pary „równoległych morfizmów” f, g : A→ B to granica diagramu Af//

g // B .

Trudno o coś prostszego. A jednak to wystarcza do konstrukcji granic nawet najbardziej skom-plikowanych diagramów. Czy to nie jest zaskakujące?

Wyróżnienie pojęcia, które obejmuje wiele pozornie różnych konstrukcji, jest wartością samą w sobie:pojedyncze twierdzenie o własnościach granic (ustalonego typu) może być interpretowane w różnychkategoriach i (pozornie) różnych sytuacjach.„Matematyka jest sztuką nadawania różnym rzeczom tych samych nazw” - pisał H. Poincare.

Granica diagramu może, ale nie musi istnieć - to zależy od tego, z jaką kategorią mamy doczynienia. Dlatego to pojęcie można wykorzystać do klasyfikacji, wyróżniania klas kategorii. Np.mówimy, że kategoria jest (skończenie) zupełna, gdy istnieją w niej granice wszelkich (skończonych)diagramów.

Zasada dualności

Trud włożony w zrozumienie czym jest granica diagramu opłaca się w dwójnasób. A to dlatego, żeteoria kategorii „odkryła” nową prawdę o strukturze matematyki - zasadę dualności.Jej źródłem jest banalna obserwacja: jeśli w dowolnej kategorii C „zmienimy kierunek morfizmów”- tzn. o morfizmie f : A → B powiemy, że działa on w odwrotnym kierunku, z B do A - tootrzymamy nową, poprawnie zdefiniowaną kategorię - kategorię dualną Cop15.

Dzięki temu w języku kategorii karierę zrobił tajemniczy przedrostek „ko” używany do wskazy-wania pojęć i twierdzeń dualnych. Jak to działa? Na przykład tak:

„Kogranica diagramu D w kategorii C to granica tego diagramu w kategorii dualnej Cop”16

Dlatego w języku kategorii obok produktów mamy koprodukty - kogranice diagramow dyskretnych.Skoro są ekwalizatory, to są też koekwalizatory (par równoleglych morfizmów). I tak dalej17.

Zasada dualności to nie tylko zabawa w słowa. Dzięki niej z każdym twierdzeniem sformułowa-nym w języku kategorii możemy związać jego „wersję dualną”. I tak np. dualną wersją przytoczonegowcześniej twierdzenia:

„jeśli w kategorii C istnieją wszelkie (skończone) produkty i ekwalizatory, to istnieją w niejgranice wszelkich (skończonych) diagramów”jest twierdzenie:

„jeśli w kategorii C istnieją wszelkie (skończone) koprodukty i koekwalizatory, to istnieją w niejkogranice wszelkich (skończonych) diagramów”.

I co ważne (nie tylko dla leni): twierdzenia dualnego nie trzeba dowodzić! Jego dowód otrzymamy„dualizując” dowód pierwotnego twierdzenia.

Zasada dualności ujawnia szczególną symetrię matematycznego uniwersum. Dostrzegalną wtedy, gdy dojego opisu użyjemy języka teorii kategorii.

14W szczególności, granica pustego diagramu to obiekt konńcowy - taki, że z każdego obiektu istnieje do niegodokładnie jeden morfizm. W Set obiekt końcowy to zbiór jednoelementowy.

15Obiekty Cop są takie same jak obiekty kategorii C.16Zachęcam do samodzielnego sformułowanie definicji kogranicy diagramu. Proszę nie bać się użyć takich pojęć jak

„kostożek” czy nawet „kostożek kouniwersalny”... .17Szczęśliwie, to szaleństwo ma swoje granice: np. nie mówimy o „ko-pullback”-ach tylko o pushoutach (par mor-

fizmów o wspólnej dziedzinie) . Dualność określeń „pull(back)” i „push(out)” jest oczywista dla bywalców hoteli irestauracji aspirujących do „poziomu światowego”.

Page 210: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 209

Matematycy uwielbiają symetrię uznając ją za dowód istnienia w matematycznym świecie oczekiwanegoładu czy wręcz doskonałości (charakterystycznej dla bytów transcedentnych)18.

12.1.1 Teoria mnogości v. teoria kategorii - okiem pragmatyka

Dla teoriomnogościowego ortodoksy teoria kategorii to tylko kolejna teoria pierwszego rzędu. Nicsię nie zmieniło - teoria mnogości jest nadal matematyczną ur-teorią.Co na to kategoryści? „In general, we shall not be very explicit about set-theoretic foun-dations, and we shall tactically assume we are working in some fixed universe U of sets.Members of U will be called „small sets” whereas a collection of members of U which does notitself belongs to U will be reffered to as a „large sets”19. Given such an ambient universe (...)”pisali S. Mc Lane i I. Moerdijk w [72].„Założenie taktyczne”, czyli przyjęte po to, by uniknąć jałowych dyskusji o wyższości WielkiejNocy nad Świętami Bożego Narodzenia (i odwrotnie)20.

F.W. Lawvere i R. Rosenburgh definiując „kategorię abstrakcyjnych zbiorów” pisali: ,An abs-tract set is supposed to have elements, each of which has no structure, except that the elementscan be distinguished as equal or unequal and to have no external structure except for thenumber of elements. [66]. To wyklucza utożsamienie kategorii zbiorów np. z opisanym wcześniejmodelem ZFC skonstruowanym na podstawie twierdzenia Łosia. Sugeruje, by kategorię zbiorówtraktować jako pojęcie niezależne od ZFC. 21

Dla części robotników matematyki spór, czy lepszym językiem opisu matematycznego uniwersum jestjęzyk teorii mnogości czy język kategorii, jest drugorzędny. Dla nich te języki są raczej dopełniające niżkonkurencyjne. Pozwalają spojrzeć na matematyczne obiekty i konstrukcje z różnych punktów widzenia.

Na czym polega odmienność tych punktów widzenia? Teoriomnogościowy obiekt - zbiór - to, jakmówił Cantor, „spojenie w całość” jego elementów. Wiedza o zbiorze to wiedza o jego elementach.Tymczasem kategoryjny obiekt nie ma wewnętrznej struktury, jest „atomem”. Wiedza o obiekcieto wiedza o jego relacjach z innymi obiektami wyrażona w języku morfizmów.

Teza o komplementarności obu języków bierze się stąd, że wiele kategorii to matematyczneświaty pierwotnie opisane w języku teorii mnogości: kategorie zbiorów, grup, pierścieni, przestrzenitopologicznych, itd. W tych kategoriach możemy równolegle (równocześnie) używać obu językówuzyskując lepszy obraz tych matematycznych światów.Np. w kategorii zbiorów możemy tak postrzegać teorimogościowy iloczyn kartezjański i kategoryjnyproduktu rodziny obiektów. Definicja iloczynu kartezjańskiego eksponuje wewnętrzną strukturętego zbioru - „elementy iloczynu A × B to pary uporządkowane (a, b) takie, że a ∈ A, b ∈ B”.Natomiast kategoryjna definicja produktu koncentruje uwagę na jego relacji z innymi zbiorami:„produkt zbiorów A,B to zbiór C wraz z funkcjami ΠA : C → A, ΠB : C → B takimi, że dladowolnych funkcji f : D → A, g : D → B istnieje dokładnie jedna funkcja < f, g >: D → C taka,że ΠA· < f, g >= f,ΠB < f, g >= g ”. Obie definicje wskazują ten sam zbiór22.

Inny przykład: funkcja różnowartościowa f : A → B przyporządkowuje różnym argumentoma, b ∈ A różne wartości. Funkcja g : A → B jest „na” gdy dla każdego elementu b ∈ B możnawskazać element a ∈ A taki, że g(a) = b. To proste definicje. Ale konia z rzędem temu teoriom-nogoścowcowi, który dostrzega jakieś ich „powinowactwo”. Tymczasem w języku kategorii funkcja

18O roli symetrii w rozumieniu piękna w sztuce i ... fizyce pięknie (choć krótko) pisał M.Heller w eseju „Czy fizykato nauka humanistyczna?”.

19„Small sets” to w naszej terminologii „zbiory a „large sets” - klasy.20J.T. Stanisławski.21Dodajmy, że definiując w [66] pojęcie kategorii autorzy unikają - jak najbardziej świadomie! - terminu zbiór.

Piszą tak: „A category C has the following data: Objects: (...), Arrows:(...)”. „Data” to (w tym przypadku) „dane”- termin, który nie ma określonej matematycznej treści.

22Troszkę kłamię: definicja kategoryjna identyfikuje iloczyn kartezjański „z dokładnością do izomorfizmu” - patrznastępny podrozdział. Podobnie rzeczy się mają, gdy porównamy pojęcia sumy rozłącznej i koproduktu zbiorów.

Page 211: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 210

różnowartościowa to monomorfizm: f : A→ B jest monomorfizmem gdy dla dowolnych morfizmówk, h : C → A, k = h jeśli tylko fk = fh. A funkcja „na” to epimorfizm: g : A → B jest epimorfi-zmem gdy dla dowolnych morfizmów k, h : B → C, k = h jeśli tylko kg = hg. Trzeba być ślepym,by nie widzieć, że mono- i epimorfizm to pojęcia dualne... . I dlatego każde twierdzenie o funk-cjach różowartościowych (wyrażone w języku kategorii) ma swój dualny odpowiednik mówiący cośo funkcjach „na”. Np.: „jeśli złożenie funkcji fg jest różnowartościowe, to g jest różnowartościowe” „jeśli złożenie gf jest „na”, to g jest „na”23

12.1.2 Izomorfizm

Skoro pojawiły się mono- i epimorfizmy, powiedzmy też choćby słowo o izomorfizmach.W wikipedii napisano: In certain areas of mathematics (...) it is valuable to distinguish between

equality on the one hand and isomorphism on the other. Equality is when two objects are exactlythe same, and everything that’s true about one object is true about the other, while an isomor-phism implies everything that’s true about a designated part of one object’s structure is trueabout the other’s. A są izomorficzne, gdy można ustalić wzajemnie jednoznaczną odpowiedniośćmiędzy ich elementami, gdy są równoliczne - równoliczność jest cechą wyróżnioną w kategorii Set.

„Myślenie kategoryjne” sugeruje by obiekty A i B w dowolnej kategorii C uznać za „takie same”,gdy ich relacje z wszelkimi innymi obiektami są identyczne. Np. gdy istnieje morfizm (monomorfizm,epimorfizm) z obiektu D do A, to powinien istnieć taki sam morfizm z D do B. Jeśli A jest granicą(kogranicą) pewnego diagramu, to jest nią również obiekt B.Doprecyzowanie tego zamysłu prowadzi do takiej oto definicji: obiekty A i B są izomorficzne,gdy istnieje para wzajemnie odwrotnych morfizmów f : A → B i g : B → A - tzn. takich, żefg = idB, gf = idA.

Aby uniknąć jałowych w gruncie rzeczy rozważań o „istocie izomorfizmu” proponuję uznać tę kategoryjnadefinicję za podstawową, a inne opowieści uznać za mniej lub bardziej udane próby opisu tego pojęcia wróżnych matematycznych światach, w różnych językach.

Izomorfizm jest jednocześnie epi- i monomorfizmem. Ale implikacja odwrotna nie zawsze musibyć prawdziwa (choć np. jest prawdziwa w Set).

W języku kategorii często pojawia się zwrot „z dokładnością do izomorfizmu”. Z dokładnością do izomor-fizmu definiujemy potrzebne nam obiekty, np. granice i kogranice diagramów. To potwierdza, że formalniedefiniowany izomorfizm realizuje pierwotny zamysł - wskazuje „kategoryjnie takie same” obiekty24..

12.2 Toposy

(...) when does the category look and behave like Set?A vague answer is - when it is (at least) a topos25.

R. Goldblat, Topoi

Kategoria to - jak ustaliliśmy - uniwersalny schemat opisu fragmentów matematycznego uni-wersum. Może też być, jak chcą teoriomnogościowcy, traktowana jako język komplementarny w

23.„Mój język wyznacza granice mojego poznania” - L. Wittgenstein. Po raz kolejny.24Kategoryści czasami zamiast danej pierwotnie kategoriiC badają jej szkielet- mniejszą kategorię, której obiektami

są reprezentanty klas obiektów izomorficznych wC a morfizmami wszelkie morfizmy między tak wybranymi obiektami.Taka „szkieletowa” kategoria ma te same (kategoryjne) własności co C. Ale, jak widać, ta konstrukcja odwołujesię do aksjomatu wyboru który przecież chcemy traktować jako specyficzną (i nieoczywistą) cechę kategorii Set.Dlatego z kategorii szkieletowych korzystamy głównie wtedy, gdy możliwy jest „kanoniczny” (konstruktywny) wybórreprezentantów klas izomorficznych obiektów.

25Topos, to pojęcie funkcjonujące też poza matematyką. Zainteresowanych odsyłam do polskiej wikipedii, gdzieznaleźć można obszerną informację na ten temat, ktora zaczyna się od słów „Topos lub miejsce wspólne.... Cociekawe, wśród dziedzin nauki, w których pojawia się ten termin Autor notki nie wymiena matematyki... .

Page 212: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 211

stosunku do ZFC. Jednak ambicje, przynajmniej części twórców teorii kategorii, sięgały dalej. Onichcieli w niej widzieć nowy podstawowy język matematyki, nową ur-teorię. „With the creation andrefinement of set theory in the hands of Cantor, Zermelo, von Neumann and others, the problemof providing an infrastructure for the elaborate developments in areas of mathematics such asabstract algebra, analysis and topology appeared to be solved. The domain of sets (structured bymembership) came to be regarded by most mathematicians (those of a constructive tendency suchas the intuitionists being the most notable exceptions) as the source of ’raw material’ for buildingthe structures required in mathematics. Thus, (...) although the notions of structure and operationon structures had come to play a fundamental role in most mathematical disciplines, these notionswere not taken as primitive.

In what sense could category theory serve as a foundation for mathematics? There seem to be(at least) two possible senses: first, a strong sense, in which all mathematical concepts, includingthose of the current logico-metatheoretical framework for mathematics, are explicable in categorytheoretic terms. And secondly, a weaker sense in which one only requires category theory to serveas a (possibly superior) substitute for axiomatic set theory in its present foundational role.26 .

W 1964 roku W. Lawvere27 sformułował własności, które charakteryzują kategorię zbiorów„z dokładnością do równoważności” [65]28. Chciał uchwycić i wyrazić w języku kategorii te cechykategorii zbiorów, które zdecydowały, że została ona uznana za podstawę współczesnej matematyki.To, co ostatecznie stało się definicją toposu, to część wyróżnionych przez Lawvere’go własności:29

topos to kartezjańsko domknięta kategoria, w której istnieją wszelkie skończone granice i spe-cjalny obiekt - klasyfikator podobiektów Ω .

Teorię mnogości postrzegamy jako ur-teorię klasycznej matematyki, pośredniczącą między matematycznąrzeczywistością a wszelkimi innymi teoriami. Dostarcza ona - a właściwie jej model, który utożsamiamyz kategorią Set - semantyk dla wszelkich teorii pierwszego rzędu.Aby kategoria C mogła zastąpić kategorię zbiorów w tej roli musi mieć wystarczająco bogatą strukturę,by można było mówić o modelach dowolnej teorii pierwszego i wyższych rzędów w tej kategorii.I to ma zapewnić definicja toposu.

Definicja modelu języka pierwszego rzędu w toposie C powinna być taka, by „po powrocie doźródeł” - czyli dla C = Set - była ona tożsama z klasyczną definicją Tarskiego, czyli:

1. model A w C jest posadowiony na pewnym obiekcie tej kategorii - nośniku modelu,2. semantyką n-argumentowej relacji (i formuły o n-zmiennych wolnych) jest „coś”, co odpowiadateoriomnogościowemu pojęciu „podzbiór n-tej potęgi kartezjańskiej nośnika modelu”.3. Struktura toposu powinna umożliwiać interpretację spójników logicznych i kwantyfikatorów atakże operacji podstawiania (termów w miejsce zmiennych). Inaczej mówiąc, podobnie jak w Set,każdy obiekt powinien generować pewną otaczającą go „elementarną strukturę” (patrz str. ??)

12.2.1 Elementarne struktury w toposie

Z odpowiednikiem „n-tej potęgi kartezjańskiej zbioru” w toposie nie ma kłopotu: skoro są tu wszel-kie skończone granice, to są też produkty dowolnej liczby kopii każdego obiektu30.

Wskazanie kategoryjnego odpowiednika „podzbioru” jest nieco bardziej kłopotliwe... . W językutoposów nie znajdziemy odpowiednika pojęcia „zanurzenie identycznościowe” wykorzystywanego w

26J.L. Bell, „Category Theory and the Foundations of Mathematics” (Brit. J. Phil. Set. 32 (1981), 349-358)27William Lawvere (1937 - ) - matematyk amerykański, jeden z współtwórców teorii kategorii.28Dokładniej: chodziło o tzw. Set-like categories” - kategorie „zbioropodobne”, równoważne z Set. Równoważność

kategorii to pojęcie nieco słabsze od izomorfizmu kategorii, ale satysfakcjonujące kategorystów.29W teorii literatury: topos - stały motyw, wątek, stereotyp wyobrażeniowy (...) Toposy są przedstawieniami

uogólnionymi, wyrażającymi pewną wizję i ocenę świata (...) (tendencyjnie wybrane fragmenty internetowej definicji).30Na marginesie: w definicji toposu wymaga się tylko istnienia skończonych produktów. A co z koproduktami?

Czyżby te światy były „asymetryczne”? Wcale nie: piękne twierdzenie Mikkelsena mówi, że w każdym toposie sąwszelkie skończne koprodukty...

Page 213: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 212

Set do zdefiniowania podzbioru zbioru A31. Możemy wprawdzie zdefiniować podobiekt obiektuA jako „klasę równoważności monomorfizmów o kodziedzinie A” ale to nie jest satysfakcjonującerozwiązanie.

„Klasa równoważności” to pojęcie teoriomnogościowe. Potrzebujemy „wewnętrznej”, kategoryjnej definicjipodobiektu jeśli chcemy, by teoria toposów była nową ur-teorią.32

Kluczem do rozwiązania problemu jest prosta obserwacja:

- podzbiór B ⊆ A jest jednoznacznie wyznaczony przez funkcję λB : A → 0, 1 taką, że dladowolnego elementy a ∈ A:

a ∈ B gdy λB(a) = 133

Taki opis podzbioru można odtworzyć w języku kategorii korzystając z granicy-pullbacku:

AλB // 0, 1

B

iB

OO

!B // 1

true

OO

(gdzie !B : B → 1 to jedyna funkcja z B do zbioru jednoelementowego 1 a true(1) = 1).

To powinno wystarczyć do zrozumienia definicji - i roli! - klasyfikatora podobiektów w toposie:klasyfikator podobiektów w toposie C to obiekt Ω wraz z morfizmem true : 1 → Ω (gdzie 1

to obiekt końcowy) taki, że dla dowolnego monomorfizmu m : B → A istnieje dokładnie jedenmorfizm λB : A→ Ω taki, że prostokąt

AλB // Ω

B

m

OO

!B // 1

true

OO

jest pullbackiem34.

Choć zabrzmi to dziwnie, podobiektami obiektu A nazywać będziemy morfizmy z A do Ω.35

12.3 Przykłady toposów

Zanim pójdziemy dalej przyjrzyjmy się prostym przykładom pozwalającym zrozumieć, że opero-wanie nieklasycznymi logikami w toposach jest naturalne. A nawet kuszące.

12.3.1 Zbiory zmienne w czasie

Zacznijmy od toposa zbiorów zmiennych w czasie - Set→.Przyjmijmy, że obserwujemy obiekt - zbiór i zachodzące w nim zmiany - w dwóch momentachczasowych: „0” i „1”. Taki obiekt opiszemy jako parę zbiorów (A0, A1) wraz z funkcją tA : A0 → A1.Zbiór A0 to stan obiektu „w chwili 0”, A1 - stan „w chwili 1” a funkcja tA opisuje „zmiany w czasie”- a ∈ A0 tA(a) ∈ A1.

31„Zbiór B jest podzbiorem A gdy istnieje zanurzenie identycznościowe - funkcja iB : B → A taka, że dla dowolnegob ∈ B, iB(b) = b”

32Do kwestii „uwęwnetrzniania” wrócimy później, gdy będziemy wiedzieli więcej o toposach.33λB to tzw. funkcja charakterystyczna podzbioru B.34!B : B → 1. to jedyny morfizm z obiektu B do obiektu końcowego 1.35Zdarza się, że w danym toposie podobiekty mają kanoniczną czyli wyróżnioną reprezentację. W Set takie kano-

niczne reprezentacje to zanurzenia identycznościowe. Ktoś powie, że kanoniczną reprezentację można wyróżnić zawsze- wystarczy skorzystać z pewnika wyboru. Ale przecież nie tego chcemy... .

Page 214: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 213

Morfizm z obiektu (B0tB→ B1) do (A0

tA→ A1) to para funkcji (f0 : A0 → B0, f1 : B1 → A1)„respektująca zmiany w czasie” tzn. taka, że f1 · tB = tA · f0:

B1f1 // A1

B0

tB

OO

f0 // A0

tA

OO

Łatwo zdefiniujemy składanie takich morfizmów-par funkcji i pokażemy, że Set→ jest kategorią.Ale ta kategoria jest też toposem. Na czym polega jego odmienność?

Pomyślmy o elementach obiektu (A0tA→ A1). Elementem - zmiennym w czasie - jest niewątpliwie

każda para (a0, tA(a0)) : a0 ∈ A0 to stan elementu w „chwili 0” a tA(a0) - stan tego samego elementuw „chwili 1”. Ale są tu też elementy, których nie ma w „chwili 0” a pojawiają się w „chwili 1” - toelementy zbioru A1 \ tA(A0). Czy ich „istnienie” jest takie samo jak istnienie elementów obecnychw obu chwilach?

Podobne dylematy pojawią się gdy zapytamy o równość elementów. Czy elementy (a0, tA(a0))i (c0, tA(c0)) takie, że tA(a0) = tA(c0), - różne w „chwili 0” a równe w „chwili 1” - są równe czyróżne? Czy równość elementów pojawiających się w „chwili 1” jest „taka sama” jak elementówobecnych w obu momentach?

A co z przynależnością elementu do podobiektu? Czy element (0, 1) obiektu (0, 0 id→ 0, 1)należy do podobiektu (1 → 0, 1) czy też nie? A może „częściowo należy”? I jak odpowiedzieć

na pytanie, czy istnieje w (A0tA→ A1) element, który należy do podobiektu (∅ → A1)?

To nie są marginalne czy też niedorzeczne pytania! Wręcz przeciwnie: uznanie „częściowości” istnienia,równości czy przynależności za problemy godne matematycznego rozważenia, to klucz do zrozumieniateorii toposów.

Spójrzmy jeszcze na topos Set⇒ którego obiektami są dwa zbiory połączone parą funkcji -s, t : A0 ⇒ A1 a morfizmami - odpowiednie pary funkcji. Mając w głowie poprzedni przykładgotowi jesteśmy uznać, że to też „zmienne zbiory” z tą różnicą, że teraz zmienność jest opisywanaprzez dwie funkcje. Ale te obiekty można interpretować jako ... multigrafy36: A0 to zbiór krawędzi,A1 - zbiór wierzchołków a funkcje s, t przyporządkowują krawędziom ich początki i końce.Intuicja bywa zwodnicza... .37

12.3.2 Toposy presnopów i toposy snopów

Presnop na przestrzeni topologicznej (A, T ) można sobie wyobrazić jako rodzinę zbiorów indekso-waną otwartymi podzbiorami - F (U) : U ∈ T - rozpatrywaną wraz z funkcjami - „obcięciami”:a ∈ F (U) a|V ∈ F (V ) jeśli V ⊆ U .

„Presnopy na dowolnie wybranej przestrzenią topologiczną - wraz z odpowiednio zdefiniowanymimorfizmami - tworzą topos” [68]38.

Skoro są presnopy, to pewnie są i snopy. Cóż to takiego? Zacznijmy od przykładu.

36Między dwoma wierzchołkami może być więcej niż jedna krawędź.37Więcej informacji o tym toposie można znależć w artykule „A Guided Tour in the Topos of Graphs (aut. S.Vigna)

dostępnym w internecie. Teraz powiedzmy tylko, że klasyfikator podobiektów w tym toposie to dwuwierzchołkowygraf z pięcioma krawędziami:

a

e

s

%%

t

99 bu

f

QQ

Spróbuj to sprawdzić... .38„Nasz” topos Set→ to topos presnopów dyskretnej przestrzeni topologicznej - takiej, w której są tylko dwa zbiory

otwarte - zbiór pusty i cała przestrzeń.

Page 215: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 214

Presnop funkcji ciągłych to rodzina (C(U) : U ∈ T ) , gdzie C(U) to zbiór funkcji ciągłych z U doR 39. Te funkcje umiemy w sposób oczywisty „obcinać” 40. Ale potrafimy je też „sklejać”:

każda zgodna rodzina funkcji ciagłych (fi : Ui → R : i ∈ I) - czyli taka, że dla dowolnychi, j ∈ I, fi|Ui∩Uj = fj|Ui∩Uj - wyznacza funkcję ciągłą f :

⋃(Ui : i ∈ I) → R taką, że dla każdego

i ∈ I funkcja fi jest obcięciem f do Ui.

„Sklejanie elementów” to cecha, która wyróżnia snopy spośród presnopów:

snop na przestrzeni (A, T ) to presnop F (U) : U ∈ T spełniający „warunek zgodności”:dla każdej rodziny (ai ∈ F (Ui) : i ∈ I) zgodnych elementów - takich, że dla dowolnych i, j ∈ X,ai|Ui∩Uj = aj|Ui∩Uj - istnieje dokładnie jeden element a ∈ F (

⋃(Ui : i ∈ I) taki, że a|Ui = ai.

Kategoria snopów dowolnie wybranej przestrzeni topologicznej jest toposem [68].

Rozważając „istnienie” i „równość” elementów snopa (presnopa) F napotkamy na te samepytania co w toposie Set→: czy „miara istnienia” elementu a ∈ F (U) jest równa mierze jegoobcięcia - elementu a|V ∈ F (V ) ? Czy różne elementy a, b ∈ F (U) których obcięcia a|V , b|V ∈ F (V )są takie same uznamy za różne czy może częściowo równe? A jeśli tak, to jak zdefiniować „logikęczęściowego istnienia i równości” w toposie snopów?

Dodatek: skąd te snopy (w matematyce)?

,(...) a sheaf is a tool for systematically trackinglocally defined data attached to the opensets of a topological space. (wikipedia)

Sklejenie zgodnej rodziny ciągłych funkcji rzeczywistych w jedną jest możliwe, bo definicjaciągłości jest „lokalna”. Do zrozumienia, na czym polega lokalny charakter definicji wystarczyprzykład: jeśli w sposób analogiczny do presnopa funkcji ciagłych zdefiniujemy presnop funkcjirzeczywistych ograniczonych z góry, to utracimy możliwość sklejania zgodnych rodzin - sklejeniefunkcji ograniczonych z góry nie musi być funkcją ograniczoną z góry. Ten presnop nie jest snopem,bo definicja „funkcji ograniczonej z góry” nie jest lokalna.

Ale dlaczego lokalna definiowalność jest tak ważna, że aż warta uwagi matematyków? Rozpa-trzmy tylko jeden, ale przekonujący przykład.

Badając różne zjawiska na powierzchni całego ziemskiego globu - rozkład temperatury, wilgot-ności, ciśnienia atmosferycznego, zanieczyszczeń powietrza itd. - zakładamy, jak chciał Leibniz, żezmienność tych zjawisk ma charakter ciągły - opisujemy je jako rzeczywiste funkcje ciągłe41.Powierzchnia globu to trójwymiarowa sfera42 czyli pewna przestrzeń topologiczna (którą oznacza-my tu przez M - „Monde”). Ale sfera to „trudna przestrzeń” - nie da się opisać globalnych(czyli działających na całej przestrzeni M) rzeczywistych funkcji ciągłych w sposób pozwalającyna efektywne badanie ich własności.Rozwiązanie, które znaleźli nasi przodkowie (żeglarze, podróżnicy i władcy marzący o globalnychpodbojach) polega na wykorzystaniu lokalnego charakteru ciagłości: zamiast trudzić się poszukiwa-niem globalnego opisu funkcji ciągłej f : M → R opisywali interesujące ich zjawiska „kawałkami”,czyli za pomocą zgodnych rodziny funkcji ciagłych fi : Ui → R, takich, że rodzina (Ui : i ∈ I)pokrywa całą przestrzeń M . To wystarczy, bo ciągłe funkcje z M do R tworzą snop - „lokalne”opisy można skleić w opis „globalny”43.

To wiele i istotnie zmienia, bo każdy otwarty podzbiór U ( M , można odwzorować na płasz-czyźnie - stworzyć jego mapę. Matematyk powie, że mapa to homeomorficzne odwzorowanie tego

39Funkcja f : U →R jest ciągła gdy przeciwobraz dowolnego zbioru otwartego V ⊆ R jest zbiorem otwartym.40f|V działa na elementach zbioru V tak samo jak f .41Mówimy tu o zmienności związanej z przemieszczaniem się po powierzchni globu a nie o zmienności w czasie.42W pewnym uproszczeniu.43To nie znaczy, że nasi przodkowie wiedzieli co to przestrzeń topologiczna. Snop kojarzyli raczej ze żniwami... .

Page 216: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 215

podzbioru na pewien otwarty podzbiór W ⊂ R2 - h : U →W 44. Taka mapa pozwala zastąpić opisdowolnej „lokalnej” funkcji ciągłej f : U → R przez opis złożenia - funkcji fh−1 : W → U → Rdziałającej na otwartym podzbiorze płaszczyzny45. A to o niebo łatwiejsze, bo do opisu i badaniatakich funkcji można użyć całego arsenału narzędzi wypracowanych przez analizę matematyczną.Pierwotny pomysł - opis globalnych zjawisk za pomocą funkcji ciagłych f : M → R - został wten sposób przekształcony w niezwykle skuteczną metodę matematycznego modelowania i badaniatych zjawisk. A wszystko dzięki temu, że „rzeczywiste funkcje ciągłe tworzą snop”46.

Ta (niezbyt klarowna) opowieść o mapach miała przekonać, że snopy były obecne w matematycedługo przed powstaniem teorii toposów. Topos snopów to też pierwowzór toposów Grothendiecka- ważnej podklasy toposów. Tę klasę opiszemy tak (trochę zaszalejemy...): pojęcie prosnopa możnauogólnić zastępując poset zbiorów otwartych T jakąkolwiek małą kategorią D. Presnopy (na D) towówczas funktory z Dop do Set [68]. Takie presnopy też tworzą topos. Co więcej w dowolnej małejkategorii D można zdefiniować „coś”, co można nazwać topologią i co pozwala wyróżnić w toposiepresnopów PSh(D) mniejszy topos snopów - Sh(D, J) (gdzie J to owa wyróżniona „topologia” wD). To są właśnie toposy Grothendiecka. A potem zrobiono kolejny krok: pokazano, że w dowolnymtoposie C można wyróżniać (na wiele sposobów) „coś”, co można nazwać topologią i związać z każdątaką topologią J topos snopów CJ zawarty w C. Uff... 47.

12.4 Logika toposu

W teorii toposów fascynujące jest to, że ujawnia ona fundamentalną i jednocześnie subtelną zależnośćmiędzy logiką a matematyką.I na tym skupimy teraz uwagę.

Na dwuelementowym zbiorze - klasyfikatorze podobiektów w Set - zdefiniowane są operacjeodpowiadające spójnikom logicznym. To algebra Boole’a wartości logicznych, która jest odpowie-dzialna za interpretację logiki zdaniowej w kategorii zbiorów. Tak jest też w każdym toposie:

Logika zdaniowa toposu jest zakodowana w otoczeniu klasyfikatora podobiektów. Jest wewnętrzna, bojest zależna od struktury rozważanego toposu - jest wtórna w stosunku do matematyki tego toposu.Tak, jak chciał Brouwer.

Matryca (zbiór) wartości logiki toposu to zbiór podobiektów obiektu końcowego, czyli morfi-zmów postaci w : 1→ Ω . Jedną z tych wartości jest morfizm true : 1→ Ω wyróżniony w definicjiklasyfikatora. Druga wartość to morfizm false : 1→ Ω - taki, że diagram

1false // Ω

0

OO

!0 // 1

true

OO

jest pullbackiem 48. Te dwa morfizmy-wartości logiczne znajdziemy w każdym toposie.44Ciągłość odwzorowania homeomorficznego h gwarantuje że punkty odpowiednio bliskie wybranemu dowolnie

punktowi a ∈ U znajdą się na tej mapie blisko punktu h(a) (choć proporcje odległości mogą być zachwiane). Stwo-rzenie homeomorficznego obrazu całej sfery M na płaszczyźnie jest niemożliwe - „narysowanie takiej mapy wymaga„rozerwania” sfery. To, co znamy jako „mapę świata” nie jest homeomorficznym obrazem sfery. Ale mapę możnastworzyć np. dla Polski czy Europy. Wspomnij lekcje geografii i ”atlas świata”.

45Homeomorfizm h : U →W charakteryzuje się tym, że odwzorowanie h−1 : W → U jest też ciągłe.46Dodajmy dla porządku, że zapewnienie zgodności rodziny funkcji fi : Ui → R , po zastąpieniu ich funkcjami

fih−1 nie jest wielkim problemem.

47Mowa tu o tzw. topologiach Grothendiecka - w pierwszym przypadku - i topologiach Lawvere’go-Tirney’a - wdrugim [68]. Zdefiniowanie toposów Grothendiecka umożliwiło rozwiązanie ważnych problemów matematycznych.Wyniki uzyskane w ten sposób należą do największych osiągnięć matematyki drugiej połowy XX wieku.

48„0” oznacza tu obiekt początkowy. Obiekt początkowy to pojęcie dualne do obiektu końcowego: dla dowolnegoobiektu A istnieje dokładnie jeden morfizm z 0 do A. Obiekt początkowy w Set to zbiór pusty.

Page 217: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 216

Operacje logiczne na zbiorze wartości logicznych - koniunkcję, alternatywę, implikację i negację- definiujemy wewnętrznie, jako ... morfizmy. Najprostszy z nich - negacja - to (jedyny) morfizm¬ : Ω→ Ω taki, że diagram-prostokąt

Ω ¬ // Ω

1

false

OO

// 1

true

OO

jest pullbackiem.

Zdefiniowanie koniunkcji, alternatywy i implikacji jako odpowiednich morfizmów z Ω × Ω do Ωwymaga nieco więcej pomysłowości. Ale jest możliwe [43].

Działanie morfizmów-operatorów logicznych na podobiektach obiektu A - morfizmach z A doΩ - definiujemy odwołując się do składania morfizmów:

A<f,g> //

f op g

33Ω× Ωop // Ω A

f //

¬f

44Ω ¬ // Ω

gdzie op ∈ ∧,∨,→.W szczególności - dla A = 1 - zdefiniujemy w ten sposób algebrę wartości logicznych toposu.

Powiedzmy wreszcie to, co najistotniejsze:

W różnych toposach mamy różne matryce wartości logicznych. Ale wewnętrzna logika zdaniowa każdegotoposu jest zawsze logiką intuicjonistyczną - zdefiniowane wyżej algebry na podobiektach dowolnegoobiektu A - morfizmach z A do Ω - to są zawsze algebry Heytinga49.I nie jest to dodatkowy warunek - to jest konsekwencja struktury toposu!

Kwantyfikatory

Wewnętrzne zdefiniowanie kwantyfikacji w toposie wymaga wykorzystania dotąd nie wspominanejwłasności definiującej toposy - ich kartezjańskiej domkniętości. Precyzyjna (pełna) definicja tegopojęcia jest zbyt skomplikowana bym odważył się ją tu szczegółowo przedstawiać 50. Teraz wykorzy-stamy to, że kartezjańska domkniętość toposu pozwala związać z każdym morfizmem-rzutowaniemΠ : A×B → B dwie funkcje między zupełnymi algebrami Heytinga podobiektów produktu A×B iobiektu B - ∃B, ∀B : C(A×B,Ω)→ C(B,Ω) - takie, że dla dowolnego podobiektu c : A×B → Ω:

- ∃B(c) to najmniejszy podobiekt B taki, że c ¬ ∃B(c) ·Π,- ∀B(c) to największy podobiekt B taki, że c ¬ ∃B(c) ·Π51.

Tak naprawdę to jest tak: najpierw, wykorzystując kartezjańską domkniętość, dowodzimy istnienia obiek-tów potęgowych: dla dowolnego obiektu B w toposie C istnieje obiekt potęgowy ΩB wraz z bijekcją

C(1,ΩB) ∼= C(B,Ω)

49Co więcej: ta algebra jest zawsze zupełna tzn. każdy jej podzbiór ma kres dolny i kres górny.50O kartezjańskiej domkniętości kategorii można myśleć tak: to kategoria C , w której zbiór C(X,Y ) morfizmów

z obiektu X do obiektu Y jest „reprezentowany” - cokolwiek to oznacza - przez pewien obiekt Y X zwany obiektemwykładniczym - exponential object . W Set to oczywistość - wszak funkcje ze zbioru X do Y tworzą zbiór - obiekttej kategorii. Ale w kategorii zbiorów przeliczalnych nie na takiej reprezentacji: zbiór morfizmów - funkcji międzynieskończonymi zbiorami przeliczalnymi - nie jest przeliczalny.Przedstawienie pełnej definicji kartezjańskiej domkniętości wymaga wcześniejszego wyjaśnienia, czym jest sprzężeniefunktorów. Tego nie zrobiliśmy. Szkoda, bo sprzężenie to jedno z fundamentalnych pojęć teorii kategorii. Wielość iróżnorodność sytuacji, które można opisywać korzystając ze sprzężeń jest imponująca. Niestety, z uwagi na złożonycharakter tego pojęcia musimy ograniczyć się do gombrowiczowskiej deklaracji: odkrycie sprzężeń to jedno z najważ-niejszych osiągnięć teorii kategorii („dlaczego Słowacki wzbudza w nas zachwyt i miłość? (...) Dlatego, panowie, żeSłowacki wielkim poetą był! - Ferdydurke).

51Warto na chwilę powrócić do opisu kwantyfikacji w Set (str. 79) by dostrzec podobieństwo i uwierzyć (uznać zaprawdopodobne) że mówimy tu o czymś, co można nazwać kwantyfikacją... .

Page 218: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 217

Następnie dowodzimy istnienia morfizmów ∀B , ∃B : ΩA×B → ΩB [68]. które, w dalszej kolejności, wyko-rzystujemy do zdefiniowania opisanych tu funkcji.Pominiemy milczeniem (zniechęcające) zawiłości techniczne. Istotne jest to, że - podobnie jak w przypadkulogiki zdaniowej - logika pierwszego rzędu w dowolnym toposie jest w pełni zdeterminowana przez jegomatematyczną strukturę.

Po co nam uwewnętrznianie? Jeśli pewien obiekt jest opisany tylko w języku zewnętrznym - metajęzyku -to nie może być badana w języku przedmiotowym. W tym przypadku - w języku toposów. A to konieczne,jeżeli język i sformułowana w tym języku teoria ma być teorią podstawową, ur-teorią.Metajęzyk ur-teorii powinien być ograniczony do absolutnego i niekontrowersyjengo minimum52.

Gdy B = 1 i gdy utożsamimy produkt A × 1 z A (co nam wolno) to dla dowolnego podobiektuc : A→ Ω , ∃1(c) i ∀1(c) to wartości logiczne takie, że:

- ∃1(c) to najmniejsza wartość logiczna, taka, że c ¬ kA · ∃1(c),

- ∀1(c) to największa wartość logiczna, taka, że ∀1(c) · kA ¬ c.( kA : A→ 1 to (jedyny) morfizm z A do obiektu końcowego).

Dodajmy uwagę, która rzuca pewne dodatkowe światło na „sens” kantyfikacji w toposie.Otóż z każdą wartością logiczną q ∈ H można związać podobiekt logiczny (dowolnego obiektu A)- morfizm qA : A→ 1

q→ Ω.Dlatego badając model posadowiony na obiekcie A możemy pytać, czy semantyka pierwszorzędowejformuły φ - morfizm [[φ]] : A → Ω - „mieści się w paśmie wyznaczonym przez wartości logiczneq ¬ p” - qA ¬ [[φ]] ¬ pA .

Wartości logiczne ∀1(φ) i ∃1(φ) wyznaczają „najwęższe pasmo” w którym mieści się podobiekt[[φ]] - największy podobiekt logiczny zawarty w [[φ]] i najmniejszy go zawierający:

∀1(φ)A ¬ [[φ]] ¬ ∃1(φ)A

W Set są dwie wartości logiczne więc każdy obiekt (zbiór) A ma tylko dwa podobiekty logiczne - A i ∅ imamy tylko trzy „pasma” (∅, ∅), (∅, A), i (A,A).W mainstreamowej teorii modeli nie mówi się o „pasmach”. Ale jest pewien ślad: mówimy, że formuła φjest niespełniona w modelu posadowionym na zbiorze A jeśli [[φ]] jest w paśmie (∅, ∅), jest spełniona (alenie prawdziwa) gdy jest w paśmie (∅, A) i prawdziwa, gdy jest w paśmie (A,A)53..

W szczególności, dla dowolnego zdania φ równość [[φ]] = q w modelu posadowionego na obiekcieA oznacza, że to zdanie jest prawdziwe w podobiekcie (podmodelu) qA.

Przykład - logika toposu Set→

Klasyfikator podobiektów w kategorii Set→ to obiekt Ω = (Ω0ω→ Ω1) taki, że:

Ω1 = •1 0

Ω0

ω

OO

= •1

OO

•12

``

0

``

52(...) One can consider (a topos) as a mathematical object that satisfies the axioms of topos and draw theconnections from the axioms. (...) these axioms (...) make assertion just about „all” objects and „all”arrows” (i.e.statements in FOL) they do not involve any set-theoretic assumptions; they can just be viewed as (part of) anindependent description of C as a universe of discussion. (...) Properties of a topos (...) formulated in this way (...)are said to be ”internal”. On the other hand one can think of a topos as an object formed within set theory, as a setof objects and a set of arrows for which composition (etc.) is defined so as to satisfy the category and topos axioms.(...) Development in this style are called ”external” [68].

53Podobiekty logiczne w Set nazwano niewłaściwymi dając w ten sposób dowód ich lekceważenia... .Zauważ, że w logice intuicjonistycznej pierwszego rzędu nie jesteśmy w stanie dowieść równości ∀1(φ) = q czy też∃1(φ) = p (gdzie q, p ∈ H) z oczywistego powodu: te równości nie należą do języka tej logiki. Można jedynie poszukiwać„semantycznych” dowodów tych równości korzystając ze struktury rozważanego toposu i jego logiki.

Page 219: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 218

Produkt (A0 → A1) × (B0 → B1) konstruujemy niezależnie dla każdej z dwóch chwil54. Obiektkońcowy w Set→ to obiekt 1 = (1→ 1), gdzie 1 to zbiór jednoelementowy.Morfizmy true = (true0, true1), false = (false0, false1) : (1 → 1) → (Ω0

ω→ Ω1) opiszemykorzystając z takiego diagramu:

1true1 //

false1

**•1 0

1

OO

true0 //

false0

33•1

OO

•12

``

0

``

Logika tego toposu jest trójwartościowa. Trzecią wartością logiczną - „półprawdą” - jest mor-fizm 1

2 = ((12)0, (1

2)1) :

1( 1

2 )1 // •1 0

1

OO

( 12 )0

55•1

OO

•12

``

0

``

Algebra Heytinga wartości logicznych w tym toposie to opisana wcześniej algebra posadowionana trójelementowym zbiorze uporządkowanym 0 < 1

2 < 1.55

Podobiekty obiektu A = (A0tA→ A1) są tu kanonicznie reprezentowane przez obiekty C = (C0

tC→C1) takie, że C0 ⊆ A0, C1 ⊆ A1 i tC = tA|C

56.Ta kanoniczna reprezentacja pozwala opisać kwantyfikator uniwersalny tak: dla dowolnego po-

dobiektu C = (C0 → C1) ⊆ A×B = (A0 ×B0)→ (A1 ×B1)):

∀B = (b ∈ B0 : ∀a0∈A0(b, a0) ∈ C0 ∧ ∀a1∈A1(tB(b), a1) ∈ C1 → b ∈ B1 : ∀a1∈A1(b, a1) ∈ C1)Nieco prościej to wygląda gdy C ⊆ A = A× 1 . Wówczas

∀1C =

1 C0 = A0, C1 = A112 C0 6= A0, C1 = A1,

0 otherwise

∃1C =

1 C0 6= ∅, C1 6= ∅12 C0 = ∅, C1 6= ∅0 otherwise

Wzorując się na powyższym opisie łatwo można opisać topos „zbiorów zmiennych w czasie” wktórym „zmienność” jest ciągła i opisana np. przez liczby rzeczywiste odcinka [0, 1]. Spróbuj.

12.4.1 Semantyka języka pierwszego rzędu

Mamy już wszystko co niezbędne by opisać semantykę języka pierwszego rzędu (dowolnej sygnaturyΣ) wzorując się na opisie tej semantyki w toposie zbiorów (str. 156).

54(A0 → A1)× (B0 → B1) = (A0 ×B0 → A1 ×B1).55Patrz str. 196. Wartość logiczną false reprezentuje liczba 0, półprawdę - 1

2 a true - 1.56C reprezentuje podobiekt - morfizm λC z A do Ω - który jest parą funkcji

(λ0C : A0 → 0, 1

2 , 1, λ1C : A1 → 0, 1),

gdzie λ1C to funkcja charakterystyczna podzbioru C1 ⊆ A1 , natomiast λ0

C działa tak: dla dowolnego a ∈ A0

λ0C(a) =

1 gdy a ∈ C0,12 gdy a /∈ C0 ∧ tA(a) ∈ C1

0 gdy a /∈ C0 ∧ tA(A) /∈ C1

Page 220: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 219

Zdefiniowanie w toposie „modelu posadowionego na obiekcie A” to wskazanie - dla każdego n-argumentowego symbolu relacyjnego r - podobiektu rA : An → Ω, a dla każdego m-argumentowegosymbolu operacyjnego f - morfizmu fA : Am → A.Semantykę formuł określamy rekurencyjnie:

- [[r(x1, . . . , xn)]] = rA , dla każdego symbolu relacyjnego r,

dla dowolnych formuł φ(x1, . . . , xn), ψ(x1, . . . , xn):- [[φ ∧ ψ]] = ∧· < [[φ]], [[ψ]] > 57 ,

w ten sam sposób definiujemy semantykę alternatywy, implikacji i negacji.

- [[∀xiφ(x1, . . . , xn)]] = ∀xi([[φ(x1, . . . , xn)]]) , [[∃xiφ(x1, . . . , xn)]] = ∃xi([[φ(x1, . . . , xn)]]).Semantyka termów i równości:

- semantyką termu t(x1, . . . , xn) jest (definiowany rekurencyjnie) morfizm [[t(x1, . . . , xn)]] :An → A.

- semantyką formuły otrzymanej z φ(x) przez podstawienie termu t(x1, . . . , xn) w miejsce zmien-nej wolnej x jest złożenie morfizmów [[φ]] · [[t(x1, . . . , xn)]] : An → A.

- semantyką równości jest podobiekt produktu A × A - morfizm ≈A: A × A → Ω taki, żeprostokąt:

A×A ≈A // Ω

A

<id,id>

OO

// 1

true

OO

jest pullbackiem. Dla termów t1, t2 których semantyką są morfizmy [[t1]], [[t2]] : An → A przyjmu-jemy: [[t1 = t2]] = ≈A · < [[t1]], [[t2]] >. W szczegolności [[x = x]] =≈A.

Toposy boolowskie i podwójna negacja

Może się zdarzyć, że w rozważanym toposie - tak jak w Set - podobiekty dowolnego obiektutworzą algebrę Boole’a (czyli algebrę Heytinga, w której dodatkowo obowiązuje prawo wyłączonegośrodka). To jest topos boolowski58.

Światy opisane przez toposy boolowskie są nieco bardziej podobne do Set. To banał. Ciekawszejest takie oto twierdzenie:

„Każdy topos C zawiera w sobie mniejszy topos boolowski C¬¬ ”.

Oznaczenie C¬¬ wzięło się stąd, że ten „podtopos” wyróżnimy korzystając z podwójnej negacji- morfizmu ¬ · ¬ : Ω→ Ω.Robimy to tak: podobiekt f : A→ Ω nazwiemy gęstym, gdy ¬¬f = trueA = A→ 1 true→ Ω. ObiektE należy do tego podtoposu boolowskiego gdy każdy morfizm φ : B → E, którego dziedzina jestgęstym podobiektem obiektu A, można jednoznacznie rozszerzyć do morfizmu φ : A→ E .Matrycę wartości logicznych toposu C¬¬ tworzą domknięte wartości logiczne - morfizmy w : 1→ Ωtakie, że ¬¬w = w. I to wszystko59.

Podobieństwo do omawianych wcześniej twierdzeń Glivenki i Godla jest oczywiste. Ale szczerzemówiąc, nie potrafię powiedzieć wiele ponad stwierdzenie tej „oczywistej oczywistości”60

57Str. 21658To nie znaczy, że logika toposu boolowskiego musi być dwuwartościowa! Topos Set2 (którego obiektami są pary

zbiorów a morfizmami - pary funkcji) jest boolowski, a jego matryca wartości logicznych jest czteroelementowa.59W toposie Set→ podobiekt (B0

tB→ B1) obiektu (A0tA→ A1) jest gęsty gdy B1 = A1 . Topos boolowski Set→¬¬

tworzą „zbiory niezmienne w czasie” - Aid→ A. Ten boolowski topos jest „taki sam” jak topos zbiorów (upraszczam).

60Morfizm-podwójna negacja wyznacza jedną z możliwych topologii Lawvere’go-Tirney’a (o której wspominaliśmywcześniej) a przytoczone twierdzenie to szczególny przypadek twierdzenia które mówi, że każda taka topologia Jwyznacza w toposie C mniejszy (ale niekoniecznie boolowski) topos CJ [68].

Page 221: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 220

12.5 Teoria zbiorów a teoria toposów

Jedno matematyczne uniwersum i - istniejąca niezależnie - jedna jedynie słuszna logika - to paradygmatklasycznej logiki zrealizowany w postaci matematyki teoriomnogosciowej.Teoria toposów to podważa. Matematyczne uniwersum to galaktyka lokalnych światów - toposów, którychwewnętrzna struktura jest wprawdzie podobna do struktury kategorii zbiorów ale każdy z tych światówma swą własną logikę. Powiązania między tymi światami opisują funktory61.

Aksjomaty teorii toposów są twierdzeniami w ZFC62. Ale nie odwrotnie. Definicja toposu tonie wszystko co obecne w miłej sercu teorii mnogości. Można więc pytać: jak daleko - jak blisko -od pierwowzoru - kategorii Set - jest dowolny topos?

Podstawową różnicę już znamy: logika dowolnego toposu jest intuicjonistyczna a logika Set todwuwartościowa logika klasyczna. Powiedzmy coś o innych.

Generator

Zdanie „funkcje f, g : A→ B są równe gdy dla dowolnego elementu a ∈ A, f(a) = g(a)” kategorystaodczyta jako stwierdzenie, że zbiór jednoelementowy - obiekt końcowy - jest generatorem w Set63.Nie w każdym toposie obiekt końcowy jest generatorem. Gdy tak jest, to mówimy - po angielsku- że ten topos jest well-pointed64. W toposie, który jest „well-pointed” o równości równoległychmorfizmów f, g : A→ B decydujemy badając równości fa = ga dla dowolnego morfizmu-elementua : 1→ A. Tak jak w kategorii zbiorów65.

Dlaczego nie włączono warunku by obiekt końcowy był generatorem do definicji toposu? Dlatego, logikatakiego toposu musi być logiką klasyczną! [68]. A tego nie chcemy.To jeszcze jeden przykład, że matematyczna struktura toposu determinuje jego logikę ... .

To, że obiekt końcowy nie musi być generatorem w toposie zmusza do rewizji wyobrażenia, cowłaściwie opisuje język pierwszego rzędu. W „teoriomnogościowej” narracji formuła φ(x1, . . . , xn)jest opisem pewnej własności n-elementowych ciągów elementów zbioru A (na którym jest posa-dowiony aktualnie rozważany model). Semantyka formuły φ jest pojęciem wtórnym: to podzbiórproduktu An złożony z n-elementowych ciągów (a1, . . . , an) które mają własność opisaną przez φ.

Tymczasem definiując semantykę języka pierwszego rzędu w toposie przyjęliśmy, że to seman-tyka formuły (atomowej) jest pojęciem pierwotnym. Jednak nadal można rozumieć formułę jakoopis własności. Ale już nie elementów, tylko ... morfizmów:

Morfizm f : U → An ma własność opisaną przez formułę φ(x1, . . . , xn) której semantyką jestpodobiekt [[φ]] : An → Ω dokładnie wtedy, gdy [[φ]] · f = trueU : U → 1 true→ Ω

Pomińmy szczegóły66. Zauważmy tylko, że w „well-pointed” toposie morfizm f : U → An mawłasność opisaną przez formułę φ dokładnie wtedy, gdy ma ją każdy morfizm postaci f · u : 1→ Ωgdzie u : 1→ U to dowolny element U .

Tylko w „well-pointed” toposach „prawda” jest sumą „punktowych prawd”: dla dowolnego f : U → Ω

f = trueU wtw fa = true dla dowolnego a : 1→ U

61Szkoda, że o tych funktorach - w szczególności o funktorach logicznych i geometrycznych - nic dotąd nie powie-dzieliśmy. Może to się kiedyś uda naprawić...

62Co zazwyczaj zastępujemy stwierdzeniem „kategoria Set jest toposem” przemilczając, że istnienie tej kategorii- modelu ZFC - wcale nie jest oczywiste. To zdanie trzeba czytać tak, jak chcą nominaliści: po zastąpieniu pojęć„obiekt” i „morfizm” przez teoriomnogościowe „zbiór” i „funkcja”, aksjomaty teorii toposów są dowodliwe w ZFC.

63Obiekt G jest generatorem jeżeli dowolne dwa równoległe morfizmy f, g : A → B są równe, jeśli tylko dladowolnego morfizmu a : G→ A, fa = ga”.

64W polskim (niezręcznym) tłumaczeniu - „dobrze upunktowiony”. To określenie stanie się zrozumiałe jeśli umó-wimy się nazywać morfizmy z obiektu końcowego 1 do obiektu A elementami (obiektu A).

65Żądanie, by obiekt końcowy był generatorem jest, w pewnym sensie, „bliskie” aksjomatowi ekstensjonalności. Aleto nie oznacza, że obiekty są równe, gdy mają te same elementy: przeciwnie - różne obiekty nie mogą mieć wspólnychelementów!

66Zainteresowani szczegółową analizą tej definicji znajdą ją w [68].

Page 222: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 221

Wyróżnia się też toposy, w których istnieje zbiór generatorów - „rodzina obiektów (Gi : i ∈ I)taka, że dowolne morfizmy równoległe f, g : A→ B są równe, gdy fa = ga dla dowolnego morfizmupostaci a : Gi → A”.Taki zbiór generatorów istnieje w każdym toposie snopów - są to podsnopy obiektu końcowego67

Gdy dodatkowo zażądamy, by taki topos miał wszelkie kogranice, to otrzymamy nową charak-teryzację wspomnianych wcześniej toposów Grothendiecka68.

Aksjomat wyboru

Kategoryjne sformułowanie tego aksjomatu może wyglądać tak: kategoria C spełnia aksjomat wy-boru jeśli dla każdego epimorfizmu e : A → B istnieje morfizm f : B → A taki, że e · f = idB.Powód niewłączenia aksjomatu wyboru do definicji toposu jest taki sam, jak przed chwilą: logikatoposu z pewnikiem wyboru musi być logiką klasyczną69. To kolejne potwierdzenie, że strukturamatematyczna toposu determinuje jego logikę... .

Aksjomat nieskończoności - obiekt liczb naturalnych

Nie musimy akceptować nieskończoności w każdym toposie. Ale możemy:

Obiekt liczb naturalnych - NNO - w toposie C to obiekt N wraz z morfizmami 0 : 1 → N

, s : N → N , takimi, że dla dowolnego diagramu postaci 1 a→ Ah→ A istnieje dokładnie jeden

morfizm φ(h,a) : N → A taki, że diagram

1a

&&

0 // Nsucc //

φ(h,a)

N

φ(h,a)

Ah // A

jest przemienny.

NNO w Set to oczywiście (definiowany teoriomnogościowo) zbiór liczb naturalnych. W toposiezbiorów skończonych takiego obiektu nie ma70.

NNO jest obiektem nieskończonym. By to stwierdzenie miało sens, trzeba wyjaśnić, jak rozu-miemy „skończoność” w toposie:

obiekt A jest skończony, jeżeli każdy monomorfizm m : A → A jest izomorfizmem. Obiekt jestnieskończony gdy nie jest skończony.

NNO jest nieskończony - morfizm succ : N → N jest monomorfizmem ale nie izomorfizmem.

W toposach presnopów obiekt liczb naturalnych to (odpowiednio liczna) rodzina kopii zbioruliczb naturalnych. Banał.W toposie snopów na przestrzeni (A, T ) jest ciekawiej: snop-obiekt liczb naturalnych to rodzina(NSh(U) : U ∈ T ), gdzie NSh(U) to zbiór lokalnie stałych funkcji z U do N co oznacza, że jeślif(x) = n, to f(y) = n dla wszystkich punktów y z pewnego otwartego otoczenia punktu x ∈ U .

Definicja NNO nawiązuje w oczywisty sposób do postrzegania liczb naturalnych jako ockha-mowskiego wzorca rekurencji. Skoro w toposach możemy interpretować pierwszorzędowe teorie, to

67Obiekt końcowy w toposie snopów na przestrzeni topologicznej (A, T ) to rodzina (1(U) : U ∈ T ) zbiorówjednoelementowych. Jego podsnopy są wyznaczone przez podzbiory otwarte: zbiór otwarty V wyznacza podsnop1V ¬ 1 taki, że zbiór 1V (U) jest jednoelementowy gdy U ⊂ V i pusty w pozostałych przypadkach.

68„Grothendieck topos is a topos that is neither too small nor too large, in that it is cocomplete (not too small),and has a small generating set (not too large)” - (internet)Zapewne dlatego toposy presnopów i snopów zajmuja centralne miejsce w teorii toposów

69To jest opisane wcześniej twierdzenie Diaconescu „w wersji kategoryjnej”. Dodajmy, że to samo twierdzenieudowodniono ponownie kilka lat poźniej (Goodman-Myhill). A wcześniej jako ćwiczenie(!) zamieścił w monografiiFoundations of constructive analysis E. Bishop...

70Aby zgodnie z definicją NNO zdefiniować dodawanie liczb naturalnych - funkcję + : N × N → N wystarczyskorzystać z kartezjańskiej domkniętości i wskazać funkcję + : N→ NN. Zrobimy to korzystając z funkcji i : 1→ NNoraz succN : N : NN → NN określonych wzorami: i(1) = idN oraz succN(f)(n) = f(succ(n)).

Page 223: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 222

zapytajmy - czy NNO to model arytmetyki Peano? Odpowiedź jest pozytywna, ale ... wystarczypopatrzeć na konkretny topos by dostrzec niebanalne subtelności. Przywołajmy ponownie toposSet2 w którym obiektami są pary zbiorów, morfizmami - pary funkcji a algebra wartości logicznychto czteroelementowa algebra Boole’a 0, 1 × 0, 1. Algebra podzbiorów obiektu (A,B) to para(2A, 2B) z operacjami logicznymi działającymi „po współrzędnych”.NNO w tym toposie para (N,N), „zero” to para (0, 0)71 Operacja następnika (podobnie jak doda-wanie i mnożenie) działa „po współrzędnych” succ(n,m) = (n+ 1,m+ 1)

Czy w takim NNO prawdziwy jest aksjomat Peano ∀x(x = 0∨ ∃y(x = succ(y)) ? Na pierwszyrzut oka wydaje się, że nie - wystarczy popatrzeć na element (0, 1) ∈ (N,N). No to policzmy.

[[x = succ(y)]] = ((n, succ(n)) : n ∈ N, (m, succ(m)) : m ∈ N , [[x = 0]] = (0, 0).Kwantyfikatory też działają „po współrzędnych” co oznacza, że:

[[∃yx = succ(y)]] = ((n ∈ N : n ­ 1, m ∈ N : m ­ 1)Tak więc semantyką alternatywy (x = 0)∨ (∃y(x = succ(y)) jest cały obiekt (N,N). A to oznacza,że wartością logiczną zdania [[∀x(x = 0) ∨ (∃y(x = succ(y)) jest true!72.

Można to wytłumaczyć przywołując trzy proste fakty:- w toposie podstawowe jest „spełnianie formuły przez podobiekt” a nie jej spełnianie przez element,- element (0, 1) traktowany jako poodobiekt to para (0, 1) - suma podobiektów (0, ∅) i (∅, 1),- w dowolnym toposie „podobiekt β ma własność opisaną przez alternatywę φ∨ψ wtedy, gdy β = β1∨β2i β1 ma własność φ a β2 ma własność ψ.

W toposie z NNO mamy też obiekty liczb całkowitych, wymiernych i rzeczywistych.

Dlaczego mamy nazwać pewien obiekt w toposie obiektem liczb całkowitych (wymiernych)? Te obiekty torezultaty konstrukcji, które prowadzimy według schematu odwzorowującego budowę tych zbiorówPunk-tem wyjścia dla tych konstrukcji jest obiekt liczb naturalnych.Konstrukcje obiektów liczb całkowitych i naturalnych są proste: wykorzystujemy tu tylko pewne skończonegranice i kogranice istniejące w każdym toposie.Konstrukcja obiektu liczb rzeczywistych jest bardziej subtelna, bo odwołuje się do wewnętrznej logikitoposu. Formalną definicję tego zbioru zapisaną w języku teorii mnogości można - po pewnej modyfikacji- interpretować w każdym toposie z NNO73. A potem, dla aktualnie rozważanego toposu, wystarczyudowodnić istnienie obiektu spełniającego warunki tej definicji ... . Zero transcedencji...

W toposie snopów obiekt liczb całkowitych (wymiernych) jest opisany podobnie jak NNO - tosnop lokalnie stałych funkcji, których kodziedziną jest zbiór liczb całkowitych (wymiernych).

Ból głowy grozi dopiero wtedy, gdy musimy przyjąć do wiadomości, że w każdym toposie snopów

71Morfizmy-elementy (N,N) można utożsamiać z parami liczb naturalnych.72Dorzućmy jeszcze przykład burzący teoriomnogościowe myślenie. Gdy analizowaną tu alternatywę odczytamy

„teoriomnogościowo” - „każdy element jest zerem lub następnikiem innej liczby naturalnej” to możemy sądzić, żefunkcja następnika jest epimorfizmem z (N,N) do obiektu otrzymanego z (N,N) przez wyrzucenie zera - elementu(0, 0). A to się wydaje nieprawdopodobne. Zgoda, ale .. ten problem jest po prostu źle sformułowany: po wyrzuceniuzera otrzymujemy „coś”, co nie jest obiektem w Set2!

73Ta modyfikacja polega na zapisaniu definicji Dedekinda w języku Mitchella-Benabou. Na stronie nLab poświęconejtemu językowi napisano: The Mitchell–Benabou language is a particularly simple form of the internal language ofan elementary topos. (...) This language (...), is a powerful way to describe various objects in a topos as if theywere sets. It can be viewed as making the topos into a generalized set theory (...) or a type theory, so that wecan write and prove statements in a topos, and properties of a topos, using first order intuitionistic predicate logic(https://ncatlab.org/nlab/show/Mitchell/Benabou+language) . Rzeczywiście, niesposób ignorować fakt, że prawiewszyscy obecnie pracujący matematycy są wychowani w kręgu matematyki teoriomnogościowej. Język tej teorii jest ichjęzykiem „ojczystym” a każdy inny matematyczny język jest obcy - trzeba się go mozolnie uczyć przezwyciężając przytym teoriomnogościowe nawyki. Stąd pomysł, by wewnętrzną teorię toposów opisywać nie w języku teorii kategoriiale w „podobnym” do języka teorii mnogości. Rezultaty takiego postępowania są czasem bardzo interesujące ale, jaksądzę, nie wnoszą nic istotnie nowego do dyskusji o podstawach matematyki. Dlatego nie tu tego wątku odsyłajączainteresowanych do [72] (wersja prosta) i [87] (wersja rozbudowana nazwana konstruktywną teorią zbiorów).Nie wykluczam, że się mylę. Może rzeczywiście język Cantora i Hilberta jest najlepiej dostosowany do naszegomatematycznego postrzegania świata, najbliższy naszej intuicji?

Page 224: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 223

snop-obiekt liczb rzeczywistych to ... poznany wcześniej snop funkcji ciągłych! Czy potrafisz sobiewyobrazić, czym jest np. przestrzeń metryczna w takim toposie?

Co więcej, jeśli odpowiednio dobierzemy topos z NNO, to spełnimy postulat Brouwera - wska-żemy topos z obiektem liczb rzeczywistych R takim, że wszystkie morfizmy z R do R są ciągłe!74

Teorię toposów z NNO, które są „well-pointed” i w których obowiązuje aksjomat wyboru,Lawvere nazwał Elementarną Teorią Kategorii Zbiorów - ETCS75. Można uznać, że to odmienna odZFC propozycja opisu klasycznego uniwersum, operująca innymi pojęciami pierwotnymi. Jednakteorie ZFC i ECTS nie są równoważne - ZFC jest nieco silniejsza: np. mamy w niej aksjomatsumy zbiorów, których istnienia nie można dowieść w ETCS.

Po co nam ten nowy opis klasycznego uniwersum? Choćby po to, aby czerpiąc pełnymi garściamiz teorii toposów potwierdzić dowód Cohena o niezależności (od ZFC) hipotezy continuum [68].

Teoria mnogości wydaje się „łatwa”, bo z jej pełnym sformułowaniem (i subtelnościami) spotykamy sięwtedy, gdy mamy już za sobą lata matematycznej praktyki uprawianej w języku tej teorii.Teoria toposów jest dla wszystkich nowa - nikt, jak dotąd, nie zaczyna edukacji matematycznej od teoriikategorii. Jest obcym, więc i trudnym światem. Zapewne dlatego W. Phoa komentując skomplikowanedowody twierdzeń opisujących strukturę toposów napisał: ..There is no doubt that the pioneering topostheorists (...) all drank Carling Black Label.”[87]76

12.6 Od logiki do toposów

Każdy topos ma swą wewnętrzną logikę - „matematyka poprzedza logikę”. Czy można to odwrócić?

12.6.1 Topos snopów revisited

To, co istotnie dla definicji „snopa topologicznego” to nie cała przestrzeń topologiczna (A, T ) lecztylko jej „bezpunktowa część” - rodzina zbiorów otwartych T 77 . Te zbiory tworzą zupełną algebrąHeytinga co oznacza, że każdy podzbiór H ma kres górny i dolny. Stąd już niedaleko do pomysłu,by zająć się snopami związanymi z dowolną zupełną algebrą Heytinga H.

H-snop to rodzina zbiorów F = (F (q) : q ∈ H) wraz z funkcjami fqp : F (q)→ F (p) dla dowol-nych elementów p, q ∈ H takich, że p ¬ q.Ważna konwencja notacyjna. Termin „element obiektu A” zarezerwowaliśmy dla morfizmówz obiektu końcowego do A. Dlatego - aby uniknać nieporozumień - mówiąc o jakimkolwiek snopieF , elementy sumy rozłącznej zbiorów F (q) nazywać będziemy punktami. Formalnie: punkt snopato każda para (a, q) taka, że a ∈ F (q) (ale będziemy często pisali krótko „punkt a”). Piszemy a|pzamiast fq,p(a) nazywając punkt a|p „obcięciem punktu a do p”.

Operacja obcinania punktów musi spełniać trzy warunki: dla dowolnego q ∈ H i a ∈ F (q),

- a|q = a ,- a|s = (a|p)|s jeśli tylko s ¬ p ¬ q ,- dla dowolnej zgodnej rodziny

(ai ∈ F (qi) : i ∈ I

)- czyli takiej, że ai|qi∧qj = aj|qi∧qj - istnieje

dokładnie jeden element a ∈ F (sup(qi : i ∈ I)) taki, że a|qi = ai 78.

„Elementy snopa można obcinać i - pod pewnymi warunkami - sklejać”.74Dowody tych twierdzeń są zbyt skomplikowane by próbować je choćby naszkicować w języku, którego używamy

w tym tekście. Zainteresowanych odsyłam do [68].75Nie mylić z innym wynalazkiem - punktami ECTS.76Carlig Black Label to - wg wikipedii - „ Canadian brand of lager distributed by Carling and well-known throughout

the former British Empire”.77str. 21378Stąd, w szczególności, F (⊥) jest zawsze zbiorem jednoelementowym!

Page 225: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 224

Morfizm snopów φ : F → G to rodzina funkcji (φq : F (q)→ G(q) : q ∈ H) „respektująca operacjęobcinania” - φq(a)|p = φp(a|p).

H-snopy i ich morfizmy tworzą topos. Logika - algebra H - wyznacza matematykę - topos H.

Kluczem do zrozumienia logiki tego toposa są dwie obserwacje:- podobiekty dowolnego snopa G = (G(q) : q ∈ H) są reprezentowane przez podsnopy G - snopy

F = (F (q) : q ∈ H) takie, że F (q) ⊆ G(q).- dla każdego punktu (a, q) snopa G i podsnopa F ⊆ G można wskazać największy element

qa ¬ q taki, że a|qa ∈ F (qa) 79.

Dlatego klasyfikator podobiektów w tym toposie to snop ΩH = (ΩH(q) : q ∈ H) taki, żeΩH(q) = p ∈ H : p ¬ q. Podobiekt reprezentowany przez podsnop F ⊆ G to morfizm-rodzinafunkcji (λFq : G(q)→ Ω(q)) taka, że λFq (a) = qa dla dowolnego a ∈ G(q).

Algebra wartości logicznych w toposie H-snopów to ... algebra H. Łatwo to zrozumieć śledząctaki ciąg myślowy:

- obiekt końcowy - 1 - to snop - rodzina zbiorów jednoelementowych,- podsnopy obiektu końcowego są jednoznacznie wyznaczone przez elementy algebry H:

p ∈ H 1p ⊆ 1 , gdzie zbiór 1p(q) jest niepusty dokładnie wtedy, gdy p ¬ q.- istnieje wzajemnnie jednoznaczna odpowiedniość między podobiektami obiektu końcowego i

wartościami logicznymi.

Sumę i przekrój podsnopów F,H ⊂ G definiujemy „naturalnie”80. Ciekawiej jest z implikacją:(F → H)(q) = a ∈ G(q) : dla dowolnego p ¬ q, : jeśli a|p ∈ F (p) to również a|p ∈ H(p)81

Kwantyfikacja działa tu tak: dla danego podsnopa produktu C ⊆ F ×G:82

- ∀G(C)(q) = a ∈ G(q) : dla każdego p ¬ q i d ∈ F (p), (a|p, d) ∈ C(p)- ∃G(C)(q) = a ∈ G(q) : istnieje d ∈ F (q), (a, d) ∈ C(q)

W szczególności, dla G = 1 i podsnopa C snopa F :

∀1C - największy element algebry H taki, że C(q) = G(q) jeśli tylko q ¬ ∀1C.∃1C = sup(q ∈ H : C(q) 6= ∅)

Ostatnia równość zasługuje na więcej uwagi. Rozważmy 5-elementową algebrę Heytinga ⊥ ¬ l∧r ¬l, r ¬ > (l i r są nieporównywalne) i taki snop F :

? = F (>)

tt **a, ?|l = F (l)

**

b, ?|r = F (r)

tt?|l∧r, a|l∧r, b|l∧r = F (l ∧ r)

i jego podsnop C powstały przez usunięcie punktu ? i jego obcięć83.Zbiór C(>) jest pusty. Ale ∃1C = > choć w snopie C nie istnieje żaden element globalny! Są tylkopunkty-elementy częściowe które na dodatek nie są zgodne.Ten przykład każe inaczej patrzeć na „skolemowską metodę eliminacji kwantyfikatora istnienia”która pozwala, w szczególności, wyeliminować z dowolnej teorii T zdanie-aksjomat postaci ∃φ(x) wzamian wprowadzając do języka stałą cφ, bez ryzyka utraty niesprzeczności teorii T 84. To jest aż

79Należy skleić wszystkie obcięcia punktu (a, q) należące do podsnopa F .80Jak kto woli - „lokalnie”:(F ∨H)(q) = F (q) ∨H(q).81Zauważ (kontrawariantne) podobieństwo do definicji semantyki implikacji w modelach Kripke’go (str 195).82Produkt snopów konstruujemy „lokalnie”: (F ×G)(q) = F (q)×G(q) dla każdego q ∈ H.83(Oczywiście F (⊥) = C(⊥) = ∅) bo to są snopy.84Najlepiej znany przykład to dwie wersje teorii grup.

Page 226: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 225

nadto oczywiste, gdy interesuje nas tylko teoriomnogościowa semantyka teorii pierwszego rzędu -„skoro element istnieje, to go nazwijmy”. Ale, jak widać, taka eliminacja kwantyfikatora istnieniajest nieuprawniona gdy semantykę języka definiujemy w innym toposie85.

Istnienie i równość punktów w snopach

One of the most intriguing features of topos is that itmakes sense to talk about entities that only ”partiallyexists”. One can only speculate what would have beenHeidegger’s reaction had he been told that the answer to”What is a thing?” is ”Something that partially exists”86.

Nasze doświadczenie matematyczne czerpiemy z teoriomnogościowym uniwersum. W tym świecie na py-tania „czy a jest elementem zbioru A” , „czy elementy są równe” i wreszcie „czy a istnieje” odpowiadamy„TAK” lub „NIE”. Tertium non datur.Matematyka toposów nie respektuje tego klasycznego paradygmatu. Dopuszcza „częściowe” istnienie.

W dowolnym H-snopie F można, odwołując się do algebry H, określić dwie miary:

- miarę równości punktów: gdy a ∈ F (r) i b ∈ F (s) to ich miarą równości jest największyelement q ¬ r ∧ s taki, że a|q = b|q. Tę miarę oznaczamy symbolem a ≈F b.

- miarę istnienia: EF (a) = q gdy a ∈ F (q) 87

Miara istnienia jest wtórna w stosunku do miary równości - EF (a) = a ≈F a. Miara równościspełnia dwa warunki: dla dowolnych punktów a, b:

(Eq1) a ≈F b = b ≈F a,(Eq2) a ≈F b ∧ b ≈F c ¬ a ≈F c

Miara równości można opisać wewnętrznie, jako morfizm H-snopów - ≈F : F × F → Ω. Tenmorfizm to semantyka równości w tym toposie (patrz str. 219).

To oznacza, że zdanie ∀x(x = x) jest prawdziwe w każdym toposie H-snopów dla dowolnego snopa F 88.Ale to nie znaczy, że „wartość logiczna formuły (x = x) jest równa > w każdym punkcie snopa”! Tooznacza tylko tyle, że interperacja kwantyfikatora uniwesalnego w tym toposie jest istotnie różna odinterpretacji teoriomnogościowej (którą mamy we krwi).

Miary równości pozwala też na inny opis morfizmów snopów: morfizm φ : F → G to funkcjaprzyporządkowująca punktom snopa F punkty snopa G i taka, że dla dowolnych punktów a, b snopaF :

a ≈F b ¬ φ(a) ≈G φ(b) 89

12.6.2 Topos reprezentacji snopów

Tym, którzy znają podstawy teorii przestrzeni liniowych istotę „reprezentacji snopa” przybliży przypo-mnienie czym jest baza przestrzeni liniowej:- każda przestrzeń liniowa V ma bazę. Przestrzeń może mieć wiele baz, a każda z nich może być uważanaza reprezentację tej przestrzeni z dwóch powodów:

85Warto wykorzystać tę okazję by przypomnieć, że istnieje też „konstruktywna wersja” metody Skolema: jeślizdanie arytmetyczne ∀x∃yψ(x, y) jest dowodliwe w HA to istnieje obliczalna funkcja f taka, że zdanie ψ(n, f(n))jest dowodliwe w HA.

86Topos theory in the foundations of Physics, A. Doring, C.Isham w New Structure for Phisics” (ed. B.Coecke).87Każdy H-snop ma dokładnie jeden „punkt nieistniejący” - taki, że E(a) = ⊥. „Istnieje punkt nieistniejący”... .88Tzn. [[∀x(x = x)]] = > .To stwierdzenie wynika wprost z definicji semantyki równości i kwantyfikatora uniwer-

salnego w toposie snopów.89Pierwotny opis morfizmu - rodziny φq : F (q)→ G(q) odtworzymy przyjmując φ|q(a) = φ(a)|q∧φ(a).

Page 227: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 226

- każdy wektor przestrzeni V można skonstruować z wektorów bazowch korzystając z operacji dodawaniai mnożenia przez skalary,- każde przekształcenie liniowe φ : V → W można opisać korzystając wyłącznie z wyroznionych baz wobu przestrzeniach90.

Punkty H-snopów umiemy obcinać i sklejać. Wzorując się na przykładzie przestrzeni liniowych,można przyjąć, że reprezentacją snopa F jest każdy zbiór jego punktówBF wyposażony w „obcięcie”miary równości punktów snopa F i taki że:

- każdy punkt F można skonstruować z punktów zbioru BF za pomocą obcinania i sklejania,- morfizmy snopów można opisać odwołując się do wyróżnionych w obu snopach reprezentacji.

Przykład. Rozważmy trójelementową algebrę Heytinga (⊥ < 12 < >) i snop F :

F (>) = a, b

F (1

2) = a2 = b2 , c

F (⊥) = ?

a2 i b

2 to (równe) obcięcia punktów a i b. To oznacza, że miarą równości tych pounktów jest 12

91.Reprezentacją tego snopa jest zbiór punktów B = a, b, c (wraz z miarami równości i istnienia„dziedziczonymi” z F ) gdyż jedyny odrzucony punkt jest obcięciem punktów należących do B92.

Popatrzmy na morfizm : φ : F → F taki, że φ>(a) = φ>(b) = a a φ 12

jest funkcją identyczno-ściową. Korzystając z wybranej reprezentacji możemy go opisać przyporządkowując każdej parzepunktów (a, b) ∈ B ×B pewną wartości logiczną (którą oznaczymy przez fφ(a, b)).Zaczniemy tak:

fφ(a, a) = >, fφ(a, b) = 12 , fφ(a, a2 ) = fφ(a, b2) = 1

2 , fφ(a, c) = fφ(a, ?) = ⊥Wystarczy - reguła jest widoczna: fφ(a, b) to największa wartość logiczna taka, że obcięcie b|fφ(a,b)jest mniejsze od φ>(a). Wówczas φ>(a) jest sumą - sklejeniem takich obcięć (pewnij się, że rozumiesz- dokończ opis przyporządkowania fφ).

Ten przykład, choć prosty, zdradza intencję: chcemy w sposób ścisły zdefiniować kategorię, której obiektyi morfizmy będą reprezentować H-snopy - umożliwiać alternatywny opis toposa H-snopów93.

Tą „kategorią reprezentacji H-snopów” jest kategoria H którą definiujemy tak:

- obiekty („H-obiekty”) to pary (A,≈A: A×A→ H) , gdzie A to zbiór, a funkcja ≈A spełnia - dladowolnych a, b, c ∈ A - dwa warunki:

a ≈a b ¬ b ≈ a,a ≈A b ∧ b ≈A c ¬ a ≈A c,

- morfizm z (A,≈A) do (B,≈B) to funkcja f : A × B → H taka, że dla dowolnych a, a1 ∈ A orazb, b1 ∈ B:

f(a, b) ¬ EA(a) ∧EB(b),a ≈A a1 ∧ b ≈B b1 ∧ f(a, b) ¬ f(a1, b1)f(a, b) ∧ f(a, b1) ¬ b ≈B b1EA(a) ¬ supf(a, b) : b ∈ B

90Ci którzy nie znają podstaw algebry liniowej mogą tylko żałować... .91Wierzę, że odczytanie z rysunku miar równości par punktów i miar istnienia punktów nie przysparza żadnych

trudności.92Oczywiście snop F - i każdy inny snop! - ma też reprezentację trywialną złożoną ze wszystkich punktów tego

snopa. Dlatego, być może, lepiej kojarzyć reprezentacje snopów nie z bazami, ale ze zbiorami generatorów przestrzeniliniowych. Ale przecież chodzi tylko o wywołanie pomocnych skojarzeń - precyzja porównań nie jest aż tak istotna...

93Matematycznie: chcemy zbudować kategorię większa, ale równoważną z kategorią H- snopów.

Page 228: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 227

Złożenie morfizmów f : (A,≈A)→ (B,≈B) i g : (C,≈C)→ (B,≈B) to morfizm-funkcjah : A× C → H taka, że

h(a, c) = sup(f(a, b) ∧ g(b, c) : b ∈ B).

Morfizm identycznościowy obiektu (A,≈A) to miara równości - funkcja ≈A: A×A→ H .

Ani to miłe ani eleganckie... . Ale pamiętajmy o „sensie” tej konstrukcji - ta kategoria repre-zentuje topos H-snopów94

Ta kategoria jest toposem. Co więcej, zawiera ona topos H-snopów95.

Algebra wartości logicznych w tym toposie to algebra H. Klasyfikator podobiektów to H-obiektΩH = (H,≈H) , gdzie q ≈H r to największa wartość logiczna s ∈ H taka, że q ∧ s = r ∧ s 96

Elementy algebry H pełnią tu podwójną rolę: są punktami w ΩH i jednocześnie wartościami miaryrówności punktów w ΩH . Punkt związany z q ∈ H oznaczamy przez q. To pozwala uniknąć nieporozumieńzwiązanych choćby z tym, że miarą istnienia punktu q jest ... > - wszystkie punkty w ΩH są „globalne”!Na dodatek > ≈H q = q .

12.6.3 Punkty i elementy - od H-obiektów do H-snopów

Jeżeli H-obiekty mają reprezentować H-snopy to przedstawiona definicja wydaje się niekompletna:brakuje wskazania snopa reprezentowanego przez H-obiekt A = (A,≈A). Ale to jest zbędne - tensnop można „zrekonstruować” jako snop elementów częściowych. Pokażemy jak to zrobić.

Elementy częściowe A to morfizmy postaci e : 1q → A gdzie q ∈ H, 1q = (?,≈q) oraz? ≈q ? = q. Te elementy umiemy obcinać i - pod pewnymi warunkami - sklejać:

- „obcięcie elementu e : 1q → A do r ¬ q ” to element e|r : 1r → A taki, że e|r(a) = r ∧ e(a).

- jeśli (ei : 1qi → A : i ∈ I) jest zgodną rodziną elementów - taką, że ei|qi∧qj = ej|qi∧qj to jejsklejeniem jest element A - funkcja e : A→ H opisana wzorem e(a) = sup(ei : i ∈ I).

Kluczowa dla rekonstrukcji snopa reprezentowanego przez A jest to, że: każdy punkt a ∈ Ageneruje element częściowy morfizm ea : 1E(a) → A - funkcję ea : A→ H taką, że

ea(b) = a ≈ b dla dowolnego b ∈ A 97

Jednak obcięcia punktów i ich sklejenia nie muszą być punktami:

Przykład Szostakowicza. Załóżmy, że H jest 4-elementową algebrą Boole’a - H = 0, 12. Rozpa-trzmy dwupunktowy obiekt (a, b,≈), gdzie a ≈ b = (0, 0),E(a) = (0, 1),E(b) = (1, 0). Punktya, b wyznaczają dwa różne elementy (częściowe).Jedyny element globalny tego obiektu to morfizm h taki, że h(?, a) = (0, 1), h(?, b) = (1, 0). Tenmorfizm to sklejenie punktów a i b98.

94Wyróżnienie baz przestrzeni liniowych umożliwia opis przekształceń liniowych za pomocą macierzy a ich składanieza pomocą mnożenia macierzy. Morfizm w H - funkcja f : A × B → H - to (nieskończona) macierz. Składaniemorfizmów to też „mnożenie” macierzy z tym, że - z oczywistych powodów - dodawanie i mnożenie przez skalar(wykorzystywane w mnożeniu zwykłych macierzy) zostało tu zastąpione przez operacje w zupełnej algebrze HeytingaH - koniunkcję i kres górny... .

95Dowód tego faktu jest niebanalny [45]. Dodajmy, że w literaturze przedmiotu używa się nazwy „H-zbiory”. Toniefortunne, bo skłania do myślenia o tym toposie w języku teorii mnogości. Tymczasem warunkiem zrozumienia tejkategorii jest odrzucenie teoriomnogościowych nawyków. Nazwa „kategoria H” ma też tę zaletę, że utrwala pamięć otwórcach tego lokalnego matematycznego uniwersum - A.Heytingu (pośrednio) i D.Higgsie, który tę kategorię opisał.

96q ≈H r = q ↔ r = (q → r) ∧ (r → q).Obiekt końcowy to jednopunktowy obiekt 1> = (?,≈>) w którym punkt ? jest „globalny”, tzn, ? ≈> ? = E(?) = >Morfizm true : 1> → ΩH to funkcja true : ? ×H → H taka, że true(?, q) = (> ≈H q) = q

97Elementy częściowe nazywamy tu krótko „elementami”, wyróżniając w razie potrzeby elementy globalne - te,których dziedziną jest obiekt końcowy 1>. Pojęcia „punkt” i „element” interpretujemy tu tak, jak w toposie H-snopów. Elementy (częściowe) generowane przez punkty nazywać będziemy również „punktami”.

98Skąd tu Szostakowicz? Tajemnica... .

Page 229: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 228

Elementy częściowe H-obiektu underlineA tworzą snop El(A) = (El(A),≈el) każdy taki element jestsklejeniem obcięć punktów:

e(a) = sup(ec|e(c)(a) : c ∈ A) dla dowolnego punktu a 99.

„Elementów jest więcej niż punktów”. Czy interpretując kwantyfikator egzystencjalny należy myśleć o„punktach” czy też o „elementach”? To jest pierwszy powód naszego szczególnego zainteresowanie tymtoposem100.

Zawiła definicja morfizmu jest teraz olśniewająco prosta:

Morfizm f : A→ B to przyporządkowanie punktom A elementów B:

a ∈ A ea : 1E(a) → A f · ea : 1E(a)ea→ A

f→ B

Opis morfizmu - funkcję f : A × B → H - należy interpretować tak: wartość f(a, b) ∈ H to „miarawykorzystania” punktu b w budowie elementu - obrazu punktu a .

„Obraz punktu a przez morfizm f” - element f · ea - to funkcja fa : B → H taka, że fa(b) =f(a, b). Stąd wprost wynika, że ...

„podobiekty obiektu końcowego tworzą zbiór generatorów w toposie H101

Izomorfizmy, monomorfizmy i epimorfizmy

Zacznijmy tak: H-obiekty posadowione na tym samym zbiorze można porównywać: obiekt (A,≈1)jest mniejszy od (A,≈2) gdy a ≈1 b ¬ a ≈2 b dla dowolnych punktów a, b ∈ A. Wtedy funkcjaid : A2 → H taka, że id(a, b) = E(A,≈1)(a) ∧ (a ≈2 b) jest morfizmem z (A,≈1) do (A,≈2)

W tej sytuacji można zdefiniować „obiekt pośredni” (A,≈) , gdzie a ≈ b = E(A,≈1)(a) ∧ (a ≈2

b) ∧ E(A,≈1)(b) i pokazać, że id jest złożeniem dwóch morfizmów:

(∗) (A,≈1)eid→ (A,≈)

mid→ (A,≈2)z których pierwszy - eid - jest epi- a drugi - mid - monomorfizmem.

Morfizm id opisuje wzrost miary równości punktów zbioru A. Opisany rozkład odpowiada podziałowitego procesu na dwie fazy: Zapominając na chwilę o matematycznej precyzji, odczytamy zapis (∗) tak:

- „epimorfizm eid opisuje fazę pierwszą, w której zwiększa się miara równości różnych punktów a miaraistnienia pozostaje niezmieniona”,- „monomorfizm mid opisuje fazę drugą, w której zwiększa się miara istnienia a miara równości niezwiększa się ponad to, co jest skutkiem zwiększenia miary istnienia punktów”

Tak opisane epi- i monomorfizmy są kanoniczne co oznacza, że:„Każdy morfizm f : (A,≈A) → (B,≈B) jest złożeniem trzech morfizmów - epimorfizmu kano-

nicznego, izomorfizmu i monomorfizmu kanonicznego”:

(A,≈)eid //

f

11(A,≈1)if // (B,≈2)

mid // (B,≈B)

Skoro kanoniczne epi- i monomorfizmy nie zmieniają zbiorów punktów to musi to czynić izomorfizmi : (A,≈1) → (B,≈2). To oznacza, że izomorfizm H-obiektów nie wymusza równoliczności zbiorów ichpunktów! To trochę zaskakuje. Dlaczego?Każdy model dowolnej teorii pierwszego rzędu posadowiony na obiekcie (A,≈) można skopiować naizomorficznym obiekcie (B,≈). Ta kopia musi mieć dokładnie te same własności (cechy) co oryginał.

100Miarą równości elementów e : 1q → A, f : 1r → A jest największa wartość s ∈ H taka, że s ¬ q ∧ r i e|s = f|s.W szczególności dla dowolnego elementu e i punktów a, b, e ≈el ea = e(a) oraz ea ≈el eb = a ≈ b.Warto też spróbować skonstruowac obiekt El(ΩH).

101Morfizmy f, g : A→ B, są równe gdy f(a, b) = g(a, b) dla dowolnych punktów a, b co jest równoważne stwierdze-niu, że f · ea = g · ea dla dowolnego a ∈ A.

Page 230: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 229

Np. jeśli zdanie ∀x,y(x = y) jest prawdziwe w oryginale to jest też prawdziwe w jego kopii. To zdanie- „czytane teoriomnogościowo” - mówi, że model ma jeden punkt. A przecież obiekt izomorficzny zjednopunktowym obiektem może mieć - w tym toposie! - wiele punktów...Wniosek może być tylko jeden - kwantyfikację uniwwersalną w toposie H trzeba rozumieć inaczej.I to jest drugi powód naszego szczególnego zainteresowanie tym toposem.

H- obiekty są izomorficzne dokładnie wtedy, gdy reprezentują izomorficzne snopy. Nieco mniejformalnie: izomorficzne H-obiekty mogą mieć różne zbiory punktów ale mają „takie same” snopyelementów częściowych. 102

W szczególności przyporządkowanie a ∈ A ea ∈ El(A) (które nie jest różnowartościowe ani niejest funkcją „na”) wyznacza izomorfizm ηA : A→ (El(A),≈el)103.

Popatrzmy ponownie na opisany w „przykładzie Szostakowicza” dwupunktowy obiekt (a, b,≈),gdzie a ≈ b = (0, 0),E(a) = (0, 1),E(b) = (1, 0) i jednopunktowy obiekt końcowy (1, E(1) =(1, 1)). Te obiekty są izomorficzne - oba reprezentują snop końcowy.

Jak wyróżnić H-snopy wewnątrz kategorii H? Nie można tego zrobić w języku kategorii (dlaczego)? Alemożna odwołując się do punktów: snop to H-obiekt w którym wszystkie elementy są punktami.

Podobiekty

Podobiekty A = (A,≈) są reprezentowane przez monomorfizmy kanoniczne o kodziedzinie A.A każdy taki monomorfizm można jednoznacznie opisać wskazując funkcję α : A→ H taką, że dladowolnych punktów a, b ∈ A:

- α(a) ¬ EA(a)- (a ≈ b) ∧ α(a) = (a ≈ b) ∧ α(b)

Monomorfizm kanoniczny wskazywany przez α to morfizm mα : Aα = (A,≈α) → A, gdzie a ≈αb = α(a) ∧ a ≈ b 104. Podobiekt reprezentowany przez mα : Aα → A - morfizm λα : A → ΩH - tofunkcja λα : A×H → H taka, że:

λα(a, q) = EA(a) ∧ (α(a) ≈H q)

dla dowolnych punktów a ∈ A i q ∈ ΩH 105.Morfizmy mα i λα tworzą - wraz z morfizmem true : 1> → ΩH - „prostokąt logiczny” - pullback

Aλα // Ω

OO

kα // 1>

true

OO

Funkcję α można traktować jako funkcję charakterystyczną rozważanego podobiektu - wartośćlogiczna α(a) określa jaka „część” punktu a ∈ A należy do podobiektu λα . Dla podkreślenia faktu,że taka funkcja opisuje podobiekt A będziemy pisać - trochę nieformalnie - α : A→ H.

Funkcja charakterystyczna podobiektu α : A → H to jego opis „zewnętrzny” a morfizm λα : A →ΩH to opis „wewnętrzny”106. Zewnętrzny opis jest wygodny a wewnętrzny konieczny, by wskazany H-obiekt ΩH = (H,≈H) był rzeczywiście klasyfikatorem podobiektów. Opisana tu droga „od monomorfizmukanonicznego do prostokąta logicznego” to w istocie część dowodu, że kategoria H jest toposem.

102Formalna charakteryzacja izomorfizmów w H jest prosta: morfizm f : (A,≈) → (B,≈) opisany przez funkcjęf : A×B → H - jest izomorfizmem gdy funkcja g : B ×A→ H określona wzorem g(b, a) = f(a, b) jest morfizmem z(B,≈) do (A,≈).

103Morfizm ηA opisuje funkcja η : A×El(A)→ H taka, że η(a, e) = e(a). Punkty a, b ∈ A generują ten sam elementgdy E(a) = a ≈ b = E(b). Mówimy wtedy, że są one wewnętrznie równe.Kategorysta podsumuje tę opowieść o izomorfizmach stwierdzeniem, że topos H-snopów i topos H to kategorierównoważne.

104mα(a, b) = a ≈α b dla dowolnych punktów a, b ∈ A.105Pamiętajmy o podwójnej roli jaką pełnią elementy algebry H w klasyfikatorze podobiektów ΩH !

Page 231: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 230

Korzystając z funkcji charakterystycznych możemy też łatwo opisać strukturę algebry Heytingapodobiektów - zarówno porządek jak i działania są realizowane na tych funkcjach „po współrzęd-nych”. Jest tu jednak pewna subtelność - implikacja α → β to funkcja taka, że (α → β)(a) =EA(a) ∧ (α(a) → β(a)). A to dlatego, że miara istnienia EA jest funkcją charakterystyczną naj-większego elementu algebry podobiektów A .

Przy odrobinie wysiłku można też sformułować „jawne” wzory pozwalające obliczać wartościkwantyfikatorów:

∀1(c) = inf(EA(a)→ α(a) : a ∈ A) ∃1(α) = sup(EA(a) ∧ α(a) : a ∈ A) 107

Zapiszmy też ogólne wzory opisujące kwantyfikację dla dowolnego podobiektu β : An+1 → H ipunktu a = (a1, . . . , an) ∈ An:

[[∀x(β)]](a) = inf(E(A,≈)(a)→ β(a, a) : a ∈ A)[[∃x(β)]](a) = sup([β(a, a) : a ∈ A).

Pamietajmy, że ten jest opis zewnętrzny, bo korzystamy tu z funkcji charkterystycznych podobiektów.Zastępuje możliwy, ale bardziej skomplikowany opis struktury podobiektów odwzorowujacy wprost „to-posowe” definicje operacji na podobiektach. Ale to zbędne. Reprezentacja , nawet zewnętrzna” jest poto, by z niej korzystać.

Jak odpowiedzieć na pytanie, czy α ¬ β ? Narzuca się odpowiedź „dychotomiczna” - odpowia-damy „tak”, gdy α(a) ¬ β(a) dla każdego punktu a lub „nie” - w przeciwnym wypadku. Ale to nieto: powinniśmy odpowiedzieć odwołując się do wewnętrznej logiki toposa H-zbiorów - powiedzieć,co to znaczy, że „miarą zawierania podobiektu α w podobiekcie β jest wartość logiczna q ∈ H”.W toposie zbiorów, zawieranie podzbiorów C,B ⊆ A można opisać wykorzystając ich funkcjecharakterystyczne: „C ⊆ B dokładnie wtedy, gdy λC(a) ¬ λB(a) dla każdego punktu a ∈ A”.Jeśli przypomnimy, że w dowolnej algebrze Heytinga a ¬ b dokładnie wtedy, gdy a → b = >,to nie znajdziemy nic zaskakującego w tym, że „wartość logiczna stwierdzenia α ¬ β to war-tość logiczna ∀(α → β)” . A zgodnie z definicją kwantyfikatora uniwersalnego ta wartość toinfa((EA(a) ∧ α(a))→ β(a)) = infa(α(a)→ β(a)).

Zróbmy kolejny krok: teoriomnogościowa równoważność - (A ⊂ B∧B ⊂ A)↔ (A = B) - możnainterpretowac jako (dychotomiczną) mierę równosci podzbiorów. Nic więc zaskakujacego w tym, żew toposie H miara równości podobiektów: α ≈sub β = infa(α(a)↔ β(a)).

To nie tylko ciekawostka: w ten sposób opisaliśmy obiekt potęgowy ΩAH którego istnienie jest wymaganejako konsekwencja kartezjańskiej domkniętości toposa108.

To ważne bo np. nieformalne stwierdzenie - α ¬ β staje się skrótem ble ble - nie wiem, jaknapisać o „elementach logiki wy zszego rzedu w toposie.

I wreszcie ostatnia konstrukcja: każdy element obiektu A wyznacza jego („jednoelementowy”)podobiekt. Prościej: jest jego podobiektem. Jeżeli opisaną miarę równości podobiektów ≈sub ogra-niczymy do podzbioru elementów, to otrzymamy obiekt Ae wraz z morfizmem s : A → Ae któryma szczególną własność: dla dowolnego morfizmu f : B → A i monomorfizmu m : B → C istniejedokładnie jeden morfizm f : C → Ae taki, że prostokąt

106Opis zewnętrzny generuje wewnętrzny i vice versa: funkcję charakterystyczną podobiektu λ : A → ΩH - funkcjęαλ : A → H opisuje wzór αλ(a) = λ(a, (>)) . Jeśli ktoś zechce sparawdzić, że opisany tu „prostokąt logiczny” jestpullbackiem to ostrzegam: to nie jest banalne zadanie . Podpowiem, że kluczową rolę w tych rachunkach gra równośćq ∧ (q ≈H p) = p ∧ (q ≈H p) = q ∧ p prawdziwa dla dowolnych p, q ∈ H.

107Algebra H jest zupełna, opisując kwantyfikację można korzystać z kresów dolnych i górnych.108Zauważalne podobieństwo między opisem klasyfikatora podobiektów ΩH a opisem obiektów potęgowych nie jest

przypadkowe: klasyfikator to obiekt potęgowy Ω1>H .

Page 232: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 231

Cf // Ae

B

m

OO

f // A

s

OO

jest pullbackiem. Obiekt Ae wraz z morfizmem s : A → Ae nazywam klasyfikatorem morfizmówczęściowych (dla A). 109

12.6.4 Semantyka języka pierwszego rzędu

Funkcje charakterystyczne ułatwiają opis modeli języka pierwszego rzędu w toposie H. Aby opisaćmodel posadowiony na obiekcie A wystarczy każdej formule atomowej φ(x1, . . . , xn) przyporząd-kować pewną funkcję funkcję charakterystyczną - [φ] : An → H110. Semantykę formuł złożonychobliczymy wówczas korzystając z bardzo prostych reguł111

Przykłady funkcji charakterystycznych. Niech FR oznacza snop wszystkich funkcji rzeczywi-stych określonych na zbiorach otwartych przestrzeni liczb rzeczywistych (R, T )112 Podsnop funkcjiciągłych opisuje funkcja która każdemu elementowi FR - funkcji f : U → R ∈ FR(U) przypo-rządkowuje największy otwarty podzbioru V ⊆ U taki, że obcięcie f|V : V → R jest funkcjąciągłą. Podobnie - za pomocą funkcji charakterystycznych - można opisać podsnop funkcji różnicz-kowalnych czy też takich, które „nie zmieniaja się zbyt gwałtownie”113. Można wyróżnić podsnoprózniczkowalnych funkcji niemalejacych (rosnących) ale już nie funkcji monotonicznych. A w snopieFR × FR można tak wyróżnić np. podsnop par funkcji (f, g) takich, że f(a) ¬ g(a) dla każdegopunktu ich dziedziny.

Wszystkie opisane wyżej podsnopy mogą być wskazane jako semantyka unarnych (lub binar-nych) symboli relacyjnych (przy konstrukcji modelu posadowionego na tym snopie).

W szczególności, dla dowolnego punktu (a1, . . . , an) ∈ An wartość [φ](a1, . . . , an) ∈ H to „miaraposiadania przez punkt (a1, . . . , an) ∈ An własności opisanej przez formułę φ(x1, . . . , xn)”. Punktma tę własność gdy tą miarą jest wartość E(a1)∧. . .∧E(an). Klasyczna dychotomia „punkt ma danąwłasność lub jej nie ma” jest tu zastąpiona przez coś bliższego rzeczywistości - „miarę posiadaniawłasności przez punkty”.

Nie musimy ograniczać się do punktów. Element e : 1q → An ma własność opisaną przez formułę φdokładnie wtedy, gdy jest sklejeniem (sumą) obcięć punktów, dla których „suma miar posiadnia własnościopisanej przez φ” jest równa q.Własności opisywane w języku pierwszego rzędu mają „lokalny” charakter (str.214).

Można wybrać inną metodę opisu modeli: skoro każdy H- obiekt jst izomorficzny z H-snopem,to wystarczy rozważać modele posadowione na snopach114. To nęcące, bo każdy model posadowionyna snopie można opisać jako snop modeli rozważanego języka - rodzinę teoriomnogościowych modeli

109W [87] znajdziemy kategoryjny („teoriotoposowy”) dowód istnienia klasyfikatorów obiektów częściowych w do-wolnym toposie i dla dowolnego obiektu . Ten kategoryjny dowód jest naprawdę krótki. I prosty, jeśli tylko języktoposów uznamy za „naturalny”. Ale dla większości matematyków, jest on napisany w „obcym” języku, jest małointuicyjny. Czy w wyobrazalnej przyszlości porzucimy ten punkt widzenia na matematykę? Szczerze mówiąc, wątpię....

110Oczywiście poza formułami - równościami które nmaja „kanoniczą” senatyke.111Ta prostota staje się wątpliwa gdy w sygnaturze rozważanego języka są symbole operacyjne. Np. gdy w języku

funkcjonuje unarny symbol relacyjny r i unarny symbol operacyjny p, to semantyka formuły atomowej r(p(x)) zależyod semantyki formuły r(x) i semantyki termu p(x). Ale można sobie z tym poradzić: jeśli [r(x)] : A→ H a semantykątermu p(x) jest morfizm [t] : A → A to semantykę formuły r(p(x)) - funkcję charakterystyczną [r(p(x))] : A → H -opisujemy wzorem: [r(p(x))(a) = supa∈A[t(x)](a, c) ∧ [r(x)](c). Nie jest to już tak banalnie proste, ale jest.

112Bazą zbiorów otwartych w tej przestrzeni są otwarte odcinki o koncach wymiernych.113Czyli podsnop funkcji Lipschitza z ustaloną stałą - takich funkcji, że dla dowolnych argumentów a, b, |f(a)−f(b)| ¬C · |a− b| - C to własnie owa stała.

114Nic w ten sposób nie tracimy, bo kategoria wszystkich modeli i tych „posadowionych na snopach”, są kategoriamirównoważnymi - mają te same „kategoryjne” własności.

Page 233: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 232

(F (q) : q ∈ H) taką, że funkcje-obcięcia a ∈ F (q) a|p ∈ F (p) „respektują operacje i relacje”115

Taki opis jest dla teoriomnogościowo myślących matematyków zdecydowanie bardziej przyjazny.Dlatego w literaturze spotkamy snopy grup i snopy pierścieni a raczej rzadko (nigdy) używa sięsformułowania „model teorii grup (pierścieni) w toposie snopów”. Tego pragmatycznego aspektu -„przyjazności” języka opisu - nie można lekceważyć.

Możemy tak potraktować modele języka i modele pewnych teorii w toposie H. Ale czy takmożna opisywać modele dowolnych teorii pierwszego rzędu?Odpowiem uczciwie - nie wiem, ale watpię. Znam tylko taki wynik: jeśli teoria T jest teorią alge-braiczną (czyli w jej języku nie ma symboli relacyjnych) a wszelkie aksjomaty tej teorii są quasi-równościami tzn. zdaniami uniwersalnymi postaci

∀x1,...,xn (p1 = t1 ∧ . . . ∧ pk = tk)→ (p = k)

(wszystkie zmienne w termach p1, . . . , pk, t1, . . . , tk, p, t są w zbiorze x1, . . . , xn) to kategoria modelitej teorii toposie H jest równoważna z kategorią „snopów teorii T . Wówczas modele tej teorii wtoposie H-obiektów można równoważnie opisać jako H-snopy (teoriomnogościowych) modeli tejteorii116.

Zbiory bogate, rozmyte i presnopy

Elementy H-obiektu konstruujemy z jego punktów poprzez ich obcinanie i sklejanie. Nic więcdziwnego w wyróżnieniu dwóch klas tych obiektów: takich, w których każdy element jest sklejeniemzgodniej rodziny punktów i takich, w których każdy element jest obcięciem punktu. Pierwsza klasato znane nam już H-presnopy117. Druga klasy to bogate H-obiekty118:

każdy morfizm do bogatego H-obiektu - f : (C,≈C) → (A,≈A) - jest jednoznacznie opisanyprzez funkcję f0 : C → A taką, że c ≈C c1 ¬ f0(c) ≈A f0(c1).Funkcję f0 nazwiemy reprezentacją morfizmu f [45] 119

Każdy obiekt potegowy - i w szczególności klasyfikator podobiektów! - jest bogatymH-obiektem.To tłumaczy dlaczego podobiekty w tym toposie są reprezentowane przez funkcje charakterystyczne.

H- snopy to bogate H-presnopy...Wyróżnijmy kolejną klasę: H-zbiór rozmyty to H-obiekt (A,≈) w którym miara równości jest

zredukowana do miary istnienia - a ≈ b = ⊥ jeśli tylko a 6= b . Te zbiory opisujemy prościej, jakopary (A,EA : A→ H) nie nakładając na funkcję EA żadnych ograniczeń.

Ta definicja jest „prawie” tożsama z tą, która jako pierwszy zaproponował L.A.Zadeh120. „Pra-wie”, gdyż we wczesnych pracach o zbiorach rozmytych nie mówi się wiele (wcale) o ich morfizmach.Tutaj to zrobiliśmy lokując H-zbiory rozmyte wewnątrz toposa H121.

115Naukowo: każda funkcja-obcięcie f(q) f(p) jest homomorfizmami modeli. Mniejsza o szczegóły.116Ten, nie tak znowu trudny wynik, można znaleźć w pracy „Algebra in Grothendieck topos: injectivity in quasi-

equational classes”, M.M.Ebrahimi, JPPA 26(1982),269-283).117Uwaga: morfizmy H-presnopów definiowane tak, jak morfizmy snopów a morfizmy między presnopami w kategoriiH to nie to samo: w drugim przypadku jest ich więcej.

118Ample objects w [45]. Lepsze tłumaczenie nie przychodzi mi do głowy.119f(c, a) = EC(c)∧(f(a) ≈A a) . Podpowiedź: element-obraz punktu c poprzez morfizm f to obcięcie punktu f0(a).

Stąd też wynika, że morfizm może mieć wiele reprezentacji. Funkcje f0, g0 : C → A reprezentują ten sam morfizm, gdydla dowolnego punktu c ∈ C. EC(c) ¬ f0(c) ≈A g0(c). Wielość reprezentacji morfizmu nie jest istotną komplikacją.Morfizmy (między dowolnymi H-obiektami) które maja taką reprezentację nazywamy morfizmami prostymi.

120L.A. Zadeh (1965) „Fuzzy sets”. Information and Control 8 (3) 338–353.121Nie znam na tyle teorii zbiorów rozmytych by kategorycznie twierdzić, że wcześniej „zapomniano” o morfizmach.

Ale dopiero w 2004 roku w pracy ”Categories of fuzzy sets”, C.L. Walker, Soft Computinng February 2004, Volume8, Issue 4, pp 299–304 próbowano zdefiniować morfizmy H-zbiorów rozmytych. A w pracy On a new category of fuzzysets, A.R. Porselvi Agnes, D. Sivaraj, T. Tamizh Chelvam, Journal of Advanced Research in Pure Mathematics Vol.2, Issue. 4, 2010, pp. 73-83 morfizmy zbiorów rozmytych definiowano nieco inaczej. Także w obszernej monografiiFuzzy Sets, Fuzzy Logic, Fuzzy Methods with Applications, H. Bandemer, S. Gottwald (dostępna w internecie) trudnoznaleźć definicję morfizmu zbiorów rozmytych.

Page 234: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 233

Bliższe różnym definicjom morfizmów H-zbiorów spotykanych w literaturze są morfizmy pro-ste122 Ale nie każdy morfizm między H-zbiorami rozmytymi w toposie H jest prosty- H-zbiór niemusi byc bogaty!. Np. rozpatrywany w przykładzie Szostakowicza (str. 227) dwupunktowy obiekt(a, b,≈),to 0, 12-zbiór rozmyty (który nie jest bogaty). Morfizm prosty z tego obiektu do jed-

noelementowego zbioru rozmytego (?, E(?) = >) jest izomorfizmem w toposie 0, 12 ale nie jestizomorfizmem w kategorii 0, 12-zbiorów rozmytych.

Topos H jest oszczędnym rozszerzeniem kategorii rozmytych H-zbiorów w tym sensie, że „każdyH-obiekt jest epimorficznym obrazem pewnego rozmytego H-zbioru123

Ostatnia w kolejce wyróżnianych podkategorii to ... kategoria zbiorów, która jest w oczywistysposób zanurzalna w kategorię H-zbiorów rozmytych.

Snopy, presnopy, obiekty bogate, zbiory rozmyte czy wreszcie „zwykłe” zbiory... . Wszystko to pokazuje, żetopos H nie jest peryferyjną ciekawostką ale obszernym światem łączacym wiele znanym ale postrzeganychosobno światów. A takich toposów jest tyle, ile zupełnych algebr Heytinga... .

Zwolennik matematyki mainstreamowej uzna zapewne rozważanie toposa H za zbędną kompli-kację, bo przecież jest on równoważny z powszechnie znanym i „eleganckim” toposem H- snopów.Nie zgadzam się. W toposie H-obiektów operujemy innym jezykiem, odwołującym się do miar rów-ności i istnienia. Opis tego samego świata w„nowym” języku nie jest wadą ale zaletą. Z ręką nasercu: czy w toposie H- snopów równie łatwo wyróżnimy opisane przed chwilą podklasy (podkate-gorie)?Topos H to świat obiektów, w których nie wszystkie możliwe „potencjalne punkty” - elementyobiektów - zostały rozpoznane i ujawnione. W takim toposie możemy opisywać stany procesu do-chodzenia do „pełnej wiedzy” reprezentowanej przez H-snopy.

Eksponowanie miary istnienia w toposach H-obiektów jest też ważkim przyczynkiem do dyskusji o tym,czym jest - czym może być - podstawowy obiekt matematyczny.Świat matematyczny wyznaczony przez topos H kręci się wokół algebry Heytinga H: obiekty, morfizmy,podobiekty, elementy to funkcje o kodziedzinie H Kategoryjne operacje na morfizmach (elementach ipodobiektach) są opisywane również jako funkcje o kodziedzinie H.Na dodatek „funkcję” nie trzeba (nie należy) rozumieć tu tak ściśle jak chce tego teoria mnogości. Choćbydlatego, że dorzucając do H-obiektu (A,≈) ,dowolnie wiele „punktów miary zero” otrzymamy obiektizomorficzny z (A,≈).

Jest wreszcie i taka korzyść z rozważania toposa H-zbiorów: zrozumienie jego niebanalnej defi-nicji pomoże w zmaganiach z toposem Hylanda które nas czekają w kolejnym rozdziale.

Uwagi na koniec rozdziału

Toposów jest wiele: kazdą pierwszorzędową teorię T można interpretować w każdym z nich. Okazujesię, że:

for every geometric theory T , there exists a topos B(T ) (called the classifying topos of T )containing a model GT of T which is generic in the sense that, for any Grothendieck topos F , thefunctor Top(F , B(T )) → T -Mod(F), which sends a geometric morphism f : F → B(T ) to theT -model f∗(GT ), is an equivalence of categories.Conversely, for every Grothendieck topos F , there exists a geometric theory T such that B(T ) ∼= F .124

122Zauważ, że morfizm prosty z (A,EA) do (B,EB) reprezentuje funkcja f : A → B taką, że EA(a) ¬ EB(f(a))dla każdego a ∈ A.

123Funkcja ≈: A×A→ H jest epimorfizmem z rozmytego H-zbioru (A,E(A,≈)) do (A,≈). Dla zaawansowanych: tojest kokwalizator pary prostych morfizmów między (A×A,E) i (A,E(A,≈)) gdzie E(a, b) = (a ≈ b).

124Classifying toposes for first-order theories C.Bud, P.Johnstone.

Page 235: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 12. KATEGORIE, FUNKTORY I TOPOSY 234

Wiele tu niewyjaśnionych terminów ale sens jest jasny: logika i toposy są związane bardziej, niżmoże się zdawać „na pierwszy rzut oka”.

Uwaga druga: nie jest tak, że o związkach logiki z matematyką można mówić tylko w przypadkukategorii, które są toposami. W kategoriach o uboższej strukturze można interpretować słabszelogiki, czyli pewne fragmenty pełnej logiki intuicjonistycznej pierwszego rzędu. Zainteresowanymproponuję wizytę na stronie internetowej

https://ncatlab.org/nlab/show/geometric+theory/logical definition .

Page 236: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Rozdział 13

Topos Hylanda

The pleasing feature of the effective topos is that in it, ideas abouteffectivity in mathematics seem to have their natural home.

J.M.E.Hyland [48]

Topos Hylanda1 to rozwinięcie idei realizowalności Kleene’ego. Tak zazwyczaj się pisze nietłumacząc, „co autor miał na myśli”. Spróbujemy to wyjaśnić, wykraczając poza prostą prezentacjędefinicji (czyli przepisanie ich z oryginalnych prac).

Naszą opowieść rozpoczniemy tak:

„Rzeczy” (wielkości, fakty, jedności) to obiekty uniwersum. Stają się dostępne, gdy są opisane, nazwane,czyli „zakodowane jako słowo”. Te opisy to realizacje rzeczy2.

Nie trzeba jednak zakładać, że pojedynczy opis rzeczy jednoznacznie ją identyfikuje - rzeczmoże być opisana, zrealizowana na wiele sposobów3.O uniwersum rzeczy myślimy jako o kategorii: interesują nas nie tylko rzeczy, ale i związki międzynimi - morfizmy. Chcemy je realizować wykorzystując słowne opisy - morfizm ma być realizowanyjako przekształcenie opisów jednej rzeczy w opisy drugiej.Jeśli dodatkowo zażądamy, by nasz model był „konstruktywny”, to powinniśmy wykorzystać...maszyny Turinga (które przecież przekształcają słowa w słowa). A skoro maszyny Turinga teżumiemy opisywać4 to i one mogą być postrzegane jako opisy „rzeczy” - funkcji obliczalnych.

Rzeczy grupujemy - arbitralnie(?) - w kolekcje - typy5. Wyróżnikiem (spoiwem) typu jest funk-cja, która każdej rzeczy z rozważanej kolekcji przypisuje jej opisy.

13.0.5 Kategoria zbiorów efektywnych

Formalizacją idei „badania rzeczy i związków między nimi za pośrednictwem ich opisów” jest kate-goria efektywnie reprezentowanych zbiorów - ESet 6 . W opisie tej kategorii zamiast słów-opisów

1J. Hyland, angielski matematyk, zdefiniował ten specjalny topos w 1982 roku. Oczywiście nie nazywał go „to-posem Hylanda”. Używał nazwy „effective topos”. Słowo „effective” można tłumaczyć bądź jako „rzeczywisty” lub„skuteczny”. Na stronie Dictionary.com znajdujemy takie objaśnienie znaczenia tego przymiotnika: adequate to ac-complish a purpose; producing the intended or expected result lub actually in operation or in force; functioningPrzyznam, że nie znam powszechnie akceptowanego polskiego odpowiednika tej nazwy. Dlatego pozwoliłem sobie naunik i użycie określenia topos Hylanda. Nasz opis tego toposu opiera się głównie na [48], [87] i [131].

2Z tą ideą zetknęliśmy się już mówiąc o λ-rachunku. Pokazaliśmy, jak korzystając z λ-termów opisać (kodować)„typ boolowski” - czyli wielkości boolowskie true, false wraz z operacjami logicznymi. Pokazaliśmy jak kodowaćliczby naturalne i funkcje obliczalne.

3Jeśli np. „rzeczą” jest funkcja obliczalna, to może ona być realizowana przez różne maszyny Turinga.4Opisem maszyny Turinga jest lista jej instrukcji.5Unikamy terminu „zbiór” by nie wpaść w pułapkę „myślenia teoriomnogościowego”. Jeśli kogoś - znawcę teorii

typów - razi użycie w tym kontekście terminu „typ” to bardzo przepraszam.6Effective sets. „Effective” - efektywny, rzeczywisty, skuteczny itp. . Jak się zdaje żaden z tych polskich terminów

nie oddaje istoty rzeczy.

235

Page 237: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 13. TOPOS HYLANDA 236

mamy liczby naturalne, zamiast maszyn Turinga - funkcje obliczalne. Zamiast Turinga jest Kleene.

Notacja: symbolem P(N) oznaczamy tu zbiór wszystkich podzbiorów liczb naturalnych a P(N)A -zbiór wszystkich funkcji ze zbioru A do P(N).

Obiekty kategorii ESet to „typy” - pary (A,EA) gdzie EA : A→ P(N) to funkcja taka, że

EA(a) ∩ EA(b) = ∅jeśli tylko a 6= b7. W zbiorze A wyróżniamy podzbiór AE złożony z punktów opisanych - takich, żeEA(a) 6= ∅.

Morfizm z (A,EA) do (B,EB) to funkcja f : AE → BE dla której można wskazać (częściową)funkcję obliczalną φ : N→ N taka, że φ(EA(a)) ⊆ EB(f(a)) dla dowolnego a ∈ AE

Mówimy wtedy, że morfizm f jest instancją φ i że φ realizuje f .

Darujmy sobie rutynową analizę struktury tej kategorii i skupmy się tym, co ją wyróżnia8.

Polimorfizmy

Morfizm f : (A,EA)→ (B,EB) może być realizowany przez wiele funkcji obliczalnych. To jasne9.

Jest też odwrotnie: wprawdzie funkcja obliczalna φ może realizować co najwyżej jeden mor-fizm między ustaloną parą obiektów, ale może realizować wiele morfizmów działających międzyróżnymi parami obiektów - może mieć wiele instancji. Np. funkcja identycznościowa id : N → Nrealizuje wszystkie morfizmy identycznościowe. Dlatego mówimy, że:

„każda (częściowa) funkcja obliczalna φ : N→ N jest polimorfizmem w kategorii ESet”.

Polimorfizmy pojawiły się w informatyce teoretycznej pod koniec lat sześćdziesiątych XX w. za sprawąCh. Strachey’a w odpowiedzi na to, co było obecne w praktyce programistycznej10.

W czym rzecz? „wstawienia elementu a na początek listy [a1, . . . , an] - (a, [a1, . . . , an]) [a, a1, . . . , an] -można opisać tak: „napisz znak „[”, potem przepisz „a” a następnie przepisz listę [a1, . . . , an] zastępującnawias otwierający „[” przecinkiem”.Tak opisana procedura jest zrozumiała bez względu na to, czy dopisujemy liczbę do listy liczb, słowodo listy słów itp. itd. A jeśli tak, to chciałoby się by - w danym języku programowania - można byłonapisać program realizujący tę operację „dla wszystkich rodzajów list” - by można go było wykorzystaćwe wszystkich możliwych przypadkach11.

Kategorię ESet została wyróżniona przez teoretyków informatyki właśnie po to, by precyzyjnieopisać tak rozumiane polimorfizmy12. Więcej: w ESet można to pojęcie „uwewnętrznić” definiującobiekty, których elementami są polimorfizmy. Pokażemy - na przykładzie i w sposób uproszczony -jak taki obiekt zbudować.Niech K będzie klasą wszystkich endomorfizmów w ESet 13.

Obiekt reprezentujący K-polimorfizmy to para (A,E) taka, że:

- A to produkt kartezjański wszystkich zbiorów morfizmów postaci ESet((B,EB), (B,EB)

),

- dla dowolnej rodziny morfizmów (fi : i ∈ I) ∈ AE((fi)) =

⋂EB(fi).

7A to zbiór „rzeczy” a EA(a) to zbiór opisów a ∈ A.8Zainteresowanym szczegółami takiej (niebanalnej) analizy polecam [87].9Nieformalnie: pomyśl, że morfizm f to „zadanie programistyczne” a funkcja obliczalna φ która ją realizuje to

„program”. To samo zadanie można rozwiązać na wiele sposobów... .10Christofer Strachey (1916-1975, brytyjski teoretyk informatyki) wyróżnił dwie klasy polimorfizmów: polimorfizmy

parametryczne i „polimorfizmy ad hoc. Teraz interesują nas te pierwsze. Polimmorfizmy ad hoc też są ciekawe, aleto raczej element pragmatyki języka a nie jego struktury.

11Współczesne języki programowania - np. Haskell - dają taką możliwość. Możemy w nich tworzyć programypolimorficzne które można wykorzystywać w sposób zgodny z tymi oczekiwaniami.

12By to docenić, zastanów się jak wyróżnić polimorfizmy np. w kategorii zbiorów.13Endomorfizm to każdy morfizm postaci (A,EA)→ (A,EA) gdzie (A,EA) to dowolny obiekt.

Page 238: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 13. TOPOS HYLANDA 237

- n ∈ E((fi)) gdy n-ta funkcja obliczalna φn realizuje wszystkie morfizmy fi. 14

Zazwyczaj o stracheyowskich idei polimorfizmów mówi się nieco inaczej,: polimorfizmy pojawiają sięw systemach formalnych, które są rozszerzeniami λ-rachunku z typami15. Jedną z takich formalnychkonstrukcji jest tzw. System F w którym funkcjonuje konstruktor „typów polimorficznych”. Podobnie jakw przypadku pełnego λ-rachunku, w Systemie F mamy zadaną semantykę operacyjną - reguły redukcji(które możemy traktować jako reguły obliczeniowe).Kategoria ESet dostarcza tzw. semantyki denotacyjnej dla Systemu F - pozwala „nadać znaczenia”wyrażeniom tego systemu.To ważne dopełnienie: semantyka operacyjna pozwala badać i kontrolować procesy obliczeniowe. Aledopiero semantyka denotacyjna pozwala zrozumieć, co właściwie obliczamy....

13.1 Topos Hylanda

Kategoria ESet ma wiele cech oczekiwanych przez teoretyków informatyki. Ale dla tych, którzychcą budować matematykę konstruktywną „od podstaw” ma zasadniczą wadę - nie jest toposem16.Ale tę kategorię można poszerzyć - „zanurzyć” w topos Hylanda.

Puktem wyjścia do konstrukcji tego toposu jest pewna struktura (P(N),∧,∨,→) którą opisa-liśmy mówiąc o realizowalności Kleene’ego. Przypomnijmy krótko: P(N) to zbiór podzbiorów N idla dowolnych zbiorów C,D ⊆ N:

C ∧D = (n,m) : n ∈ C,m ∈ DC ∨D = (0, n) : n ∈ C ∪ (1,m) : m ∈ DC → D = n : dla dowolnego k ∈ C, φn(k) ∈ D 17

Korzystając z tej struktury definiujemy koniunkcję, alternatywę i implikację na zbiorach P (N)A

- zbiorach funkcji ze zbioru A do P(N). I tak np. dla dowolnych funkcji f, g : A→ P (N) przyjmu-jemy: (f ∧A g)(a) = f(a) ∧ g(a) dla dowolnego a ∈ A.Podobnie definiujemy - „punktowo”, jak mówią matematycy - alternatywę i implikację.

Jednak pierwszoplanową rolę w konstrukcji toposu Hylanda odegrają relacje A⊆ P(N)A×P(N)A

które definiujemy tak: dla dowolnych funkcji f, g : A→ P(N):

f A g gdy istnieje funkcja obliczalna ψ taka, że dla każdego a ∈ A , ψ(f(a)

)⊆ g(a) 18

f A g gdy istnieje wspólna dla wszystkich punktów a ∈ A procedura translacyjna liczb-opisów zazbiorów f(a) na liczby ze zbiorów g(a).Istotę żądania, by ta procedura była wspólna, pokazuje taki przykład:zdefiniujmy funkcje f, g : 0, 1 → P(N) tak:

f(0) = N \ C, f(1) = C ,g(0) = 0, g(1) = 1 ,

gdzie C ⊆ N to dowolnie ustalony niepusty zbiór. Łatwo wskazać parę funkcji obliczanych φ0, φ1 takich,że φ0(f(0)) ⊆ g(0), φ1(f(1)) ⊆ g(1). A wskazanie pojedynczej funkcji obliczalnej ψ takiej, że ψ(f(0)) ⊆g(0), ψ(f(1)) ⊆ g(1) jest możliwe tylko wtedy, gdy C jest zbiorem rozstrzygalnym!19.

14Ta konstrukcja może, a nawet powinna budzić wątpliwości: tworząc zbiór A mówimy o produkcie wszystkich zbio-rów morfizmów postaci ESet((B,E), (B,E)) Ale w ESet jest zbyt wiele obiektów by taki produkt istniał To prawda.Jednak w tej kategorii można (konstruktywnie!) wyróżnić szkieletową podkategorię PER (str. 210) z przeliczalnymzbiorem obiektów. Konstruując produkt -zbiór A - można ograniczyć się do zbioru PER ∩ K. Opis kategorii PER -„partial equivalence relations” - można znaleźć np. w [87].

15Ten fragment λ-rachunku opisaliśmy omawiając izomorfizm Curry-Howarda (str.193).Więcej informacji o Systemie F i jego semantyce denotacyjnej można znaleźć w [6].

16W toposie każdy morfizm, który jest jednocześnie mono- i epimorfizmem musi być izomorfizmem. Tymczasem wESet tak nie jest [87].

17W szczególności ¬C = C → ∅. Oczywiście zdefiniowanie tych operacji wymaga wcześniejszego ustalenia pewnejnumeracji częściowych funkcji obliczalnych i kodowania par liczb. Przez φn będziemy oznaczać funkcję obliczalną onumerze n w przyjętej numeracji a przez (n, k) kod pary (n, k). (patrz str. 201) .

18Tu i dalej zapis ψ(X) ⊆ Y oznacza, że dla dowolnej liczby n ∈ X wartość ψ(n) istnieje i ψ(n) ∈ Y .

Page 239: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 13. TOPOS HYLANDA 238

Możemy teraz zdefiniować pewną „kategorię” bH (która jednak ne jest jeszcze toposem Hy-landa):

Obiekty bH to pary (A,≈A: A×A→ P(N)) takie, że:

(a ≈ b) A (b ≈ a)((a ≈ b) ∧ (b ≈ c)) A (a ≈ c) 20

Ta definicja jest uderzająco podobna do defincji obiektów w toposie H. Ale ostrożnie - inter-pretacja tych zapisów jest odmienna! I tak:

- pierwszy warunek jest spełniony, gdy istnieje funkcja obliczalna, która - dla dowolnych a, b ∈ A!- przekształca dowolny opis-realizację a ≈ b w realizację b ≈ a.

- drugi warunek jest spełniony, gdy istnieje funkcja obliczalna φ która - dla dowolnych a, b ∈ A!-przekształca każdą parę realizacji a ≈ b i b ≈ c w realizację a ≈ c.Piszemy E(A,≈)(a) (lub E(a)) zamiast (a ≈ a). E(a) to miara istnienia punktu a.

Definicja morfizmów w bH jest też tożsama z definicją morfizmów w toposie H:

Morfizmy z (A,≈A) do (B,≈B) w „kategorii” bH to funkcje f : A×B → P(N) takie, że:(f(a, b) ∧ ([a ≈A a1) ∧ (b ≈B b1)

)A f(a1, b1),

f(a, b) A (E(a) ∧E(b),f(a, b) ∧ f(a, b1) A (b ≈B b1),

E(A,≈A)(a) A⋃b∈B (E(B,≈B)(b) ∧ f(a, b)).

Morfizm identycznościowy obiektu (A,≈A) to funkcja ≈A: A×A→ H. Złożenie (f : A×B →H) : (A,≈A) → (B,≈B) i (g : B × C → H) : (C,≈C) → (B,≈B) to funkcja h : A× C → H taka,że

h(a, c) =⋃

(f(a, b) ∧ g(b, c) : b ∈ B).

Definiując strukturę bH słowo „kategoria” pisaliśmy w ponieważ... nie jest to kategoria. Gdy np.policzymy złożenie dowolnego morfizmu f : (A,≈A) → (B,≈B) z morfizmem identycznościowym≈A: (A,≈A)→ (A,≈A) to pokażemy jedynie, że

f · ≈AA f oraz f A f · ≈APodobne wyniki otrzymamy gdy obliczymy złożenie ≈B ·f i gdy zechcemy sprawdzić łączność

tak zdefiniowanego składania morfizmów21.

Remedium na tę przypadłość udało się znaleźć bardzo prosto: powiemy, że funkcje f, g : A →P(N) są równoważne gdy f A g oraz g A f .

Topos Hylanda to kategoria, której obiektami sa opisane powyżej obiekty w bH, a morfizmy z (A,≈A) i(B,≈B) są jedynie reprezentowane przez funkcje f, g : A×B → P(N) - morfizmy w bH z (A,≈A) do(B,≈B) . Dwie takie funkcje reprezentują ten sam morfizm, gdy są równoważne.

Sprawdzenie, że tak zdefiniowane obiekty i morfizmy tworzą topos wymaga naprawdę sporejbiegłości. I benedyktyńskiej cierpliwości22

Obiekty w bikategorii bH i w toposie Hylanda są takie same. Ale ich rola może się zmienić!.

19Konwencja notacyjna: odtąd będziemy pisać f(a) A g(a) zamiast f A g. Pozwoli to uprościć formalne zapisyi ułatwić ich odczytywanie.

20The elements of (A,≈) are to be thought of as (...) elements of some ”real underlying” set in the topos. Given apair (a, b) of elements of A, the set [a ≈A b] is the set of codes of proofs that the element denoted by a is equal to theelement denoted by b” - „Colimit completions and the effective topos”, E.Robinson, G. Rossolini, J. of Symb. Log.vol.55 no2. 1990.).

21Bardziej naukowo: opisana struktura bH nie jest kategorią lecz bikategorią (równoważnie: jest to weak 2-category(mam nadzieję, że się nie mylę). Ale nie zaprzątajmy sobie głowy nowymi definicjami.

22Zainteresowanych odsyłam np. do [131]. A w [87] napisano, że ten dowód jest „pretty hard”... .

Page 240: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 13. TOPOS HYLANDA 239

Przykład. Dla dowolnego podzbioruB ⊂ N możemy utworzyć jednopunktowy obiekt 1B = (?,EB))taki, że EB(?) = B. W bH jest to podobiekt obiektu (?,EN)) istotnie od niego różny. A w toposieHylanda oba te obiekty są izomorficzne (i są obiektami końcowymi)23 .

Snopy w toposie Hylanda

Zrozumienie, czym są morfizmy w toposie H, znacząco ułatwiła konstrukcja „H-snopa elementów”El(A). Tę konstrukcję można powtórzyć w toposie Hylanda uwzględniając jednak specyficzne cechytego toposu:- najpierw - dla danego obiektu A = (A,≈A) konstruujemy - w bikategorii BH ! - obiekt El(A) =

(El(A),≈el). Ta konstrukcja jest taka sama jak w toposie H24

- następnie pokazujemy, że funkcja η : A×El(A)→ P(N) taka, że η(e, a) = e(a) generuje - w bH!- dwa morfizmy: η : A→ El(A) i η1 : El(A)→ A takie, że złożenie η · η1 jest funkcją równoważnąz miarą istnienia ≈el a złożenie η1 · η - z miarą istnienia ≈. To oznacza, że morfizmy η i η1 niesą wprawdzie wzajemnie odwrotnymi izomorfizmami w bikategorii bH ale są izomorfizmami tymiobiektami w toposie Hylanda!

I to jest to: funkcja f : A×B → P(N) reprezentująca morfizm między obiektami A i B opisujew istocie przyporządkowanie punktom A elementów B . I można ją jednoznacznie rozszerzyć domorfizmu między snopami elementów.

Problem w tym, że nie tak łatwo powiedzieć, jak wyglądają te snopy w toposie Hylanda....25.

Zbiory efektywne i obiekt liczb naturalnych

Brak jasnych intuicji, czym sa morfizmy w toposie Hylanda nie jest wielkim zmartwieniem. Tentopos stworzono głównie po to, by zbudować matematyczne uniwersum zawierające kategorię ESetzbiorów efektywnych. To się udało: w oczywisty sposób każdy zbiór efektywny jest obiektem toposuHylanda a morfizmy w ESet są morfizmami w toposie Hylanda26. Co więcej, między zbioramiefektywnymi w toposie Hylanda nie ma innych morfizmów niż te, które są w kategorii ESet [87].

Jednym z efektywnych zbiorów jest obiekt N = (N,EN ) , gdzie E(n) = n . Morfizmy z N do Nto wyłącznie (totalne) funkcje obliczalne. To jest obiekt liczb naturalnych w toposie Hylanda.

Podkategoria ESet to „centrum” toposu Hylanda. Jego jądrem jest obiekt liczb naturalnych, gdyż każdyefektywny zbiór można z niego zbudować korzystając najprostszych konstrukcji kategoryjnych: „everyeffective object is a quotient by a closed equivalence relation of a closed subobject of NNO”27.

Logika toposu Hylanda. Obiekty i morfizmy leżące poza „centrum” - poza ESet - interesująnas średnio. Wyjątek robimy dla tych, które związane z logiką toposu Hylanda.

Logika toposa Hylanda jest dwuwartościowa. To stwierdzenie - po tak pięknie (piekielnie) skom-plikowanej definicji tego toposu - nieco zaskakuje. Wyjaśnijmy to.

Klasyfikator podobiektów ΩH to para (P(N),≈), gdzie:

23Obiekt końcowy - granica pustego diagramu - jest (jak każda granica) wyznaczony „z dokładnością do izomorfi-zmu”.

24Przypomnijmy:- punkty El(A)) to elementy A -morfizmy z dowolnego jednopunktowego obiektu 1B = (?,EB) do A,

- miara równości elementów e : 1B → A i e1 : 1C → A to największy zbiór D ⊆ B ∧ C, taki, że e|D = e1|D.25H-snopy są pięknie reprezentowane jako kontrawariantne funktory (z H do Set spełniające elegancki, intuicyjnie

prosty warunek. Nie potrafię wskazać podobnej reprezentacji dla snopów w toposie Hylanda. Ale może to tylko mojaniewiedza... .

26Morfizm f ∈ ESet((A,E), (B,E))) generuje jednoznacznie morfizm między tymi obiektami w toposie Hylandaktóry jest opisany przez funkcję f : A×B → P(N) taką, że (f)(a, f(a)) = (n, φ(n)) : n ∈ E(a) gdzie φ to funkcjaobliczalna realizująca f . W pozostałych przypadkach f(a, b) = ∅.

27Relacja między kategorią ESet a toposem Hylanda przypomina tę między H-zbioremi rozmytymi a toposem H.

Page 241: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 13. TOPOS HYLANDA 240

A ≈ B = (A→ B) ∧ (B → A)

dla dowolnych zbiorów A,B ⊆ N.Podobiekty dowolnego obiektu A = (A,≈) - morfizmy z A do klasyfikatora podobiektów - sąwyznaczone przez funkcje g : A→ P(N) spełniające dwa warunki [131]:

- g(a) A E(a) ,- g(a) ∧ (a ≈ b) A g(b) 28

Kanoniczą reprezentacją tak opisanego podobiektu jest obiekt (A,≈g) gdzie a ≈g b = a ≈ b∧ g(a).

Obiekt końcowy to jednopunktowy obiekt 1N = (?,E(?) = N). Jego podobiekty w bH to obiektypostaci 1A gdzie A ⊆ N. Ale w toposie Hylanda te podobiekty - z wyjątkiem obiektu 1∅! - sąizomorficzne z obiektem końcowym.

Dlatego w toposie Hylanda są tylko dwie wartości logiczne.

O semantyce zdań i formuł języka pierwszego rzędu w toposie Hylanda trzeba myśleć tak:Pierwotną semantyką zdania α jest tu pewna funkcja [α] : ? → P(N) - morfizm w bikategorii bH. Zbiór[α](?) ⊆ N to zbiór realizacji, (uzasadnień) zdania α.The meaning of a proposition is determined by (...) what counts as a verification of it - Martin Lof.29

Wartość logiczna zdania α - morfizm [[α]] : 1 → ΩH w toposie Hylanda wyznaczony przez funkcję [α]- jest wtórna: zdanie α jest prawdziwe - [[α]] = true - gdy zbiór [α](?) jest niepusty, gdy zdanie α majakiekolwiek uzasadnienie. W przeciwnym przypadku wartością logiczną zdanie α jest false. To jest zgodnez koncepcją Brouwera: prawdziwość to istnienie uzasadnienia.

Podobnie pierwotną semantyką formuły φ(x) z jedną wolną zmienną w modelu którego nośnikiem jestobiekt (A,≈) jest pewna funkcja [φ(x)] : A→ P(N) a wtórną - związany z nią morfizm w toposie Hylanda- [[φ(x)]] : (A,≈)→ ΩH.

I jest tak, jak oczekujemy: jeżeli w toposie Hylanda zinterpretujemy arytmetykę korzystając zobiektu liczb naturalnych, to:

„formuła arytmetyczna jest realizowalna w sensie Kleene’ego dokładnie wtedy, gdy jest uzasad-niona w toposie Hylanda” [48].

Jednak to, że w tym toposie są tylko dwie wartości logiczne nie znaczy, że jest on boolowski!To stwierdzenie stanie się zrozumiałe gdy powiemy, jak w toposie Hylanda interpretowana jestkwantyfikacja.

Dla dowolnych obiektów A i B i podobiektu produktu A × B reprezentowanego przez funkcjęg : A×B → H zdefiniujemy funkcje ∀B(g),∃B(g) : B → P(N) (reprezentujące podobiekty B) :

(∀B g)(b) =⋂a∈A

(E(a)→ g(a, b)) , (∃B g)(b) =⋃a∈A

(E(a) ∧ g(a, b))

dla dowolnego b ∈ B .Jeśli pierwotną semantyką formuły φ(x, y) w modelu posadowionym na A jest funkcja [φ(x, y)] :A×A→ H to semantyką formuł ∃yφ(x, y) i ∀yφ(x, y) są klasy równoważności funkcji ∀A([φ(x, y)])i ∃A([φ(x, y)]).

Uwzględniając równość (izomorfizm) A ∼= A× 1 możemy z każdą formułą φ(x) dwa podzbioryliczb naturalnych:

∀1[φ(x)] =⋂a∈A (E(a)→ [φ(x)](a)) , ∃1[φ(x)] =

⋃a∈A (E(a) ∧ [φ(x)](a))

które są pierwotnymi semantykami formuł-zdań ∀xφ(x) i ∃xφ(x).Ponieważ wszystkie niepuste podzbiory N są równoważne, to te zdania są prawdziwe (w modelu)

gdy ich pierwotne semantyki są niepustymi zbiorami.

28Jest „tak samo” jak w toposie H. Ale teraz te zapisy odczytujemy inaczej. Np. pierwszy warunek jest spełnionygdy istnieje funkcja obliczalna φ taka, że φ(g(a)) ⊆ E(a) dla każdego punktu a.

29Per Martin-Lof. On the meanings of the logical constants and the justifications of the logical laws.Nordic Journalof Philosophical Logic, 1(1):11–60, 1996

Page 242: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 13. TOPOS HYLANDA 241

Powiemy, że formuła φ(x) jest punktowo uzasadniona w punkcie a ∈ A gdy zbiór [φ(x)](a) jest niepu-sty.Ale przekrój niepustych zbiorów nie musi być niepusty. Dlatego istnienie uzasadnienia formuły φ to, wtoposie Hylanda, coś więcej niż istnienie jej wszystkich punktowych uzasadnień! Potrzebne jest wspólne,czyli jednolite uzasadnienie.Wymóg jednolitego uzasadnienia zdań uniwersalnych jest bliższy intuicji, niż żądanie uzasadnienia „wkażdym punkcie” modelu. Czy uzasadnieniem sokratesowskiego zdania „każdy człowiek jest śmiertel-ny” jest osobny dowód śmiertlności każdego człowieka czy też oczekujemy jednolitej argumentacjiobejmującej wszystkie przypadki?

Przykład. Przyjmijmy, że [α(x)], [β(x)] : 0, 1 → P(N) są funkcjami takimi, że:

[α(x)](0) = N \ C, [α(x)](1) = C ,[β(x)](0) = 0, [β(x)](1) = 1 ,

gdzie C ⊆ N to dowolnie ustalony niepusty zbiór.

Bez względu na wybór zbioru C, zdania-implikacje (α(x) → β(x))[x := a] są realizowalne w obupunktach - dla a = 0 i a = 1. Natomiast zdanie ∀ (α(x) → β(x)) jest prawdziwe tylko wtedy, gdyzbiór C jest rozstrzygalny! 30

Co więcej, ponieważ ∃ g =⋃a∈A g(a), to - dla rozstrzygalnego zbioru C - żadne ze zdań

¬∀x (α(x)→ β(x)) i ∃x ¬(α(x)→ β(x)) nie jest prawdziwe. Wbrew prawom klasycznej logiki.

Wewnętrzna logika zdaniowa toposu Hylanda to dwuwartościowa logika klasyczna a wewnętrzna logikapierwszego rzędu jest „tylko” intuicjonistyczna. „This situation seems at first sight anomalous (at leastit did to the author)” pisał R.Goldblatt po zauważeniu, że takie sytuacje są możliwe [43]. „Anomalous”można tłumaczyć jako „nienormalna”, będąca anomalią.Wrażenie, że to anomalia bierze się stąd, że w Set i w wielu innych toposach algebra podobiektówdowolnego obiektu jestpodalgebrą potęgi kartezjańskiej algebry wartości logicznych31. W toposie Hylandatak nie jest.

Kwantyfikacja - przejście od uzasadnień formuły do prawdziwości zdania (od algebry Heytingado dwuelementowej algebry Boole’a) jest zrealizowane zgodnie z BHK-postulatami: prawdziwośćzdania ∃φ(x) to istnienie (lokalnego) uzasadnienia φ(x) a zdania ∀φ(x) - istnienie jednolitego uza-sadnienia tej formuły.

Punkty i elementy

Skoro logika toposu Hylanda jest dwuwartościowa, to nie ma tu elementów częściowych (pozanieszczęsnym elementem nieistniejącym): wszystkie elementy są globalne i generowane przez punkty.

Każdy punkt a ∈ A obiektu (A,≈A) taki, że E(a) 6= ∅ wyznacza element globalny. Punktya, b ∈ A wyznaczają ten sam element jeśli tylko zbiór a ≈A b jest niepusty.

Ale uwaga: obiekt końcowy nie jest tu generatorem: równoległe morfizmy id, ¬¬ : ΩH → ΩHsą równe na elementach klasyfikatora ΩH - ¬¬true = true, ¬¬false = false - ale nie są równe32.

To jeszcze jeden argument by definicji modelu języka pierwszego rzędu w toposie nie opierać nadefinicji „spełniania formuły w danym punkcie”.

Topos ∇(Set)Każdemu zbiorowi A można przyporządkować w toposie Hylanda obiekt ∇(A) = (A,≈A), taki, że:

[a ≈A b] =

N a = b

∅ a 6= b

. Każda funkcja f : A → B wyznacza morfizm z ∇(A) do ∇(B) Nieco trudniej pokazać, ża każdymorfizm z ∇(A) do ∇(B) jest wyznaczony przez pewną funkcję z A do B. W ten sposób wyróżnimy

30Powielamy tu przykład który ilustrował sutelności relacji „A”. Nic dziwnego: f A g dokładnie wtedy, gdy∀(f → g) 6= ∅.

31Tzn. operacje logiczne w tych algebrach są definiowane „po wspórzędnych”.32Równość ¬¬ = id implikuje boolowskość toposu [68].

Page 243: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 13. TOPOS HYLANDA 242

w toposie Hylanda podkategorię ∇(Set).

„∇(Set) should be regarded as the world of classical mathematics within Eff” [48].Co to znaczy, że w obiektach postaci ∇(A) miarą równości różnych punktów jest zbiór pusty a miarąistnienia każdego punktu - „wszystko”? Nie można tego interpretować inaczej, niż jako stwierdzenie, żew świecie klasycznej matematyki „wiemy” (zakładamy, że wiemy, przyjmujemy aprioryczne założenie),że równe elementy (punkty obiektu) są równe a różne - różne.

Kategorię ∇(Set) można też wyróżnić „wewnętrznie”, jako topos boolowski, wyznaczony przezmorfizm (topologię) podwójnej negacji: obiekty postaci ∇(A) to ¬¬-snopy33.

Obiekt liczb naturalnych N jest podobiektem ∇(N) istotnie od niego różnym34

Morfizmy z ∇(N) do ∇(N) to wszystkie funkcje z N do N. Jest ich nieprzeliczalnie wiele.Morfizmy z N do N to totalne funkcje rekurencyjne. I jest ich przeliczalnie wiele.

Skoro w toposie Hylanda jest obiekt liczb naturalnych to są też obiekty liczb całkowitych, wy-miernych i rzeczywistych, konstruowane według schematu, który opisaliśmy w toposie H-zbiorów.Obiekt „liczb rzeczywistych” to tutaj para (Rrec,≈) gdzie Rrec to liczby rzeczywiste wyznaczoneprzez rekurencyjne ciągi Cauchy’ego a n ∈ (r ≈ r1) gdy r = r1 i φn opisuje ciąg rekurencyjny zbież-ny do r [48]. „Miarą istnienia” tak definiowanej liczby rzeczywistej jest zbiór (kodów) wszystkichrekurencyjnych ciągów, które ją aproksymują. A każdy morfizm z (R,≈) do (R,≈) jest ciągły...

Możliwość zanurzenia klasycznej matematyki w topos Hylanda - poprzez funktor ∇ - poddaje w wątpli-wość stwierdzenie, że topos Hylanda to świat matematyki obliczalnej. Wygląda na to, że chcąc zbudowaćmatematyczny świat konstruktywistów nie możemy zbudować czegoś „obok” a jedynie „coś więcej”.

Wątpliwość uzasadniona. Ale z uwagi na trywialny charakter miary równości w obiektach podkategorii∇(Set) można zaryzykować twierdzenie, że jest ona gdzieś na peryferiach toposu Hylanda.

Dodatek: od hiperdoktryny do toposu

Analizujac definicję toposu odkrywaliśmy jego wewnętrzną logikę. To droga „od matematykido logiki”. Ale możliwa jest też wędrówka w odwrotnym kierunku - „od logiki do matematycznegouniwersum (toposu)”. I właśnie w ten sposób konstruowany jest każdy topos H i topos Hylanda.Różnica polega na tym, że w pierwszym przypadku opis logiki jest prosty: ta logika wyznaczonaprzez pojedynczą zupełną algebrę Heytinga H. W przypadku toposu Heytinga jest to coś bardziejskomplikowanego - to hiperdoktryna. Cóż to takiego?

Hiperdoktryna pierwszego rzędu jest zadana przez wskazanie:- funktora Hd : Setop → Heyt , gdzie Heyt to kategoria zupełnych algebr Heytinga,- rodziny funkcji (indeksowanej parami zbiorów (A,B)) ∀A,∃A : Hd(A × B) → Hd(B) powią-

zanych z rzutowaniami ΠA : A×B → A przez takie oto nierówności:

c ¬ Hd(Π)(d) ⇔ ∃A(c) ¬ d , Hd(Π)(d) ¬ c⇔ d ¬ ∀A(c)dla wszelkich elementów c ∈ Hd(A×B) i d ∈ Hd(B)

Darujemy sobie analizę tej definicji35. Niech nam wystarczy, że są tu algebry Heytinga (niejedna, ale wiele!) i działające między nimi funkcje, których opisy sugerują związki z kwantyfkacją.

Każda zupełna algebra Heytinga H wyznacza swoją hiperdoktrynę: funktor H : Setop → Heytprzyporządkowujący każdemu zbiorowi A algebrę Heytinga posadowioną na zbiorze HA wszystkichfunkcji z A do H. Działania są tu określone „po współrzędnych” (np. (f ∨ g)(a) = f(a) ∨ g(a)).Funkcje ∀A, ∃A : HB×A → HB opisaliśmy wcześniej, gdy mówiliśmy o kwantyfikacji w toposie H.

33Konstrukcję takiego podtoposu boolowskiego opisaliśmy wcześniej.34Spróbuj pokazać, że wszystkie morfizmy z ∆(N) do N są „stałe” - postaci ∇(N) → 1 → N (gdzie 1 to obiekt

końcowy.35Podana tu definicja hiperdoktryny jest niepełna. Pełną wersję można znaleźć np. w pracy A.M.Pittsa [88].

Page 244: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

ROZDZIAŁ 13. TOPOS HYLANDA 243

Hiperdoktryna - punkt wyjścia do budowy toposu Hylanda - jest bardziej skomplikowana. Aby jązbudować musimy - dla dowolnego zbioru A - wskazać odpowiednią zupełną algebrę HeytingaH(A).Zdefiniowanie struktur (P(N)A,∧,∨,→) zdaje się sugerować, że to właśnie one są poszukiwanymialgebrami. Niestety - to nie są algebry Heytinga.

Musimy powtórzyć manewr, który już raż wykonaliśmy definiując morfizmy w toposie Hylanda- musimy przyjąć, że elementy zbiorów P(N)A jedynie reprezentują elementy poszukiwanychalgebr Heytinga:

funkcje f, g : A→ P(N) reprezentują ten sam element algebry H(A) gdy są równoważne36

O tym, że możliwa jest droga „od logiki do (lokalnego) uniwersum” - od hiperdoktryny do toposu- mówi takie oto twierdzenie [88]:

Każda hiperdoktryna (spełniająca pewne dodatkowe warunki) wyznacza topos37.

Jego obiekty to pary(A,≈A) ∈ H(A×A)

)takie, że:

- ∀a,ba ≈A b→ b ≈A a,- ∀a,b,c (a ≈A b ∧ b ≈A c)→ a ≈A c

Natomiast morfizm z (A,≈A) do (B,≈B) to każdy element f ∈ H(A×B) taki, że:∀a,b a ≈ b→

(EA(a) ∧EB(b)

),

∀a,b,a1,b1 (a ≈A a1 ∧ b ≈B b1 ∧ f(a, b))→ f(a1, b1)∀a,b (f(a, b) ∧ f(a, b1))→ b ≈B b1∀a EA(a) ¬ ∃b f(a, b)

Ot, cała tajemnica... . 38.

To nie koniec

Proces dochodzenia do rozumienia matematyki jest (potencjalnie) nieskończony.

Czy zdanie okrągłe wypowiesz,czy księgę mądrą napiszesz,będziesz zawsze mieć w głowietę samą pustkę i ciszę.(...)

Zwieść cię może ciągnący ulicami tłum,wódka w parku wypita albo zachód słońca,lecz pamiętaj: naprawdę nie dzieje się nici nie stanie się nic - aż do końca. (...)

M. Zabłocki

to be continued ... (???))

36Matematycznie: poszukiwane algebry Heytinga to struktury ilorazowe (P(N)A,∧,∨,→)/ ∼=A gdzie ∼=A to relacjarównoważnego uzasadnienia: f ∼=A g gdy istnieje para funkcji obliczalnych taka, że φ(f(a)) ⊆ g(a) i ψ(g(a)) ⊆ f(a)dla dowolnego a ∈ A.

37Hiperdoktryny spełniające te dodatkowe warunki to triposy. Rezygnuję tu ze szczegółowego omawiania tychpojęć, gdyż wymagało by to użycia języka daleko wykraczającego poza przyjęte tu samoograniczenie.Co oznacza słowo ”tripos”? P.Johnstone (...) suggested naming these structures with the acronym tripos - standingfor Topos Representing Indexed Partially Ordered Set” ale zaraz dodaje:it is partly a joke: the Tripos is the nameCambridge University gives to examinations” [88]

38Zainteresowanych szczegółami odsyłam do [88]

Page 245: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

Bibliografia

[1] S.Abramsky, The Lazy Lambda Calculus, (http://www.cs.ox.ac.uk/files/293/ lazy.pdf)

[2] M.Atiyah, Matematyka w XX wieku, Roczniki PTM Seria II: Wiad. Mat. XXXIX (2003)

[3] M.van Atten, D.van Dalen, R.Tieszen, Brouwer and Weyl: The phenomenology and mathe-matics of intuitive continuum, http://www.researchgate.net/publication/

[4] M.van Atten, D.van Dalen, Arguments for the continuity principle, The Bull. of. Symb.Logic,vol.8 num.3 (2002)

[5] J.Avigad, S.Feferman, Godel’s Functional Interpretation, Handbook of Proof Theory, 1968

[6] H.P.Barendgert, The Lambda Calculus, its syntax and semantics, Studies in Logic, vol.103

[7] M.Barr, Ch.Wells, Toposes, Triples and Theories (http://www.cwru.edu/artsci/math/wells/pub/ttt.html) (30.11.2011)

[8] H.P.Barendregt, The Lambda Calculus, its syntax and semantics, Studies in Logic and theFoundation of Mathematics vol.103, North-Holland Publ. Comp. 1981

[9] A.Bauer, Realizability as connection between Computable and Constructive mathematics,(http://math.andrej.com/data/c2c.pdf) (23.09.2012)

[10] J.L.Bell, Continuity and Infinitesimals, Stanford Encyklopedia of Philosophy (http://plato.stanford.edu/entries/continuity/),(13.12.2012)(pełny tekst książki The Continuous and the In-finitesimal in Mathematics and Philosophy jest (był) dostępny w internecie).

[11] J.L.Bell, A.B.Slomson, Models and ultraproducts, an introduction, North-Holland Publ.Comp., 1971

[12] N.Bezhanishvili, D.de Jongh, Intuitionistic Logic, (http://www.cs.le.ac.uk/people/ nb118 /Pu-blications/ESSLLI2705.pdf) (20.01.2013)

[13] C.Bohm, G.Jacopini, Flow Diagrams, Turing Machines And Languages With Only Two For-mation Rules, http://www.cs.unibo.it/ martini/PP/bohm-jac.pdf

[14] B.Brożek, M.Hohol, Umysł matematyczny, Copernicus Center Press, Kraków 2014

[15] E.Bryniarski, Metoda fluksji Newtona, (http://www.math.uni.opole.pl/ebryniarski / Meto-da20fluksji20Newtona.pdf) (10.05.2011).

[16] A.Bundy, The Automation og Proof by Mathematica Induction, in Handbook of AutomatedReasoning vol.1 , North-Holland, 1992

[17] S.Buss, First-Order Proof Theory of Arithmetic - Rozdział II książki o nieznanym mi tytule,(http://www.math.ucsd.edu/ sbuss/ResearchWeb/handbookII/ChapterII.pdf )(24.07.2012)

[18] C.S.Calude, Information and Randomness - an algorithmic perspective, Springer 2002 (2ed.)

244

Page 246: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

BIBLIOGRAFIA 245

[19] F.Cardone, J.R.Hindley, History of Lambda-calculus and Combinatory Logic, Swansea Uni-versity Mathematics Department Research Report No. MRRS-05-06 (2006)(http://maths.swan.ac.uk/staff/jrh/papers/jrhhislamweb.pdf) (15.04.2012)

[20] G.Chaitin, The search for the perfect language , http://pirsa.org/09090007/ (20.12.2012)

[21] G.Chaitin, On the search of the lenght of programs for computing finite binary sequences,Journal of the ACM 13 (1966),pp. 547-569

[22] K. Ciesielski, Z. Pogoda, Diamenty matematyki, Prószyński i Spółka.

[23] P.Cohen, The discovery of forcing, Rocky Moutain J. of. Math. vol.32, no. 4 2002

[24] H.Curry, The Paradox of Kleene and Rosser, Transactions of the American MathematicalSociety Vol. 50, No. 3 (Nov., 1941), pp. 454-516

[25] D.van Dalen, Intuitionistic logic, Handbook of Philosophical Logic, volume III, Reidel Publ.Co., 1986.

[26] B.Dembiński, Teoria idei. Ewolucja myśli platońskiej, sbc.org.pl)

[27] J.Dieudonee, Logika i matematyka, Zagadnienia Filozoficzne w Nauce VIII, 7-19 (1986)

[28] A.Doring, Ch.Isham,‘What is a Thing?’: Topos Theory in the Foundationsof Physics (inter-net)

[29] J.M.Dunn, N.D.Belnap, The substitution Interpretation of the quantifiers, Nous, vol.2 (1968),177-185

[30] U.Eco, W poszukiwaniu języka uniwersalnego, Wyd. Marabut, 2002

[31] Companion Encyclopedia of the history and philosophy of the mathematical sciences, ed. I.Grattan-Guiness

[32] S.Feferman, Godel’s Dialectica interpretation and its two-way stretch, Computational Logicand Proof Theory (Proc. 3d Kurt Godel Colloquium, Brno Aug. 1993), G. Gottlob et at. eds.,LNCS 713 (1993)

[33] T.Chow, Forcing for dummies, (though I should warn that Tim has a rather stringent definitionof “dummy”), http://www-math.mit.edu/ tchow/mathstuff/forcingdum (6.07.2012)

[34] ks.J.Dadaczyński, Pojęcie nieskończoności w matematyce, Śląskie Studia Historyczno-Teologiczne 2002, t.35, z.2, s.265–270

[35] ks.J.Dadaczyński, Koncepcja matematyki G. Cantora a idea logicyzmu, Zagadnienia Filozo-ficzne w Nauce XXII, 1998, s.15–34

[36] ks.J.Dadaczyński, Filozofia matematyki Immanuela Kanta i jej dziedzictwo, Zagadnienia Fi-lozoficzne w Nauce XXIV / 1999, s. 26–42

[37] ( D. van Dalen, Intuitionistic logic, The Blackwell Guide to Philosophica Logic. Ed. L.Gobble.Blackwell, Oxford.2001, 224–257.

[38] P.J.Davis, R.Hersh, Świat matematyki,

[39] S.Feferman, Predicativism (internet???)

[40] T.Forster,The axioms of set theory, internet

Page 247: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

BIBLIOGRAFIA 246

[41] J.Y.Girard, The Blind Spot Lectures on Logic, Rome, Autumn 2004. (http://iml.univ-mrs.fr/ girard/coursang/coursang2.pdf.gz) (13.08.2012)

[42] J.Y.Girard, Proof and Types.

[43] R.Goldblatt, Topoi - the categorical analysis of Logic, Studies in Logic and Foundation ofMathepatisc, vol.98, North-Holland 1979

[44] M.Has, Czy świat zmierza ku czemuś?, Zielone Brygady. Pismo Ekologów, nr 4 (218) (2006)

[45] D.Higgs, Injectivity in the topos of complete Heyting algebra valued sets, Can. J. Math., Vol.XXXVI, No. 3, 1984, pp. 550-568.

[46] Companion Encyclopedia of the History of Philosophy of Mathematical Science, Ed. I Grattan-Guinness, 1994

[47] Holmes, Randall, Elementary Set Theory with a Universal Set, Academia-Bruylant 1998.

[48] J.M.E.Hyland, The Effective Topos, internet

[49] B. Jacobs, Categorical logic and Type theory, Studies in Logic and Foundation of Mathematics,vol.141

[50] P.Johnstone, Stone spaces, Cambr. Univ. Press,1986

[51] P.Johnstone, The point of pointless topology, Bull. AMS vol.8, No.1, 1983

[52] J.P.Jones, Universal Diophantine Equation, Journal of Symb.Logic,vol 47 N.3,1982

[53] A.Kanamori, The mathematical development of set theory. From Cantor to Cohen, Bull.ofSymb.Logic vol 2.,Num.1, March 1996

[54] H.J. Keisler, Foundations of infinitesmall calculus, ([email protected])

[55] R.Kaye, Tennenbaum’s Theorem for Models of Arithmetic, internet

[56] R.Kaye, T.L.Wong, On interpretation of arithmetic and set theory (internet - rozszerzonawersja art. z Notre Dame Journal of Formal Logic

[57] K. Kapulkin, O prawdzie u Alfreda Tarskiego, http://www.racjonalista.pl/kk.php/s,3573,(22.05.2012)

[58] A.O.Kazakci, A.Hatchuel, Is ”creative subject” of Brouver a designer? - an analysis of intu-itionist mathematics from the viewpoint of C-K design theory, ICED’09 24-27 August 2009,Stanford,CA 24-27,USA, .

[59] J.Klop, Term rewriting systems

[60] S.Krajewski, Twierdzenie Godla i jego filozoficzne interpretacje, rozdział z książki „Twier-dzenie Godla” zamieszczony w internecie

[61] A.Kolany, Kultura matematyczna - świadomość środków, świadomość ograniczeń,http://www.msn.ap.siedlce.pl/smp/msn/22/7-9.pdf (3.2.2012)

[62] M.Kordos, Czy w matematyke trzeba wierzyć? (XX Szkoła Matematyki Poglądowej - tekstdostępny w internecie

[63] J.J.C.Kuiper, Ideas and Explorations - Brouwer’s Road to Intuitionism - praca doktorska, 2004(http://igitur-archive.library.uu.nl/dissertations/2004-0303-084333/inhoud.htm (3.01.2013))

Page 248: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

BIBLIOGRAFIA 247

[64] F.W. Lawvere, Functorial semantics of algebraic theories. Proc. Nat. Acad. Sci U.S.A 50,869–73, 1963.

[65] F.W.Lawvere, An elementary theory of the category of sets, Proc. Nat. Acad. Sci U.S.A vol.52,1506-11, 1964.

[66] F.W.Lawvere, R.Rosebrugh, Sets for Mathematics, Cambridge Univ.Press, 2003 (internet)

[67] G.Lakoff, R.E.Nunez, Where Mathematics Come from. How the Embodied Mind Brings Ma-thematics into Being. New York.Basic Books,2000

[68] S.McLane, I.Moerdijk, Sheaves in Geometry and Logic - a first introduction to topos theory,Springer-Verlag,1992

[69] A.Miguel, An introduction to forcing, https://www.fing.edu.uy/ amiquel/forcing/forcing

[70] P.Martin-Lof, An Intuitionistic Theory of Types, Technical report, University of Stockholm.

[71] P.Martin-Lof, Intuitionistic Type Theory Per Martin-Lof, Notes by G. Sambin of a series oflectures given in Padua, June 1980 (internet)

[72] S. McLane, Category theory for the working mathematicians.

[73] M. McLuhan, Wybór tekstów, Zysk i S-ka Wydawnictwo,2001

[74] P.Muller, Introduction to model oriented programmming using C++ ( [email protected]) (10.10. 2012)

[75] A.Mostowski, Logika Matematyczna, Monografie Matematyczne t. 18, Warszawa-Wrocław,1948.

[76] R.Murawski, Filozofia matematyki. Zarys dziejów. PWN, Warszawa, 1995.

[77] R.Murawski, Funkcje rekurencyjne i elementy metamatematyki, Wyd. Naukowe UAM, Poznań2000.

[78] R.Murawski, Program Hilberta - drogi i manowce, (http://www.msn.ap.siedlce.pl /smp/msn/14/ 21-25.pdf)

[79] R.Murawski, Główne koncepcje i kierunki filozofii matematyki XX wieku, Zagadnienia Filo-zoficzne w Nauce XXXIII,74-92,2003

[80] R.Murawski (red.),Współczesna filozofia matematyki, wybór tekstów, PWN Wwa 2002.

[81] M. Di Nasso,On the Foundations of Nonstandard Mathematics (internet)

[82] E.Nelson, Hilbert’s mistake, https://web.math.princeton.edu/ nelson/papers/hm.pdf

[83] E.Nelson, Understanding intuitionism, http://www.math.princeton.edu/ nelson/papers.html

[84] J.Niekus, Brouwer’s incomplete objects (http://www.illc.uva.nl/Research/Reports/PP-2005-27.text.pdf)

[85] R.Penrose, Nowy umysł cesarza. PWN, Warszawa, 1995

[86] S.Petrakis, Brouwer intitionism as a self interpreted mathematical theory (internet)

[87] W.Phoa, An introduction to fibrations,topos theory the effective topos and modest sets,http://www.lfcs.inf.ed.ac.uk/reports/92/ECS-LFCS-92-208/ (12.01.2013)

Page 249: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

BIBLIOGRAFIA 248

[88] A.M.Pitts, Tripos theory in retrospect, Math.Struc.in Comp.Sci., 2002, vol.12, 265-279.

[89] Platon, Obrona Sokratesa, Uczta.

[90] H.Poincare, Nauka i Hipoteza.

[91] J.Pogonowski, Niewyrażalna tęsknota za modelem zamierzonym, odczyt 10.06. 2010 roku,Uniwersytet Opolski, http://www.glli.uni.opole.pl/index.php?id=publications (2.11.2012)

[92] J.Pogonowski, Projekt Logiki Infinitarnej Ernsta Zermela, Investigationes Linguisticae, vol.XIV, praca dostępna w internecie

[93] J.Pogonowski, Geneza matematyki według kognitywistów, Investigationes Linguisticae, vol.XXIII, pp.106-146, 2001

[94] P.Raatikainen, Hilbert’s program revisited, (Synthese 137: 157–177, 2003.) http://www.mv.helsinki.fi/home/praatika/Hilbert’s Program Revisited.pdf

[95] H.Rasiowa, Wstęp do matematyki współczesnej, PWN,1989.

[96] B.Russell, Wstęp do filozofii matematykiPWN Wwa 1958.

[97] K.A.Ross, Ch.R.B.Wright, Matematyka dyskretna, PWN, 2000.

[98] B.Rosenblum, F.Kuttner, Zagadka teorii kwantów, Prószyński i S-ka, 2013.

[99] M.Rossberg, First order logic, second order logic and completness, http://homepages.uconn.edu/ mar08022/papers/RossbergCompleteness.pdf (5.09.2012)

[100] G.Sambin, Intuitionistic formal spaces,http://www.math.unipd.it/ sambin/txt/ifs87-97.pdf,15.09.2012)

[101] J.P.Seldin, Lambda-Calculus and Functional Programming, artykuł znaleziony w internecie

[102] J.P.Seldin, The Logic of Curry and Church, http://www.logic.amu.edu.pl/images/c/c5/Currychurch.pdf(10.10.2012)

[103] S.Shaprio, Foundations without Foundationalism A Case for Second-order Logic, OxfordUniversity Press, 2006 (dostępne również w internecie)

[104] W.Sieg, Theory of computability, http://www.phil.cmu.edu/summerschool/2006/Sieg/computability-theory.pdf (15.10.2012)

[105] S.G.Simpson, Subsystems of Second Order Arithmetic,(rozdział 1), https:www. math.psu.edu/simpson/sosoa/chapter1.pdf

[106] C.Smoryński, Godel incompletness theorem, in: Proof Theory and Constructive Mathematics,Part D.

[107] R.Smullyan, Na zawsze nierozstrzygnięte - zagadkowy przewodnik po twierdzeniach Godla(tłum. J.Pogonowski) Książka i Wiedza, 2007.

[108] M.H.Soersten, P.Urzyczyn, Lectures on the Curry-Howard Isomorphism, draft-paper.

[109] Ch.Strachey, Fundamental Concepts in Programming Languages, Higher-Order and SymbolicComputation, 13, 11–49, 2000

[110] T.Streicher, Introduction to Constructive Logic and Mathematics, http:www.mathematik.tu-darmstadt.de/ streicher/CLM/clm.pdf.

Page 250: Poukładać matematykę (lub przynajmniej próbować)grzegorz/r1.pdfformal systems, at the expense of philosophical substance. Thus it is the mathematical profession that tends to

BIBLIOGRAFIA 249

[111] T.Streicher, Realizability, http:www.mathematik.tu -darmstadt.de/ streicher/REAL/REAL.pdf

[112] L.Susanka, What are we (mathematicians) doing? internet (???).

[113] K.Świrydowicz, Podstawy logiki modalnej, Wyd. Naukowe UAM, Poznań 2004.

[114] J.Szymanik, Paradoks implikacji: próba wyjaśnienia - http://kf.mish.uw.edu.pl/mishellanea/m2/m2 15.pdf (3.11.2012)

[115] T.Tait, Finitism, The Journal of Philosophy 78, 1981, pp.524-546.

[116] P.Taylor, Practical Foundations of Mathematics, Cambridge Studies in Advanced Mathema-tics 59 (1999)

[117] A.Tarski, Wprowadzenie do logiki, Philomat (internet)

[118] A.Tarski, The Semantical Conception of True, Philosophy and Phenomenological Research4 (1944) ( http://www.ditext.com/tarski/tarski.html) (5.10.2012)

[119] S.Thompson, Type Theory and Functional Programming, 1999 (internet)

[120] A.S.Troelstra, Constructivism and proof theory, internet

[121] A.S.Troelstra, History of constructivism in the 20th century, http://staff.science.uva.nl/ an-ne/hhhist.pdf (15.10.2011)

[122] A.S.Troelstra, Kleene’s realizability, http:oai. cwi.nl/oai/asset/13500/13500A.pdf

[123] K.Trzęsicki, Metodologiczne i teoriopoznwacze przesłanki klasycznego problemu rozstrzygal-ności, http: www.calculemus.org/neumann/odczyty/trzesicki2.pdf (10.12.2011)

[124] C.F von Weizsacker, Filozofia grecka a fizyka współczesna, Zagadnienia Filozoficzne w NauceII , 1979/80, s.1–17.

[125] K.Wojtowicz, Paradoksy skończoności, Zagadnienia filozoficzne w nauce XVIII 1996,s.87–100.

[126] J.Vaananen, Lindstrom’s Theorem, http://www.math.helsinki.fi/logic/opetus/lt/lindstrom theorem1.pdf

[127] J.Vaananen, Second order logic and foundation of mathematics, Bull.Symbolic Logic, 7(4)504-520, 2001.

[128] J.Vaananen, Second order logic, set theory and foundation of mathematics,(http:www.math.helsinki.fi/logic/people/ jouko.vaananen/ (15.09.2011))

[129] J.Vaananen, Second order logic or set theory?, internet

[130] S.Valentini, Meta-mathematical aspects of Martin-Lof ’s type theory, http://www.math.unipd.it/ silvio/papers/PhDThesis/TypeTheory.pdf (10.06.2012)

[131] S.Vermeeren, Realizability Toposes, https://stijnvermeeren.be/download/ mathema-tics/essay.pdf

[132] N.Weawer, Forcing for mathematicians, World Scientific,2014

[133] S.Wolfram, A New Kind of Science, Wolfram Media, 2002