Wstępdoteoriimnogości - Forum PLpolibuda.dyn.pl/logika/teoriamn.pdf ·...

62
–1– Podstawy matematyki dla informatyków Wstęp do teorii mnogości Proponowana literatura Podręczniki: [1] Kazimierz Kuratowski, Andrzej Mostowski, Teoria mnogości, Monografie Matematyczne t. XXVII, W-wa 1978, [2] Jerzy Tiuryn, Wstęp do teorii mnogości i logiki, Wrocław 2000, [3] Helena Rasiowa, Wstęp do matematyki współczesnej, PWN W-wa 2003, [4] Zofia Adamowicz, Paweł Zbierski, Logika matematyczna, PWN W-wa 1991, [5] Agnieszka Wojciechowska, Elementy logiki i teorii mnogości, PWN W-wa 1979. Zbiory zadań: [1] Igor A. Ławrow, Łarisa L. Maksimowa, Zadania z teorii mnogości, logiki matematycznej i teorii algorytmów, PWN W-wa 2004, [2] Janusz Onyszkiewicz, Wiktor Marek, Elementy logiki i teorii mnogości, PWN W-wa 2004.

Transcript of Wstępdoteoriimnogości - Forum PLpolibuda.dyn.pl/logika/teoriamn.pdf ·...

– 1 –

Podstawy matematyki dla informatyków

Wstęp do teorii mnogości

Proponowana literatura

Podręczniki:

[1] Kazimierz Kuratowski, Andrzej Mostowski, Teoria mnogości, Monografie Matematyczne t.XXVII, W-wa 1978,

[2] Jerzy Tiuryn, Wstęp do teorii mnogości i logiki, Wrocław 2000,[3] Helena Rasiowa, Wstęp do matematyki współczesnej, PWN W-wa 2003,[4] Zofia Adamowicz, Paweł Zbierski, Logika matematyczna, PWN W-wa 1991,[5] Agnieszka Wojciechowska, Elementy logiki i teorii mnogości, PWN W-wa 1979.

Zbiory zadań:

[1] Igor A. Ławrow, Łarisa L. Maksimowa, Zadania z teorii mnogości, logiki matematycznej iteorii algorytmów, PWN W-wa 2004,

[2] Janusz Onyszkiewicz, Wiktor Marek, Elementy logiki i teorii mnogości, PWN W-wa 2004.

– 2 –

Zarys historii teorii mnogości

Ewolucja myśli matematycznej przebiega w sposób nieprzerwany od co najmniej 5 000lat. Wiodła ona od, jak byśmy to dziś powiedzieli, aplikacji arytmetycznych poprzez rozwójgeometrii i algebry oraz próby formalizacji idei matematycznych z wykorzystaniem dorobkufilozofów zwanego od czasów Arystotelesa logiką. Wraz ze wzrostem poziomu komplikacji anal-izowanych obiektów matematycy potrzebowali coraz to nowych narzędzi pozwalających na jed-noznaczny opis zarówno nowouzyskiwanych wyników jak i tych, które były znane stosunkowodawno, ale język ich opisu był mało prezyzyjny. Takie pojęcia jak zbiór i zawieranie byływ przeszłości rozumiane intuicyjnie, między innymi z uwagi na geometryczne odniesienia, inie budziły sporów interpretacje tych pojęć. Kłopoty zaczęły się pojawiać w momencie, gdyobiektem rozważań były pojęcie równoliczności zbiorów, czy też pojawienia się w kontekściezbioru pojęcia liczby czy wielkości. Jednym z takich problemów był problem nieograniczonej„podzielności” czy „rozciągliwości” badany już przez pitagorejczyków. Ten problem prowadziłczęsto do kłopotów natury filozoficznej i dotykał on zarówno eleatów jak Bolzana i Cantora.

Po raz pierwszy z zagadniem równoliczności lub bardziej precyzyjnie uogólnionej równolicz-ności pojawia się w pracach Galileusza, który wykazuje wzajemnie jednoznaczną odpowiedniośćmiędzy liczbami naturalnymi i ich drugimi potęgami.

Dziś wydaje się co najmniej niezrozumiałe, jak przez całe wieki mogły być utrzymywane ikultywowane poglądy matematyczne, o których dziś wiemy, że były nieprecyzyjne lub całkowiciebłędne. Wytłumaczenie tego zjawiska wydaje się jednak być dość nieskomplikowane. Mi-anowicie, nie istnieło wewnętrzne zapotrzebowanie matematyki na precyzje w tym względzie.Rozwój analizy matematycznej jaki dokonał się w XIX wieku za sprawą wielu ówczesnychmatematyków wśród których należy wymienić Cauchy’ego, Weierstrass’a, Bolzano, Riemanna,Poincarego, Mittag-Leffera, Cantora, Dedekinda, Bernsteina i Peano. Ta lista nie jest oczywiściekompletna, ale wymienione nazwiska wskazują na rangę dostrzeżonego problemu.

Bez wątpienia za ojca teorii mnogości w jej dzisiejszym rozumieniu należy uznać matem-atyka niemieckego Georga Ferdynanda Ludwiga Cantora (1845-1918). Wychodząc od analizyprac Riemanna doszedł problemów związanych z przeliczalnością oraz konstruowaniem liczbrzeczywistych. W latach 1878-1884 Cantor ogłosił cykl sześciu rozpaw poświęconych prob-lemom równoliczności, teorii zbiorów całkowicie uporządkowanych, własnościom topologicznymR i Rn, a także problemom miary. Wprowadzenie w 1882 roku przez Cantora pojęcia zbioru do-brze uporządkowanego daje podstawę do badania liczb kardynalnych oraz pozwala sformułować„hipotezę continuum”. Opór matematyków wobec wyników Cantora był dość jednolity i twardy.Jedynie Carl Weierstrass był nastawiony do jego wyników życzliwie. Opór ten powodowany byłrewolucyjnym charakterem tych wyników, burzyły one bowiem ponad dwutysięczną tradycjęmatematyczną. Po wynikach Cantora przyszła kolej na uzupełniejące je rezultaty Bernsteinai Zermelo. Prawdziwym sojusznikiem Cantora w pracach nad teorią mnogości był Julius Wil-helm Richard Dedekind (1831-1916). Niektóre spośród wyników uzyskanych przez Cantora ijego kontunuatorów były odkryte przez Dedekinda jednak nie zostały one opublikowane. Cowięcej wiele wyników tego ostatniego pokazało jak w pełni należy stosować teorie aksjomaty-czne. Mianowicie, Dedekind rozważając ogólne przypadki zbiorów, a nie tylko zbiorów całkowicie

– 3 –

uporządkowanych, dochodzi do zbiorów kratowych i gruntownie analizuje ich własności. Chociażw odróżnieniu od wyników Cantora, rezultaty uzyskane przez Dedekinda nie znalazły natych-miastowego zastosowania, to okazały się one niezwykle ważnie już w nieodległej przyszłości.Wyniki prac Cantora pozwoliły na formalizację matematyki, a jednocześnie dały początek

upowszechnianiu się metod aksjomatycznych. Jednak poza tym osiągnięciem dały one początekkryzysowi podstaw matematyki. Pojawiły się oto paradoksy teorii mnogości. Większość z nichbyła bliźniaczo podobna, pod względem natury, do tych z jakimi zetknięto się wcześniej przyodkryciu geometrii nieeuklidesowych. Skonstatować to można sformułowaniem zaczerpniętym zElementów historii matematyki Nicolasa Bourbaki, że próżne są próby zbudowania jakiejkolwiekteorii matematycznej za pomocą odwoływania się (jawnego lub nie) do „intuicji”. Szło zatemo to, by dla teorii mnogości stworzyć podstawę aksjomatyczną analogiczną do układu aksjo-matów geometrii elementarnej, bez dociekania co nazywamy zbiorem, w sensie natury obiektu,jak również nie jest definiowane przynależenie do zbioru, a jedynie wyraźnie formułowane sąwarunki charakteryzujące przynależność do ustalonego zbioru. Pierwszym, który zbudował takąaksjomatyzację był Zermelo i stało się to w 1908 roku. Próba ta uzupełniona przez wynkiSkolema i Fraenkla pozwoliła na konstrukcję aksjomatyki teorii mnogości, jednak ceną jakąnależało za to zapłacić, była komieczność wprowadzenia także reguł logiki.

Literatura

[1] N. Bourbaki – Elementy historii matematyki, PWN Warszawa 1980,[2] A.P. Juszkiewicz – Historia matematyki (od czasów najdawniejszych do początku czasównowożytnich), Tom 1-3, PWN Warszawa 1975,

[3] K.Kuratowski, A. Mostowski – Teoria mnogości, Monografie Matematyczne XXVII, War-szawa 1978,

[4] R. Murawski – Filozofia matematyki – zarys dziejów, Wydawnictwo Naukowe PWN 1995

– 4 –

Ważne osoby i daty w rozwoju teorii mnogości

• Julius Wilhelm Richard DEDEKIND (∗1831 Braunschweig w Niemczech –†1916 Braun-schweig w Niemczech), nowoczesna teoria liczb algebraicznych, prakroje Dedekinda.

• Paul David Gustav DU BOIS-REYMOND (∗1831 Berlin –†1889 Freiburg w Niemczech),badał szeregi liczbowe, a przy tym wniósł wiele do teorii zbiorów.

• Georg Ferdynand Ludwig CANTOR (∗1845 St Petersburg w Rosji –†1918 Halle w Niem-czech), twórca teorii mnogości, która wpłynęła na rozwój całej matematyki, a w szczególnoś-ci na podstawy współczesnej analizy matematycznej, konstrukcja Cantora liczb rzeczy-wistych.

• Magnus Gosta MITTAG-LEFFLER (∗1846 Sztokholm –†1927 Sztokholm), twórca skandy-nawskiej szkoły matematycznej, przyczynił się do uporządkowania teorii mnogości.

• Ernst Friedrich Ferdinand ZERMELO (∗1871 Berlin –†1953 Freiburg w Niemczech), badałpodstawy matematyki, autor fundamentalnych prac z teorii mnogości w szczególności ak-sjomatyki teorii mnogości.

• Julius Henri POINCARE (∗1854 Nancy we Francji –†1912 Paryż), zajmował się wielomadyscyplinami matematycznymi, a także fizyką i filozofią. Jego prace dotyczące podstawmatematyki stanowiły istotny wkład w rozwój teorii mnogości.

• Adolf Abraham Halevi FRAENKEL (∗1891 Monachium –†1965 Jerozolima), wspólnie zFraenklem i Cantorem współtworzył współczesną teorię mnogości.

• Friedriech Ludwig Gottlob FREGE (∗1848 Wismar w Mecklenburgii-Schwerinie w Niem-czech –†1925 Bad Kleinen w Niemczech), pierwsze ujęcie rachunku zdań jako sformali-zowanej teorii aksjomatycznej.

• Giuseppe PEANO (∗1858 Cuneo na Sardynii – †1932 Turyn we Włoszech), atytmetykajako teoria aksjomatyczna sformalizowana (Arytmetyka Peano).

• David HILBERT (∗1862 Królewiec w Prusach Wschodnich – †1943 Getynga w Niemczech),jego badania nad podstawami geometrii (1898-1902) zapoczątkowały nowoczesną, aksjo-matyczną budowę teorii matematycznych (23 problemy Hilberta, teoria spektralna opera-torów liniowych – podstawowy aparat mechaniki kwantowej).

• Bertrand Arthur William RUSSEL (∗1872 Ravenscroft w Walii – †1970 Penrhyndendraethw Walii), w 1902 r analizując zaproponowany przez Fregego system logicznych podstawmatematyki zauważył w nim sprzeczność polegającą na tzw. paradoksie klas (antynomiaRussella), w 1903 ogłosił „Principles of Mathematics”, w których starał się sprowadzićteorię mnogości, a nawet całą matematykę do logiki, w 1908 r stworzył zasady tzw. teoriitypów logicznych. W latach 1910-1913 B.A.W. Russell wraz z Alfredem North Whitehea-dem (∗ 1861 Ramsgate hrabstwo Kent w Anglii – † 1847 Cambridge w Massachusetts USA)napisali i opublikowali „Principia Mathematica” (t. I–III), w której ideą przewodnią byłoposzukiwanie podstaw matematyki w zasadach logicznych, rezultatem zaś przedstawieniematematyki w postaci systemu sformalizowanego oraz nadanie współczesnego kształtu log-ice matematycznej.

• John (Janos) von NEUMANN (∗1903 Budapeszt –†1957 Waszyngton), matematyk, chemik,fizyk, informatyk współtwórca broni atomowej. Jego badania z teorii mnogości przyczyniły

– 5 –

się do wykorzystania uzyskanych przez niego wyników w zastosowaniach praktycznych orazdo uszlachetnienia wielu wyników.

• Henri Leon LEBESGUE (∗1875 Beavais we Francji –†1941 Paryż), twórca ogólnej teoriimiary i całki. W trakcie badań nad tymi teoriami uzyskał ważne dla teorii mnogości wyniki.

• Wacław SIERPIŃSKI (∗1882 Warszawa –†1969 Warszawa), badał teorię liczb, topologięi teorię mnogości. W 1912 roku napisał fundamentalną książkę dotyczącą tej ostatniejdyscypliny, w której zamieścił również wiele własnych wyników.

• Kurt GODEL (∗1906 Brunn w Austrowęgrzech obecnie Brno w Czechach –†1978 Princetonw stanie Nowy Jork w USA), niepełność teorii aksjomatycznych sformalizowanych zawiera-jących arytmetykę. Twierdzenie o niesprzeczności hipotezy continuum zaksjomatyką teoriimnogości.

• Kazimierz KURATOWSKI (∗1896 Warszawa –†1980 Warszawa), jeden z twórców LwowskiejSzkoły Matematycznej, badacz teorii mnogości, topologii, teorii grafów, analizy matematy-cznej i podstaw matematyki. Jego wyniki badań z podstaw matematyki przyczyniły się douporządkowania tej dyscypliny (lemat Kuratowskiego-Zorna).

• Stanisław Marcin ULAM (∗1909 Lwów –†1984 Santa Fe w USA), twórca metody MonteCarlo, wszechstronny matematyk o zdolnościach przenoszenia wyników matematycznychdo innych nauk. Jego prace z teorii procesów stochastycznych, równań różniczkowychcząstkowych, analizy funkcjonalnej oraz ich zastosowania w fizyce przyczyniły się do badańproblemów teorii mnogości. Niektóre z jego wyników prac pozostają utajnione po dziś dzień,ze względu na ich wykorzystanie przy konstrukcji bomby atomowej i wodorowej. BezspornieStanisław Ulam jest uważany za twórcę koncepcji bomby wodorowej, był on także stałymkonsultantem w trakcie jej budowy.

• Paul Joseph COHEN (∗1934 Long Branch, New Jersey), niezależność hipotezy continuum(1963), medal Fieldsa w 1966.

– 6 –

0. Wprowadzenie

Warto dodać, że tak jak logika matematyczna korzysta z pojęć teorii mnogości, tak teoriamnogości wykorzystuje wiele pojęć logiki. W tej części wykładu nie będziemy formalizować pojęćlogiki matematycznej, będzie to przedmiotem drugiej części. Jednak z uwagi na użytecznośćpodstawowych faktów logicznych przedstawimy je w znacznym uproszczeniu. Dodać należy, żeposłużymy się logiką znaną z nauki w szkole średniej. Jest to w penym sensie klasyczne podejściedo tej dyscypliny, odmienne od podejścia które zaprezentowane w części poświęconej logice. Tenlogiczny dualizm jest jednak konieczny ze względu na gradację trudności.Niech Z oznacza zbiór wszystkich zdań orzekaja↪cych odnoszących się do matematyki. Niech

ponadto 0 będzie symbolem fałszu, natomiast 1 symbolem prawdy. Funkcję w : Z → {0, 1}nazywamy wartościowaniem. Przyjmijmy umowę, że elementy zbioru Z będziemy oznaczaćmałymi literami alfabetu:

p, q, r, s, p1, q1, r1, s1, p2, q2, r2, s2, . . . ,

których może być nawet nieskończenie wiele. Litery oznaczać będą obiekty zwane zmiennymizdaniowymi.Narzędziem zaczerpniętym z języka potocznego są spójniki, zwane w logice również funk-

torami zdaniotwórczymi. Pozwalają one budować ze zdań prostych zdania złożone. I tak, zamiastpisać „nie” użyjemy symbolu ∼ (symbolizyje on zdeformowaną literę N, od nego, co oznaczaprzeczę), zamiast pisać „jeśli ..., to” zapiszemy ⇒, symbol ⇔ będzie zastępował zwrot „wtedy itylko wtedy” (lub krótko „wtt”), symbol ∧ oznaczać będzie „i”, zaś symbol ∨ będzie zastępowałspójnik „lub”.Oprócz spójników (funktorów zdaniotwórczych) posługiwać się będziemy nawiasami: otwie-

rającym „(” oraz zamykającym „)”. W oparciu o nawiasy, funktory zdaniotwórcze i zmiennezdaniowe tworzyć będziemy formuły rachunku zdań. Kazda z takich formul staje sie↪ zdaniem,gdy w miejsce zmiennych zdaniowych wstawimy zdania – oczywiscie w miejsce ustalonej literywstawiamy to samo zdanie.Nawiasy, wymienione jako element skladowy formul zdaniowych ulatwiaja↪, a niekiedy wre↪cz

umozliwiaja↪, odczytanie takiej formuly – gdy w zbiorze funktorow nie zostala wprowadzonahierarchia “mocy wia↪zania”.Wsrod wszystkich formul rachunku zdan szczegolnie wazna↪ role↪ pelnia↪ formuly prawdziwe

bez wzgle↪du na wartosc logiczna↪ wyste↪puja↪cych w nich zmiennych zdaniowych. Formuly takienazywamy tautologiami i w zapisie dla podkreślenia tego faktu poprzedzamy symbolem �. Rolatautologii polega na tym, ze za ich pomoca↪ mozemy dokonywac operacji logicznych niezaleznieod tresci zdan, ktore “logicznie” przeksztalcamy.Osobnym zagadnieniem jest sprawdzenie czy dana formula jest tautologia↪. Przedstawimy

pochodzącą od Ernsta Schrodera metodę zerojedynkową, lub inaczej metodę tablicową. Polegaona na rozpatrzeniu wszystkich ukladow wartosci logicznych zmiennych zdaniowych wyste↪puja↪-cych w danym wyrazeniu. Metoda ta nazywana jest niekiedy metoda↪ matrycowa↪, ze wzgle↪duna poslugiwanie sie↪ w niej tabelkami matrycowymi, przedstawiaja↪cymi w jaki sposob wartosclogiczna zdania zlozonego utworzonego przy pomocy danego funktora, lub funktorow, jest wyz-naczona przez wartosci logiczne zdan skladowych. Pozostaja↪c przy dotychczasowych umowachmozemy zdefiniowac poszczegolne funktory. W tym celu posluzymy sie↪ naste↪puja↪ca↪ tabela↪.

– 7 –

w(p) w(q) w(∼ p) w(p ∧ q) w(p ∨ q) w(p⇒ q) w(p⇔ q)0 0 1 0 0 1 10 1 1 0 1 1 01 0 0 0 1 0 01 1 0 1 1 1 1

Metode↪ zerojedynkowa↪ zilustrujemy naste↪puja↪cym przykladem.

Przyk�lad. Sprawdzimy czy formula (p ⇒ q) ⇒ [(q ⇒ r) ⇒ (p ⇒ r)] jest tautologia↪rachunku zdan.

w(p)00001111

w(q)00110011

w(r)01010101

w(p⇒ q)11110011

w(q ⇒ r)11011101

w(p⇒ r)11110101

w[(q ⇔ r) ⇒⇒ (p⇒ r)]11110111

w{(p⇒ q)⇒⇒ [(q ⇔ r) ⇒ (p⇒ r)]}

11111111

Tabela ta pokazuje w jaki sposób należy postępować dla sprawdzenia czy rozpatrywanaformuła jest tautologią. Ponieważ ostatnia kolumna składa się z samych jedynek, to oznacza to,że dla wszystkich możliwych układów wartości logicznych zdań składowych, zbudowanych zgdniez formułą, otrzymujemy zdanie prawdziwe. Zatem badana przez nas formuła jest tautologia↪. �

Przedstawimymy teraz kilka wazniejszych tautologii, ktorych sprawdzenie pozostawiamy dosamodzielnego wykonania przy uzyciu obu przedstawionych metod.

postac prawa nazwa prawa� w(p ∨ q) = w(q ∨ p) przemiennosci alternatywy

� w(p ∧ q) = w(q ∧ p) przemiennosci koniunkcji

� w(p ∨ (q ∨ r)) = w((p ∨ q) ∨ r) �la↪cznosci alternatywy

� w(p ∧ (q ∧ r)) = w(p ∧ q) ∧ r) �la↪cznosci koniunkcji� w(p ∧ (q ∨ r)) = w((p ∧ q) ∨ (p ∧ r)) rozdzielnosci koniunkcji wzgle↪dem alternatywy

� w(p ∨ (q ∧ r) = w((p ∨ q) ∧ (p ∨ r)) rozdzielnosci alternatywy wzgle↪dem koniunkcji

� w(p∨ ∼ p) = 1 wy�la↪czonego srodka

� w(p⇐⇒ p) = 1 tozsamosci

� w(∼ (p∧ ∼ p)) = 1 sprzecznosci

� w(p⇔∼ (∼ p)) = 1 podwojnego przeczenia

� w([(p⇒ q) ∧ (q ⇒ r)] ⇒ (p⇒ r)) = 1 sylogizmu

� w((∼ p⇒ p)⇒ p) = 1 sprowadzania do niedorzecznosci

� w(p⇒ q) = w(∼ q ⇒∼ p) kontrapozycji

� w(p ∧ (p⇒ q) ⇒ q) = 1 regu�la odrywania

Zajmiemy sie↪ teraz bardzo waznymi z praktycznego punktu widzenia tautologiami zwanymiprawami de Morgana. Pozwalaja↪ one przeczyc funktorom dwuczlonowym i sa↪ cze↪sto wykorzysty-wane w dowodach nie wprost.

– 8 –

postac prawa nazwa prawa� w(∼ (p ∧ q)) = w(∼ p∨ ∼ q) prawo de Morgana dla koniunkcji

� w(∼ (p ∨ q)) = w(∼ p∧ ∼ q) prawo de Morgana dla alternatywy

Bezposrednia↪ konsekwencja↪ praw de Morgana dla zdan sa↪ naste↪puja↪ce tautologie:

w(∼ (p⇒ q)) = w(p∧ ∼ q)

w(∼ (p⇐⇒ q)) = w([(p∧ ∼ q) ∨ (q∧ ∼ p)])

W matematyce spotykamy sie↪ cze↪sto z poje↪ciami warunku koniecznego i warunku wystar-czaja↪cego. Poje↪cia te wia↪za↪ sie↪ z funktorami implikacji i rownowaznosci. Rozwazmy implikacje↪

p =⇒ q, (∆)

w ktorej zdanie p nazywamy poprzednikiem, a zdanie q naste↪pnikiem implikacji (∆). Mowimywtedy ze zdanie q jest warunkiem koniecznym dla p, natomiast p jest warunkiem dostatecznymdla q.Dla implikacji (∆) implikacje↪

p⇐= q, (lub inaczej q =⇒ p) (∇)

nazywamy odwrotna↪.Jesli prawdziwe sa↪ implikacja prosta i implikacja odwrotna, to zdanie p ⇐⇒ q nazywamy

warunkiem koniecznym i wystarczaja↪cym.

1. Zbiory i operacje na zbiorach

W teorii mnogości, podobnie jak w każdej dyscyplinie matematycznej, korzystamy z pojęćprzyjmowanych bez definicji tak zwanych pojęć pierwotnych. Zaliczamy do nich: pojęcie zbiorui pojęcie przynależności do zbioru lub inaczej bycie elementem zbioru. Zamiast mówić, że ajest elementem zbioru A piszemy a ∈ A, jeśli natomiast a nie jest elementem zbioru A piszemya �∈ A. Jeśli zajmujemy się ustaloną teorią matematyczną (w naszym przypadku teorią mnogoś-ci), to poza pojęciami pierwotnymi przyjmuje się bez dowodu pewną liczbę własności (twierdzeń)odnoszących się do obiektów teorii (w naszym przypadku zbiorów) zwanych aksjomatami i woparciu o taki zestaw narzędzi formułowane są dalsze własności obiektów tej teorii. Istnienietakiej kolekcji pojęć pierwotnych i aksjomatów w przypadku ustalonej teorii pozwala nazwać jąteorią aksjomatyczną. Jak już mówiliśmy w części poświęconej historii teorii mnogości dyscyplinata ma aksjomatykę zwaną aksjomatyką Zermelo-Fraenkla.

Rozpatrzmy dwa dowolne zbiory A i B. Mówimy, że A jet równy B wtedy i tylko wtedy,gdy zbiory te mają identyczne elementy. Zwykle fakt ten wyrażamy pisząc:

A = B wtedy i tylko wtedy, gdy dla każdego a zachodzi: a ∈ A wtt a ∈ B.

– 9 –

Zależność tę nazywamy zasadą ekstensjonalności.Mówimy, że A jest podzbiorem B lub równoważnie A jest zawarty w B wtedy i tylko wtedy,

gdy każdy element zbiotu A jest elementem zbioru B. Piszemy wtedy A ⊆ B. Niekiedy o zbiorzeB mówimy, że jest nadzbiorem zbioru A. Jeśli A ⊆ B i A �= B, to A nazywamy podzbioremwłaściwym zbioru B i piszemy wtedy A �⊆ B. Zbiór nie zawierający żadnego elementu nazywamyzbiorem pustym i oznaczamy symbolem ∅. Na mocy zasady ekstensjonalności istnieje dokładniejeden zbiór pusty.Zbiór będziemy uważać za określony jeśli zostało podane kryterium pozwalające rozstrzyg-

nąć czy dany element należy, czy też nie należy do rozpatrywanego zbioru.

W zależności od sposobu określenia i rodzaju zbioru oznaczamy go symbolem {a1, . . . , an},gdy zbiór jest skończony i składa się z n elementów, albo {x| w(x)}, gdzie w(x) jest warunkiemcharakteryzującym dany zbiór. Zamiast A ∩ {x| w(x)} będziemy pisać {x ∈ A| w(x)}. Jeżeli Ajest zbiorem, którego elementami są zbiory, to A nazywać będziemy rodziną zbiorów.Jeśli A i B są dowolnymi zbiorami, to przez sumę tych zbiorów rozumiemy zbiór A ∪ B,

którego elementami są te i tylko te elementy, które należą do zbioru A lub do zbioruB. Natomiastiloczynem (przecięciem) zbiorów nazywamy zbiór A ∩ B, którego elementami są te i tylko teelementy, które są równocześnie elementami zbioru A i zbioru B. Różnicą zbioru A i B nazywamyzbiór A\B, złożony z tych i tylko tych elementów, które należą doA i nie należą do B. Dla zbioruA symbolem P(A) lub też 2A oznaczać będziemy zbiór złożony ze wszystkich podzbiorów tegozbioru i nazywać go będziemy zbiorem potęgowym zbioru A. Jeżeli w odniesieniu do ustalonegozbioru A rozważania ograniczymy tylko do jego podzbiorów (tj. elementów P(A)), to zbiór Anazywać będziemy wtedy przestrzenią.Działania sumy i iloczynu dwóch zbiorów można rozszerzyć na większą liczbę zbiorów, to

znaczy na rodziny zbiorów. Dla rodziny zbiorów A jej sumę oznaczamy przez ⋃A i mamywtedy:

x ∈⋃A wtt, gdy istnieje A ∈ A, że x ∈ A.

Podobnie definiujemy iloczyn rodziny zbiorów⋂A. Mamy mianowicie:

x ∈⋃A wtt, dla każdego A ∈ A, że x ∈ A.

Rozpatrzmy teraz sytuację, kiedy element x nie należy odpowiednio do sumy zbiorów,iloczynu zbiorów oraz różnicy zbiorów. A zatem, jeśli x �∈ A ∪ B, to zgodnie z definicją sumyzbiorów x �∈ A i x �∈ B. Z kolei jeśli x �∈ A∩B, to x �∈ A lub x �∈ B. Natomiast fakt, że x �∈ A\Boznacza na mocy definicji, że x �∈ A lub x ∈ B.Zatem symbolicznie możemy wyrazić te uwagi pisząc:

x �∈ A ∪B ⇐⇒x �∈ A ∧ x �∈ B,x �∈ A ∩B ⇐⇒x �∈ A ∨ x �∈ B,x �∈ A \B ⇐⇒x �∈ A ∨ x ∈ B.

Przez formułę rachunku zbiorów rozumiemy wyrażenie utworzone z symboli zbiorów, symbolioperacji na zbiorach i nawiasów. Podobnie jak w przypadku formuł rachunku zdań tautologiaminazuwać będziemy te spośród formuł rachunku zdań, które są prawdziwe niezależnie od doboruwystępujących w nich zbiorów.

– 10 –

(1) Prawa przemienności. Jeśli A i B są dowolnymi zbiorami to

� A ∪B =B ∪A,� A ∩B =B ∩A.

D o w ó d. Wykażemy na wstępie prawdziwość przemienności dla sumy. Przypuśćmy, żex ∈ B ∪ A. Na mocy definicji wiemy, że x ∈ A ∪ B ⇐⇒ x ∈ A ∨ x ∈ B. Z drugiej strony namocy prawa przemienności alternatywy:

� p ∨ q ≡ q ∨ p,

mamy, że x ∈ A∪B ⇐⇒ x ∈ A∪B ⇐⇒ x ∈ A∨ x ∈ B ⇐⇒ x ∈ A∪B ⇐⇒ x ∈ B ∨ x ∈ A⇐⇒x ∈ B ∪A. �

Dowód drugiego z praw przebiega podobnie.

(2) Prawa łączności. Jeśli A, B, C są dowolnymi zbiorami, to prawdziwe są równości:

� A ∪ (B ∪ C) =(A ∪B) ∪C,� A ∩ (B ∩ C) =(A ∩B) ∩C.

Dla dowodu tych praw wystarczy wykorzystać odpowiednio prawo przemienności dla alter-natywy i dla koniunkcji. �

(3) Prawa rozdzielności. Jeśli A, B, C są dowolnymi zbiorami, to prawdziwe są równości:

� A ∩ (B ∪ C) =(A ∩B) ∪ (B ∩ C),

� A ∪ (B ∩ C) =(A ∪B) ∩ (A ∪ C).

W tym przypadku również wystarczy wykorzystać prawa rachunku zdań tj. prawa rozdziel-ności koniunkcji względem alternatywy i alternatywy względem koniunkcji. �

(4) Prawa tautologii. Jeśli A jest dowolnym zbiorem, to prawdziwe są równości:

� A ∪A =A,

� A ∩A =A.

Łatwo udowodnić prawa rachunku zdań:

� p ∨ p ≡ p oraz � p ∧ p ≡ p,

to bezośrednio z tych praw wynikają prawa tautologii. �

(5) Prawa de Morgana. Jeśli A, B, C są dowolnymi zbiorami, to prawdziwe są równości:

� A \ (B ∩ C) =(A \B) ∪ (A \ C),

� A \ (B ∪ C) =(A \B) ∩ (A \ C).

– 11 –

Prawa de Morgana dla zbiorów są konsekwencją praw de Morgana dla zdań. �

Bardziej znana postać praw de Morgana dotyczy dopełnienia zbioru. Jeśli X jest przes-trzenią zaś A ∈ P(X) i B ∈ P(X), to przez dopełnienie zbioru A do przestrzeni X rozumiemyzbiór A = X \ A – podobnie B = X \B. Przy takich oznaczeniach prawa de Morgana możemyzapisać w postaci

� (A ∪B) = A ∩B, � (A ∩B) = A ∪B.

2. Iloczyn kartezjański zbiorów i relacje

Niech A i B będą dowolnymi zbiorami i niech x ∈ A oraz y ∈ B. Wynika stąd, że {x} ⊂ A

oraz {x, y} ⊂ A ∪B, a zatem{{x}, {x, y}} ⊂ P(P(A ∪B)

).

Przyjmujemy umowę notacyjną, że symbol

〈x, y〉 def={{x}, {x, y}}

oznaczać będzie parę uporządkowaną o poprzedniku x i następniku y. Zbiór

{〈x, y〉| x ∈ A ∧ y ∈ B}

nazywamy iloczyniem kartezjańskim (produktem kartezjańskim) zbiorów A i B oraz oznaczamysymbolem A×B.

Niech 〈x, y〉 oraz 〈z, t〉 będą elementami zbioru A×B. Pamiętamy, że 〈x, y〉 ={{x}, {x, y}}

oraz 〈z, t〉 ={{z}, {z, t}}. Skoro pary te są zbiorami to zbadajmy kiedy są one równe. Przy-

puśćmy, że są równe i zastosujmy do nich definicję równości zbiorów. Wynika stąd, że

{z} ∈ {x, y} oraz {z, t} ∈ 〈x, y〉,

a w konsekwencji, że

(1) {z} = {x} lub {z} = {x, y} (2)

oraz(3) {z, t} = {x} lub {z, t} = {x, y} (4)

Równość (1) ma miejsce jedynie wtedy, gdy x = z = y. W takim przypadku równości (3)oraz (4) są równoważne i mamy z = t = x. Mamy więc, że z = t = x. Prowadzi to do wniosku,że x = y = z = t. Jeśli rozpatrzymy przypadek (3), to równość okazuje się także spełniona.Zajmijmy się teraz przypadkiem (4). Wtedy z = x oraz bądź z = y, bądź t = y. Gdy z = y,

to zachodzi równość (2) i otrzymujemy rozpatrywany już przypadek. Gdy natomiast t = y, tomamy x = z i y = t.

– 12 –

Jesli rozpatrzymy teraz implikację odwrotną do dowiedzionej tzn. jeśli przypuścimy, żex = z i y = t, to teza jest oczywista, na mocy definicji równości zbiorów.

Otrzymaliśmy zatem następujące twierdzenie.

Twierdzenie. Warunkiem koniecznym i wystarczającym na to, by pary 〈x, y〉 i 〈z, t〉 byłyrówne jest, by zachodziły równości: x = z oraz y = t. �

Pojęcie iloczynu kartezjańskiego ma łatwą interpretację geometryczną. Jeśli A i B są dowol-nie ustalonymi zbiorami, to elementy zbioru A × B nazywamy niekiedy punktami, zaś zbioryA i B osiami współrzędnych. Jeśli t = 〈x, y〉 jest punktem w A × B, to x nazywamy odciętą,zaś y – rzędną punktu t. Ta intuicja wywodzi się z geometrii płaszczyzny, gdzie zbiór punktówpłaszczyzny może być utożsamiany z iloczynem R×R, przy czym R oznacza zbiór liczb rzeczy-wistych.

Korzystając bezpośrednio z definicji produktu kartezjańskiego możemy wyprowadzić wielepraw wiążących to działanie z działaniami teorii zbiorów.

Przyk�lad. Wykażemy tożsamość: (A ∩B)× C = (A× C) ∩ (B × C).Niech (x, y) ∈ (A ∩B)× C. Wtedy

(x, y) ∈ (A ∩B)× C ⇐⇒ (x ∈ A ∩B) ∧ (y ∈ C)⇐⇒ (x ∈ A ∧ x ∈ B) ∧ y ∈ C ⇐⇒⇐⇒ x ∈ A ∧ (y ∈ C ∧ x ∈ B)⇐⇒ (x ∈ A ∧ y ∈ C) ∧ (x ∈ B ∧ y ∈ C)⇐⇒⇐⇒ (x, y) ∈ A× C ∧ (x, y) ∈ B × C ⇐⇒ (x, y) ∈ (A× C) ∩ (B ×C).

Posługując się podobną techniką dowodową możemy wykazać prawdziwość formuł, o którychmówi następujące twierdzenie.

Twierdzenie. Jeśli A1, A2 oraz B są dowolnymi zbiorami, to

� (A1 ∪A2)×B =A1 ×B ∪A2 ×B,� (A1 \ A2)×B =A1 ×B \A2 ×B,� B × (A1 ∪A2) =B ×A1 ∪B ×A2,

� B × (A1 \ A2) =B ×A1 \B ∪B ×A2,

Dowolny podzbiór iloczynu kartezjańskiego zbioru A×B, tzn. dowolny zbiór par uporząd-kowanych o poprzednikach z A i następnikach z B nazywamy relacją (dwuczłonową). Jeślipodzbiór taki oznaczymy przez � to zamiast pisać 〈a, b〉 ∈ � piszemy czesto a�b i mówimy, że„a jest w relacji � z b”.Dziedziną relacji (dziedziną lewostronną) � nazywamy zbiór D� zawarty w A i złożony

z poprzedników par należących do relacji. Przeciwdziedziną (dziedziną prawostronną) relacji �nazywmy podzbiórR� zbioru B złożony z następników par należących do relacji �. Formalizującte definicje możemy zapisać:

D� = {a ∈ A| istnieje b ∈ B, że a�b} oraz R� = {b ∈ B| istnieje a ∈ A, że a�b}

– 13 –

Przez pole relaji rozumiemy zbiór będący sumą dziedziny i przeciwdziedziny (obu dziedzin)relacji.Niech � ⊂ A×B. Przez wykres relacji rozumiemy zbior

Gr(�) ={〈a, b〉 ∈ A×B| a�b}.

Tak więc wykres relacji i relacja spełniają tę samą definicję, zatem jest to ten sam obiekt.Relacja � ⊂ A×B wyznacza nową relację �−1 ⊂ B ×A w następujący sposób:

(b, a) ∈ �−1 def⇐⇒ (a, b) ∈ �.

Relację �−1 nazywamy relacją odwrotną do relacji �.W takim przypadku mamy, że D�−1 = R� oraz R�−1 = D�.Niech � ⊂ A×B oraz µ ⊂ B × C, będą takie, że D� ⊂ Rµ. Relację η ⊂ A× C taką, że

〈x, z〉 ∈ η ⇐⇒ istnieje y ∈ B, że x�y ∧ y�z.

nazywamy złożeniem (superpozycją) relacji � oraz µ i oznaczamy pisząc η = µ ◦ �.Przykład. Weźmy pod uwagę relacje:

� ⊂ {a, b, c} × {α, γ} i µ ⊂ {α, β, γ} × {−2, 0, 1, 5, 8}

gdzie � =⟨a, α〉, 〈b, α〉, 〈c, γ〉} oraz µ =

{〈α,−2〉, 〈α, 0〉, 〈β, 1〉, 〈γ, 5〉, 〈δ, 8〉}.Złożeniem tych relacji jest relacja η ⊂ {a, b, c} × {−2, 0, 1, 5, 8} taka, że

η = µ ◦ � = {〈a,−2〉, 〈a, 0〉, 〈b,−2〉, 〈b, 0〉, 〈c, 5〉}.

Przykład. Dana jest relacja χ ⊆ {0, 1, 2, 3, . . . , 9} × {0, 1, 2, 3, . . . , 9} zdefiniowana warun-kiem:

aχb⇔ 3a = b ∨ 3a+ 1 = b.

Wyznaczymy relacje↪ χ−1.

Zanim przejdziemy do wyznaczenia relacji χ−1 na wste↪pie wypiszmy precyzyjnie parynaleza↪ce do relacji χ. Mamy:

χ ={〈0, 0〉, 〈0, 1〉, 〈1, 3〉, 〈1, 4〉, 〈2, 6〉, 〈2, 7〉, 〈3, 9〉}.

Bezposrednio z definicji relacji odwrotnej dostajemy, ze

χ−1 ={〈0, 0〉, 〈1, 0〉, 〈3, 1〉, 〈4, 1〉, 〈6, 2〉, 〈7, 2〉, 〈9, 3〉}. �

Twierdzenie. Jeśli � ⊆ A×B, µ ⊆ B × C i ν ⊆ C ×D, to:(i) ν ◦ (µ ◦ �) = (ν ◦ µ) ◦ �;(ii) (µ ◦ �)−1 = µ−1 ◦ �−1.

– 14 –

Dowód. Wykażemy prawdziwość (i). Przypuśćmy, że 〈x, z〉 ∈ A×D. Mają miejsce następującefakty:

〈x, z〉 ∈ � ◦ (µ ◦ ν) wtt, gdy istnieją t ∈ C, że 〈x, t〉 ∈ µ ◦ ν oraz 〈t, z〉 ∈ � wtt, gdyistnieją t ∈ C i y ∈ B, że 〈x, y〉 ∈ � oraz 〈y, t〉 ∈ µ oraz 〈t, z〉 ∈ ν wtt, gdyistnieje y ∈ B, że 〈a, b〉� oraz 〈y, z〉 ∈ ν ◦ µ wtt, gdy 〈x, t〉 ∈ (ν ◦ µ) ◦ �.

Rozpatrzmy teraz przypadek (ii). Niech 〈t, x〉 ∈ C ×A. Wtedy:〈t, x〉 ∈ (µ ◦ �)−1 wtt, gdy 〈x, t〉 ∈ µ ◦ � wtt, gdy istnieje y ∈ B, że 〈x, y〉 ∈ � oraz 〈y, t〉 ∈ µ wtt, gdy

istnieje y ∈ B, że 〈y, x〉 ∈ �−1 oraz 〈t, y〉 ∈ µ−1 wtt, gdy 〈t, x〉 ∈ �−1 ◦ µ−1

Przedstawimy teraz kilka przykladow relacji.

Przyk�lad.a) Niech A = B = A be↪dzie zbiorem wszystkich ludzi zyja↪cych na Ziemi (w dowolnym okresiejej istnienia). Relacje↪ “bycia przodkiem” rozumiemy wtedy jako zbior par 〈a, b〉 takich, zeosoba a jest przodkiem osoby b – bez wzgle↪du na czas dziela↪cy ich daty urodzenia.

b) Niech X = Y = R. Rozwazmy nierownosc y > x + 1. Oznaczmy przez � zbior par 〈x, y〉,ktore spelniaja↪ nasza↪ nierownosc. Sta↪d piszemy: 〈x, y〉 ∈ �⇐⇒ y > x+ 1.

c) Niech niepusty zbiór X będzie przestrzenią, zaś P(X) zbiorem potęgowym X. Zgodniez wprowadzoną poprzednio definicja↪ inkluzji i definicja↪ relacji wiemy, ze mie↪dzy zbioramiA ∈ P(X) oraz B ∈ P(X) zachodzi inkluzja tylko w pewnych przypadkach. Zatem inkluzjajest wlasnoscia↪ par uporza↪dkowanych 〈A,B〉 zbiorow – elementow P(X). Jest wie↪c inkluzja“⊂” podzbiorem produktu P(X) × P(X), a wie↪c relacja↪. �

Dotychczas rozwazalismy przypadki, gdy produkt kartezjanski tworzony byl z dwoch zbio-row, a co za tym idzie relacje odnosily sie↪ do par elementow. W przypadku ogolnym relacjamidwucz�lonowymi w produkcie X × Y , gdzie X i Y sa↪ dowolnymi zbiorami, nazywamy podzbiorytego produktu. Jesli � jest podzbiorem produktu X × X, to miast mowic, ze � jest relacja↪dwuczlonowa↪ w w produkcie X ×X, cze↪sto mowimy, ze � jest relacja↪ dwucz�lonowa↪ w X.W zbiorze wszystkich relacji dwuczlonowych mozemy wyroznic pewne ich klasy. Przedsta-

wimy je w naste↪puja↪cej definicji.Relacje↪ dwuczlonowa↪ � ⊂ X ×X nazywamy:

(i) zwrotna↪def⇐⇒ dla każdego x ∈ X jest x�x;

(ii) przeciwzwrotna↪def⇐⇒ dla każdego x ∈ X jest ∼ (x�x);

(iii) symetryczna↪def⇐⇒ dla każdego x ∈ X oraz y ∈ X jest x�y =⇒ y�x;

(iv) przeciwsymetryczna↪def⇐⇒ dla każdego x ∈ X oraz y ∈ X jest x�y =⇒∼ (y�x);

(v) antysymetryczna↪def⇐⇒ dla każdego x ∈ X oraz y ∈ X jest (x�y) ∧ (y�x) =⇒ (x = y);

(vi) przechodnia↪def⇐⇒ dla każdych x ∈ X i y ∈ X i żdego z ∈ X jest (x�y)∧ (y�z) ⇒ (x�z);

(vii) spojna↪def⇐⇒ dla każdego x ∈ X i każdego y ∈ X jest {(x �= y) =⇒ [(x�y) ∨ (y�x)]

}.

– 15 –

Przyk�lad. Poszczegolne rodzaje relacji zilustrujemy przykładami

a) Relacja przystawania trojka↪tow jest relacja↪ zwrotna↪ w zbiorze wszystkich trojka↪tow.

b) Relacja “wie↪kszosci” liczb w zbiorze liczb rzeczywistych jest przeciwzwrotna.

c) Przykladem relacji symetrycznej jest relacja podzielnosci w zbiorze liczb calkowitych, bokazda liczba calkowita jest podzielna przez sama↪ siebie.

d) Przykladem relacji przeciwsymetrycznej jest relacja wie↪kszosci w zbiorze liczb rzeczywis-tych.

e) Relacja “niewie↪kszosci” w zbiorze liczb rzeczywistych jest przykladem relacji antysymet-rycznej.

f) Rownoleglosc prostych na plaszczyznie jest relacja↪ przechodnia↪.

g) Niech X be↪dzie zbiorem liter alfabetu lacinskigo. Przyje↪ta umowa co do kolejnosci liter wnim zawartych pozwala ustalic relacje↪ “hierarchie↪” wyrazow (hasel) w skorowidzach nazwczy hasel. Tak okreslona relacja jest relacja↪ spojna↪. Podobnie relacja “niewie↪kszosci” (≤)jest relacja↪ spojna↪. �

3. Liczby naturalne

Niech A będzie rodziną zbiorów. Rodzinę tę nazywamy induktywną wtt, gdy:(i) ∅ ∈ A;(ii) dla każdego X ∈ A, zbiór X ∪ {X} ∈ A.Operacją następnika nazywamy operację, króra każdemu zbiorowi X przyporządkowuje

zbiór X ∪ {X}. Następnik zbioru X oznaczamy przez X ′. W aksjomatyce Zermelo-Fraenklaistnienie zbiorów induktywnych gwarantuje aksjomat nieskończoności. Mówiąc krótko wyrażaon istnienie zbiorów nieskończonych.

Twierdzenie. Istnieje najmniejszy zbiór induktywny tj. taki zbiór induktywny A0, że dladowolnego zbioru induktywnego B jest A0 ⊆ B.Dowód. Przypuśćmy, że A jest zbiorem induktywnym . Rozpatrzmy rodzinę zbiorów ∆ taką,że

∆ = {B ⊆ A| B jest zbiorem induktywnym }.

Wynika stąd, że również zbiór A0 =⋂

∆ jest zbiorem induktywnym. Pozostaje wykazać, że Ajest najmniejszym zbiorem induktywnym. Jeśli B jest zbiorem induktywnym, to B ∩ A ∈ ∆. Zkolei z definicji iloczynu zbiorów wynika, że

A0 ⊆ B ∩ A.

Z drugiej strony skoro B ∩ A ⊆ B, to A0 ⊆ B. Z tego, że ostatnia inkluzja zachodzi dlawszystkich elementów rodziny ∆, to A0 jest najmniejszym zbiorem induktywnym, w sensierelacji zawierania. �

– 16 –

Przez zbiór liczb naturalnych rozumiemy najmniejszy zbiór induktywny i oznaczamy goprzez N . Z definicji zbioru induktywnego (warunek (i)), zawiera on zbiór pusty ∅, któryreprezentuje liczbę 0. Z drugiej strony (warunek (ii)), N zawiera następnik 0 (oznaczany sym-bolem 1), a także następnik następnika 0 (oznaczany symbolem 2), itd.

Twierdzenie. (Zasada indukcji) JeśliM⊂ N jest zbiorem liczb naturalnych spełniającymwarunki:

• 0 ∈M,• dla dowolnie wybranej liczby n takiej, że n ∈M, zachodzi n′ ∈M,toM zawiera wszystkie liczby naturalne tj. M = N .Dowód. Teza twierdzenia jest konsekwencją bycia przez N najmniejszym zbiorem induktyw-nym. �

Małymi literami alfabetu będziemy oznaczać elementy zbioru N .Twierdzenie. Dla dowolnych m ∈ N oraz n ∈ N :(i) jeśli m ∈ n, to m ⊆ n;

(ii) n �∈ n;(iii) jeśli m′ = n′, to m = n;

(iv) jeśli m ⊆ n oraz m �= n, to m ∈ n;(v) zachodzi: m ⊆ n lub n ⊆ m;

(vi) zachodzi dokładnie jedna z możliwości: m ∈ n, m = n, n ∈ m.Dowód. Dowód poprowadzimy przez indukcję.

Ad. (i) NiechM = {n ∈ N| dla każdego m ∈ n jest m ⊆ n}. Chcemy wykazać induktywnośćzbioru M. Mamy: 0 ∈ M. Przypuśćmy, że n ∈ M. Po to by wykazać, że n′ ∈ M obierzmydowolne m ∈ n′. Ponieważ n′ = n ∪ {n}, to mamy możliwe dwa przypadki. Jeśli m ∈ n, to zzałożenia indukcyjnego mamy m ⊆ n, a więc m ⊆ n′. Jeżeli zaś m = n, to m ⊆ n′. Wynikastąd, że w każdym z tych przypadków m ⊆ n′, co w konsekwencji dowodzi, że n′ ∈M. �

Ad. (ii) Rozpatrzmy zbiór M = {n ∈ N| n �∈ n}. W takim przypadku 0 ∈ M. Przypuśćmy,że n ∈M i załóżmy, że

n′ ∈ n ∪ {n}.

Wtedy albo n′ ∈ n albo n′ = n. Jeśli n′ ∈ n, to korzystając z warunku (i) mamy n ∪ {n} ⊆ n,co oznacza, że n ∈ n – co przeczy założeniu indukcyjnemu. Jeśli zaś n′ = n, to otrzymujemysprzeczność z założeniem indukcyjnym. Zatem przypuszczenie, że n′ ∈ n ∪ {n} jest błędne.Dowodzi to, że n′ ∈M. �

Ad. (iii) Teraz załóżmy, że m ∪ {m} = n ∪ {n}. Wynika stąd, że m musi należeć do zbioru poprawej stronie znaku równości. Jeśli m ∈ n, to na mocy (i) mamy, że m ⊆ n. Gdy zaś m = n,to także m ⊆ n. Z symetrii założeń wynika również n ⊆ m, co prowadzi do równości m = n. �

Ad. (iv) Niech teraz M = {n ∈ N| dla każdego m ⊆ n, jeśli m �= n, to m ∈ n}. Na pewno

– 17 –

0 ∈M – bo zbiór pusty nie zawiera podzbiorów właściwych. Przypuśćmy, że n ∈M i niech

m ⊆ n′. (∗)

Załóżmy, że m jest podzbiorem właściwym zbioru n′. Pokażęmy, że m ∈ n′. Jeśli n ∈ m, to napodstawie (i) jest n ⊆ m, zatem n′ ⊆ m i z załóżenia: m ⊆ n′, otrzymujemy róność n′ = m – awięc sprzeczność. Mamy zatem n �∈ m. Z założenia (∗) otrzymujemy

m ⊆ n.

Jeśl m = n, to m ∈ n′. Niech zatem m �= n. Ponieważ m jest podzbiorem właściwym n, to zzałożenia indukcyjnego otrzymujemy, że m ∈ n, co daje m ∈ n′. To zaś oznacza koniec dowodupodpunktu (iv) twierdzenia. �

Ad. (v) Teraz rozpatrzmy zbiórM = {n ∈ N| dla każdego m ∈ N , jeślin �⊆ m, to m ⊆ n}.Dla wykazania induktywności zbioru M zauważmy, że 0 ∈ M oraz załóżmy, że n ∈ M.

Obierzmy dowolny m taki, żen′ �⊆ m (♥)

Z założenia indukcyjnego mamy, że m ⊆ n lub też n ⊆ m. Gdy m ⊆ n, to m ⊆ n′ – co kończyproces dwodowy. Przypuśćmy zatem, że n �⊆ m. Na podstawie (iv) mamy, że n ∈ m. Wynikastąd, że n′ ⊆ m, co przeczy (♥). Dowodzi to, że założony przypadek nie może zajść. Stądn′ ∈M. �

Ad. (vi) Ten podpunkt jest konsekwencją wcześniejszych podpunktów. Jeden z warunkówwynika z (iv) i (v), podczas gdy niemożliwość zajścia dwóch spośród wymienionych przypadkówwynika z (ii) oraz (i). �

W zbiorze liczb nauralnych relacja zawierania ⊆ oznaczana jest symbolem ≤, podczas, gdyrelacja przynależnośći ∈ oznazczana jest symbolem <. Jeśli piszemy n ∈ m, to mówimy, że njest mniejsze od m oraz, że m jest większe od n. Następnik liczby n jest oznaczany poprzezn+ 1. Liczba naturalna jest równocześnie zbiorem wszystkich liczb naturalnych mniejszych odniej, co oznacza, że

n = {k ∈ N| k < n}.

Twierdzenie. Jeśli n jest liczbą naturalną, zaś X niepustym zbiorem takim, że X ⊆ n, toistnieje n0 ∈ X, że dla każdego m ∈ X zachodzi warunek m ≤ n0, tj. n0 jest największą liczbąw X.

Innymi słowy, ostatnie twierdzenie głosi, że każdy skończony i niepusty podzbiór liczb na-turalnych ma element największy.

Dowód. NiechM oznacza zbiór tych wszystkich liczb naturalnych n, że dla każdego niepustegopodzbioru X ⊆ n istnieje n0 ∈ X, że dla każdego m ∈ X ma miejsce nierówność: m ≤ n0.Chcemy pokazać, żeM jest zbiorem induktywnym. Z oczywistych powodów 0 ∈M.Przypuśćmy, że n ∈ M oraz niech X ⊆ n′ będzie dowolnym niepustym podzbiorem. Roz-

patrzmy dwie możliwości.

– 18 –

Jeśli n ∈ X, to szukanym elementem jest n. Gdy zaś n �∈ X, wtedy X ⊆ n i założeniaindukcyjnego mamy, że istnieje n0 ∈ X o stosownych własnościach. �

Twierdzenie. (Zasada minimum) Każdy niepusty zbiór liczb naturalnych ma liczbę najmniejszątj. taką, że jeśli X ⊆ N oraz X �= ∅, to istnieje n0 ∈ X, że dla każdego m ∈ X zachodzi warunekn0 ≤ m.

Dowód. Przypuśćmy, że X �= ∅ jest podzbiorem N nie zawierającym elementu najmniejszego.Niech ponadto

M = {n ∈ N| n ∩X = ∅}.

Chcemy wykazać induktywność zbioru M. Łatwo widać, że 0 ∈ M. Przypuśćmy, że n ∈ Moraz, że n′ ∩ X �= ∅. Stąd n ∈ X oraz dla każdego m < n mamy m �∈ X. To zaś oznacza, żen jest najmniejszym elementem w X. Sprzeczność ta dowodzi, że n′ ∩ X = ∅, co oznacza, żen′ ∈MNa mocy zasady indukcji mamy, że M = N , a więc X = ∅. Z tej sprzeczności wynika, że

X musi mieć element najmniejszy. �

4. Funkcje

Rozpatrzmy dowolne zbiory A i B. Przez funkcję z A w B rozumiemy uporządkowanątrójkę 〈f,A,B〉 taką, że f ⊆ A×B jest relacją spełniającą następujące warunki:(i) dla każdego x ∈ A istnieje y ∈ B, że 〈x, y〉 ∈ f ;(ii) dla każdego x ∈ A oraz każdych y1 ∈ b oraz y2 ∈ B, jeśli 〈x, y1〉 ∈ f oraz 〈x, y2〉 ∈ f ,to y1 = y2.Przedstawiona definicja wskazuje na istotność każdego z elementów trójki 〈f,A,B〉 – a więc

nie tylko relację f , ale w tym samym stopniu zbiory A i B. Zbiór A nazywamy dziedziną, zaśzbiór B przeciwdziedziną funkcji f . Zwykle zamiast pisać 〈f,A,B〉 piszemy f : A → B. Zbiórwszystkich funkcji z A w B oznaczamy symbolem AB .

Jeśli w definicji funkcji zrezygnujemy z warunku (i), to trójkę 〈f,A,B〉 spełniającą jedyniewarunek (ii) nazywamy funkcją częściową z A w B. Zbiór

Dom(f) = {x ∈ A| istnieje b ∈ B, że 〈x, y〉 ∈ f}

nazywamy dziedziną funkcji częściowej f . W przypadku, gdy f ⊆ A×B jest funkcją częściowąz A w B, to jest funkcją z Dom(f) w B.Funkcję ze zbioru A w zbiór B nazywamy równoważnie odwzorowaniem określonym na zbio-

rze A i o wartościach w zbiorze B. Przyjęła się niepisana umowa, że funkcja to odwzorowaniezbioru liczbowego, lub produktu kartezjanskiego takich zbiorów w inny zbiór liczbowy – myjednak obu nazw będziemy używać zamiennie. Dla oznaczenia funkcji będziemy używać na ogółmałych liter alfabetu łacinskiego. Symbol f : A → B będzie oznaczał, że f odwzorowuje zbiórA w zbiór B, natomiast symbol f : x �→ y, że f przyporządkowuje elementowi x ∈ A elementy ∈ B. Niekiedy element przyporza↪dkowany elementowi x ∈ A poprzez funkcję f be↪dziemy

– 19 –

oznaczać przez f(x). Wtedy f(x) oznacza wartość odwzorowania f dla elementu x, lub obrazelementu x poprzez funkcję f . Podzbiór zbioru B złozony z wszystkich tych elementów y, ze dlakazdego z nich istnieje przynajmniej jeden element x ze zbioru A, ze y jest obrazem x poprzezfunkcję f tj. y = f(x) nazywamy obrazem zbioru A poprzez funkcję f . Mamy zatem:

f(A) ={y ∈ B : istnieje x ∈ A, że y = f(x)

}.

Podobnie, jeśli X jest dowolnym podzbiorem zbioru A, to obraz tego zbioru poprzez odwzo-rowanie f oznaczamy przez f(X) i kładziemy:

f(X) ={y ∈ B : istnieje x ∈ A, że y = f(x)

}.

Jeśli f(A) = B, to mówimy, ze f : A→ B jest funkcją przekształcającą zbiór A na zbiór B.Odwzorowanie f : A → A nazywamy odwzorowaniem zbioru A w siebie, gdy f(A) ⊂ A,

natomiast odwzorowaniem zbioru A na siebie, gdy f(A) = A.Odwzorowanie i zbioru A na siebie, w którym obrazem kazdego elementu x ∈ A jest ten

sam element tj.dla wszystkich x ∈ A jest i(a) = a

nazywamy odwzorowaniem identycznościowym zbioru A na siebie i oznaczamy przez iA.Jeżeli dziedzina A funkcji f jest zborem pustym, zaś B jest dowolnym zbiorem, to relacja

f ⊆ A × B jest relacją pustą (jako podzbiór zbioru pustego). Gdy zaś A �= ∅ oraz B = ∅, tofunkcja z A w B nie istnieje. Znów mamy A × B = A × ∅ = ∅, jednak teraz relacja pusta jestfunkcją częściową, ale nie jest funkcją.

Korzystając z definicji funkcji wprowadzimy teraz nowe pojęcia.

Przez indeksowaną rodzinę zbiorów rozumiemy dowolną funkcję ze zbioru indeksów I wrodzinę zbiorów A. Rodzinę indeksowaną zbiorów oznaczamy zwykle symbolem: {Ai}i∈I . �

Jeśli A jest dowolnym zbiorem, to słowem nad alfabetem A nazywamy każdy skończonyciąg elementów zbioru A, tj. funkcję w : {0, 1, 2, . . . , n} → A, gdzie (n + 1) ∈ N nazywamydługością słowa, którą zwykle oznaczamy symbolem |w|. Zbiór wszystkich słów nad alfabetemA (niezależnie od ich długości) oznaczamy symbolem A∗. Słowem pustym, oznaczanym zwyklesymbolem ε, nazywamy słowo nad każdym alfabetem o długości 0. Symbol An oznaczał będziezbiór uporządkowanych n-tek postaci 〈x0, x1, . . . , xn−1〉, które mogą być również traktowanejako słowa długości n nad alfabetem A. Wtedy 〈x0, x1, . . . , xn−1〉 może być reprezentowana wprzez funkcję w : n→ A, dla której w(i) = ai, przy i ∈ {0, 1, . . . , n − 1}.W zbiorze A∗ możemy określić operację składania (konkatenacji) słów w taki sposób, że

jeśli w : n→ A, zaś u : m→ A, to wu : (m+ n) → A, przy czym:

(wu)(i) ={w(i), gdy i ∈ {0, 1, . . . , n− 1},w(i− n), gdy i ∈ {n, n + 1, . . . ,m+ n− 1}.

Dla dowolnie ustalonego zbioru A, przez multizbiór rozumiemy każdą funkcję M : A→ N .Opisowo, funkcjaM z każdemu elementowi bioru A przypisuje krotność jego występowania. Oz-nacza to, że jeżeli element x ∈ A ma przypisaną krotność 0, to nie występuje on w multizbiorze,

– 20 –

jeśli zaś M(x) = 3, to element x pojawia się trzykrotnie. Zbiór wszystkich multizbiorów zbioruA oznaczamy symbolemM(A). Dowolny podzbiór zbioru A, jest multizbiorem, którego każdyz elementów ma krotność nie przekraczającą 1. �

Odwzorowanie f : A → B nazywamy różnowartościowym wtedy i tylko wtedy, gdy dladowolnych x1 ∈ A oraz x2 ∈ A zachodzi warunek:

(x1 �= x2 =⇒ f(x1) �= f(x2)).

Róznowartościowe odwzorowanie zbioru A na zbiór B nazywamy tez wzajemnie jednoznacznymodwzorowaniem zbioru A na zbiór B.

Jeśli odwzorowanie 〈f,A,B〉 jest równocześnie różnowartościowe i “na”, to nazywamy jebijekcją.Jeśli f : A → B, to możemy ją rozpatrywać w dowolnym podzbiorze X ⊂ A i wtedy

mówimy, że rozpatrujemy obcięcie funkcji f do zbioru X. Dla podkreślenia zawężenia dziedzinyfunkcji f ze zbioru A do zbioru X używamy symbolu f|X .Funkcje↪ g przeprowadzającą zbiór B na cały zbiór A nazywamy funkcją odwrotną do funkcji

f przeprowadzającej zbiór A na zbiór B, gdy dla każdego x ∈ A oraz każdego y ∈ B zachodząrówności:

g(f(x)) = iA(x) = x oraz f(g(y)) = iB = y.

Funkcję odwrotną do funkcji f , dla podkreślenia jej związku z funkcją f będziemy zwykle oz-naczać symbolem f−1. Odwzorowania różnowartościowe nazywane są niekiedy odwracalnymi.Wśród wszystkich odwzorowań wyróżnia się także odwzorowania częściowo odwracalne tj. takie,które zawężone do pewnego podzbioru dziedziny są różnowartościowe.

Zwróćmy teraz uwagę, że istnienie dla danej funkcji, funkcji do niej odwrotnej jest ob-warowane warunkiem różnowartościowości. W przypadku, gdy mówimy o relacji warunek tennie jest wymagany. Zatem jeśli dla danej funkcji nie istnieje funkcja odwrotna, wskutek jejnieróżnowartościowości, to na pewno istnieje relacja do niej odwrotna.

Twierdzenie. Jeśli f : A→ B, g : B → C są funkcjami, to:(i) relacja g ◦ f ⊂ A× c jest funkcją z A w C;(ii) gdy f i g są różnowartościowe odpowiednio na A i B, to g ◦ f jest różnowartościowa;(iii) gdy f i g są “na”, to g ◦ f jest “na”.Dowód. Ad (i) Z założenia, że f jest funkcją z A w B wynika, że dla dowolnego x ∈ A

istnieje y ∈ B spełniające warunek 〈a, y〉 ∈ f . Z drugiej strony dla funkcji g z podobnychpowodów dla każdego y ∈ B istnieje z ∈ C, że 〈y, z〉 ∈ g. Stąd zgodnie z definicją składaniarelacji dla dowolnego x ∈ A istnieje z ∈ C, że 〈x, z〉 ∈ g ◦ f . Tak więc dla każdego x ∈ A istniejeobraz poprzez superpozycję g◦f . Pozostaje pokazać, że jest to obraz jedyny. Przypuśćmy, że taknie jest tj., że istnieją dwie pary 〈x, z1〉 ∈ g ◦ f oraz 〈x, z2〉 ∈ g ◦ f . Jednak w takim przypadkumuszą istnieć elementy y1 oraz y2 w zbiorze B takie, że 〈x, y1〉 ∈ f oraz 〈x, y2〉 ∈ f przy czym〈y1, z1〉 ∈ g oraz 〈y2, z2〉 ∈ g. Założenie o tym, że f jest funkcją prowadzi do równości: y1 = y2. Zkolei założenie, że g jest funkcją daje równość: z1 = z2. Ostatecznie z obu wykazanych powodówwynika, że relacja g ◦ f jest funkcją.

– 21 –

Ad (ii) Niech zgodnie z założeniem obie funkcje tj. f i g będą różnowartościowe i niech(g ◦ f)(x1) = (g ◦ f)(x2). Z faktu różnowartościowości funkcji g wynika równość: f(x1) =f(x2). Dalej już z różnowartościowości funkcji f mamy, że x1 = x2. Oznacza to, że g ◦ f jestróżnowartościowa.

Ad (iii) Zgodnie z założeniem niech f i g będą “na”. Zatem dla każdego elementu z ∈ Cistnieje element y ∈ B, że z = g(y). Podobnie dla każdego y ∈ B istnieje x ∈ A, że y = f(x).Stąd też mamy zagwarantowane dla każdego z ∈ C istnienie takich elementów x ∈ A oraz y ∈ B,że c = g(y) = g

(f(x)

). Jest to zgodne z definicją funkcji “na”, którą tym razem spełnia g ◦f . �

Zatem funkcje f : A → B i g : B → C wyznaczają nową funkcję, którą oznaczamy przezg ◦ f taką, ze h : A→ C i określoną dla wszystkich x ∈ A warunkiem:

h(x) = g(f(x)

),

którą nazywamy superpozycją (złożeniem) funkcji f i g i oznaczamy symbolem g ◦ f . Tak więcdla każdego x ∈ A: (

g ◦ f)(x) = (g ◦ f)(x)

Przykład. Niech f : R→ R będzie określona wzorem: f(x) = x2 +1, zaś g : R → R wzorem:g(x) = sinx. Obie te funkcje mają wspólną dziedzinę, natomiast różne przeciwdziedziny. Może-my dla tych funkcji rozważać zarówno superpozycję f ◦ g jak i g ◦ f . Mamy:

(g ◦ f)(x) = g(f(x)) = sin (x2 + 1) zaś (f ◦ g)(x) = sin2 x+ 1.

Jak łatwo zauważyć porównując oba te złożenia, a właściwie przeciwdziedziny tych złożeń, su-perpozycja funkcji nie jest przemienna. �

Twierdzenie. Dla dowolnych funkcji f : A→ B, g : B → C i h : C → D

h ◦ (g ◦ f) = (h ◦ g) ◦ f.

D o w ó d. Bezpośrednio z definicji złożenia funkcji mamy, że dla dowolnego x ∈ A zachodząrówności:

(h ◦ (g ◦ f))(x) = h((g ◦ f)(x)) = h(g(f(x))),

((h ◦ g) ◦ f)(x) = (h ◦ g)(f(x)) = h(g(f(x))).

Porównując je dostajemy tezę twierdzenia. �

Twierdzenie. Dla dowolnej funkcji f : A→ B następujące warunki są równoważne:

(i) f ma funkcję odwrotną;(ii) f jest bijekcją;(iii) relacja odwrotna f−1 jest funkcją.

Dowód. Załóżmy zgodnie z (i), że f ma funkcję odwrotną i oznaczmy ją przez g. Zatemg : B → A. Gdy f(x1) = f(x2), to g(f(x1)) = g(f(x2)). Z drugiej strony mamy z założenia, żeg ◦ f = iA, a więc x1 = x2. Oznacza to różnowartościowość funkcji f .

– 22 –

Teraz pokażemy, że f jest “na”. Niech y ∈ B będzie dowolnie wybrany i niech a = g(y).Stąd f(x) = f(g(y)) = y, bo f ◦ g = iB . Oznacza to, że f jest “na” (czyli jest bijekcją).

Obecnie przypuśćmy, że spełniony jest warunek (ii) twierdzenia. Niech y ∈ B będzie dowol-nie wybrany. Z tego, że f jest “na” wynika, że istnieje x ∈ A dla którego f(x) = y. To zaśoznacza, że 〈y, x〉 ∈ f−1. Załóżmy teraz, że 〈y, x1〉 ∈ f−1, a także 〈y, x2〉 ∈ f−1. Wtedy otrzy-mujemy równość: f(x1) = f(x2), a z różnowartościowości funkcji f mamy x1 = x2. Oznacza to,że relacja f−1 jest funkcją.

Niech teraz spełniony będzie warunek (iii). Dla każdego x ∈ A mamy: 〈x, x〉 ∈ f−1f , gdyż〈x, f(x)〉 ∈ f . Konsekwencją tego faktu jest, że iA ⊆ f−1 ◦ f . Gdy założymy, że 〈x1, x2〉 ∈f−1 ◦ f , to istnieje y ∈ B dla którego 〈x1, y〉 ∈ f oraz 〈y, x2〉 ∈ f−1. Wynika stąd również, że〈y, x1〉 ∈ f−1, a skoro f−1 jest funkcją, to x1 = x2. Zatem f−1 ◦ f = iA. �

Dla funkcji f : A → B wprowadziliśmy poprzednio pojęcie obrazu elementu x zbioru Apoprzez funkcję f . Przypomnijmy, że jest to taki element y zbioru B, że 〈x, y〉 ∈ f . Jeśli terazX ⊆ A będzie dowolnym podzbiorem dziedziny funkcji f . Obrazem zbioru X poprzez funkcjęf : A→ B nazywamy zbiór f(X) ⊆ B, że

f(X) def=⋃

x∈X

{f(x)} ={y ∈ B| istnieje x ∈ X, że y = f(x)

}

Jeśli Y ⊆ B, to przeciwobrazem zbioru Y poprzez funkcję f nazywamy zbiór f−1(Y )określony równością:

f−1(Y ) def=⋃

y∈Y

{f−1(y)} ={x ∈ A| f(x) ∈ Y }.

Twierdzenie. Dla dowolnej funkcji f : A → B oraz rodziny X podzbiorów zbioru A irodziny Y podzbiorów zbioru B mamy:(i) f (

⋃X ) =⋃{f(X)| X ∈ X};

(ii) jeśli X �= ∅, to f (⋂X ) ⊆ ⋂{f(X)| X ∈ X};

(iii) f−1 (⋃Y) =

⋃{f−1(Y )| Y ∈ Y};

(iv) jeśli Y �= ∅, to f−1 (Y) =⋂{f−1(Y )| Y ∈ Y

}.

Dowód. Ad (i) Zgodnie z definicją obrazu zbioru poprzez funkcję mamy dla dowolnegoX ∈ X , że f(X) =

⋃x∈X

{f(x)}. Zatem skoro⋃X =

⋃X∈X

X, to dostajemy natychmiast, że

f(⋃

X)

= f

[ ⋃X∈X

( ⋃x∈X

{f(x)})]

=⋃{

f(X)| X ∈ X}

Ad (ii) Niech y ∈ f(⋂

X). Zatem istnieje x ∈

⋂X , że y = f(x). Na mocy definicji

iloczynu zbiorów (w szczególności definicji iloczynu rodziny zbiorów) mamy, że x ∈ X dlawszystkich X ∈ X . Z drugiej strony oznacza to, że f(x) ∈

⋂X∈X

{f(X)

}. Tak więc teza (ii)

jest prawdziwa.

– 23 –

Ad (iii) Przyjmijmy, że x ∈ f−1(⋃

Y)jest dowolnie wybrany. Stąd zaś wynika, że f(x) ∈⋃

Y. Dalej z definicji sumy zbiorów wynika, że istnieje zbiór Y ∈ Y, do którego należy f(x).

To z kolei oznacza, że istnieje Y ∈ Y, że x ∈ f−1(Y ). W konsekwencji jest tak wtedy i tylkowtedy, gdy x ∈

⋃Y ∈Y

{f−1}.

Ad (iv) Technika dowodowa tej tezy jest analogiczna do zaprezentowanej w poprzednichpodpunktach. �

5. Definicje indukcyjne

Jak to zostało omówione w paragrafie 3. zbiór liczb naturalnych N jest najmniejszymzbiorem zawierającym 0 i zamkniętym ze względu na jednoargumentową operację następnika.Te własności zbioru liczb naturalnych umożliwiają definiowanie w nim pewnych funkcji.Dla przykładu niech f oznacza działanie dodawania liczb naturalnych (dwuargumentową i

wewnętrzną operację w N ) tj. f : N ×N → N . Mamy:

f(m, 0) =m,

f(m,n′) =(f(m,n)

)′.

Przy użyciu tych dwóch równości możemy wykonywać działanie dodawania w zbiorze N . Liczbam występująca w tej definicji nosi nazwę parametru. Jest to liczba naturalna dowolnie ustalona.

Twierdzenie. (o definiowaniu przez indukcję) Niech A i B będą dowolnie ustalonymizbiorami i niech B �= ∅, zaś g : A → B i h : B × A × N → B dowolnymi funkcjami. Istniejedokładnie jedna funkcja f : A×N → B spełniająca dla dowolnych x ∈ A oraz n ∈ N następującewarunki:

f(x, 0) =g(x),

f(x, n′) =h(f(x, n), x, n

).

Na wstępie uprzedźmy, że dowód tego twierdzenia zostanie przedstawiony w dalszej częściwykładu. Dodajmy też, że w przedstawionym twierdzeniu zbiór A jest zbiorem parametrów. �

Jako efekt tego twierdzenia możemy przedstawić pewne uporządkowanie zaprezentowanejpoprzednio definicji dodawania liczb naturalnych. Rolę funkcji g pełni funkcja identyczność iNw zbiorze liczb naturalnych, zaś rolę funkcji h operacja następnika. Wartość funkcji f dla liczbnaturalnych m i n oznaczamy tradycyjnie poprzez m+ n.Teraz przedstawimy definicję mnożenia liczb naturalnych. Będziemy się trzymać oznaczeń

użytych w twierdzeniu.Mnożenie liczb naturalnych jest to jedyna funkcja f : N × N → N określona układem

równań:f(m, 0) =0,

f(m,n′) =m+ f(m,n).

Funkcja g ma w tym przypadku postać g(x) = 0 dla x ∈ N , zaś h ma postać h(x, y, z) = y + x,dla x ∈ N , y ∈ N , z ∈ N .

– 24 –

Rozpatrzmy teraz operację iteracji, którą oznaczymy przez Iter i wtedy

Iter : P(A×A)×N → P(A ×A)

dla każdej relacji binarnej w A, przy czym o zbiorze A niczego nie zakładamy.Dla realacji � ⊆ A×A przyjmujemy definicję:

Iter(�, 0) =iA,

Iter(�, n′) =� ◦ Iter(�, n),

gdzie Iter(�, n) oznacza n-krotne złożenie relacji � ze sobą. Funkcja g (z ostatniego twierdzenia)jest określona następująco: {

g : P(A×A) →P(A×A),

g(�) =iA,

przy czym � ∈ P(A × A). Zaś funkcja h (również wymieniona w ostatnim twierdzeniu) mapostać: {

h : P(A×A)× P(A×A)×N →P(A×A),

h(�1, �2, n) =�2 ◦ �2,

dla �1 ∈ P(A ×A) i �2 ∈ P(A×A) oraz n ∈ N .Dla ilustracji przedstawionego opisu rozpatrzmy następującą sytuację. Niech k ∈ N będzie

dowolną liczbą naturalną dodatnią i niech A = {0, 1}k oraz niech ϕ : {0, 1}k → {0, 1} oznaczapewną funkcję k-argumentową. Wtedy dla dowolnego 〈x0, x1, . . . , xk−1〉 mamy

ϕ(〈x0, x1, . . . , xk−1〉

)= xk.

Funkcja ϕ określona poprzednio pozwala na określenie odwzorowania

Iϕ : {0, 1}k → {0, 1}∞,

zwanego systemem iteracyjnym funkcji ϕ, gdzie {0, 1}∞ oznacza zbiór wszystkich słów (ciągów)nieskończonych nad alfabetem {0, 1}. Ciągi takie nazywamy obliczeniami systemu Iϕ, a okreś-lamy je następującą równością:

Iϕ(〈x0, x1, . . . , xk−1〉

)= (x0, x1, . . . , xk−1, xk, xk−1, . . .)

gdzie dla dowolnego i ∈ N jest

xi+k = ϕ(〈xi, xi+1, . . . , xi+k〉

).

W oparciu o funkcję ϕ możemy określić relację �ϕ ⊆ {0, 1}k ×{0, 1}k . Jeśli przyjmiemy, żex0 := 〈x0, x1, . . . , xk−1〉 oraz x1 :=

⟨x1, x2, . . . , xk, ϕ

(〈x0, x1, . . . , xk−1〉)⟩, to:

〈xi,xj〉 ∈ �ϕdef⇐⇒ xj = 〈xi|1, ϕ(xi)〉,

gdzie xi|1 = 〈x1, x2, . . . , xk−1〉 jest elementem {0, 1}k−1 powstałym z xi poprzez “obcięcie”pierwszego wyrazu.

– 25 –

Zatem relacja �ϕ ustala zależność między słowani dlugości k nad alfabetem {0, 1}. Możemysprawdzić, że dla tego przypadku są spełnione warunki definicyjne nałożone na operację iteracji.Mamy mianowicie:(1) Zerowe złożenie relacji �ϕ jest działaniem tożsamościowym. Mamy:

Iter(�ϕ, 0)(x) = x dla dowolnego x ∈ {0, 1}k .

(2) (n+ 1)-krotne złożenie relacji �ϕ spełnia warunek:

Iter(�ϕ, n′) = �ϕ ◦ Iter(�ϕ, n),

co oznacza, że

�n+1ϕ (x0) = �ϕ ◦ �n

ϕ(x0) = �ϕ(xn−1) = xn

dla dowolnego x0 ∈ {0, 1}k . �

Przedstawiony przykład relacji �ϕ pokazuje, że iteracja, a co za tym idzie definiowanieindukcyjne, odwołuje się nie tylko do poprzedniej wartości, ale wynik uzależniony jest od wszys-tkich dotychczas obliczonych wartości. Mamy na ten temat następujące twierdzenie.

Twierdzenie. Dla dowolnych zbiorów A oraz B, gdzie B �= ∅, niech g : A → B zaśh : B∗ × A × N → B będą dowolnymi funkcjami. Istnieje wtedy dokładnie jedna funkcja f :A×N → B spełniająca dla dowolnego x ∈ A oraz dowolnego n ∈ N równości:

f(x, 0) =g(x),

f(x, n′) =h((f(x, 0) · · · f(x, n)), x, n

),

gdzie (f(x, 0) · · · f(x, n)) oznacza słowo w B∗, którego literami są f(x, 0), f(x, 1), . . . , f(x, n).

Dowód. Funkcja f , o której mowa w twierdzeniu jest tylko jedna. Zauważmy bowiem, żegdyby istniały dwie takie funkcje f1 i f2, to dla wszystkich n ∈ N oraz dowolnie wybranegox ∈ A byłoby:

f1(x, n) = f2(x, n).

Mianowicie jeśli f1(x, 0) = g(x) oraz f2(x, 0) = g(x), to dla dowolnego x i n = 0 warunek jestspełniony.Przypuśćmy teraz, że dla x ∈ A oraz ustalonego n ∈ N dla

f1(x, n) = h((f1(x, 0) · · · f1(x, n− 1)), x, n − 1

)oraz

f2(x, n) = h((f2(x, 0) · · · f2(x, n− 1)), x, n − 1

)zachodzi

f1(x, n) = f2(x, n) oraz f1(x, n′) �= f2(x, n′)

Mamy, że

f1(x, n′) = h((f1(x, 0) · · · f1(x, n − 1)), f1(x, n), x, n

)

– 26 –

orazf2(x, n′) = h

((f2(x, 0) · · · f2(x, n − 1)), f2(x, n), x, n

).

Ponieważ z założenia h jest funkcją, to dla tych samych argumentów przyjmuje te same wartości.Stąd na mocy zasady indukcji dla wszystkich n ∈ N jest f1(x, n′) = f2(x, n′).

Pokażemy teraz istnienie funkcji f . Wykorzystamy w tym celu twierdzenie o definiowaniuprzez indukcję.Niech B� = B∗ oraz niech g� : A→ B� będzie określona w ten sposób, że g�(x) jest słowem

jednoliterowym. Ponadto niech h� : B� ×A×N → B� będzie określona następująco:

h�(w, x, n) = wh(w, x, n),

tj. do słowa w dopisywana jest litera h(w, x, n).Niech teraz f� : A×N → B� oznacza jedyną funkcję określoną indukcyjnie poprzez warunki:

f�(x, 0) =g�(x),

f�(x, n′) =h�(f�(a, n), a, n

).

Symbolem : B∗ → B oznaczymy funkcję, która każdemu niepustemu słowu w przy-porządkowuje ostatnią (tj. skrajną prawą) literę występującą w tym słowie. Po to, by nie byłafunkcją częściową na B∗ zakładamy, że dla słowa pustego ε jej wartość jest równa (ε) = b0,gdzie b0 jest dowolnie ustalonym elementem alafabetu B. Funkcję f : A × N → B określamyrównością:

f(x, n) = (f�(x, n)

).

Pokażemy, żef�(x, n) =

(f(x, 0), . . . , f(x, n)

)(♣)

Dowód poprowadzimy przez indukcję względem n. Gdy n = 0, to

f�(x, 0) =(g�(x)

)=( (g�(x))

)=((f�(x, 0)

))=(f(x, 0)

).

Dodatkowo mamy:

f�(x, n′) = h� (f�(x, n)x, n) = f�(x, n)h(f�(x, n)x, n)

)=

=(f(x, 0) · · · f(x, n)

) (f�(x, n′)) =

(f(x, 0) · · · f(x, n)f(x, n′)

).

Należy jeszcze wykazać, że f spełnia warunki nałożone na nią w twierdzeniu. Mamy, że

f(x, 0) = (f�(x, 0)

)= (g�(x)) = g(x).

Z drugiej stronyf(x, n′) =

(f�(a, n′)

)= (h�(f�(x, n), x, n)

)=

= (f�(x, n)h (f�(x, n), x, n)) = h (f�(x, n), x, n) =

= h((f(x, 0) · · · f(x, n)) , a, n

).

Dodajmy, że ostatnia równość jest konsekwencją (♣). Ostatecznie wykazaliśmy, że f jest funkcjąo jakiej mówi ostatnie twierdzenie. �

– 27 –

6. Relacje równoważności

W zależności od własności jakie spełnia relacja binarna możemy rozważać różne kategorietakich relacji. Obecnie zajmiemy się relacjami, które są zwrotne, symetryczne i przechodnie(definicje tych własności zostały podane w paragrafie 3). Relację spełniającą wymienione trzywłasności nazywamy relacją równoważności (lub równoważnością). Relacje równoważności sązwykle oznaczane symbolem ≈.

Przykłady.

(1) Rozważmy ogół emitowanych przez Narodowy Bank Polski banknotów i pozostającychw obiegu. Oznaczmy ten zbiór przez X. Określmy w nim relacjś równości nominałów banknotó –bez względ na inne ich atrybuty takie jak seria, numer i stan. Tak okreśona relacja spełia definicjęrelacji równoważności. Zauważmy przy tym, że zbiór X został przez tę relację podzielony narozłączne podzbiory złożone z banknotów o nominale 10, 20, 50, 100, 200 złotych.

(2) Jeśli na płaszczyżnie π wprowadzimy relację równoległości prostych, to okaże się żerelacja ta jest również relacją równoważności. Z jej punktu widzenia jedyną interesująca cechąjest kierunek prostej. Ta relacja dzieli płaszczyznę π na podzbiory prostych o jednakowymkierunku, z tym że podzbiorów takich jest nieskonczenie wiele.

(3) Rozważmy dowolny niepusty zbiór X, a w nim relację ≈ zdefiniowaną w ten sposób, że

x ≈ y wtt, gdy x = y.

łatwo zauważyć, że jest ona relacją równoważności. �

Niech X będzie dowolnym niepustym zbiorem, zaś ≈ określoną w nim dowolną relacjąrównoważności. Dla dowolnego elementu x ze zbioru X symbolem ‖x‖≈ będziemy oznaczaćzbiór tych wszystkich elementów y ze zbioru X, że są one w relacji ≈ z elementem x tj.:

‖x‖≈ = {y ∈ X| 〈x, y〉 ∈≈} (6.1)

Podzbiory elementów zbioru X określone równością (6.1) nazywamy klasami równoważnościrelacji ≈ w X lub tez klasami abstrakcji relacji ≈ w X. Precyzyjniej, klasę ‖x‖≈ nazywamyklasą równoważności (abstrakcji) relacji ≈ w X wyznaczoną przez x lub też o reprezentancie x.Zbiór wszystkich klas równoważności relacji ≈ w X oznaczamy symbolem X/ ≈ i nazywamyzbiorem ilorazowym zbioru X względem relacji równoważności ≈.Niech X be↪dzie dowolnym niepustym zbiorem. Rodzine↪ Π podzbiorów tego zbioru nazy-

wamy rozbiciem zbioru X (podziałem zbioru X) wtt,

(i) każdy z elementów rodziny Π jest zbiorem niepustym;(ii) elementy rodziny Π są parami rozłączne;(iii) suma wszystkich elementów rodziny Π jest równa zbiorowi X.

Elementy rodziny Π nazywane są klasami rozbicia.

Zatem, każda z relacji rozpatrywanych w ostatnim przykładzie dzieląc zbiory, w którychbyła określona wyznaczała rodzine↪ be↪dącą przykładem rozbicia.

– 28 –

Zajmijmy sie↪ teraz własnościami klas abstrakcji dowolnej relacji równoważności. Mówi otym naste↪pujące twierdzenie.

Twierdzenie. Niech X be↪dzie dowolnym niepustym zbiorem, zaś ≈ dowolną określoną wnim relacją równoważności. Wtedy dla każdego x, x1, x2 ∈ X spełnione są naste↪pujące warunki:

x ∈ ‖x‖≈, (6.2)

‖x1‖≈ = ‖x2‖≈ ⇐⇒ x1 ≈ x2, (6.3)

‖x1‖≈ �= ‖x2‖≈ =⇒ ‖x1‖≈ ∩ ‖x2‖≈ = ∅. (6.4)

D o w ó d. Ponieważ ≈ jest zwrotna z definicji, jako relacja równoważności, wie↪c dladowolnego x ∈ X zachodzi x ≈ x, wie↪c x ∈ ‖x‖≈.Przypuśćmy, że ‖x1‖≈ ⊂ ‖x2‖≈. Wtedy x1 ∈ ‖x2‖≈, a wie↪c na mocy definicji relacji równo-

ważności x1 ≈ x2. Odwrotnie, gdy x2 ≈ x1, wtedy jeśli x ∈ ‖x1‖≈ to x ≈ x1. Ponieważ jednak≈ jest przechodnia, to x ∈ ‖x2‖≈. Oznacza to, że ‖x1‖≈ ⊂ ‖x2‖≈ i mamy równoważność

‖x1‖≈ ⊂ ‖x2‖≈

poste↪pując podobnie pokazujemy, że

‖x2‖≈ ⊂ ‖x1‖≈.

Dlatego ‖x1‖≈ = ‖x2‖≈.Przejdzmy teraz do dowodu warunku (6.4), który przeprowadzimy metodą nie wprost.

Załóżmy wie↪c, że zbiory ‖x1‖≈ i ‖x2‖≈ nie są rozłączne. Istnieje zatem taki element x, którynależy do każdego z nich. Na mocy (6.1) mamy, że x1 ≈ x i x2 ≈ x. Jednocześnie symetrycznośćrelacji ≈ gwarantuje, że x1 ≈ x i x ≈ x2. Przechodniość z kolei powoduje, że x1 ≈ x2 – co wpołączeniu z (6.3) prowadzi do równości ‖x1‖≈ = ‖x2‖≈. Zatem sprzeczność i koniec dowoduwarunku (6.4). �

Podamy teraz, jako konsekwencje↪ ostatniego twierdzenia, twierdzenie nazywane zasadą ab-strakcji.

Twierdzenie. (zasada abstrakcji) Dowolna relacja równoważności ≈ określona w nie-pustym zbiorze X ustala podział tego zbioru na rozłączne i niepuste podzbiory, mianowicie naklasy równoważności tej relacji, w taki sposób, że dwa elementy x, y zbioru X należą do tej samejklasy równoważności wtedy i tylko wtedy, gdy x ≈ y. �

Przykłady.

(1) Rozpatrzmy zbiór Z wszystkich liczb całkowitych i niech m be↪dzie dowolną liczbąnaturalną nie mniejszą niż 2, którą zwykle nazywamy modułem. O liczbach a i b mówimy, żesą równe modulo m i piszemy a ≡ b(mod m) wtedy i tylko wtedy, gdy różnica tych liczb jestpodzielna przez m. Łatwe sprawdzenie warunków definicji relacji równoważności pokazuje, żerelacja równości liczb modulo m jest taką właśnie relacją. Wobec tego, na mocy ostatniego

– 29 –

twierdzenia, dzieli ona zbiór Z na rozłączne podzbiory – klasy równoważności. Jest ich jakłatwo sie↪ przekonać m. Wypiszmy je zatem:

‖0‖≈ = {. . . ,−m, 0,m, . . .}, . . . , ‖m− 1‖≈ = {. . . ,−m− 1,−1,m − 1, . . .}.

Pierwsza z nich jest zbiorem liczb, których reszta z dzielenia przez m jest równa 0. Podobnie,ostatnia z nich jest zbiorem wszystkich tych liczb całkowitych, których reszta z dzielenia przezmjest równa m− 1. Jeśli m = 2, to zbiór ilorazowy Z/(mod 2) składa sie↪ z dwóch klas abstrakcji‖0‖≈ i ‖1‖≈.(2) Niech A będzie dowolnym zbiorem, który traktujemy jak alfabet, zaś A∗ zbiorem słów

nad A. Ponadto niech L ⊆ A będzie dowolnie ustalonym podzbiorem słów. W oparciu o zbiórL określamy relację ∼L w A∗ w następujący sposób: jeśli u ∈ A∗, w ∈ A∗, to 〈u,w〉 ∈∼L wtedyi tylko wtedy, gdy dla dowonych słów x ∈ A∗ oraz y ∈ A∗ zachodzi równoważność:

xuy ∈ L⇐⇒ xwy ∈ L.Opisowo oznacza to, że słowa u i w są w relacji ∼L wtedy i tylko wtedy, gdy bez względu nakontekst w jakim się znajdują pozostają w L. Ta relacja równoważności jest istotnym narzędziemjęzyków formalnych. Jeżeli zbiór ilorazowy A/ ∼L jest skończony, to język L nosi nazwę językaregularnego.

(3) Rozpatrzmy alfabet postaci A = N ∪ {+,×, (, )}, w którym nawiasy są symbolamialfabetu, podobnie jak symbole działań: + -dodawania i × – mnożenia. Przez W oznaczamynajmniejszy zbiór słów nad alfabetem A spełniającym warunki:

(i) dla n ∈ N jest n ∈ W;(ii) dla u ∈ W oraz w ∈ W jest (u+ w) ∈ W oraz (u× w) ∈ W.Każdy z elementów zbioruW nazywamy wyrażeniem. Relację �∈ W×W określamy nastę-

pująco: u � w wtt, gdy wyrażenia u i w wyznaczają tę samą liczbę naturalną. Relacja ta jestrównież równoważnością.

(4) Niech teraz A i B będą dowolnymi zbiorami oraz niech f : A→ B. Dla funkcji 〈f,A,B〉określamy relację zwaną jądrem funkcji i oznaczaną przez ker(f) w następujący sposób:

〈x1, x2〉 ∈ ker(f)⇐⇒ f(x1) = f(x2).

Ponieważ relacja równości elementów dowolnego zbioru jest równoważnością, to także relacjaker(f) jest równoważnością. �

Liczby całkowite. Dotychczas nie były rozważane przez nas własności algebraiczne zbiorówz działaniami, jednak obecnie potrzebne będą pewne fakty z tym związane. Zakładamy mia-nowicie, że w zbiorze N określone są działania dodawania i mnożenia, rozumiane jako dwu-argumentowe funkcje określone w paragrafie dotyczącym definiowania indukcyjnego. Liczbęcałkowitą c będziemy reprezentować w postaci pary 〈a, b〉 takiej, że c+a = b. Łatwo zauważamy,że dla ustalonego c istnieje nieskończenie wiele takich par. Z tego powodu w zbiorze N × Ndefiniujemy relację ≈ taką, że:

〈a1, b1〉 ≈ 〈a2, b2〉 wtedy i tylko wtedy, gdy a1 + b2 = a2 + b1.

– 30 –

Zauważamy z tego zapisu, że dwie pary pozostają ze sobą w relacji, gdy ich poprzedniki różniąsię od następników o tę samą liczbę. Podkreślmy jeszcze raz, że zarówno poprzedniki jak inastępniki par są liczbami naturalnymi.

Twierdzenie. Relacja ≈ jest równoważnością w N ×N .Dowód. Zwrotność realcji ≈ wynika wprost z definicji. Symetria z kolei oznacza, że

〈a1, b1〉 ≈ 〈a2, b2〉 wtedy i tylko wtedy, gdy a1 + b2 = a2 + b1

podczas, gdy

〈a2, b2〉 ≈ 〈a1, b1〉 wtedy i tylko wtedy, gdy a2 + b1 = a1 + b2.

Z uwagi na prawe strony ostatnich równoważności mamy własność symetrii dla relacji ≈.Wykażemy teraz przechodniość. Niech

〈a1, b1〉 ≈ 〈a2, b2〉 oraz 〈a2, b2〉 ≈ 〈a3, b3〉

Oznacza to z definicji, że

a1 + b2 = a2 + b1 oraz a2 + b3 = a3 + b2.

Stąd zaś wynika, żea1 + (a2 + b2) + b3 = (a2 + b2) + a3 + b1,

dlategoa1 + b3 = a3 + b1 wtedy i tylko wtedy, gdy 〈a1, b1〉 ≈ 〈a3, b3〉.

co świadczy o tym, że ≈ jest równoważnością w N ×N . �

Jako relacja równoważności ≈ dzieli N × N na klasy abstrakcji, które to klasy nazy-wamy liczbami całkowitymi. Zbiór N/ ≈ oznaczamy symbolem Z i nazywamy zbiorem liczbcałkowitych.W zbiorze Z wprowadzamy dwa działania.

(α) ‖〈a, b〉‖≈ ⊕ ‖〈a′, b′〉‖≈ = ‖〈a+ a′, b+ b′〉‖≈

(β) ‖〈a, b〉‖≈ � ‖〈a′, b′〉‖≈ = ‖〈(a · a′) + (b · b′), (a · b′) + (b · a′)〉‖≈.

Lemat. Jeśli 〈a1, b1〉 ≈ 〈a2, b2〉 oraz 〈a′1, b′1〉 ≈ 〈a′2, b′2〉, to

(∗) 〈a1 + a′1, b1 + b′1〉 ≈ 〈a1 + a′2, b1 + b′2〉

(∗∗) 〈(a1 · a′1) + (b1 · b′1), (a1 + b′1) + (b1 + a′1)〉 ≈ 〈(a2 · a′2) + (b2 · b′2), (a2 + b′2) + (b2 + a′2)〉

Dowód. Zgodnie z definicją relacji ≈ mamy:

〈a1, b1〉 ≈ 〈a2, b2〉 ⇔ a1 + b2 = a2 + b1

– 31 –

oraz

〈a′1, b′1〉 ≈ 〈a′2, b′2〉 ⇔ a′1 + b′2 = a′2 + b′1 ⇐⇒ a1 + b1 + 2 = a2 + b1 + 2⇐⇒ a1 + b1 = a2 + b1.

〈a1 + a′1, b1 + b′1〉 ≈ 〈a2 + a′2, b2 + b′2〉 ⇐⇒ a1 + a′1 + (b2 + b′2)′ = b1 + b′1 + (a2 + a′2)

czylia1 + a1 + 1 + b2 + 1 + b2 + 1 + 1 = b1 + b1 + 1 + a2 + 1 + a2 + 1 + 1

Stąd juża1 + b2 = a2 + b1

– co oznacza, że (∗) jest prawdą. Podobnie postępujemy przy dowodzie (∗∗). �

Liczby wymierne. Jak poprzednio niech Z oznacza zbiór liczb całkowitych, zaś Z◦ := Z\{0}.Rozpatrzmy iloczyn kartezjański Z×Z◦, którego elementami są pary liczb 〈a, b〉, gdzie następnikpary nie może być zerem. W zbiorze Z × Z◦ definiujemy relację � określoną następująco:

〈a1, b2〉 � 〈a2, b2〉 wtedy i tylko wtedy, gdy a1b1 = a2b1.

Mówiąc językiem opisowym pary liczb całkowitych pozostają ze sobą w relacji � wtedy i tylkowtedy, gdy poprzedniki tych par są w takiej samej proporcji do następników. Tak więc 〈2, 6〉,〈−1,−3〉, 〈27, 81〉, to przykłady par pozostających w relacji �.Twierdzenie. Relacja �⊆ Z ×Z∗ jest równoważnością.

Dowód. Zwrotność otrzymujemy natychmiast:

〈a, b〉 � 〈a, b〉 def⇐⇒ ab = ab.

Ponadto

〈a1, b1〉 � 〈a2, b2〉 def⇐⇒ a1b2 = a2b1 ⇐⇒ a2b1 = a1b2 ⇐⇒ 〈a2, b2〉 � 〈a1, b1〉,

co oznacza, że � jest symetryczna.Teraz zbadamy przechodniość. Mamy:

〈a1, b1〉 � 〈a2, b2〉 oraz 〈a2, b2〉 � 〈a3, b3〉.

Oznacza to, że a1b2 = a2b1 oraz a2b3 = a3b2, stąd a1b2a2b3 = a2b1a3b2, co daje (a1b3)(a2b2) =(a3b1)(a2b2). Zatem jeśli tylko a2 �= 0, to a1b3 = a3b1 czyli 〈a1, b1〉 � 〈a3, b3〉. Oznacza to, że �jest przechodnia i dlatego relacja ta jest równoważnością. �

Relacja � dzieli zbiór Z × Z◦ na rozłączne klasy abstrakcji, które to klasy nazywamyliczbami wymiernymi. Zbiór (Z × Z◦)/ � nazywamy zbiorem liczb wymiernych i oznaczamyprzez Q.W zbiorze Q określamy działania dwuargumentowe: ⊕ i � zwane odpowiednio dodawaniem

i mnożeniem liczb wymiernych. A oto ich definicje:

‖〈a1, b1〉‖ ⊕ ‖〈a2, b2〉‖ def=‖〈a1b2 + a2b1, b1b2〉‖‖〈a1, b1〉‖ � ‖〈a2, b2〉‖ def=‖〈a1a2, b1b2〉‖

– 32 –

Z przyczyn praktycznych, ale i historycznych parę 〈a, b〉 utożsamiamy zwykle z napisem a

b.

Zatem symbola

bzwany ułamkiem zwykłym oznacza klasę abstrakcji pewnej specjalnej relacji

równoważności.Dla liczb wymiernych podobnie jak to ma miejsce w przypadku liczb całkowitych można

pokazać, że przy wykonywaniu działań dodawania i mnożenia wybór konkretnego reprezentantaklasy abstrakcji nie ma wpływu na wynik działania. W odróżnieniu od liczb całkowitych obawprowadzone działania arytmetyczne tj. dodawanie i mnożenie mają działania odwrotne (pozadzieleniem przez 0).

6. Teoria mocy

Niech A i B będą dowolnymi zbiorami. Zbiory te będziemy nazywać równolicznymi wtedyi tylko wtedy, gdy istnieje funkcja f różnowartościowa i odwzorowująca zbiór A na zbiór B.Fakt równoliczności zbiorów A i B będziemy wyrażać pisząc: A ∼ B. Pojęcie równolicznościzbiorów jest uogólnieniem na dowolne zbiory – zbiory elementów dowolnej natury – pojęciarównej liczebności. W myśl tej definicji równoliczne są zbiory A = {7, t, α, �} i B = {♣,♦,♥,♠}.Rozpatrzmy jednak bardziej interesujący przykład.

Przykład. Niech a, b ∈ R oraz a < b. Rozważmy przedział (a; b). Pokażemy, że przedział(a; b) jest równoliczny ze zbiorem liczb rzeczywistych. W tym celu, zgodnie z warunkamidefinicji równoliczności, należy wskazać funkcje różnowartościową i wzajemnie jednoznacznieprzeprowadzającą (a; b) na R. Zauważmy, że funkcja tangens przeprowadza otwarty przedział(− 1

2π; 1

2π) na przedział (−∞; +∞). Zatem należy zmodyfikować tak dziedzinę funkcji tangens,

by przekształcała ona w R przedział (a; b). W tym celu przekształcamy przedział (a; b) poprzezwzajemnie jednoznaczną i różnowartościową funkcję h na przedział (− 1

2π; 1

2π). Niech zatem

h : (a; b) −→(−1

2π;

12π

)

oraz

h : x �−→ π · x−a+b2

b− ałatwo sprawdzić, że funkcja h spełnia wszystkie potrzebne warunki. Dokonując teraz superpozy-cji odwzorowań f i h otrzymujemy funkcję f ◦ h różnowartościową i wzajemnie jednoznacznieprzeprowadzającą zbiór (a; b) na R. Zatem zgodnie z definicją zbiory te są równoliczne.Ostatni przykład pokazuje, że zbiór nieskończony może być równoliczny ze swoim podzbio-

rem właściwym.

Twierdzenie. Relacja równoliczności zbiorów jest relacją równoważności.

Dowód. Ponieważ relacją równoliczności zbiorów jest zdefiniowana poprzez bijekcję, to dladowolnego zbioru A jest on równoliczny z samym sobą i bijekcię taką realizuje identyczność iA. Zkolei symetria relacji równoliczności wynika z faktu, że każda bijekcja jest funkcją odwracalną.Natomiast przechodniość wynika z udowodnionego poprzednio faktu, że złożenie bijekcji jestbijekcją. �

– 33 –

Relacja równoliczności zbiorów, jako równoważność dzieli zbiory na rozłączne klasy zbiorówi utożsamia ze sobą zbiory równoliczne.

Przyjmujemy umowę, że każdemu zbiorowi możemy przyporządkować pewien nowy atrybut,który zwyczajowo oznaczać będziemy jako |A|, zwany mocą zbioru A. (Niekiedy używane jesttakże inne onaczenie: cardA od angielskiego słowa cardinality.) Ponadto zbiory A i B mają tęsamą moć, wtedy i tylko wtedy, gdy są one równoliczne. Wyrażamy ten fakt pisząc:

A ∼ B ⇐⇒ |A| = |B|.

Widać stąd, że moc zbioru jest cechą klasy abstrakcji relacji równoliczności zbiorów. Mocezbiorów nazywamy także liczbami kardynalnymi.Zbiór A będziemy nazywać skończonym wtedy i tylko wtedy, gdy istnieje liczba naturalna n,

że A ∼ n (tu n rozumiemy jako zbiór wszystkich liczb naturalnych mniejszych niż n). Mówimywtedy, że A jest n-elementowy. Każdy zbiór, który nie jest skończony nazywamy nieskończonym.Przyjmujemy umowę, że moc zbioru n-elementowego jest równa n, zaś moc zbioru liczb

naturalnych oznaczamy symbolem ℵ0.

Twierdzenie.

(i) Dla każdego n ∈ N nie istnieje funkcja różnowartościowa z n ∪ {n} w n.(ii) Jeśli m ∈ N , n ∈ N oraz m ∼ n, to m = n.(iii) Nie istnieje liczba naturalna równoliczna z N , co oznacza, że N jest nieskończony.Dowód. Ad (i) Dowód zostanie poprowadzony przez indukcję. Gdy n = 0, to twierdzenie

jest prawdziwe, ponieważ nie istnieje funkcja określona na zbiorze niepustym o wartościach wzbiorze pustym.

Przypuśćmy teraz, że twierdzenie zachodzi dla n ∈ N oraz niech

f : n ∪ {n} ∪ {n′} → n ∪ {n}

oznacza funkcję różnowartościową. Gdy f nie przyjmuje wartości n, lub też gdy f(n′) = n, tozawężając f do n∪ {n} (w notacji relacyjnej oznacza to funkcja ma wtedy postać f ∩ (n′ × n′))otrzymujemy funkcję różnowartościową z n∪{n} w n – prowadzi to do sprzeczności z założeniemindukcyjnym. Przyjmując natomiast f(i) = n, gdzie i ≤ n oraz zakładając, że j = f(n′) mamyiż z tego, że f jest różnowartościowa wynika j < n. Wtedy funkcja g : n ∪ {n} → n określonawarunkiem:

g(x) ={f(x), gdy x �= i

j, gdy x = i

jest różnowartościowa. Sprzeczność ta pokazuje, że f nie może być różnowartościowa. Zatem(i) zachodzi.

Zajmiemy się teraz podpunktem (ii). Dla m ∈ N oraz n ∈ N pokażemy, że:Jeśli istnieje funkcja różnowartościowa z m w n, to m ⊆ n. (∇)

Indukcja prowadzona jest względem m. Gdy m = 0, to twierdzenie jest prawdziwe.Przypuśćmy, że (∇) zachodzi i niech f : m′ → n będzie różnowartościowa. Skoro m ⊆ m′,to istnieje funkcja różnowartościowa z m w n, a więc z założenienia indukcyjnego mamy m ⊆ n.Przypadek, gdy m = n nie jest możliwy ze względu na poprzedni podpunkt. Stąd m �= n i w

– 34 –

oparciu o własności zbioru liczb naturalnych mamy, że m ∈ n. Ostatecznie m′ = m ∪ {m} orazm′ ⊂ n, co pokazuje, że warunek (∇) jest spełniony. Z kolei (ii) jest konsekwencją (∇).Dla dowodu (iii) zauważmy, że gdyby istniała funkcja różnowartościowa f : N → n, to jej

zawężenie do n ∪ {n} byłaby funkcją różnowartościową z n ∪ {n} w n, a to stoi w sprzecznościz (i). �

Zbiory przeliczalne

Zbiór A nazywamy przeliczalnym wtedy i tylko wtedy, gdy jest skończony, bądź równolicznyze zbiorem liczb naturalnych.Przez ciąg o wyrazach w niepustym zbiorze A będziemy rozumieć każdą funkcję z N w A.

Twierdzenie. Niepusty zbiór A jest przeliczalny wtedy i tylko wtedy, gdy jest on zbioremwyrazów pewnego nieskończonego ciągu.

Dowód. Rozpocznijmy od przypadku, gdy A = {a0, a1, . . . , am−1} tzn., gdy jest skończony.Wtedy ciąg (αn) możemy określić następująco:

αn ={an, gdy n ∈ {0, 1, . . . ,m− 1},am−1, gdy n ∈ {m, . . .},

Jeśli zaś A jest zbiorem przeliczalnym nieskończonym, to istnieje funkcja f : N → A, cooznacza, że A jest zbiorem wyrazów pewnego ciągu (ciągu nieskończonego) (αn), dla któregozachodzi równość: f(αn) = f(n) dla wszystkich n ∈ N .Załóżmy, że A jest zbiorem wyrazów pewnego ciągu (αn). Jeżeli A jest skończony, to z

definicji jest zbiorem przeliczalnym. Jeżeli zaś jest zbiorem nieskończonym, to kładąc f(1) = α1

i f(k) niech będzie równe pierwszemu wyrazowi ciągu (αn) różnemu od f(k − i) dla 1 ≤ i < k

otrzymujemy funkcję f : N → A różnowartościową przekształcającą N ma A. Stąd A jestrównoliczny z N . �

Twierdzenie. Podzbiór zbioru przeliczalnego jest zbiorem przeliczanym.

Dowód. Niech A będzie zbiorem przeliczalnym oraz niech B ⊂ A. Jeśli B jest przeliczalny,to jest skończony z definicji. Jeśli zaś jest nieskończony, to załóżmy, że B �⊆ A. PonieważA jest zbiorem przeliczalnym, to istnieje funkcja f : N → A będąca bijekcją. Niech terazg : N → B będzie funkcją określoną równością: g(1) = f(k1), przy czym k1 jest najmniejsząliczbą naturalną, dla której f(k1) ∈ B, g(n) = f(k1) dla n > 1, gdzie kn jest najmniejszą liczbąnaturalną, dla której kn > kn−1 oraz f(kn) ∈ B. Funkcja g jest różnowartościowa i przekształcaN na B. Wynika stąd, że B jest równoliczny z N , a więc przeliczalny i nieskończony. �

Inny sposób dowodu. Niech A oznacza niepusty zbiór przeliczalny oraz niech B ⊆ A. Zpoprzedniego twierdzenia wiemy, że istnieje funkcja f z N w A. Niech x0 ∈ B będzie dowolniewyróżniony. Określamy funkcję g : A→ B w następujący sposób:

g(x) ={x, gdy x ∈ B ∩A,x0, gdy x ∈ A \B.

Funkcja g jest funkcją z A na B, a zatem B jest przeliczalny. �

– 35 –

Twierdzenie. Jeżeli f : A → B jest dowolną funkcją oraz X ⊆ A jest zbiorem przeliczal-nymm to f(X) jest przeliczalny.

Dowód. Niech f : A → B będzie dowolną funkcją oraz niech X ⊆ A będzie przeliczalny.Gdy X = ∅, to f(X) = ∅ jest przeliczalny. Gdy zaś X �= ∅, to istnieje funkcja g : N → X

będąca „na” X. Niech f|X oznacza obcięcie funkcji f do X, co oznacza, że f|X = f ∩ (X ×B).Jest przy tym f|X przeprowadza X na f(X) a złożenie f|X ◦ g : N → f(X) jest „na” f(X).Oznacza to na mocy wcześniejszego twierdzenia, że f(X) jest zbiorem przeliczalnym. �

Lemat. Funkcja f : N × N → N określona równością f(〈m,n〉) = 2n(2m + 1) − 1 jestbijekcją.

Dowód. Przypuśćmy, że 2n1(2m1 + 1) − 1 = 2n2(2m2 + 1) − 1. Wtedy 2n1(2m1 + 1) =2n2(2m2 + 1). Z zasadniczego twierdzenia arytmetyki (twierdzenia o jednoznaczności rozkładuna czynniki pierwsze) wynika, że n1 = n2, co implikuje równość 2m1 + 1 = 2m2 + 1, a wkonsekwencji m1 = m2. Tak więc f jest różnowartościowa.Dla pokazania, że f jest „na” obierzmy dowolną liczbę naturalną k i przyjmijmy, że n ∈ N

oznacza największą liczbę naturalną taką, że 2n dzieli k + 1. Wynika stąd, żek + 12njest liczbą

nieparzystą, bo gdyby tak nie było, to n nie byłaby największa. Weźmy m =12

(k + 12n

− 1).

Wtedy f(〈m,n〉) = k – co oznacza, że f jest funkcją „na” zbiór N . �

Twierdzenie. Jeśli A i B są przeliczalne, to A×B jest przeliczalny.Dowód. Jeśli którykolwiek ze zbiorów A i B jest pusty, to A × B jest pusty, a zatem

przeliczalny. Załóżmy, że żaden z tych zbiorów nie jest pusty. Poza tym niech f : N → A ig : N → B będą funkcjami na. Funkcję h określamy następująco:

h : N ×N → A×B,h(〈m,n〉) = 〈f(m), g(n)〉.

Funkcja h przekształca „na” A×B, co oznacza, że zbiór ten jest przeliczalny. �

Twierdzenie. Jeżeli {Ai| i ∈ I} jest przeliczalną rodziną zbiorów przeliczalnych (I jestprzeliczalny oraz każde Ai jest zbiorem przeliczalnym), to

⋃i∈I

Ai jest także zbiorem przeliczalnym.

Dowód. Niech {Ai| i ∈ N} oznacza rodzinę zbiorów przeliczalnych. Zakładamy, że każdy zelementów tej rodziny jest zbiorem niepustym. Niech f : N → I będzie „na” I oraz dla każdegoi ∈ I niech gi : N → Ai oznacza przekształcenie „na”. Określamy funkcję h : N ×N →

⋃i∈I

Ai

równością h(〈m,n〉) = gf(m)(n). Funkcja h jest „na”⋃i∈I

Ai, gdyż jeśli a ∈⋃

i∈I Ai, to istnieje

i ∈ I takie, że a ∈ Ai. Istnieją wtedy m,n ∈ N takie, że f(m) = i (przypomijmy, że f jest „na”I) oraz gi(n) = a (funkcja gi jest „na” Ai). Wynika stąd, że

h(〈m,n〉) = gf(m)(n) = gi(n) = a,

co pokazuje, że h jest „na”⋃i∈I

Ai. Jako obraz zbioru przeliczalnego zbiór⋃i∈I

jest przeliczalny.�

– 36 –

Wniosek. Zbiór liczb całkowitych jako suma zbioru liczb naturalnych oraz przeliczalnegozbioru liczb całkowitych ujemnych jest przeliczalny. �

Wniosek. Zbiór liczb wymiernych jako podzbiór zbioru N ×N jest przeliczalny. �

Wniosek. Dla dowolnego przeliczalnego zbioru A oraz dowolnego n ∈ N zbiór An wszyst-kich funkcji z n w A jest przeliczalny. �

Wniosek. Dla dowolnego przeliczalnego zbioru A zbiór A∗ wszystkich słów skończonychnad A przeliczalny. �

Zbiory nieprzeliczalne

Twierdzenie. (Cantora) Dla każdego zbioru A nie istnieje funkcja z A „na” zbiór P(A).

Dowód. Przypuśćmy, że f : A→ P(A) jest „na” P(A). Wtedy

A0 = {a ∈ A| a �∈ f(a)}.

Skoro f jest „na” P(A), to istnieje a0 ∈ A, że f(a0) = A0. Zatem

a0 ∈ A0 wtedy i tylko wtedy, gdy a0 ∈ f(a0).

Otrzymaliśmy, żea0 ∈ A0 wtedy i tylko wtedy, gdy a0 �∈ A0

Sprzeczność ta dowodzi, że f nie może być funkcją „na” P(A). A więc wstępne przypuszczeniebyło fałszywe. �

Wniosek. Zbiór potęgowy P(A) nie jest równoliczny z żadnym podzbiorem zbioru A. �

Wniosek. Zbiór wszystkich podzbiorów zbioru liczb naturalnych oraz zbiór wszystkich nies-kończonych ciągów o wyrazach ze zbioru {0, 1} są zbiorami nieprzeliczalnymi. �

Wniosek. Nie istnieje zbiór wszystkich zbiorów.

Dowód. Jeśliby A był zbiorem wszystkich zbiorów, wtedy każdy podzbiór zbioru Anależałby do A, czyli P(A) ⊆ A. Wtedy P(A) byłby równoliczny z pewnym podzbiorem zbioruA, co przeczy pierwszemu z wniosków mówiącemu o nierównoliczności zbioru potęgowego P(A)ze zbiorem A. �

Przyjmujemy umowę, że moc zbioru wszystkich podzbiorów zbioru liczb naturalnych tj.zbioru P(N ) nazywać będziemy continuum i oznaczać przez c.

– 37 –

Porównywanie liczb kardynalnych

Jeśli A i B są dowolnymi zbiorami to mówimy, że moc zbioru A jest mniejsza lub równamocy zbioru B i piszemy |A| ≤ |B| wtedy i tylko wtedy, gdy istnieje funkcja różnowartościowaz A w B.

Lemat. Jeśli A ∼ A oraz B ∼ B, to istnieje funkcja różnowartościowa z A w B wtedy itylko wtedy, gdy istnieje funkcja różnowartościowa z A w B.

Dowód. Niech ϕ : A → A oraz ψ : B → B będą bijekcjami. Wtedy, gdy f : A → B jestróżnowartościowa, to ψfϕ−1 : A → B jest także różnowartościowa. Podobnie jeśli g : A → B

jest różnowartościowa, to ψ−1gϕ : A→ B jest także różnowartościowa. �

Mówimy, że moc zbioru A jest mniejsza od mocy zbioru B i piszemy |A| < |B|, gdy |A| ≤ |B|oraz |B| �≤ |A|.Twierdzenie. (Lemat Banacha) Dla dowolnych funkcji f : A→ B oraz g : B → A istnieją

zbiory A1 ⊆ A, A2 ⊆ A oraz B1 ⊆ B,B2 ⊆ B takie, że:(i) A1 ∪A2 = A, A1 ∩A2 = ∅;(ii) B1 ∪B2 = B,B1 ∩B2 = ∅;(iii) f(A1) = B1;(iv) g(B2) = A2.

Dowód lematu Banacha zostanie przeprowadzony w oparciu o metodę punktu stałego, któraprzedstawiona zostanie później.

Lemat. Jeśli A, A′, B i B′ są takimi zbiorami, że: A ∼ A′, B ∼ B′, A ∩ B = ∅ orazA′ ∩B′ = ∅, to A ∪B ∼ A′ ∪B′.

Dowód. Niech f : A → A′ oraz g : B → B′ będą bijekcjami. Wtedy f ∪ g jest bijekcjąustalającą równoliczność A ∪ B ∼ A′ ∪B′. Z tego, że f ∪ g jest bijekcją wynika, że A ∩B = ∅.Różnowartościowość funkcji f ∪ g implikuje, że A′ ∩B′ = ∅. �

Zatrzymajmy się nad warunkami niepustości przecięć zbiorów A i B oraz A′ i B′. Rozpatrz-my zbiory: A = {1,©} oraz B = {©, λ}, gdzie A ∪ B = {1,©, λ}. Ponadto niech A′ = {∗,�}i B′ = {Θ,Π}, zaś bijekcje f i g niech mają postać:

f :{

1 �→ ∗© �→ � g :

{© �→ Πλ �→ Θ

Ponieważ A′∪B′ = {∗,�,Θ,Π}, a stąd już mamy, że A∪B �∼ A′∪B′. Widać stąd istotę założeńlematu. Można oczywiście wskazać inne jeszcze przykłady niespełniania założeń i wynikające ztego konsekwencje.

– 38 –

Twierdzenie. Jeśli A, B i C są dowolnymi zbiorami, to(i) |A| ≤ |A|;(ii) jeśli |A| ≤ |B| oraz |B| ≤ |C|, to |A| ≤ |C|;(iii) ����������� ��������� ����� jeśli |A| ≤ |B| oraz |B| ≤ |A|, to |A| = |B|.Dowód. Podpunkty (i) oraz (ii) są prostymi konsekwencjami defincji mocy zbioru. Przed-

stawimy dowód części (iii). Przyjmijmy, że f : A → B oraz g : B → C są funkcjami różnowar-tościowymi. Wykorzystajmy lemat Banacha uzyskując rozbicia zbioru A i B w postaci A1 ⊆ A

i A2 ⊆ A oraz B1 ⊆ B i B2 ⊆ B, dla których zachodzą równości:

A1 ∪A2 = A, A1 ∩A2 = ∅ (1)

B1 ∪B2 = B, B1 ∩B2 = ∅ (2)

f(A1) = B1 (3)

g(B2) = A2 (4)

Konsekwencją (3) jest A1 ∼ B1, zaś konsekwencją (4), że A2 ∼ B2. Z równości (1) i (2) oraz zostatniego lematu mamy, że A ∼ B. �

Twierdzenie. Zbiór liczb rzeczywistych jest równoliczny ze zbiorem {0, 1}N . Zbiór liczbrzeczywistych ma moc continuum.Dowód. Niech ϕ : {0, 1}N →R będzie określona warunkiem:

ϕ(f) =

⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩

∞∑n=10

f(n)2n

, jeśli f−1({0}) jest nieskończony,

−∞∑

n=10

f(n)2n

, jeśli f−1({0}) jest skończony,

Wykażemy różnowartościowość funkcji ϕ. Zauważmy, że jeśli f−1({0}) jest nieskończony, toϕ(f) ≥ 0. Gdy natomiast jest skończony, to ϕ(f) < 0. Załóżmy, że f oraz g są dwoma ciągaminieskończonymi zawierającymi nieskończenie wiele zer. Poza tym niech k będzie najmniejsząliczbą o tej własności, że f(k) �= g(k). Przyjmijmy (bez utraty ogólności), że f(k) = 0 orazg(k) = 1. Gdy ϕ(f) = ϕ(g), to odejmując k − 1 początkowych wyrazów w odpowiednichszeregach dostaniemy:

∞∑n=k+1

f(n)2n

=12k

+∞∑

n=k=1

g(n)2n

. (5)

Wynika stąd, że szereg po lewej stronie ma sumę mniejszą od∞∑

n=k+1

12n

=12k(zawiera nieskoń-

czenie wiele zer). Z drugiej strony szereg po prawej stronie ma sumę nie mniejszą niż 12k . Z

tego powodu nie jest możliwa równość (5) – dowodzi to, że ϕ(f) �= ϕ(g). W sytuacji, gdy f i gzawierają jedynie skończenie wiele zer, to postępujemy podobnie. Wtedy szere pe lewej stroniedąży do sumy nie większej niż 1

2k podczas, gdy szereg po prawej stronie dąży do sumu większejod 1

2k (wynika to z faktu, że g zawiera tylko skończenie wiele zer). Zatem i w tym przypadkurówność (5) jest możliwa. Oznacza to, że przekształcenie ϕ jest różnowartościowe. Poza tym|{0, 1}|N ≤ |R|.

– 39 –

Aby wykazać prawdziwość nierówności przeciwnej definiujemy przekształcenie

ψ : (0, 1) → {0, 1}N ,

przyporządkowujące każdej z liczb przedziału (0, 1) jej reprezentację binarną. Jest to ciąg bi-narny f : N → {0, 1} o tej własności, że jeśli a ∈ (0, 1) jest wybraną liczbą, to

a =∞∑

n=0

f(n)2n

.

Przyjmujemy ponadto umowę, że gdy rozwinięcie o skończonej i nieskończonej liczbie zer, wybie-ramy to znich, które ma nieskończoną liczbę zer. Funkcja ψ jest różnowartościowa, a więc

|(0, 1)| ≤ |{0, 1}N |.

Ponieważ wiemy, że (0, 1) ∼ R, to na mocy twierdzenia Cantora-Bernsteina zachodzi tezatwierdzenia. �

Działania na liczbach kardynalnych

Dla rozłącznych zbiorów A i B przez moc sumy zbiorów A i B rozumiemy sumę mocy:|A| + |B|. Na mocy lematu o równoliczności sum zbiorów rozłącznych mamy zagwarantowanąpoprawność tej definicji tj. jej niezależność od wyboru reprezentantów.

Lemat. Jeśli A, A′, B i B′ są takimi zbiorami, że: A ∼ A′, to A×B ∼ A′ ×B′.

Dowód. Niech dane będą bijekcje f : A→ A′ oraz g : B → B′. Funkcja h : A×B → A′×B′

określona równościąh(a, b) = 〈f(a), g(b)〉

jest bijekcją.Różnowartościowość funkcji h wynika z różnowartościowości funkcji składowych f i g oraz

warunku równości par uporządkowanych.Przypuśćmy teraz, że h(A × B) �⊆ A′ × B′. Oznacza to istnienie przynajmniej jednej pary

〈a′, b′〉 ∈ A′×B′ nie mającej przeciwobrazu poprzez funkcję h. W konsekwencji nie istnieje bądźprzeciwobraz elementu a′ poprzez funkcję f czyli f−1(a′), bądź przeciwobraz b′ poprzez funkcjęh czyli g−1(b′). Jednak żadna z tych możliwości zajść nie może z uwagi na definicyjne własnościfunkcji f i g. Sprzeczność ta oznacza, że teza lematu zachodzi. �

Iloczyn mocy zbiorów A i B (bez zakładania rozłączności) tj. |A||B| definiujemy jako moczbioru A×B. Poprawność tej definicji wynika z ostatniego lematu.Lemat. Jeśli A, A′, B i B′ są takimi zbiorami, że: A ∼ A′, to AB ∼ (A′)B′

.

Dowód. Niech dane będą bijekcje f : A → A′ oraz g : B → B′. Definiujemy funkcję:ϕ : AB → (A′)B′

w następujący sposób: dla dowolnej funkcji h : A→ B przyjmujemy:

ϕ(h) = ghf−1.

– 40 –

Funkcją odwrotną do ϕ jest ψ : (A′)B′ → AB określona dla funkcji h′ : A′ → B′równością:

ψ(h′) = g−1h′f.

Funkcja ta jest bijekcją na mocy twierdzenia o własnościach bijekcji. �

Bezpośrednio z ostatniego lematu wynika poprawność następującej definicji. Moc zbiorufunkcji AB definiujemy jako potęgę mocy |A||B|.

W przeszłości pokazywaliśmy, że zbiór wszystkich liczb całkowitych jest przeliczalny, cooznacza, że ℵ0ℵ0 = ℵ0. Można wykazać, że jeśli tylko n > 0 jest skończone, to ℵn

0 = ℵ0. Zdrugiej strony pokazaliśmy również, że 2ℵ0 = c.Działania dodawania, mnożenia i potęgowania liczb kardynalnych zawężone do zbiorów

skończonych pokrywają się z operacjami arytmetycznymi dodawania, mnożenia i potęgowania.

Twierdzenie. Dla dowolnej liczby kardynalnej |A| zachodzi nierówność: |A| < 2|A|.Dowód. Funkcja ϕ : A→ P(A) określona dla {a} ∈ A równością:

ϕ(a) = {a}

jest funkcją różnowartościową. Stąd |A| < 2|A|. Z drugiej strony twierdzenie Cantora głosi, żenie istnieje funkcja z A na zbiór potęgowy P(A). Stąd |A| < 2|A|. �

Twierdzenie. Dla dowolnych zbiorów A, B, C zachodzi równość:(|A||B|)|C|

= |A||B||C|.

Dowód. Naszym celem jest pokazanie równoliczności zbiorów(AB)Coraz AB×C . W tym

celu niech ϕ :(AB)C → AB×C będzie określona następująco: f : C → AB oraz dla b ∈ B i

c ∈ Cϕ(f)(b, c) =

(f(c)

)(b).

Warto zauważyć, że ϕ(f) : B × C → A, zaś f(c) : B → A.Niech teraz ψ : AB×C → (

AB)C oznacza funkcję, która każdej funkcji g : B × C → A

przyporządkowuje funkcję ψ(g) : C → AB taką, że: dla dowolnego c ∈ C funkcja (ψ(g)) (c) :B|toA zachodzi równość: ((

ψ(g))(c))(b) = g(b, c).

Wykażemy, że ψ jest funkcją odwrotną do ϕ. Niech f : C → AB będzie dowolną funkcją.Wtedy dla dowolnych b ∈ B oraz c ∈ C zachodzą równości:

((ψ(ϕ)

)(c))(b) = ϕ(f)(b, c) = (f(c))(b).

Ponieważ równości te zachodzą dla dowolnego b ∈ B, to

(ψ(ϕ(f))) (c) = f(c),

to zaś oznacza wobec dowolności c ∈ C, że (ϕ(ψ(f))) = f .Niech teraz g : B×C → A będzie dowolne oraz niech dowolne będzie b ∈ B i c ∈ C. Wtedy

(ϕ(ψ(g))) (b, c) = ((ψ(g))(c)) (b) = g(b, c).

– 41 –

Ponieważ b ∈ B oraz c ∈ C są dowolne, to mamy (ϕ(ψ(g))) = g. Jest to równoznaczne zfaktem bycia przez ψ funkcją odwrotną do ϕ. Oznacza to więc, że ϕ jest bijekcją ustalającąrównoliczność. �

Na mocy tego twierdzenia mamy również: cℵ0 =(2ℵ0)ℵ0 = 2ℵ0ℵ0 = 2ℵ0 = cℵ0

7. Relacje porządkujące

Jeśli η ⊆ A×A jest zwrotna, antysymetryczna i przechodnia, to mówimy, że η jest relacjąporządku częściowego w A, zaś parę 〈A, η〉 nazywamy zbiorem częściowo uporządkowanym.W przypadku, gdy 〈A, η〉 jest zbiorem częściowo uporządkowanym, a dodatkowo relacja η

jest spójna, to mówimy, że η jest relacją porządku liniowego, zaś parę 〈A, η〉 nazywamy zbioremuporządkowanym liniowo lub też łańcuchem.

Przykłady.

A. Jeśli A jest dowolnym niepustym zbiorem to para 〈P(A),⊆〉 jest zbiorem częściowo uporząd-kowanym. �

B. Jeśli N oznacza zbiór liczb naturalnych, zaś | ⊆ N ×N oznacza relację podzielności w tymzbiorze określoną warunkiem:

〈m,n〉 ∈ | def⇐⇒ istnieje k ∈ N , że k ·m = n,

to 〈N , |〉 jest zbiorem częściowo uporządkowanym. �

C. Relacja ≤⊆ R×R rozumiana jako relacja niewiększości w R jest relacją porządku częściowe-go, a więc 〈R,≤〉 jest uporządkowany częściowo. Relacja ta jest ponadto spójna, zatem 〈R,≤〉jest liniowo uporządkowany.Wprost z definicji relacji zawierania otrzymujemy następujący wynik.

Wniosek. Każda rodzina zbiorów wraz z relacją zawierania jest zbiorem częściowo upo-rządkowanym. �

D. Niech dany będzie niepusty zbiór A traktowany jak alfabet oraz niech jak poprzednio A∗

oznacza zbiór wszystkich słów skończonych nad A. W zbiorze A∗ definiujemy relację porządkuprefiksowego. Mówimy, że słowo w ∈ A∗ jest prefiksem słowa u ∈ A∗ i piszemy 〈w, u〉 ∈ pr↪→wtedy i tylko wtedy, gdy istnieje słowo w′ ∈ A∗, że u = ww′. Para 〈A∗,

pr↪→〉 jest zbiorem

uporządkowanym częściowo (formalnie możemy napisać tak: 〈w, u〉 ∈ pr↪→ def⇐⇒ istnieje w′ ∈A∗, że u = ww′). Dowód tej obserwacji pozostawiamy jako nietrudne ćwiczenie. �

E. Podobnie jak w przykładzie D. symbol A oznacza alfabet, zaś A∗ zbiór wszystkich słówskończonych nad A. Zakładamy, że A jest częściowo uporządkowany przez relację ≤. W oparciuo relację porządku częściowego

pr↪→ określamy nową relację lx↪→ działającą w A∗. Relację tę

– 42 –

będziemy nazywać porządkiem leksykograficznym nad 〈A,≤〉 i definiujemy ją następująco: dladowolnych słów u ∈ A∗ oraz w ∈ A∗ mamy: 〈w, u〉 ∈ lx↪→ wtt, gdy 〈w, u〉 ∈ pr↪→ lub gdy istniejei < min(|w|, |u|) takie, że w(i) < u(i) oraz dla każdego j < i, zachodzi w(j) = u(j).

Wniosek. Porządek leksykograficzny nad 〈A,≤〉 jest porządkiem częściowym. Gdy nato-miast 〈A,≤〉 jest zbiorem liniowo uporządkowanym, to także porządek leksykograficzny jest po-rządkiem liniowym.

Dowód. Relacjalx↪→ jest zwrotna z definicji porządku pr↪→. Zajmijmy się teraz dowodem

antysymetrii. Niech 〈w, u〉 ∈ lx↪→ oraz 〈u,w〉 ∈ lx↪→. Jeśli 〈w, u〉 ∈ pr↪→ oraz 〈u,w〉 ∈ pr↪→, to u = w.Gdy zaś istnieje i < min(|w|, |u|), że w(i) < u(i) oraz dla każdego j < i jest w(j) = u(j), to unie może być prefiksem w, a to oznacza, że istnieje k < min(|w|, |u|), że u(k) < w(k) oraz dlakażdego w(j) = u(j). Stąd nie jest możliwe ani to, że i ≤ k, ani też, że k ≤ i. Sprzecznośćta pokazuje, że jedynym możliwym przypadkiem jest taki, że w jest prefiksem u i na odwrót.

Oznacza to u = w, czyli relacjalx↪→ jest antysymetryczna.

Pokażemy, że jeśli 〈w, u〉 ∈ lx↪→ oraz 〈u, v〉 ∈ lx↪→, to 〈w, v〉 ∈ lx↪→. Rozpatrzmy po kolei wszystkiemożliwości:

(i) w jest prefiksem u (tj. 〈w, u〉 ∈ pr↪→);(ii) istnieje i1 < min(|w|, |u|), że w(i1) < u(i1) oraz dla każdego j < i1 jest w(j) = u(j);

(iii) u jest prefiksem v (tj. 〈u, v〉 ∈ pr↪→);(iv) istnieje i2 < min(|w|, |u|), że w(i2) < u(i2) oraz dla każdego j < i2 jest w(j) = u(j).

Jeśli spełnione są warunki (i) oraz (iii), to 〈w, v〉 ∈ pr↪→, a zatem 〈w, v〉 ∈ lx↪→.Gdy zachodzi (i) oraz (iv), to jeżeli |w| ≤ i2 wtedy 〈w, v〉 ∈

pr↪→.

W przypadku, gdy i2 < |w|, to skoro 〈w, u〉 ∈ pr↪→, więc w(i2) = u(i2) ≤ v(i2) oraz nawszystkich pozycjach wcześniejszych słowa w i u pokrywają się (mają identyczne litery). Wynika

stąd, że 〈w, v〉 ∈ lx↪→.Jeżeli zachodzą warunki (ii) oaz (iii), to i1 < |v| i postępując analogicznie jak w poprzednim

przypadku dostajemy, że 〈w, v〉 ∈ lx↪→.Teraz rozpatrzmy ostatnią możliwość, a mianowicie, że zachodzą (ii) oraz (iv). Gdy i1 ≤ i2,

to w(i1) ≤ u(i1) ≤ v(i1), w(i1) �= u(i1) to zaś implikuje, że w(i1) �= v(i1). Dodatkowo dla j < i1

jest w(j) = u(j) = v(j). Fakty te łącznie dają warynek: 〈w, v〉 ∈ lx↪→. W przypadku, gdy i2 < i1,to postępując podobnie jak poprzednio pokazujemy, że i2 jest numerem pierwszego miejsca, na

którym różnią się słowa w oraz v i w(i2) ≤ v(i2). To oznacza, że 〈w, v〉 ∈ lx↪→.Ponieważ w każdym z rozpatrywanych przypadków wystąpiła przechodniość relacji

lx↪→, to

dowód przechodniości jest zakończony.

Jeśli porządek w A jest liniowy, to dla dowolnych słów w, u z których żadne nie jestprefiksem drugiego, jeśli i < min(|w|, |u|) jest najmniejszą taką liczbą, dla której w(i) �= u(i), to

〈w, u〉 ∈ lx↪→, jeśli tylko w(i) ≤ u(i); oraz 〈u,w〉 ∈ lx↪→ w przypadku przeciwnym. Wynika stąd, żelx↪→ jest porządkiem liniowym. �

Rozpatrzmy teraz zbiór częściowo uporządkowany 〈{0, 1},≤〉, przy czym uporządkowanie

– 43 –

≤ jest takie, że 0 ≤ 1. Przykładem łańcucha wstępującego jest ciąg:

εlx↪→ 0

lx↪→ 00

lx↪→ . . .

lx↪→ 0k lx↪→ 0k+1 lx↪→ . . .

podczas, gdy przykładem łańcucha zstępującego jest ciąg:

. . .lx↪→ 0k+11

lx↪→ 0k1

lx↪→ . . .

lx↪→ 1.

Zauważamy również zależność 0k lx↪→ 0n1 dla dowolnych liczb k ∈ N oraz n ∈ N . Dla porządkuprzypomnijmy, że ε jest symbolem słowa pustego.

Drzewa

Rozpatrzmy dowolny zbiór A, dla którego jak poprzednio A∗ oznacza zbiór wszystkch słówskończonych nad A. Przez drzewo nad A rozumiemy każdy niepusty zbiór t ⊆ A (od angielskiego

słowa tree) taki, że jeśli w ∈ t oraz u pr↪→ w, to również u ∈ t (oznacza to, że zbiór t jest zamkniętyze względu na prefiksy). Każdy z elementów drzewa nazywamy jego wierzchołkiem.Bezpośrednio z definicji drzewa mamy, że każde drzewo zawiera słowo puste ε. Słowo

puste ε ∈ t nazywamy korzeniem drzewa t. Gdy w ∈ t oraz wa ∈ t dla pewnego a ∈ A, towa nazywamy a-tym następnikiem (lub dzieckiem) wierzchołka w. Liściem nazywamy każdywierzchołek drzewa nie mający następnika.W przypadku, gdy A jest zbiorem nieskonczonym, to w drzewie nad A mogą występować

wierzchołki o nieskonczenie wielu następnikach. W takim przypadku rzędem wierzchołka w wdrzewie t nazywamy moc zbioru następników tego wierzchołka – symbolicznie |{a ∈ A|wa ∈ t}|.Jeśli π ⊂ t, to zbiór ten nazwiemy ścieżką w drzewie t wtt, gdy jest on uporządkowany linio-

wo poprzez relację porządku prefiksowegopr↪→ (tj. 〈π, pr↪→〉 jest zbiorem liniowo uporządkowanym),

a ponadto zachodzi warunek: dla dowolnych u ∈ π, w ∈ π oraz v ∈ t jeśli w pr↪→ vpr↪→ u, to v ∈ π.

Moc zbioru π nazywamy dlugością ścieżki π.

Przykłady. Oto kilka przykładów drzew.(i) {ε} – drzewo o jednym wierzchołku;(ii) {an| n ∈ N}, dla dowolnie ustalonej litery alfabetu A;(iii) {w ∈ A∗| |w| ≤ n} – pełne drzewo nad A wysokości n;(iv) A∗ – pełne drzewo nad A;(v) Dla A = {a1, a2} dzrewem jest na przykład zbiór {a1, a1a2, a1a1a2, a1a1a2a2}Twierdzenie. (Lemat Koniga) Jeśli t ∈ A∗ jest drzewem, w którym każdy wierzchołek

jest skończonego rzędu, wtedy jeśli t zawiera ścieżki skończone dowolnej długości, to t zawierarównież ścieżkę nieskończoną.Dowód. Nech t będzie drzewem spełniającym założenia twierdzenia. Dla przeprowadzenia

dowodu określmy funkcję f : N → t spełniającą warunek: dla każdej liczby n ∈ N wierzchołekf(n′) jest następnikiem wierzchołka f(n) w drzewie t, a ponadto t zawiera ścieżki dowolnejdługości zaczynające się od f(n). Przyjmijmy, że f(0) = ε. Korzeń drzewa spełnia warunekna podstawie założenia twierdzenia. Ustalmy f(n) oraz rozpatrzmy wszystkie następniki wierz-chołka f(n). Gdyby ścieżki zaczynające się od f(n) miały skonczoną długość, to istniałoby

– 44 –

ograniczenie górne długości ścieżek, co kłóci się z tym, że w drzewie t występują ścieżki dowolnejskończonej długości. Wynika stąd, że istnieje następnik wierzchołka f(n) od którego zaczynająsię ścieżki dowolnej długości. Jako f(n′) wybieramy dowolny z tych następników.Zatem, na mocy zasady indukcji, zbiór f(N ) ma nieskończoną ścieżkę w drzewie t. �

Dla dowolnego drzewa t nad A oraz w ∈ t przyjmijmy oznaczenie: t|w = {u ∈ A∗| wu ∈ t}.Wniosek. Jeśli t jest drzewem nad A oraz w ∈ t jest wierzchołkiem, to zbiór t|w jest

drzewem nad A.

Dowód. Słowo puste ε ∈ t|w. Dodatkowo jeżeli v jest prefiksem słowa u, to wv jestprefiksem słowa wu. Wynika stąd, że t|w jest zamknięty ze względu na prefiksy. �

Drzewo r ⊆ A∗ nazywamy poddrzewem drzewa t ⊆ A∗, co wyrażamy pisząc r & t wtt, gdyistnieje wierzchołek w ∈ t, że r = t|w. Mówimy wtedy, żę r jest poddrzewem zaczepionym wwierzchołku w drzewa t.

Niech k ∈ N \ {0} oraz niech t ⊆ {0, 1, . . . , k − 1}∗ będzie drzewem. Nazwiemy je drzewemk-argumentowym wtt, gdy każdy wierzchołek t nie będący liściem jest rzędu k. Zbiór wszystkichdrzew k-argumentowych oznaczymy przez Tk. Ponieważ jego elementami są zbiory (drzewa),to Tk jest rodziną zbiorów, a każda rodzina zbiorów jest, jak wiemy, uporządkowana częściowoprzez relację zawierania. Gdy t ⊆ r, gdzie r ∈ Tk oraz t ∈ Tk, to mówimy, że drzewo r rozszerzadrzewo t. Symbolem FTk oznaczamy zbiór wsystkich drzew skończonych k-argumentowych.

Drzewami k-argumentowymi są między innymi:(i) {ε};(ii) pn = {w ∈ {0, 1, . . . , k − 1}∗| |w| ≤ n} jest drzewem pełnym wysokości n;(iii) {0, 1, . . . , k − 1}∗ drzewem pełnym k-argumentowym nieskończonym;(iv) t1 = {0n| n ∈ N} ∪ {0n1| n ∈ N} ∪ {02n+110| n ∈ N} ∪ {02n+111| n ∈ N} jest drzewem2-argumentowym (binarnym).

(v) t2 = {0n| n ∈ N} ∪ {0n1| n ∈ N} ∪ {02n10| n ∈ N} ∪ {02n11| n ∈ N} jest także drzewem2-argumentowym (binarnym).

Drzewo t ⊆ {0, 1, . . . , k − 1}∗ nazywamy drzewem k≤-argumentowym wtt, gdy spełnia onowarunek:

dla każdego w ∈ t oraz i < k, jeśli wi ∈ t, to wj ∈ t, dla każdego j ≤ i

Zbiór wszystkich drzew k≤-argumentowych oznaczamy przez Tk≤ , zaś symbolem FTk≤ zbiórwszystkich skończonych drzew k≤-argumentowych. Ze stosownych definicji mamy: Tk ⊆ Tk≤ .Ponadto zbiór Tk≤ jest uporządkowany częściowo przez relację ⊆.Jeśli t jest drzewem k-argumentowym, to jest ono także drzewem k≤-argumentowym.

Różnica między tymi obiema pojęciami polega na tym, że drzewa k≤-argumentowe mogą miećwierzchołki rzędów pośrednich między 0 i k. Z drugiej strony nie każde drzewo nad {0, . . . , k−1}∗jest drzewem k≤-argumentowym.

Wniosek. Para 〈FTk≤ ,&〉 jest zbiorem częściowo uporządkowanym.Relacja & była jak pamiętamy określona w zbiorze drzew. We wniosku jest ona ograniczona

do zbioru FTk≤ drzew skończonych.

– 45 –

Dowód. Zauważmy, że t = tε. Z tego też faktu wynika zwrotność relacji &.Zajmijmy się teraz antysymetrią. Załóżmy, że r = t|w i t = r|v. Wynika stąd, że r = t|wv.

Z założenia r jest drzewem skończonym. Przyjmijmy, że u′ ∈ r będzie wierzchołkiem takim, że|u′| jest największą liczbą w zbiorze {|u|| u ∈ r}. Zatem wvu′ ∈ r, a to by oznaczało, że wv = ε.Zatem w = v = ε – co oznacza, że r = t, a więc warunek antysymetrii jest spełniony.

Obecnie wykażemy przechodniość. Niech r = t|w oraz t = s|v, a więc r = (s|v)|w. Skoro

(s|v)|w = s|vw

to r & s, co oznacza przechodniość relacji &.

Drzewa etykietowane

Niech Σ = {Σn}n∈N oznacza indeksowaną rodzinę zbiorów. Elementy Σn nazywamy ety-kietami rzędu n. Zakładamy, że Σ0 zawiera wyróżniony symbol ⊥∈ Σ0.Dla t ∈ Tk≤ przez drzewo etykietowane nad Σ o nośniku t rozumiemy dowolną funkcję

σ : t → ⋃n∈N Σn taką, że dla każdego n ∈ N oraz w ∈ t jeśli w jest rzędu n, to σ(w) ∈ Σn.

Symbolem ‖σ‖ oznaczać będziemy nośnik drzewa etykietowanego σ, zaś symbolem Tk≤(Σ) oz-naczamy zbiór wszystkich drzew etykietowanych nad Σ o nośnikach z Tk≤ . Podobnie możemyzdefiniować Tk(Σ).W zbiorze Tk(Σ) definiujemy relację ≤ w następujący sposób: dla σ ∈ Tk≤ oraz τ ∈ Tk≤ ,

przy czym σ ≤ τ wtt, gdy równocześnie spełnione są warunki:(1) ‖σ‖ ⊆ ‖τ‖;(2) dla każdego w ∈ ‖σ‖, jeśli σ(w) �=⊥, to σ(w) = τ(w).

Wniosek. Relacja ≤⊆ Tk(Σ)× Tk(Σ) jest porządkiem częściowym.

Dowód. Bezpośrednio z definicji wynika zarówno zwrotność jak i przechodniość relacji≤. Dla wykazania antysymetrii przypuśćmy, że σ ≤ τ oraz τ ≤ σ. Wówczas ‖σ‖ = ‖τ‖ i dlaw ∈ ‖σ‖ jeżeli σ(w) �=⊥ lub τ(w) �=⊥, to σ(w) = τ(w). Stąd równość σ(w) = τ(w) ma miejscedla każdego w ∈ ‖σ‖, tzn. σ = τ . �

Przykłady.A. Rozpatrzmy rodzinę etykiet Σ określoną następująco:

Σn =

⎧⎪⎪⎪⎨⎪⎪⎪⎩

{⊥, 1}, dla n = 0,∅, dla n = 1,{+,×, /}, dla n = 2∅, dla n > 2

Przy tak określonej rodzinie etykiet drzewa etykietowane nazywane są wyrażeniami aryt-metycznymi.Wtedy liczbę naturalna n można przedstawić jako wyrażenie arytmetyczne n o nośniku

‖n‖ = {1i| i ≤ n} ∪ {1i0| i < n},

– 46 –

oraz rozkładzie etykiet określonym następująco:

n =

⎧⎪⎨⎪⎩

1, gdy w = 1i0 oraz i < n,

⊥, gdy w = 1n,

+, gdy w = 1i oraz i < n.

Drzewo to ilustruje następujący rysunek.

©+

©1 ©+

©1 ©+

·

n poziomów ·

·

©+

©1 ©⊥

Jeżeli potraktujemy 1 jako liczbę naturalną „jeden”, ⊥ jako „zero”, zaś + jako symboldziałania dodawania liczb naturalnych, to przedstawione na powyżej wyrażenie ma wartość n.Bez tej umowy wymienione symbole pełnią jedynie charakter symboli formalnych wykorzys-tanych przy etykietowaniu wierzchołków drzew.

Symbol ⊥ (ten wyróżniony w definicji etykietowania) pełni w przypadku drzew etykieto-wanych specjalną rolę. Przy jego użyciu oznaczane są te liście w drzewie, z których możliwajest rozbudowa drzewa do większego w sensie relacji ≤. Zatem reprezentacja liczb naturalnychjako drzew etykietowanych ma także tę własność, że n ≤ m w sensie porządku na drzewachetykietowanych wtt, gdy m ≤ n w sensie porządku w zbiorze liczb naturalnych.

Wprowadzimy teraz jeszcze jedną relację porządku częściowego odnoszącą się do drzewetykietowanych. Symbolem

FT (Σ) =∑k∈N

FTk≤(Σ)

oznaczmy zbiór wszystkich skończonych k-argumentowych drzew etykietowanych nad Σ przy kmogącym być dowolną liczbą naturalną. Elementy zbioru FT (Σ) nazywamy termami nad Σ.Wprowadzone poprzednio pojęcie poddrzewa określone dla drzew nieetykietowanych może być

– 47 –

rozszerzone na pojęcie podtermu. Jeśli σ, τ ∈ FT (Σ), to mówimy, że term σ jest podtermemtermu τ i piszemy σ & τ wtt, gdy istnieje w ∈ ‖τ‖, że spełnione są równocześnie warunki:(1) ‖σ‖ = (‖τ‖)|w ,(2) dla u ∈ ‖σ‖, σ(u) = τ(wu).Zarówno definicja zbioru FT (Σ) jak i relacja podtermu odnoszą się do przypadku, gdy Σ0

nie zawiera ⊥. Należy jednak założyć, że Σ0 �= ∅ ponieważ w przy braku tego założenia byłobyFT (Σ) = ∅.Wniosek. Relacja podtermu & jest częściowym porządkiem w FT (Σ). �

7. Kresy zbiorów. Kraty.

Rozpatrzmy zbiory częściowo uporządkowane 〈A,≤A〉 i 〈B,≤B〉 oraz funkcję f : A → B.Mówimy, że f jest monotoniczna wtt, gdy dla każdego x1 ∈ A oraz x2 ∈ A zachodzi warunek:

jeśli x1 ≤A x2 to f(x1) ≤B f(x2).

Funkcję f nazywamy izomorfizmem wtt, gdy f oraz f−1 są monotonicznymi bijekcjami. Jeśli〈A,≤A〉 i 〈B,≤B〉 są izomorficzne, to piszemy 〈A,≤A〉 � 〈B,≤B〉.Bezpośrednio z tej definicji uzyskujemu następujący wynik.

Wniosek. Zbiory częściowo uporządkowane 〈N ,≤〉, 〈{0}∗,≤〉 oraz 〈FT1,⊆〉 są izomor-ficzne.

Dowód. Na wstępie ustalmy, że {0}∗ oznacza zbiór wszystkich słów skończonych nadjednolelementowym alfabetem {0}. Oznacza to, że elementami zbioru {0}∗ są dowolnej długościciągi o wszystkich wyrazach będących zerami. Dość łatwo znaleźć fukncję ustalającą izomorfizm.Jest nią funkcja f : N → {0}∗ taka, że f(n) = 0n. Funkcja g : {0}∗ → FT1 określona wzorem:g(0n) = {0i| i ≤ n} ustala izomorfizm między 〈{0}∗,≤〉 a 〈FT1,⊆〉. �

Nietrudno zauważyć, że izomorfizm wśród zbiorów częściowo uporządkowanych jest relacjąrównoważności.

W każdym zbiorze częściowo uporządkowanym 〈A,≤A〉 relacja porządku częściowego ≤A

generuje nową relację <A⊆ A×A zwaną relacją poprzedzania określoną warunkiem:

a1 <A a2 wtt, gdy 〈a1, a2〉 ∈≤A oraz a1 �= a2 (tj. a1 ≤A a2 i a1 �= a2).

W zbiorze częściowo uporządkowanym 〈A,≤A〉 element ⊥≤A ∈ A nazywamy elementemnajmniejszym w 〈A,≤A〉 wtt, gdy dla wszystkich a ∈ A zachodzi warunek:

〈⊥≤A , a〉 ∈≤A (⊥≤A ≤A a).

Mówimy natomiast, że a◦ ∈ A jest elementem minimalnym w tym zbiorze wtt, gdy nieistnieje a ∈ A, że a ≤ a◦.

– 48 –

Element ( nazywamy elementem największym w 〈A,≤A〉 wtt, gdy spełniony jest warunek:

〈a,(≤A〉 ∈≤A (a ≤A (≤A).

Element a◦ nazywamy elementem maksymalnym w zbiorze 〈A,≤A〉, gdy nie poprzedza onżadnego elementu w zbiorze A tzn. jeśli nie istnieje a ∈ A, ze a◦ ∈≤A a.

Odwolajmy sie↪ teraz do przypadkow zbiorow uporza↪dkowanych omowionych poprzednio.W zbiorze cze↪sciowo uporza↪dkowanym 〈P(X), �〉 przez relacje↪ inkluzji, elementem maksy-

malnym jest zbior X i jest to jedyny element maksymalny. Natomiast w drugim z omawianychprzypadkow tj. w zbiorze 〈N , |〉 nie ma elementu maksymalnego poniewaz n|2n i n �= 2n dlawszystkich liczb naturalnych.

Każdy zbiór częściowo uporządkowany 〈A,≤A〉 określa poprzez relację odwrotną do ≤A

nowy zbiór częściowo uporządkowany 〈A,≤−1A 〉. O zbiorze 〈A,≤−1

A 〉 mówimy, że określa wstosunku do 〈A,≤A〉 porządek dualny. Dualność tę widać między elementami wyróżnionymiobu porządków i tak na przykład jeśli ⊥≤A jest elementem najmniejszym w 〈A,≤A〉, to jestrównocześnie elementem największym w 〈A,≤−1

A 〉. Podobnie z elementem największym w〈A,≤A〉.Twierdzenie. W zbiorze cze↪sciowo uporza↪dkowanym 〈A,≤A〉 istnieje co najwyzej jeden

element najwie↪kszy (najmniejszy). Element najwie↪kszy (najmniejszy) jest maksymalny (mini-malny) w tym zbiorze.

Dowód. Przypuśćmy, że (≤A

1 oraz (≤A

2 są elementami największymi w 〈A,≤A〉. Wtedyrównocześnie zachodzą warunki (≤A

1 ≤ (≤A

2 oraz (≤A

2 ≤ (≤A

1 , to jednak na mocy antysymetriirelacji porządku częściowego ≤A oznacza, że (≤A

1 = (≤A

2 .Załóżmy teraz, że (≤A ∈ A jest elementem największym. Wprost z definicji elementu

maksymalnego mamy, że gdyby a◦ ∈ A był takim elementem, to byłoby (≤A ≤ a◦, ale zkolei definicja elementu największego gwarantuje, że dla wszystkich a ∈ A, w tym dla a◦ jesta ≤A (≤A . Dalej już z antysymetrii relacji porządku częściowego dostajemy (≤A = a◦. �

Przyk�lad. Niech A be↪dzie rodzina↪ zbiorow uporza↪dkowana↪ przez relacje↪ porza↪dku cze↪sci-owego ⊂. Rodzina A sklada sie↪ przy tym z naste↪puja↪cych zbiorow:

{a, d}, {a, e}, {a, b, c}, {a, c, d}, {a, b, c, d}, {a, b, c, e}.

W zbiorze 〈A,⊂〉 elementami minimalnymi sa↪ zbiory {a, d}, {a, e} i {a, b, c}, natomiast elemen-tami maksymalnymi zbiory {a, b, c, d} i {a, b, c, e}. Widac sta↪d, ze zbior cze↪sciowo uporza↪dko-wany moze miec wie↪cej niz jeden element minimalny i wie↪cej niz jeden element maksymalny.Jednoczesnie nalezy zauwazyc, ze w 〈A,⊂〉 nie ma ani elementu najmniejszego, ani elementunajwie↪kszego. �

Niech X ⊂ A (!) będzie podzbiorem zbioru częśiowo uporządkowanego 〈A,≤A〉. Wtedy:element γ ∈ A nazywamy ograniczeniem górnym zbioru X, jezeli dla wszystkich a ∈ X zachodziwarunek:

a ≤A γ,

– 49 –

natomiast element δ ∈ A (!) nazywamy ograniczeniem dolnym zbioru X, jeżeli dla każdegoa ∈ A jest:

δ ≤A a.

Zwróćmy uwagę, że definicje ograniczeń dolnego i górnego nie mówią, że jeśli element jestograniczeniem dolnym czy też górnym, to jest on co najwyżej jeden – czy tylko jeden. Faktten, jak się niebawem okaże, ma bardzo poważne konsekwencje.

Przyk�lad. Niech 〈N , |〉 be↪dzie zbiorem cze↪sciowo uporza↪dkowanym przez relacje↪ podziel-nosci. Ponadto, niech A = {12, 18, 30}. Ograniczeniami dolnymi zbioru A sa↪ liczby 1,2,3,6 –ponieważ kazda z nich jest dzielnikiem liczb 12, 18, 30, zaś ograniczeniami gornymi tego zbiorusą 180, 360, 540, . . . , n · 180, . . ., gdyz kazda z liczb zbioru A dzieli te liczby. �

Zbiór ΓX wszystkich ograniczeń górnych zbioru X jest oczywiście podzbiorem zbioru cze↪s-ciowo uporza↪dkowanego (A,≤A). Jeśli ΓX ma element najmniejszy, to nazywamy go kresemgornym zbioru X i oznaczamy symbolem

⊔X (lub też supX i czytamy: supremum X). Podob-

nie, jesli zbior∆X wszystkich ograniczen dolnych zbioruX ma element najwie↪kszy, to nazywamygo kresem dolnym tego zbioru i oznaczamy przez ||-----||X (lu też infX (i czytamy: infimum X).

Przyk�lad. Jeszcze raz rozwazmy zbior cze↪sciowo uporza↪dkowany 〈N , |〉 z ostatniego przy-kladu oraz zbior X zdefiniowany jak poprzednio. W zbiorze ograniczen gornych tego zbioru180, 360, 540, . . . , n · 180, . . . elementem najmniejszym jest liczba 180 – bowiem wszystkie po-zostale sa↪ jej wielokrotnosciami. Matomiast elementem najwie↪kszym w zbiorze ograniczen dol-nych jest liczba 6, gdyz kazda z liczb 1,2,3,6 dzieli liczbe↪ 6. Mamy zatem: ||

-----||X = 6 oraz⊔X = 180. �

Zwykle elementami wyróżnionymi w zbiorze częściowo uporządkowanym 〈A,≤A〉 nazywamyelementy maksymalne i minimalne oraz elementy najmniejszy i największy. Jeżeli natomiastX ⊆ A do jego elementów wyróżnionych dołączamy także kresy dolny i górny. Widać z tego, żekresy zbioru występują zawsze w konteście przestrzeni z relacją porządku.

Może się zdarzyć, że w tym samym zbiorze określonych jest kilka relacji porządku częścio-wego. Wtedy konieczne jest, a nie tylko wskazane, opatrywanie elementów wyróżnionych in-deksami relacji względem której są one wyróżnione. Gdy zaś w zbiorze występuje jedna tylkorelacja porządku częściowego, to możemy wskażnik taki zaniedbać.

Porządek częściowy 〈A,≤A〉 nazywamy kratą wtt, gdy dla każdej pary elementów istniejąkresy dolny i górny. Natomiast kratą zupełną nazywamy taki zbiór częściowo uporządkowany, wktórym każdy podzbiór X ⊆ A ma kresy dolny i górny.

Twierdzenie. Dla dowolnego porządku częściowego 〈A,≤A〉 następujące warunki są rów-noważne:(i) 〈A,≤A〉 jest kratą zupełną;(ii) każdy podzbiór zbioru X ⊆ A ma kres górny w 〈A,≤A〉;(iii) każdy podzbór X ⊆ A ma kres dolny w 〈A,≤A〉.Dowód. Bezpośrednio z definicji mamy układ implikacji (i)=⇒(ii) oraz (i)=⇒(iii).Zajmiemy się teraz implikacją (ii)=⇒(i). W tym celu załóżmy, że każdy podzbiór X zbioru

〈A,≤A〉 ma kres górny. Ponadto niech ∆X oznacza zbiór wszystkich ograniczeń dolnych zbioru

– 50 –

X w 〈A,≤A〉. Umówmy się, że a◦ =⊔

∆X . Ponadto niech x ∈ X. Z definicji, dla dowolnegoδ ∈ ∆X jest δ ≤A x. Zatem x jest ograniczeniem górnym zbioru ∆X . Wynika stąd, że a◦ ≤A x.Oznacza to, że a◦ jest ograniczeniem dolnym zbioru X, bo x ∈ X został wybrany dowolnie. Zdrugiej strony jeśli δ jest ograniczeniem dolnym zbioru X, to δ ∈ ∆X . Zatem δ ≤A a◦. Stąd a0

jest największym ograniczeniem dolnym zbioru X, czyli a◦||-----||X.Podobnie dowodzimy, że (iii)=⇒(i). �

Przykłady.

(1) Rozpatrzmy dowolny niepusty zbiór A. Wtedy oczywiście para 〈P(A),⊆〉 jest porządkiemczęściowym. Jeśli A jest dowolną rodziną zbiorów należących do P(A), to kresem górnymtej rodziny jest zbiór stanowiący sumę jej elementów tj.

⊔A =⋃A. Kresem dolnym

rodziny A jest zaś zbiór ||-----||A =⋂A – przy założeniu, że A �= ∅, zaś ∅, gdy A = ∅. Wynika

stąd, że 〈P(A),⊆〉 jest kratą zupełną.(2) Rozpatrzmy relację podzielności | w zbiorze N . W tym przypadku nie możemy dla dowol-nego podzbioru N mówić o istnieniu jego kresu górnego, bo jak wykazaliśmy w przeszłościzbiór N jest nieograniczony. Natomiast każdy niepusty podzbiór tego zbioru ma elementnajmniejszy.

(3) Rozpatrzmy alfabet binarny {0, 1} oraz porządek prefiksowy. Zbiór 〈{0, 1}∗ , pr↪→〉, gdzie pr↪→jest symbolem porządku prefiksowego, jest zbiorem częściowo uporządkowanym. W takimprzypadku zbiór {0, 1} nie ma kresu górnego, ale ma kres dolny jest nim słowo puste tj.||-----||{0, 1} = ε. Zatem {ε} jest jedynym prefiksem słów 0 oraz 1. �

Na zakończenie tej części zajmiemy się jeszcze krótko porządkiem liniowym. Przypomnijmy,że jest to wzbogacony o warunek spójności porządek częściowy. Mamy następujące fakty.

Twierdzenie. Jeśli 〈A,≤A〉 jest zbiorem liniowo uporządkowanym oraz X ⊂ A, to takżezbiór 〈X,≤A|X〉 jest liniowo uporządkowany.Dowód. Skoro dla wszystkich par elementów zbioru A zachodziły definicyjne warunki

relacji porządku liniowego, to zachodzą one z definicji dla par elementów dowolnego podzbioruzbioru A �

Twierdzenie. Dla każdego elementu a0 zbioru liniowo uporządkowanego 〈A,≤A〉 następu-jące warunki są równoważne:

(a) a0 jest elementem największym,

(b) a0 jest elementem maksymalnym,

Dowód. W zbiorze uporządkowanym liniowo a0 jest elementem największym wtedy i tylkowtedy, gdy dla każdego elementu a ∈ A jest a ≤A a0. Zatem nie istnieje takie a ∈ A, że a0 ≤A a

– co oznacza, że a0 jest elementem maksymalnym.Teraz załóżmy, że a0 jest elementem maksymalnym i nie jest elementem największym.

Oznaczałoby to, że a0 <A a0, bo każdy element a ∈ A, w tym a0 jest jego poprzednikiem. Tasprzeczność potwierdza tezę. �

Analogicznie jak poprzednio możemy uzasadnić prawdziwość następującego twierdzenia.

– 51 –

Twierdzenie. Dla kazdego elementu a0 zbioru liniowo uporza↪dkowanego 〈a,≤A〉 naste↪pu-ja↪ce warunki sa↪ rownowazne:

(a) a0 jest elementem najmniejszym,

(b) a0 jest elementem minimalnym, �

Na zakończenie bez dowodu przedstawimy bardzo istotne, z praktycznego punktu widzenia,twierdzenie.

Twierdzenie. Jesli 〈A,≤A〉 jest zbiorem liniowo uporządkowanym oraz X jest niepustymzbiorem skończonym, to istnieją w X elementy najmniejszy i największy. �

8. Twierdzenia o punkcie stałym

Twierdzeń takich jest kilka, my przedstawimy te, które będą istotne z punktu widzeniaczekających nas zadań. Na wstępie zdefiniujmy jednak pojęcie, któremu są one poświęcone.Jeśli A jest dowolnym niepustym zbiorem, zaś f : A→ A dowolną funkcją, to mówimy, że f maw A punkt stały wtt, gdy istnieje a ∈ A, że f(a) = a.

Twierdzenie. (Knastera-Tarskiego) Dla kraty zupełnej 〈A,≤A〉 oraz funkcji monotonicznejf : A→ A funkcja ma najmniejszy punkt stały a ∈ A.Dowód. Oznaczmy przez A = {a ∈ A|f(a) ≤ a} oraz niech a = ||-----||A. Jeżeli a ∈ A, to

a ≤A a. Ponadto z założenia monotonoczności funkcji f mamy: f(a) ≤A f(a), zaś z definicjizbioru A mamy f(a) ≤A a. Łącznie mamy f(a) ≤A f(a) ≤ a dla elementów A. Wynika stąd,że f(a) jest ograniczeniem dolnym zbioru A. A ponieważ z założenia jest kresem dolnym, tof(a) ≤A a. Nierówność ta w połączeniu z monotonicznością funkcji f daje, że f

(f(a)

) ≤A f(a).To zaś gwarantuje, że f(a) ∈ A. Stąd ponieważ a jest ograniczeniem dolnym z A to a ≤A f(a).W połączeniu z faktem, że f(a) ≤A a na mocy antysymetrii relacji ≤A mamy a = f(a).Dla wykazania, że a jest najmniejszym punketm stałym przypuśćmy, że f(a�) = a�. Jednak

a� ∈ A oraz a ≤A a�. Zatem dowód zakończony. �

Przykłady. Rozpatrzmy alfabet A o tej własności, że {0, 1} ⊆ A. Określamy funkcjęf : P(A∗) → P(A∗) określoną równością:

f(X) = {ε} ∪ {0w|w ∈ X} ∪ {1w|w ∈ X}

Funkcja f jest monotoniczna oraz zbiór {0, 1}∗ jest najmniejszym punktem stałym. �

Dowód twierdzenia BanachaNiech f : A→ B oraz g : B → A. Funkcję ϕ : P(A) → P(A) określamy równością:

ϕ(X) = A− g(B − f(X)).

Operacja dopełniania zbioru do przestrzeni jest antymonotoniczna, bo odwraca porządek okreś-lony w przestrzeni poprzez relację zawierania. Wynika stąd, że funkcja ϕ jest monotoniczna.

– 52 –

Niech teraz A1 będzie punktem stałym funkcji ϕ. Zbiór ten określa jednoznacznie pozostałezbiory:

A2 = A \ A1, B1 = f(A1), B2 = B \B1.

Należy pokazać, że A2 = g(B2). Skoro

g(B2) = g(B \B1) = g(B \ f(A1)),

toA \ g(B2) = A \ g(B \ f(A1)) = ϕ(A1) = A1.

Dlategog(B2) = A \ A1 = A2,

a zatem A2 = g(B2) – co kończy dowód. �

Przez zbiór skierowany rozumiemy każdy podzbór zbioru uporządkowanego 〈A,≤A〉, gdyX �= ∅ oraz, gdy każde dwa elementy mają ograniczene górne. Innymi słowy, jeśli x1 ∈ X orazx2 ∈ X, to istnieje x3 ∈ X, że x1 ≤A x3 oraz x2 ≤A x3. Zauważamy, że zbiór skierowany jestuogólnieniem łańcucha.Przez porządek zupełny rozumieć będziemy każdy taki zbiór uporządkowany 〈A,≤A〉, że A

ma element najmniejszy oraz każdy zbiór skierowany ma kres górny.Jeśli 〈A,≤A〉 oraz 〈B,≤B〉 są porządkami zupełnymi, to funkcję f : A → B nazywamy

ciągłą wtt, gdy f zachowuje kresy górne zbiorów skierowanych. Oznacza to, że dla dowolnegozbioru skierowanego X ze zbioru 〈A,≤A〉 zbiór f(X) , ma kres górny w 〈B,≤B〉, a przy tym:

f(⊔

X)

=⊔

f(X).

Wniosek. Jeśli 〈A,≤A〉 oraz 〈B,≤B〉 są porządkami zupełnymi oraz f : A→ B jest ciągła,to f jest monotoniczna.Dowód. Niech zgodnie z założeniem twierdzenia f : A→ B będzie ciągła. Jeśli a1 ≤A a2,

to {a1, a2} jest skierowany i jego kresem górnym jest a2. Zatem

f(a2) = f(⊔

{a1, a2})

=⊔{f(a1), f(a2)}.

Wynika stąd, że f(a1) ≤B f(a2) – co oznacza zgodnie z definicją monotoniczność funkcji f . �

Wniosek. Superpozycja funkcji ciągłych jest funkcją ciągłą.Dowód. Ponieważ w przekształceniu ciągłym obrazem zbioru skierowanego jest zbiór

skierowany, to w połączeniu z porzednim wnioskiem otrzymujemy monotoniczność superpozycji.�

Twierdzenie. Jeśli 〈A,≤A〉 jest porządkiem zupełnym oraz f : A→ A jest funkcją ciągłą,to f ma najmniejszy punkt stały a0 oraz

a0 =⊔{fn(⊥)|n ∈ N}.

– 53 –

Dowód. Na wstępie zwróćmy uwagę na fakt, że zbiór {fn(⊥)| n ∈ N} jest łańcuchem,co oznacza, że jest zbiorem skierowanym. Jest to konsekwencją tego, że dla dowolnego n ∈ Nmamy:

fn(⊥) ≤ fn+1(⊥).

Dowód tej zależności możemy przeprowadzić przez Indukcję. Jeśli n = 0, to oczywiście ⊥ jestelementem najmniejszym. Drugi krok indukcyjny jest konsekwencją założonej w twierdzeniufunkcji f . Zatem z dowolności wyboru n ∈ N mamy na mocy Zasady Indukcji Matematycznejpewność, że fn(⊥) ≤ fn+1(⊥), a w efekcie otrzymujemy, że istnieje a0 =

⊔{fn(⊥)|n ∈ N}.Ponadto:

f(a0) = f(⊔

{fn(⊥)|n ∈ N})

=⊔{fn(⊥)|n ∈ N}

=⊔

({fn(⊥)|n ∈ N} ∪ {⊥}) =⊔{fn(⊥)|n ∈ N} = a0.

Powodem tego jest fakt, że po pierwsze funkcja f jest z założenia monotoniczna, a po drugiedodanie elementu najmniejszego ⊥ do dowolnie wybranego zbioru nie zmienia jego kresu dolnego.Zatem a0 jest punktem stałym. Należy teraz wykazać, że jest to najmniejszy (w sensie

relacji ≤) punkt stały. Przypuśćmy, że a∗ jest dowolnym punktem stałym czyli takim, żef(a∗) = a∗. Znów postępując przez indukcję względem n mamy, że fn(⊥) ≤ a∗, dla wszystkichn ∈ N . Wynika stąd, że a∗ jest ograniczeniem górnym zbioru {fn(⊥)|n ∈ N}. Oznacza to wkonsekwencji, że a0 ≤ a∗. Stąd istotnie, a0 jest najmniejszym punktem stałym. �

9. Lemat Kuratowskiego-Zorna

Poza dowodami konstrukcyjnymi czyli takimi, w których wykazujemy istnienie obiektówopisywanych w twierdzeniu osobną gupę stanowią dowody twierdzeń, w których dowodzimyistnienia postulowanego obiektu, ale nie określamy wyraźnie jego postaci. Takie dowody nazy-wamy dowodami niekonstruktywnymi. Jednym z najważniejszych narzędzi dowodów niekon-struktywnych odgrywa twierdzenie Kuratowskiego-Zorna zwane w bibliografii matematycznejLematem Kuratowskeigo-Zorna.

Twierdzenie. (Lemat Kratowskiego-Zorna) Każdy zbiór częściowo uporządkowany, które-go każdy łańcuch ma ograniczenie górne zawiera element maksymalny.

Dowód twierdzenia zostanie przeprowadzony w przyszłości. �

Wniosek. Każdy porządek częściowy można rozszerzyć do porządku liniowego.

Dowód. Niech 〈A,≤A〉 będzie dowolnym zbiorem częściowo uporządkowanym. Pokażemy,że istnieje relacja porządku liniowego ≤�

A⊆ A2, że ≤A⊂≤�A.

Symbolem P≤A

ord oznaczamy zbiór wszystkich porządków częściowych ≤lA na A takich, że

≤A⊂≤lA. Oznaczmy przez L łańcuch w P≤A

ord (określony ze względu na relację inkluzji). GdyL = ∅, to ≤A= ∅, to ≤A jest ograniczeniem górnym L. Przypuścmy, że L �= ∅. Dla dokończeniadowodu wykorzystamy następujący lemat.

Lemat. Jeśli A jest dowolnie ustalonym zbiorem, to⋃

P≤A

ord jest porządkiem częściowym wzbiorze A. �

– 54 –

Z tego lematu dostajemy, że⋃L jest ograniczeniem górnym w P≤A

ord łańcucha L. LematKuratowskiego-Zorna zapewnia o istnieniu elementu maksymalnego w P≤A

ord, który oznaczymyprzez ≤◦

A. Porządek ten jest liniowy. Gwarantuje to następujący lemat.

Lemat. W dowolnym zbiorze A elementem maksymalnym w zbiorze wszystkich porządkówczęściowych P≤A

ord jest porządek częściowy wtt, gdy porządek ten jest liniowy. �

10. Dobre ufundowanie

Zbiorem dobrze ufundowanym nazywamy każdy zbiór częściowo uporządkowany 〈A,≤A〉,dla którego nie istnieje w A nieskończony ciąg zstępujący elementów tj., nie istnieje funkcjaróżnowartościowa f : N → A taka, że dla wszystkich n ∈ N ma miejsce nierówność: f(n+1) ≤A

f(n). Przez dobry porządek rozumiemy porządek liniowy dobrze ufundowany.Twierdzenie. Porządek częściowy 〈A,≤A〉 jest dobrze ufundowany wtt, gdy każdy niepusty

podzbiór zbioru A zawiera element minimalny.Dowód. Załóżmy, że 〈A,≤A〉 jest zbiorem dobrze ufundowanym oraz, że X ⊆ A jest

niepustym podzbiorem nie mającym elementu minimalnego. Zdefiniujemy ciąg f : N → X

w następujący sposób: f(0) ∈ X jest dowolnym elementem. Załóżmy, że f jest już określonadla liczb k ≤ n oraz, że dla wszystkich k < n jest f(k′) <A f(k). Wtedy f(n′) przyjmujemyjako dowolny element zbioru X taki, że f(n′) <A f(n). Istnienie takiego elementu f(n′) jestkonsekwencją faktu, że f(n) nie jest elementem minimalnym w X. Zatem został określonynieskończony zstępujący ciąg elementów zbioru A. Sprzeczność ta pokazuje, że każdy niepustypodzbiór zbioru A ma element minimalny.

Jeśli teraz f : N → A jest nieskończonym zstępującym ciągiem elementów zbioru A, tof(N ) jest niepustym podzbiorem A nie mającym elementu minimalnego. �

Jako konsekwencję twierdzenia otrzymujemy następujący wniosek.

Wniosek. Zbiór 〈N ,≤N 〉 liczb naturalnych z porządkiem będącym relacją niewiększościjest dobrym porządkiem. �

Przykład.

(i) Jeśli A jest dowolnym zbiorem traktowanym jak alfabet, to zbiór wszytkich słów nad A zporządkiem prefiksowym jest dobrze ufundowany. Mianowicie, gdyby było, że w0 > w1 > . . .

jest zstępującym ciągiem słów, to wystarczy jako funkcję f występującą w definicji zbioru dobrzeufundowanego wziąć funkcję długości słowa i wtedy dostajemy zstępujący ciąg liczb naturalnych|w0| > |w1| > . . ., co na mocy ostatniego wniosku nie jest możliwe.

(ii) Zbiór 〈{0, 1}, lx↪→〉 z porządkiem leksykograficznym generowanym przez porządek 0 ≤ 1 niejest dobrze ufundowany, bo ciąg

. . .lx↪→ 0k+11

lx↪→ 0k1

lx↪→ . . .

lx↪→ 1

tworzy nieskończony łańcuch zstępujący.

(ii) Każdy skończony porządek jest dobrze ufundowany.

– 55 –

(iv) Jeśli mamy dowolną rodzinę zbiorów skończonych F , to 〈F ,⊆〉 jest dobrze ufundowany.Jest to konsekwencją faktu, że dla skończonych zbiorów F1 i F2 jeśli F1 �⊆ F2, to |F1| < |F2|. Wtej sytuacji nieskończony zstępujący ciąg zbiorów prowadziłby do nieskończonego zstępującegozbioru liczb naturalnych. �

Indukcja noetherowska

Zasadę Indukcji Matematycznej sformułowaną dla liczb naturalnych można rozszerzyć nazbiory dobrze ufundowane. Zasadę tę precyjzuje następujące twierdzenie.

Twierdzenie. (Zasada indukcji noetherowskiej) Jeśli 〈A,≤A〉 jest porządkiem dobrze ufun-dowanym oraz jeśli X ⊆ A spełnia warunek: dla dowolnie wybranego a ∈ A z tego, że wszystkieelementy x spełniające nierówność x <A a należą do X wynika, że a ∈ X, wówczas X = A.Dowód. Niech A \ X �= ∅ oraz niech a0 ∈ A \ X będzie elementem minimalnym. Stąd

jeśli x <A a0, mamy x ∈ X. Z założenia a0 ∈ X. Sprzeczność do jakiej doszliśmy pokazuje, żeA \X = ∅, tj. A = P . �

Załóżmy teraz, że 〈A,≤A〉 jest porządkiem dobrze ufundowanym. Przyjmijmy dla dowol-nego a ∈ A następujące oznaczenie:

O(a) def= {x ∈ A : x <A a}.

Zbiór O(a) nazywać będziemy odcinkiem początkowym zbioru 〈A,≤A〉.Zbiory dobrze ufundowane umożliwiają definiowanie funkcji przez indukcję. Mówi o tym

następujące twierdzenie. Przyjmijmy przedtem oznaczenie: symbol PF (A,B) oznaczał będziezbiór wszystkich funkcji częściowych z A w B.

Twierdzenie. (o definiowaniu funkcji przez indukcję noetherowską) Jeśli 〈A,≤A〉 jestzbiorem dobrze ufundowanym, to dla dowolnych zbiorów B i C oraz dowolnej funkcji

h : PF (A× C,B)×A× C → B

istnieje dokładnie jedna funkcja f : A × C → B spełniająca dla dowolnych x ∈ A oraz c ∈ C

następujący warunek:f(x, c) = h(f ∩ (O(x)× C ×B), x, c).

Dowód. Na wstępie pokażemy, że dla każdego x ∈ A istnieje funkcja fx : (O(x)∪{x})×C → B

taka, że dla dowolnych y ≤A x i oraz c ∈ C zachodzi równość:

(∗) fx(y, c) = h(fx ∩ (O(y)× C ×B)x, c).

Wykorzystamy w tym celu indukcję noetherowską względem x. Załóżmy, że y <A x oraz, żefy : (O(y)∪ {y})×C → B jest funkcją spełniającą warunek (∗). W tym celu obierzmy dowolney1 < x oraz y2 < x. Twierdzimy, że dla dowolnego z ∈ A, dla którego z ≤A y1 oraz z ≤A y2

oraz dowolnego c ∈ C zachodzi równość:

fy1(y, c) = fy2(y, c).

– 56 –

Jest to konsekwencją założenia indukcynego oraz zależności (∗).Stąd g =

⋃{fy|y <A} jest funkcją o dziedzinie O(x) × C. Możemy zatem określić funkcjęfx poprzez równość:

fx(y, c) = g ∪ {〈x, h(g, y, c)〉},przy czym y ≤A x oraz c ∈ C. Funkcja ta spełnia (∗), co kończy dowód tej części.Udowodniona własność implikuje, że dla dowolnych x1 ∈ A oraz x2 ∈ A zachodzi równość:

fx1(y, c) = fx2(y, c)

przy y ≤A x1, y ≤A x2 i c ∈ C.W konsekwencji f =

⋃{fx|x ∈ A} jest funkcją o dziedzinie A× C. Otrzymujemy:f(x, c) = fx(x, x) = h(fx ∩ (O(x)×B ×C), x, c) = h(f ∩ (O(x)× C ×B), x, c).

To zaś oznacza, że twierdzenie jest prawdziwe. �

Skomentujmy podstawowe fakty. Otóż zbiór C, o którym mówi twierdzenie jest zbioremparametrów. Poza tym definicja indukcyjna, o której mówi twierdzenie, sprowadza się dookreślenia funkcji na argumencie x w zależności od zdefiniowanej już części funkcji na argu-mentach mniejszych od x ze względu na relację <A. W przypadku, gdy x jest elementemminimalnym w zbiorze A, to teza twierdzenia redukuje się do zależności:

f(x, c) = h(∅, x, c).Dla pełniejszego zrozumienia twierdzenia odwołajmy się do przykładu.

Przykład. Rozpatrzmy funkcję konkatenacji słów nad alfabetem X, tj. f : X∗×X∗ → X∗.Przypuścmy, że dla każdego a ∈ X określona jest funkcja ga : X∗ → X∗ taka, że dla

dowolnego słowa w ∈ X∗ jest ga(w) = aw. Niekiedy funkcja ga nazywana jest niekiedy a-tymnastępnikiem.Funkcję f określa układ równań:

f(ε,w) =w,

f(au,w) =ga(f(u,w)) gdy a ∈ X.Odwołując się do twierdzenia o definiowaniu przez indukcję noetherowską możemy ostatnią

definicję zapisać w postaci sformalizowanej następująco:

A = B = C = X∗

h : [PF (X∗ ×X∗,X∗)×X∗ ×X∗] → X∗

przy czym

h(f, u,w) ={ga(f(u′, w)) gdy u = au′ oraz 〈u′, w〉 ∈ Dom(f),w w pozostałych przypadkach.

W zbiorze A określamy porządek ≤� w następujący sposób:

jeśli u ∈ A oraz w ∈ A, to w ≤� u wtt, gdy istnieje w′ ∈ A, że u = w′w.

Porządek 〈A,≤�〉 jest dobrze ufundowany ponieważ jest izomorficzny z porządkiem prefik-sowym na zbiorze A (izomorfizm taki ustala funkcja przyporządkowująca słowu w jego lustrzaneodbicie wR).Zwróćmy uwagę, że warunki definicyjne funkcji f są równoważne warunkowi (∗) ostatniego

twierdzenia. �

– 57 –

Dobre porządki

W przeszłości była już mowa o dobrych porządkach, przez które rozumieliśmy porządkiliniowe dobrze ufundowane. Analizę własności takich porządków rozpocznijmy od następującegotwierdzenia.

Twierdzenie. Jeśli 〈A,≤〉 jest zbiorem liniowym dobrze uporządkowanym, to dla dowol-nych a ∈ A oraz b ∈ A takich, że a �= b odcinki O(a) oraz O(b) nie są izomorficzne.

Dowód. Niech b < a oraz niech f : O(a) → O(b) będzie izomorfizmem. Załóżmy, że a ∈ Ajest najmniejszym elementem, dla którego istnieje c < a, że O(a) oraz O(c) są izomorficzne.Zbiór O(b) jest podzbiorem właściwym zbioru O(a), to zaś oznacza, że O(b) \ f(O(b)) �= ∅.Przyjmijmy, że c jest elementem najmniejszym w zbiorze O(b)\ f (O(b)) �= ∅. Zachodzi warunek:f(O(b)) ⊆ O(c). Ze sposobu wyboru elementu c wynika, że dla dowolnego x <A c, ponieważx ∈ O(b), to x ∈ f(O(b)). Stąd:

f(O(b)) = O(c),

co oznacza, że odcinki początkowe O(b) i O(c) są izomorficzne. Z założenia mamy c <A b <A a,co powoduje sprzeczność z wyborem elementu a. �

Wniosek. Żaden zbiór dobrze uporządkowany nie jest izomorficzny ze swoim odcinkiempoczątkowym. �

Rozpatrzmy dwa zbiory dobrze uporządkowane 〈A,≤A〉 oraz 〈B,≤B〉. Ponadto niech λbędzie elmentem nie należącym do zbioru B, a jednocześnie niech B′ = B ∪ {λ}. W zbiorzeB′ porządek generowany jest przez porządek w B, z tym zastrzeżeniem, że λ jest elementemnajwiększym w sensie ≤B w zbiorze B′. Funkcję g : A → B′ określimy z wykorzystaniemindukcji noetherowskiej. Mianowicie dla a ∈ A przez g(a) rozumieć będziemy element największyw zbiorze B \ {g(x)|x <A a}, jeśli tylko zbiór ten jest niepusty. W przypadku, gdy jest onpusty, przyjmujemy, że g(a) = λ. Tak określoną funkcję nazywać będziemy przekształceniemkanonicznym indukowanym przez 〈A,≤A〉 oraz 〈B,≤B〉.Przedstwiona konstrukcja będzie przez nas wielokrotnie wykorzystywana. Warto więc grun-

townie ją przemyśleć.

Lemat 1. Jeśli 〈A,≤A〉 i 〈B,≤B〉 są zbiorami dobrze uporządkowanymi oraz g : A → B′

jest przekształceniem kanonicznym indukowanym przez te zbiory, to:(i) dla każdego a ∈ A, jeśli g(a) �= λ, to g(O(a)) = O(g(a));(ii) jeśli a ∈ A jest najmniejszym elementem takim, że g(a) = λ, to g(O(a)) = B.

Dowód. Warunek (i) dowiedziemy posługując się indukcją noetherowską względem a.Zwróćmy uwagę, że ponieważ g(a) �= λ, to nie jest istotne czy odcinek początkowy wyznaczonyprzez g(a) jest brany względem zbioru B czy też zbioru B′. Z założenia co do funkcji g wynika,że

g(a) �∈ {g(x)|x <A a}.Niech c będzie dowolnym elementem odcinka O(a). Jeśliby było g(a) <B′ g(c), to byłoby

g(a) ∈ O(g(c)) = g(O(c)) ⊆ {g(x)|x <A a},

– 58 –

to zaś stoi w sprzeczności z tym, że g(a) �∈ {g(x)|x <A a}. Z tego samego powodu mamyg(c) �= g(a). Stąd

g(O(a)) ⊆ O(g(a)).

Jeśli teraz na odwrót przyjmiemy b <B g(a) dla pewnego b ∈ B, to ponieważ g(a) jest na-jmniejszym elementem spełniającym warunek g(a) �∈ {g(x)|x <A a}, więc istnieje c <A a, żeb = g(c). Zatem b ∈ g(O(a)), co dowodzi (i).Aby dowieść (ii) zauważamy, że skoro g(λ), to B ⊆ {g(x)|x <A a} = g(O(a)). Jednak

z drugiej strony mamy na podstawie założeń punktu (i) mamy, że dla każdego c <A a jestg(c) ∈ B. Ostatecznie g(O(a)) ⊆ B. �

Wprost z tego lematu mamy wniosek.

Twierdzenie. Dla zbiorów dobrze uporządkowanych 〈A,≤A〉 i 〈B,≤B〉 oraz przekształceniakanonicznego g : A→ B′ indukowanego przez te zbiory zachodzą warunki:(i) g jest monotoniczna;(ii) jeśli λ �∈ g(A), to g jest monotoniczna;(iii) jeśli λ ∈ g(A) oraz a ∈ A jest najmniejszym elementem takim, że g(a) = λ, to 〈B,≤B〉jest izomorficzny z odcinkiem początkowym O(a).Kolejny fakt pokazuje, że przekształcenie kanoniczne jest najmniejszym spośród wszystkich

funkcji monotonicznych między dwoma ustalonymi dobrymi porządkami.

Lemat 2. Dla zbiorów dobrze uporządkowanych 〈A,≤A〉 i 〈B,≤B〉 oraz przekształceniakanonicznego g : A → B′ indukowanego przez te zbiory dla dowolnej funkcji monotonicznej iróżnowartościowej f : A→ B oraz dwolnego a ∈ A zachodzi nierówność:

g(a) ≤B f(a).

W szczególności wynika stąd, że jeśli istnieje monotoniczna i różnowartościowa funkcja z 〈A,≤A〉w 〈B,≤B〉, to λ �∈ g(A) oraz g : A→ B jest różnowartościowa.

Dowód. W pierwszym etapie dowiedziemy prawdziwości nierówności przez indukcję noet-herowską względem a, przy dodatkowym założeniu, że g(a) �= λ. Obierzmy dowolne takie λ, żeg(a) �= λ oraz przypuścmy, że f(a) <B g(a). Skoro g(a) �∈ {g(x)|x <A a}, to w oparciu o definicjęfunkcji g wnioskujemy, że istnieje x <A, że f(a) = g(x). Z założenia indukcyjnego mamy g(x) ≤B

f(x). Zatem f(a) ≤B f(x), a to przeczy założeniu o monotoniczności i różnowartościowościfunkcji f . Sprzeczność ta dowodzi, że f(a) ≤B g(a).Załóżmy teraz, że g(a) = λ i niech a ∈ A będzie najmniejszym elementem o taj własności. Z

lematu 1. wynika, że B = {g(x)|x <A a}. Istnieje więc x <A a, że f(a) = g(x). Z wcześniejszejczęści dowodu wynika, że g(x) ≤B f(x). Tak więc f(a) ≤B f(x) oraz podobnie jak poprzedniodostajemy sprzeczność. Musi więc być, że g(a) �= λ.Pozostała część ostatniego lematu jest konsekwencją jego pierwszej części oraz ostatniego

twierdzenia. �

Lemat 3. Dla zbiorów dobrze uporządkowanych 〈A,≤A〉 i 〈B,≤B〉 oraz przekształceńkanonicznych g : A → B′ oraz h : B → A′ indukowanych przez stosowne zbiory mamy, żedla każdego a ∈ A dla którego g(a) �= λ, zachodzi równość: hg(a) = a.

– 59 –

Dowód. Lemat dowiedziemy stosując indukcjię noetherowską względem a ∈ A spełniające-go warunek g(a) �= λ. Obierzmy dowolne takie a oraz rozpatrzmy zbiór X = {h(y)|y <B g(a)}.Dowiedziemy, że X = O(a). Przyjmijmy, że x = h(y) dla pewnego y <B g(a). Z określeniafunkcji g mamy, że istnieje z <A a dla którego y = g(z). Dlatego wykorzystując założenieindukcyjne dostajemy:

h(y) = hg(z) = z.

Dlatego x <A a.

Odwrotnie, jeśli x <A a, to na mocy lematu 1. mamy g(x) <B g(a) oraz z założeniaindukcyjnego x = hg(x). Stąd x ∈ X. To kończy dowód równości X = O(a).Ostatecznie A \ X �= ∅ i hg(a) jest elementem najmniejszym w tym zbiorze. Elementem

tym jest oczywiście a. �

Liczby porządkowe

Podobnie jak liczby kardynalne są pewnymi obiektami przyporządkowanymi zbiorom rów-nolicznym według wcześniej omówionej zasady, tak liczby porządkowe są obiektami przyporząd-kowanymi zbiorom dobrze uporządkowanym. Mianowicie liczby te reprezentują klasy dobrychporządków izomorficznych.

Zauważmy, że izomorfizm zbiorów dobrze uporządkowanych jest zjawiskiem zwrotnym,symerycznym i przechodnim jednak nie możemy powiedzieć, że jest to relacja równoważności.Podobnie jak to miało miejsce w przypadku liczb kardynalnych rónież w przypadku liczb porząd-kowych poprawnie jest mówić o klasie zbiorów, które konkretna liczba porządkowa reprezentujeniż o pewnej cesze klasy abstrakcji relacji równoważności określonej przez izomorfizm zbiorów.Jak łatwo zgadnąć, powodem jest dowiedziony wcześniej fakt nieistnienia zbioru wszystkichzbiorów.

Do jednej klasy zbiorów dobrze uporządkowanych należą zatem dwa dobre porządki, wtedyi tylko wtedy, gdy istnieje izomorfizm między tymi porządkami. Mówimy wtedy, że porządkite mają tę samą liczbę porządkową. Zatem liczba porządkowa α lub inaczej typ porządkowyα zbioru dobrze uporządkowanego 〈A,≤A〉 jest to obiekt charakteryzujący nie tylko zbiór do-brze uporządkowany 〈A,≤A〉, ale wszystkie zbiory dobrze uporządkowane izomorficzne z nim.Piszemy wtedy 〈A,≤A〉 = α. Przyjmujemy przy tym umowę, że jeśli n jest liczbą naturalną, todobremu porządkowi 〈n,≤〉 odpowiada liczba porządkowa n. Jeśli natomiast 〈N ,≤〉, to liczbąporządkową tego zbioru jest omega tj. ω.

Na liczbach porządkowych możemy określić działanie dodawania według następujących za-sad:

(i) jeśli 〈A,≤A〉 oraz 〈B,≤B〉 są dobrymi porządkami o liczbach porządkowych odpowiednio αi β, to liczba porządkowa charakteryzuje porządek będącym rozszerzeniem porządków ≤A oraz≤B w taki sposób, że wszystkie elementy zbioru A są mniejsze od elementów zbioru B – wnowym porządku. Zwykle dokonuje się założenia, że zbiory A i B są rozłączne.

(ii) Dodawanie liczb porządkowych nie jest działaniem przemiennym. Dla przykładu 1+ω = ω,natomiast ω + 1 �= ω. Powodem tego jest fakt, że ω + 1 reprezentuje porządek w elementem

– 60 –

największym, natomiast ω porządek bez elementu największego. Izomorfizm przeprowadza po-nadto element największy na element największy.W przypadku liczb porządkowych skończonych dodawanie tych liczb ma identyczne włas-

ności jak dodawanie liczb naturalnych.Jeśli 〈A,≤A〉 oraz 〈B,≤B〉 są dobrymi porządkami o liczbach (typach) porządkowych α

oraz β, to mówimy, że α jest mniejsza lub równa od β (piszemy zwyczajnie α ≤ β) wtt, gdyistnieje monotoniczna i różnowartościowa funkcja f : A→ B. Przyjmujemy, że α < β wtt, gdyα ≤ β oraz 〈A,≤A〉 i 〈B,≤B〉 nie są izomorficzne.Twierdzenie. Jeśli 〈A,≤A〉 oraz 〈B,≤B〉 są zbiorami dobrze uporządkowanymi o ty-

pach odpowiednio α i β, to: α < β wtt, gdy 〈A,≤A〉 jest izomorficzny z pewnym odcinkiempoczątkowym zbioru 〈B,≤B〉.Dowód. K o n i e c z n o ś ć. Przyjmijmy, że g : A → B′ jest przekształceniem kanon-

icznym indukowanym przez zbiory dobrze uporządkowane 〈A,≤A〉 i 〈B,≤B〉. Funkcja g jestróżnowartościowa na podstawie wcześniejszego twierdzenia (λ nie należy do g(A), a w takimprzypadku twierdzenie gwarantuje różnowartościowość). Różność typów porządkowych i zało-żenie α < β oznacza, że g nie może być „na” B.Niech teraz b ∈ B \ g(A) oznacza najmniejszy element w tym zbiorze. Chcemy pokazać, że

(∇). g(A) = O(b)

Niech a ∈ A będzie dowolnym elementem. Jeśliby b <B g(a), to istniałoby x <A a, że b = g(x)– mimo, że wybór elementu b temu przeczy. Dlatego g(a) <B b, a w konsekwencji g(a) ∈ O(b).Odwrotnie, jeśli c <B b, to ze sposobu wyboru b mamy c ∈ g(A). Zatem równość (∇) jestdowiedziona. Z warunku (∇) wynika, że g(A) jest izomorficzny z O(b).

D o s t a t e c z n o ś ć. Jeśliby 〈A,≤A〉 oraz 〈B,≤B〉 były izomorficzne, to 〈B,≤B〉 byłbyz kolei izomofriczny ze swoim odcinkiem początkowym. Temu zaś przeczy wcześniejsze twierdze-nie. �

Twierdzenie Cantora. Jeśli 〈A,≤A〉 oraz 〈B,≤B〉 są zbiorami dobrze uporządkowanymio typach porządkowych α i β, a przy tym jeśli α ≤ β i β ≤ α, to α = β.

Dowód. Niech g : A → B′ oraz h : B → A′ będą kanonicznymi przekształceniami in-dukowanymi przez 〈A,≤A〉 oraz 〈B,≤B〉. Z wcześniejszego lematu wynika, że λ �∈ g(A) orazλ �∈ h(B). Inny wcześniejszy lemat gwarantuje, że g oraz h są izomorfizmami. �

Twierdzenie. (prawo trichotomii dla liczb porządkowych) Jeśli α i β są dowolnymiliczbami porządkowymi, to zachodzi jedna z następujących możliwości:

(i) α < β, (ii) α > β, (iii) α = β.

Dowód. Z wcześniejszych spostrzeżeń wnioskujemy, że żadne dwa przypadki nie mogą za-chodzić równocześnie.Pokażemy, że musi zajść dowolnie wybrany. W tym celu obierzmy zbiory 〈A,≤A〉 oraz

〈B,≤B〉 o typach porządkowych odpowiednio α i β. Niech następnie g : A→ B′ oraz h : B → A′

będą kanonicznymi przekształceniamim indukowanymi przez zbiory 〈A,≤A〉 oraz 〈B,≤B〉.

– 61 –

Z twierdzenia poprzedzającego lemat 2. mamy, że jeśli λ �∈ g(A), to α ≤ β, a więc (i) lub(ii). Analogicznie jeśli λ �∈ h(B), to β ≤ α oraz zachodzi (i) lub (iii). Jeśli natomiast λ ∈ g(A),to zachodzi (ii). Gdy jest, że λ ∈ h(B), to (i). �

Twierdzenie. Każdy zbiór liczb porządkowych jest dobrze uporządkowany przez relaję ≤.Dowód. Jeśli Z jest dowolnie ustalonym zbiorem liczb porządkwoych, to z twierdzenia

Cantora oraz prawa trichotomii dla liczb porządkowych wynika, że Z jest liniowo uporządkowany.Niech α1 > α2 > . . . będzie nieskończonym łańcuchem zstępującym w Z. Przyjmijmy

ponadto, że dla wszystkich i ≥ 0 jest 〈A,≤A〉 = αi. Chcemy pokazać, że dla dowolnego i > 0istnieje ai ∈ A0, że odcinek początkowy O(ai) jest izomorficzny z Ai oraz, że ai+1 <A0 ai.Własność tę dowiedziemy poprzez indukcję prowadzoną względem i. Skoro a1 < a0, to

na mocy wcześniejszego twierdzenia wiemy, że istnieje a1 ∈ A0, że 〈A,≤A〉 jest izomorficzny zO(a1).Niec teraz i > 1. Postępując podobnie znajdziemy c ∈ Ai−1, 〈Ai,≤Ai

〉 jest izomorficzny zO(c). Z założenia indukcyjnego wiadomo, że 〈Ai−1,≤Ai−1〉 jest izomorficzny z O(ai−1) ⊆ A0.Niech ai ∈ O(ai−1) będzie elementem będącym obrazem c w tym izomorfizmie. Z własnościizomorfizmu wiemy, że odcinek początkowy przechodzi w przekształceniu izomorficznym na od-cinek początkowy. Stąd odcinki O(c) oraz O(ai) są izomorficzne. Wynika stąd, że 〈Ai,≤Ai

〉 jestizomorficzny z O(ai).Został zatem zdefiniowany nieskończony zstępujący ciąg w 〈A0,≤A0〉. Uzyskaliśmy sprzecz-

ność, co oznacza, że Z jest dobrze uporządkowany. �

Twierdzenie Zermelo

Twierdzenie Zermelo Każdy zbiór można dobrze uporządkować tj. dla każdego zbioru Aistnieje relacja dobrego porządku na A.

Dowód. Jeśli R jest zbiorem wszystkich par 〈X, r〉 o tej własności, że X ⊆ A oraz rjest dobrym porządkiem w X. Ponadto niech Z będzie zbiorem wszystkich liczb porządkowychodpowiadających elementom zbioru R. Ponieważ, jak głosi ostatnie twierdzenie, każdy zbiórliczb porządkowych jest dobrze uporządkowany przez relację ≤, to również 〈Z,≤〉 jest takimzbiorem.Określmy funkcję f : Z → A poprzez indukcję noetherowską. Załóżmy, że a0 ∈ A jest

dowolnie ustalonym elementem. Jeśli α ∈ Z, to jako wartość f(α) przyjmujemy dowolny elementzbioru A \ {f(β)| β < α} – jeśli tylko zbiór ten jest niepusty. Gdy {f(β)|β < α} = A, toprzyjmujemy f(α) = a0.Chcemy pokazać, że

f(Z) = A.

Jeśli założymy, że X = f(Z) �= A, to bezpośrednio z definicji funkcji f otrzymujemy, że fjest różnowartościowa, a więc w zbiorze X można określić dobry porządek r, indukowany przezporządek w Z. Porządek ten jest izomorficzny z 〈Z,≤〉. Połóżmy, że 〈Z,≤〉 = γ. Skoro〈Z,≤〉 ∈ R, to γ ∈ Z, a więc O(γ) ⊆ Z. Oznacza to, że Z byłby izomorficzny ze swoimodcinkiem początkowym. Jest to jednak sprzeczne z wcześniej dowiedzionym twierdzeniem, awięc przypuszczenie było fałszywe. Zatem prawdą jest, że f(Z) = A.

– 62 –

Jeżeli istnieje α ∈ Z, że {f(β)|β < α} = A, to niech α będzie najmniejszą liczbą o tejwłasności. Wtedy funkcja f ograniczona do O(α) jest różnowartościowa i skoro f(O(α)) = A,to indukuje ona dobry porządek na zbiorze A. Jeżeli dla każdego α ∈ Z jest {f(β)|β < α} �= A,to f jest różnowartościowa i z tego, że f(Z) = A wynika iż także w tym przypadku f indukujedobry porządek na A. �

Bezpośrednią konsekwencją twierdzenia Zermelo i prawa trichotomii dla liczb porządkowychmamy następujący twierdzenie.

Twierdzenie. Dla dowolnych zbiorów A i B bądź |A| ≤ |B|, bądź też |B| ≤ |A|.Dowód. Zbiory A i B można dobrze uporządkować. Jeśli α i β są typami porządkowymi

tych zbiorów, to na mocy prawa trichotomii dla liczb porządkowych jest α ≤ β lub też β ≤ α.W pierwszym przypadku jest |A| ≤ |B|, zaś w drugim |B| ≤ |A|. �

Dowód lematu Kuratowskiego-Zorna

Dowód. Przypuśćmy, że 〈A,≤A〉 jest porządkiem częściowym, w którym każdy łańcuchma graniczenie górne. Pokażemy, że A zawiera element maksymalny.Przyjmijmy, że Z jest dowolnym zbiorem o mocy większej niż A i niech ) oznacza dobry

porządek w zbiorze Z, którego istnienie gwarantuje twierdzenie Zermelo. Zdefiniujemy funkcjęf : Z → A przez indukcję noetherowską.Niech z ∈ Z i niech X = {f(u)| ≺ Z}. Z założenia indukcyjnego wynika, że X jest

łańcuchemm, a zatem ma ograniczenie górne. Jeżeli X ma jakieś ograniczenie górne a pocho-dzące ze zbioru A\X, to definiujemy f(z) = a, gdzie a jest dowolnie wybranym elementem o tejwłasności. W przeciwnym przypadku X zawiera swoje własne ograniczenie górne, które musibyć elementem największym w X. Kładziemy wtedy f(z) = a.Ponieważ |Z| > |A|, to funkcja f nie może być różnowartościowa. Istnieje zatem z0 ∈ Z,

że dla wszystkich z, jeżeli z0 ≺ z, to f(z0) = f(z). Z definicji funkcji f wynika, że f(z0) jestelementem maksymalnym w 〈A,≤A〉. Zatem lemat Kuratowskiego-Zorna jest dowiedziony. �

Tak lemat Kuratowskeigo-Zorna jak i twierdzenie Zermelo wymagają dla dowodu nowegoaksjomatu, zwanego aksjomatem wyboru. Aksjomat ten głosi, że dla każdej niepustej rodzinyzbiorów istnieje funkcja, która każdemu zbiorowi przyporządkowuje pewien element tego zbioru.Funkcję tę nazywa się funkcją wyboru. Okazuje się, że pewnik wyboru jest równoważny twierdze-niu Zermelo oraz lematowi Kuratowskiego-Zorna, na gruncie pozostałych aksjomatów teoriimnogości.Wcześniej mówiliśmy o niekonstruktywności dowodu. Otóż oba wymienione twierdzenia

mają dowody niekonstruktywne tj. dowodzi się istnienia obiektu nie pokazując jak obiekt tenwygląda, a ściślej, jak można go otrzymać.