perjantai 18. marraskuuta 2022

Fibonacci


Leonardo Pisalainen (noin 1170-1250) tunnetaan paremmin nimellä Fibonacci. Nimi on lyhentymä ilmaisusta filius Bonacci, Bonaccin poika, jossa Bonacci viittaa sukuun eikä isään. Hänet tiedetään lähinnä nimeään kantavasta lukujonosta, mutta Fibonacci oli paljon monipuolisempi matemaatikko. Vuonna 1202 ilmestyneessä teoksessaan Liber abaci ('laskemisen kirja') hän esittelee intialais-arabialaisen lukujärjestelmän, ts. meidän käyttämämme kymmenkantaisen paikkajärjestelmän (ykköset oikealla, kymmenet seuraavaksi vasemmalla, sitten sadat jne.), jonka käyttö alkoi tuohon aikaan vähitellen levitä Eurooppaan. Kesti kuitenkin nelisensataa vuotta, ennen kuin järjestelmä kaikkine desimaalilukumerkintöineen vakiintui. Tämän ohella Liber abaci käsittelee kaupankäynnin matematiikkaa, erilaisia matemaattisia probleemoja sekä geometriaan ja lukuteoriaan luettavia konstruktioita. Muutama muukin Fibonaccin teos on säilynyt.

Liber abacin probleemojen joukossa on myös kanien lisääntymistä koskeva tehtävä: Kanipari pannaan suljettuun aitaukseen. Ne synnyttävät joka kuukausi uuden parin. Nämä ovat kuukauden kuluttua sukukypsiä ja synnyttävät uuden parin jne. Kuinka monta paria aitauksessa on vuoden kuluttua? Fibonacci osoittaa, että kuukausittaiset määrät ovat $1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233$ ja vuoden kuluttua $377$. Yllä olevassa kuvassa Fibonaccin alkuperäinen teksti; määrät laskettu oikeassa reunassa.

Syntyvää lukujonoa on alettu kutsua Fibonaccin luvuiksi. Ne määritellään usein rekursiivisesti: \[f(0)=0,\ f(1)=1,\ f(n)=f(n-1)+f(n-2),\ n \ge 2.\] Seuraava luku on siis aina kahden edellisen luvun summa: \[0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597,2584,4181,6765,\dots\] Kaniparien lukumäärät alkavat luvusta $f(2)$. Kanien lisääntymisen ohella Fibonaccin luvuilla on osoittautunut olevan yhteys moneen asiaan. Tunnetuin lienee kultaisen leikkauksen suhde, jota peräkkäisten Fibonaccin lukujen suhde lähestyy. Hieman erikoisempana esimerkkinä olkoon istumajärjestysongelma: Tuolirivissä on $n$ tuolia ja siihen sijoitetaan kahdenlaisia ihmisiä, rauhallisia ja herkästi riitaantuvia, joita ei voida sijoittaa rinnakkain. Kuinka monella tavalla tuolirivi voidaan täyttää? Vastauksena on Fibonaccin luku. (Esimerkki on peräisin Ron Knottin dokumentista.) 

Hakukone löytää lisää verkkodokumentteja Fibonaccin luvuista. Lähtökohtana voi myös käyttää kanadalaisen Fibonacci Associationin sivua tai edellä mainitun Ron Knottin sivua.

Rekursiivisen määrittelyn sijaan Fibonaccin lukuja voidaan tarkastella myös eksplisiittisesti: $f(n)$ lausekkeena, joka riippuu indeksistä $n$. Rekursiokaavaa $f(n)=f(n-1)+f(n-2)$ ajatellaan tällöin ns. differenssiyhtälönä, jolle etsitään ratkaisu. Menettely on samankaltainen kuin lineaarisen vakiokertoimisen differentiaaliyhtälön ratkaiseminen: muodostetaan sopiva yrite, jossa on tuntematon symboli, ja pyritään määrittämään tämä. Osoittautuu, että yritteeksi kannattaa valita $f(n) = r^n$ ja pyrkiä määrittämään $r$. Kun yrite sijoitetaan differenssiyhtälöön, saadaan \[r^n = r^{n-1} + r^{n-2}.\] Kun tämä jaetaan potenssilla $r^{n-2}$, saadaan luvulle $r$ toisen asteen yhtälö \[r^2 = r + 1.\] Tällä on kaksi juurta: $r_1 = \frac{1}{2}(1 + \sqrt{5})$ ja $r_2 = \frac{1}{2}(1 - \sqrt{5})$. Differenssiyhtälöllä on siis ratkaisuna potenssit $r_1^n$ ja $r_2^n$. Mutta sijoittamalla differenssiyhtälöön todetaan, että sillä on ratkaisuna myös jokainen lauseke $f(n) = c_1 r_1^n + c_2 r_2^n$, missä $c_1$ ja $c_2$ ovat mitä tahansa vakioita (so. riippumattomia luvusta $n$). (Tähän viitataan sanomalla, että differenssiyhtälö on lineaarinen.)

Fibonaccin luvuilla on lisäksi ominaisuudet $f(0) = 0$, $f(1) = 1$. Nämä ovat differenssiyhtälön kannalta ns. alkuehtoja, ja niistä seuraa yhtälöt $c_1 + c_2 = 0$, $c_1r_1 + c_2r_2 = 1$. Tällöin $c_1 = -c_2 = \frac{1}{\sqrt{5}}$ ja Fibonaccin luvun lausekkeeksi saadaan \[f(n) = \frac{1}{\sqrt{5}}\biggl(\Bigl(\frac{1 + \sqrt{5}}{2}\Bigr)^n - \Bigl(\frac{1 - \sqrt{5}}{2}\Bigr)^n\biggr).\]

Luku $r_1$ on itse asiassa kultaisen leikkauksen suhde. Tässä jana jaetaan kahteen osaan, pituuksiltaan $a$ ja $b$ ($a > b$). Näiden suhde $q = a/b$ on kultaisen leikkauksen suhde, jos pidemmän osan suhde lyhyempään on sama kuin koko janan suhde pitempään, ts. \[\frac{a}{b} = \frac{a+b}{a}.\] Tämä johtaa yhtälöön $q^2 = q + 1$, jonka positiiviseksi juureksi edellä todettiin $q = r_1 = \frac{1}{2}(1 + \sqrt{5})$. Negatiivinen juuri on $r_2 = \frac{1}{2}(1 - \sqrt{5}) = -1/q$.

Eksplisiittisen lausekkeen avulla nähdään, että Fibonaccin lukujen suhde $f(n+1)/f(n)$ lähestyy kultaisen leikkauksen suhdetta, kun $n$ lähestyy ääretöntä.

Fibonaccin luvut toteuttavat koko joukon erilaisia algebrallisia identiteettejä. Kokeilemalla voi todeta, että esimerkiksi lauseke $f(n)f(m) + f(n+1)f(m+1)$ antaa aina jonkin Fibonaccin luvun. Esimerkiksi arvoilla $n=6$, $m=9$ saadaan $8 \cdot 34 + 13 \cdot 55 = 987$. Saattaa olla hieman vaikeata todistaa rekursiokaavan avulla, että näin todella on (en ainakaan nopeasti löytänyt todistusta), mutta eksplisiittisen lausekkeen avulla se on suora lasku: \begin{align*}&f(n)f(m) + f(n+1)f(m+1)\\ &= \tfrac{1}{5}(r_1^n - r_2^n)(r_1^m - r_2^m) + \tfrac{1}{5}(r_1^{n+1} - r_2^{n+1})(r_1^{m+1} - r_2^{m+1})\\ &= \tfrac{1}{5}(r_1^{n+m} + r_2^{n+m} - r_1^nr_2^m - r_2^nr_1^m + r_1^{n+m+2} + r_2^{n+m+2} - r_1^{n+1}r_2^{m+1} - r_2^{n+1}r_1^{m+1})\\ &= \tfrac{1}{5}(r_1^{n+m}(1+r_1^2) + r_2^{n+m}(1+r_2^2) - (r_1^nr_2^m + r_2^nr_1^m)(1 + r_1r_2)).\end{align*} Koska \[1+r_1^2 = \tfrac{1}{2}(5+\sqrt{5}) = \sqrt{5}r_1, \quad 1+r_2^2 = \tfrac{1}{2}(5-\sqrt{5}) = -\sqrt{5}r_2, \quad 1+r_1r_2 = 0,\] tämä saadaan muotoon \[\frac{1}{\sqrt{5}}\left(r_1^{n+m+1} - r_2^{n+m+1}\right) = f(n+m+1).\] Esimerkissä on siten $987 = f(6+9+1) = f(16)$.

Jos tulos on tiedossa tai kokeilujen perusteella arvattu, niin todistamisessa tarvittava mekaaninen lasku sujuu vaivatta symbolisella laskentaohjelmalla (alla käytetty Mathematicaa ja GeoGebraa):



Fibonaccin luvuista ja niitä koskevista identiteeteistä on laaja artikkeli Wolfram MathWorld -sivustossa.


perjantai 21. lokakuuta 2022

Ei geometrikko viivoitinta tarvitse



Geometrisissa konstruktioissa tai piirustuksissa sallitut työkalut ovat olleet Eukleideen ajoista lähtien viivoitin ja harppi. Viivoittimella voidaan piirtää suora, kun kaksi sen pistettä tunnetaan. Harpilla voidaan piirtää ympyrä, kun sen keskipiste ja yksi kehäpiste tunnetaan. Suorien ja ympyröiden leikkauspisteet voivat olla pohjana uusille piirroksille, so. uudelle viivoittimen tai harpin käytölle. Muunlainen käyttö, kuten janan pituuden siirtäminen uuteen paikkaan harpin kärkien välissä tai merkintöjen tekeminen viivoittimen reunaan ei ole sallittua. Janan siirto harpin kärkien välissä voidaan kuitenkin sallia, koska se voidaan tehdä myös edellä mainituilla perusoperaatioilla, tosin hieman pidemmällä konstruktiolla.

Viivoitinkin on kuitenkin tarpeeton työkalu, kun sovitaan, että suora tunnetaan, kun kaksi sen pistettä tunnetaan, eikä suoraa pyritä varsinaisesti piirtämään. Kaikki geometriassa tarvittavat konstruktiot voidaan nimittäin tehdä yksinomaan harppia käyttäen. Esimerkkinä ympyrän piirtäminen annettu piste $K$ keskipisteenä ja annettu jana $AB$ säteenä siirtämättä sädettä harpin kärkien välissä:

$K$-keskisen ympyrän piirtäminen säteenä jana $AB$
siirtämättä sädettä harpin kärkien välissä;
piirtämisjärjestys: vihreä, sininen, punainen.

Harpin riittävyys perustuu käänteissäteiseen muunnokseen eli ympyräpeilaukseen. Tässä tasoon asetetaan kiinteä ympyrä (keskipisteenä $K$, säteenä $r$) ja mielivaltaisen pisteen $P$ kuvapiste $P'$ sijaitsee säteellä $KP$ siten, että etäisyyksille pätee \[|KP||KP'| = r^2.\] Poikkeuksena on piste $K$, jolla ei kuvapistettä ole. Puute voidaan poistaa liittämällä tasoon yksikäsitteinen äärettömän kaukainen piste (johon voidaan ajatella päädyttävän siirtymällä äärettömän kauaksi mihin tahansa suuntaan) ja asettamalla tämä $K$:n kuvaksi. Kuvapiste $P'$ voidaan määrittää yksinomaan harppia käyttäen:
Kuvapisteen $P'$ määritys käänteissäteisessä muunnoksessa; piirtämisjärjestys
vihreä, sininen, punainen. Konstruktion pätevyyden voi osoittaa katkoviivojen
muodostamien yhdenmuotoisten kolmioiden avulla.

Käänteissäteinen muunnos kuvaa yleensä ympyrän ympyräksi. Poikkeuksena ovat pisteen $K$ kautta kulkevat ympyrät, jotka kuvautuvat suoriksi. Suorat muunnos kuvaa pisteen $K$ kautta kulkeviksi ympyröiksi, poikkeuksena pisteen $K$ kautta kulkevat suorat, jotka kuvautuvat itselleen. Suoraa voidaankin ajatelle ympyränä, jonka säde on ääretön. Muunnoksen kiinteän ympyrän pisteet ovat omia kuviaan.

Käänteissäteisen muunnoksen käänteiskuvaus on se itse, ts. kuvapisteen kuvapiste on alkuperäinen piste. Tähän viitataan sanomalla, että käänteissäteinen muunnos on involutorinen. Piste $P$ ja sen kuvapiste $P'$ ovat siten symmetrisessä asemassa ja niitä kutsutaan peilipisteiksi muunnoksen kiinteän ympyrän suhteen.

GeoGebra-ohjelmisto tarjoaa työkalun ympyräpeilausten tekemiseen: reflect in circle / peilaus ympyrän suhteen. Esimerkkinä muutamien kuvioiden peilikuvat:

Kuvio ja sen peilikuva käänteissäteisessä muunnoksessa,
kukin pari omalla värillään.

Käänteissäteisessä muunnoksessa mikä tahansa suorista ja ympyröistä muodostuva geometrinen kuvio voidaan asettaa siten, että sen suorat ja ympyrät ja näiden osat kuvautuvat (peilautuvat) ympyröiksi tai ympyrän kaariksi. Kuva voidaan määrittää yksinomaan harpilla. Geometrisissa konstruktioissa tarvittavat perusoperaatiot (leikkauspisteiden määritys, ympyrän piirtäminen keskipisteen ja kehäpisteen avulla, kolmen annetun pisteen kautta kulkevan ympyrän piirtäminen) kohdistetaan tällöin vain ympyräkaarten muodostamaan kuvioon. Voidaan osoittaa, että nämä voidaan tehdä yksinomaan harpilla. Lopuksi konstruoinnin tulokset peilataan takaisin.

Alla on esimerkkinä suorien $AB$ ja $CD$ leikkauspisteen määritys, kun kumpikin suora on annettu kahden pisteen avulla. Pisteet peilataan ensin kiinteässä $K$-keskisessä ympyrässä, jolloin saadaan pisteet $A'$, $B'$, $C'$ ja $D'$. Edellä olevan esimerkin mukaisesti tämä voidaan tehdä yksinomaan harpilla. Suorien kuvat peilauksessa ovat keskipisteen $K$ kulkevia ympyröitä, joista kumpikin siis määräytyy kolmen pisteen avulla: $K$, $A'$, $B'$ ja $K$, $C'$, $D'$. Näiden konstruoiminen onnistuu yksinomaan harpilla (vaikkakaan ei aivan lyhyesti). Peilaamalla ympyröiden leikkauspiste $X'$ saadaan etsitty suorien leikkauspiste $X$.

Harppikonstruktio: suorien $AB$ ja $CD$ leikkauspiste;
peilausympyrä musta, piirtämisjärjestys: vihreä, sininen, punainen.
Suorat katkoviivalla.

Menettelyn todistus (ja monia harppikonstruktioita) on esitetty itävaltalaisen August Adlerin kirjassa Theorie der geometrischen Konstruktionen vuodelta 1906 (löytyy verkosta). Harpin riittävyys ei sinänsä ollut uutta, mutta todistusta käänteissäteistä muunnosta käyttäen ei ollut aiemmin esitetty. Tarvittavat harppikonstruktiot oli esittänyt italialainen Lorenzo Mascheroni vuonna 1797 teoksessaan Geometria del compasso ja tätäkin aikaisemmin tanskalainen Georg Mohr tanskaksi ja hollanniksi ilmestyneessä teoksessaan Euclides danicus vuonna 1672 (kuva artikkelin alussa). Mohrin teos jäi kuitenkin huomiotta ehkä kielen takia, latinahan tuohon aikaan olisi ollut luontevampi valinta. Suomeksi harppikonstruktioita on käsitelty Erkki Rosenbergin kirjassa Geometria (Limes 1983).


Euclides danicuksen tiivis esitys: ympyrä kolmen pisteen kautta.

Lopuksi lukijalle pohdittavaa: Jos $A$ ja $B$ ovat peilipisteitä ympyrän $c$ suhteen ja sekä ympyrä että pisteet kuvataan toiseen ympyrään liittyvällä käänteissäteisellä muunnoksella, niin ovatko kuvapisteet peilipisteitä kuvaympyrän suhteen? Työkaluksi sopii GeoGebra.

-----

Jonkin matematiikan alan hyödyllisyyttä tai hyödyttömyyttä arvioidessa täytyy olla hyvin varovainen. Hyvä esimerkki on lukuteoria, jota on pidetty sovellusten kannalta tarpeettomana puhtaana matematiikkana, mutta johon tietoliikenteen salausalgoritmit nykyään perustuvat. Geometriset harppikonstruktiot voisivat sen sijaan olla hyvä kandidaatti hyödyttömäksi, mutta ehkä kuitenkin jollakin tavoin viehättäväksi matematiikaksi. Kommenteissa voi esittää vastaväitteitä tai muita näkökohtia.


tiistai 27. syyskuuta 2022

Geometrian probleema ja sen moderni versio


Vanha geometrian tehtävä saattaa antaa aihetta monenlaisiin pohdiskeluihin, kun avuksi otetaan laskentaohjelmat.

Annettuna on yllä olevan kuvion mukainen tilanne, jossa $\alpha = 60^\circ$ ja $\beta = 45^\circ$. Kysytään kulman $\gamma$ suuruutta. Tämä on tyypillinen tehtävä omalta kouluajaltani. Vaikeutena on liikkeelle lähtö, sopivan idean — ja apupiirroksen — löytäminen. Jos idea löytyy, tehtävä on melko helppo, ellei, ei synny juuri mitään.

Piirretään pisteestä $A$ normaali janalle $BD$ ja yhdistetään sen kantapiste pisteeseen $C$. Tällöin syntyy ns. muistikolmioita ja tasakylkisiä kolmiota. Kulmia päästään laskemaan vaiheittain eikä tarvita muuta tietoa kuin kolmion kulmien summa. Tuloksena on $\gamma = 75^\circ$. Kuva alla.

Mutta miksi tyytyä vain kulmien arvoihin $\alpha = 60^\circ$, $\beta = 45^\circ$? Voihan $\alpha$ olla mitä tahansa väliltä $]0^\circ,180^\circ[$ ja $\beta$ jotakin $\alpha$:aa pienempää.

Sijoitetaan tilanne koordinaatistoon, piste $A$ origoon ja pisteet $B$ ja $C$ x-akselille. Otetaan tuntemattomiksi kulman $\gamma$ ohella pisteen $D$ koordinaatit $(x,y)$. Jos $\vec{i}$ on tavanomainen yksikkövektori, skalaaritulon avulla saadaan ehdot \[ \cos(\alpha) = \frac{-\vec{i}\cdot\vec{BD}}{|\vec{BD}|}, \quad \cos(\beta) = \frac{-\vec{i}\cdot\vec{CD}}{|\vec{CD}|}, \] jotka määrittävät tilanteen. Nämä tuottavat yhtälöt \[ \cos(\alpha) = \frac{2-x}{\sqrt{(2-x)^2 + y^2}}, \quad \cos(\beta) = \frac{3-x}{\sqrt{(3-x)^2 + y^2}}, \] joista voidaan ratkaista $x$ ja $y$. Ratkaiseminen käsin voi olla työlästä, mutta (ainakin hyvä) symbolisen laskennan ohjelma suoriutuu. Kokeilin Mathematicalla ja GeoGebralla. Kumpikin antaa neljä ratkaisua, GeoGebra tavattoman paljon hankalammat lausekkeet. Tuloksiin on syytä suhtautua rauhallisesti. Ei laskentaohjelma tee sitä, mitä käyttäjä haluaisi, vaan mitä se on ohjelmoitu tekemään, ja tulokset voivat olla mutkikkaita eivätkä aina edes oikeita. Ohjelma pyrkii ottamaan huomioon kaikki tapaukset, mutta ei välttämättä onnistu.

Sijoittamalla Mathematicassa tulokset takaisin yhtälöihin nähdään, että vain kaksi ratkaisuista toteuttaa yhtälöt. Kaksi muuta on ilmeisesti syntynyt neliöjuurien käsittelyn myötä. Vastaavasta sijoittamisesta ei ainakaan käyttämäni GeoGebran versio suoriutunut, mutta numeerisen tarkastelun perusteella tässäkin on kaksi oikeaa ja kaksi väärää ratkaisua. Oikeissa ratkaisuissa x-koordinaatit ovat samat, y-koordinaatit vastalukuja, joten toinen tarkoittaa vain kuvion peilaamista x-akselin alapuolelle.

Mathematican tapauksessa tulos on \[ x = \tfrac{1}{2}(5 - \csc(\alpha - \beta)\sin(\alpha + \beta)), \quad y = \csc(\alpha - \beta)\sin(\alpha)\sin(\beta). \] Suomalaiselle nämä saattavat näyttää hieman oudoilta $\csc$-funktion takia. Tämä on kosekantti, yksinkertaisesti sinin käänteisarvo. Vastaavasti $\sec$, sekantti on kosinin käänteisarvo. Monissa maissa ja sen seurauksena laskentaohjelmissa usein käytetään näitä.

Kun pisteen $D$ koordinaattien lausekkeet ovat käytettävissä, voidaan laskea kaikenlaista. Kulma $\gamma$ saadaan kaksiargumenttisella $\arctan(x,y)$-funktiolla, joka antaa pisteen $(x,y)$ napakulman ja joka on useimmissa ohjelmissa käytettävissä.

Sijoittamalla ratkaisuun esimerkiksi $\beta = \alpha - 15^\circ$ voidaan etsiä ne pisteet $D$, jotka vastaavat kulmien $\alpha$ ja $\beta$ 15 asteen erotusta. Pisteitä voi piirtää ohjelmasilmukalla tai parametrikäyränä, jota useimmat ohjelmistot tukevat. Alkeisgeometriansa hallitsevaa henkilöä ei yllätä, että kyseessä on ympyränkaari. Laskentaohjelma saattaa parametriesityksen perusteella kyetä löytämään myös ympyrälle yhtälön: $x^2 + y^2 - 5x - (2 + \sqrt{3})y + 6 = 0$. Kuva alla, pisteen $D$ mahdollinen sijainti punaisella.

Pienillä muutoksilla voidaan tutkia erilaisia tehtävän variaatioita, mikä usein johtaa algoritmiseen ajatteluun ja kirjoittamaan muutaman rivin ohjelmakoodeja. Edellytyksenä on, että laskentaohjelma tukee ainakin pienimuotoista ohjelmointia. Mathematicassa sujuu hyvin, GeoGebrassa on hankalaa. Mikä esimerkiksi olisi kulman $\gamma$ maksimiarvo, kun kulmien $\alpha$ ja $\beta$ erotus on vakio? Miten maksimiarvo riippuu erotuksen suuruudesta? Sopivatko nämä geometriseen havaintoon?



Ylhäällä: Pisteen $D$ sijainti tapauksessa $\beta = \alpha/3$. Alhaalla vasemmalla: Kulma $\gamma$ kulman $\alpha$ funktiona, kun $\beta = \alpha - 15^\circ$. Alhaalla oikealla: Kulma $\gamma$ kulmien $\alpha$ ja $\beta$ funktiona sekä edellä mainittu käyrä, joka sijaitsee pinnalla.

Erilaisen lähestymistavan tehtävään tarjoavat dynaamisen geometrian ohjelmat, joista GeoGebra lienee tunnetuin. Näissä tarkasteltava kuvio konstruoidaan ohjelman tarjoamien geometristen operaatioiden avulla piirtämällä, jolloin ohjelma laskee pisteiden koodinaatit ja suorien yhtälöt, usein myös perustyyppisten käyrien yhtälöt. Jälkikäteen kuviota voidaan muunnella pisteitä siirtämällä. Urakäyriä (locus) saadaan myös piirretyksi. Symbolisiin lausekkeisiin tai ns. tarkkoihin arvoihin (joita ehkä olisi parempi kutsua symbolisiksi arvoiksi, onhan kymmendesimaalinen likiarvokin jo kohtalaisen tarkka) ei yleensä päästä käsiksi ilman symbolista laskentaa.

maanantai 15. elokuuta 2022

Netti, Pythagoras ja CAS

(CAS = Computer Algebra System, symbolinen laskentaohjelma)

Olen aina silloin tällöin pannut selaimen kirjanmerkeiksi matemaattisesti kiinnostavia verkkosivuja. Usein nämä ovat enemmän tai vähemmän irrallisia yhteen asiaan keskittyviä tekstejä tai havainnollistuksia. Toki löytyy myös isompia kokonaisuuksia käsitteleviä dokumentteja ja sähköisessä muodossa olevia oppikirjojakin.

Lyhyet tekstit ja havainnollistukset yleensä edellyttävät jonkinlaisia perustietoja asiasta, mutta saattavat tämän jälkeen avata uusia näköaloja. Ovat hyödyllisiä ja hauskoja vaikkapa opettajalle tai oppikirjantekijälle.

Alexander Bogomolnyn luoma sivusto Interactive Mathematics Miscellany and Puzzles, tuttavallisemmin Cut the Knot, tarjoaa paljon muun ohella katsauksen Pythagoraan lauseeseen: 122 erilaista todistusta (https://www.cut-the-knot.org/pythagoras/). Joukossa tietenkin tavanomaiset oppikirjoissa esiintyvät, mutta myös paljon muuta. Ehkä kiintoisimmasta päästä on epäsuora todistus:

Lähtökohtana on tavanomainen suorakulmaisen kolmion jako kahteen yhdenmuotoiseen suorakulmaiseen kolmioon alla olevan kuvan mukaisesti.


Pythagoraan väittämän vastaoletus on $a^2 + b^2 \neq c^2$, esimerkiksi siis $a^2 + b^2 < c^2$.

Ison kolmion ja vasemmanpuolisen osakolmion yhdenmuotoisuuden perusteella on $a = sx$, $b = sh$ ja $c = sa$, missä $s$ on verrannollisuuskerroin. Vastaoletuksesta seuraa tällöin $s^2 x^2 + s^2 h^2 < s^2 a^2$ ja siis $x^2 + h^2 < a^2$. Oikeanpuoliselle osakolmiolle pätee vastaavasti $h^2 + y^2 < b^2$. Yhdenmuotoisuuden perusteella on myös $y/h = h/x$ eli $h^2 = xy$. Nyt voidaan arvioida seuraavasti: \[ a^2 + b^2 > (x^2 + h^2) + (h^2 + y^2) = x^2 + y^2 + 2h^2 = x^2 + y^2 + 2xy = (x + y)^2 = c^2. \] Siis $a^2 + b^2 > c^2$, mikä on ristiriidassa lähtökohtana olevan vastaoletuksen kanssa.

Jos olisi  $a^2 + b^2 > c^2$, päädyttäisiin samalla tavoin ristiriitaan $a^2 + b^2 < c^2$. Ainoaksi mahdollisuudeksi siis jää $a^2 + b^2 = c^2$.

Uudet näkökulmat herättävät usein pohtimaan asiaa enemmänkin. Edellä oleva epäsuora todistus viittaa minusta mahdollisuuteen todistaa Pythagoraan lause myös algebrallisesti yhdenmuotoisuuksiin perustuen. Kolmioiden yhdenmuotoisuuksista saadaan ehdot \[a = sx, b = sh, c = sa, a = th, b = ty, c = tb,\] missä $s$ ja $t$ ovat verrannollisuuskertoimia. Kun mukaan liitetään hypotenuusan paloitteluehto $x + y = c$, suorakulmainen kolmio on algebrallisesti karakterisoitu. Seuraako tästä sitten ehto $a^2 + b^2 = c^2$? Voidaanko yhtälöryhmästä eliminoida $x$, $y$, $h$, $s$ ja $t$, jolloin ehkä jäisi jäljelle jotakin symboleja $a$, $b$ ja $c$ koskevaa?

Eliminointi onnistuu käsinlaskulla helposti (voisi sopia ylioppilastehtäväksi), mutta usein CAS-ohjelmistoista löytyy myös valmis eliminointityökalu. Kuvassa on Mathematican suoritus:


Ehdoista siis seuraa Pythagoraan väittämä.

Pythagoraan lause pätee myös käänteisesti: Jos kolmion sivuille pätee $a^2 + b^2 = c^2$, niin kolmio on suorakulmainen. Voitaisiinko tämäkin todistaa jotenkin algebrallisesti?


Olkoon oheisen kuvion mukaisesti $D$ jokin piste sivulla $AB$, jonka pituus on $c$. Onko mahdollista valita $D$ siten, että kolmiot $BDC$, $CDA$ ja $BCA$ ovat yhdenmuotoiset, jos ehto $a^2 + b^2 = c^2$ on voimassa? Toisin sanoen: Onko yhtälöryhmällä \[a = sx, b = sh, c = sa, a = th, b = ty, c = tb, x + y = c\] ehdon voimassa ollessa ratkaisua, kun tuntemattomia ovat verrannollisuuskertoimet $s$ ja $t$ sekä $x$, $y$ ja $h$? Käsinlaskukin sujuu, mutta CAS-ohjelmistosta saattaa löytyä valmis työkalu:


Ratkaisu todellakin löytyy. (Kuvassa Mathematica ei anna heti sievintä muotoa, vaan tarvitaan erillinen sievennyskomento, jossa uudelleen ilmoitetaan oletuksena oleva ehto.) Jos piste $D$ valitaan tämän mukaisesti, ovat kolmiot $BDC$, $CDA$ ja $BCA$ yhdenmuotoiset. Vastinkulmina $BDC$, $CDA$ ja $BCA$ ovat yhtä suuret ja niiden on silloin oltava suoria kulmia. Kolmio $ABC$ on siis suorakulmainen.

Lukija saattaa kysyä, eikö edellä mainitulla yhtälöryhmällä sitten ole ratkaisua, jos Pythagoraan ehto ei ole voimassa. Geometrinen intuitio ehkä sanoisi, että ei ole. Näin onkin (nollaratkaisua lukuunottamatta) ja myös polynomialgebralla asia voidaan osoittaa. CAS-ohjelmista saattaa löytyä sopiva työkalukin, Mathematicalla komento Reduce.

tiistai 31. toukokuuta 2022

Vääriä todistuksia

Päättelyvirheiden etsiminen matemaattisista todistuksista on usein hyödyllistä matematiikan opiskelijalle. Esitän kolme todistusta ilmiselvästi virheellisille väitteille. Lukijan tehtäväksi jääköön etsiä virhe. Monille tässä ei varmaankaan ole mitään ongelmaa, mutta toivon, että jutun juonta ei paljasteta kommenteissa ainakaan ihan heti.

Lause 1. Kaikki ympyrät ovat samasäteisiä.




Todistus. Oheisessa kuviossa on kaksi ympyrää, joiden keskipisteet ovat $A$ ja $B$. Jana $CD$ on ympyröiden yhteinen tangentti. Janoille $AB$ ja $CD$ asetetaan keskinormaalit. Nämä leikkaavat toisensa pisteessä $E$. Keskinormaaliominaisuuden takia janat $AE$ ja $BE$ ovat yhtä pitkät; sama koskee janoja $CE$ ja $DE$. Keskinormaaliominaisuudesta seuraa edelleen, että kulmat $ECD$ ja $EDC$ ovat yhtä suuret, jolloin myös kulmat $ACE$ ja $BDE$ ovat näiden komplementtikulmina yhtä suuret. Tällöin kolmiot $AEC$ ja $BED$ ovat yhtenevät. Vastinsivuina ympyröiden säteet $AC$ ja $BD$ ovat yhtä pitkät. QED

Lause 2. Kaikki positiiviset kokonaisluvut ovat yhtä suuria.

Todistus. Lause on suora seuraus apulauseesta: Jos $a$ ja $b$ ovat positiivisia kokonaislukuja, joille pätee $a \leq n$ ja $b \leq n$, niin $a = b$. Tämä voidaan todistaa induktiolla $n$:n suhteen.

Jos $n = 1$, ainoa mahdollisuus on, että $a = b = 1$, ja luvut siis ovat yhtä suuret. Induktion alku on siis kunnossa.

Induktioaskeleessa oletetaan, että lause pätee arvolla $n$, ja osoitetaan, että tällöin se pätee myös arvolla $n+1$. Olkoon siis $a \leq n+1$ ja $b \leq n+1$. Tällöin on $a-1 \leq n$ ja $b-1 \leq n$, jolloin induktio-oletuksen mukaan $a-1 = b-1$. Tästä seuraa $a = b$ ja induktioaskel on osoitettu. QED

Lause 3. Funktiolla $\sin(x)/x$ ei ole raja-arvoa, kun $x \to \infty$.

Todistus. Lausekkeessa \[\frac{x - \sin(x)}{x}\] osoittaja $x - \sin(x)$ lähestyy ääretöntä, kun $x \to \infty$. Sama koskee nimittäjää $x$. Tällöin lauseke saa rajaprosessissa $x \to \infty$ muodon $\infty/\infty$ ja voidaan soveltaa l'Hospitalin lausetta. Derivoimalla osoittaja ja nimittäjä saadaan \[\frac{1 - \cos(x)}{1} = 1 - \cos(x),\] joka heilahtelee välillä $[0,2]$ eikä sillä siis ole raja-arvoa. Tällöin ei myöskään lausekkeella \[\frac{x - \sin(x)}{x} = 1 - \frac{\sin(x)}{x}\] ole raja-arvoa, mistä seuraa väitös. QED

Funktion $\sin(x)/x$ kuvaaja



lauantai 7. toukokuuta 2022

Projektiivinen taso, homogeeniset koordinaatit ja äärettömän kaukaiset pisteet

Rautatien äärettömän kaukainen piste (kuva Tom Barrett, Unsplash)

Geometrioita on monenlaisia. Perinteinen koulugeometria, antiikin Kreikasta lähtenyt euklidinen geometria ei ole lainkaan ainoa mahdollisuus. Epäeuklidista geometriaa olen aiemmin käsitellyt, tällä kertaa esillä on jotakin projektiivisesta geometriasta jatkona edellisen blogikirjoituksen Pascalin ja Brianchonin lauseisiin. Näissä saattoi esiintyä yhdensuuntaisia suoria, joille kuitenkin tarvittiin leikkauspiste. Kutsuin tällaisia pisteitä äärettömän kaukaisiksi pisteiksi ja niiden turvin lauseet saatiin toimimaan rajoituksitta. Mutta saisiko tällaiseen geometriaan — projektiiviseen geometriaan — jotenkin konkreettisuutta?

Lähtökohtana olkoon tavallinen euklidinen taso, jossa pisteen paikka voidaan ilmaista kahdella koordinaatilla: $P = (x,y)$. Luodaan pisteelle uudet koordinaatit, ns. homogeeniset koordinaatit lisäämällä alkuun nollas koordinaatti. Tällöin piste esitetään muodossa $P\,\widehat{=}\, (1,x,y)$ ja sovitaan, että jos koordinaatit kerrotaan nollasta eroavalla luvulla, kyseessä on edelleen sama piste: $P\,\widehat{=}\,(p,px,py)$, $p \neq 0$. Jos kääntäen pisteen homogeeniset koordinaatit ovat $(x_0,x_1,x_2)$, nämä voidaan kertoa luvulla $1/x_0$ ja saada muotoon $(1,x_1/x_0,x_2/x_0)$, mistä näkyy, että tavalliset koordinaatit ovat $(x_1/x_0,x_2/x_0)$. Edellytyksenä luonnollisesti on, että $x_0 \neq 0$.

Vaatimus, että homogeenisten koordinaattien nollas koordinaatti ei saa olla $0$, on jonkinlainen kauneusvirhe, joka rikkoo symmetrian. Siitä luopuminen tuo mahdollisuuden liittää tasoon uusia pisteitä: Sovitaan, että luvut $(x_0,x_1,x_2)$ esittävät aina pistettä, kunhan kaikki eivät ole samanaikaisesti $= 0$,. Nollasta eroavalla vakiolla kerrottuna ne esittävät edelleen samaa pistettä: $(x_0,x_1,x_2)\,\widehat{=}\,(px_0,px_1,px_2)$. Jos $x_0 \neq 0$, kyseessä on tavallinen piste, jos $x_0 = 0$, kyseessä on tasoon liitetty uusi piste, jota kutsutaan ideaalipisteeksi tai äärettömän kaukaiseksi pisteeksi. Syntyvää geometriaa kutsutaan projektiiviseksi geometriaksi. Kaikki sen pisteet ovat periaatteessa samassa asemassa. (Lineaarialgebrallisesti ajatteleva henkilö voisi kutsua niitä kolmiulotteisen avaruuden $\mathbb{R}^3$ yksiulotteisiksi aliavaruuksiksi.) Jako tavallisiin ja ideaalipisteisiin koskee vain geometrian tulkintaa jossakin yhteydessä.

Nimityksen 'äärettömän kaukainen piste' motivoimiseksi on syytä tarkastella tason suoria. Tunnetusti suoran yhtälö on muotoa $a_1x + a_2y + a_0 = 0$ ja piste $P = (x,y)$ on suoralla, jos yhtälö toteutuu. Jos piste ilmaistaan homogeenisilla koordinaateilla muodossa $(x_0,x_1,x_2)$, ehto saa muodon $a_1x_1/x_0 + a_2x_2/x_0 + a_0 = 0$ tai yhtä hyvin $a_0x_0 + a_1x_1 + a_2x_2 = 0$, koska yhtälön voi kertoa nollasta eroavalla vakiolla.

Suora määräytyy, kun tunnetaan sen yhtälön kertoimet $a_0$, $a_1$ ja $a_2$. Itse asiassa kertoimet $qa_0$, $qa_1$ ja $qa_2$ määräävät saman suoran, kun $q \neq 0$. Näitä voidaan kutsua suoran homogeenisiksi koordinaateiksi. Pisteiden ja suorien välillä vallitsee symmetrinen tilanne: kummatkin määräytyvät kolmen luvun perusteella ja nämä luvut voidaan aina kertoa nollasta eroavalla vakiolla. Piste $P\,\widehat{=}\,(x_0,x_1,x_2)$ on suoralla $s\,\widehat{=}\,(a_0,a_1,a_2)$, jos ja vain jos $a_0x_0 + a_1x_1 + a_2x_2 = 0$. Tätä kutsutaan insidenssirelaatioksi.

Jos kaksi suoraa ovat tavanomaisessa mielessä yhdensuuntaisia, niiden yhtälöt eroavat vain vakiotermien osalta. Niiden homogeeniset koordinaatit ovat tällöin muotoa $(c_1,a,b)$ ja $(c_2,a,b)$, missä $c_1 \neq c_2$. Jos suorilla on leikkauspiste, ts. yhteinen piste, jonka homogeeniset koordinaatit ovat $(x_0,x_1,x_2)$, tulee insidenssirelaatioiden \begin{align*} &c_1x_0 + ax_1 + bx_2 = 0, \\ &c_2x_0 + ax_1 + bx_2 = 0 \end{align*} toteutua. Vähentämällä yhtälöt saadaan $(c_1 - c_2)x_0 = 0$, mistä seuraa $x_0 = 0$. Yhteinen piste on siis ideaalipiste ja sen kutsuminen äärettömän kaukaiseksi pisteeksi on perusteltua, koska kahden suoran kääntyessä yhdensuuntaisiksi niiden leikkauspiste pakenee äärettömän kauas.

Koska äärettömän kaukaiset pisteet ovat muotoa $(0,x_1,x_2)$ ne sijaitsevat suoralla $(1,0,0)$: $1 \cdot 0 + 0 \cdot x_1 + 0 \cdot x_2 = 0$. Tämä on ainoa projektiiviseen tasoon laajennuksessa tullut uusi suora. Sitä kutsutaan ideaalisuoraksi tai äärettömän kaukaiseksi suoraksi.

Voidaanko äärettömän kaukaisia pisteitä sitten jotenkin 'nähdä' vai ovatko ne vain teoreettisia apukäsitteitä? Projektiivisen tason kuviot voidaan ns. projektiivisella kuvauksella muuntaa uudenlaisiksi kuvioiksi. Tällöin pisteet ja suorat ja niiden väliset insidenssirelaatiot säilyvät, mutta esimerkiksi etäisyydet tai kulmien suuruudet eivät säily. Esimerkkinä on oheinen F-kirjaimen kuvautuminen. Perspektiivikuvan muodostaminen on myös esimerkki projektiivisesta kuvauksesta. Alla olevassa kuvassa on xy-tason suorakulmaisen ruudukon perspektiivikuva. Tässä ruudukkoa rajaa yläpuolelta vaakasuora viiva, jonka pisteisiin tason yhdensuuntaiset suorat suuntautuvat. Tämä viiva (perspektiivikuvan horisontti) on ideaalisuoran kuva.

Kirjaimen F projektiivinen kuva. Harmaat viivat ovat konstruktion apuviivoja.

Suorakulmaisen ruudukon perspektiivikuva

Artikkelin alussa olevan suoran rautatien perspektiivikuvassa näkyy myös yhdensuuntaisten kiskojen äärettömän kaukaisen pisteen kuva, jossa kiskot näyttävät yhtyvän (perspektiivikuvan pakopiste).


maanantai 4. huhtikuuta 2022

Pascal ja Brianchon

Blaise Pascal (1623-1662) oli matemaatikko ja uskonnollinen ajattelija, jonka nimen matemaattisten aineiden opiskelija kohtaa moneen kertaan: binomikertoimien muodostama Pascalin kolmio (joka esiintyy monissa yhteyksissä), projektiivisen geometrian Pascalin lause, paineen yksikkö pascal, ohjelmointikieli Pascal. Kaksi viimeksi mainittua ovat varsin modernia nimen käyttöä, mutta sillä on taustansa Pascalin töissä: hän pohti painetta ja tyhjiötä, rakensi mekaanisen laskukoneen.



Pascalin lause

Pascalin lauseessa sijoitetaan kartioleikkaukselle — ellipsille, paraabelille tai hyperbelille — jollakin tavoin kuusi (eri) pistettä. Nämä olkoot $A_1$, $B_1$, $C_1$, $A_2$, $B_2$ ja $C_2$. Järjestyksellä tai sijainnilla ei ole merkitystä. Pisteiden kautta asetetaan suorat ja muodostetaan näiden leikkauspisteet: suorien $A_1B_2$ ja $A_2B_1$ leikkauspiste on $R$, suorien $B_1C_2$ ja $B_2C_1$ leikkauspiste $S$, suorien $C_1A_2$ ja $C_2A_1$ leikkauspiste $T$. Tällöin pisteet $R$, $S$ ja $T$ ovat samalla suoralla.

Tavallisista euklidisen geometrian lauseista tämä poikkeaa sikäli, että pisteiden etäisyydellä ei lauseessa ole mitään roolia. Kyse on ainoastaan suorien asettamisesta ja leikkauspisteiden määrittämisestä. Todistuskin perustuu — tietenkin — tämäntyyppiseen käsitteistöön. En paneudu siihen.


Pappoksen lause

Kaksi toisensa leikkaavaa tai kaksi yhdensuuntaista suoraa ovat erikoistapaus kartioleikkauksesta ja lause pätee myös tällöin. Tulosta kutsutaan Pappoksen lauseeksi 300-luvun alussa eläneen Pappos Aleksandrialaisen mukaan. Tulos on siten merkittävästi vanhempi kuin Pascalin lause.

Pascalin lause, toinen versio

Koska Pascalin lauseen pisteiden sijainti kartioleikkauksella voi olla mikä tahansa, ne voidaan siirtää siten, että $R$, $S$ ja $T$ ovat kuperan kuusikulmion vastakkaisten sivuparien leikkauspisteitä. Lause saa tällöin uuden muodon: Kartioleikkauksen sisään piirretyn kuperan kuusikulmion vastakkaisten sivuparien leikkauspisteet ovat samalla suoralla.

Lukija ehkä huomaa puutteen Pascalin lauseen muotoilussa. Jos kerran pisteet voivat sijaita kartioleikkauksella miten tahansa, jotkut suorapareista saattavat olla yhdensuuntaisia, jolloin leikkauspistettä ei ole. Pitäisikö nämä tapaukset rajata pois?

Tilanteesta selvitään toisinkin. Liitetään euklidiseen (tavalliseen) tasoon uusia pisteitä. Sovitaan, että kahdella yhdensuuntaisella suoralla onkin yhteinen äärettömän kaukana sijaitseva piste. Tähän pisteeseen päästään kulkemalla suorien suunnassa — jompaankumpaan suuntaan — äärettömän kauaksi. Yhdensuuntaisen suoraparven suorilla on yhteinen äärettömän kaukainen piste, mutta kahdella erisuuntaisella suoraparvella on kummallakin oma äärettömän kaukainen pisteensä. Tasoon liitetään myös yksi uusi suora, äärettömän kaukainen suora, joka muodostuu kaikista äärettömän kaukaisista pisteistä.

Tällä tavoin laajennettua tasoa kutsutaan projektiiviseksi tasoksi. Täsmällisestä matematiikasta viehättynyt lukija varmaan sanoo, ettei edellä oleva kelpaa matemaattiseksi määritelmäksi, ja siinä hän on aivan oikeassa. Projektiivinen taso voidaan toki määritellä täsmällisestikin, mutta edellä oleva antaa ideasta oikean ja riittävän mielikuvan, ainakin aluksi.

Projektiivisessa tasossa kaksi suoraa määrää aina pisteen, niiden leikkauspisteen, joka on joko tavallinen piste tai äärettömän kaukainen piste. Kaksi pistettä määrää aina suoran. Jos pisteistä toinen on äärettömän kaukainen piste, kyseessä on jokin tähän pisteeseen liittyvän yhdensuuntaisen suoraparven suora. Jos molemmat ovat äärettömän kaukaisia pisteitä, kyseessä on äärettömän kaukainen suora.

Projektiivisessa tasossa pisteet ja suorat ovat siten symmetrisessä asemassa. Tätä kutsutaan dualiteetiksi. Pisteitä ja suoria koskeva projektiivisen geometrian lause voidaan dualisoida: siinä voidaan vaihtaa pisteiden ja suorien roolit. Uuden lauseen todistus saadaan dualisoimalla alkuperäisen lauseen todistus: vaihdetaan siinä pisteiden ja suorien roolit.

Pascalin lause on projektiivisen geometrian lause, ts. siinä on kyse vain pisteistä ja suorista, kahden pisteen määräämistä suorista ja kahden suoran määräämistä pisteistä (leikkauspisteistä). Näin ollen se voidaan dualisoida, jolloin lähtökohtana on kuuden suoran asettaminen kartioleikkaukselle. Tämä vaatii tarkennuksen: kartioleikkauksella oleva suora tarkoittaa, että suora on kartioleikkauksen tangentti.

Dualisoitua lausetta kutsutaan Brianchonin lauseeksi ranskalaisen matemaatikon ja tykistökoulun professorin Charles-Julien Brianchonin (1783-1864) mukaan. Dualisoimalla yllä oleva Pascalin lauseen formulointi se saa seuraavan muodon:

Kartioleikkaukselle sijoitetaan jollakin tavoin kuusi (eri) tangenttia. Nämä olkoot suorat $a_1$, $b_1$, $c_1$, $a_2$, $b_2$ ja $c_2$. Järjestyksellä tai sijainnilla ei ole merkitystä. Määritetään leikkauspisteet ja asetetaan suorat: leikkauspisteiden $a_1 \cap b_2$ ja $a_2 \cap b_1$ määräämä suora on $r$, leikkauspisteiden $b_1 \cap c_2$ ja $b_2 \cap c_1$ määräämä suora $s$, leikkauspisteiden $c_1 \cap a_2$ ja $c_2 \cap a_1$ määräämä suora $t$. Tällöin suorat $r$, $s$ ja $t$ leikkaavat samassa pisteessä.  (Tässä siis joukko-opillinen leikkauksen merkki viittaa suorien leikkauspisteeseen.)

Brianchonin lause