perjantai 23. joulukuuta 2022

Tekoäly, joulu ja matematiikka


Yllä oleva ei ole minun tekstiäni vaan tekoälybotin ChatGPT vastaus pyyntööni Kirjoita lämminhenkinen joulutervehdys matematiikkablogin lukijoille. Marraskuussa koemielessä julkaistu ChatGPT (https://chat.openai.com/) on saanut mediassa aika paljon huomiota viime aikoina. Rekisteröitymällä pääsee kokeilemaan.

ChatGPT tuottaa tekstiä perustuen siihen materiaaliin, jolla se on opetettu. Mitä opettaminen tarkkaan ottaen tarkoittaa, ei ole aivan yksinkertaista. Sille voi esittää kysymyksen, pyynnön tai kommentin jollakin kielellä ja se pyrkii vastaamaan samalla kielellä. Olen kokeillut suomea, englantia, saksaa, ranskaa, venäjää ja latinaa, ja kaikissa tapauksissa vastaus on tullut kohtalaisen hyvällä kielellä. Pieniä virheitä voi olla, mutta yleisesti ottaen kieli on hyvää. Pitäisin aika hämmästyttävänä suorituksena.

Sisällön suhteen tulos on heikompi. Teksti on jollakin tavoin latteaa ja saattaa sisältää vakaviakin asiavirheitä. Syötin kokeeksi kysymyksen Oliko Venäjän vallan aika onnellista Suomessa? ja tuloksena oli mitäänsanomatonta pyörittelyä ja selkeitä virhearveluita. Voisiko toisin ollakaan, ellei järjestelmää ole opetettu syöttämällä sille riittävästi aihetta käsittelevää kirjallisuutta? Suoriutuisiko se tällöin yhtä hyvin kuin keskimääräinen ihminen tai ehkä jopa paremmin?

Entä sitten matematiikka?

Kerrottakoon taustaksi lineaarialgebran tenttitehtäväni vuosikymmenien takaa: Mitä tarkoitetaan matriisin häiriöalttiudella (engl. condition number)? Eräs tentissä ollut henkilö kirjoitti aiheesta puolen sivun esseen pyörittelemällä häiriöiden vaikutusta ja alttiutta niihin sekä liittämällä tämän jotenkin matriiseihin. Itse käsitteestä hän ei tiennyt mitään. Nolla pistettä.

Tein saman kysymyksen ChatGPT:lle. Ensin englanniksi, sitten suomeksi käyttäen nimitystä häiriöalttius ja lopulta myös usein käytetyn virheellisen käännöksen ehtoluku avulla. Kaikissa tapauksissa moitteeton suoritus, joko englanniksi tai suomeksi. Olisin antanut täydet pisteet.

Onko tämä sitten hämmästyttävää? Ei. Vastauksen jälkeen esitettyyn kysymykseen How do you know this? ChatGPT vastasi:

The definition of the condition number of a matrix and its properties are well-documented in standard texts on numerical linear algebra and in research papers in the field. I have learned about the concept of the condition number of a matrix through my training as a language model, which included learning about various mathematical concepts and principles from a wide range of sources such as textbooks, research papers, and online resources.

Ja suomenkielisessä tapauksessa jatkokysymykseen Mistä tiedät, että englannin condition number on suomeksi häiriöalttius (tai häiriöluku)?:

Käännökset ovat yleensä tehty käyttäen kielten välistä sanakirjaa tai käännöstietokantaa, jotka sisältävät yleisesti käytettyjä käännöksiä eri kielten välillä. Tämän lisäksi käännöksiin voidaan käyttää apuna myös kielten asiantuntijoita, jotka ovat perehtyneet käännösten tekemiseen ja tietävät, miten eri käsitteitä voidaan kääntää eri kielillä. Näin ollen olen pystynyt selvittämään, että englannin condition number on suomeksi häiriöalttius tai häiriöluku, käyttämällä kielten välistä sanakirjaa tai käännöstietokantaa sekä tietämällä, miten eri käsitteitä voidaan kääntää eri kielillä.

Kaikki matematiikka ei kuitenkaan mene yhtä hyvin. Kysyin, miten ratkaistaan yhtälö $x^2 = x + 1$. ChatGPT muunsi sen ensin muotoon $x(x - 1) = 1$ ja sitten muotoon $x = \dfrac{1}{x - 1}$. Tästä ja alkuperäisestä yhtälöstä se päätteli juuriksi $x = 1$ ja $x = -2$, koska $1^2 = 1 + 1$ ja $-2^2 = -2 + 1$. Ei kovin vakuuttavaa. Opetus ei ilmeisesti ole sisältänyt pitkän matematiikan lukiokurssia.

Mitä tekoälystä sitten pitäisi ajatella? ChatGPT on kokeellinen järjestelmä, jolla varmasti on pitkä kehitys edessään. Mutta mihin oikeastaan olemme menossa? Jonakin päivänä koevastauksensa tai gradunsa ehkä voi tilata tekoälyltä. Pitäisikö tekoälyn käyttö kieltää? Ja onnistuisiko se? Vai pitäisikö miettiä, mitä oikeastaan pitää tietää ja miten elää maailmassa, jossa tekoäly tuottaa paljon hyvää ja paljon pahaa?

Tässä on jonkinlaisesta jatkumosta kysymys. Matematiikkaa harjoitettiin ennen kynällä ja paperilla (tai sitä ennen ehkä tikulla ja hiekalla), sitten tulivat erilaiset laskukoneet, ohjelmoitavat laitteet (laskin, tietokone, kännykkä), verkkoresurssit (kuten Google ja Wolfram Alpha). Mikä on seuraava askel?

Omasta puolestani toivotan hyvää joulua ja rauhallista uutta vuotta 2023.



perjantai 18. marraskuuta 2022

Fibonacci


Leonardo Pisalainen (noin 1170-1250) tunnetaan paremmin nimellä Fibonacci. Nimi on lyhentymä ilmaisusta filius Bonacci, Bonaccin poika, jossa Bonacci viittaa sukuun eikä isään. Hänet tiedetään lähinnä nimeään kantavasta lukujonosta, mutta Fibonacci oli paljon monipuolisempi matemaatikko. Vuonna 1202 ilmestyneessä teoksessaan Liber abaci ('laskemisen kirja') hän esittelee intialais-arabialaisen lukujärjestelmän, ts. meidän käyttämämme kymmenkantaisen paikkajärjestelmän (ykköset oikealla, kymmenet seuraavaksi vasemmalla, sitten sadat jne.), jonka käyttö alkoi tuohon aikaan vähitellen levitä Eurooppaan. Kesti kuitenkin nelisensataa vuotta, ennen kuin järjestelmä kaikkine desimaalilukumerkintöineen vakiintui. Tämän ohella Liber abaci käsittelee kaupankäynnin matematiikkaa, erilaisia matemaattisia probleemoja sekä geometriaan ja lukuteoriaan luettavia konstruktioita. Muutama muukin Fibonaccin teos on säilynyt.

Liber abacin probleemojen joukossa on myös kanien lisääntymistä koskeva tehtävä: Kanipari pannaan suljettuun aitaukseen. Ne synnyttävät joka kuukausi uuden parin. Nämä ovat kuukauden kuluttua sukukypsiä ja synnyttävät uuden parin jne. Kuinka monta paria aitauksessa on vuoden kuluttua? Fibonacci osoittaa, että kuukausittaiset määrät ovat $1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233$ ja vuoden kuluttua $377$. Yllä olevassa kuvassa Fibonaccin alkuperäinen teksti; määrät laskettu oikeassa reunassa.

Syntyvää lukujonoa on alettu kutsua Fibonaccin luvuiksi. Ne määritellään usein rekursiivisesti: \[f(0)=0,\ f(1)=1,\ f(n)=f(n-1)+f(n-2),\ n \ge 2.\] Seuraava luku on siis aina kahden edellisen luvun summa: \[0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597,2584,4181,6765,\dots\] Kaniparien lukumäärät alkavat luvusta $f(2)$. Kanien lisääntymisen ohella Fibonaccin luvuilla on osoittautunut olevan yhteys moneen asiaan. Tunnetuin lienee kultaisen leikkauksen suhde, jota peräkkäisten Fibonaccin lukujen suhde lähestyy. Hieman erikoisempana esimerkkinä olkoon istumajärjestysongelma: Tuolirivissä on $n$ tuolia ja siihen sijoitetaan kahdenlaisia ihmisiä, rauhallisia ja herkästi riitaantuvia, joita ei voida sijoittaa rinnakkain. Kuinka monella tavalla tuolirivi voidaan täyttää? Vastauksena on Fibonaccin luku. (Esimerkki on peräisin Ron Knottin dokumentista.) 

Hakukone löytää lisää verkkodokumentteja Fibonaccin luvuista. Lähtökohtana voi myös käyttää kanadalaisen Fibonacci Associationin sivua tai edellä mainitun Ron Knottin sivua.

Rekursiivisen määrittelyn sijaan Fibonaccin lukuja voidaan tarkastella myös eksplisiittisesti: $f(n)$ lausekkeena, joka riippuu indeksistä $n$. Rekursiokaavaa $f(n)=f(n-1)+f(n-2)$ ajatellaan tällöin ns. differenssiyhtälönä, jolle etsitään ratkaisu. Menettely on samankaltainen kuin lineaarisen vakiokertoimisen differentiaaliyhtälön ratkaiseminen: muodostetaan sopiva yrite, jossa on tuntematon symboli, ja pyritään määrittämään tämä. Osoittautuu, että yritteeksi kannattaa valita $f(n) = r^n$ ja pyrkiä määrittämään $r$. Kun yrite sijoitetaan differenssiyhtälöön, saadaan \[r^n = r^{n-1} + r^{n-2}.\] Kun tämä jaetaan potenssilla $r^{n-2}$, saadaan luvulle $r$ toisen asteen yhtälö \[r^2 = r + 1.\] Tällä on kaksi juurta: $r_1 = \frac{1}{2}(1 + \sqrt{5})$ ja $r_2 = \frac{1}{2}(1 - \sqrt{5})$. Differenssiyhtälöllä on siis ratkaisuna potenssit $r_1^n$ ja $r_2^n$. Mutta sijoittamalla differenssiyhtälöön todetaan, että sillä on ratkaisuna myös jokainen lauseke $f(n) = c_1 r_1^n + c_2 r_2^n$, missä $c_1$ ja $c_2$ ovat mitä tahansa vakioita (so. riippumattomia luvusta $n$). (Tähän viitataan sanomalla, että differenssiyhtälö on lineaarinen.)

Fibonaccin luvuilla on lisäksi ominaisuudet $f(0) = 0$, $f(1) = 1$. Nämä ovat differenssiyhtälön kannalta ns. alkuehtoja, ja niistä seuraa yhtälöt $c_1 + c_2 = 0$, $c_1r_1 + c_2r_2 = 1$. Tällöin $c_1 = -c_2 = \frac{1}{\sqrt{5}}$ ja Fibonaccin luvun lausekkeeksi saadaan \[f(n) = \frac{1}{\sqrt{5}}\biggl(\Bigl(\frac{1 + \sqrt{5}}{2}\Bigr)^n - \Bigl(\frac{1 - \sqrt{5}}{2}\Bigr)^n\biggr).\]

Luku $r_1$ on itse asiassa kultaisen leikkauksen suhde. Tässä jana jaetaan kahteen osaan, pituuksiltaan $a$ ja $b$ ($a > b$). Näiden suhde $q = a/b$ on kultaisen leikkauksen suhde, jos pidemmän osan suhde lyhyempään on sama kuin koko janan suhde pitempään, ts. \[\frac{a}{b} = \frac{a+b}{a}.\] Tämä johtaa yhtälöön $q^2 = q + 1$, jonka positiiviseksi juureksi edellä todettiin $q = r_1 = \frac{1}{2}(1 + \sqrt{5})$. Negatiivinen juuri on $r_2 = \frac{1}{2}(1 - \sqrt{5}) = -1/q$.

Eksplisiittisen lausekkeen avulla nähdään, että Fibonaccin lukujen suhde $f(n+1)/f(n)$ lähestyy kultaisen leikkauksen suhdetta, kun $n$ lähestyy ääretöntä.

Fibonaccin luvut toteuttavat koko joukon erilaisia algebrallisia identiteettejä. Kokeilemalla voi todeta, että esimerkiksi lauseke $f(n)f(m) + f(n+1)f(m+1)$ antaa aina jonkin Fibonaccin luvun. Esimerkiksi arvoilla $n=6$, $m=9$ saadaan $8 \cdot 34 + 13 \cdot 55 = 987$. Saattaa olla hieman vaikeata todistaa rekursiokaavan avulla, että näin todella on (en ainakaan nopeasti löytänyt todistusta), mutta eksplisiittisen lausekkeen avulla se on suora lasku: \begin{align*}&f(n)f(m) + f(n+1)f(m+1)\\ &= \tfrac{1}{5}(r_1^n - r_2^n)(r_1^m - r_2^m) + \tfrac{1}{5}(r_1^{n+1} - r_2^{n+1})(r_1^{m+1} - r_2^{m+1})\\ &= \tfrac{1}{5}(r_1^{n+m} + r_2^{n+m} - r_1^nr_2^m - r_2^nr_1^m + r_1^{n+m+2} + r_2^{n+m+2} - r_1^{n+1}r_2^{m+1} - r_2^{n+1}r_1^{m+1})\\ &= \tfrac{1}{5}(r_1^{n+m}(1+r_1^2) + r_2^{n+m}(1+r_2^2) - (r_1^nr_2^m + r_2^nr_1^m)(1 + r_1r_2)).\end{align*} Koska \[1+r_1^2 = \tfrac{1}{2}(5+\sqrt{5}) = \sqrt{5}r_1, \quad 1+r_2^2 = \tfrac{1}{2}(5-\sqrt{5}) = -\sqrt{5}r_2, \quad 1+r_1r_2 = 0,\] tämä saadaan muotoon \[\frac{1}{\sqrt{5}}\left(r_1^{n+m+1} - r_2^{n+m+1}\right) = f(n+m+1).\] Esimerkissä on siten $987 = f(6+9+1) = f(16)$.

Jos tulos on tiedossa tai kokeilujen perusteella arvattu, niin todistamisessa tarvittava mekaaninen lasku sujuu vaivatta symbolisella laskentaohjelmalla (alla käytetty Mathematicaa ja GeoGebraa):



Fibonaccin luvuista ja niitä koskevista identiteeteistä on laaja artikkeli Wolfram MathWorld -sivustossa.


perjantai 21. lokakuuta 2022

Ei geometrikko viivoitinta tarvitse



Geometrisissa konstruktioissa tai piirustuksissa sallitut työkalut ovat olleet Eukleideen ajoista lähtien viivoitin ja harppi. Viivoittimella voidaan piirtää suora, kun kaksi sen pistettä tunnetaan. Harpilla voidaan piirtää ympyrä, kun sen keskipiste ja yksi kehäpiste tunnetaan. Suorien ja ympyröiden leikkauspisteet voivat olla pohjana uusille piirroksille, so. uudelle viivoittimen tai harpin käytölle. Muunlainen käyttö, kuten janan pituuden siirtäminen uuteen paikkaan harpin kärkien välissä tai merkintöjen tekeminen viivoittimen reunaan ei ole sallittua. Janan siirto harpin kärkien välissä voidaan kuitenkin sallia, koska se voidaan tehdä myös edellä mainituilla perusoperaatioilla, tosin hieman pidemmällä konstruktiolla.

Viivoitinkin on kuitenkin tarpeeton työkalu, kun sovitaan, että suora tunnetaan, kun kaksi sen pistettä tunnetaan, eikä suoraa pyritä varsinaisesti piirtämään. Kaikki geometriassa tarvittavat konstruktiot voidaan nimittäin tehdä yksinomaan harppia käyttäen. Esimerkkinä ympyrän piirtäminen annettu piste $K$ keskipisteenä ja annettu jana $AB$ säteenä siirtämättä sädettä harpin kärkien välissä:

$K$-keskisen ympyrän piirtäminen säteenä jana $AB$
siirtämättä sädettä harpin kärkien välissä;
piirtämisjärjestys: vihreä, sininen, punainen.

Harpin riittävyys perustuu käänteissäteiseen muunnokseen eli ympyräpeilaukseen. Tässä tasoon asetetaan kiinteä ympyrä (keskipisteenä $K$, säteenä $r$) ja mielivaltaisen pisteen $P$ kuvapiste $P'$ sijaitsee säteellä $KP$ siten, että etäisyyksille pätee \[|KP||KP'| = r^2.\] Poikkeuksena on piste $K$, jolla ei kuvapistettä ole. Puute voidaan poistaa liittämällä tasoon yksikäsitteinen äärettömän kaukainen piste (johon voidaan ajatella päädyttävän siirtymällä äärettömän kauaksi mihin tahansa suuntaan) ja asettamalla tämä $K$:n kuvaksi. Kuvapiste $P'$ voidaan määrittää yksinomaan harppia käyttäen:
Kuvapisteen $P'$ määritys käänteissäteisessä muunnoksessa; piirtämisjärjestys
vihreä, sininen, punainen. Konstruktion pätevyyden voi osoittaa katkoviivojen
muodostamien yhdenmuotoisten kolmioiden avulla.

Käänteissäteinen muunnos kuvaa yleensä ympyrän ympyräksi. Poikkeuksena ovat pisteen $K$ kautta kulkevat ympyrät, jotka kuvautuvat suoriksi. Suorat muunnos kuvaa pisteen $K$ kautta kulkeviksi ympyröiksi, poikkeuksena pisteen $K$ kautta kulkevat suorat, jotka kuvautuvat itselleen. Suoraa voidaankin ajatelle ympyränä, jonka säde on ääretön. Muunnoksen kiinteän ympyrän pisteet ovat omia kuviaan.

Käänteissäteisen muunnoksen käänteiskuvaus on se itse, ts. kuvapisteen kuvapiste on alkuperäinen piste. Tähän viitataan sanomalla, että käänteissäteinen muunnos on involutorinen. Piste $P$ ja sen kuvapiste $P'$ ovat siten symmetrisessä asemassa ja niitä kutsutaan peilipisteiksi muunnoksen kiinteän ympyrän suhteen.

GeoGebra-ohjelmisto tarjoaa työkalun ympyräpeilausten tekemiseen: reflect in circle / peilaus ympyrän suhteen. Esimerkkinä muutamien kuvioiden peilikuvat:

Kuvio ja sen peilikuva käänteissäteisessä muunnoksessa,
kukin pari omalla värillään.

Käänteissäteisessä muunnoksessa mikä tahansa suorista ja ympyröistä muodostuva geometrinen kuvio voidaan asettaa siten, että sen suorat ja ympyrät ja näiden osat kuvautuvat (peilautuvat) ympyröiksi tai ympyrän kaariksi. Kuva voidaan määrittää yksinomaan harpilla. Geometrisissa konstruktioissa tarvittavat perusoperaatiot (leikkauspisteiden määritys, ympyrän piirtäminen keskipisteen ja kehäpisteen avulla, kolmen annetun pisteen kautta kulkevan ympyrän piirtäminen) kohdistetaan tällöin vain ympyräkaarten muodostamaan kuvioon. Voidaan osoittaa, että nämä voidaan tehdä yksinomaan harpilla. Lopuksi konstruoinnin tulokset peilataan takaisin.

Alla on esimerkkinä suorien $AB$ ja $CD$ leikkauspisteen määritys, kun kumpikin suora on annettu kahden pisteen avulla. Pisteet peilataan ensin kiinteässä $K$-keskisessä ympyrässä, jolloin saadaan pisteet $A'$, $B'$, $C'$ ja $D'$. Edellä olevan esimerkin mukaisesti tämä voidaan tehdä yksinomaan harpilla. Suorien kuvat peilauksessa ovat keskipisteen $K$ kulkevia ympyröitä, joista kumpikin siis määräytyy kolmen pisteen avulla: $K$, $A'$, $B'$ ja $K$, $C'$, $D'$. Näiden konstruoiminen onnistuu yksinomaan harpilla (vaikkakaan ei aivan lyhyesti). Peilaamalla ympyröiden leikkauspiste $X'$ saadaan etsitty suorien leikkauspiste $X$.

Harppikonstruktio: suorien $AB$ ja $CD$ leikkauspiste;
peilausympyrä musta, piirtämisjärjestys: vihreä, sininen, punainen.
Suorat katkoviivalla.

Menettelyn todistus (ja monia harppikonstruktioita) on esitetty itävaltalaisen August Adlerin kirjassa Theorie der geometrischen Konstruktionen vuodelta 1906 (löytyy verkosta). Harpin riittävyys ei sinänsä ollut uutta, mutta todistusta käänteissäteistä muunnosta käyttäen ei ollut aiemmin esitetty. Tarvittavat harppikonstruktiot oli esittänyt italialainen Lorenzo Mascheroni vuonna 1797 teoksessaan Geometria del compasso ja tätäkin aikaisemmin tanskalainen Georg Mohr tanskaksi ja hollanniksi ilmestyneessä teoksessaan Euclides danicus vuonna 1672 (kuva artikkelin alussa). Mohrin teos jäi kuitenkin huomiotta ehkä kielen takia, latinahan tuohon aikaan olisi ollut luontevampi valinta. Suomeksi harppikonstruktioita on käsitelty Erkki Rosenbergin kirjassa Geometria (Limes 1983).


Euclides danicuksen tiivis esitys: ympyrä kolmen pisteen kautta.

Lopuksi lukijalle pohdittavaa: Jos $A$ ja $B$ ovat peilipisteitä ympyrän $c$ suhteen ja sekä ympyrä että pisteet kuvataan toiseen ympyrään liittyvällä käänteissäteisellä muunnoksella, niin ovatko kuvapisteet peilipisteitä kuvaympyrän suhteen? Työkaluksi sopii GeoGebra.

-----

Jonkin matematiikan alan hyödyllisyyttä tai hyödyttömyyttä arvioidessa täytyy olla hyvin varovainen. Hyvä esimerkki on lukuteoria, jota on pidetty sovellusten kannalta tarpeettomana puhtaana matematiikkana, mutta johon tietoliikenteen salausalgoritmit nykyään perustuvat. Geometriset harppikonstruktiot voisivat sen sijaan olla hyvä kandidaatti hyödyttömäksi, mutta ehkä kuitenkin jollakin tavoin viehättäväksi matematiikaksi. Kommenteissa voi esittää vastaväitteitä tai muita näkökohtia.


tiistai 27. syyskuuta 2022

Geometrian probleema ja sen moderni versio


Vanha geometrian tehtävä saattaa antaa aihetta monenlaisiin pohdiskeluihin, kun avuksi otetaan laskentaohjelmat.

Annettuna on yllä olevan kuvion mukainen tilanne, jossa $\alpha = 60^\circ$ ja $\beta = 45^\circ$. Kysytään kulman $\gamma$ suuruutta. Tämä on tyypillinen tehtävä omalta kouluajaltani. Vaikeutena on liikkeelle lähtö, sopivan idean — ja apupiirroksen — löytäminen. Jos idea löytyy, tehtävä on melko helppo, ellei, ei synny juuri mitään.

Piirretään pisteestä $A$ normaali janalle $BD$ ja yhdistetään sen kantapiste pisteeseen $C$. Tällöin syntyy ns. muistikolmioita ja tasakylkisiä kolmiota. Kulmia päästään laskemaan vaiheittain eikä tarvita muuta tietoa kuin kolmion kulmien summa. Tuloksena on $\gamma = 75^\circ$. Kuva alla.

Mutta miksi tyytyä vain kulmien arvoihin $\alpha = 60^\circ$, $\beta = 45^\circ$? Voihan $\alpha$ olla mitä tahansa väliltä $]0^\circ,180^\circ[$ ja $\beta$ jotakin $\alpha$:aa pienempää.

Sijoitetaan tilanne koordinaatistoon, piste $A$ origoon ja pisteet $B$ ja $C$ x-akselille. Otetaan tuntemattomiksi kulman $\gamma$ ohella pisteen $D$ koordinaatit $(x,y)$. Jos $\vec{i}$ on tavanomainen yksikkövektori, skalaaritulon avulla saadaan ehdot \[ \cos(\alpha) = \frac{-\vec{i}\cdot\vec{BD}}{|\vec{BD}|}, \quad \cos(\beta) = \frac{-\vec{i}\cdot\vec{CD}}{|\vec{CD}|}, \] jotka määrittävät tilanteen. Nämä tuottavat yhtälöt \[ \cos(\alpha) = \frac{2-x}{\sqrt{(2-x)^2 + y^2}}, \quad \cos(\beta) = \frac{3-x}{\sqrt{(3-x)^2 + y^2}}, \] joista voidaan ratkaista $x$ ja $y$. Ratkaiseminen käsin voi olla työlästä, mutta (ainakin hyvä) symbolisen laskennan ohjelma suoriutuu. Kokeilin Mathematicalla ja GeoGebralla. Kumpikin antaa neljä ratkaisua, GeoGebra tavattoman paljon hankalammat lausekkeet. Tuloksiin on syytä suhtautua rauhallisesti. Ei laskentaohjelma tee sitä, mitä käyttäjä haluaisi, vaan mitä se on ohjelmoitu tekemään, ja tulokset voivat olla mutkikkaita eivätkä aina edes oikeita. Ohjelma pyrkii ottamaan huomioon kaikki tapaukset, mutta ei välttämättä onnistu.

Sijoittamalla Mathematicassa tulokset takaisin yhtälöihin nähdään, että vain kaksi ratkaisuista toteuttaa yhtälöt. Kaksi muuta on ilmeisesti syntynyt neliöjuurien käsittelyn myötä. Vastaavasta sijoittamisesta ei ainakaan käyttämäni GeoGebran versio suoriutunut, mutta numeerisen tarkastelun perusteella tässäkin on kaksi oikeaa ja kaksi väärää ratkaisua. Oikeissa ratkaisuissa x-koordinaatit ovat samat, y-koordinaatit vastalukuja, joten toinen tarkoittaa vain kuvion peilaamista x-akselin alapuolelle.

Mathematican tapauksessa tulos on \[ x = \tfrac{1}{2}(5 - \csc(\alpha - \beta)\sin(\alpha + \beta)), \quad y = \csc(\alpha - \beta)\sin(\alpha)\sin(\beta). \] Suomalaiselle nämä saattavat näyttää hieman oudoilta $\csc$-funktion takia. Tämä on kosekantti, yksinkertaisesti sinin käänteisarvo. Vastaavasti $\sec$, sekantti on kosinin käänteisarvo. Monissa maissa ja sen seurauksena laskentaohjelmissa usein käytetään näitä.

Kun pisteen $D$ koordinaattien lausekkeet ovat käytettävissä, voidaan laskea kaikenlaista. Kulma $\gamma$ saadaan kaksiargumenttisella $\arctan(x,y)$-funktiolla, joka antaa pisteen $(x,y)$ napakulman ja joka on useimmissa ohjelmissa käytettävissä.

Sijoittamalla ratkaisuun esimerkiksi $\beta = \alpha - 15^\circ$ voidaan etsiä ne pisteet $D$, jotka vastaavat kulmien $\alpha$ ja $\beta$ 15 asteen erotusta. Pisteitä voi piirtää ohjelmasilmukalla tai parametrikäyränä, jota useimmat ohjelmistot tukevat. Alkeisgeometriansa hallitsevaa henkilöä ei yllätä, että kyseessä on ympyränkaari. Laskentaohjelma saattaa parametriesityksen perusteella kyetä löytämään myös ympyrälle yhtälön: $x^2 + y^2 - 5x - (2 + \sqrt{3})y + 6 = 0$. Kuva alla, pisteen $D$ mahdollinen sijainti punaisella.

Pienillä muutoksilla voidaan tutkia erilaisia tehtävän variaatioita, mikä usein johtaa algoritmiseen ajatteluun ja kirjoittamaan muutaman rivin ohjelmakoodeja. Edellytyksenä on, että laskentaohjelma tukee ainakin pienimuotoista ohjelmointia. Mathematicassa sujuu hyvin, GeoGebrassa on hankalaa. Mikä esimerkiksi olisi kulman $\gamma$ maksimiarvo, kun kulmien $\alpha$ ja $\beta$ erotus on vakio? Miten maksimiarvo riippuu erotuksen suuruudesta? Sopivatko nämä geometriseen havaintoon?



Ylhäällä: Pisteen $D$ sijainti tapauksessa $\beta = \alpha/3$. Alhaalla vasemmalla: Kulma $\gamma$ kulman $\alpha$ funktiona, kun $\beta = \alpha - 15^\circ$. Alhaalla oikealla: Kulma $\gamma$ kulmien $\alpha$ ja $\beta$ funktiona sekä edellä mainittu käyrä, joka sijaitsee pinnalla.

Erilaisen lähestymistavan tehtävään tarjoavat dynaamisen geometrian ohjelmat, joista GeoGebra lienee tunnetuin. Näissä tarkasteltava kuvio konstruoidaan ohjelman tarjoamien geometristen operaatioiden avulla piirtämällä, jolloin ohjelma laskee pisteiden koodinaatit ja suorien yhtälöt, usein myös perustyyppisten käyrien yhtälöt. Jälkikäteen kuviota voidaan muunnella pisteitä siirtämällä. Urakäyriä (locus) saadaan myös piirretyksi. Symbolisiin lausekkeisiin tai ns. tarkkoihin arvoihin (joita ehkä olisi parempi kutsua symbolisiksi arvoiksi, onhan kymmendesimaalinen likiarvokin jo kohtalaisen tarkka) ei yleensä päästä käsiksi ilman symbolista laskentaa.

maanantai 15. elokuuta 2022

Netti, Pythagoras ja CAS

(CAS = Computer Algebra System, symbolinen laskentaohjelma)

Olen aina silloin tällöin pannut selaimen kirjanmerkeiksi matemaattisesti kiinnostavia verkkosivuja. Usein nämä ovat enemmän tai vähemmän irrallisia yhteen asiaan keskittyviä tekstejä tai havainnollistuksia. Toki löytyy myös isompia kokonaisuuksia käsitteleviä dokumentteja ja sähköisessä muodossa olevia oppikirjojakin.

Lyhyet tekstit ja havainnollistukset yleensä edellyttävät jonkinlaisia perustietoja asiasta, mutta saattavat tämän jälkeen avata uusia näköaloja. Ovat hyödyllisiä ja hauskoja vaikkapa opettajalle tai oppikirjantekijälle.

Alexander Bogomolnyn luoma sivusto Interactive Mathematics Miscellany and Puzzles, tuttavallisemmin Cut the Knot, tarjoaa paljon muun ohella katsauksen Pythagoraan lauseeseen: 122 erilaista todistusta (https://www.cut-the-knot.org/pythagoras/). Joukossa tietenkin tavanomaiset oppikirjoissa esiintyvät, mutta myös paljon muuta. Ehkä kiintoisimmasta päästä on epäsuora todistus:

Lähtökohtana on tavanomainen suorakulmaisen kolmion jako kahteen yhdenmuotoiseen suorakulmaiseen kolmioon alla olevan kuvan mukaisesti.


Pythagoraan väittämän vastaoletus on $a^2 + b^2 \neq c^2$, esimerkiksi siis $a^2 + b^2 < c^2$.

Ison kolmion ja vasemmanpuolisen osakolmion yhdenmuotoisuuden perusteella on $a = sx$, $b = sh$ ja $c = sa$, missä $s$ on verrannollisuuskerroin. Vastaoletuksesta seuraa tällöin $s^2 x^2 + s^2 h^2 < s^2 a^2$ ja siis $x^2 + h^2 < a^2$. Oikeanpuoliselle osakolmiolle pätee vastaavasti $h^2 + y^2 < b^2$. Yhdenmuotoisuuden perusteella on myös $y/h = h/x$ eli $h^2 = xy$. Nyt voidaan arvioida seuraavasti: \[ a^2 + b^2 > (x^2 + h^2) + (h^2 + y^2) = x^2 + y^2 + 2h^2 = x^2 + y^2 + 2xy = (x + y)^2 = c^2. \] Siis $a^2 + b^2 > c^2$, mikä on ristiriidassa lähtökohtana olevan vastaoletuksen kanssa.

Jos olisi  $a^2 + b^2 > c^2$, päädyttäisiin samalla tavoin ristiriitaan $a^2 + b^2 < c^2$. Ainoaksi mahdollisuudeksi siis jää $a^2 + b^2 = c^2$.

Uudet näkökulmat herättävät usein pohtimaan asiaa enemmänkin. Edellä oleva epäsuora todistus viittaa minusta mahdollisuuteen todistaa Pythagoraan lause myös algebrallisesti yhdenmuotoisuuksiin perustuen. Kolmioiden yhdenmuotoisuuksista saadaan ehdot \[a = sx, b = sh, c = sa, a = th, b = ty, c = tb,\] missä $s$ ja $t$ ovat verrannollisuuskertoimia. Kun mukaan liitetään hypotenuusan paloitteluehto $x + y = c$, suorakulmainen kolmio on algebrallisesti karakterisoitu. Seuraako tästä sitten ehto $a^2 + b^2 = c^2$? Voidaanko yhtälöryhmästä eliminoida $x$, $y$, $h$, $s$ ja $t$, jolloin ehkä jäisi jäljelle jotakin symboleja $a$, $b$ ja $c$ koskevaa?

Eliminointi onnistuu käsinlaskulla helposti (voisi sopia ylioppilastehtäväksi), mutta usein CAS-ohjelmistoista löytyy myös valmis eliminointityökalu. Kuvassa on Mathematican suoritus:


Ehdoista siis seuraa Pythagoraan väittämä.

Pythagoraan lause pätee myös käänteisesti: Jos kolmion sivuille pätee $a^2 + b^2 = c^2$, niin kolmio on suorakulmainen. Voitaisiinko tämäkin todistaa jotenkin algebrallisesti?


Olkoon oheisen kuvion mukaisesti $D$ jokin piste sivulla $AB$, jonka pituus on $c$. Onko mahdollista valita $D$ siten, että kolmiot $BDC$, $CDA$ ja $BCA$ ovat yhdenmuotoiset, jos ehto $a^2 + b^2 = c^2$ on voimassa? Toisin sanoen: Onko yhtälöryhmällä \[a = sx, b = sh, c = sa, a = th, b = ty, c = tb, x + y = c\] ehdon voimassa ollessa ratkaisua, kun tuntemattomia ovat verrannollisuuskertoimet $s$ ja $t$ sekä $x$, $y$ ja $h$? Käsinlaskukin sujuu, mutta CAS-ohjelmistosta saattaa löytyä valmis työkalu:


Ratkaisu todellakin löytyy. (Kuvassa Mathematica ei anna heti sievintä muotoa, vaan tarvitaan erillinen sievennyskomento, jossa uudelleen ilmoitetaan oletuksena oleva ehto.) Jos piste $D$ valitaan tämän mukaisesti, ovat kolmiot $BDC$, $CDA$ ja $BCA$ yhdenmuotoiset. Vastinkulmina $BDC$, $CDA$ ja $BCA$ ovat yhtä suuret ja niiden on silloin oltava suoria kulmia. Kolmio $ABC$ on siis suorakulmainen.

Lukija saattaa kysyä, eikö edellä mainitulla yhtälöryhmällä sitten ole ratkaisua, jos Pythagoraan ehto ei ole voimassa. Geometrinen intuitio ehkä sanoisi, että ei ole. Näin onkin (nollaratkaisua lukuunottamatta) ja myös polynomialgebralla asia voidaan osoittaa. CAS-ohjelmista saattaa löytyä sopiva työkalukin, Mathematicalla komento Reduce.

tiistai 31. toukokuuta 2022

Vääriä todistuksia

Päättelyvirheiden etsiminen matemaattisista todistuksista on usein hyödyllistä matematiikan opiskelijalle. Esitän kolme todistusta ilmiselvästi virheellisille väitteille. Lukijan tehtäväksi jääköön etsiä virhe. Monille tässä ei varmaankaan ole mitään ongelmaa, mutta toivon, että jutun juonta ei paljasteta kommenteissa ainakaan ihan heti.

Lause 1. Kaikki ympyrät ovat samasäteisiä.




Todistus. Oheisessa kuviossa on kaksi ympyrää, joiden keskipisteet ovat $A$ ja $B$. Jana $CD$ on ympyröiden yhteinen tangentti. Janoille $AB$ ja $CD$ asetetaan keskinormaalit. Nämä leikkaavat toisensa pisteessä $E$. Keskinormaaliominaisuuden takia janat $AE$ ja $BE$ ovat yhtä pitkät; sama koskee janoja $CE$ ja $DE$. Keskinormaaliominaisuudesta seuraa edelleen, että kulmat $ECD$ ja $EDC$ ovat yhtä suuret, jolloin myös kulmat $ACE$ ja $BDE$ ovat näiden komplementtikulmina yhtä suuret. Tällöin kolmiot $AEC$ ja $BED$ ovat yhtenevät. Vastinsivuina ympyröiden säteet $AC$ ja $BD$ ovat yhtä pitkät. QED

Lause 2. Kaikki positiiviset kokonaisluvut ovat yhtä suuria.

Todistus. Lause on suora seuraus apulauseesta: Jos $a$ ja $b$ ovat positiivisia kokonaislukuja, joille pätee $a \leq n$ ja $b \leq n$, niin $a = b$. Tämä voidaan todistaa induktiolla $n$:n suhteen.

Jos $n = 1$, ainoa mahdollisuus on, että $a = b = 1$, ja luvut siis ovat yhtä suuret. Induktion alku on siis kunnossa.

Induktioaskeleessa oletetaan, että lause pätee arvolla $n$, ja osoitetaan, että tällöin se pätee myös arvolla $n+1$. Olkoon siis $a \leq n+1$ ja $b \leq n+1$. Tällöin on $a-1 \leq n$ ja $b-1 \leq n$, jolloin induktio-oletuksen mukaan $a-1 = b-1$. Tästä seuraa $a = b$ ja induktioaskel on osoitettu. QED

Lause 3. Funktiolla $\sin(x)/x$ ei ole raja-arvoa, kun $x \to \infty$.

Todistus. Lausekkeessa \[\frac{x - \sin(x)}{x}\] osoittaja $x - \sin(x)$ lähestyy ääretöntä, kun $x \to \infty$. Sama koskee nimittäjää $x$. Tällöin lauseke saa rajaprosessissa $x \to \infty$ muodon $\infty/\infty$ ja voidaan soveltaa l'Hospitalin lausetta. Derivoimalla osoittaja ja nimittäjä saadaan \[\frac{1 - \cos(x)}{1} = 1 - \cos(x),\] joka heilahtelee välillä $[0,2]$ eikä sillä siis ole raja-arvoa. Tällöin ei myöskään lausekkeella \[\frac{x - \sin(x)}{x} = 1 - \frac{\sin(x)}{x}\] ole raja-arvoa, mistä seuraa väitös. QED

Funktion $\sin(x)/x$ kuvaaja



lauantai 7. toukokuuta 2022

Projektiivinen taso, homogeeniset koordinaatit ja äärettömän kaukaiset pisteet

Rautatien äärettömän kaukainen piste (kuva Tom Barrett, Unsplash)

Geometrioita on monenlaisia. Perinteinen koulugeometria, antiikin Kreikasta lähtenyt euklidinen geometria ei ole lainkaan ainoa mahdollisuus. Epäeuklidista geometriaa olen aiemmin käsitellyt, tällä kertaa esillä on jotakin projektiivisesta geometriasta jatkona edellisen blogikirjoituksen Pascalin ja Brianchonin lauseisiin. Näissä saattoi esiintyä yhdensuuntaisia suoria, joille kuitenkin tarvittiin leikkauspiste. Kutsuin tällaisia pisteitä äärettömän kaukaisiksi pisteiksi ja niiden turvin lauseet saatiin toimimaan rajoituksitta. Mutta saisiko tällaiseen geometriaan — projektiiviseen geometriaan — jotenkin konkreettisuutta?

Lähtökohtana olkoon tavallinen euklidinen taso, jossa pisteen paikka voidaan ilmaista kahdella koordinaatilla: $P = (x,y)$. Luodaan pisteelle uudet koordinaatit, ns. homogeeniset koordinaatit lisäämällä alkuun nollas koordinaatti. Tällöin piste esitetään muodossa $P\,\widehat{=}\, (1,x,y)$ ja sovitaan, että jos koordinaatit kerrotaan nollasta eroavalla luvulla, kyseessä on edelleen sama piste: $P\,\widehat{=}\,(p,px,py)$, $p \neq 0$. Jos kääntäen pisteen homogeeniset koordinaatit ovat $(x_0,x_1,x_2)$, nämä voidaan kertoa luvulla $1/x_0$ ja saada muotoon $(1,x_1/x_0,x_2/x_0)$, mistä näkyy, että tavalliset koordinaatit ovat $(x_1/x_0,x_2/x_0)$. Edellytyksenä luonnollisesti on, että $x_0 \neq 0$.

Vaatimus, että homogeenisten koordinaattien nollas koordinaatti ei saa olla $0$, on jonkinlainen kauneusvirhe, joka rikkoo symmetrian. Siitä luopuminen tuo mahdollisuuden liittää tasoon uusia pisteitä: Sovitaan, että luvut $(x_0,x_1,x_2)$ esittävät aina pistettä, kunhan kaikki eivät ole samanaikaisesti $= 0$,. Nollasta eroavalla vakiolla kerrottuna ne esittävät edelleen samaa pistettä: $(x_0,x_1,x_2)\,\widehat{=}\,(px_0,px_1,px_2)$. Jos $x_0 \neq 0$, kyseessä on tavallinen piste, jos $x_0 = 0$, kyseessä on tasoon liitetty uusi piste, jota kutsutaan ideaalipisteeksi tai äärettömän kaukaiseksi pisteeksi. Syntyvää geometriaa kutsutaan projektiiviseksi geometriaksi. Kaikki sen pisteet ovat periaatteessa samassa asemassa. (Lineaarialgebrallisesti ajatteleva henkilö voisi kutsua niitä kolmiulotteisen avaruuden $\mathbb{R}^3$ yksiulotteisiksi aliavaruuksiksi.) Jako tavallisiin ja ideaalipisteisiin koskee vain geometrian tulkintaa jossakin yhteydessä.

Nimityksen 'äärettömän kaukainen piste' motivoimiseksi on syytä tarkastella tason suoria. Tunnetusti suoran yhtälö on muotoa $a_1x + a_2y + a_0 = 0$ ja piste $P = (x,y)$ on suoralla, jos yhtälö toteutuu. Jos piste ilmaistaan homogeenisilla koordinaateilla muodossa $(x_0,x_1,x_2)$, ehto saa muodon $a_1x_1/x_0 + a_2x_2/x_0 + a_0 = 0$ tai yhtä hyvin $a_0x_0 + a_1x_1 + a_2x_2 = 0$, koska yhtälön voi kertoa nollasta eroavalla vakiolla.

Suora määräytyy, kun tunnetaan sen yhtälön kertoimet $a_0$, $a_1$ ja $a_2$. Itse asiassa kertoimet $qa_0$, $qa_1$ ja $qa_2$ määräävät saman suoran, kun $q \neq 0$. Näitä voidaan kutsua suoran homogeenisiksi koordinaateiksi. Pisteiden ja suorien välillä vallitsee symmetrinen tilanne: kummatkin määräytyvät kolmen luvun perusteella ja nämä luvut voidaan aina kertoa nollasta eroavalla vakiolla. Piste $P\,\widehat{=}\,(x_0,x_1,x_2)$ on suoralla $s\,\widehat{=}\,(a_0,a_1,a_2)$, jos ja vain jos $a_0x_0 + a_1x_1 + a_2x_2 = 0$. Tätä kutsutaan insidenssirelaatioksi.

Jos kaksi suoraa ovat tavanomaisessa mielessä yhdensuuntaisia, niiden yhtälöt eroavat vain vakiotermien osalta. Niiden homogeeniset koordinaatit ovat tällöin muotoa $(c_1,a,b)$ ja $(c_2,a,b)$, missä $c_1 \neq c_2$. Jos suorilla on leikkauspiste, ts. yhteinen piste, jonka homogeeniset koordinaatit ovat $(x_0,x_1,x_2)$, tulee insidenssirelaatioiden \begin{align*} &c_1x_0 + ax_1 + bx_2 = 0, \\ &c_2x_0 + ax_1 + bx_2 = 0 \end{align*} toteutua. Vähentämällä yhtälöt saadaan $(c_1 - c_2)x_0 = 0$, mistä seuraa $x_0 = 0$. Yhteinen piste on siis ideaalipiste ja sen kutsuminen äärettömän kaukaiseksi pisteeksi on perusteltua, koska kahden suoran kääntyessä yhdensuuntaisiksi niiden leikkauspiste pakenee äärettömän kauas.

Koska äärettömän kaukaiset pisteet ovat muotoa $(0,x_1,x_2)$ ne sijaitsevat suoralla $(1,0,0)$: $1 \cdot 0 + 0 \cdot x_1 + 0 \cdot x_2 = 0$. Tämä on ainoa projektiiviseen tasoon laajennuksessa tullut uusi suora. Sitä kutsutaan ideaalisuoraksi tai äärettömän kaukaiseksi suoraksi.

Voidaanko äärettömän kaukaisia pisteitä sitten jotenkin 'nähdä' vai ovatko ne vain teoreettisia apukäsitteitä? Projektiivisen tason kuviot voidaan ns. projektiivisella kuvauksella muuntaa uudenlaisiksi kuvioiksi. Tällöin pisteet ja suorat ja niiden väliset insidenssirelaatiot säilyvät, mutta esimerkiksi etäisyydet tai kulmien suuruudet eivät säily. Esimerkkinä on oheinen F-kirjaimen kuvautuminen. Perspektiivikuvan muodostaminen on myös esimerkki projektiivisesta kuvauksesta. Alla olevassa kuvassa on xy-tason suorakulmaisen ruudukon perspektiivikuva. Tässä ruudukkoa rajaa yläpuolelta vaakasuora viiva, jonka pisteisiin tason yhdensuuntaiset suorat suuntautuvat. Tämä viiva (perspektiivikuvan horisontti) on ideaalisuoran kuva.

Kirjaimen F projektiivinen kuva. Harmaat viivat ovat konstruktion apuviivoja.

Suorakulmaisen ruudukon perspektiivikuva

Artikkelin alussa olevan suoran rautatien perspektiivikuvassa näkyy myös yhdensuuntaisten kiskojen äärettömän kaukaisen pisteen kuva, jossa kiskot näyttävät yhtyvän (perspektiivikuvan pakopiste).


maanantai 4. huhtikuuta 2022

Pascal ja Brianchon

Blaise Pascal (1623-1662) oli matemaatikko ja uskonnollinen ajattelija, jonka nimen matemaattisten aineiden opiskelija kohtaa moneen kertaan: binomikertoimien muodostama Pascalin kolmio (joka esiintyy monissa yhteyksissä), projektiivisen geometrian Pascalin lause, paineen yksikkö pascal, ohjelmointikieli Pascal. Kaksi viimeksi mainittua ovat varsin modernia nimen käyttöä, mutta sillä on taustansa Pascalin töissä: hän pohti painetta ja tyhjiötä, rakensi mekaanisen laskukoneen.



Pascalin lause

Pascalin lauseessa sijoitetaan kartioleikkaukselle — ellipsille, paraabelille tai hyperbelille — jollakin tavoin kuusi (eri) pistettä. Nämä olkoot $A_1$, $B_1$, $C_1$, $A_2$, $B_2$ ja $C_2$. Järjestyksellä tai sijainnilla ei ole merkitystä. Pisteiden kautta asetetaan suorat ja muodostetaan näiden leikkauspisteet: suorien $A_1B_2$ ja $A_2B_1$ leikkauspiste on $R$, suorien $B_1C_2$ ja $B_2C_1$ leikkauspiste $S$, suorien $C_1A_2$ ja $C_2A_1$ leikkauspiste $T$. Tällöin pisteet $R$, $S$ ja $T$ ovat samalla suoralla.

Tavallisista euklidisen geometrian lauseista tämä poikkeaa sikäli, että pisteiden etäisyydellä ei lauseessa ole mitään roolia. Kyse on ainoastaan suorien asettamisesta ja leikkauspisteiden määrittämisestä. Todistuskin perustuu — tietenkin — tämäntyyppiseen käsitteistöön. En paneudu siihen.


Pappoksen lause

Kaksi toisensa leikkaavaa tai kaksi yhdensuuntaista suoraa ovat erikoistapaus kartioleikkauksesta ja lause pätee myös tällöin. Tulosta kutsutaan Pappoksen lauseeksi 300-luvun alussa eläneen Pappos Aleksandrialaisen mukaan. Tulos on siten merkittävästi vanhempi kuin Pascalin lause.

Pascalin lause, toinen versio

Koska Pascalin lauseen pisteiden sijainti kartioleikkauksella voi olla mikä tahansa, ne voidaan siirtää siten, että $R$, $S$ ja $T$ ovat kuperan kuusikulmion vastakkaisten sivuparien leikkauspisteitä. Lause saa tällöin uuden muodon: Kartioleikkauksen sisään piirretyn kuperan kuusikulmion vastakkaisten sivuparien leikkauspisteet ovat samalla suoralla.

Lukija ehkä huomaa puutteen Pascalin lauseen muotoilussa. Jos kerran pisteet voivat sijaita kartioleikkauksella miten tahansa, jotkut suorapareista saattavat olla yhdensuuntaisia, jolloin leikkauspistettä ei ole. Pitäisikö nämä tapaukset rajata pois?

Tilanteesta selvitään toisinkin. Liitetään euklidiseen (tavalliseen) tasoon uusia pisteitä. Sovitaan, että kahdella yhdensuuntaisella suoralla onkin yhteinen äärettömän kaukana sijaitseva piste. Tähän pisteeseen päästään kulkemalla suorien suunnassa — jompaankumpaan suuntaan — äärettömän kauaksi. Yhdensuuntaisen suoraparven suorilla on yhteinen äärettömän kaukainen piste, mutta kahdella erisuuntaisella suoraparvella on kummallakin oma äärettömän kaukainen pisteensä. Tasoon liitetään myös yksi uusi suora, äärettömän kaukainen suora, joka muodostuu kaikista äärettömän kaukaisista pisteistä.

Tällä tavoin laajennettua tasoa kutsutaan projektiiviseksi tasoksi. Täsmällisestä matematiikasta viehättynyt lukija varmaan sanoo, ettei edellä oleva kelpaa matemaattiseksi määritelmäksi, ja siinä hän on aivan oikeassa. Projektiivinen taso voidaan toki määritellä täsmällisestikin, mutta edellä oleva antaa ideasta oikean ja riittävän mielikuvan, ainakin aluksi.

Projektiivisessa tasossa kaksi suoraa määrää aina pisteen, niiden leikkauspisteen, joka on joko tavallinen piste tai äärettömän kaukainen piste. Kaksi pistettä määrää aina suoran. Jos pisteistä toinen on äärettömän kaukainen piste, kyseessä on jokin tähän pisteeseen liittyvän yhdensuuntaisen suoraparven suora. Jos molemmat ovat äärettömän kaukaisia pisteitä, kyseessä on äärettömän kaukainen suora.

Projektiivisessa tasossa pisteet ja suorat ovat siten symmetrisessä asemassa. Tätä kutsutaan dualiteetiksi. Pisteitä ja suoria koskeva projektiivisen geometrian lause voidaan dualisoida: siinä voidaan vaihtaa pisteiden ja suorien roolit. Uuden lauseen todistus saadaan dualisoimalla alkuperäisen lauseen todistus: vaihdetaan siinä pisteiden ja suorien roolit.

Pascalin lause on projektiivisen geometrian lause, ts. siinä on kyse vain pisteistä ja suorista, kahden pisteen määräämistä suorista ja kahden suoran määräämistä pisteistä (leikkauspisteistä). Näin ollen se voidaan dualisoida, jolloin lähtökohtana on kuuden suoran asettaminen kartioleikkaukselle. Tämä vaatii tarkennuksen: kartioleikkauksella oleva suora tarkoittaa, että suora on kartioleikkauksen tangentti.

Dualisoitua lausetta kutsutaan Brianchonin lauseeksi ranskalaisen matemaatikon ja tykistökoulun professorin Charles-Julien Brianchonin (1783-1864) mukaan. Dualisoimalla yllä oleva Pascalin lauseen formulointi se saa seuraavan muodon:

Kartioleikkaukselle sijoitetaan jollakin tavoin kuusi (eri) tangenttia. Nämä olkoot suorat $a_1$, $b_1$, $c_1$, $a_2$, $b_2$ ja $c_2$. Järjestyksellä tai sijainnilla ei ole merkitystä. Määritetään leikkauspisteet ja asetetaan suorat: leikkauspisteiden $a_1 \cap b_2$ ja $a_2 \cap b_1$ määräämä suora on $r$, leikkauspisteiden $b_1 \cap c_2$ ja $b_2 \cap c_1$ määräämä suora $s$, leikkauspisteiden $c_1 \cap a_2$ ja $c_2 \cap a_1$ määräämä suora $t$. Tällöin suorat $r$, $s$ ja $t$ leikkaavat samassa pisteessä.  (Tässä siis joukko-opillinen leikkauksen merkki viittaa suorien leikkauspisteeseen.)

Brianchonin lause


tiistai 15. maaliskuuta 2022

Elliptinen sohvapöytä

Tarinoitiin ystävien kanssa sohvapöydän ympärillä. Heräsi kysymys, onko soikea sohvapöytä ellipsin muotoinen vai ylipäätään vain jokin soikio. Miten asian voisi helpoimmin selvittää? Kamera on nykyään jokaisella mukana, joten otettiin pöytälevystä pari kuvaa, molemmat vinossa asennossa, ja päätettiin analysoida ne myöhemmin.

 

Kamera muodostaa kuvia — perspektiivikuvia — keskusprojektion periaatteella. Keskusprojektio puolestaan kuvaa kartioleikkauksen — ellipsin, paraabelin tai hyperbelin — kartioleikkaukseksi. Tyyppi ei välttämättä säily, esimerkiksi ellipsi voi myös kuvautua paraabelin tai hyperbelin kaareksi. Sohvapöydän kuvissa oli kuitenkin ilmeistä, että jos muoto on ellipsi, niin sen kuvakin on ellipsi. Myös käänteinen pätee: jos kuva on ellipsi, niin pöytäkin on ellipsin muotoinen. Eikä kuvan tällöin tarvitse olla otettu kohtisuoraan pöydän pintaa vastaan.

Riittää siis analysoida pöydästä otetut valokuvat. Tätä varten kuva voidaan siirtää GeoGebran piirtoalustalle, jolloin sen päälle on mahdollista tehdä geometrisia konstruktioita. Kartioleikkauksen — toisen asteen käyrän — yhtälö xy-tasossa on periaatteessa muotoa \[ax^2 + by^2 + 2cxy + 2dx + 2ey + f = 0,\] missä on kuusi kerrointa $a$, $b$, $c$, $d$, $e$ ja $f$. Yhtälön määräämiseen riittää tuntea viisi pistettä kartioleikkaukselta. Tällöin kertoimiin jää yksi vapausaste, mutta näin tulee ollakin, sillä kartioleikkaus ei muutu, jos yhtälö kerrotaan nollasta eroavalla vakiolla. GeoGebrassa on työkalu, joka määrittää kartioleikkauksen yhtälön ja piirtää käyrän, kun annetaan viisi pistettä.

Valittiin siis valokuvassa viisi pistettä pöydän reunalta ja muodostettiin reunakäyrä kartioleikkauksena. Tämä osoittautui ellipsiksi, joka hyvin suurella tarkkuudella yhtyy pöydän reunaan. Alla on konstruktio tehtynä kumpaankin kuvaan. Pöytälevy on siis ilmeisesti tehty nimenomaan ellipsin muotoon. Myöhemmin ilmeni, että pöydän suunnittelija on Ilmari Tapiovaara (Ovalette,1954).

GeoGebrassa on myös työkalu, jolla voidaan määrittää annetun ellipsin polttopisteet. Nämä ovat nähtävissä kummassakin kuvassa (punaiset pisteet $F_1$ ja $F_2$). Pöytälevyyn nähden ne näyttävät kuvissa olevan eri paikoissa. Vaikkakin keskusprojektiossa kartioleikkaus kuvautuu kartioleikkaukseksi, polttopisteet eivät kuvaudu polttopisteiksi. Jos siis haluaa kairata pöytäänsä reiät kynttiläjaloiksi polttopisteiden kohdalle, paikkoja ei voi määrittää valokuvan perusteella. Vastaava koskee ellipsin tunnettua ominaisuutta: kehäpisteen yhteenlaskettu etäisyys polttopisteistä on vakio. Ominaisuus on jokaisella ellipsillä, mutta vakio ei ole eri kuvissa sama, vaikka skaalauskin otettaisiin huomioon. 

 

torstai 24. helmikuuta 2022

Peruskoulualgebraa

Kaappaus YouTube-videosta (Päivi Portaankorva-Koivisto ja Sirpa Wass)

Kaltaiseni urallaan yliopistotason matematiikan kursseja opettanut henkilö tietää ehkä pääpiirteittäin, mitä lukion matematiikka sisältää ja mitkä ovat sen näkökulmat. Peruskoulu sen sijaan on usein jäänyt vähemmälle huomiolle. Omien lasten peruskouluvuosistakin on jo aikaa. Tietoisuudessa on lähinnä taakse jäänyt joukko-oppi ja viime aikoina esitetyt väitteet, että peruskoulussa ei enää luoda tukevaa matemaattista pohjaa.

Muutaman kerran olen selannut digitaalisia oppimateriaaleja ja hiljattain osuin katsomaan Päivi Portaankorva-Koiviston ja Sirpa Wassin YouTube-videoita algebran peruskäsitteiden havainnollistamisesta. En tiedä, onko nämä tarkoitettu peruskoulun tunneilla käytettäviksi vai ovatko ne opettajakoulutuksen materiaalia, mutta aika erikoisen näkökulman ne minusta algebraan antavat. Jos algebraan todella lähdetään näin, niin en ihmettele, jos asia koululaiselle jää hämäräksi.

Lähtökohta on hyvä: kirjaimet tarkoittavat lukuja, joita ainakaan siinä vaiheessa ei tarkemmin tunneta tai haluta täsmentää. Sitten kerrotaan, että termi on olio, jossa on etumerkki, kerroin ja kirjainosa. Tämä kuitenkin johtaa väärään mielikuvaan. Oleellista on, että termit ovat lausekkeita, joita lasketaan yhteen, mutta tämä jää sanomatta. Termien muoto voi olla mutkikkaampikin, vaikkapa lausekkeessa $abc + 1/x + (x+y)^3$ on kolme termiä. Toki tällaisia lausekkeita ei aivan heti aleta käsitellä, mutta periaatteessa esimerkki on ymmärrettävissä ja johtaa oikeaan mielikuvaan lausekkeesta ja termistä.

En oikein ymmärrä tapaa, jolla lausekkeiden yhteenlaskussa päädytään yhdistämään ns. samanmuotoiset termit. Esimerkissä (kuva ylhäällä) on kaksi joukkoviivaa (!), toisen sisällä kolme neliötä ja neljä ympyrää, toisen sisällä yksi neliö ja kaksi ympyrää. Näitä kuvataan lausekkeella $(4y+3n) + (2y+1n)$. Mitä tämä sitten on? Kirjaintenhan piti tarkoittaa lukuja eikä geometrisia olioita. Laskemalla kaikki neliöt ja kaikki ympyrät saadaan neljä neliötä ja kuusi ympyrää, siis $4n + 6y$. Tässä on siis kertoimet laskettu yhteen aina kun kirjainosat ovat samat. Mutta miten tämä sääntö sopii tilanteeseen, jossa $y$ ja $n$ ovatkin lukuja? Onko niin, että oppilaan pitää vain uskoa ja muistaa sääntö, mutta ei miettiä sen yhteyttä lukuihin?

Katsoin, miten asia on esitetty yli puoli vuosisataa vanhassa K. Väisälän Algebran oppi- ja esimerkkikirjassa. Täälläkin kirjaimet tarkoittavat lukuja. Lausekkeen käsite on selitetty sanoin, mukana useita esimerkkejä, yhtenä \[\dfrac{7x-4}{xy}.\] Sama koskee termin käsitettä ja termien samanmuotoisuutta. Esimerkiksi kuuden termin lauseke \[rx - 3sx-1+2sx+2r+2\] voidaan samanmuotoiset termit yhdistämällä saataa kahteen eri muotoon riippuen siitä, mitä pidetään kirjainosana ja mitä kertoimena: \[rx - sx + 2r + 1 = (r-s)x + (2r+1).\] Edellisessä on neljä termiä, jälkimmäisessä kaksi. Sivutuotteena tulee ymmärrys siitä, että sieventämisen tulos ei ole yksikäsitteinen, vaan riippuu sieventämisen tavoitteesta.

Samanmuotoisten termien yhdistämisen Väisälä perustelee osittelulailla: $a(b+c) = ab + ac$ tai toisin kirjoitettuna $ba + ca = (b+c)a$. Tällöin siis esimerkiksi $5x + 4x = (5+4)x = 9x$. Tämä luonnollisesti edellyttää, että osittelulaki tunnetaan aikaisemmasta. En tiedä, opetetaanko se nykyään ennen kirjainlaskennan aloittamista. Minusta pitäisi. Millään tavoin mahdotontahan se ei ole. Tilanne on esimerkki matematiikan opiskelun kumulatiivisuudesta: uudet asiat rakentuvat aikaisemmin opitun päälle. Jos tästä logiikasta ei pidetä kiinni, matematiikan opiskelu muuttuu irrallisen silpputiedon opetteluksi vailla ymmärrystä. (On kyllä myönnettävä, että aikoinani pidin laskulakien opettelua aritmetiikan yhteydessä tylsänä ja tarpeettomana, vaikka niillä oli käyttöä päässälaskussakin. Algebra kyllä sitten näytti niiden merkityksen ja muutin mieleni.)

Osittelulakiin vetoaminen painottaa myös usein väärin ymmärretyn yhtäläisyysmerkin merkitystä. Kyse on nimenomaan yhtäsuuruudesta, ei siitä, että vasemmasta puolesta 'tulee' oikea puoli. Osittelulaki toimii molemmin päin: se on joko menettely sulkujen poistamiseen (lausekkeen 'kehittämiseen', englanniksi expand) tai yhteisen tekijän ottamiseen.

On tietenkin totta, että matematiikassa käytetään kirjainsymboleja muutoinkin kuin viittaamassa lukuihin. Näin käy jo lukiossakin puhumattakaan yliopistollisesta abstraktin algebran kurssista. Hyppy aritmetiikasta peruskoulualgebraan on ensimmäinen askel abstraktiotason lisäämisen tiellä, eikä siitä minusta pidä tehdä tarpeettoman vaikeata. Edellä mainittu ympyrä-neliö-malli tuskin auttaa vektoreiden yhteenlaskun ymmärtämisessä, vaikka asiat hallitseva ehkä näkeekin ympyrät ja neliöt lineaarisesti riippumattomiksi.

Kuten sanottu, en ole erityisen hyvin perehtynyt peruskoulun oppimateriaaleihin. Olen kuitenkin tavannut edellä kritisoimani opetustavat joissakin muissakin materiaaleissa. Kuinka yleisiä ne ovat, en osaa sanoa. Mieleen hiipii epäily, että johtuisiko matemaattisen osaamisen rapautuminen tavasta, jolla asioita opetetaan. (Ehkä syytä todeta, että tässä yhteydessä ei niinkään ole kyse sellaisesta osaamisesta, jota PISA-tutkimuksissa on testattu, vaan pohjasta myöhemmille matematiikan opinnoille.)

Selasin kiinnostuksella Väisälän kirjaa. Sillä on ikää eikä se varmasti olisi ihanneoppikirja tämän päivän maailmassa. Mutta kirjasta näkee, että Väisälä on tarkoin miettinyt, miten asiat kannattaa ymmärrettävästi ja johdonmukaisesti esittää. Väisälä myös selvisi kolmen luokan algebraosuudesta harjoitustehtävineen 150 sivulla. Voisin Väisälää suositella oppimateriaalintekijöiden oheislukemistoksi.

Väisälän esitys samanmuotoisten termien yhdistämisestä

tiistai 1. helmikuuta 2022

Chambordin linnan portaikko

Chambordin linna (Wikipedia, Benh LIEU SONG, 2012, CC BY-SA 3.0)

Ranskan kuningas Frans I rakennutti 1500-luvulla Chambordin linnan Loire-joen laaksoon (Wikipedia-artikkeli ranskaksi, englanniksi). Linnan pääportaikko perustunee Leonardo da Vincin ideaan ja siinä voi samanaikaisesti toinen henkilö nousta ylöspäin, toinen laskeutua alaspäin, ilman että he kohtaavat tai edes ovat välttämättä tietoisia toisistaan.

Millainen portaikon rakenne voi olla?

Kyseessä on kierreportaikko, jolloin rakenne perustuu ruuviviivaan: \begin{align*} x &= a\cos(t), \\ y &= a\sin(t), \\ z &= bt, \end{align*} vektorimuodossa $p = (a\cos(t), a\sin(t), bt)$. Tässä $t$ on parametri, jonka jokaista arvoa kohden saadaan yksi ruuviviivan piste. xy-tason pisteet $(a\cos(t), a\sin(t))$ sijaitsevat origokeskisellä $a$-säteisellä ympyrällä, jolloin ruuviviiva sijaitsee tämän ympyrän yläpuolella ja z-koordinaatti määrää pisteen korkeuden. Vakio $b$ ($> 0$) on ruuviviivan nousu, ts. siitä riippuu, miten nopeasti viiva nousee $t$:n kasvaessa. Parametri $t$ ilmaistaan radiaaneissa, jolloin $2\pi$:n suuruinen kasvu tarkoittaa yhtä kierrosta.

Ruuviviiva; kaksi kierrosta

Ruuviviivan akseli on z-akseli. Sijoitetaan tälle piste, joka on samalla korkeudella kuin parametriarvoa $t$ vastaava ruuviviivan piste: $q = (0,0,bt)$.

Pisteiden $p$ ja $q$ kautta kulkevan suoran parametriesitys on $r = q + u(p - q)$, missä $u$ on parametri. Tämä voidaan kirjoittaa usein mukavampaan muotoon $r = up + (1-u)q$. Jos $0 < u < 1$, piste $r$ on pisteiden $p$ ja $q$ välissä.

Kun pisteiden $p$ ja $q$ lausekkeet pannaan paikoilleen, saadaan \[ r = u(a\cos(t), a\sin(t), bt) + (1-u)(0,0,bt), \] minkä voi halutessaan sieventääkin: $r = (ua\cos(t), ua\sin(t), bt)$. Tässä on kaksi parametria, $t$ ja $u$. Piste $r$ sijaitsee parametrin $t$ määräämällä suoralla parametrin $u$ määräämässä kohdassa. Yhdessä pisteet $r$ muodostavat pinnan, jonka parametriesitys $r$:n lauseke on. Pintaa kutsutaan ruuvipinnaksi.

Ruuvipinta; kaksi kierrosta, $-2 \le u \le 2$

Lisäämällä parametrivälejä $0 \le t \le 4\pi$ ja $0 \le u \le 1$ vastaavaan ruuvipintaan askelmat, saadaan monissa linnojen torneissa käytetty jyrkkä ja hankala portaikko.

Ruuvipinnan muodostama jyrkkä portaikko

Ruuvipinnasta voidaan kuitenkin leikata myös kaksi erillistä kaistaletta valitsemalla $1 \le u \le 3$ ja  $-3 \le u \le -1$. Varustamalla nämä askelmilla saadaan kaksoisportaikko, jossa on kaksi samaan suuntaan kiertyvää nousua. Toinen saadaan toisesta kiertämällä akselin ympäri 180 astetta. Chambordin portaikko on tällainen. Jos keskelle vielä asetetaan ikkunaton tukipylväs, portaita pitkin eri puolilla liikkuvat henkilöt eivät havaitse toisiaan.

Ruuvipintojen muodostama kaksoisportaikko

YouTubesta löytyy havainnollistus, joka osoittaa, että portaikossa todella voi kulkea eri suuntiin toisiaan kohtaamatta.