torstai 26. tammikuuta 2023

Mitä matematiikan tehtävässä kysytään?

Selasin erästä sosiaalisen median matematiikkaryhmää ja havahduin postaukseen, jossa ihmeteltiin seuraavaa ongelmaa:

Tasavälisiä kokonaislukuja korotetaan tiettyyn (positiiviseen) kokonaislukupotenssiin. Syntyvästä lukujonosta lasketaan perättäisten lukujen erotukset, jolloin saadaan uusi lukujono. Tästä lasketaan uudelleen perättäisten lukujen erotukset, jolloin syntyy jälleen uusi lukujono. Näin jatketaan ja todetaan, että jossakin vaiheessa saadaan vakiolukujono, ts. kaikki luvut yhtä suuria. Seuraava askel tuottaisi nollajonon. Miksi näin käy? Mistä tässä on kysymys?

Pohdin asiaa hetken ja mieleeni tuli moniakin matemaattisia asioita, joilla on yhteys ongelmaan. Tilanteen konkretisoimiseksi alla on Mathematicalla laskettu esimerkki, jossa lähtökohtana ovat parilliset luvut korotettuina seitsemänteen potenssiin (kuva suurenee klikkaamalla).



Yleensä matematiikan tehtävissä pyydetään laskemaan jotakin tai todistamaan jotakin. Nämä ovat selväpiirteisiä tehtäviä: opiskelija tietää, mihin pyrkiä, ja opettajan on melko yksiselitteistä arvioida esimerkiksi koetehtävässä, miten pitkälle on päästy. Edellä olevan ongelman asettelu on kuitenkin avoimempi. Kysytään miksi näin käy, mistä oikeastaan on kysymys. Voitaisiin vielä kysyä, mihin muihin asioihin ongelma voisi liittyä. Tällaisena ongelma ei oikein kelpaa koetehtäväksi, mutta hyvin opettavainen se voi olla. Tutki asiaa, käytä kaikkia välineitä mitä sinulla on, mieti kaikkea mitä jostakin tämäntyyppisestä tiedät. Vastaus olisi luonnollisimmin aihetta käsittelevä essee. 

Esseen tai työskentelyä kuvaavan dokumentin kirjoittaminen on asia, johon varmasti olisi hyvä oppia jo kouluaikana. Matematiikassahan kirjoittamiseen usein opitaan vasta muutaman vuoden yliopisto-opintojen jälkeen. Siihen asti matematiikan tehtävien käsittely on kaavojen kirjoittamista allekkain, viereen ehkä jokunen sana perusteluiksi. Matematiikastakin on kuitenkin hyvä oppia kirjoittamaan normaalilla kielellä kielioppisääntöjä noudattaen ja kaavat selittävään tai kommentoivaan tekstiin upottaen. (Vaikka eivät edes oppimateriaalit useinkaan näin tee.)

Matemaattisilta taidoiltaan samatasoisten henkilöiden tuotokset voivat olla hyvin erilaisia, puhumattakaan siitä, että eri tasoilla olevat henkilöt päätyvät laajempiin tai suppeampiin esityksiin. 'Oikeaa vastausta' ei ole. Tämän takia kyse ei yleensä voi olla osaamisen arvioimisesta vaan asioiden tutkimisen oppimisesta avoimessa tilanteessa. Luontevaa on, että tällöin käytössä ovat kaikki tarjolla olevat välineet, kynän ja paperin ohella erilaiset laskenta- ja grafiikkavälineet. Kokeilevaa matematiikkaa voi harrastaa. Nettiä ja miksei tekoälyäkin voi hyödyntää. Tuotoksen täytyy kuitenkin olla itse sisäistetty ja käytettyjen lähteiden tulee ilmetä.

Tehtävän avoimuus antaa myös mahdollisuuden retkeillä oman mielenkiinnon mukaan tehtävänantoa laajemmalle, kunhan esseen aihepiiri jotenkin säilyy ehjänä. Esimerkissä voisin vaikka luopua kokonaislukuoletuksesta.

Mitä kaikkea sitten mieleeni johtui tehtävää pohtiessani? Mitä johtuu lukijan mieleen? Kommentteja voi esittää  joko blogiin tai Facebook-ympäristön blogi-ilmoituksen yhteyteen (esseetä ei toki tarvitse kirjoittaa). Omasta ajatusmaailmastani olkoon esimerkkinä seuraava, joka voisi löytyä jostakin numeerisen analyysin oppikirjasta: \[\begin{aligned}p_n(t) &= p_n(t_0 + sd) = x_0 + \binom{s}{1} \Delta^1 x_0 + \dots + \binom{s}{n} \Delta^n x_0, \\ \Delta^n x_j &= \Delta^{n-1} x_{j+1} - \Delta^{n-1} x_j, \quad \Delta^0 x_j = x_j. \end{aligned}\] Vastailen mahdollisiin kommentteihin ja ehkä palaan asiaan jossakin myöhemmässä blogikirjoituksessa.

Edellä oleva esimerkki antaa myös kuvan matemaattisen lukutaidon merkityksestä. Mitä kaavoista oikeastaan purkautuu ja mitä niistä pitäisi nähdä? Matemaattinen teksti on usein tapana kirjoittaa aika tiiviiksi (tarpeettomastikin) ja lukijalle jää pohdittavaa.

perjantai 23. joulukuuta 2022

Tekoäly, joulu ja matematiikka


Yllä oleva ei ole minun tekstiäni vaan tekoälybotin ChatGPT vastaus pyyntööni Kirjoita lämminhenkinen joulutervehdys matematiikkablogin lukijoille. Marraskuussa koemielessä julkaistu ChatGPT (https://chat.openai.com/) on saanut mediassa aika paljon huomiota viime aikoina. Rekisteröitymällä pääsee kokeilemaan.

ChatGPT tuottaa tekstiä perustuen siihen materiaaliin, jolla se on opetettu. Mitä opettaminen tarkkaan ottaen tarkoittaa, ei ole aivan yksinkertaista. Sille voi esittää kysymyksen, pyynnön tai kommentin jollakin kielellä ja se pyrkii vastaamaan samalla kielellä. Olen kokeillut suomea, englantia, saksaa, ranskaa, venäjää ja latinaa, ja kaikissa tapauksissa vastaus on tullut kohtalaisen hyvällä kielellä. Pieniä virheitä voi olla, mutta yleisesti ottaen kieli on hyvää. Pitäisin aika hämmästyttävänä suorituksena.

Sisällön suhteen tulos on heikompi. Teksti on jollakin tavoin latteaa ja saattaa sisältää vakaviakin asiavirheitä. Syötin kokeeksi kysymyksen Oliko Venäjän vallan aika onnellista Suomessa? ja tuloksena oli mitäänsanomatonta pyörittelyä ja selkeitä virhearveluita. Voisiko toisin ollakaan, ellei järjestelmää ole opetettu syöttämällä sille riittävästi aihetta käsittelevää kirjallisuutta? Suoriutuisiko se tällöin yhtä hyvin kuin keskimääräinen ihminen tai ehkä jopa paremmin?

Entä sitten matematiikka?

Kerrottakoon taustaksi lineaarialgebran tenttitehtäväni vuosikymmenien takaa: Mitä tarkoitetaan matriisin häiriöalttiudella (engl. condition number)? Eräs tentissä ollut henkilö kirjoitti aiheesta puolen sivun esseen pyörittelemällä häiriöiden vaikutusta ja alttiutta niihin sekä liittämällä tämän jotenkin matriiseihin. Itse käsitteestä hän ei tiennyt mitään. Nolla pistettä.

Tein saman kysymyksen ChatGPT:lle. Ensin englanniksi, sitten suomeksi käyttäen nimitystä häiriöalttius ja lopulta myös usein käytetyn virheellisen käännöksen ehtoluku avulla. Kaikissa tapauksissa moitteeton suoritus, joko englanniksi tai suomeksi. Olisin antanut täydet pisteet.

Onko tämä sitten hämmästyttävää? Ei. Vastauksen jälkeen esitettyyn kysymykseen How do you know this? ChatGPT vastasi:

The definition of the condition number of a matrix and its properties are well-documented in standard texts on numerical linear algebra and in research papers in the field. I have learned about the concept of the condition number of a matrix through my training as a language model, which included learning about various mathematical concepts and principles from a wide range of sources such as textbooks, research papers, and online resources.

Ja suomenkielisessä tapauksessa jatkokysymykseen Mistä tiedät, että englannin condition number on suomeksi häiriöalttius (tai häiriöluku)?:

Käännökset ovat yleensä tehty käyttäen kielten välistä sanakirjaa tai käännöstietokantaa, jotka sisältävät yleisesti käytettyjä käännöksiä eri kielten välillä. Tämän lisäksi käännöksiin voidaan käyttää apuna myös kielten asiantuntijoita, jotka ovat perehtyneet käännösten tekemiseen ja tietävät, miten eri käsitteitä voidaan kääntää eri kielillä. Näin ollen olen pystynyt selvittämään, että englannin condition number on suomeksi häiriöalttius tai häiriöluku, käyttämällä kielten välistä sanakirjaa tai käännöstietokantaa sekä tietämällä, miten eri käsitteitä voidaan kääntää eri kielillä.

Kaikki matematiikka ei kuitenkaan mene yhtä hyvin. Kysyin, miten ratkaistaan yhtälö $x^2 = x + 1$. ChatGPT muunsi sen ensin muotoon $x(x - 1) = 1$ ja sitten muotoon $x = \dfrac{1}{x - 1}$. Tästä ja alkuperäisestä yhtälöstä se päätteli juuriksi $x = 1$ ja $x = -2$, koska $1^2 = 1 + 1$ ja $-2^2 = -2 + 1$. Ei kovin vakuuttavaa. Opetus ei ilmeisesti ole sisältänyt pitkän matematiikan lukiokurssia.

Mitä tekoälystä sitten pitäisi ajatella? ChatGPT on kokeellinen järjestelmä, jolla varmasti on pitkä kehitys edessään. Mutta mihin oikeastaan olemme menossa? Jonakin päivänä koevastauksensa tai gradunsa ehkä voi tilata tekoälyltä. Pitäisikö tekoälyn käyttö kieltää? Ja onnistuisiko se? Vai pitäisikö miettiä, mitä oikeastaan pitää tietää ja miten elää maailmassa, jossa tekoäly tuottaa paljon hyvää ja paljon pahaa?

Tässä on jonkinlaisesta jatkumosta kysymys. Matematiikkaa harjoitettiin ennen kynällä ja paperilla (tai sitä ennen ehkä tikulla ja hiekalla), sitten tulivat erilaiset laskukoneet, ohjelmoitavat laitteet (laskin, tietokone, kännykkä), verkkoresurssit (kuten Google ja Wolfram Alpha). Mikä on seuraava askel?

Omasta puolestani toivotan hyvää joulua ja rauhallista uutta vuotta 2023.



perjantai 18. marraskuuta 2022

Fibonacci


Leonardo Pisalainen (noin 1170-1250) tunnetaan paremmin nimellä Fibonacci. Nimi on lyhentymä ilmaisusta filius Bonacci, Bonaccin poika, jossa Bonacci viittaa sukuun eikä isään. Hänet tiedetään lähinnä nimeään kantavasta lukujonosta, mutta Fibonacci oli paljon monipuolisempi matemaatikko. Vuonna 1202 ilmestyneessä teoksessaan Liber abaci ('laskemisen kirja') hän esittelee intialais-arabialaisen lukujärjestelmän, ts. meidän käyttämämme kymmenkantaisen paikkajärjestelmän (ykköset oikealla, kymmenet seuraavaksi vasemmalla, sitten sadat jne.), jonka käyttö alkoi tuohon aikaan vähitellen levitä Eurooppaan. Kesti kuitenkin nelisensataa vuotta, ennen kuin järjestelmä kaikkine desimaalilukumerkintöineen vakiintui. Tämän ohella Liber abaci käsittelee kaupankäynnin matematiikkaa, erilaisia matemaattisia probleemoja sekä geometriaan ja lukuteoriaan luettavia konstruktioita. Muutama muukin Fibonaccin teos on säilynyt.

Liber abacin probleemojen joukossa on myös kanien lisääntymistä koskeva tehtävä: Kanipari pannaan suljettuun aitaukseen. Ne synnyttävät joka kuukausi uuden parin. Nämä ovat kuukauden kuluttua sukukypsiä ja synnyttävät uuden parin jne. Kuinka monta paria aitauksessa on vuoden kuluttua? Fibonacci osoittaa, että kuukausittaiset määrät ovat $1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233$ ja vuoden kuluttua $377$. Yllä olevassa kuvassa Fibonaccin alkuperäinen teksti; määrät laskettu oikeassa reunassa.

Syntyvää lukujonoa on alettu kutsua Fibonaccin luvuiksi. Ne määritellään usein rekursiivisesti: \[f(0)=0,\ f(1)=1,\ f(n)=f(n-1)+f(n-2),\ n \ge 2.\] Seuraava luku on siis aina kahden edellisen luvun summa: \[0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,1597,2584,4181,6765,\dots\] Kaniparien lukumäärät alkavat luvusta $f(2)$. Kanien lisääntymisen ohella Fibonaccin luvuilla on osoittautunut olevan yhteys moneen asiaan. Tunnetuin lienee kultaisen leikkauksen suhde, jota peräkkäisten Fibonaccin lukujen suhde lähestyy. Hieman erikoisempana esimerkkinä olkoon istumajärjestysongelma: Tuolirivissä on $n$ tuolia ja siihen sijoitetaan kahdenlaisia ihmisiä, rauhallisia ja herkästi riitaantuvia, joita ei voida sijoittaa rinnakkain. Kuinka monella tavalla tuolirivi voidaan täyttää? Vastauksena on Fibonaccin luku. (Esimerkki on peräisin Ron Knottin dokumentista.) 

Hakukone löytää lisää verkkodokumentteja Fibonaccin luvuista. Lähtökohtana voi myös käyttää kanadalaisen Fibonacci Associationin sivua tai edellä mainitun Ron Knottin sivua.

Rekursiivisen määrittelyn sijaan Fibonaccin lukuja voidaan tarkastella myös eksplisiittisesti: $f(n)$ lausekkeena, joka riippuu indeksistä $n$. Rekursiokaavaa $f(n)=f(n-1)+f(n-2)$ ajatellaan tällöin ns. differenssiyhtälönä, jolle etsitään ratkaisu. Menettely on samankaltainen kuin lineaarisen vakiokertoimisen differentiaaliyhtälön ratkaiseminen: muodostetaan sopiva yrite, jossa on tuntematon symboli, ja pyritään määrittämään tämä. Osoittautuu, että yritteeksi kannattaa valita $f(n) = r^n$ ja pyrkiä määrittämään $r$. Kun yrite sijoitetaan differenssiyhtälöön, saadaan \[r^n = r^{n-1} + r^{n-2}.\] Kun tämä jaetaan potenssilla $r^{n-2}$, saadaan luvulle $r$ toisen asteen yhtälö \[r^2 = r + 1.\] Tällä on kaksi juurta: $r_1 = \frac{1}{2}(1 + \sqrt{5})$ ja $r_2 = \frac{1}{2}(1 - \sqrt{5})$. Differenssiyhtälöllä on siis ratkaisuna potenssit $r_1^n$ ja $r_2^n$. Mutta sijoittamalla differenssiyhtälöön todetaan, että sillä on ratkaisuna myös jokainen lauseke $f(n) = c_1 r_1^n + c_2 r_2^n$, missä $c_1$ ja $c_2$ ovat mitä tahansa vakioita (so. riippumattomia luvusta $n$). (Tähän viitataan sanomalla, että differenssiyhtälö on lineaarinen.)

Fibonaccin luvuilla on lisäksi ominaisuudet $f(0) = 0$, $f(1) = 1$. Nämä ovat differenssiyhtälön kannalta ns. alkuehtoja, ja niistä seuraa yhtälöt $c_1 + c_2 = 0$, $c_1r_1 + c_2r_2 = 1$. Tällöin $c_1 = -c_2 = \frac{1}{\sqrt{5}}$ ja Fibonaccin luvun lausekkeeksi saadaan \[f(n) = \frac{1}{\sqrt{5}}\biggl(\Bigl(\frac{1 + \sqrt{5}}{2}\Bigr)^n - \Bigl(\frac{1 - \sqrt{5}}{2}\Bigr)^n\biggr).\]

Luku $r_1$ on itse asiassa kultaisen leikkauksen suhde. Tässä jana jaetaan kahteen osaan, pituuksiltaan $a$ ja $b$ ($a > b$). Näiden suhde $q = a/b$ on kultaisen leikkauksen suhde, jos pidemmän osan suhde lyhyempään on sama kuin koko janan suhde pitempään, ts. \[\frac{a}{b} = \frac{a+b}{a}.\] Tämä johtaa yhtälöön $q^2 = q + 1$, jonka positiiviseksi juureksi edellä todettiin $q = r_1 = \frac{1}{2}(1 + \sqrt{5})$. Negatiivinen juuri on $r_2 = \frac{1}{2}(1 - \sqrt{5}) = -1/q$.

Eksplisiittisen lausekkeen avulla nähdään, että Fibonaccin lukujen suhde $f(n+1)/f(n)$ lähestyy kultaisen leikkauksen suhdetta, kun $n$ lähestyy ääretöntä.

Fibonaccin luvut toteuttavat koko joukon erilaisia algebrallisia identiteettejä. Kokeilemalla voi todeta, että esimerkiksi lauseke $f(n)f(m) + f(n+1)f(m+1)$ antaa aina jonkin Fibonaccin luvun. Esimerkiksi arvoilla $n=6$, $m=9$ saadaan $8 \cdot 34 + 13 \cdot 55 = 987$. Saattaa olla hieman vaikeata todistaa rekursiokaavan avulla, että näin todella on (en ainakaan nopeasti löytänyt todistusta), mutta eksplisiittisen lausekkeen avulla se on suora lasku: \begin{align*}&f(n)f(m) + f(n+1)f(m+1)\\ &= \tfrac{1}{5}(r_1^n - r_2^n)(r_1^m - r_2^m) + \tfrac{1}{5}(r_1^{n+1} - r_2^{n+1})(r_1^{m+1} - r_2^{m+1})\\ &= \tfrac{1}{5}(r_1^{n+m} + r_2^{n+m} - r_1^nr_2^m - r_2^nr_1^m + r_1^{n+m+2} + r_2^{n+m+2} - r_1^{n+1}r_2^{m+1} - r_2^{n+1}r_1^{m+1})\\ &= \tfrac{1}{5}(r_1^{n+m}(1+r_1^2) + r_2^{n+m}(1+r_2^2) - (r_1^nr_2^m + r_2^nr_1^m)(1 + r_1r_2)).\end{align*} Koska \[1+r_1^2 = \tfrac{1}{2}(5+\sqrt{5}) = \sqrt{5}r_1, \quad 1+r_2^2 = \tfrac{1}{2}(5-\sqrt{5}) = -\sqrt{5}r_2, \quad 1+r_1r_2 = 0,\] tämä saadaan muotoon \[\frac{1}{\sqrt{5}}\left(r_1^{n+m+1} - r_2^{n+m+1}\right) = f(n+m+1).\] Esimerkissä on siten $987 = f(6+9+1) = f(16)$.

Jos tulos on tiedossa tai kokeilujen perusteella arvattu, niin todistamisessa tarvittava mekaaninen lasku sujuu vaivatta symbolisella laskentaohjelmalla (alla käytetty Mathematicaa ja GeoGebraa):



Fibonaccin luvuista ja niitä koskevista identiteeteistä on laaja artikkeli Wolfram MathWorld -sivustossa.


perjantai 21. lokakuuta 2022

Ei geometrikko viivoitinta tarvitse



Geometrisissa konstruktioissa tai piirustuksissa sallitut työkalut ovat olleet Eukleideen ajoista lähtien viivoitin ja harppi. Viivoittimella voidaan piirtää suora, kun kaksi sen pistettä tunnetaan. Harpilla voidaan piirtää ympyrä, kun sen keskipiste ja yksi kehäpiste tunnetaan. Suorien ja ympyröiden leikkauspisteet voivat olla pohjana uusille piirroksille, so. uudelle viivoittimen tai harpin käytölle. Muunlainen käyttö, kuten janan pituuden siirtäminen uuteen paikkaan harpin kärkien välissä tai merkintöjen tekeminen viivoittimen reunaan ei ole sallittua. Janan siirto harpin kärkien välissä voidaan kuitenkin sallia, koska se voidaan tehdä myös edellä mainituilla perusoperaatioilla, tosin hieman pidemmällä konstruktiolla.

Viivoitinkin on kuitenkin tarpeeton työkalu, kun sovitaan, että suora tunnetaan, kun kaksi sen pistettä tunnetaan, eikä suoraa pyritä varsinaisesti piirtämään. Kaikki geometriassa tarvittavat konstruktiot voidaan nimittäin tehdä yksinomaan harppia käyttäen. Esimerkkinä ympyrän piirtäminen annettu piste $K$ keskipisteenä ja annettu jana $AB$ säteenä siirtämättä sädettä harpin kärkien välissä:

$K$-keskisen ympyrän piirtäminen säteenä jana $AB$
siirtämättä sädettä harpin kärkien välissä;
piirtämisjärjestys: vihreä, sininen, punainen.

Harpin riittävyys perustuu käänteissäteiseen muunnokseen eli ympyräpeilaukseen. Tässä tasoon asetetaan kiinteä ympyrä (keskipisteenä $K$, säteenä $r$) ja mielivaltaisen pisteen $P$ kuvapiste $P'$ sijaitsee säteellä $KP$ siten, että etäisyyksille pätee \[|KP||KP'| = r^2.\] Poikkeuksena on piste $K$, jolla ei kuvapistettä ole. Puute voidaan poistaa liittämällä tasoon yksikäsitteinen äärettömän kaukainen piste (johon voidaan ajatella päädyttävän siirtymällä äärettömän kauaksi mihin tahansa suuntaan) ja asettamalla tämä $K$:n kuvaksi. Kuvapiste $P'$ voidaan määrittää yksinomaan harppia käyttäen:
Kuvapisteen $P'$ määritys käänteissäteisessä muunnoksessa; piirtämisjärjestys
vihreä, sininen, punainen. Konstruktion pätevyyden voi osoittaa katkoviivojen
muodostamien yhdenmuotoisten kolmioiden avulla.

Käänteissäteinen muunnos kuvaa yleensä ympyrän ympyräksi. Poikkeuksena ovat pisteen $K$ kautta kulkevat ympyrät, jotka kuvautuvat suoriksi. Suorat muunnos kuvaa pisteen $K$ kautta kulkeviksi ympyröiksi, poikkeuksena pisteen $K$ kautta kulkevat suorat, jotka kuvautuvat itselleen. Suoraa voidaankin ajatelle ympyränä, jonka säde on ääretön. Muunnoksen kiinteän ympyrän pisteet ovat omia kuviaan.

Käänteissäteisen muunnoksen käänteiskuvaus on se itse, ts. kuvapisteen kuvapiste on alkuperäinen piste. Tähän viitataan sanomalla, että käänteissäteinen muunnos on involutorinen. Piste $P$ ja sen kuvapiste $P'$ ovat siten symmetrisessä asemassa ja niitä kutsutaan peilipisteiksi muunnoksen kiinteän ympyrän suhteen.

GeoGebra-ohjelmisto tarjoaa työkalun ympyräpeilausten tekemiseen: reflect in circle / peilaus ympyrän suhteen. Esimerkkinä muutamien kuvioiden peilikuvat:

Kuvio ja sen peilikuva käänteissäteisessä muunnoksessa,
kukin pari omalla värillään.

Käänteissäteisessä muunnoksessa mikä tahansa suorista ja ympyröistä muodostuva geometrinen kuvio voidaan asettaa siten, että sen suorat ja ympyrät ja näiden osat kuvautuvat (peilautuvat) ympyröiksi tai ympyrän kaariksi. Kuva voidaan määrittää yksinomaan harpilla. Geometrisissa konstruktioissa tarvittavat perusoperaatiot (leikkauspisteiden määritys, ympyrän piirtäminen keskipisteen ja kehäpisteen avulla, kolmen annetun pisteen kautta kulkevan ympyrän piirtäminen) kohdistetaan tällöin vain ympyräkaarten muodostamaan kuvioon. Voidaan osoittaa, että nämä voidaan tehdä yksinomaan harpilla. Lopuksi konstruoinnin tulokset peilataan takaisin.

Alla on esimerkkinä suorien $AB$ ja $CD$ leikkauspisteen määritys, kun kumpikin suora on annettu kahden pisteen avulla. Pisteet peilataan ensin kiinteässä $K$-keskisessä ympyrässä, jolloin saadaan pisteet $A'$, $B'$, $C'$ ja $D'$. Edellä olevan esimerkin mukaisesti tämä voidaan tehdä yksinomaan harpilla. Suorien kuvat peilauksessa ovat keskipisteen $K$ kulkevia ympyröitä, joista kumpikin siis määräytyy kolmen pisteen avulla: $K$, $A'$, $B'$ ja $K$, $C'$, $D'$. Näiden konstruoiminen onnistuu yksinomaan harpilla (vaikkakaan ei aivan lyhyesti). Peilaamalla ympyröiden leikkauspiste $X'$ saadaan etsitty suorien leikkauspiste $X$.

Harppikonstruktio: suorien $AB$ ja $CD$ leikkauspiste;
peilausympyrä musta, piirtämisjärjestys: vihreä, sininen, punainen.
Suorat katkoviivalla.

Menettelyn todistus (ja monia harppikonstruktioita) on esitetty itävaltalaisen August Adlerin kirjassa Theorie der geometrischen Konstruktionen vuodelta 1906 (löytyy verkosta). Harpin riittävyys ei sinänsä ollut uutta, mutta todistusta käänteissäteistä muunnosta käyttäen ei ollut aiemmin esitetty. Tarvittavat harppikonstruktiot oli esittänyt italialainen Lorenzo Mascheroni vuonna 1797 teoksessaan Geometria del compasso ja tätäkin aikaisemmin tanskalainen Georg Mohr tanskaksi ja hollanniksi ilmestyneessä teoksessaan Euclides danicus vuonna 1672 (kuva artikkelin alussa). Mohrin teos jäi kuitenkin huomiotta ehkä kielen takia, latinahan tuohon aikaan olisi ollut luontevampi valinta. Suomeksi harppikonstruktioita on käsitelty Erkki Rosenbergin kirjassa Geometria (Limes 1983).


Euclides danicuksen tiivis esitys: ympyrä kolmen pisteen kautta.

Lopuksi lukijalle pohdittavaa: Jos $A$ ja $B$ ovat peilipisteitä ympyrän $c$ suhteen ja sekä ympyrä että pisteet kuvataan toiseen ympyrään liittyvällä käänteissäteisellä muunnoksella, niin ovatko kuvapisteet peilipisteitä kuvaympyrän suhteen? Työkaluksi sopii GeoGebra.

-----

Jonkin matematiikan alan hyödyllisyyttä tai hyödyttömyyttä arvioidessa täytyy olla hyvin varovainen. Hyvä esimerkki on lukuteoria, jota on pidetty sovellusten kannalta tarpeettomana puhtaana matematiikkana, mutta johon tietoliikenteen salausalgoritmit nykyään perustuvat. Geometriset harppikonstruktiot voisivat sen sijaan olla hyvä kandidaatti hyödyttömäksi, mutta ehkä kuitenkin jollakin tavoin viehättäväksi matematiikaksi. Kommenteissa voi esittää vastaväitteitä tai muita näkökohtia.


tiistai 27. syyskuuta 2022

Geometrian probleema ja sen moderni versio


Vanha geometrian tehtävä saattaa antaa aihetta monenlaisiin pohdiskeluihin, kun avuksi otetaan laskentaohjelmat.

Annettuna on yllä olevan kuvion mukainen tilanne, jossa $\alpha = 60^\circ$ ja $\beta = 45^\circ$. Kysytään kulman $\gamma$ suuruutta. Tämä on tyypillinen tehtävä omalta kouluajaltani. Vaikeutena on liikkeelle lähtö, sopivan idean — ja apupiirroksen — löytäminen. Jos idea löytyy, tehtävä on melko helppo, ellei, ei synny juuri mitään.

Piirretään pisteestä $A$ normaali janalle $BD$ ja yhdistetään sen kantapiste pisteeseen $C$. Tällöin syntyy ns. muistikolmioita ja tasakylkisiä kolmiota. Kulmia päästään laskemaan vaiheittain eikä tarvita muuta tietoa kuin kolmion kulmien summa. Tuloksena on $\gamma = 75^\circ$. Kuva alla.

Mutta miksi tyytyä vain kulmien arvoihin $\alpha = 60^\circ$, $\beta = 45^\circ$? Voihan $\alpha$ olla mitä tahansa väliltä $]0^\circ,180^\circ[$ ja $\beta$ jotakin $\alpha$:aa pienempää.

Sijoitetaan tilanne koordinaatistoon, piste $A$ origoon ja pisteet $B$ ja $C$ x-akselille. Otetaan tuntemattomiksi kulman $\gamma$ ohella pisteen $D$ koordinaatit $(x,y)$. Jos $\vec{i}$ on tavanomainen yksikkövektori, skalaaritulon avulla saadaan ehdot \[ \cos(\alpha) = \frac{-\vec{i}\cdot\vec{BD}}{|\vec{BD}|}, \quad \cos(\beta) = \frac{-\vec{i}\cdot\vec{CD}}{|\vec{CD}|}, \] jotka määrittävät tilanteen. Nämä tuottavat yhtälöt \[ \cos(\alpha) = \frac{2-x}{\sqrt{(2-x)^2 + y^2}}, \quad \cos(\beta) = \frac{3-x}{\sqrt{(3-x)^2 + y^2}}, \] joista voidaan ratkaista $x$ ja $y$. Ratkaiseminen käsin voi olla työlästä, mutta (ainakin hyvä) symbolisen laskennan ohjelma suoriutuu. Kokeilin Mathematicalla ja GeoGebralla. Kumpikin antaa neljä ratkaisua, GeoGebra tavattoman paljon hankalammat lausekkeet. Tuloksiin on syytä suhtautua rauhallisesti. Ei laskentaohjelma tee sitä, mitä käyttäjä haluaisi, vaan mitä se on ohjelmoitu tekemään, ja tulokset voivat olla mutkikkaita eivätkä aina edes oikeita. Ohjelma pyrkii ottamaan huomioon kaikki tapaukset, mutta ei välttämättä onnistu.

Sijoittamalla Mathematicassa tulokset takaisin yhtälöihin nähdään, että vain kaksi ratkaisuista toteuttaa yhtälöt. Kaksi muuta on ilmeisesti syntynyt neliöjuurien käsittelyn myötä. Vastaavasta sijoittamisesta ei ainakaan käyttämäni GeoGebran versio suoriutunut, mutta numeerisen tarkastelun perusteella tässäkin on kaksi oikeaa ja kaksi väärää ratkaisua. Oikeissa ratkaisuissa x-koordinaatit ovat samat, y-koordinaatit vastalukuja, joten toinen tarkoittaa vain kuvion peilaamista x-akselin alapuolelle.

Mathematican tapauksessa tulos on \[ x = \tfrac{1}{2}(5 - \csc(\alpha - \beta)\sin(\alpha + \beta)), \quad y = \csc(\alpha - \beta)\sin(\alpha)\sin(\beta). \] Suomalaiselle nämä saattavat näyttää hieman oudoilta $\csc$-funktion takia. Tämä on kosekantti, yksinkertaisesti sinin käänteisarvo. Vastaavasti $\sec$, sekantti on kosinin käänteisarvo. Monissa maissa ja sen seurauksena laskentaohjelmissa usein käytetään näitä.

Kun pisteen $D$ koordinaattien lausekkeet ovat käytettävissä, voidaan laskea kaikenlaista. Kulma $\gamma$ saadaan kaksiargumenttisella $\arctan(x,y)$-funktiolla, joka antaa pisteen $(x,y)$ napakulman ja joka on useimmissa ohjelmissa käytettävissä.

Sijoittamalla ratkaisuun esimerkiksi $\beta = \alpha - 15^\circ$ voidaan etsiä ne pisteet $D$, jotka vastaavat kulmien $\alpha$ ja $\beta$ 15 asteen erotusta. Pisteitä voi piirtää ohjelmasilmukalla tai parametrikäyränä, jota useimmat ohjelmistot tukevat. Alkeisgeometriansa hallitsevaa henkilöä ei yllätä, että kyseessä on ympyränkaari. Laskentaohjelma saattaa parametriesityksen perusteella kyetä löytämään myös ympyrälle yhtälön: $x^2 + y^2 - 5x - (2 + \sqrt{3})y + 6 = 0$. Kuva alla, pisteen $D$ mahdollinen sijainti punaisella.

Pienillä muutoksilla voidaan tutkia erilaisia tehtävän variaatioita, mikä usein johtaa algoritmiseen ajatteluun ja kirjoittamaan muutaman rivin ohjelmakoodeja. Edellytyksenä on, että laskentaohjelma tukee ainakin pienimuotoista ohjelmointia. Mathematicassa sujuu hyvin, GeoGebrassa on hankalaa. Mikä esimerkiksi olisi kulman $\gamma$ maksimiarvo, kun kulmien $\alpha$ ja $\beta$ erotus on vakio? Miten maksimiarvo riippuu erotuksen suuruudesta? Sopivatko nämä geometriseen havaintoon?



Ylhäällä: Pisteen $D$ sijainti tapauksessa $\beta = \alpha/3$. Alhaalla vasemmalla: Kulma $\gamma$ kulman $\alpha$ funktiona, kun $\beta = \alpha - 15^\circ$. Alhaalla oikealla: Kulma $\gamma$ kulmien $\alpha$ ja $\beta$ funktiona sekä edellä mainittu käyrä, joka sijaitsee pinnalla.

Erilaisen lähestymistavan tehtävään tarjoavat dynaamisen geometrian ohjelmat, joista GeoGebra lienee tunnetuin. Näissä tarkasteltava kuvio konstruoidaan ohjelman tarjoamien geometristen operaatioiden avulla piirtämällä, jolloin ohjelma laskee pisteiden koodinaatit ja suorien yhtälöt, usein myös perustyyppisten käyrien yhtälöt. Jälkikäteen kuviota voidaan muunnella pisteitä siirtämällä. Urakäyriä (locus) saadaan myös piirretyksi. Symbolisiin lausekkeisiin tai ns. tarkkoihin arvoihin (joita ehkä olisi parempi kutsua symbolisiksi arvoiksi, onhan kymmendesimaalinen likiarvokin jo kohtalaisen tarkka) ei yleensä päästä käsiksi ilman symbolista laskentaa.

maanantai 15. elokuuta 2022

Netti, Pythagoras ja CAS

(CAS = Computer Algebra System, symbolinen laskentaohjelma)

Olen aina silloin tällöin pannut selaimen kirjanmerkeiksi matemaattisesti kiinnostavia verkkosivuja. Usein nämä ovat enemmän tai vähemmän irrallisia yhteen asiaan keskittyviä tekstejä tai havainnollistuksia. Toki löytyy myös isompia kokonaisuuksia käsitteleviä dokumentteja ja sähköisessä muodossa olevia oppikirjojakin.

Lyhyet tekstit ja havainnollistukset yleensä edellyttävät jonkinlaisia perustietoja asiasta, mutta saattavat tämän jälkeen avata uusia näköaloja. Ovat hyödyllisiä ja hauskoja vaikkapa opettajalle tai oppikirjantekijälle.

Alexander Bogomolnyn luoma sivusto Interactive Mathematics Miscellany and Puzzles, tuttavallisemmin Cut the Knot, tarjoaa paljon muun ohella katsauksen Pythagoraan lauseeseen: 122 erilaista todistusta (https://www.cut-the-knot.org/pythagoras/). Joukossa tietenkin tavanomaiset oppikirjoissa esiintyvät, mutta myös paljon muuta. Ehkä kiintoisimmasta päästä on epäsuora todistus:

Lähtökohtana on tavanomainen suorakulmaisen kolmion jako kahteen yhdenmuotoiseen suorakulmaiseen kolmioon alla olevan kuvan mukaisesti.


Pythagoraan väittämän vastaoletus on $a^2 + b^2 \neq c^2$, esimerkiksi siis $a^2 + b^2 < c^2$.

Ison kolmion ja vasemmanpuolisen osakolmion yhdenmuotoisuuden perusteella on $a = sx$, $b = sh$ ja $c = sa$, missä $s$ on verrannollisuuskerroin. Vastaoletuksesta seuraa tällöin $s^2 x^2 + s^2 h^2 < s^2 a^2$ ja siis $x^2 + h^2 < a^2$. Oikeanpuoliselle osakolmiolle pätee vastaavasti $h^2 + y^2 < b^2$. Yhdenmuotoisuuden perusteella on myös $y/h = h/x$ eli $h^2 = xy$. Nyt voidaan arvioida seuraavasti: \[ a^2 + b^2 > (x^2 + h^2) + (h^2 + y^2) = x^2 + y^2 + 2h^2 = x^2 + y^2 + 2xy = (x + y)^2 = c^2. \] Siis $a^2 + b^2 > c^2$, mikä on ristiriidassa lähtökohtana olevan vastaoletuksen kanssa.

Jos olisi  $a^2 + b^2 > c^2$, päädyttäisiin samalla tavoin ristiriitaan $a^2 + b^2 < c^2$. Ainoaksi mahdollisuudeksi siis jää $a^2 + b^2 = c^2$.

Uudet näkökulmat herättävät usein pohtimaan asiaa enemmänkin. Edellä oleva epäsuora todistus viittaa minusta mahdollisuuteen todistaa Pythagoraan lause myös algebrallisesti yhdenmuotoisuuksiin perustuen. Kolmioiden yhdenmuotoisuuksista saadaan ehdot \[a = sx, b = sh, c = sa, a = th, b = ty, c = tb,\] missä $s$ ja $t$ ovat verrannollisuuskertoimia. Kun mukaan liitetään hypotenuusan paloitteluehto $x + y = c$, suorakulmainen kolmio on algebrallisesti karakterisoitu. Seuraako tästä sitten ehto $a^2 + b^2 = c^2$? Voidaanko yhtälöryhmästä eliminoida $x$, $y$, $h$, $s$ ja $t$, jolloin ehkä jäisi jäljelle jotakin symboleja $a$, $b$ ja $c$ koskevaa?

Eliminointi onnistuu käsinlaskulla helposti (voisi sopia ylioppilastehtäväksi), mutta usein CAS-ohjelmistoista löytyy myös valmis eliminointityökalu. Kuvassa on Mathematican suoritus:


Ehdoista siis seuraa Pythagoraan väittämä.

Pythagoraan lause pätee myös käänteisesti: Jos kolmion sivuille pätee $a^2 + b^2 = c^2$, niin kolmio on suorakulmainen. Voitaisiinko tämäkin todistaa jotenkin algebrallisesti?


Olkoon oheisen kuvion mukaisesti $D$ jokin piste sivulla $AB$, jonka pituus on $c$. Onko mahdollista valita $D$ siten, että kolmiot $BDC$, $CDA$ ja $BCA$ ovat yhdenmuotoiset, jos ehto $a^2 + b^2 = c^2$ on voimassa? Toisin sanoen: Onko yhtälöryhmällä \[a = sx, b = sh, c = sa, a = th, b = ty, c = tb, x + y = c\] ehdon voimassa ollessa ratkaisua, kun tuntemattomia ovat verrannollisuuskertoimet $s$ ja $t$ sekä $x$, $y$ ja $h$? Käsinlaskukin sujuu, mutta CAS-ohjelmistosta saattaa löytyä valmis työkalu:


Ratkaisu todellakin löytyy. (Kuvassa Mathematica ei anna heti sievintä muotoa, vaan tarvitaan erillinen sievennyskomento, jossa uudelleen ilmoitetaan oletuksena oleva ehto.) Jos piste $D$ valitaan tämän mukaisesti, ovat kolmiot $BDC$, $CDA$ ja $BCA$ yhdenmuotoiset. Vastinkulmina $BDC$, $CDA$ ja $BCA$ ovat yhtä suuret ja niiden on silloin oltava suoria kulmia. Kolmio $ABC$ on siis suorakulmainen.

Lukija saattaa kysyä, eikö edellä mainitulla yhtälöryhmällä sitten ole ratkaisua, jos Pythagoraan ehto ei ole voimassa. Geometrinen intuitio ehkä sanoisi, että ei ole. Näin onkin (nollaratkaisua lukuunottamatta) ja myös polynomialgebralla asia voidaan osoittaa. CAS-ohjelmista saattaa löytyä sopiva työkalukin, Mathematicalla komento Reduce.

tiistai 31. toukokuuta 2022

Vääriä todistuksia

Päättelyvirheiden etsiminen matemaattisista todistuksista on usein hyödyllistä matematiikan opiskelijalle. Esitän kolme todistusta ilmiselvästi virheellisille väitteille. Lukijan tehtäväksi jääköön etsiä virhe. Monille tässä ei varmaankaan ole mitään ongelmaa, mutta toivon, että jutun juonta ei paljasteta kommenteissa ainakaan ihan heti.

Lause 1. Kaikki ympyrät ovat samasäteisiä.




Todistus. Oheisessa kuviossa on kaksi ympyrää, joiden keskipisteet ovat $A$ ja $B$. Jana $CD$ on ympyröiden yhteinen tangentti. Janoille $AB$ ja $CD$ asetetaan keskinormaalit. Nämä leikkaavat toisensa pisteessä $E$. Keskinormaaliominaisuuden takia janat $AE$ ja $BE$ ovat yhtä pitkät; sama koskee janoja $CE$ ja $DE$. Keskinormaaliominaisuudesta seuraa edelleen, että kulmat $ECD$ ja $EDC$ ovat yhtä suuret, jolloin myös kulmat $ACE$ ja $BDE$ ovat näiden komplementtikulmina yhtä suuret. Tällöin kolmiot $AEC$ ja $BED$ ovat yhtenevät. Vastinsivuina ympyröiden säteet $AC$ ja $BD$ ovat yhtä pitkät. QED

Lause 2. Kaikki positiiviset kokonaisluvut ovat yhtä suuria.

Todistus. Lause on suora seuraus apulauseesta: Jos $a$ ja $b$ ovat positiivisia kokonaislukuja, joille pätee $a \leq n$ ja $b \leq n$, niin $a = b$. Tämä voidaan todistaa induktiolla $n$:n suhteen.

Jos $n = 1$, ainoa mahdollisuus on, että $a = b = 1$, ja luvut siis ovat yhtä suuret. Induktion alku on siis kunnossa.

Induktioaskeleessa oletetaan, että lause pätee arvolla $n$, ja osoitetaan, että tällöin se pätee myös arvolla $n+1$. Olkoon siis $a \leq n+1$ ja $b \leq n+1$. Tällöin on $a-1 \leq n$ ja $b-1 \leq n$, jolloin induktio-oletuksen mukaan $a-1 = b-1$. Tästä seuraa $a = b$ ja induktioaskel on osoitettu. QED

Lause 3. Funktiolla $\sin(x)/x$ ei ole raja-arvoa, kun $x \to \infty$.

Todistus. Lausekkeessa \[\frac{x - \sin(x)}{x}\] osoittaja $x - \sin(x)$ lähestyy ääretöntä, kun $x \to \infty$. Sama koskee nimittäjää $x$. Tällöin lauseke saa rajaprosessissa $x \to \infty$ muodon $\infty/\infty$ ja voidaan soveltaa l'Hospitalin lausetta. Derivoimalla osoittaja ja nimittäjä saadaan \[\frac{1 - \cos(x)}{1} = 1 - \cos(x),\] joka heilahtelee välillä $[0,2]$ eikä sillä siis ole raja-arvoa. Tällöin ei myöskään lausekkeella \[\frac{x - \sin(x)}{x} = 1 - \frac{\sin(x)}{x}\] ole raja-arvoa, mistä seuraa väitös. QED

Funktion $\sin(x)/x$ kuvaaja