tiistai 13. huhtikuuta 2021

Nelikulmioiden runsaudensarvi

Kävin kouluni pääosin 50-luvulla, jolloin kuoluvuosien 7-12 matematiikanopetuksesta suuri osa käsitteli geometriaa Eukleideen tapaan: todistettiin tasokuvioita koskevia teoreemoja eli lauseita, konstruoitiin kuvioita harpilla ja viivoittimella. Jonkin verran käytettiin myös algebraa geometrisiin ongelmiin. Tästä on nykyisessä koulukurssissa jäljellä aika vähän. En oikeastaan pidä sitä pahana. Kuvioiden ominaisuudet eivät ehkä kovin tärkeitä ole, deduktiivinen päättely saattaisi ollakin.


Kuvioiden geometrisissa ominaisuuksissa ja niiden todistamisessa on kuitenkin jotakin viehättävää, ainakin Eukleideensa lukeneelle. Olen selaillut AMS:n ja MAA:n (American Mathematical Society, Mathematical Association of America) yhdessä julkaisemaa Claudi Alsinan ja Roger B. Nelsenin teosta A Cornucopia of Quadrilaterals, suomeksi 'nelikulmioiden runsaudensarvi'. Ei varmaankaan aineistoa koulukurssille eikä siis tiukasti ottaen tarpeellista. Muutama hyvä idea ylioppilaskokeeseen voisi kyllä löytyä.  Pikemminkin kyseessä on palanen geometrista kulttuuria, hämmästyttävä määrä yksinkertaisten kuvioiden ominaisuuksia ja säännönmukaisuuksia, todistamisen ja sen tarpeellisuuden idea.

Kirjassa on yli 300 sivua, aiheena yksinomaan nelikulmiot, kaikin tavoin. Ominaisuuksia ja niiden todistuksia, selkeät kuvat, haasteiksi (challenge) kutsuttuja helpompia ja vaikeampia harjoitustehtäviä, niiden ratkaisut, hakemisto. Lopussa on varsin laaja kirjallisuusluettelo, joten tietojaan voi helposti syventääkin. (Olisiko tässä aineksia opettajakoulutukseen?)

Lukijan alkaa helposti tehdä mieli kokeilla: Onko se nyt todella noin, jos muunnan kuviota?  Entä jos teksinkin hieman toisin? Voisinko todistaa jotakin vastaavaa samaan tapaan?  Kouluaikanani kokeilut olisivat olleet hankalia: piirrettävä melkein sama kuvio moneen kertaan.  Nykyään on helpompaa: tällaisiin kokeiluihin GeoGebra (tai vastaava) on omiaan.

Muutama esimerkki:

Nelikulmion massakeskipisteen hakeminen

Mielivaltaisen nelikulmion massakeskipiste voidaan hakea ajattelemalla, että nelikulmion kärjissä on identtiset massat. Jokaisen sivun massakeskipiste on tällöin sen keskipiste. Kun nämä yhdistetään perättäin, syntyy suunnikas (miksi?). Tätä kutsutaan Varignonin suunnikkaaksi ranskalaisen matemaatikon Pierre Varignonin (1654–1722) mukaan. Suunnikkaan kahden vastakkaisen kärjen massakeskipiste on niiden yhdysjanan, suunnikkaan lävistäjän keskipiste. Koska kummankin lävistäjän keskipisteet yhtyvät (miksi?), on saatu Varignonin suunnikkaan massakeskipiste. Tämä on myös alkuperäisen nelikulmion massakeskipiste.

Toisaalta nelikulmio voidaan ajatella homogeeniseksi levyksi. Kun se jaetaan (toisella) lävistäjällä kahdeksi kolmioksi, voidaan kummallekin kolmiolle löytää massakeskipiste keskijanojen leikkauspisteestä. Nelikulmion massakeskipiste sijaitsee näiden yhdysjanalla.  Tekemällä vastaava konstruktio toisen lävistäjän suhteen saadaan toinen yhdysjana.  Massakeskipiste on näiden yhdysjanojen leikkauspiste.

Lukija jää ehkä miettimään, ovatko saadut massakeskipisteet samat. Kokeilemaan GeoGebralla ja myönteisessä tapauksessa todistamaan!


Sinin ja kosinin yhteenlaskukaavat (kirjan kuvio 6.4.2)

Toinen esimerkki trigonometriasta:  Kuvioilla voi todistaakin kaikenlaista, vaikkapa sinin ja cosinin yhteenlaskukaavat \begin{align*} \sin(x+y) &= \sin x \cos y + \cos x \sin y, \\ \cos(x+y) &= \cos x \cos y - \sin x \sin y \end{align*} rakentamalla sopivista kolmioista suorakulmio sopivalla tavalla. (Samaa ideaa käytti myös K. Väisälä 50-luvulla trigonometrian kirjassaan, mutta hän ei pakannut kolmioitaan suorakulmion sisään.)

Miten tällaisia muualla maailmassa ilmestyneitä kirjoja sitten saa käsiinsä? Painetun kirjan tilaamisesta sen saapumiseen saattaa kulua viikkoja, varsinkin korona-aikana pikemminkin kuukausia. Onneksi kuitenkin sähköisten kirjojen tarjonta on lisääntynyt. Sain tämän kirjan jäsenyyteni perusteella ilmaiseksi ja ostopäätöksestä kirjan tallentumiseen koneeni levylle meni muutama minuutti. Luottokortilla maksaminen tuskin prosessia merkittävästi hidastaa. Sähköisissä kirjoissa on muitakin hyviä puolia: eivät täytä kirjahyllyä, hävittäminen on helppoa.

Tarjonnan seuraaminen kyllä teettää hieman töitä eikä esitteen tai mainoksen perusteella aina ole helppoa päätellä kannattaako ostaa. Olisiko vaikka MAOLilla resursseja seurata tarjontaa ja nostaa kiinnostavia teoksia esiin?

Kieli, ainakaan englanti, ei varmaan ole ylivoimainen este. Matematiikassa tarvittava sanasto on aika suppea. Suomeksi kääntäminen voisi tietenkin olla hienoa, mutta vaikka se levikkiä lisäisikin, kaupallista kannattavuutta tuskin syntyisi.

maanantai 5. huhtikuuta 2021

Pallopythagoras

Pallokolmio

Pallokolmio on pallopinnalla oleva kolmio, jonka sivut ovat jonkin isoympyrän kaaria. Kolmion kärkipisteessä leikkaa kaksi isoympyrää, joille voidaan leikkauspisteeseen asettaa tangentit. Näiden välinen kulma on pallokolmion kulma. Kulma voi olla suora, jolloin kyseessä on suorakulmainen pallokolmio. Itse asiassa pallokolmiossa voi olla kaksi tai jopa kolme suoraa kulmaa.

Pallokolmio, jossa on kolme suoraa kulmaa

Pallokolmioita voidaan usein käsitellä vektorialgebran avulla. Olkoot $\vec{A}$, $\vec{B}$ ja $\vec{C}$ vektoreita, jotka osoittavat pallon keskipisteestä $K$ pallokolmion kärkiin $A$, $B$ ja $C$. Vektoreiden $\vec{A}$ ja $\vec{B}$ välinen kulma olkoon $\gamma$, vektoreiden $\vec{B}$ ja $\vec{C}$ välinen kulma olkoon $\alpha$, vastaavasti vektoreiden $\vec{C}$ ja $\vec{A}$ välinen kulma $\beta$. Nämä ilmaistaan radiaaneissa.  Tällöin kolmion kärjen $A$ vastaisen sivun pituus on $a = r\alpha$, kärkien $B$ ja $C$ vastaisten sivujen pituudet $b = r\beta$ ja $c = r\gamma$, missä $r$ on pallon säde.

Pallon keskipisteestä kolmion kärkiin osoittavat vektorit

Skalaaritulon määritelmän (tai perusominaisuuden, miten halutaankin) mukaan on $\vec{A}\cdot\vec{B} = r^2\cos\gamma$, $\vec{B}\cdot\vec{C} = r^2\cos\alpha$, $\vec{C}\cdot\vec{A} = r^2\cos\beta$.

Jos pisteessä $C$ on suora kulma, ovat tasot $KAC$ ja $KBC$ kohtisuorat. Tällöin niiden normaalivektorit (ristitulovektorit) $\vec{A}\times\vec{C}$ ja $\vec{B}\times\vec{C}$ ovat myös kohtisuorat, ts. niiden skalaaritulo on $= 0$. Skalaaritulon lauseke saa vektorialgebraa käyttäen muodon \begin{align*} &(\vec{A}\times\vec{C}) \cdot (\vec{B}\times\vec{C}) = (\vec{A}\times\vec{C}) \times \vec{B} \cdot \vec{C}) = \left((\vec{A}\cdot\vec{B})\vec{C} - (\vec{B}\cdot\vec{C})\vec{A}\right) \cdot \vec{C} \\ &= r^2(\vec{A}\cdot\vec{B}) - (\vec{B}\cdot\vec{C})(\vec{A}\cdot\vec{C}) = r^4\cos\gamma - r^4\cos\alpha\cos\beta.\end{align*} Koska tämä on $= 0$, saadaan \[ \cos\gamma = \cos\alpha\cos\beta.\] Tätä kutsutaan pallogeometrian Pythagoraan lauseeksi.

Yhteys tavalliseen Pythagoraan lauseeseen nähdään lausumalla kulmat kolmion sivujen pituuksien avulla: \[ \cos(c/r) = \cos(a/r)\cos(b/r).  \] Jos sivujen pituudet pidetään vakioina ja annetaan pallon säteen kasvaa, kulmat lähestyvät nollaa ja kolmio lähestyy tasokolmiota. Pienillä argumentin arvoilla kosini voidaan korvata toisen asteen Taylorin polynomilla: \[ \cos x \approx 1 - \frac{x^2}{2}.  \] Tällöin yhtälö saa muodon \[ 1 - \frac{c^2}{2r^2} \approx \left(1 - \frac{a^2}{2r^2}\right)\left(1 - \frac{b^2}{2r^2}\right) \] tai \[ \frac{c^2}{2r^2} \approx \frac{a^2}{2r^2} + \frac{b^2}{2r^2}, \] kun lisäksi termi $\dfrac{a^2b^2}{4r^4}$ jätetään huomiotta pienenä neljännen asteen terminä. Tämä sieveneekin tavalliseksi Pythagoraan yhtälöksi $c^2 \approx a^2 + b^2$.


maanantai 25. tammikuuta 2021

Miksi $1+1$ on $2$?

En oikein tiedä, miten peruskoulussa opetetaan, että $1+1$ on $2$. Ehkä tämä ei olekaan matemaattinen ongelma vaan kielellinen. Jos pöydällä on omena — siis yksi omena — ja siihen tuodaan toinenkin omena — siis yksi omena lisää — niin on tapana sanoa, että pöydällä kaksi omenaa. Ei tässä ole kysymys matematiikasta vaan kielenkäytöstä.

Aksiomaattisiin määrittelyihin viehättynyt matemaatikko kuitenkin ajattelee, että kyseessä on laskutoimituksen määrittely luonnollisten lukujen joukossa ja luonnolliset luvut ovat joukko $\mathbb{N}$, joka karakterisoidaan Peanon aksioomilla. Tältä pohjalta pitäisi siis olla osoitettavissa, että $1+1 = 2$.

Italialainen matemaatikko Giuseppe Peano (1858-1932) julkaisi nimeään kantavat aksioomat vuonna 1889 latinaksi kirjoitetussa teoksessaan Arithmetices principia, nova methodo exposita. Julkaisupaikka on Augusta Taurinorum, italiaksi Torino.


Joukko $\mathbb{N}$ määritellään luonnollisten lukujen joukoksi, jos se toteuttaa seuraavat aksioomat:

  1. $0 \in \mathbb{N}$, ts. joukossa on luku, jolle annetaan nimeksi $0$.
  2. Jokaisella luonnollisella luvulla $n \in \mathbb{N}$ on seuraaja $s(n) \in \mathbb{N}$.
  3. $0$ ei ole minkään luonnollisen luvun seuraaja.
  4. Jos $s(n) = s(m)$, niin $n = m$.
  5. Jos $M$ on luonnollisten lukujen osajoukko, jolla on ominaisuudet $0 \in M$ ja $n \in M \implies s(n) \in M$, niin $M = \mathbb{N}$.

Viides aksiooma, ns. induktioaksiooma on näistä vaikeimmin hahmotettava. Se lähinnä rajoittaa luonnollisten lukujen joukon kokoa.

Aksioomat Peanon julkaisussa

Alkuperäisessä julkaisussaan Peanolla ykkönen oli pienin luonnollinen luku nollan sijasta, mutta myöhemmin hän siirtyi käyttämään nollaa. Nykyään käytäntö vaihtelee. Asiayhteydestä riippuen käytetään jompaakumpaa.  Kumpikin on periaatteessa mahdollinen, mutta esimerkiksi seuraavassa esiintyviin lausekkeisiin tulee pieniä muutoksia, jos käytetäänkin nollan sijasta ykköstä.

Peanon aksioomissa ei puhuta yhteen- tai kertolaskusta yhtään mitään. Laskutoimitukset on ensin määriteltävä, jotta voidaan yrittää laskea $1+1$. Tätäkin ennen on määriteltävä, mitä tarkoittaa symboli $1$ ja mitä tarkoittaa symboli $2$. Näistäkään aksioomat eivät sano mitään.

Aksiooman 2 mukaan jokaisella luonnollisella luvulla on seuraaja. Siis myös luvulla $0$ on seuraaja $s(0)$.  Koska aksiooman 3 mukaan $0$ ei ole minkään luvun seuraaja, ei voi olla $s(0) = 0$. Tällöin $s(0)$ on jokin muu luku ja sille voidaan antaa nimeksi $1$, siis $s(0) = 1$. Tällä on myös seuraaja $s(1) = s(s(0))$. Samoin kuin edellä tämä ei voi olla $= 0$. Ei voi myöskään olla $s(s(0)) = 1 = s(0)$, sillä tästä seuraisi aksiooman 4 mukaan $s(0) = 0$. Luku $s(1)$ on siis jokin muu luku ja sille voidaan antaa nimeksi $2$. Siis $s(1) = 2$.  Näin voidaan jatkaa, mutta tämän artikkelin tavoitetta varten ei enempää tarvita.

Yhteenlaskun määrittely perustuu induktioaksioomaan. Jos $p$ on jokin luonnollinen luku, määritellään $p + 0 = p$. Jos $n$ on jokin luonnollinen luku ja $p+n$ on määritely, määritellään $p + s(n) = s(p+n)$.  Tällöin niiden lukujen $n$ joukko $M$, joille laskutoimitus $p + n$ on määritelty, täyttää induktioaksiooman ehdot ja siis $M = \mathbb{N}$.

Yhteenlaskun määritelmästä seuraa erityisesti on $s(p) = s(p + 0) = p + s(0) = p + 1$. Luvun seuraaja siis saadaan lisäämällä ykkönen. (Tämä on itse asiassa motiivina määrittelyssä $p + s(n) = s(p+n)$, joka purkautuukin muotoon $p + (n + 1) = (p + n) + 1$.)

Yhteenlaskun määrittelyn jälkeen on päästy perille: $1 + 1 = 1 + s(0) = s(1 + 0) = s(1) = 2$.

Vaikka tavoitteeseen onkin päästy, ei laskutoimitusten määrittely kokonaisuutena ole valmis. Lukija voi miettiä, miten voitaisiin osoittaa esimerkiksi yhteenlaskun vaihdannaisuus $(p + n = n + p)$ tai miten voitaisiin määritellä kertolasku. Jääköön harjoitustehtäväksi.

Vaikka yhteenlaskulle $1 + 1$ onkin saatu täsmällinen määrittely, ei peruskoulun opetussuunnitelmaa liene syytä kehittää tähän suuntaan. Usein ihailtu matemaattinen täsmällisyys ja asioiden oppiminen eivät aina (koskaan?) ole sama asia. Pedagogin ongelmana onkin, miten esittää matematiikan käsite ymmärrettävästi, mutta tekemättä liikaa väkivaltaa matematiikalle.

 

sunnuntai 13. joulukuuta 2020

Digijoulu

Tonttu Digi Bittinuttu oli toiminut Joulupukin Paja Oy:n logistiikkapäällikkönä melkein 100 vuotta. Hän oli tullut taloon nuorena tonttuna yli 200 vuotta sitten sulkemaan joulupaketteja lakalla ja ollut tuolloin nimeltään Petteri Pikkunuttu. Hän oli vähitellen edennyt urallaan, kohonnut logistiikkapäälliköksi ja viimeisen 70 vuoden aikana kiinnostunut tietotekniikan tarjoamista mahdollisuuksista. Häntä oli tämän takia alettu kutsua Bittinutuksi ja hän oli lopulta virallistanut sen nimekseen. Tämän jälkeen hän oli saanut uuden lyhyemmän lempinimen "Digi".

Joulupukin Pajan periaatteena oli edelleen, että lahjat jaetaan pulkkakuljetuksilla ja käyttövoimana on poro.  Digin tehtävänä oli näiden järjestely ja se harmitti häntä tavattomasti. Hän olisi jo kauan halunnut siirtyä modernimman tekniikan käyttöön (mönkijöitä, putkijärjestelmiä, droneja, kevyitä suihkukoneita, raketteja jne.), virtuaalilahjat voitaisiin toimittaa perille yksinomaan sähköisesti. Koko järjestelmä kuljetusreitteineen olisi kaivannut optimointia. Mutta Pajan johdossa oleva Joulupukki oli auttamattoman konservatiivinen, pulkista ja poroista ei luovuta, virtuaalilahjoihin ei siirrytä. Vaikka lahja olisi ollut ohjelmistotuote, se talletettiin muistitikulle, joka pakattiin kauniiseen joulupakettiin. Pulkkauratkin olivat pyhiä, vaikka lunta ei sataisikaan.

Digi alkoi vähitellen kyllästyä ja suunnitteli uusiin kuvioihin siirtymistä. Hän oli kaikessa hiljaisuudessa perustanut startup-yrityksen, jonka ideana oli joulun kaikinpuolinen digitalisointi. Joulupukin Pajan tontuilla oli kyllä kilpailukielto ja salassapitosopimus, joka kattoi irtisanoutumisen jälkeiset 100 vuotta jouluun liittyvien toimintojen osalta, mutta Digi arveli saavansa tarvittaessa korkeimman oikeuden uskomaan, että digijoulu on täysin eri toimiala.

Startup-yrityksen ensimmäinen hanke oli virtuaalijoulukuusen kehittäminen. Tämä sai nimekseen X-Spruce ja se voitiin räätälöidä asiakkaan toiveiden mukaan. Kuusi generoitiin matemaattisella algoritmilla, jonka parametrien arvot asiakas valitsi. Se toimitettiin verkon kautta koodina, jonka avulla asiakas saattoi katsella kuusta eri puolilta, luoda olohuoneeseensa laajennetun todellisuuden joulukuusineen tai tulostaa kuusen 3D-tulostimella. Muitakin mahdollisuuksia kehitettäisiin myöhemmin. Toistaiseksi kyseessä oli prototyyppi, joka oli vielä varsin köyhä esimerkiksi koristeiden suhteen.


Generointialgoritmin pohjana oli ruuviviiva \[c(u) = (r\cos(wu), r\sin(wu), au),\] missä $r$, $w$ ja $a$ olivat asiakkaan valitsemia parametreja. $r$ saattoi olla myös käyräparametrista $u$ riippuva funktio $r(u)$ asiakkaan valinnan mukaan. Ruuviviiva määräsi kuusen oksien ulottuvuuden rungosta.

Paitsi ruuviviivaan oksat tuettiin kuusen runkoon pisteeseen $q(u) = (0,0,au+b)$. Tämä oli parametrista $b$ riippuen joko ylempänä tai alempana kuin ruuviviivalla oleva oksan toinen pää. Oksat suuntautuivat tällöin joko ylös- tai alaspäin. Parametrin $b$ valitsi asiakas. Kuusen oksia kuvattiin tällöin lausekkeella \[s(u,v) = vc(u) + (1-v)q(u).\] Tämä esittää ruuvipinnaksi kutsuttua pintaa, jolla oksat sijaitsevat. $u$ ja $v$ ovat pintaparametrit, $u \ge 0$, $0 \le v \le 1$.

Kuusen tuuheuttamiseksi sen rakenne saattoi perustua useaan ruuviviivaan.

Prototyypissä ei vielä ollut muita koristeita kuin dodekaedriin perustuva latvatähti.

Esimerkiksi valintoihin \[r(u) = \frac{60-u}{15},\ w_1 = 1,\ w_2 = 0.8,\ a = 0.2,\ b = 1\] pohjautuva kahden ruuviviivan kuusi näytti seuraavalta:


Saadakseen käsityksen markkinoista Digi päätti julkaista kuusesta 3D-tulostimelle tarkoitetun koodin, joka oli laadittu Mathematicalla: x_spruce.stl (32 MB). Toiveena on, että 3D-tulostimen omistavat potentiaaliset asiakkaat kokeilevat tulostusta ja raportoivat kokemuksistaan. Digi odottaa tuloksia jännittyneenä.


torstai 19. marraskuuta 2020

Matemaattista kirjallisuutta maailmalta

Nelikulmiossa jokainen kärki yhdistetään vastakkaisen sivun keskipisteeseen kuvion osoittamalla tavalla.  Onko sininen ala yhtä suuri kuin punainen ala?

Selasin American Mathematical Societyn Notices-lehtiä. Jäsen voi saada painetun lehden, joka tulee, kunhan Atlantin takaa ehtii, mutta sähköiset versiot ovat kaikille avoimia ja myös aihepiireittäin selattavissa: https://www.ams.org/notices/. Paljon muun ohella sisältävät myös matematiikan opetukseen ja popularisointiin sopivien kirjojen esittelyjä. Nämä ovat usein sellaisia, että tekee mieli tutustua niihin tarkemminkin.

Kirjojen kieli on tietenkin lähes poikkeuksetta englanti, mutta tämänhän ei liene nyky-Suomessa ongelma.  Monista kirjoista on sähköinen versio, jonka lataaminen ei kauan kestä, ja hankinta on siis helppoa. Painetunkin toki saa, mutta posti kulkee niin kuin kulkee. Lahjana painettu on varmaan parempi kuin muistitikulle talletettu digiversio. Verkkokaupoista voi etsiä, kustantajasta riippuen ainakin https://www.amazon.com/, https://bookstore.ams.org/ ja https://press.princeton.edu/ ovat kiinnostavia.

En tiedä, hankitaanko tämäntyyppisiä kirjoja Suomeen kovinkaan paljoa. Lähinnä voisi ajatella opettajakoulutukseen liittyviä yliopistokirjastoja, oppikirjoja tekeviä kustantajia ja opettajajärjestöjä, miksei myös yksittäisiä opettajia. Erilaiset näkökulmat voisivat tuoda uusia herätteitä jokaiselle matematiikkaa opettavalle tai harrastavalle ja näyttää, että totuttu tapa katsoa asioita ei ole ainoa mahdollinen eikä välttämättä edes paras.

Seuraavassa muutama esimerkki loka- ja marraskuun numeroissa esitellyistä kirjoista, joista kiinnostuin.

Daniel J. Velleman, Stan Wagon; Bicycle or Unicycle?: A Collection of Intriguing Mathematical Puzzles; MAA Press, Jason Rosenhousen esittely. Kirja koostuu 105 ongelmasta tai pulmatehtävästä, englanniksi puzzle. Näiden vastakohta on problem, joka oppikirjaterminologiassa tarkoittaa perinteistä (matematiikan) harjoitustehtävää. Puzzlet rinnastuvat pikemminkin esimerkiksi vanginlukkoon ja niiden ratkaiseminen on yhden tai muutaman, enemmän tai vähemmän matemaattisen idean varassa. Yllä olevassa kuvassa on yksi esimerkki, jonka ratkaisua en paljasta. Kirjasta se kyllä löytyy.

Stephen H. Saperstone, Max A. Saperstone; Interacting with Ordinary Differential Equations; MAA Press, Stephen Kennedyn esittely. Kyseessä on differentiaaliyhtälöiden oppimateriaali, e-kirja, modernein tietotekniikan mahdollistamin painotuksin.  Kirjan ostaminen tarkoittaa kuuden kuukauden lisenssiä web-palvelimelle, jonka materiaali mahdollistaa laskentavälineiden käytön. Taustalla on laskentaohjelma Mathematican pilvipalvelu. Vaikka digitaalimaailmaan ei innostuisikaan, mahdollisuuksiin kannattaa minusta perehtyä. Niiden järkevä käyttötapa ei ole itsestään selvää, mutta kokeiluihin perehtyminen kehittää omaa näkemystä. Tätä yritin itsekin jo lähes kaksikymmentä vuotta sitten kirjassani DelTa — Tavalliset differentiaaliyhtälöt.

Róbert Freud, Edit Gyarmati; Number Theory; esittely samassa yhteydessä kuin edellisen kirjan. Unkarilaisen hyvin suositun lukuteorian oppikirjan käännös englanniksi. Alkeista lähdetään ja aika pitkälle päästään. Ilman tarkempaa perehtymistä on tietysti vaikea sanoa, miten kirja suhtautuu moniin muihin lukuteorian oppikirjoihin ja miten se soveltuu vaikkapa luentokurssin pohjaksi. Unkarilainen tausta kuitenkin kiinnostaa.

David M. Bressoud; Calculus Reordered: A History of Big Ideas; Princeton University Press, esittely Stephan Ramon Garcia. Calculuksen — differentiaali- ja integraalilaskennan — historia Välimeren hellenistisestä maailmasta 1900-luvulle, Arkhimedeestä Gödeliin. Melkoinen kaari siis. Esittelijä pitää kirjaa ajatuksia herättävänä lukemistona jokaiselle calculuksen opettajalle.

Grady Klein, Yoram Bauman; The Cartoon Introduction to Calculus; esittely samassa yhteydessä kuin edellisen kirjan. Hieman kevyempi näkemys calculuksesta. Vaikeata sanoa, mikä on tämän merkitys opiskelulle, mutta koulukirjaa hauskempi voi toki olla.


sunnuntai 25. lokakuuta 2020

Eksponenttifunktiosta

Napierin logaritmeja koskevan teoksen kansilehti

Varsinaisen eksponenttifunktion $e^x$ kantalukua $e$ kutsutaan Neperin luvuksi skotlantilaisen matemaatikon John Napierin (1550–1617) mukaan. Neper oli hänen nimensä latinalaistettu muoto. Napier pyrki helpottamaan pitkien lukujen kertolaskua muuntamalla sen logaritmien yhteenlaskuksi. Tässä hän oleellisesti käytti eksponenttifunktiota esittämättä asiaa kuitenkaan näin. Myöskään nimeään kantavaan lukuun hän ei viittaa. Sen tunnisti merkittäväksi matemaattiseksi vakioksi Jacob Bernoulli (1655–1705) ja symbolin $e$ otti käyttöön Leonhard Euler (1707–1783).

Eksponenttifunktiota ja Neperin lukua käytti ainakin Gottfried Wilhelm Leibniz (1646–1716) vuonna 1691 julkaisemassaan ketjukäyrää — päistään kiinnitetyn vapaasti roikkuvan ketjun muotoa — koskevassa tutkimuksessaan. Tällöin hän myös laski varsin tarkan likiarvon Neperin luvulle.

Leibnizin muistiinpanoja Neperin luvun laskemiseksi

Ajan kuluessa tietämys eksponenttifunktion ominaisuuksista on lisääntynyt ja tavat sen määrittelyyn ovat hioutuneet. Edellisessä postauksessani esittelin neljä erilaista nykyään käytettyä tapaa määritellä eksponenttifunktio ja johtaa sen ominaisuudet määritelmästä lähtien. Voidaan kuitenkin menetellä myös toisinpäin: lähdetään funktion perusominaisuuksista ja katsotaan, millaiseen funktioon tällöin päädytään. Kun aikoinaan aloitin matematiikan opintoni Helsingin yliopistossa, eksponenttifunktiota tarkasteltiin näin, mikä oli minulle — lyhyen matematiikan lukiossa lukeneelle — hieman hämmentävää.

En muista tätä esitystä nähneeni pitkään aikaan missään muussa oppikirjassa kuin Juhani Pitkärannan teoksessa Calculus fennicus. Tämä on kooltaan amerikkalaisten calculus-kirjojen luokkaa oleva yli tuhatsivuinen opus, joka kuitenkin on tiukkaa asiaa eikä lainkaan amerikkalaisen tradition mukainen.  Suosittelen lämpimästi henkilölle, joka haluaa huolella perehtyä yliopistotasoiseen peruskurssimatematiikkaan.  Kirja on tehty Teknillisen korkeakoulun (sen otaniemeläisen) laajalle peruskurssille, mutta ei taida olla käytössä oppikirjana enää missään. Sääli. Fyysisen kirjan painos näyttää olevan lopussa, mutta sähköinen versio on olemassa.

Miten eksponenttifunktiota sitten tässä lähestytään?

Lähtökohtana ovat perusominaisuudet: \[ E(0) \neq 0, \quad E(x+y) = E(x)E(y) \] kaikilla reaalisilla $x$, $y$. Lisäksi vaaditaan, että $E$ on jatkuva ja derivoituva origossa. Muuta ei funktiosta $E$ tarvitsekaan olettaa.

Voi tietenkin kysyä, miksi juuri tällaiset perusominaisuudet eikä jotakin muuta. Nämä ovat kuitenkin luonnollisia ominaisuuksia fysikaalisille kasvu- ja vaimenemisongelmille, joten niistä on hyvä lähteä, jos tarkoituksena on sopivan matemaattisen työkalun luominen. Tämä tosin on jälkiviisautta, historiallisesti eksponenttifunktio ei ole syntynyt näin.

Lähtökohdista saadaan vaiheittain suhteellisen yksinkertaisilla laskuilla $E(0) = 1$ ja $E(x) > 0$ kaikilla reaalisilla $x$. Seuraavaksi osoitetaan, että $E$ on kaikkialla jatkuva ja sille saadaan lauseke $E(x) = b^x$, kun $x$ on rationaalinen ja $b = E(1)$. Funktio on aidosti kasvava tai aidosti vähenevä riippuen siitä, onko $b > 1$ vai $b < 1$. Koska $E$ on origossa derivoituva, on olemassa $E'(0) = a$.  Tästä seuraa helposti, että $E$ on kaikkialla derivoituva ja $E'(x) = a E(x)$.

Eksponenttifunktion karakteristiset ominaisuudet purkautuvat siis varsin helposti, mutta avoimeksi jää funktion olemassaolo. Vakiofunktio $E(x) = 1$ epäilemättä toteuttaa ehdot ja tällöin $b=1$, $a=0$.  Onkin hieman isompi työ osoittaa, että tämä ei ole ainoa mahdollisuus, vaan funktio on olemassa kaikilla vakion $b$ positiivisilla arvoilla. Jos erityisesti $b$ on Neperin luku, on $a = 1$ ja saadaan varsinainen eksponenttifunktio.

En mene yksityiskohtiin. Lukija löytää ne Juhani Pitkärannan kirjasta.

Tällainen eksponenttifunktion käsittely ei ole oppikirjoissa kovin yleinen ja tuskin sopii ensimmäiseksi näkökulmaksi aiheeseen. Kuitenkin se kertoo jotakin olennaista matemaattisen päättelyn luonteesta ja sellaisena on minusta paikallaan yliopistotason matematiikan opiskelijoille. Lukio-opettajan ja ehkä joidenkin oppilaidenkin näkemystä se saattaisi monipuolistaa tuomalla matematiikan uuteen valoon kaavakokoelma-ajattelun sijaan.

Eksponenttifunktion tarina ei pääty tähän, vaan sitä voidaan jatkaa vakion $b$ negatiivisiin arvoihin. Tällaisiahan monet matemaattiset ohjelmistot laskevat sujuvasti. Tällöin kuitenkin siirrytään siinä määrin uusille alueille, että en jatka tässä.

lauantai 26. syyskuuta 2020

Matematiikan ja sen opettamisen kumulatiivisuudesta

Eräs reaaliluku

Yliopistotason kurssi matemaattisesta analyysista — differentiaali- ja integraalilaskennasta — alkaa usein reaalilukujen aksioomilla. Periaatteellisena ajatuksena on rakentaa analyysi näiden päälle: muodostetaan uusia käsitteitä, asetetaan määritelmiä ja todistetaan lauseita vetoamalla vain aksioomiin tai niiden avulla aiemmin muodostettuihin rakenteisiin. Tämä kuitenkin jää hyvin periaatteelliseksi. Jo yksinomaan epäyhtälön $1 > 0$ todistaminen huolellisesti aksioomiin vedoten on monivaiheinen prosessi. On siis pakko luottaa siihen, että opiskelijat ovat koulussa hankkineet lujan ja toivottavasti oikeanlaisen uskon reaalilukuihin.

Analyysin kurssi voitaisiin tietenkin aloittaa hieman kauempaakin. Voitaisiin ottaa lähtökohdaksi Peanon aksioomien avulla määritellyt luonnolliset luvut ja rakentaa näiden avulla ensin kokonaisluvut, sitten rationaaliluvut ja näiden avulla lopuksi reaaliluvut. Prosessi on aika pitkä ja raskas eikä kovin mielenkiintoinen. Tosin reaalilukujen konstruointi joko Dedekindin leikkausten tai Cauchyn jonojen avulla kertoo ajattelevalle opiskelijalle jotakin olennaista reaaliluvuista. Jos taas ei jää pohdiskelemaan, prosessi on erittäin tylsä. Opetuksen kannalta ongelmana on, että opiskelija jo osaa laskea luvuilla yleensä varsin hyvin, joten miksi tuhlata aikaa pohdiskeluihin.

Puhdasoppinen matemaatikko ei tyytyisi luonnollisiin lukuihinkaan, vaan aloittaisi joukko-opin aksiomatiikasta.

Mitä koulussa sitten pitäisi kertoa reaaliluvuista? Ainakin jotakin, mikä luo lujan uskon niihin ja antaa pääpiirteissään oikean ymmärryksen. Ehkä enemmän kulttuurihistorian puolelle menee kertomus pythagoralaisista, joille ihmetyksen ja hämmennyksen aiheena oli päättely, joka osoitti, että tasakylkisen suorakulmaisen kolmion kateetin ja hypotenuusan pituutta ei voida tasan mitata samalla mittatikulla, olipa tämä miten lyhyt tahansa. Seurauksena tulee todetuksi, että $\sqrt{2}$ ei ole rationaaliluku, kuten asia meidän aikanamme ilmaistaan. Pohtimisen arvoista on myös, onko $0.99999\dots = 1$. Yleensä ei pidetä selvänä, että vastaus on myönteinen.

Koulutasolla reaaliluvuista riittäneekin mielikuva, että jos on jotakin, jolle voidaan laskea yhä tarkempia likiarvoja (tai jopa täsmällinen arvo), niin tämä jokin on olemassa ja sitä kutsutaan reaaliluvuksi. Tällainen mielikuva menee varsin lähelle Cauchyn jonojen ideaa (mitä ei tarvitse koululaisille kertoa).

Tämän jälkeen tie on auki funktioiden jatkuvuuteen, raja-arvoihin, differentiaali- ja integraalilaskentaan.  Joissakin kohdissa kuitenkin tulee ongelmia. Esimerkiksi Bolzanon lause — jos jatkuva funktio vaihtaa merkkiään suljetulla välillä, niin välillä on ainakin yksi nollakohta — saa usein tarpeettoman juhlallisen sävyn.  Asiahan on selviö, jos jatkuvuus mielletään vain kuvaajan yhtenäisyytenä. Kuitenkaan lause ei päde, jos tarkastelu rajoitetaan rationaalilukuihin. Reaaliluvut rationaaliluvuista erottavan täydellisyysaksiooman täytyy siis olla lauseen kannalta oleellinen.

Pitävän todistuksen esittäminen Bolzanon lauseelle ei siten ole mahdollista, jos käsitys reaaliluvuista perustuu lujaan uskoon, eikä tätä koulutasolla onneksi yritetäkään. Tiukkaan kumulatiivisuuteen jää aukko ja se voisi olla hieman isompikin: Bolzanon lausetta voisi pitää selviönä antamatta sille edes nimeä. Ajattelevaisen lukiolaisen ei tarvitsisi ihmetellä, mikä lauseesta tekee juhlallisen. Vielä enemmän ajattelevaiselle voi sitten kertoa reaaliluvuista syvemmin.

Alkeisfunktioiden (potenssit, eksponenttifunktio, trigonometriset funktiot, näiden käänteisfunktiot sekä näistä peruslaskutoimituksilla ja funktioiden yhdistämisellä saatavat funktiot) kohtuullisen tarkkaan kumulatiiviseen määrittelyyn on syytä kiinnittää huomiota eikä vain antaa valmiita kaavoja tai tuloksia.  Funktioistahan koululainen jo jotakin tietää laskimen näppäinhattujen tai tietokoneen käytön perusteella, mutta määrittelyprosessi kertoo jotakin oleellista matematiikan luonteesta.

Tietyn alkeisfunktion määrittelyyn voi olla useita teitä. Eksponenttifunktio on tästä hyvä esimerkki:

1) Lähtökohdaksi voidaan ottaa, että kyseessä on potenssi, jossa hieman mystillisesti määritelty luku \[e = \lim_{n \to \infty} (1+\frac{1}{n})^n\] korotetaan muuttujan $x$ ilmaisemaan potenssiin. Tätä varten on ymmärrettävä, mitä tarkoittaa raja-arvo ja miten potenssit määritellään, kun eksponentti on kokonais-, rationaali- tai irrationaaliluku.

2) Voidaan myös antaa määritelmä muuttujasta riippuvana raja-arvona: \[\exp(x) = \lim_{n \to \infty} (1+\frac{x}{n})^n.\] Raja-arvon olemassaolon lisäksi ongelmana on potenssin laskusääntöjen osoittaminen: $\exp(x)\exp(y) = \exp(x+y)$ jne.

3) Voidaankin ensin määritellä käänteisfunktio: \[\ln(x) = \int_1^x \dfrac{dt}{t}.\] Tämän käänteisfunktio on $\exp(x)$. Tarvitaan tieto integraalin määrittelystä ja olemassaolosta, kun integroitavana on jatkuva funktio. Lisäksi on pääteltävä käänteisfunktion olemassaolo. Potenssin laskusäännöt on osoitettava.

4) Myös sarjamäärittely on mahdollinen: \[\exp(x) = \sum_{k=0}^\infty \frac{x^k}{k!}.\] Täytyy osoittaa, että sarja suppenee ja että potenssin laskusäännöt ovat voimassa.

Mikään näistä teistä ei ole aivan helppo, vaan joudutaan vetoamaan aiemmin esitettyihin käsitteisiin ja tuloksiin. Kumulatiivisuus on oleellista ja jollakin tavoin tähän haasteeseen täytyy opetuksessa vastata, vaikka kaikkia yksityiskohtia ei ehkä voidakaan — tasosta riippuen — huolellisesti käsitellä.  Matematiikan kumulatiivisen luonteen tulee näkyä, jotta mielikuva ei jää kaavakokoelman ja laskinohjelman tasolle.

Mikä edellä olevista eksponenttifunktion määrittelytavoista sitten on paras? Ei tähän ole vastausta.  Riippuu yhteydestä ja varmaan myös opettajan mieltymyksistä.