torstai 12. joulukuuta 2019

Joulupukin liikenneympyrä ja Fredericus-tontun ongelma


Liikenne ja ruuhka joulupukin pajan edustalla oli siinä määrin lisääntynyt, että katsottiin välttämättömäksi rakentaa pajan eteen liikenneympyrä, jossa kuljettaisiin vain positiiviseen kiertosuuntaan. Lahjojen toimittamista varten joulupukilla oli myös lukuisia poroja ja moottorikelkkoja, joille tarvittiin pysäköintitilaa mahdollisimman läheltä pajan ulko-ovea.

Niinpä pajan oven eteen päätettiin rakentaa liikenneympyrä, jonka keskiympyrän halkaisija olisi 40 metriä.  Pysäköintipaikat päätettiin sijoittaa keskiympyrään, puolet ympyrän alasta poroille ja toinen puoli moottorikelkoille. Tarvittavan kaavamuutoksen saaminen kesti kauan eikä rakennustyökään ihan nopeasti sujunut. Kun ympyrä lopulta valmistui, pukin kuljetuskalusto oli siinä määrin motorisoitunut, että poroja oli jäljellä enää yksi. Kaavamääräykset olivat kuitenkin tiukat: poroille oli varattava tasan puolet keskiympyrän alasta.

Aitauksen rakentamista yhdelle ainoalle porolle ei enää pidetty taloudellisesti järkevänä, vaan poro päätettiin panna sopivan pituiseen liekaan, joka kiinnitettäisiin keskiympyrän reunaan. Liean pituus tuli määrätä siten, että poro pääsisi syömään jäkälää täsmälleen puolella ympyrän alasta eikä se voisi käydä pureskelemassa moottorikelkkojen satuloita tai muita maistuvia osia.

Joulupukki-konsernissa oli matemaattinen osasto, joka varsinaisesti vastasi lahjojen hinnoittelusta ja konsernin tulokseen liittyvistä laskelmista. Lisäksi sillä oli tilastomatemaattista asiantuntemusta mielipidekyselyjen analysointiin. Tarvittaessa sitä käytettiin muihinkin matemaattisiin tehtäviin.  Osasto sai tehtäväkseen selvittää liekanarun pituuden.

Osaston päämatemaatikko oli Stefanus Superbus -niminen tonttu, joka hallitsi erinomaisesti matemaattisten laskentaohjelmien käytön, mutta joka inhosi kynään tarttumista ja varsinkin paperia, ellei se tullut ulos tulostimesta. Osastolla omassa kammiossaan yleensä suljetun oven takana pohdiskeli matemaattisia ongelmia myös tonttu nimeltään Fredericus Minimus. Hän oli Stefanuksen täydellinen vastakohta: kulutti suunnattomasti paperia luonnosteluihin ja pohdiskeluihin ennen kuin kirjoitti lopullisen tiiviin esityksen pienellä ja selkeällä käsialalla. Teknisiin apuvälineisiin hän tarttui vain äärimmäisessä hädässä pahoinvointia tuntien. Kumpikin paneutui liekanaruongelmaan.


Stefanus kirjoitti keskiympyrän muotoon $x^2+y^2 = 1$, jolloin yksikkönä on keskiympyrän säde.  Liean kiinnityspisteeksi hän valitsi $(0,-1)$. Jos liean pituus on $r$, poro pääsee alueelle $x^2 + (y+1)^2 \le r^2$, jolloin keskiympyrän sisäpuolelle jäävän alueen ala saadaan integraalista
\[
\int_{-r\sqrt{1-r^2/4}}^{r\sqrt{1-r^2/4}} \left(-1+\sqrt{r^2-x^2}+\sqrt{1-x^2}\right)\,dx.
\]
Tässä tulee olla $0 \le r \le \sqrt{2}$. Laskentaohjelma antoi integraalille arvon
\[
-r\sqrt{1-r^2/4} + r^2 \mathrm{arccot}\left(\frac{r}{\sqrt{4-r^2}}\right) + \arcsin\left(r\sqrt{1-r^2/4}\right).
\]
Koska tämän tulee olla puolet keskiympyrän alasta eli $\pi/2$, on saatu yhtälö liean pituudelle.  Laskentaohjelman Newtonin iteraatio antoi nollakohdaksi $r = 1.1587\dots$. Koska keskiympyrän säde on 20 metriä, sai Stefanus liean pituudeksi noin 23.17 metriä.


Fredericus puolestaan piirteli kuvan, jossa poron laidunalueen puolikas muodostui kahdesta osittain päällekkäin olevasta sektorista keskipisteinä $K$ ja $P$. Yhteinen osa oli kolmio, ja Fredericus laski pinta-alan vähentämällä kolmion alan sektoreiden yhteispinta-alasta. Koko laidunalueen pinta-alaksi tuli tällöin
\[
\pi - r\sqrt{1-r^2/4} + (r^2 - 2)\arctan\left(\sqrt{4/r^2 - 1}\right).
\]
Tämän oli siis oltava puolet keskiympyrän alasta eli $\pi/2$. Ratkaisun olemassaolon Fredericus päätteli helposti, mutta lukuarvon laskemiseen hän joutui käyttämään taskulaskinta.  Tulokseksi tuli sama kuin Stefanuksella.

Liean pituus oli siis saatu selvitetyksi. Heräsi kuitenkin kysymys, olivatko saadut pinta-alan lausekkeet samat. Stefanus syötti lausekkeet laskentaohjelmaan ja pani ohjelman sieventämään niiden erotusta. Tulisiko tulokseksi 0? Ei tullut. Lauseke hieman yksinkertaistui, mutta se sisälsi edelleen molemmat funktiot $\arcsin$ ja $\arctan$. Jäi avoimeksi, voisiko tulosta sieventää edelleen.  Stefanus oli kuitenkin toiminnan tonttu: hän piirsi ohjelmalla kummankin lausekkeen kuvaajan, ja kun ne osuivat päällekkäin, totesi niiden olevan samat ja asian tulleen loppuun käsitellyksi.

Käsin laskuun luottava ja tarkkaa päättelyä arvostava Fredericuskin ryhtyi puuhaan ja vannoi selvittävänsä asian täsmällisesti ennen joulupuuron syöntiä. Aika kului ja joulu lähestyi.  Fredericuksen kammion lattia alkoi peittyä revittyihin suttupapereihin, ja hän pyysi lisää paperia.  Tuskanhiki nousi hänen otsalleen. Eikö käsin laskeminen johtaisikaan tulokseen ja jäisikö joulupuuro syömättä?

Jouluun on vielä muutama päivä. Osaisitko auttaa Fredericus-parkaa?

perjantai 22. marraskuuta 2019

Mikä on suora?

Christophorus Clavius, Euclidis Elementa, 1574

Viime blogijutussani esittelin epäeuklidisen geometrian mallia, jossa suorina pidettiin ympyränkaaria, jotka kohtaavat erään rajaympyrän kohtisuorasti. Miksi tällaisia kutsutaan suoriksi, vaikka ne ovat kaarevia eivätkä suinkaan suoria?

Matematiikka on vanha tiede ja tässäkin on mentävä juurille yli kahden tuhannen vuoden taakse.  Antiikin kreikkalaisten suuri idea oli rakentaa geometriasta johdonmukainen järjestelmä. Lähtökohtina olivat yksinkertaiset käsitteet (määritelmät), niiden perusominaisuudet (postulaatit) ja päättelysäännöt (aksioomat). Postulaatteja kutsuttaisiin nykyään mieluummin aksioomiksi. Näihin pohjautuen esitettiin konstruktioita ja väittämiä (propositioita, teoreemoja), joiden tuli perustua joko lähtökohtiin tai aiemmin todistettuihin väittämiin. Kyseessä oli logiikkaan pohjautuva deduktiivinen päättely.

Oppijärjestelmän esitti Eukleides Aleksandrialainen noin vuonna 300 eaa. teoksessaan Στοιχεῖα (Stoikheia), latinaksi Elementa, suomeksi yleensä Alkeet (vaikkakaan se ei ole alkeisoppikirja vaan pikemminkin oppijärjestelmän perusteet). Teoksesta tuli geometrian oppikirja yli 2000 vuodeksi. Siitä on kirjoitettu useita toisistaan enemmän tai vähemmän poikkeavia versioita kommentaareineen. Vielä 1960-luvulla suomalaisen oppikoulun (peruskoulun yläkoulun ja lukion) geometrian kurssin pohjana oli Eukleideen geometria.

Viivan Eukleides määrittelee pituudeksi ilman leveyttä (määritelmä 2, Linea est longitudo sine latitudine).  Suora viiva eli suora taas on sellainen, joka on pisteidensä suhteen tasainen (määritelmä 4, Recta linea est quæ ex æquo sua interiacet puncta). Teoksen alkukieli oli tietenkin kreikka, joten olisi oikeampaa nojautua kreikankieliseen tekstiin. Tämäkin on kyllä saatavissa, esimerkiksi Dimitrios E. Mourmourasin verkkosivuilta. Latina on kuitenkin hieman helpommin ymmärrettävää, vaikka matemaatikko toki kreikkalaiset kirjaimet hallitseekin.  Teoksen latinankielisiä versioita (tai siihen pohjautuvia tekstejä) on vuosisatojen kuluessa julkaistu useita, esimerkiksi Carolus Malapertiuksen kommentoitu esitys vuodelta 1620.  Myös englanninkielinen versio löytyy.

Varsinkin suoran määritelmästä on Eukleideen esitystä noudattelevissa teoksissa esitetty erilaisia versioita. Mikään näistä ei oikeastaan ole määritelmä nykyaikaisessa mielessä vaan jonkinlainen kuvailu siitä, mitä tarkoitetaan: pisteidensä suhteen tasainen, pisteestä toiseen ulottuva, päätepiste varjostaa välipisteet (vrt. valonsäteeseen).

Historiallisesti mielenkiintoinen on viides postulaatti, joka muodostaa pohjan ns. paralleeliaksioomalle.  Latinankielisessä on hieman tavaamista: Et quod si ceciderit linea recta super duas lineas rectas, et fecerit in una duarum partium duos angulos interiores minores duobus rectis, ille due linee recte, quando in illam partem protrahentur, coniungentur. Englanninkielinen versio ehkä auttaa: That, if a straight line falling on two straight lines makes the interior angles on the same side less than two right angles, the two straight lines, if produced indefinitely, meet on that side on which are the angles less than the two right angles. Tästä seuraa paralleeliaksiooma sellaisena kuin se suomalaisissa geometrian kirjoissa yleensä on esitetty: Suoran ulkopuolella olevan pisteen kautta voidaan asettaa täsmälleen yksi sen suuntainen suora.

Viides postulaatti ei ollut yhtä yksinkertainen ja itsestään selvänä pidettävä kuin muut postulaatit, ja tuntui, että se (tai edellä oleva paralleeliaksiooman muotoilu) pitäisi voida todistaa muihin postulaatteihin perustuen, jolloin kyseessä olisikin teoreema eikä postulaatti. Tätä yritettiin vuosisatojen ajan onnistumatta. Vielä nykyäänkin tapaa aina silloin tällöin hieman originelleja matematiikan harrastajia, jotka pyrkivät todistamaan paralleeliaksiooman.

Asia ratkesi vasta 1800-luvun alkupuolella, jolloin venäläinen Nikolai Lobatševski ja unkarilainen Janos Bolyai toisistaan riippumatta esittivät geometrisen järjestelmän, joka toteutti muut postulaatit mutta ei paralleeliaksioomaa. Tämä osoitti, että paralleeliaksioomaa ei ollut mahdollista todistaa muiden postulaattien pohjalta. Intuitiivinen mielikuva suorasta oli tällöin kuitenkin hylättävä. Oli hyväksyttävä, että suora saattoi tarkoittaa muunkintyyppistä oliota, kunhan sillä vain oli suoran karakteristiset ominaisuudet, esimerkiksi se, että kaksi pistettä määrää suoran yksikäsitteisesti. Tällaisia geometrioita alettiin kutsua epäeuklidisiksi. Edellisen blogikirjoitukseni Poincarén malli on tällainen.

David Hilbert, Grundlagen der Geometrie, alku

Suoran määrittelyssä olevan epämääräisyyden poisti lopullisesti David Hilbert vuonna 1899 teoksessaan Grundlagen der Geometrie, jossa hän esitti geometrialle modernin aksiomatiikan. Lähtökohtana on kaksi objektijoukkoa, joista toisen olioita kutsutaan pisteiksi ja toisen olioita suoriksi. Näille määritellään ns. insidenssirelaatio, joka kertoo mikä piste sijaitsee milläkin suoralla. Lisäksi vaaditaan, että oliot (siis pisteet ja suorat) toteuttavat tietyt aksioomat. Nämä voidaan valita eri yhteyksissä eri tavoin, jolloin valinnasta riippuen saadaan erilaisia geometrioita. Siten esimerkiksi paralleeliaksiooman toteutuminen voidaan vaatia tai olla vaatimatta. Tämän kummallisemmin ei suoraa (eikä pistettä) määritellä tai luonnehdita. Epämääräisyys poistui jättämällä määrittely tekemättä!

Jonkinlainen ääriesimerkki geometriasta on Fanon taso, jossa on vain seitsemän pistettä ja seitsemän suoraa. Se voidaan havainnollistaa oheisella kuviolla, jossa suoria ovat kolmion sivut ja korkeusjanat sekä kolmion sisään piirretty ympyrä. Geometrian seitsemän pistettä on merkitty tavalliseen tapaan mustilla täplillä. Yhtä hyvin Fanon tason voisi esittää insidenssitaululla, jossa yläpuolen vaakarivillä ovat pisteet ja vasemman reunan pystyrivillä suorat. Taulukon täplä osoittaa pisteen kuulumista suoralle.

maanantai 28. lokakuuta 2019

Epäeuklidiset GeoGebra ja Napoleon

Mustat suorat eivät kohtaa punaista suoraa, ts. ovat sen suuntaisia.

Vanhassa geometrian kirjassani (Kallio, Malmio, Geometria I, Otava 1954) esitellään paralleeliaksiooma muodossa Suoran ulkopuolella olevan pisteen kautta voidaan piirtää ainoastaan yksi sen suuntainen suora.  Tämän sanotaan olevan ns. euklidisen geometrian peruslauselmia, mutta sitä ei ole voitu todistaa. Sen jälkeen todetaan, että vastakohdaksi on kehitetty epäeuklidinen geometria, jossa lauselmaa ei käytetä ja monet paralleeliaksioomaan perustuvat väittämät saavat toisen muodon. Eikä sen enempää.

Muistan, että tämä teki hämmentävän vaikutelman. Usko paralleeliaksioomaan oli luja eikä tuntunut mitenkään järkevältä puhua mistään muunlaisesta tilanteesta. En tiedä, mitä nykyään koulussa sanotaan euklidisesta ja epäeuklidisesta geometriasta, mutta mahdollisuuksia konkretisointiin ainakin nykyään on paljon paremmin.

GeoGebra on hyvä ympäristö geometristen kuvioiden piirtelyyn ja geometristen totuuksien tutkimiseen.  On helppoa kokeilla, näyttäisikö jokin tulos olevan totta. Jos näyttää, voi lähteä etsimään todistusta.  Varsin lähellä on ajatus, että vastaavanlainen epäeuklidinen ympäristö voisi olla hyvinkin havainnollinen ja kiinnostava. Ajatuksen on maailmassa varmaankin sangen moni saanut ja epäeuklidisia ympäristöjä onkin tehty. Luultavasti paljonkin, mutta seuraavia kahta olen käyttänyt. Molemmissa on kyseessä hyperbolinen epäeuklidisen geometrian Poincarén malli:

GeoGebraan pohjautuva Poincare Disk for Hyperbolic Space, tekijänä Heather Pierce, https://www.geogebra.org/m/fUCCfAEj;

Javascript-pohjainen NonEuclid, tekijänä Joel Castellanos, https://www.cs.unm.edu/~joel/NonEuclid/NonEuclid.html.

Molemmat toimivat verkkoselaimessa, mutta myös omalle koneelle lataaminen on mahdollista.

Osoitteessa http://www.malinc.se/noneuclidean/en/index.php on Malin Christerssonin sivusto, jossa GeoGebraan pohjautuvan Poincarén mallin lisäksi on käsitelty mallin taustalla olevaa geometriaa ja GeoGebra-työkalujen muodostamista. Tiivistelmä aiheesta on Wikipedia-artikkelissa Hyperbolic Geometry, https://en.wikipedia.org/wiki/Hyperbolic_geometry. Tämä on selvästi laajempi kuin vastaava suomenkielinen.

Poincarén epäeuklidisen geometrian mallissa geometrista tasoa vastaa vain kiinteän ympyrän sisäpuoli, ts. geometrian pisteitä ovat tämän rajaympyrän sisäpuolen pisteet. Geometrian suoria ovat rajaympyrän sisäpuolella olevat ympyränkaaret, jotka kohtaavat rajaympyrän kohtisuorasti. Näiden erikoistapauksena ovat rajaympyrän halkaisijat, joita voi ajatella rajaympyrän keskipisteen kautta kulkevina ääretönsäteisinä ympyränkaarina. Tällä tavoin määritellyillä suorilla on suorien tyypillinen ominaisuus: kaksi pistettä määrää suoran yksikäsitteisesti. (Ks. alussa olevaa kuvaa.)

Malliin voidaan määritellä myös sen oma metriikka, ts. tapa laskea kahden pisteen välinen etäisyys. Lauseke ei ole aivan yksinkertainen, mutta sillä on luontevat etäisyyden ominaisuudet: lyhin kahden pisteen välinen etäisyys saavutetaan pisteiden määräämää suoraa (siis ympyränkaarta) pitkin; minkä tahansa pisteen etäisyys rajaympyrästä on äärettömän suuri. Etäisyyden määrittely mahdollistaa geometrian omien ympyröiden muodostamisen: tällaisen kehä muodostuu niistä pisteistä, joiden etäisyys keskipisteestä on vakio. Osoittautuu, että tällainen Poincarén mallin ympyrä on ympyrä myös tavanomaisessa mielessä.

Yksikkösäteisiä ympyröitä, joiden keskipisteet ovat samalla suoralla.

 Kun suoria ja ympyröitä voidaan muodostaa — ts. käytettävissä ovat epäeuklidisen geometrian viivoitin ja harppi — voidaan tehdä kaikki tavanomaisen geometrian konstruktiot. Tämän jälkeen voidaankin kysyä, mitkä tavanomaisen euklidisen geometrian tulokset ovat voimassa epäeuklidisessa geometriassa tai ainakin Poincarén mallissa. Jätän lukijan ihmeteltäväksi ja kokeiltavaksi.

Napoleonin lause ei päde, kuten vihreät ympyrät osoittavat.
(Vrt. http://matta.hut.fi/matta/geogebra/Napoleon.html.)

Lupasin kerran ohjata muutamaa lukiolaista, jotka halusivat tehdä projektityön epäeuklidisesta geometriasta. Ongelmaksi muodostui aihepiirin laajuus. Lukiolaiset etsivät kaikenlaisia asiaan liittyviä verkkodokumentteja suhteellisuusteoriaa myöten, ja näitähän löytyy paljon. Yritin rajata aihetta, mutta en onnistunut rajoittamaan heidän intoaan eikä työ sitten valmistunutkaan. Projektityöt ovat hyvä ajatus, mutta vaativat usein aika tiukkaa ohjausta. Intoa ei toisaalta tietenkään pitäisi kahlita.


sunnuntai 29. syyskuuta 2019

Jatkuvuuden epsilon-delta-määrittely

Funktiota $f$ sanotaan jatkuvaksi pisteessä $a$, jos seuraava pätee:
\[
\forall(\varepsilon > 0)\exists(\delta > 0)(|x - a| < \delta \implies |f(x) - f(a)| < \varepsilon),
\]
ts. jokaista positiivilukua $\varepsilon$ (epsilon) kohden on olemassa positiiviluku $\delta$ (delta) siten, että jos $x$:n etäisyys $a$:sta on pienempi kuin $\delta$, niin $f(x)$:n etäisyys $f(a)$:sta on pienempi kuin $\varepsilon$.

Jatkuvuuden määrittely tällä tavoin on eräänlaista šokkihoitoa aloittelevalle matematiikan opiskelijalle. Tokihan tämäntyyppisiä lausekkeita on syytä oppia lukemaan ja kirjoittamaankin, mutta jatkuvuuden opettaminen tällä tavoin on kuin uimaan opettaminen heittämällä oppilas veteen ja katsomalla uppoaako. Ainakin pitäisi olla valmis onkimaan oppilas kuiville.

Tällaista šokkihoitoa sain itsekin aloittaessani matematiikan opinnot 1960-luvulla Helsingin yliopistossa opiskeltuani lukiossa lyhyen matematiikan. Kuiville pääsin kevätlukukauteen mennessä tyytyväisenä: 'Eikö se tämän kummallisempaa ollutkaan?'

Ei jatkuvuuden määrittely tällä tavoin ole kovin vaikeaa, kunhan määritelmää hieman avataan. Kyseessä on eräänlainen kahden pelaajan, A ja B, hieman epäreilu peli. Jos A voittaa, funktio on epäjatkuva, jos B, niin se on jatkuva. Alussa pelaaja A valitsee positiiviluvun $\varepsilon$ ja pelaajan B pitää löytää positiiviluku $\delta$ siten, että implikaatio toteutuu. Jos B ei löydä, A on voittanut eikä funktio ole jatkuva. Jos B löytää, A antaa uuden epsilonin ja otetaan uusi kierros. Näin jatketaan tarvittaessa äärettömän monta kierrosta, minkä jälkeen B on voittaja ja funktio on jatkuva.  Jatkuvuuteen tarvitaan äärettömän monta kierrosta, koska testattavana ovat kaikki positiiviset epsilonit.

Tarkastelupisteessä jatkuva funktio


Yllä oleva GeoGebralla tehty graafinen sovellus tekee pelistä inhimillisemmän ja samalla määritelmä tulee helpommin ymmärrettäväksi. A valitsee epsilonin liukusäätimellä, jolloin vihreät vaakasuorat viivat rajaavat y-akselilla alueen, jossa etäisyys funktion arvosta $f(a)$ (musta piste) on pienempi kuin $\varepsilon$. B hakee vastaavaa deltaa toisella liukusäätimellä, jolloin punaiset pystysuorat viivat rajaavat x-akselilla alueen, jossa etäisyys pisteestä $a$ on pienempi kuin $\delta$. Kun sopiva delta löytyy, merkkivalo muuttuu punaisesta vihreäksi. Tällöin funktion kuvaaja pysyy vihreiden viivojen välissä punaisten viivojen rajaamalla alueella, mikä tarkoittaa implikaation toteutumista. Pienellä kokeilulla on melko helppoa oppia ymmärtämään, miten $\delta$ on valittava.

Kuvan funktio on jatkuva eikä tämä vielä auta ymmärtämään, miksi jatkuvuus on järkevää määritellä juuri näin. Tässä — kuten monissa muissakin matematiikan määrittelyissä — on oleellista katsoa, miten määritelmä erottaa tapaukset, joissa ehto ei ole voimassa. Alla olevat kuvat ovat muutoin samanlaisia kuin edellä, mutta kyseessä ei ole jatkuva funktio. Tällöin on toki olemassa epsiloneja, joita vastaava delta löytyy ongelmitta. Mutta on myös epsiloneja — riittävän pieniä — joille vastaavaa deltaa ei löydy. Epäjatkuvuus näkyy tällä tavoin. Deltanhan pitää löytyä kaikilla positiivisilla epsiloneilla.

Funktio jolla on hyppyepäjatkuvuus

Origossa epäjatkuva funktio $\sin(1/x)/2$, origossa arvo $0$


Edellä sanottu on oikeastaan vasta puolet asiasta: määritelmän idea. Toinen puoli jatkuvuuden osoittamisessa on hakea laskemalla annettua epsilonia vastaava delta. Piirroskuviahan ei ole tapana hyväksyä todistuksiksi. Tällöin lähtökohtana on kiinnitetty luku $\varepsilon$, jota käsitellään symbolina. Tavoitteena on hakea tähän liittyvä $\delta$, ts. esittää delta jonkinlaisena funktiona epsilonista. Hakeminen merkitsee yleensä epäyhtälöiden manipulointia, mikä sekin on sinänsä tarpeellinen taito, mutta eri asia kuin jatkuvuuden määrittely. Epäjatkuvuuden osoittamiseen taas riittää löytää yksi epsilon, jota vastaavaa deltaa ei todistettavasti ole.

Arvelen, että osa määritelmän vaikeudesta johtuu siitä, että idea hukkuu teknisen epäyhtälöiden manipuloinnin taakse. Kun jälkimmäinen vie päähuomion, ymmärtämiselle ei riitä energiaa.

Edellä olevat kuvat ovat staattisia, mutta GeoGebralla tehty sovellus löytyy verkko-osoitteesta http://matta.hut.fi/matta/demot.html.  Siellä on myös Mathematica-versio, jonka käyttöön tarvitaan laskentaohjelma Mathematica tai katseluohjelma Wolfram Player (CDF Player).

perjantai 20. syyskuuta 2019

Verbaalinen epsilon ja delta

Raja-arvon määrittelyä epsilonia ja deltaa käyttäen pidetään — aiheellisesti — vaikeana asiana. Aiemmin opiskeltuun matematiikkaan nähden abstraktiotaso on selvästi korkeampi. Tämän sijasta usein määritellään, että funktiolla $f$ on pisteessä $a$ raja-arvo $b$, siis $\lim_{x \to a} f(x) = b$, jos funktion $f$ arvot tulevat mielivaltaisen lähelle lukua $b$, kun muuttujan $x$ arvot tulevat riittävän lähelle lukua $a$. Tätä voidaan täydentää jollakin epsilon-delta-ajatteluun viittaavalla lausumalla, mutta se ei kovin paljoa opiskelijalle anna. Kirjoittaja vain pesee kätensä määritelmänsä epämääräisyydestä.

Ei liene aivan selvää, millaisia mielikuvia raja-arvosta em. määritelmä opiskelijalle synnyttää. Luin jokin aika sitten amerikkalaisen professorin David Bressoudin blogikirjoituksia Beyond the Limit I, II, III, joissa käsiteltiin aiheesta tehtyjä tutkimuksia. Opiskelijoille on annettu yhdentoista tehtävän sarja, joissa heitä on pyydetty selittämään (explain) raja-arvoihin liittyviä ideoita, merkityksiä ja syitä. Tulosten perusteella käsitykset on luokiteltu eri tyyppeihin.  Vastaavanlainen tutkimus suomalaisista pitkän matematiikan lukijoista voisi olla kiinnostava.  Onkohan tällaisia tehty?

Edellä mainitun määritelmän epämääräisyys näkyy verbivalinnassa: mitä tarkoittaa arvon 'tuleminen'?  Onko kyseessä jonkinlainen dynamiikka? Verbiä voi toki vaihtaakin, mutta epämääräisyyttä se ei poista.  Onko arvoja paljon? Voivatko ne jotenkin heilahdella? Lähestyvätkö ne tasaisesti? (Mitä se sitten onkin.)  Ongelmiin joudutaan viimeistään yritettäessä yleistää määritelmää kahden muuttujan funktioille.

Epämääräisyydestä huolimatta esitystä yleensä jatketaan lauseilla summan, tulon ja osamäärän raja-arvoista. Tietenkään näitä ei todisteta, ei toki oikein voitaisikaan, mutta tulokset julistetaan tärkeinä lauseina. Toisinaan tähän sarjaan liitetään myös alussa olevan kuvan yhdistettyä funktiota koskeva lause. Ilmeisen tuntuinen tulos, jonka toki voinee todistaakin epsilon-delta-tekniikalla. Paitsi että lause ei pidä paikkaansa.

Virheellisen lauseen on esittänyt suomenkielinen Wikipediakin (ainakin 16.9.2019, olen huomauttanut asiasta). Englannin- ja saksankielisissä Wikipedia-artikkeleissa on vastaesimerkki, joka osoittaa lauseen vääräksi. Ehkä yksinkertaisin esimerkki on $f(x) = 0$, kun $x \neq 0$, $f(0) = 1$ ja tarkastellaan yhdistettyä funktiota $f \circ f$.

Ranskankielinen Wikipedia-artikkeli esittää yhdistettyjä funktiota koskevan tuloksen pätevänä lauseena, ja tällä kertaa se sitä onkin, sillä ranskalainen raja-arvon määritelmä on hieman erilainen: funktion arvo pisteessä $a$ otetaan huomioon, ts. $0 \le |x-a| < \delta$. Tämäkin kyllä sopii em. verbaaliin määrittelyyn.

Miten raja-arvo sitten tulisi määritellä lukiotasolla? Epsilon-delta-määritelmästä aloittaminen on varmasti liian vaativaa, joten edellä esitettyyn epämääräisyyteen on tyydyttävä. Vierastan tällöin kuitenkin pohdiskeluja raja-arvon laskusäännöistä ja toispuolisista raja-arvoista. Ikään kuin oltaisiin kehittämässä täsmällistä teoriaa. Todettakoon mieluummin suoraan määritelmän riittämättömyys ja palattakoon siihen myöhemmin jossakin analyysin jatkokurssissa, jolloin kykyä abstraktisuuden käsittelemiseen on ehtinyt kertyä. Intuitiivisen mielikuvan ja raja-arvojen numeerisen laskemisen pohjalta päästään aivan hyvin kiinni erotusosamäärän raja-arvoon, ts. derivaattaan. Samalla kurssi muuttuu selvästi kevyemmäksi.

Tällä tavoin asia on hoideltu Kalle Väisälän maineikkaassa algebran kirjassa. Sitä selailemalla ei oikein voi välttyä käsitykseltä, että Väisälä oli pedagogi, joka taisi tehdä paljon töitä löytääkseen asioille luontevan ja kohtuullisen helposti omaksuttavan esitystavan.

lauantai 17. elokuuta 2019

Geometrista päättelyä Eukleideen tapaan laskentaohjelmalla

Kaupallisista tietokoneohjelmista ilmestyy ajoittain uusi versio, jossa vähäisten paikkailujen lisäksi täytyy olla jotakin oleellisesti uutta. Tämä tarvitaan uuden version markkinointiin, mutta uutuuksien merkitys ja kohtalo ilmenee vasta myöhemmin. Ne saattavat olla uusia aluevaltauksia, joita kukaan ei ehkä osannut edes kaivata, mutta ne muuttavat työskentelytapojamme ja näkökulmiamme joko hyvään tai huonoon suuntaan. Toisaalta ne saattavat osoittautua tarpeettomiksi ja jäädä olemattomalle käytölle.

Laskentaohjelma Mathematica on jokaisessa kokonaislukuversiossaan pyrkinyt tuomaan jotakin uutta.  Usein kyse on ollut merkittävistä uusista mahdollisuuksista, mutta joukossa on myös unohduksiin painuneita ideoita. Versio 12 tuo Eukleideen geometrian, ei laskennallisena analyyttisena geometriana, vaan eräänlaisena päättelynä.

Olkoon esimerkkinä kolmioiden yhtenevyysteoreema KSK. Aluksi määritellään lähtötilanne oletuksineen: kaksi kolmiota, $ABC$ ja $PQR$, sekä näiden yhtä suuret vastinosat, yksi sivupari ja kaksi kulmaparia.


Konfiguraatiosta voidaan piirtää haluttu määrä kuvioita, joissa kärkipisteiden koordinaatit valitaan satunnaisesti, mutta oletusehdot toteutuvat.


Mielenkiintoisin on kolmas vaihe, jossa pyritään etsimään kuvion uusia ominaisuuksia, ts. mitä voitaisiin yrittää todistaa lähtötilanteen pohjalta. Alla olevan tuloksen kaksi ensimmäistä riviä väittävät, että kolmiot ovat yhteneviä ja että ne ovat yhdenmuotoisia. Loput rivit tarkoittavat vastinosien yhtäsuuruutta.


En tiedä, millaista algoritmia tässä käytetään, ts. miten uudet ominaisuudet itse asiassa etsitään.

Vastaavalla tavalla käy, jos määritellään lähtötilanteeksi kolmio keskijanoineen, jolloin uudeksi ominaisuudeksi löydetään keskijanojen kulkeminen saman pisteen kautta (ovat concurrent).

Kyseessä ilmeisesti on uusi kokeellinen innovaatio tekoälysovellusten kehittelyssä. Taustatiedot ovat tässä suhteessa aika niukkoja. Tilanne tietenkin houkuttelee kokeilemaan erilaisia konfiguraatioita, eikä uusia ominaisuuksia aina löydykään. Jos keskijanat korvataan kulmanpuolittajilla tai keskinormaaleilla, mitään uusia ominaisuuksia ei löydy. Sovelluksen kehittely näyttää olevan vielä kesken, minkä avoin kertominen olisi paikallaan.

Kaikenlaista voidaan kehitellä, ja tuloksena saattaa olla ideoita, joista saatava hyöty on jossakin kokonaan muualla. Jään kuitenkin ihmettelemään, mikä hyöty laskentaohjelman käyttäjälle olisi kuvatunkaltaisesta euklidisesta geometriasta. Jos sovellus alkaa toimia edes lähes moitteetta, kyseessä on eräänlainen geometrinen laskin: syötteeksi annetaan jokin konfiguraatio, ja tulokseksi saadaan luettelo siitä, mikä tässä konfiguraatiossa on totta. Eräänlainen teoreemalaskuri siis. Mutta tarvitsemmeko me tällaista?

Euklidisen geometrian todistamista ei varsinaisesti opeteta sen takia, että tiedettäisiin, mikä on totta, vaan sen takia, että opitaan päättelyn metodi. Tämän näkökulman sovellus ainakin nykymuodossaan ohittaa. Toisaalta voidaan tietysti ajatella, että riittävän pitkälle kehittyessään sovellus alkaa löytää ennen tuntemattomia tuloksia ja ehkä jopa kykenee raportoimaan menettelyn näiden todistamiseen. Tähän on kuitenkin melkoinen matka.

Minkälaiseen käyttöön ja minkälaiseen tehtävään sovellus sitten olisi tarkoitettu?

lauantai 6. heinäkuuta 2019

Palloharmoniaa heinäkuun ratoksi

Ajauduin kesäkuulla keskustelemaan kollega Hannu Korhosen kanssa pallogeometriasta ja samalla pohtimaan palloharmonisia funktioita, englanniksi spherical harmonics. Näihinhän johdutaan ratkaistaessa pallokoordinaateissa Laplacen differentiaaliyhtälöä \[ \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} + \frac{\partial^2 u}{\partial z^2} = 0, \] tuntemattomana funktiona $u(x,y,z)$. Pallokoordinaateissa yhtälö saa hieman hankalamman muodon \[ \frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial u}{\partial r}\right) + \frac{1}{r^2\sin\theta}\frac{\partial}{\partial\theta}\left(\sin\theta\frac{\partial u}{\partial\theta}\right) + \frac{1}{r^2\sin^2\theta}\frac{\partial^2 u}{\partial \phi^2} = 0 \] ja tuntemattomana funktiona on $u(r,\theta,\phi)$. Käytössä ovat ns. fysikaaliset pallokoordinaatit: etäisyys origosta $r$ ($\ge 0$), leveysaste $\theta$ ($0 \le \theta \le \pi$, pohjoisnapa $0$, päiväntasaaja $\pi/2$, etelänapa $\pi$) ja pituusaste $\phi$ ($-\pi < \phi \le \pi$).

En ryhdy esittelemään, miten yhtälön ratkaisu tapahtuu, viittaan vain esimerkiksi dokumenttiin http://scipp.ucsc.edu/~haber/ph116C/SphericalHarmonics_12.pdf tai ranskantaitoisille https://www.phy.ulaval.ca/fileadmin/phy/documents/PDF/Pedago/Harm-Sphervf.pdf.  Tietyssä vaiheessa ratkaisuun ilmestyvät funktiot $Y_\ell^m(\theta,\phi)$, joille saadaan melko yksinkertaiset lausekkeetkin ja joita kutsutaan palloharmonisiksi funktioiksi. Näitä pyritään havainnollistamaan kuvilla, jotka samankin funktion kohdalla näyttävät hyvin erilaisilta.

Alla on esimerkkeinä kaksi funktiota: \begin{align*} Y_4^0(\theta,\phi) &= \frac{3}{16}\sqrt{\frac{1}{\pi}}\left(3 - 30\cos^2\theta + 35\cos^4\theta\right), \\ Y_5^3(\theta,\phi) &= \frac{1}{32}\sqrt{\frac{385}{\pi}}\sin^3\theta\left(1 - 9\cos^2\theta\right)\exp(3i\phi).  \end{align*} Jälkimmäinen on kompleksiarvoinen ja alla olevat kuvat koskevat sen reaaliosaa.  Lisää lausekkeita löytyy osoitteesta https://en.wikipedia.org/wiki/Table_of_spherical_harmonics, kuvia Googlen kuvahausta termillä 'spherical harmonics'.

Funktioiden tavanomaisin havainnollistus on alla. Hieman harvinaisempi on alapuolella oleva.


Ylempi on minusta hieman yllättävä: äkkiseltään katsoen pallomaisuus ei oikein hahmotu. Alempi on selkeämpi: pallopinnalle on kuvattu alueet, joissa funktio saa positiivisia arvoja (punainen) ja negatiivisia arvoja (keltainen). Mitä voimakkaampi väri, sitä isompi itseisarvo. Ylemmässä on kyllä periaatteessa sama informaatio: lähtemällä origosta suuntaan $(\theta,\phi)$ kohdataan pinta etäisyydellä, joka vastaa funktion itseisarvoa. Väri kertoo positiivisuuden tai negatiivisuuden.

Jälkimmäinen vaihtoehto sai minut kehittelemään hieman toisenlaisen havainnollistuksen: harmaa läpikuultava referenssipallo, jonka sisä- ja ulkopuolella funktion määräämä pinta aaltoilee. Etäisyys pallosta määräytyy funktion arvosta: positiivinen ulospäin pallopinnasta, negatiivinen sisäänpäin.  Rinnastus Fourier'n sarjan sini- ja kosinitermeihin on ilmeinen.

Hakemisen jälkeen vastaava kuva löytyi kyllä netistäkin, joten ei tämä ainutlaatuinen idea ole.

Olisiko tästä jotakin yleistä opittavaa? Matemaattisia olioita voi havainnollistaa monella tavalla.  Ainoaa oikeaa tapaa ei ole. Havainnollistuksen arvon ratkaisee, miten hyvin siitä näkyy tutkittavana oleva asia. Kuvat eivät matematiikassa sinänsä ole pahasta. Joskus hyvä kuva tai animaatio kelpaa jopa todistukseksi.

tiistai 4. kesäkuuta 2019

Väärin opetettu?

Korkeakoulujen valintamenettelyä kehitettäessä on päädytty ylioppilaskokeen arvosanoihin perustuvaan malliin, jossa varsinkin pitkällä matematiikalla on suuri merkitys. Taustana on huoli pitkän matematiikan kirjoittaneiden määrästä tilanteessa, jossa matematiikan merkitys monilla aloilla on kasvamassa ja pelkona on puute osaavasta työvoimasta. Kirjoittaneiden vuotuinen määrä on juuttunut noin 12000:een, vaikka jo toistakymmentä vuotta sitten tavoitteeksi asetettiin 16000. Uudistusta on kritisoitu voimakkaasti siitä, että se pakottaa lähes mitä tahansa alaa tavoittelevan lukiolaisen valitsemaan varmuuden vuoksi pitkän matematiikan.

Lukion matematiikanopettaja Timo Salminen kritisoi Helsingin Sanomissa 26.5.2019 uudistusta siitä, että se tuo pitkän matematiikan opiskelijoiksi aiheesta kiinnostumattomia opiskelijoita, jotka varsinaisesti tähtäävät muualle. Seurauksena vaatimustaso saattaa jopa laskea. Matematiikan opetuksen tutkija Marika Toivola on samana päivänä Uuden Suomen puheenvuorossaan asettunut vastustamaan Salmisen näkemystä ja korostanut, että opettajan tehtävänä on auttaa kaikkia oppilaita uskomaan kyvykkyyteensä oppia matematiikkaa. Ongelmat voidaan ratkaista pedagogisesti.

Siinä missä Salmisen näkemyksessä on kyynisyyttä, Toivola on idealisti. Usko mahdollisuuksiin pitää toki säilyttää, mutta entä jos Salmisen näkemyksissä onkin perää ja opettaja joutuu mahdottoman tehtävän eteen heterogeenisen ryhmänsä ohjaamisessa?

Salmisen ja Toivolan kirjoituksia on kommentoitu vilkkaasti ja moneen kertaan tuotu esiin näkemys matematiikassa opittujen asioiden hyödyttömyydestä työelämässä. Matematiikka nähdään joidenkin alojen ammattilaisten työkaluna, jolla ei ole mitään tekemistä yleissivistyksen kanssa. Samat käsitykset nousevat lähes aina esiin, kun missä tahansa keskustelussa sivutaan matematiikan opetusta. Jotakin on ilmeisesti tällöin jäänyt oppimatta ja ehkä opettamatta. On kyllä opetettu ratkaisemaan ylioppilaskirjoituksissa esiintyviä tehtäviä, mutta yhteys kulttuurin ja ajattelun kehitykseen sekä maailman hahmottamiseen on unohtunut. Matematiikka on suljettu yleissivistyksen ulkopuolelle.

Puutetta ei korjata muutamalla kirjoituksella ja juhlapuheella, joissa painotetaan matematiikan tärkeyttä ja kerrotaan sen olevan läsnä kaikkialla. Ei myöskään hallinnollisella päätöksellä ajaa lukiolaiset pitkän matematiikan karsinaan.

Pitkää matematiikkaa opetetaan lukiossa kolmetoista kurssia. Tämä on varsin paljon ja se on ollut perusteena myös vahvalle asemalle korkeakoulujen valintaperusteissa. Kevään 2019 ylioppilaskokeessa oli kolmetoista tehtävää ja läpipääsyyn riitti, että osasi ratkaista yhden tehtävän ja sai lisäksi muutaman hajapisteen. Hyväksyttyyn arvosanaan pääsi myös keräämällä hajapisteitä useammasta tehtävästä ilman että yhtäkään oli kokonaisuudessaan ratkaistu. Mitä lukion matematiikan kursseilla oikeastaan on tehty, jos tämän enempää osaamista ei synny? Toki suurin osa suorituksista on parempia, jopa erinomaisia, mutta osa lukiolaisista ei ole oppinut juuri mitään. Heille kurssit ovat olleet hyödyttömiä, hukkaan heitettyä aikaa. Vaikuttaa siltä, että Salmisen pelko saattaa olla aiheellinen.

Onko tässä kyse siitä, että matematiikkaa opetetaan jotenkin väärin? Olisi helppoa sanoa, että opettajat eivät vain ole hoitaneet tehtäväänsä. En kuitenkaan usko, että asia on näin yksinkertainen.

Opetushallituksen julkaisemat opetussuunnitelman perusteet ja kirjantekijöiden tulkinta näistä kiinnittävät sen, mitä lukiokursseilla tapahtuu. Opettajalla ei käytännössä ole sisällön ja painotusten suhteen kovin paljon valinnan varaa. Olen pitkään ihmetellyt, miten matematiikasta onkin saatu aika hengetöntä ja tylsää. Siitä on muodostunut silppukokoelma, josta on vaikeata löytää punaista lankaa. Erillisiä asioita, jotka vain pitää osata ylioppilaskokeessa. Ajattelun taitojen kehittyminenkin jäänee toiveajatteluksi.

Ei ole kovin suuri ihme, jos motivaatiota ei synny ja aletaan kysellä, missä tiettyä temppua tarvitaan työelämässä. Eihän matematiikkaa tämän takia opeteta, ehkä peruslaskutoimituksia lukuunottamatta.  Opin pitäisi jäsentyä laajemmaksi näkemykseksi ja yleissivistykseksi, kyvyksi tarpeen tullen paneutua niihin matemaattisluontoisiin ongelmiin, joita elämässä tulee vastaan.

Vertailuna historian opetukseen: Ei siinäkään kerrota juttua sieltä, toista täältä ja jaeta vuosilukutaulukkoa. Ei tavoitteena ole oppia tietämään vaikkapa Ranskan vallankumouksen aikaisia puoluejakoja, vaan että vallankumous ylipäätään tapahtui ja mikä oli sen merkitys. Vaikeutena tietenkin on, että yleistä näkemystä ei oikein voi syntyä ilman aika isoa määrää detaljeja. Sekä historiassa että matematiikassa.

Olisiko aika matematiikan opetuksen revisiointiin? Ehkä tämän jälkeen mielenkiintokin heräisi paremmin ja valintamenettelyssä käyttö olisi perustellumpaa.

maanantai 27. toukokuuta 2019

9999 potenssiin 9999

Silmiini osui tehtävä, jossa piti selvittää, kuinka monta numeroa on luvussa $9999^{9999}$ ja mitkä ovat kolme ensimmäistä numeroa. Ilmeisestikin kyseessä logaritmien harjoittelu ja käytettävissä laskin tai vastaava tietokoneohjelma.

Samantyyppisiä tehtäviä lienee aina käytetty logaritmien harjoittelemiseen. Klassikossa, K. Väisälän algebran kirjassakin on tehtävä, jossa kysytään luvun $9^{9^9}$ numeroiden lukumäärää. Tuolloin ei ollut laskimia, ainoastaan viisidesimaaliset logaritmitaulut.  Näilläkin tehtävän saattoi ainakin melkein ratkaista, numeroita oli noin 370 miljoonaa.  Paljon tarkempaan ei ollut mahdollista päästä eikä ensimmäisten numeroiden selvittämiseenkään tarkkuus riittänyt.

Potenssi $9999^{9999}$ on vaatimattomampi kuin $9^{9^9}$ ja ensimmäiseksi tekee mieli koettaa, selvittäisiinkö ilman logaritmeja, yksinkertaisesti laskemalla kokonaislukupotenssi suoraan normaalilla ohjelmiston aritmetiikalla. GeoGebralle ja TI-Nspirelle luku on liian suuri, GeoGebra antaa kysymysmerkin, TI-Nspire $\infty$-symbolin ja varoituksen ylivuodosta.

Mathematica sen sijaan laskee luvun ja antaa pitkän jonon numeroita. Näiden lukumäärän laskeminen olisi ikävä tehtävä, mutta tarkoitukseen on valmis funktio IntegerLength, jolla tulokseksi saadaan 39996 numeroa. Kolme ensimmäistä ovat 367. Mathematicaan pohjautuva verkossa toimiva Wolfram|Alpha ei anna suoraan kaikkia numeroita, mutta kertoo niiden lukumäärän. Onko enää tarpeen miettiäkään logaritmeja, jos laskentaohjelmien kapasiteetti kasvaa näinkin suureksi?

Jos kuitenkin käytetään logaritmeja, kannattaa aluksi laskea potenssin logaritmi muodosta $9999\lg(9999)$, missä $\lg$ tarkoittaa kymmenkantaista (Briggsin) logaritmia. GeoGebra antaa tulokseksi $39995.57$. Tämän kokonaisosa $39995$ on logaritmin ns. karakteristika.  Tämä on yhtä pienempi kuin luvun numeroiden määrä, joka siis on 39996. Desimaaliosa $0.57$ on logaritmin mantissa, jonka avulla saadaan luvun numeroiden alkupää. Tämä perustuu hajotelmaan
\[ 9999^{9999} = 10^{39995.56\dots} = 10^{39995} \cdot 10^{0.56\dots}. \]
GeoGebra kuitenkin tuottaa pienen yllätyksen: $10^{0.57} = 3.72$, mutta jos talletetaan muuttujaan alkuperäinen logaritmi, $s = 9999\lg(9999)$, ja lasketaan $10^{s-39995}$, saadaankin $3.68$. Ovatko oikeat alkupään numerot siis 372 vai 368?

Lasku GeoGebralla

TI-Nspirellä käy suurin piirtein samoin.

Selityksenä on, että ohjelmistojen numeerisessa laskennassa on käytössä huomattavasti enemmän desimaaleja kuin käyttäjälle normaalisti näytetään. Tarkkuuden säilyttämiseksi kannattaa siis tallettaa välitulokset muistiin eikä kopioida niitä uudelleen näytön mukaisina. Tämäkään ei poista kaikkia virheitä, koska laskennassa kuitenkin käytetään rajallista desimaalimäärää (tai oikeastaan bittimäärää). Jossakin tilanteessa virhe tulee aina esiin.

Olisiko logaritmien lisäksi jotakin muuta tapaa suoriutua tehtävästä, jos laskentaväline ei suoriudu suurista luvuista ilman ylivuotoa? Kantaluvun $9999$ voi skaalata jakamalla sen $10000$:lla. Tällöin syntyy luku $0.9999$, jonka korottaminen potenssiin $9999$ ei aiheuta ylivuotoa. Tulos on $0.36789\dots$, mikä antaa ensimmäiset numerot. Numeroiden lukumäärä saadaan kertomalla tämä skaalauksen takia tekijällä $10000^{9999} = 10^{39996}$.

Mitä kaikesta tästä — ja paljosta muusta vastaavasta — pitäisi oppia? Ohjelmisto on ensisijaisesti laskentaväline olipa kyse numeerisesta tai symbolisesta laskennasta. Se toimii omilla ehdoillaan eikä aina siten, kuin matemaattisessa mielessä pitäisi. Laskentaväline myös vaikuttaa siihen, millaista matematiikkaa on järkevää käyttää. Esimerkiksi logaritmitaulut ja ohjelmistot edellyttävät erilaista näkökulmaa.

maanantai 6. toukokuuta 2019

Kuution pyörittelyä

Linkki liikkuvaan kuvaan

xy-tason pistettä $(x,y)$ voi kiertää origon ympäri kulman $w$ verran kertomalla pystyvektoriksi kirjoitetut koordinaatit kiertomatriisilla matriisitulomielessä:
\[
\begin{pmatrix}\cos(w) & -\sin(w) \\ \sin(w) & \phantom{-}\cos(w)\end{pmatrix}
\begin{pmatrix}x \\ y\end{pmatrix}\ .
\]
Kuvion kiertäminen tapahtuu kiertämällä periaatteessa sen jokainen piste, mutta esimerkiksi neliötä kierrettäessä riittää kiertää sen kärkipisteet ja piirtää kierretty neliö näiden avulla.

Mikä olisi kaksiulotteisen kierron kolmiulotteinen vastine? Kiertokeskuksena oleva origo on tällöin korvattava origon kautta kulkevalla kiertoakselilla, jonka ympäri kierretään kulman $w$ verran. Tällöinkin kierto voidaan kuvata matriisilla, joka nyt on kokoa $3 \times 3$.

Matriisi saadaan suhteellisen helposti, jos käytettävissä on riittävästi matriisilaskentaa tukeva symbolinen ohjelma. Jos kiertoakselin yksikön pituinen suuntavektori on $\vec{n} = n_1\vec{i} + n_2\vec{j} + n_3\vec{k}$, muodostetaan matriisi
\[
N = \begin{pmatrix} 0 & -n_3 & n_2 \\ n_3 & 0 & -n_1 \\ -n_2 & n_1 & 0 \end{pmatrix}.
\]
Eksponenttifunktio voidaan määritellä myös matriiseille ja kiertomatriisi saadaan tämän avulla:
\[ Q = \exp(wN),
\] missä $w$ on kiertokulma.

Matriisieksponenttifunktio voidaan määritellä eksponenttifunktion tavanomaisen sarjakehitelmän avulla:
\[
\exp(A) = \sum_{k=0}^\infty \frac{A^k}{k!}.
\]
Tässä potenssit $A^k$ tarkoittavat matriisituloja ja sarjan suppeneminen täytyy luonnollisesti osoittaa. Symboliset ohjelmat eivät kuitenkaan laske matriisieksponenttifunktion arvoja tästä määritelmästä, vaan matriisien ominaisarvoteoria antaa siihen paremmat mahdollisuudet.

Alla oleva lasku näyttää kiertomatriisin laskemisen Mathematicalla tarkkoja arvoja käyttäen. Graafisiin demonstraatiotarkoituksiin on kuitenkin luonnollisempaa käyttää numeerista laskentaa, ts. riittävän tarkkoja likiarvoja.


Mathematica — kuten monet muutkin kehittyneet ohjelmat — tarjoavat mahdollisuuden laatia animaatioita ja säädettäviä demonstraatioita niin ilmiön kuin sitä kuvaavan koodin tutkimiseen: katso kuvakaappausta artikkelin alussa ja linkin takana olevaa liikkuvaa kuvaa.

Matemaattisen tekstin lukijan on syytä olla hereillä ja aina hieman epäluuloinen. Mistä tiedetään, että menettely todella antaa kiertomatriisin? Onko selvää, että kolmiulotteisella kierrolla on aina akseli, kuten edellä ohimennen oletettiin? Jos kuutiota jotenkin pyöräyttelee, niin pääseekö alkuasennosta loppuasentoon aina yhdellä sopivan suuruisella kierrolla sopivan akselin ympäri? Työkaluiksi tarvitaan melkoinen annos matriisilaskentaa. Alaan perehtynyt lukija voi kokeilla taitojaan.

maanantai 1. huhtikuuta 2019

Mietteitä kevään 2019 ylioppilaskokeesta

En ole enää muutamaan vuoteen kovinkaan tarkasti tutkinut matematiikan ylioppilastehtäviä.  Tämän kevään koe oli kuitenkin ensimmäinen sähköinen koe ja sellaisena mielenkiintoinen: millaisia tehtäviä, miten käytetään ohjelmistotyökaluja. Keskityn seuraavassa vain pitkän matematiikan kokeeseen.

Tärkeimmät yleiset kokeen piirteet ovat sen vaikeustaso ja kattavuus, ts. miten hyvin lukiokurssien sisältö tulee katetuksi. Molempia pitäisin aika onnistuneina.

Koe alkaa varsin helpoilla tehtävillä, mutta vaikeutuu tasaisesti ja lopussa päästään varsin vaativiin tehtäviin. Myös yläpäähän syntynee hajontaa. Vaikka tehtäviä itsekin laatineena toki tiedän, että varsinkin alussa täytyy olla helppoja tehtäviä, en silti voi olla ihmettelemättä vaatimustasoa läpipääsyrajan kohdalla. Kolme ensimmäistä tehtävää ovat minusta sellaisia, että pitkän matematiikan kurssit opiskelleen pitäisi saada niistä täydet pisteet joutumatta erityisemmin miettimään. Arvelen kuitenkin, että läpipääsyraja jää tätä alemmaksi. Mihin ihmeeseen on käytetty oppimäärän lähes 500 tuntia?

Tehtävien tulisi kattaa lukiokurssit pääpiirteissään ja keskittyä oleellisiin asioihin. Ainoana kritiikin kohteena pitäisin vektoreiden vähäistä osuutta. Myös differentiaali- ja integraalilaskennan osuutta on pidetty vähäisenä, mutta tähän en yhtyisi. Aina ei ole selvää, mihin kurssiin tehtävä liittyy, mutta ei minusta pidäkään. Tarkoituksena on testata kykyä käyttää matematiikkaa, ei yksinomaan tietyn kurssin osaamista.

Ensimmäisessä sähköisessä kokeessa mielenkiinto tietenkin kohdistuu koekäyttöliittymän näppäryyteen ja toisaalta laskentaohjelmistojen hyödyntämiseen. Edellisestä en osaa sanoa; olisi pitänyt osallistua kokeeseen. Jälkimmäisen osalta kyseessä on selvästi varovainen aloitus, ja hyvä niin. Arvelen, että ohjelmistoja ei ole ainakaan vielä opittu käyttämään tutkimusvälineinä tehtävien ratkaisemisessa, vaan keskitytään lähinnä tiettyjen laskujen suorittamiseen: ratkaistaan yhtälö, derivoidaan tai integroidaan jotakin, piirretään kuvaaja, jos sitä pyydetään.

Symboliset ohjelmat (CAS) saattavat aiheuttaa yllätyksiä myös tehtävien laatijoille. Arvelen, että tehtävää 10.2 ($\sum_{n=0}^\infty \tan(x)^n = \frac{3}{2}$) ei ehkä tarkoitettu ratkaistavaksi yhdellä solve-komennolla. Ei paljoa puutu, ettei tehtävässä 11 ($\cos(x)^{\sin(x)} = \sin(x)^{\cos(x)}$) ole samanlainen tilanne: Tehtävän voi ratkaista Mathematicalla muutamalla komennolla laskematta yhtään mitään (liite). Mathematica ei ole kokeessa käytettäviä ohjelmistoja, mutta muutkin saattavat ennen pitkää kyetä tähän. Ehkä jo ensi vuonna.

Tällaiset tilanteet ovat haasteita kokeen arvostelulle. Mihin kaikkeen laskentaohjelmaa saa käyttää?  Milloin ja millaisia perusteluja pitää kirjoittaa? Säännöt eivät saisi olla kovin monimutkaisia.  Lukiolaisenhan tulisi oppia matematiikkaa, ei lautakunnan määräysten tulkintaa. En oikein usko, että on muuta ratkaisua kuin sanoa jokaisessa tehtävässä erikseen, mitä halutaan: Osoita, miten käsinlaskulla voidaan ratkaista seuraava tehtävä. Kirjoita algoritmi, joka ratkaisee seuraavan tehtävän. Selosta integraalin määrittelyn ja pinta-alan välinen yhteys.

Kaksi viimeistä — vaikeinta — tehtävää ovat minusta sinänsä hyviä, mutta 'Hyvän vastauksen piirteiden' ratkaisuja pidän vähän kummallisina.

Tehtävälle 12 (kolmion pinta-ala, kun piiri on vakio) esitettyä ratkaisua en jaksanut miettiä läpi.  Ratkaisun 'Havainto 1' on minusta samantasoinen kuin todistettava väite, jolloin herää kysymys, mitä kaikkea voi pitää tunnettuna. Kuitenkin kyseessä on laskentaohjelmien aikakaudelle sopiva tehtävä. Liitteenä on oma ratkaisuni Mathematicalla. Ehkä joku voisi testata, miten hyvin sama onnistuu jollakin muulla ohjelmistolla.

Tehtävään liittyi myös GeoGebra-aineisto, jolla ei oikeastaan ollut merkitystä. En tiedä, tulisiko liian vaativa tehtävä, jos aineistona annettaisiin dynaaminen kolmio, jonka piiri on pakotettu vakioksi (liite), ja kysyttäisiin hypoteesia kolmion alasta verrattuna tasasivuisen kolmion alaan.  Hypoteesi tulisi lopuksi todistaa.

Tehtävän 13 kakkoskohdan ($\ (\frac{1}{n}\sum_{k=1}^n a_k^2)^{1/2} \leq (\frac{1}{n}\sum_{k=1}^n a_k^4)^{1/4}\ $) todistus on aika vaativa ainakin 'Hyvän vastauksen piirteissä' esitetyllä tavalla tehtynä. Sen hahmottaminen on helpompaa, jos ensin yrittää arvoa $n=3$. Tämä olisi tietenkin voinut olla myös vihjeenä, ellei sitten ole tarkoitus testata, keksiikö kokelas itse lähestyä ongelmaa esimerkiksi tällä tavoin. Induktiotodistus on minusta selkeämpi, vaikka toki sekin vaatii näppäryyttä lausekkeiden käsittelyssä. Varsin hyvä loppuhuipennus.

Lopuksi en malta olla pohtimatta todennäköisyystehtävän 6 sanamuotoa. Šakkilaudalle pudotetaan riisinjyviä satunnaisesti, millä kaiketi tarkoitetaan, että jyvien jakauma šakkilaudan alueella on tasainen. Satunnaisilmiössä jakauma kuitenkin voi olla muutakin ja riisinjyvien heittelyssä varmaan sitä onkin. Kielenkäytöllä on merkitystä asioiden mieltämisessä.  Eräs ystäväni kerran määritteli, että satunnaisuus tai umpimähkäisyys tarkoittaa yksiulotteisessa tapauksessa tasaista jakaumaa, useampiulotteisessa se voi tarkoittaa mitä tahansa. Ehkei ihan näinkään.

maanantai 18. maaliskuuta 2019

Matematiikkaa kokeilemalla

Erinäisistä syistä tulin hiljattain syöttäneeksi laskentaohjelma Mathematicalle lausekkeen $(-1)^{i-1}$, missä $i$ tarkoittaa imaginaariyksikköä. Tämä sieveni muotoon $-e^{-\pi}$, ei tosin suoraan, mutta komennolla ComplexExpand ohjattuna. Saadun tuloksen korotin potenssiin $i$, siis $(-e^{-\pi})^i$, jolloin tulos oli uudelleen $-e^{-\pi}$.

Kyseessä on tietenkin hieman eksoottinen kompleksiluvuilla laskeminen ja on paikallaan pyrkiä verifioimaan tulokset jollakin tavoin. Yhtenä mahdollisuutena on miettiä, miten tällaiset potenssit oikeastaan pitäisi määritellä ja mitä määritelmä sitten antaisi. Myös kokeilemalla voi edetä ja testata ohjelmiston johdonmukaisuutta laskemalla vastaavat tulokset numeerisesti. Tällöin tulokset olivat seuraavat: \begin{align*} a &= (-1)^{i-1} \approx -0.0432139 - 5.29218 \cdot 10^{-18}\,i \ ,\\ b &= a^i \approx -23.1407 - 2.83392 \cdot 10^{-15}\,i\ . \end{align*} Edellinen näyttää hyvältä, sillä $e^{-\pi} \approx 0.0432139$ ja luokkaa $10^{-18}$ oleva imaginaariosa on $= 0$ numeerisen laskennan tarkkuudella. Jälkimmäinen sen sijaan on kummallinen, sillä $e^{\pi} \approx 23.1407$. Laskeeko Mathematica väärin?

Samat numeeriset tulokset antaa Matlab-klooni Octave. Olisiko Mathematican symbolisesti laskettu tulos väärin?

Kaikki on kuitenkin kunnossa ja Mathematica laskee sekä symbolisesti että numeerisesti juuri niin kuin pitääkin. Tämän ymmärtämiseksi on kuitenkin paneuduttava yleisen potenssin määrittelyyn.

Kompleksinen eksponenttifunktio voidaan määritellä joko sarjakehitelmällä tai hieman läpinäkymättömästi Eulerin kaavalla:
\[ e^z = \sum_{k=0}^\infty \frac{z^k}{k!} = e^x (\cos y + i\sin y), \] missä $z = x + iy$. Tämän käänteisfunktio on (luonnollinen) logaritmi $\log$, joka saadaan esittämällä $z$ napakoordinaateissa yhtälössä $e^w = z$ ja ratkaisemalla $w$: \[ w = \log z = \log|z| + i(\arg z + 2k\pi). \] Tässä $k$ on tavalliseen tapaan kokonaisluku ja $\arg$ tarkoittaa kompleksiluvun argumenttia eli napakulmaa, joka valitaan väliltä $]-\pi,\pi]$. $\log|z|$ on positiivisen reaaliluvun logaritmi ja määritelty reaalialueelta tunnetulla tavalla. (Kompleksianalyysissa on yleisesti tapana käyttää funktion nimenä $\log$ eikä $\ln$. Funktioiden määrittelystä tarkemmin esimerkiksi dokumentissa http://matta.hut.fi/matta/kompleksiluvut/cluvut.pdf.)

Jos valitaan $k = 0$, jolloin imaginaariosa on välillä $]-\pi,\pi]$, kyseessä on funktion päähaara.

Yleisen potenssin määrittely perustuu eksponenttifunktion ja logaritmifunktion käyttöön: \[ a^b = (e^{\log a})^b = e^{b\log a}, \] missä käytetään logaritmin päähaaraa.

Tällöin on \begin{align*} (-1)^{i-1} &= (e^{i\pi})^{i-1} = e^{(-1-i)\pi} = e^{-\pi}\,e^{-i\pi} = -e^{-\pi}\ ,\\ (-e^{-\pi})^i &= (e^{\log(-e^{-\pi})})^i = (e^{\log(e^{-\pi}) + i\pi})^i = (e^{-\pi + i\pi})^i = e^{-i\pi}\,e^{-\pi} = -e^{-\pi}\ . \end{align*} Symboliset tulokset ovat siis oikein.

Entä numeeriset? Luvun $-e^{-\pi}$ napakulma on $\pi$, sillä napakulma valitaan väliltä $]-\pi,\pi]$. Sen numeerisen approksimaation $-0.0432139 - 5.29218 \cdot 10^{-18}\,i$ napakulma sen sijaan on hyvin lähellä arvoa $-\pi$ negatiivisen, vaikkakin lähellä nollaa olevan imaginaariosan takia. Napakulmalla on $2\pi$:n suuruinen hyppyepäjatkuvuus negatiivista reaaliakselia ylitettäessä. Tämä muuttaa tilannetta numeerisessa laskennassa ja tulos on likimain \[ (e^{-\pi - i\pi})^i = e^{-i\pi}\,e^{\pi} = -e^{\pi} \approx -23.1407. \]
Kokeilevan matematiikan harrastaja piirtää vielä mielellään funktion $z^i = (x + iy)^i$ reaaliosan kuvaajan. Tämä on tavallinen kahden reaalimuuttujan reaaliarvoinen funktio $f(x,y) = \text{Re}(x + iy)^i$, jonka kuvaajasta epäjatkuvuuskohta selvästi näkyy:

perjantai 8. maaliskuuta 2019

Mikä on neliöjuuri?

Kompleksilukuihin perustuva lasku
\[ -1 = i \cdot i = \sqrt{-1}\sqrt{-1} = \sqrt{(-1)(-1)} = \sqrt{1} = +1 \] herättää aina toisinaan ihmetystä. Koska tunnetusti $-1$ ja $+1$ eivät ole sama asia, niin jonkin yhtäläisyysmerkin täytyy olla väärä. Mutta mikä?

Vastaus riippuu siitä, mitä neliöjuurella tarkoitetaan. Ainakin vielä puoli vuosisataa sitten kouluissa opetettiin, että neliöjuurella on kaksi arvoa, esimerkiksi $\sqrt{4} = \pm 2$. Sittemmin on yleistynyt määrittely, että neliöjuuri tarkoittaa aina positiivista vaihtoehtoa: $\sqrt{4} = +2$. Aiemman määritelmän mukaan neliöjuuri ei kaksiarvoisena ole funktio siinä mielessä, kuin funktioita nykyään yleensä ajatellaan. Jälkimmäisessä määrittelyssä on kyse funktiosta, jota selvyyden vuoksi ehkä kannattaisi kutsua juurifunktioksi tai neliöjuuren päähaaraksi.

Asiasta tulee hieman mutkikkaampi, jos tarkastellaan kompleksilukujen neliöjuuria. Esimerkiksi sekä luvun $-2+i$ että luvun $2-i$ toinen potenssi on $3-4i$. Kumpi olisi oikeutetummin $\sqrt{3-4i}$ ?

Luontevaa onkin joko ajatella neliöjuurta kaksiarvoisena (ja yleisemmin $n$:ttä juurta $n$-arvoisena) tai kiinnittää toinen (tai $n$:nnen juuren tapauksessa jokin) arvoista päähaara-arvoksi. Kumpi on parempi, riippuu yhteydestä. Molempia käytetään. Laskentaohjelmat käyttävät päähaara-arvoa, jolloin neliöjuuri on funktio. Neliöjuuren päähaara valitaan tällöin siten, että juuren napakulma on välillä $]-\pi/2,\pi/2]$, ts. reaaliosa on positiivinen. Jos reaaliosa on $= 0$, tulee imaginaariosan olla positiivinen (jolloin napakulma on $\pi/2$, ei $-\pi/2$). Siten esimerkiksi $\sqrt{-1} = i$ (eikä $-i$). Määrittely antaa positiivisten reaalilukujen neliöjuurille positiiviset arvot, kuten pitääkin.

Vastaavaan tapaan valitaan $n$:nnen juuren päähaara, mutta tilanne on hieman mutkikkaampi.  Lukija voi katsoa vaikka dokumenttia http://matta.hut.fi/matta/kompleksiluvut/cluvut.pdf.

Mikä alkuperäisen laskun yhtäläisyysmerkeistä sitten on väärä? Jos neliöjuurta ajatellaan kaksiarvoisena, pitäisi lopussa olla $\sqrt{1} = \pm 1$ ja kahdesta mahdollisesta merkistä pitäisi valita sopiva, ts. miinus. Jos neliöjuuren merkki tarkoittaa päähaaran mukaista funktiota, on keskimmäinen yhtäläisyysmerkki väärä. Yleisesti ei nimittäin päde $\sqrt{z_1}\sqrt{z_2} = \sqrt{z_1z_2}$. Kaikki tavanomaiset laskusäännöt eivät siirrykään rajoituksitta kompleksialueelle.

Esimerkkinä Mathematicalla tehty lasku, jonka voi toki laskea helposti käsinkin:


lauantai 16. helmikuuta 2019

Sieventäminen ei aina mene niin kuin luulisi

GeoGebran CAS

Potenssilausekkeen (herätteenä K. Väisälän algebran kirjan harjoitustehtävä, joskaan ei ihan tässä muodossa)
\[
x^{1+n} (x^{n-1})^n (x^n)^{-n}
\]
sieventäminen on useimmille lukiolaisille yksinkertainen juttu: tulos on $x$. GeoGebrakin sieventää sen ongelmitta: pelkän lausekkeen syöttäminen tosin antaa kesken jääneen tuloksen mutta lausekkeen uudelleen kutsuminen (tai suoraan Simplify/Sievennä-komennon käyttö) antaa tuloksen $x$.

Mathematica ei kuitenkaan suostu sieventämään lauseketta Simplify-komennolla, vaan palauttaa sen muuttumattomana. Mitä tästä pitäisi ajatella? Sievennys kyllä onnistuu, jos asetetaan sopiva lisäehto, esimerkiksi Simplify[lsk,x>0] tai Simplify[lsk,Element[n,Integers]], missä lsk tarkoittaa kyseistä lauseketta ja komennon jälkimmäinen argumentti määrittelee $x$:n positiiviseksi reaaliluvuksi tai $n$:n kokonaisluvuksi. Eikö sievennys pädekään rajoituksitta?

Mathematican oletuksena on, että symbolit ovat kompleksilukuja (joiden osajoukkona tietenkin ovat reaaliluvut). Tällöin siis $x$, $n$ tai laskennan välitulokset voivat olla kompleksilukuja, ellei toisin ilmoiteta. GeoGebra sen sijaan ei kompleksilukualgebraa kaikissa suhteissa käytä eikä ota huomioon mahdollisia kompleksiarvoja.

Onko sitten olemassa joitakin arvoja luvuille $x$ ja $n$, joilla lausekkeen arvo ei olekaan $x$?  Ehkä helpoin tapa lähteä tutkimaan asiaa on ajatella lauseke kahden muuttujan, $x$ ja $n$ funktioksi ja piirtää sen kuvaaja, ts. kolmiulotteisen avaruuden pinta. Tähän on olemassa komento, ja tulos on oheisen kuvan mukainen. Mitä ovat pinnan liuskat ja niiden välissä olevat tyhjät tilat?

Plot3D[lsk, {x, -2, 2}, {n, -5, 5}]

Komento Plot3D piirtää reaaliarvoisten funktioiden kuvaajia. Jos arvo on jossakin pisteessä kompleksinen, se jätetään yksinkertaisesti piirtämättä. Lausekkeen reaaliosa ja imaginaariosa ovat kuitenkin reaaliarvoisia:

Plot3D[Re[lsk], {x, -2, 2}, {n, -5, 5}]

Plot3D[Im[lsk], {x, -2, 2}, {n, -5, 5}]

Vaikuttaa siis siltä, että esimerkiksi arvolla $n = -1/5$ funktion arvot ovat kompleksisia, jos $x < 0$. Näin onkin. Arvoksi saadaan Mathematicalla laskettuna
\[
\left(\frac{\sqrt{5}-1}{4} - i\sqrt{\frac{\sqrt{5}+5}{8}}\right)x.
\]
Jos $n = -1/2$ ja $x < 0$, tulos on $-x$.

Lukija ehkä kysyy, miten murtopotenssit — tai niiden päähaarat — on tällöin määritelty ja voiko olla varma, että Mathematica laskee oikein. Tai että ylipäätään jokin laskentaohjelma laskee oikein. Varovaisuus on paikallaan. Mikään ihmisen tekemä ei yleensä ole täysin virheetöntä eivätkä määritelmätkään ole aina samoja. Saman laskun voikin varmuuden vuoksi laskea useammalla ohjelmalla. Ihan itse käsin laskeminen on lisäksi opettavaista, mutta saattaa olla työlästä eikä sekään aina virheetöntä.

Onko edellä oleva sitten laskettu oikein? Ainakin Matlab-klooni Octave laskee samoin.

maanantai 4. helmikuuta 2019

Sieventämisen kauneus ja kauheus


Lupauduin auttamaan lukiolaista matematiikan kertaamisessa ja taitojen testaamiseksi annoin ratkaistavaksi muutaman sievennystehtävän. Tällaisiahan on hieno kokoelma Kalle Väisälän klassikossa, Algebran oppi- ja esimerkkikirjan ensimmäisessä osassa, jota aikoinani itse käytin. Sievennystehtäviä ratkaistiin keskikoulun viimeisellä luokalla vastaten nykyistä peruskoulun viimeistä vuotta.

Sievennystehtävissä tuli kerratuksi polynomien ja rationaalilausekkeiden perusalgebra.  Niistä opittiin jotakin yleisempääkin: Yhtä ainoaa tietä lausekkeen sieventämiseen ei ole, vaan voidaan edetä montaa erilaista reittiä joko paljon työtä tehden tai hyvän oikotien löytäen. Lopputuloskaan ei ole yksikäsitteinen, vaan sievyys riippuu mieltymyksistä ja siitä, mitä lausekkeella on seuraavaksi tarkoitus tehdä.

Väisälällä on yhtenä esimerkkinä lauseke
\[ \frac{x^2 + \frac{1 }{x^2} + 2}{x + \frac{1}{x}}, \] jossa osoittaja ja nimittäjä voidaan ensin saattaa samannimiseiksi ja sitten suorittaa murtolausekkeiden jakolasku:
\[ \frac{\dfrac{x^4 + 1 + 2x^2}{x^2}}{\dfrac{x^2 + 1}{x}} = \frac{x(x^4 + 1 + 2x^2)}{x^2(x^2 + 1)}. \] Tekijällä $x$ voidaan supistaa ja osoittaja tunnistaa binomin neliöksi:
\[ \frac{(x^2 + 1)^2}{x(x^2 + 1)} = \frac{x^2 + 1}{x}. \]
Hieman suorempaan olisi päästy laventamalla alkuperäinen murtolauseke tekijällä $x^2$ ja tunnistamalla binomin neliö (tai suorittamalla polynomien jakolasku):
\[ \frac{x^4 + 1 + 2x^2}{x^3 + x} = \frac{(x^2 + 1)^2}{x(x^2 + 1)} = \frac{x^2 + 1}{x}. \]
Lyhin tie kuitenkin varmaan olisi tunnistaa alkuperäisen lausekkeen osoittaja binomin neliöksi:
\[ \frac{\left(x + \frac{1}{x}\right)^2}{x + \frac{1}{x}} = x + \frac{1}{x} \] Lopputulos on hieman erinäköinen kuin edellä, mutta kuitenkin yhtäpitävä. Molempia voidaan pitää kohtuullisen sievinä.

Tällaisia sievennyksiä ei nykyään enää taideta koulussa juurikaan opetella. Pitäisikö kuitenkin?

Pelkkä lausekkeiden sieventäminen sujuu kyllä helposti symbolisilla ohjelmilla. Tällöin ei kuitenkaan kehity laskijan taito hahmottaa rakenteita ja tarpeen tullen muuntaa lauseke johonkin muuhun kuin ohjelman sievänä pitämään muotoon. Arvelen, ettei Väisäläkään pitänyt tärkeänä konstikkaiden lausekkeiden sieventämistä sinänsä vaan taitoa yleensä muokata lausekkeita, ja tähän sievennystehtävät olivat hyvää harjoitusta. Aivan kuten polkupyörällä temppuilu johtaa varmuuteen pyörän hallitsemisessa yllättävissäkin tilanteissa.

Symbolisissa laskentaohjelmissakaan lausekkeen muokkaus ei ole aina suoraviivaista.  Esimerkiksi Mathematica tarjoaa yleiskäyttöisen Simplify-komennon lisäksi joukon spesiaalimpia muokkauskomentoja: Expand, ExpandAll, TrigExpand, PowerExpand, ComplexExpand, FunctionExpand, Reduce, TrigReduce, ExpToTrig, TrigToExp, Together, Apart, Cancel, ... Näiden käyttö edellyttää näkemystä siitä, mitä on tekemässä. Mekaanisen työn ne kyllä hoitavat.

sunnuntai 6. tammikuuta 2019

Miten laskea reitti Korvatunturilta Pääsiäissaarelle

Reitti Korvatunturilta Pääsiäissaarelle

Edellisessä blogikirjoituksessani — Joulusadussa — oli kyse lyhimmän reitin laskemisesta Korvatunturilta Pääsiäissaarelle. Sadussa Korvatunturin tontut eivät suoriutuneet tehtävästä ja se tilattiin konsultilta, jonka palkkio osoittautui isoksi. Miten reitti — pituus ja lähtösuunta — pitäisi laskea, kun lähtötietoina ovat Korvatunturin ja Pääsiäissaaren maantieteelliset koordinaatit?

Digitaalimaailmassa on tarjolla ohjelmistoja, joilla laskenta sujuu lähes asioita ymmärtämättä.  Koordinaatit löytyvät vaikka Googlen karttojen avulla: klikkaus kyseiseen pisteeseen ja valinta 'Mitä täällä on?'.  Tuloksena saadaan leveys ja pituus: ktunturi = {68.07, 29.32}, psaari = {-27.11, -109.35}.  Ainakin laskentaohjelma Mathematica tarjoaa valmiit funktiot etäisyyden ja lähtösuunnan laskemiseen:


Reitin piirtäminenkään ei ole vaikeata (kuva alussa):


Sadussa tarvittu pienoiskopterin viimeinen mahdollinen huoltopaikkakin saadaan valmiilla funktiolla:


Tämä osuu Meksikon Tyynenmeren rannikolle.

Olisiko tällaisten työkalujen hallinta sitten matematiikkaa? Kun lukion opetussuunnitelmakin painottaa teknisten apuvälineiden käyttöä, tulisiko matematiikan opetuksessa keskittyä ohjelmistotyökaluihin?  Seuraamalla ns. CAS-laskentaa ja ohjelmistojen ongelmia koskevaa keskustelua syntyy käsitys, että tällainen ajattelu valtaa alaa. Muuhun ei aikaa ole.

Ohjelmistojen käyttökoulutus ei kuitenkaan ole matematiikkaa, eikä koulumaailman digitalisointia voisi pahemmin väärin ymmärtää. Silti digitalisoinnilla on paikkansa. Sen järkevä ja hyödyllinen käyttö on vain jäänyt paljolti pohtimatta.

Millä muulla tavalla sitten joulusadun tehtävät voitaisiin laskea? Kovin vaativasta asiasta ei ole kyse. Trigonometriset funktiot — lähinnä sini ja kosini — on ymmärrettävä, lisäksi tarvitaan vektorialgebraa ristitulo mukaan luettuna. Tämän jälkeen tervettä järkeä ja kykyä sommitella asioita yhteen. Viimeksi mainitut ovat hyödyllisiä taitoja muuallakin kuin matematiikassa. Paikallaan oppia lukiossa.

Entä digitaalisuus? Ohjelmointi on hyödyllinen taito, jonka tunteminen auttaa ymmärtämään modernin maailman toimintaa. Joulusadun ongelmien ohjelmointikaan ei ole liian vaativa tehtävä, jos käytettävissä on yksinkertainen mutta hyvä ohjelmointiympäristö (jota ei kyllä nykyään kouluihin tarjottavista ohjelmistoista taida löytyä). Toimiva itse tehty ohjelma myös osoittaa, että tarvittava matematiikka on ymmärretty. Saattaisi antaa kiinnostavan näkökulman matematiikkaan ja sen sovelluksiin.

Tämäntyyppisellä ohjelmoinnilla olisi paikkansa lukion matematiikassa. Se myös pakottaisi syventymään varsinaiseen matematiikkaan vain lukiossa käytettävien ohjelmistojen sijasta.

En selvittele joulusadussa tarvittavaa laskentaa tarkemmin. Kiinnostuneet löytävät sen kirjastani Vaellusretkiä matematiikkaan (http://www.elisanet.fi/simo.kivela/vaellmat.html).