sunnuntai 30. toukokuuta 2021

Mitä ovatkaan logaritmitaulut?

Edellisessä blogijutussani mainitsin ohimennen logaritmitaulut. Vielä 60-luvulla jokainen lukiolainen oppi suorittamaan numeerisia laskuja logaritmitauluja käyttäen, mutta 70-luvulle tultaessa elektroniset laskimet muuttivat numeerisen laskennan täysin ja logaritmitaulut jäivät historiaan. Miten siis ennen laskimia laskettiin?

Ongelmana oli useasta numerosta muodostuvien lukujen kertolasku ja jakolasku. Käsin laskemalla nämä olivat työläitä ja virhealttiita. Neliöjuuren laskeminen tai yleisemmin murtopotenssiin korottaminen olivat toki mahdollisia, mutta vielä työläämpiä. Yhteen- ja vähennyslasku eivät niinkään olleet ongelmia, niissä työmäärä oli huomattavasti vähäisempi.

Logaritmifunktio ja sen taulukoidut arvot muodostivat oikotien. Kertolaskun tapauksessa perustana on identiteetti \[ \log(a) + \log(b) = \log(ab).  \] Taulukosta haettiin tulontekijöiden $a$ ja $b$ logaritmit ja nämä laskettiin yhteen, jolloin saatiin tulon $ab$ logaritmi. Käyttämällä taulukkoa käänteisesti haettiin logaritmia vastaava luku $ab$. Työläs kertolasku oli vältetty. Jakolasku palautui vähennyslaskuun identiteetin \[ \log(a) - \log(b) = \log(a/b) \] avulla. Juurenotto ja potenssiinkorotus palautuivat näitä hieman helpompiin kerto- tai jakolaskuihin yhtälön \[ p\log(a) = \log(a^p) \] perusteella.

Jotta kaikkien lukujen (tai ainakin tavattoman monen luvun) logaritmeja ei tarvinnut taulukoida, oli käytettävä Briggsin logaritmeja, joiden kantalukuna on 10. Luku jaetaan aluksi tuloksi, jossa edellinen tekijä on jokin $10$:n potenssi ja jälkimmäinen on välillä $]1,10[$. Esimerkiksi \[ 1234000 = 10^6 \cdot 1.234, \qquad 0.0001234 = 10^{-4} \cdot 1.234.  \] Luvun logaritmi on tekijöiden logaritmien summa. Edellisen tekijän logaritmi on $10$:n eksponentti; tätä kutsutaan karakteristikaksi. Jälkimmäisen tekijän logaritmi — nimeltään mantissa — haetaan taulukosta.  Tarvitaan siis vain väliltä $]1,10[$ jollakin tiheydellä otettujen lukujen logaritmit. Nämä ovat välillä $]0,1[$. Lukiolaisilla oli aikoinaan käytössä taulut, joissa logaritmit annettiin viiden numeron tarkkuudella.  Kuudes numero oli mahdollista saada interpoloimalla, mitä varten tauluissa oli pienet 'Partes proportionales' -aputaulut päässälaskua helpottamaan. Tauluja oli 37 sivua. (G. J. Hoüel, V. J. Kallio, Logaritmitaulut; alunperin ranskalaiset, joista suomalainen versio oli tehty valokuvaamalla alkuperäiset taulut ladontavirheiden välttämiseksi.)

Logaritmitaulujen sivu


Lukujen logaritmit esitettiin yleensä ns. normaalimuodossa pitäen karakteristika ja mantissa erikseen näkyvissä. Edellä olevien esimerkkien logaritmit saivat tällöin muodon (ks. kuvassa näkyvän taulukon alinta riviä!) $0.09132+6 = 6.09132$ ja $0.09132-4$. Joissakin tilanteissa — jos esimerkiksi jakolaskussa jouduttiin vähentämään pienemmästä mantissasta isompi — voitiin käyttää muutakin muotoa kuten $1.09132-5$ jälkimmäiselle esimerkkiluvulle.

Laskut oli syytä tehdä johdonmukaisesti. Tunnettu (ja arvostettu) Väisälän algebran oppikirja antoi tähän yksityiskohtaiset nyrkkisäännöt ja tähdensi huolellisuuden merkitystä: 'On tärkeätä tottua suorittamaan logaritmilaskut hyvin järjestettyinä.'

Alla oleva kuva on Väisälän esimerkki hieman mutkikkaammasta logaritmilaskusta hyvin järjestettynä.

Osamäärän ja juuren laskeminen


Logaritmifunktion arvojen lisäksi tauluissa oli trigonometristen funktioiden arvojen logaritmit. Näitä oli 45 sivua. Tauluja käytettiin lukion trigonometrian kurssissa kolmioiden ratkaisemiseen. Alla oleva esimerkki on lyhyen kurssin oppimäärästä Väisälän trigonometrian kirjasta.

Suorakulmaisen kolmion ratkaiseminen


Logaritmitaulujen ohella oli toinenkin oikotie numeeriseen laskemiseen: laskutikku. Tämä on logaritmitaulujen analoginen versio, jossa tikun kieltä ja hahloa liikuttelemalla saadaan tulos muutaman numeron tarkkuudella, yleensä pienemmällä kuin logaritmitauluja käytettäessä. Laskutikut kehittyivät logaritmitauluja monipuolisemmiksi laskuvälineiksi. Vielä 1960-luvulla laskutikku oli yleisesti käytössä esimerkiksi yliopisto-opintojen fysiikan laboratoriotöissä.Verkkoartikkeleita laskutikuista (slide rule, Rechenschieber, règle à calcul) löytyy runsaasti. Käyttöä voi myös harjoitella virtuaalisesti.


Laskutikku

Elektronisten laskimien tulo siirsi sekä logaritmitaulut että laskutikut hetkessä historiaan. Numeeriset laskut muuttuivat näppäimien paineluksi ja ohjelmoinniksi, laskennassa alkoi uusi aikakausi. Lukion matematiikkakin helpottui huomattavasti ainakin näiltä osin.

sunnuntai 23. toukokuuta 2021

Benfordin jakauma

Jotakin tilastodataa katsellessa tuntuu usein siltä, että datassa on ykkösellä alkavia lukuja eniten. Loppupään lukuja 7, 8, 9 on ensimmäisenä numerona huomattavasti vähemmän. Esimerkiksi Terveyden ja hyvinvoinnin laitoksen verkkosivuilta on saatavissa koronavirustartunnat viikoittain ja päivittäin pandemian koko ajalta. Näiden ensimmäisistä numeroista tehdyt jakaumat näyttävät seuraavilta:


Viikoittaisten tartuntojen ensimmäisen numeron jakauma

 

Päivittäisten tartuntojen ensimmäisen numeron jakauma

Samaan tapaan voidaan tarkastella Suomen kuntien väkilukuja, pinta-aloja ja väentiheyksiä. Sama ilmiö näkyy näissäkin (keltaiset pylväät, mustat pisteet viittaavat alempana esiteltävään Benfordin jakaumaan):

Kuntien väkilukujen ensimmäisen numeron jakauma

Kuntien pinta-alojen ensimmäisen numeron jakauma

Kuntien väentiheyksien ensimmäisen numeron jakauma



Ykkösten osuus näyttäisi olevan 30 prosentin paikkeilla, kakkosia on 15-20 prosenttia, kolmosia 10-15 prosenttia, nelosia kymmenkunta prosenttia, loppuja alenevasti muutamia prosentteja. Vaihtelu on melko suurta.

Ilmiöön kiinnitti huomiota amerikkalainen sähköinsinööri ja fyysikko Frank Benford julkaisussaan The Law of Anomalous Numbers vuonna 1938. Hän ei tosin ollut ensimmäinen, sillä jo 1881 oli kanadalainen astronomi ja matemaatikko Simon Newcomb havainnut logaritmitaulujen alkupään olevan kuluneempia kuin myöhemmät sivut ja päätellyt tästä laskuissa tarvittavien lukujen yleisemmin alkavan alkupään numeroilla.

Julkaisussaan Benford esitti jakauman, jota sittemmin on alettu kutsua Benfordin jakaumaksi. Todennäköisyys, että luvun ensimmäisen numero on $d$, on \[ \log_{10}\Bigl(1+\frac{1}{d}\Bigr), \quad d = 1,2,3,4,5,6,7,8,9.  \] Prosentteina todennäköisyydet ovat 30.1, 17.6, 12.5, 9.7, 7.9, 6.7, 5.8, 5.1 ja 4.6. Mustat pisteet yläpuolella olevissa kuvissa esittävät Benfordin jakaumasta laskettuja arvoja.

Äkkiseltään tulos tuntuu ihmeelliseltä. Eikö olisi luonnollisempaa, että ensimmäinen numero jakautuisi tasaisesti, ts, jokaisen numeron todennäköisyys olisi noin 11 %? Näinhän käy, kun tarkastellaan esimerkiksi väliltä $]0,1[$ tasaisesti arvottuja satunnaislukuja. Tilastodata ei tosin ole satunnaislukuja, ja tulos riippuu myös siitä, miltä väliltä tasaisesti jakautuneet satunnaisluvut arvotaan.

Useista tilastodatoista on laskettu ensimmäisen numeron jakaumia, ja erittäin usein nämä noudattavat Benfordin jakaumaa ainakin kohtuullisella tarkkuudella. Miksi näin käy?

Ensimmäisen numeron jakauma voidaan laskea mistä tahansa lukujoukosta, ei yksinomaan jostakin tilastodatasta. Sadan ensimmäisen Fibonaccin luvun ensimmäiset numerot näyttävät noudattavan Benfordin jakaumaa kohtuullisen tarkasti. Sama koskee väliltä $]0,\pi/2[$ otettuja sataa tangenttifunktion arvoa, joista otetaan ensimmäinen merkitsevä (nollasta eroava) numero, mutta ei vastaavasti muodostettuja sinifunktion arvoja.

Fibonaccin lukujen ensimmäisen numeron jakauma

Tangenttifunktion ensimmäisen numeron jakauma

Sinifunktion ensimmäisen numeron jakauma


Ilmiön syy alkaa paljastua tarkastelemalla kakkosen (tai yhtä hyvin monen muun luvun, vaikkapa kolmosen) potensseja. Tuhannen ensimmäisen kakkosen potenssin ensimmäiset numerot noudattavat täydelleen Benfordin jakaumaa:

Kakkosen potenssien ensimmäisen numeron jakauma


Alkaa vaikuttaa siltä, että eksponentiaalinen kasvu jotenkin liittyy Benfordin jakaumaan. Tämä on kuitenkin hieman hätäinen huomio: tarkasteltavia lukuja voidaan nimittäin jokaista erikseen skaalata 10:n potensseilla ilman, että ensimmäinen (merkitsevä) numero muuttuu. Jakaumakaan ei tällöin muutu.

Tarina siis on monimutkaisempi. Tyydyn viittaamaan Rashida Hakimin blogikirjoitukseen Putting #1 First – Deriving Benford’s Law. Huolellinen esitys ja lukiotiedoilla luettavissa, vaikka tietty matemaattinen kypsyys saattaakin olla tarpeen.