sunnuntai 21. kesäkuuta 2020

Laskentaohjelman rönsyt

Olen käyttänyt laskentaohjelma Mathematicaa sen syntymästä saakka, vuodesta 1988. Pääversioita on tähän mennessä kertynyt 12 ja laajentuminen on ollut melkoista. Kyseessä on edelleen pääasiassa matemaattinen laskentaohjelma, mutta rönsyilyä on tapahtunut moneen suuntaan: dynaamisia animaatioita, dokumenttimuoto nimeltään computable document format, ohjelmointikieli, verkkoresursseja, kuvankäsittelyä, kartografiaa jne. Ehkä erikoisimpana Wolfram Researchin tietokanta, josta Mathematican komennoilla voidaan hakea monenlaista silpputietoa. Osittain nämä rönsyt ovat varmaan kokeellisia: katsotaan, mikä voisi olla järkevää ja miten se pitäisi toteuttaa.

En pyri minkäänlaiseen kattavaan esittelyyn, vaan jätän markkinoinnin Wolfram Researchille (https://www.wolfram.com/). Tyydyn kertomaan kartografiaan ja tietokantoihin liittyvistä kokeiluistani kesähelteiden ratoksi.

Wolfram Knowledgebase sisältää mm. luettelon Europpan maista. Jokaisesta maasta löytyy kartografista tietoa ja melkoinen määrä tilasto- ym. dataa. 

Euroopan maat Wolfram Knowledgebasen mukaan

Suomeen liittyvien ominaisuuksien listan alkuosa Wolfram Knowledgebasessa

Tietoja voidaan yhdistellä ja kohdistaa niihin laskutoimituksia computable document format -hengessä. Siten on esimerkiksi mahdollista koostaa kuva Euroopan valtioiden ääriviivoista ja värittää maa harmaasävyllä, joka on sitä tummempi, mitä suurempi on maan pääkaupungin väkiluvun suhde koko maan väkilukuun.

Euroopan maat ääriviivoina

Lukija voi yrittää tunnistaa maat oheisesta kuvasta. Kunkin maan kohdalla mittakaava on mitä on, pohjoinen on kuitenkin kaikissa ylöspäin.

Data on peräisin Wolframin tietokannoista, mutta mistä se on sinne tullut, ei käsittääkseni ilmene.  Lähdekritiikkiä ei siis pääse helposti harjoittamaan. Tietokannassa on Suomen väkiluku vuosittain aika pitkältä ajalta. Otin tiedot sadan vuoden ajalta 1910–2010, piirsin grafiikan ja vertasin Tilastokeskuksen sivuilta saatavaan dataan. Olivat samanlaiset.

Otin vastaavalla tavalla Helsingin väkilukutiedot ja laskin suhteen Suomen väkilukuun vuosittain. Grafiikka tuotti yllätyksen:

Helsingin väkiluvun suhde Suomen väkilukuun vuosittain Wolfram Knowledgebasen mukaan

Tarkempi selvittely osoitti, että tietokannassa ei olekaan Helsingin väkilukua kuin kymmenen vuoden välein ja välivuosina toistetaan samaa lukua. Dataa pyydettäessä tämä ei kuitenkaan ilmene. Suomen väkiluku sen sijaan on vuosittain.

Lähdekritiikki siis on tarpeen. Millä perusteella monet valinnat on tehty, jää myös avoimeksi. Edellä olevassa Euroopan valtioiden luettelossakin on monia, joita ei oikeastaan odottaisi. Vielä selkeämmin tämä tulee esiin pyydettäessä Helsingin osalta luetteloa 'notable people who died in city', joka sisältää 77 henkilöä ja alkaa seuraavasti:

Alvar Aalto, Tom of Finland, Tove Jansson, Paavo Johannes Nurmi, Urho Kekkonen, Mika Waltari, Juho Kusti Paasikivi, Frans Eemil Sillanpää, Artturi Virtanen, Hannes Kolehmainen, Kaarlo Juho Ståhlberg, Carl Ludvig Engel, Harri Holkeri, Rolf Herman Nevanlinna, Timo Sarpaneva, Tapio Rautavaara, Ville Ritola, Paavo Berglund, Leena Peltonen-Palotie, Ernst Leonard Lindelöf, Lauri Kristian Relander, Karl Frithiof Sundman, Edward Vesala, Clas Thunberg, Matti Järvinen, Hjalmar Mellin, Albin Stenroos, Lars Sonck, Tommy Tabermann, Heino Kaski, Richard Stites, J. S. Sirén, ...

Ehkäpä, mutta miksi juuri nämä? Ja onko kuolinpaikka merkityksellinen näkökulma?

Vertailun vuoksi otin Botswanan pääkaupungin Gaboronen 'notable people born in city'. Tuloksena yksi henkilö, Mpule Kwelagobe, jonka 'occupation' on 'beauty queen' ja josta 'notable facts' ei anna mitään. En Botswanan merkkihenkilöistä paljoakaan tiedä, mutta Wikipedia-artikkeli antaa Mpule Kwelagobesta paljon monipuolisemman kuvan.

Edellä sanottu antaa Wolframin tietokannoista ehkä hieman turhan huonon kuvan. Kyllä siellä on hyödyllistä ja hyvin järjestettyäkin tietoa, mutta vaikeata on välttyä silppukokoelman vaikutelmalta. Lähdekritiikkiä ei voi harjoittaa, ajantasaisuus jää avoimeksi. Maailmassa ja verkossa on luotettavampiakin lähteitä. Ihmettelen Mathematican laajentamista tähän suuntaan. On lähdetty puremaan liian suurta palaa. Kaikenkattavuus ei ole järkevä tavoite. Ja lisääkö vai vähentääkö tämä ohjelman arvostusta?