Kaunista dataa

Kaaviot ovat tapa tiivistää tilastotietoa nopeasti hahmotettavaan muotoon. Ne saattavat myös paljastaa asioita, joiden tilastoiminen ei tule tavallisen ihmisen mieleenkään. Eivätkä ne kaikki aina ole ulkoasultaan mitään ”kuivia” tilastoja.

Tilastografiikan aloitteentekijänä pidetään skotlantilaista insinööriä ja taloustieteilijää William Playfairia[1]. Hänen keksintöjään ovat mm. tavallisimmat kaaviotyypit kuten pylväs-, viiva- ja piirakkakuviot. Viivadiagrammia hän käytti suorastaan luovalla tavalla esimerkiksi kuvatessaan Englannin sekä Norjan ja Tanskan välisen kaupan tasapainoa aikasarjana (kuva 1). 

Kuva 1: Nettoerotustyyppinen viivakuvio Playfairin kirjasta [2]

Tilastot kertovat kaikista inhimillisen tiedon alueista. iietoa voidaan esittää tilastokaavioilla eli diagrammeilla, teemakartoilla ja havainnekuvilla nopeasti hahmotettavassa ja helposti ymmärrettävässä muodossa. Tilastokaavioiden ulkoasussa vain mielikuvitus on rajana. Yksittäisestä kaaviosta on vain pieni siirtymä infografiikkaan [3], [4], joka tarkoittaa esityksiä, jotka sisältävät kaavio(ide)n lisäksi selitystekstejä.

Reddit/dataisbeautiful

Reddit on kaupallinen kalifornialainen sosiaalisen median alusta. Vuoden 2023 lopulla sillä oli 73 miljoonaa käyttäjää. Teemamme näkökulmasta kiinnostava on sen alasivu Dataisbeautiful [5]. Siellä on vaihtuva kokoelma tilastoesityksiä. Jotkut visuaalisesti parhaista eivät aina esitä kovinkaan merkityksellistä dataa, esimerkiksi yhden pelaajan heittopaikat koripallossa (kuva 2) tai maiden nimissä esiintyvät kirjaimet (kuva 3).

Kuva 2: Dwyane Wade oli Miami Heathin avainpelaajia vuosina 20032019. Kuva: Nimimerkki BeyondTheRK

Kuva 3: Kuinka monessa maan englanninkielisessä nimessä kukin kirjain esiintyy. Kuva: Nimimerkki EveningInfinity

Paljon yleisempää merkitystä on kasvihuonekaasupäästöjä kuvaavalla kaaviolla (kuva 4). Sitä kannattaa katsoa myös suomalaisen tekijän omilta verkkosivuilta [6], sillä siellä on monia muitakin kiinnostavia kaavioita.

Kuva 4: kasvihuonekaasupäästöt vuonna 2022 maittain asukasta kohti laskettuna. Kuva: Ville Seppälä.

Information is beatiful

Information is beautiful [7] on riippumaton yhdysvaltalainen yhteisö. Se pyrkii kuvaamaan ja selittämään maailman tilaa infografiikan ja datan visualisoinnin keinoin. Senkään tilastokuviot eivät ole tavanomaisia pylväs- tai piirakkakaavioita.

Maailman väkirikkaimpien valtioiden väestömääriä kuvataan ympyrällä [8], joka on jaettu väestömäärään verrannollisiin osiin (kuva 5). Valtameren vedenpinnan nousua [9] esittävä kaavio on enemmänkin infografiikan kuva kuin tilastokaavio (kuva 6). Monet kaavioista ovat dynaamisia ja vuorovaikutteisia, joten niitä kannatta tarkastella verkossa, sillä staattinen kuva (kuva 7) ei tee niille oikeutta, esimerkiksi suurten kielimallien kehitystä ja laajuutta kuvaava kaavio [10].

Kuva 5: Maailman maat, joissa asuu enemmän kuin 20 miljoonaa ihmistä
Kuva 6: Miten eräille rantakaupungeille käy vedenpinnan noustessa (osakuva)
Kuva 7: Suurten kielimallien kehitys (osakuva)

Tilastokeskus

Tilastokeskuksella on kaksikin tilastojen käyttöön johdattelevaa opasta: Tilastojen lukutaito [11] ja Tilastokuviot tutuiksi [12]. Edellinen kertoo Tilastokeskuksesta itsestään sekä tilastotiedon kokoamisesta, käytöstä ja tulkitsemisesta. Siinä selostetaan enemmänkin tilastokäsitteitä eikä niinkään esitellä erilaisia tilastokuvaajia. On siellä kuitenkin koukuttaviakin osuuksia, kuten esimerkiksi pakopeli Trollibunkkeri [13].

Tilastokuviot tutuiksi -opas kertoo perinteisen esittämistapojen ohella vuorovaikutteisista kaavioista ja peleistä. Siellä on myös ohjeita tilastokuvion laatijalle. Olkoon esimerkkinä Suomen kartan muotoon laadittu kaavio, joka kuvaa vuoden 2020 riistakolareiden suhteellisia määriä kunnittain (kuva 8).

Kuva 8: Vuonna 2020 tapahtuneet riistakolarit kunnittain. Tilastokeskuksen verkkosivulla kaavio on dynaamisena [14]; kun kohdistin osoittaa ympyrää, tulee näkyviin yksittäistä kuntaa koskeva tilasto. 

Tilastokeskuksen opastussivustoon kannattaa tutustua senkin vuoksi, että siellä esitellään yleisimmät kuviotyypit ja esimerkkejä epätavallisemmistakin [15] (kuva 9).

Kuva 9: Suomen väestöennuste vuodelle 2060 pyramidikaaviona

Lähteitä ja lisää luettavaa

[1] Wikipedia: William Playfair https://en.wikipedia.org/wiki/William_Playfair

[2] William Playfair (1801): The Commercial and Political Atlas (3rd edition) https://ia601009.us.archive.org/5/items/PLAYFAIRWilliam1801TheCommercialandPoliticalAtlas/PLAYFAIRWilliam1801TheCommercialandPoliticalAtlas.PDF, kuva 123 (sivu 72).

[3] Wikipedia: Infografiikka osoitteessa https://fi.wikipedia.org/wiki/Infografiikka

[4] Wong, Krystle (2023): 10 Data Presentation Examples For Strategic Communication https://venngage.com/blog/data-presentation-examples/

[5] Reddit: Data is beautiful https://www.reddit.com/r/dataisbeautiful

[6] Ville Seppälän blogi osoitteessa https://villeseppala.wordpress.com/

[7] Information is beautiful https://informationisbeautiful.net/about

[8] Where do all the people live https://informationisbeautiful.net/visualizations/world-population

[9] When Sea Levels Attack! https://informationisbeautiful.net/visualizations/when-sea-levels-attack-2

[10] The Rise of A.I. Large Language Models https://informationisbeautiful.net/visualizations/the-rise-of-generative-ai-large-language-models-llms-like-chatgpt

[11] Tilastokeskus: Tilastojen lukutaito https://guides.stat.fi/tilastojenlukutaito

[12] Tilastokeskus: Tilastokuviot tutuiksi https://guides.stat.fi/tilastokuviot-tutuksi/oppaan-esittely

[13] Tilastokeskus: Trollibunkkeri https://yle.fi/aihe/artikkeli/2020/11/11/trollibunkkeri

[14] Tilastokeskus: Visualisointihackathon 2021 https://visukintut.github.io/visualisointi_2021

[15] Tilastokeskus: Muita kuviotyyppejä https://guides.stat.fi/tilastokuviot-tutuksi/muita-kuviotyyppeja

Kirjoittaja