Kirjallisuutta: Koneoppiminen
Ethem Alpaydin: Koneoppiminen. Terra Cognita 2021, 248 sivua.
Tekijä on Turkin tiedeakatemian jäsen ja Bogaziçi-yliopiston emeritusprofessori. Siitä huolimatta Koneoppiminen on kirjoitettu tavallisen ihmisen ymmärtämällä kielellä. Kirjan erityinen ansio ovat sen sisältämät runsaat käytännön esimerkit. Tieteentekijän tausta vilahtaa välistä näkyviin esimerkiksi väliotsikossa ”Generatiiviset adversiaaliset neuroverkot”. Muualla tekstissä oppisanoja ei viljellä kohtuuttomasti. Ne muutamatkin selitetään noin sata keskeistä käsitettä käsittävässä sanastossa. Niillä on toisaalta olennainen merkitys, sillä niihin perustuu osittain se, että kirja antaa käsitteellisen viitekehyksen ilmiökentän ymmärtämiseen.
Koneoppiminen kuuluu datatieteen alaan. Muutama siihen liittyvä kirja on esitelty aikaisemmin Dimensiossa: Syväoppiminen (25.2.2021), Datatiede (29.4.20211) ja Tekoälyn etiikkaa (6.7.2021). Uusikin kirja on tarpeen, sillä se valottaa aihetta itseoppivien järjestelmien näkökulmasta. Vanhasta tietotekniikasta, ohjelmoinnista ja tekoälystäkin perillä oleva lukija yllättyy siitä, miten monenlaisia menetelmiä koneoppimiseen on kehitetty ja mihin kaikkeen itseoppivat järjestelmät soveltuvat.
Kirjoittajan mielestä ihmisen älykkyys on erilaista kuin koneen. Siksi se, että tekoäly voittaa parhaimmatkin inhimilliset mestarit esimerkiksi shakissa ja go-pelissä, voi johtaa tekoälyn ylivertaisuutta korostavaan harhaan. Tietokone (tekoäly) on vahvimmillaan laajojen aineistojen käsittelyssä, harkinnassa ja suunnittelussa. Ihmisen äly on puolestaan kehittynyt tekemään nopeita päätöksiä joskus hyvinkin vähäisten aistihavaintojen ja pikaisen päättelyn varassa.
Rajoittamatonta ja hallitsematonta tekoälyä on joskus pidetty ydinaseitakin vaarallisempana tulevaisuudenkuvana. Kirjoittajan sanoma on rauhoittava. Hän ei vertaa niinkään ihmisen älyn ja (tulevaisuuden) tekoälyn tasoa toisiinsa yksioikoisesti, niin kuin usein ehkä poleemisestikin tehdään. Hänen mielestään on syytä pelätä huonosti ohjelmoitua tai huonosti opetettua tekoälyä enemmän kuin superälykkäitä koneita.
Kirja on jaettu kahdeksaan lukuun, joiden otsikot antavat hyvän käsityksen aihepiirin jäsentämisestä: koneoppiminen, tilastotiede ja aineiston analyysi; hahmontunnistus; neuroverkot ja syväoppiminen; suositusten ja rypäiden oppiminen, toimintaan ryhtymisen oppiminen sekä haasteet ja riskit. Edellä jo mainitsemani nelitoistasivuisen sanaston lisäksi kirjassa on selittäviä lähdeviitteitä, noin 50 kirjan kirjallisuusluettelo ja lähes 500 sanan asiahakemisto.
Olkoon seuraava esimerkkinä lähdeviitteiden tyylistä ja yksityiskohtaisuudesta: ”Ladattavat litiumakut olivat ratkaisevia kannettavien tietokoneiden, musiikkisoitinten ja älypuhelinten kaltaisten kannettavien elektroniikkatuotteiden rakentamisessa. Vuonna 2019 Nobelin kemian palkinto annettiin kolmelle tämän teknologian mahdollistaneelle tutkijalle.” Vastaavalla tavalla selostetaan esimerkiksi painetun ja käsinkirjoitetun tekstin tunnistamisen eroa.
Varsinainen teksti vilisee yksityiskohtia mobiililaskennasta, aivojen ymmärtämisestä, tilastomenetelmistä, oppimisesta, neuroverkoista ja monesta muusta. Esitystapa on konkreettista. Sitä tuetaan esimerkein ja kaaviokuvin. Kirjoittajan pitkäaikaisen ja monipuolisen kokemuksen – onhan hän Turkin lisäksi opiskellut Sveitsissä ja työskennellyt Yhdysvalloissa MIT:ssä ja Berkelyssä – ansiosta hän pystyy valottamaan myös historiallista kehitystä ja auttamaan siten lukijaansa ymmärtämään, miten nykytilanteeseen on tultu ja mitä tulevaisuudelta on (ehkä) odotettavissa.
Olkoon tästä esimerkkinä seuraava lainaus. ”Ensimmäisten henkilökohtaisten tietokoneiden kovalevyn kapasiteetti oli viisi megatavua. Nykyään tyypillisessä tietokoneessa on viisisataa gigatavua. Tallennuskapasiteetti on siis satatuhatkertaistunut noin kolmessakymmenessä vuodessa.” Vastaavalla tavalla hän kuvaa suuraineistojen keräämiseen ja analysoimiseen liittyviä riskejä. ”Aikaisemmin ihmisiä koskeva informaatio jakautui aineistojen kerääjille, joista kullakin oli pääsy vain tarvitsemaansa osaan – – [nykyään] palat voidaan yhdistää erittäin yksityiskohtaisiksi henkilöä koskeviksi päätelmiksi. Tämä on sekä aineistoista oppimisen voima että sen riski.” Tämä jälkeen tekijä analysoi aineiston yksityisyyden perusvaatimuksia ja toteuttamiskeinoja.
Vaikka aiheesta on kirjoitettu paljon, niin tämäkin kirja kannattaa lukea. Pohdiskeleva ote ja runsaat käytännön esimerkit antavat syvyyttä ja uskottavuutta kirjoittajan sanomisille. Nykyään puhutaan suuraineistoista, mutta aineistojen koko näyttäisi kasvavan edelleen. Tämä ei ole ainakaan tekninen ongelma, sillä myös tietokoneiden laskentateho kasvaa jatkuvasti. Oppivista järjestelmistä tulee yhä älykkäämpiä. Kirjoittajan mielestä koneoppiminen vaikuttaa lupaavimmalta tavalta lähestyä ihmisen tasoista älykkyyttä.