Tekoälyn vauhti kiihtyy
Kuvittele tyhjä Helsingin Olympiastadion, jonne tipahtaa pisara vettä. Minuutin päästä sataa kaksi pisaraa. Sade kiihtyy sademäärän tuplaantuessa minuutin välein. Milloin stadion on täynnä vettä?
Opiskelin Otaniemessä tietotekniikkaa 80–90-lukujen vaihteessa, jolloin akatemiaprofessori Teuvo Kohosen itseorganisoituvat kartat olivat kuuma aihe. Vuosikymmenten aikana tietokoneiden laskentakapasiteetti räjähti ja tiedon tallentamisen hinta romahti. Piilaaksoon ja Kiinaan syntyi datajättejä, joissa panostettiin koukuttaviin some-algoritmeihin. TikTok-käyttäjä viettää aikaa puolitoista tuntia päivässä peukaloaan heilutellen, kiitos aistejamme huijaavien tekoälyalgoritmien.
Vuonna 2017 Google kokosi yhdentoista tutkijan ryhmän, jolle annettiin tavoitteeksi kehittää parempi hakukone. Sellainen, jonka kanssa voisi keskustelutyylisesti hakea tietoa, ja jolle voisi myös antaa palautetta. Ryhmä rakensi yhden ensimmäisen tunnetuista laajoista kielimalleista (LLM – large language model).
Parin vuoden kehitystyön jälkeen Googlen alusta kykeni jo varsin hyvään keskusteluun englanniksi. Alustalle pystyi kirjoittamaan virkkeitä, ja todennäköisyyksin pohjautuva algoritmi vastasi jotakuinkin englanniksi. Aluksi vastauksissa oli runsaasti asiavirheitä ja usein myös kielioppi ontui. Kielimalliin tankattiin lisää dataa, hallusinointi väheni ja kielen oikeellisuus parani. Eräänä päivänä tutkija keksi kysyä alustalta kysymyksen persiaksi. Tiimin yllätykseksi alusta vastasi persiaksi, ei täydellisesti, mutta kuitenkin!
OpenAI on tämän hetken tunnetuin generatiivinen LLM-tekoälyalusta. Tätä kirjoittaessa on käytössä OpenAI ChatGPT versio 4.0, ja versiota 4.5 odotetaan. Laajojen kielimallien datamäärät ovat kasvaneet massiivisista kolossaalisiin ja samalla kymmenet pienet marginaalikielet, kuten Suomi, toimivat LLM-alustoilla yhä paremmin.
Internetin tarjoamaa opetusdatamäärää on alettu kasvattaa generoidulla informaatiolla: tekoälyalustat tuottavat synteettistä opetusdataa seuraavan LLM-tekoälyalustan opetusaineistoksi. Globaalit jätit pelaavat miljardeilla ja voittajien palkinnot tulevat olemaan isoja; kuka hallitsee peliä ja kerää rahat?
Laajat tietomallit eivät kosketa pelkästään maapallon kaikkia kirjoitettuja kieliä, vaan lähes mikä tahansa informaatio ja ilmiö voidaan mieltää ’kielenä’. Valokuva voidaan pilkkoa miljooniksi pikseleiksi, jossa pikselit ja niiden värit vastaavat sanojen tavuja ja kirjaimia. Sama pätee kemian kaavoihin, musiikkiin, robotiikkaan, DNA-rakenteeseen ja vaikkapa pörssikursseihin.
Generatiiviseen tekoälyyn liittyy alati kasvava pimeä puoli. Laajojen kielimallien massiivinen datapohja mahdollistaa valitettavasti myös rikollisen ja epäeettisen käytön. GPT-alustalta voisi kysyä: ”Miten teen myrkkyä kotiani lähimmän rautakaupan tarvikkeista?” Onneksemme isojen kaupallisten alustojen etiikkaan on kiinnitetty huomiota, eivätkä ne suostu antamaan vastauksia kaikkiin kysymyksiin. Myös deepfake-kuvat ja -videot tulevat yleistymään. Deepfake-termi tarkoittaa tekoälyn generoimaa todellisen tuntuista audiovisuaalista materiaalia, jota on vaikea tai mahdoton tunnistaa synteettiseksi. Kolmen sekunnin ääninäyte riittää imitoimaan – siis varastamaan – toisen ihmisen äänen. Pikkupaikkakunnalla pankkivirkailija ei voi enää luottaa tuntemastaan puhelinnumerosta tulevan tutun asiakaan ääneen. Erään arvoin mukaan vuoden 2024 jälkeen maailman isoja vaaleja on vaikea voittaa ilman tekoälyalgoritmien mahdollistamaa yksilötason vaalivaikuttamista (A.I. Dilemma / YouTube).
Amazon verkkokirjakauppa rajoitti syksyllä 2023 yhden kirjailijan julkaisemien kirjojen määrän kolmeen kappaleeseen päivässä. Luit oikein: päivässä. Generatiivisten tekoälyjen avulla voi automatisoida kirjojen massasuoltamisen melkeinpä mille tahansa kielelle. Näen tässä myös positiivisen mahdollisuuden: kirjailija tuottaa kirjan yhteistyössä tekoälyn kanssa. Kuluttaja tilaa kirjan digitaalisesti tai painettuna. Tilauksen yhteydessä kirjan ostajalta kysytään preferenssejä: millä kielellä ja murteella, kuvituksen suhde tekstin määrään, toivottu tyyli formaalista rentoon. Tekoäly ottaa pohjakirjan ja muokkaa siitä lukijalle personoidun version.
Samaa personointikysymystä voisi laajentaa opetukseen: miten tekoälyn avulla voisi räätälöidä oppilaalle oppimiskokemuksia heidän kiinnostuksen kohteidensa, oppimistyylinsä ja edistymisensä mukaan? Yritysmaailmassa on jo useamman vuoden puhuttu metaversumista, siis verkossa toimivasta kolmiulotteisesta fotorealistisesta virtuaalimaailmasta. Tekoäly tulee mahdollistamaan ja kiihdyttämään metaversumin käyttöä monille elämän alueille. Voisiko pelillistäminen ja koukuttavat tekoälyalgoritmit huijata aistejamme innostavaan oppimiseen virtuaalimaailman sisällä?
Seuraava tekoälyaalto saattaa liittyä – hyvässä ja pahassa – synteettisen biologiaan ja DNA-muokkaukseen. Mille kuulostaisi ajatus kaupallisesta neuvolasta, jossa odottavalle pariskunnalle kerrotaan mahdollisuudesta tehdä sikiölle CRISP-teknologialla DNA-muokkausta siten, että lapsen älykkyysosamäärä tulee ylittämään 150. Tai että lapselle voidaan DNA-ohjelmoida huippu-urheilijan ominaisuudet. Tässä on palveluhinnastomme, mitä saisi olla?
Tekoälyn kehittyminen tullee jatkumaan eksponentiaalisella polulla ja Olympiastadion täyttyisi ääriään myöten eksponentiaalisesti kiihtyvässä sateessa 46 minuutissa.
Vinkkejä AI-maailman vauhdissa pysymiseen:
- Tero Ojanperä (2023): Tekoälyn vallankumous, käsikirja. Alma Talent.
- Mustafa Suleyman (2023): The Coming Wave. Random House UK.
- Tristan Harris ja Aza Raskin: A.I. Dilemma (video Youtubessa)
- AI Monday -tapahtumat
Kirjoittaja Petri Malmelin on muutosjohtaja, tietotekniikan DI ja AI Monday tekoälytapahtumasarjan perustaja.
Tilaa Dimension uutiskirje – saat sähköpostiisi aina kuunvaihteessa koosteen tuoreimmista artikkeleista