Siirry pääsisältöön

28.03.2024

Dataset #01 - Mikko Muurinen, Helen

Tässä jaksossa tutustumme tekoälyn kiehtovaan ja alati muuttuvaan maailmaan yhdessä Mikko Muurisen kanssa, joka johtaa Helenissä datan ja tekoälyn kehitystä.

Tervetuloa kuuntelemaan Dataset by AaltoAI & Smartbi-podcastin ensimmäistä jaksoa!

Tässä jaksossa esittelemme tekoälyn viimeisimpiä uutisia ja haastattelemme Helenin datan ja tekoälyn johtajaa, Mikko Muurista, joka avaa meille Helenin visiota tekoälyvetoiseen tulevaisuuteen ja kertoo, miten Helenin työntekijöitä koulutetaan datan ja tekoälyn saralla. Lopussa tarjoamme bonuksen kuulijoille: yksinkertaistamme yhden monimutkaisen, mutta hyödyllisen tekoälyyn liittyvän käsitteen.

Kuuntele täysi jakso Spotifysta, ja niille, jotka haluavat nopean yhteenvedon, lue podcastin kohokohdat sekä yhteenveto keskustelusta Mikko Muurisen kanssa alta.

Viimeisimmät AI-uutiset

EU:n tekoälylaki: Äskettäin julkaistu tekoälylaki pyrkii säätelemään tekoälyn käyttöä Euroopan Union alueella. Laki jaottelee tekoälyyn liittyvät säännökset neljään riskiperusteiseen kategoriaan: hyväksymätön, korkea, keskitason ja matala riski. Tavoitteena on löytää tasapaino innovaation edistämisen ja turvallisuus- sekä eettisten näkökohtien välillä. Kriitikot ovat huolissaan siitä, että laki saattaa pikemminkin hidastaa kuin edistää tavoitteiden toteutumista.

Claude-3 vs. GPT-4: Antropic on esitellyt Claude-3:n, väittäen sen ylittävän Open AI:n GPT-4:n suorituskyvyn. Riippumattomat arvioinnit tarjoavat erilaisen näkemyksen Claude-3:n ominaisuuksista. Vaikka Claude-3:n looginen päättelykyky näyttää parantuneen, mutta se on silti altis virheille tai hallusinaatioille. Sen tehokkuutta teollisissa sovelluksissa verrattuna GPT-4:ään ei ole vielä arvioitu kattavasti.

Stable Diffusion Versio 3: Stability AI julkisti helmikuussa Stable Diffusion Versio 3:n, jolla on merkittäviä tekstistä-kuvaan -generointikykyjä. Tämä ja sekä aiemmat Stable Diffusionin versiot ovat olleet kiistanalaisia koulutusdatan julkaisemattomuuden vuoksi. Ilman avoimia datasettejä mallin uudelleenluominen alusta asti on mahdotonta.

Google DeepMind SIMA: Dataset-tiimi tutustui Googlen uuteen SIMA-malliin. Tämä 3D-virtuaaliympäristöön tarkoitettu yleiskäyttöinen tekoäly on koulutettu pelaamaan videopelejä kuin ihmispelaajat. Toisin kuin edeltäjät, jotka keskittyivät strategiapeleihin, kuten shakkiin ja Go:hon, SIMA hyödyntää tietokonenäköä ympäristön ymmärtämiseen ja vuorovaikutuksessa se käyttää näppäimistöä ja hiirtä. Tämä mahdollistaa tekoälyn navigoinnin ja pelaamisen avoimen maailman videopeleissä luonnollisten kielikäskyjen avulla, osoittaen miten tekoäly voi selviytyä monimutkaisista ympäristöistä.

Devin, tekoälyohjelmistoinsinööri: Cognition Labsin kehittämä Devin on tekoälypohjainen ohjelmoija, joka on saavuttanut uudet huipputulokset Swg Bench -testissä, ja sillä on merkittävä suorituskyky ilman ihmisen ohjausta. Devinillä on käytössään samankaltaisia työkaluja kuin juniori-tason ohjelmoijalla, mukaan lukien komentokehote, koodieditori ja selain ja näiden lisäksi ohjelma pääsee käsiksi esimerkiksi Stack Overflow:hun.

Sähkö- ja energia-alan uudistajat: Mikko Muurinen ja Helen

Mikko Muurinen johtaa Helenillä neljää tiimiä, jotka työskentelevät datatieteen, datanhallinnan, tietotekniikan ja digitaalisten kaksosten parissa. Yli 30 asiantuntijan vahvuiset ryhmät kehittävät uusia ratkaisuja perinteisen energianhallinnan, digitaalisen asiakaspalvelun ja Helenin omien sisäisten toimintojen tehostamiseksi.

Helenin tekoälyprojektit on luokiteltu klassiseen ja generatiiviseen tekoälyyn, joissa käytetään sekä talon sisäisiä että toimittajien tarjoamia ratkaisuja.

Helen, lähes 780 työntekijän yritys, on sitoutunut siirtymään perinteisistä energiantuotantomenetelmistä kohti uusiutuvia ja kestävämpiä energialähteitä. Tämä siirtymä vaatii reaaliaikaisen datan ja ennakoivien mallien saumatonta integrointia, jotta uusiutuvien energialähteiden luontaista vaihtelua voidaan hallita tehokkaasti. Yksi merkittävä projekti tässä kontekstissa on Helen Flex, IoT-ratkaisu, joka on suunniteltu optimoimaan energianjakelua ja varastointia.

Helenin sisällä vaalitaan vahvaa datavetoista kulttuuria. Yritys tarjoaa työntekijöilleen monia mahdollisuuksia kehittää datalukutaitojaan, esimerkiksi Data Academy -koulutusohjelman kautta. Tämän ansiosta jo 75 % kaikista Helenin työntekijöistä on suorittanut vähintään yhden data-aiheisen kurssin.

Tekoälyn konseptin yksinkertaistaminen: RAG vs. Pitkät kontekstimallit

Kuvitellaan, että kysyt erittäin tietävältä ystävältä kysymyksen. Sen sijaan, että hän vastaisi pelkästään muistiinsa tukeutuen, hän etsii ensin kaikkein tarkimman ja ajantasaisimman tiedon varmistaakseen vastauksensa oikeellisuuden. Tämä on Retrieval Augmented Generationin (RAG) perusajatus.

RAG parantaa tekoälyn vastausten laatua hyödyntämällä laajaa tietokirjastoa. Tämän ansiosta tekoälyn vastaukset ovat paitsi älykkäitä, myös todenmukaisia ja luotettavia. RAG kehitettiin ratkaisemaan ongelman, jossa tekoäly saattoi antaa virheellisiä tai vanhentuneita tietoja vastauksissaan.

Mitä ovat pitkät kontekstimallit? Nämä tekoälymallit ovat kuin superlukijoita, joilla on kyky ymmärtää ja muistaa valtavia määriä tekstiä samanaikaisesti. Viimeaikaisen kehityksen myötä ne voivat "lukea" kokonaisia kirjastoja kerralla, mikä tekee niistä kykeneviä tarjoamaan vastauksia ilman, että niiden tarvitsee hakea ulkoista tietoa.

Miksi siis käyttää RAG:ia, jos meillä on jo pitkät kontekstimallit? Valinta riippuu käsillä olevasta tehtävästä. RAG:n vahvuus on sen tarkkuus ja luotettavuus, sillä se varmistaa tiedot ulkoisista lähteistä. Tämä tekee siitä erinomaisen työkalun faktapohjaisiin kyselyihin. Pitkät kontekstimallit puolestaan ovat erinomaisia analysoimaan pitkiä tekstejä, mikä tekee niistä hyödyllisiä monimutkaisten analyysien ja laajojen aiheiden ymmärtämisessä ilman ulkoisia viittauksia.

Kuuntele koko jakso täältä!


Kuuntele jakso

Voisiko ongelmasi ratkaista tekoälyllä?

Tilaa uutiskirjeemme ja opi miten tekoälyllä ratkaistaan liiketoimintahaasteita.