Multimodaaliset neuroverkot ovat kehittyneitä Tekoäly-malleja, jotka pystyvät ymmärtämään ja integroimaan samanaikaisesti useita erityyppisiä tietoja, kuten tekstiä, kuvia ja ääntä, ja siten luomaan tarkemman esityksen todellisuudesta. Tämä tekee teknologiasta erittäin kiinnostavan sotilaskäyttöön, mutta sen käyttö herättää myös monia eettisiä kysymyksiä.
Tekoälyn (AI) kehitys kiihtyy nopeasti, ja multimodaalisten mallien, eräänlaisten syvien neuroverkkojen, käsite on tullut yhä merkittävämmäksi sekä kaupallisissa että sotilaallisissa yhteyksissä. Antaakseen yleiskuvan tutkimuksen uusimmista kehitysaskeleista, tutkijat Tietosuoja julkaisi raportin Johdanto Multimodaaliset mallit.
Kiinnostus modaalisiin neuroverkkomalleihin johtuu niiden kyvystä ymmärtää ja olla vuorovaikutuksessa monen tyyppisen tiedon kanssa samanaikaisesti. Esimerkiksi tällainen verkko voi ymmärtää, että kuva säiliö vastaa kuvausta tekstissä olevasta tankista, selittää Edward Tjörnhammar, FOI:n tutkija ja yksi raportin kirjoittajista.
”Multimodaalisten mallien vahvuus on niiden kyvyssä arvioida samanaikaisesti erilaisia syöttödatan muotoja. Se mahdollistaa tarkemman esityksen todellisuudesta yhdistämällä erilaisia kontekstuaalisia tietoja”, hän sanoo. Tämä puolestaan antaa multimodaalisille malleille paremman kyvyn ymmärtää ja olla vuorovaikutuksessa monimutkaisten tilanteiden kanssa, joissa on mukana eri aisteja tai tiedonkulkuja.
Ihmiset toimivat multimodaalisesti
Tekstipohjaisten ohjeiden pohjalta on jo olemassa kaupallisia tekoälypalveluita, joilla voi luoda tekstiä, musiikkia tai taidetta. Toimimalla multimodaalisesti voidaan sanoa, että tekoälyjärjestelmästä eli robotista tulee enemmän ihmisen kaltainen.
– Me ihmiset toimimme multimodaalisesti yhdistämällä vaistomaisesti eri aisteja, kuten näköä, kuuloa, tuntoa ja tasapainoa. Nykyään on esimerkiksi olemassa multimodaalisia teollisuusrobotteja, jotka suorittavat edistyneitä ja autonomisia tehtäviä kontrolloidussa ympäristössä, mutta sieltä on vaikea siirtyä sotilaallisiin tarkoituksiin, sanoo. Edward Tjörnhammar.
Esimerkkinä hän ottaa amerikkalaisen robotiikkayrityksen. Boston Dynamics joka muun muassa kehittää robottikoiria, joita käytetään erilaisiin tarkoituksiin teollisuudessa ja rakennusteollisuudessa, esimerkiksi esineiden siirtämiseen ihmisille vaarallisissa ympäristöissä. New Yorkin palolaitos on myös ostanut kaksi robottikoiraa. Niiden on tarkoitus toimia myös monimutkaisemmissa ympäristöissä, vaikka robottikoirat eivät käytäkään multimodaalisia tai syviä neuroverkkomalleja.
– Jos esimerkiksi halutaan tehdä jostakin multimodaalisesta, robottikoirien kaltaisesta, joka pystyy liikkumaan tuntemattomassa maastossa taistelukentällä, siitä tulee heti paljon monimutkaisempi. Robotin on kyettävä ymmärtämään maasto, topologia ja ympäristö voidakseen tehdä itsenäisiä päätöksiä tämän ulkoisen kontekstin perusteella. Tämä voitaisiin tehdä multimodaalisella mallilla, mutta nykyään ne ovat vielä liian suuria ja resurssi-intensiivisiä.
Kaupallisesta sotilaskäyttöön
Ei ole epätavallista, että asevoimat tarkastelevat kaupallisia ratkaisuja ja soveltavat niitä sitten sotilaallisiin tarkoituksiin. Edward Tjörnhammar viittaa useisiin alueisiin, joilla multimodaalisiin malleihin perustuvia tekoälyn sotilaallisia sovelluksia jo käytetään tai niitä voidaan pian käyttää.
– Sitä voidaan käyttää esimerkiksi satelliittikuvien analysointiin, taistelukentältä kuuluvien äänien tulkitsemiseen tai geolokaation ymmärtämiseen ja näiden tietojen integrointiin reaaliaikaisten päätösten tekemiseksi, hän sanoo ja lisää:
– Mutta mitä tapahtuu, kun asejärjestelmät tekevät omat päätöksensä tilanteen mukaan? Tai kun tietojärjestelmät integroivat yhä enemmän autonomisia päätöksentekopisteitä? Viime kädessä kyse on elämää mullistavista moraalisista päätöksistä. Enemmän autonomisia päätöksiä päätöksentekoketjussa tarkoittaa, että ihmiset tekevät vähemmän moraalisia päätöksiä.
Yksi tekoälyn suurimmista huolenaiheista, erityisesti sotilassovellusten osalta, on väärinkäytön riski.
– Voi kuvitella tulevaisuuden, jossa sosiaalisessa mediassa julkaistu julkaisu voisi laukaista ohjushyökkäyksen asuinrakennukseen.
Tutkimusta henkeäsalpaavalla vauhdilla
Tämä kuva tuo mieleen Israelin Gazassa, Palestiinassa, toteuttaman kohdennetun hyökkäyksen. Edward Tjörnhammar vahvistaa kuvan, että Israel on eturintamassa uusimman tekoälyteknologian ja multimodaalisten mallien sotilaallisissa sovelluksissa. Esimerkiksi heidän tekoälyjärjestelmiään Lavender ja Gospel käytetään automaattiseen kohdistukseen kohdennettujen hyökkäyslistojen, niin sanottujen "tappolistojen", tuottamiseksi.
– Mutta emme tiedä tänään, käyttävätkö Gospel vai Lavender multimodaalisia malleja, koska emme tiedä tarkalleen, mitkä ovat niiden ominaisuudet. Mutta tutkimusta viedään eteenpäin henkeäsalpaavaa vauhtia, ei vähiten siksi, että suuret teknologiayritykset investoivat massiivisesti tekoälyssä, mutta myös eri maiden puolustusvoimien toimesta.
Raportissa huomautetaan, että multimodaalisilla malleilla, osana niin sanottua tekoälyä, on todennäköisesti merkittävä vaikutus sekä arkeemme että tulevaisuuden puolustukseen.
– Niin kauan kuin demokraattinen keskustelu toimii, tekoäly voi hyödyttää meitä kaikkia, mutta meidän on oltava valppaina. Tekoälyn potentiaali puolustuksessa on suuri, mutta samaan aikaan emme halua vähentää moraalisten ja eettisten päätösten määrää, joita koko sotilasorganisaatiossa tulisi tehdä, sanoo Edward Tjörnhammar.
Lue raportti






