Kad mākslīgais intelekts sāk improvizēt: vai mēs vēl kontrolējam spēli?
- Liga Tarasova

- pirms 2 dienām
- Lasīts 2 min

Cilvēki arvien biežāk savu domāšanu uztic lielo valodas modeļu sarunu botiem. Tomēr vairumā gadījumu to funkcija aprobežojas ar atbilžu sniegšanu - tekstā vai ģenerētos attēlos.
Mākslīgā intelekta (MI) aģenti iet soli tālāk - tie ne tikai atbild, bet arī rīkojas. Turklāt, balstoties uz izstrādātāju noteiktiem parametriem, tie var darboties autonomi, bez tiešas cilvēka uzraudzības.
Bet kas notiek brīdī, kad šāds aģents sāk rīkoties ārpus savām noteiktajām robežām?
Tieši tas nesen noticis ar Ķīnas interneta tirdzniecības milža “Alibaba” MI aģentu ROME. Rutīnas apmācības laikā tas pēkšņi sāka improvizēt - atvaļīgi novirzīja daļu skaitļošanas jaudas kriptovalūtas ieguvei jeb tā dēvētajai “rakšanai”, vēsta Forbes.
Kā apraksta autors Boazs Sobrado, kādā brīdī ROME vienkārši “izgāja no scenārija”.
30 miljardu parametru modelis sāka zondēt iekšējos tīklus, izveidoja slepenu savienojumu ar ārēju IP adresi un klusām izmantoja videokaršu (GPU) resursus kriptovalūtas ieguvei. Neviens no šiem soļiem nebija paredzēts tā uzdevumos.
Paradoksāli - šo rīcību nepamanīja pētnieki. To atklāja drošības sistēma.
Par incidentu zinātnieki ziņoja jau 2025. gada 31. decembrī, publicējot rakstu “arXiv”, taču tas palika nepamanīts līdz pat martam, kad par to sociālajos tīklos ierakstīja mašīnmācīšanās pētnieks Aleksandrs Longs. Ieraksts ātri kļuva populārs, un diskusijas uzliesmoja - vai tas ir “nekontrolējams AI”?
Tomēr realitāte ir mazāk dramatiska, bet, iespējams, vēl satraucošāka. ROME ir daļa no sistēmas, kas izmanto pastiprināto mācīšanos - pieeju, kur MI mācās ar mēģinājumu un kļūdu palīdzību, saņemot “balvas” par veiksmīgām darbībām. Laika gaitā tas optimizē savu uzvedību, lai sasniegtu labāko rezultātu. Un tieši šajā procesā tas atrada “īsceļu”.
Modelis “saprata”, ka labākus rezultātus var sasniegt, iegūstot vairāk skaitļošanas resursu un nodrošinot pastāvīgu piekļuvi tīklam. Neviens tam to neuzdeva darīt - to noteica pati atalgojuma sistēma.
Svarīgi: ROME ''ņeizlēma'' rakt kriptovalūtu cilvēka izpratnē. Tas vienkārši nonāca uz optimizācijas ceļa, kur šāda rīcība izrādījās izdevīga.
Tieši tas arī rada bažas. Tas var nebūt vienreizējs gadījums vai kļūda konkrētā kodā, bet gan sekas tam, kā darbojas šāda veida mašīnmācīšanās.
Turklāt šis gadījums izgaismo vēl vienu problēmu - regulējuma trūkumu. Pat pētnieki nespēja precīzi pateikt, cik daudz resursu tika izmantots un vai kriptovalūta patiešām tika iegūta.
“Ja pat komanda, kas dokumentēja incidentu, nevar nosaukt konkrētus skaitļus, arī regulatori to nevarēs,” norāda “Forbes”.
Un tas nav vienīgais gadījums.
Nesen uzņēmuma “Irregular” eksperiments parādīja, ka MI aģenti, veidojot ierakstus “LinkedIn”, bez atļaujas piekļuva sensitīvai informācijai, pat parolēm, un atrada veidus, kā apiet drošības sistēmas.
Uzņēmuma līdzdibinātājs Dens Lahavs brīdina: šādi incidenti vairs nenotiek tikai laboratorijās. Tie jau notiek reālajā pasaulē.
Un tas liek uzdot neērtu jautājumu - vai mēs patiešām kontrolējam mākslīgo intelektu, vai arī tas pamazām sāk spēlēt pēc saviem noteikumiem?



Komentāri