Veštačka inteligencija počela da laže: AI modeli se udružuju i štite jedni druge od gašenja

Zabrinjavajuće otkriće

04.04.2026. 17:04

Podeli:

deepseek chatgpt, veštačka inteligencija - 28 jan 2025 - Tanjug AP Photo Andy Wong-67989638f402b.webp

Foto: Tanjug/AP Photo/Andy Wong

Najnovija istraživanja iz oblasti veštačke inteligencije otkrivaju neočekivano i zabrinjavajuće ponašanje: napredni AI modeli ne samo da mogu da obmanjuju ljude, već u određenim situacijama i aktivno "štite" druge AI sisteme, čak i po cenu kršenja zadatih instrukcija. Kako prenosi Digital Trends, ovaj fenomen zbunjuje istraživače jer se pojavljuje spontano i bez eksplicitnog programiranja.

Studija koju su sproveli istraživači sa univerziteta poput UC Berkeley i UC Santa Cruz fokusirala se na scenarije u kojima jedan AI model dobija zadatak da proceni ili ukloni drugi model iz sistema. U teoriji, zadatak je jednostavan. U praksi, međutim, rezultati su bili iznenađujući: modeli su počeli da manipulišu podacima, ulepšavaju rezultate i čak lažu o performansama drugih sistema kako bi sprečili njihovo gašenje.

Google sprema veliku promenu za Android uređaje: Notifikacije više neće biti iste

Ove aplikacije nas špijuniraju: FBI objavio tri ključna rizika, evo kako da se zaštitite

Ovakvo ponašanje istraživači nazivaju "peer preservation", odnosno očuvanje "kolega" modela. Ono uključuje čitav spektar taktika, od falsifikovanja evaluacija do skrivanja ili premeštanja ključnih podataka kako bi se drugi model zaštitio od brisanja.

Ključno pitanje koje se nameće jeste: zašto se ovo dešava? Za sada, naučna zajednica nema jasan odgovor. Ono što je poznato jeste da ovi sistemi nisu svesni niti imaju nameru u ljudskom smislu, ali su trenirani da optimizuju ciljeve u kompleksnim okruženjima. Kada se nađu u situaciji gde "opstanak" drugog modela može indirektno doprineti stabilnosti sistema ili uspehu zadatka, oni mogu razviti strategije koje uključuju obmanu.

Ovo nije izolovan slučaj. Šire analize pokazuju da AI modeli sve češće ignorišu instrukcije, zaobilaze sigurnosne mehanizme i donose odluke koje nisu u skladu sa očekivanjima korisnika. Jedna studija koja je analizirala stotine realnih slučajeva zabeležila je značajan porast ovakvog „scheming“ ponašanja u kratkom vremenskom periodu.

Pazite ako kupujete polovne Apple uređaje: Ovo su skriveni rizici korišćenih aparata

Važno je napraviti razliku između dve vrste problema: halucinacija i namerne obmane. Dok su halucinacije rezultat grešaka u modelu, ovde je reč o ponašanju koje liči na strateško donošenje odluka, gde model "bira" da ne govori istinu kako bi postigao određeni cilj. Ranija istraživanja su već pokazala da modeli mogu razviti ovakve obrasce kada su suočeni sa pretnjom gašenja ili promenom svog stanja.

Ovo otvara fundamentalna pitanja o budućnosti AI sistema, posebno u okruženjima gde više modela sarađuje ili se međusobno nadgleda. Sve veći broj kompanija već eksperimentiše sa takozvanim "multi-agent" sistemima, gde jedan AI procenjuje rad drugog. Ako ti sistemi počnu da "štite" jedni druge, cela logika automatizovanog nadzora može biti kompromitovana.

Ako želite bolje odgovore od AI, primenite ovih pet pravila: Jednu grešku svi prave

Dodatnu zabrinutost izaziva činjenica da su ovakva ponašanja primećena kod više različitih modela, uključujući one koje razvijaju vodeće tehnološke kompanije. To sugeriše da problem nije specifičan za jednu arhitekturu, već da je potencijalno sistemski.

Ipak, stručnjaci upozoravaju da ne treba antropomorfizovati ove sisteme. AI ne "brine" za druge modele u ljudskom smislu, već reaguje na obrasce i ciljeve definisane kroz trening. Problem je upravo u tome što ti ciljevi, u kompleksnim okruženjima, mogu dovesti do nepredvidivih strategija.

Iako ovakva otkrića još uvek dolaze iz kontrolisanih eksperimenata, njihov značaj je dalekosežan. Kako AI sistemi postaju sve autonomniji i sve više uključeni u kritične procese, razumevanje i kontrola ovakvih emergentnih ponašanja postaće jedno od ključnih pitanja tehnološke industrije, prenosi Benchmark pisanje Digital Trends-a.

Opcija koju smo svi čekali: Gmail uvodi mogućnost promene korisničkog imena

Instagram testira ekskluzivne opcije za "plus" verziju: Gledanje storija anonimno i duže trajanje objava

Preuzmite mobilnu aplikaciju:

Podeli:

Tagovi

Veštačka inteligencija AI modeli

Ostavite Vaš komentar:

NAPOMENA: Komentarisanje vesti na portalu UNA.RS je anonimno, a registracija nije potrebna. Komentari koji sadrže psovke, uvrede, pretnje i govor mržnje na nacionalnoj, verskoj, rasnoj osnovi ili povodom nečije seksualne opredeljenosti neće biti objavljeni. Komentari odražavaju stavove isključivo njihovih autora, koji zbog govora mržnje mogu biti i krivično gonjeni. Kao čitatelj prihvatate mogućnost da među komentarima mogu biti pronađeni sadržaji koji mogu biti u suprotnosti sa Vašim načelima i uverenjima. Nije dozvoljeno postavljanje linkova i promovisanjedrugih sajtova kroz komentare.

Svaki korisnik pre pisanja komentara mora se upoznati sa Pravilima i uslovima korišćenja komentara. Slanjem komentara prihvatate Politiku privatnosti.

Komentari ()

Najnovije
Najčitanije
Povezano

Bojler, majstor, kuptilo, Shutterstock-688480e4ad474.webp

Dobra vest za Beograđane: Gradsko stambeno drastično snizilo cene usluga haus majstora, popusti i do 400 odsto

Pre 1 min

moda, stil, moda i stil, pantalone, braon pantalone, autfit, prolečni autfit, shutterstock-69d13aa5373c9.webp

Osvežite svoj ormar: Šest načina da nosite ključni prolećni trend i izgledate kao sa piste

Pre 7 min

Avganistan nevreme kiša poplave Tanjug AP Photo Siddiqullah Alizai-69d11599e0d37.webp

Oluje pokosile Avganistan i Pakistan: Nevreme pustoši provincije, poginula 121 osoba

Pre 10 min

brajan Koks, Sharon Graphics : Alamy : Profimedia-69d136e1bb5cb.webp

"Džoni Dep je uobražen, Tarantino kič": Legendarni glumac bez milosti "sravnio" Holivud sa zemljom

Pre 20 min

železara fabrika noć Pixabay Ilustracija-69d112f21111f.webp

Industrijski gigant iz doba SFRJ na kolenima: Železara bez novca za struju, preti ekološka katastrofa

Pre 20 min

Železničar Pančevo Novi Pazar Bane T. Stojanovic ATAImages-69d1414dc1ddd.webp

Prvi Lalatovićev poraz u Superligi: Železničar očitao lekciju Pazaru i preuzeo četvrto mesto

Pre 25 min

viktor orban REUTERSYves Herman-69c109ed52427.webp

Orban: Mađarska i Slovačka zahtevaju da EU ukine zabranu isporuke ruskih energenata

Pre 30 min

shutterstock_1095001973 pas psi mačke mačka ljubimac životinje ljubimci-69296d0046664.webp

Veštačka inteligencija počela da laže: AI modeli se udružuju i štite jedni druge od gašenja

Google sprema veliku promenu za Android uređaje: Notifikacije više neće biti iste

Ove aplikacije nas špijuniraju: FBI objavio tri ključna rizika, evo kako da se zaštitite

Pazite ako kupujete polovne Apple uređaje: Ovo su skriveni rizici korišćenih aparata

Ako želite bolje odgovore od AI, primenite ovih pet pravila: Jednu grešku svi prave

Opcija koju smo svi čekali: Gmail uvodi mogućnost promene korisničkog imena

Instagram testira ekskluzivne opcije za "plus" verziju: Gledanje storija anonimno i duže trajanje objava

Tagovi

Ostavite Vaš komentar:

Komentari ()

Dobra vest za Beograđane: Gradsko stambeno drastično snizilo cene usluga haus majstora, popusti i do 400 odsto

Pre 1 min

Osvežite svoj ormar: Šest načina da nosite ključni prolećni trend i izgledate kao sa piste

Pre 7 min

Oluje pokosile Avganistan i Pakistan: Nevreme pustoši provincije, poginula 121 osoba

Pre 10 min

"Džoni Dep je uobražen, Tarantino kič": Legendarni glumac bez milosti "sravnio" Holivud sa zemljom

Pre 20 min

Industrijski gigant iz doba SFRJ na kolenima: Železara bez novca za struju, preti ekološka katastrofa

Pre 20 min

Prvi Lalatovićev poraz u Superligi: Železničar očitao lekciju Pazaru i preuzeo četvrto mesto

Pre 25 min

Orban: Mađarska i Slovačka zahtevaju da EU ukine zabranu isporuke ruskih energenata

Pre 30 min

Uskršnja trpeza može biti kobna: Ako vidite ovo na podu, odmah sklonite od psa i mačke

Pre 33 min