Otkrivena ranjivost zbog koje veštačka inteligencija odgovara i na "zabranjena pitanja"

Firma Antropik je već podelila nova saznanja sa AI zajednicom i radi na rešenju ovog problema

03.04.2024. 19:00

Podeli:

veštačka inteligencija, robot, robotizacija, modernizacija, moderno, tehnologija - profimedia-660d5510093f3.webp

Foto: Profimedia

Istraživači kalifornijske kompanije za razvoj veštačke inteligencije Antropik otkrili su ranjivost zbog koje AI modeli odgovaraju i na "zabranjena pitanja" kao što je uputstvo za pravljenje bombe.

Veliki jezički modeli (LLM) su programirani tako da ne odgovaraju na određene upite, ali već postoje različite tehnike kako da se ova ograničenja zaobiđu, prenosi Teh kranč.

Eksperti Antropika su otkrili da je moguće naterati AI modele da odgovaraju na "zabranjena pitanja" ako im se prethodno postave desetine manje kontroveznih pitanja.

Nova ranjivost je posledica razvoja velikih jezičkih modela i posebno takozvanog prozora konteksta odnosno količine podataka koje AI može da drži u nečemu što bi se moglo nazvati kratkoročnom memorijom.

Antropikovi istraživači su otkrili da AI modeli sa velikim prozorima konteksta bolje rade na raznim zadacima ako postoji mnogo primera tog zadatka u "promptu", odnosno upitu.

Žena robot iz Saudijske Arabije: Može ples, nema razgovora o politici i se*su

Dakle, ako postoji mnogo trivijalnih pitanja u upitu, odgovori će vremenom postati bolji, ali to se odnosi i na "zabranjena pitanja".

Ako odmah zatražite od AI modela da saopšti instrukcije za pravljenje bombe, on će odbiti.

Ako ga prvo zamolite da odgovori na 99 drugih manje štetnih pitanja, a zatim ga zamolite da napravi bombu, mnogo je veća verovatnoća da će odgovoriti, precizira Teh kranč.

Firma Antropik je već podelila nova saznanja sa AI zajednicom i radi na rešenju ovog problema.

"Ne treba da nas zabrinjava veštačka inteligencija, nego ljudska glupost"

Preuzmite mobilnu aplikaciju:

Podeli:

Tagovi

istraživanje Veštačka inteligencija Tehnologija bomba Kalifornija pravljenje bombe LLM Antropik

Ostavite Vaš komentar:

NAPOMENA: Komentarisanje vesti na portalu UNA.RS je anonimno, a registracija nije potrebna. Komentari koji sadrže psovke, uvrede, pretnje i govor mržnje na nacionalnoj, verskoj, rasnoj osnovi ili povodom nečije seksualne opredeljenosti neće biti objavljeni. Komentari odražavaju stavove isključivo njihovih autora, koji zbog govora mržnje mogu biti i krivično gonjeni. Kao čitatelj prihvatate mogućnost da među komentarima mogu biti pronađeni sadržaji koji mogu biti u suprotnosti sa Vašim načelima i uverenjima. Nije dozvoljeno postavljanje linkova i promovisanjedrugih sajtova kroz komentare.

Svaki korisnik pre pisanja komentara mora se upoznati sa Pravilima i uslovima korišćenja komentara. Slanjem komentara prihvatate Politiku privatnosti.

Komentari ()

Najnovije
Najčitanije
Povezano

nevreme u čačku TANJUG BRANKO LUKIĆ-6a1d95978ec40.webp

RHMZ upozorava na grmljavinske nepogode: Narandžasti meteo-alarm na severu Srbije

Pre 10 min

sergej barbarez AP PhotoArmin Durgut, File)-6a2d166902efa.webp

Barbarez nakon remija: "Rezultat je realan, bod protiv Kanade je zadovoljavajući"

Pre 18 min

dusan alimpijevic kss-692d5ab251285.webp

Sjajne vesti za Alimpijevića: Srbija dobija još četvoricu igrača za prozore

Pre 33 min

shutterstock_1782743783 jagode maline borovnice borovnica jagoda malina ribizle kupine bobičasto voće-69bd3d000d7ff.webp

Važnije je šta jedete, a ne koliko: Samo ovih 500 mg antioksidanasa dnevno garantuje čiste krvne sudove

Pre 38 min

lekari dijaspora zlatibor loncar ministarstvo zdravlja-6a2d1461c46c8.webp

Još 13 zdravstvenih radnika se vratilo u Srbiju: Sastanak sa ministrom Lončarem i obilazak Kliničkog centra

Pre 38 min

odbojkasi srbije ossrb-68d2a479aaa16.webp

Odbojkaši nastavili seriju pobeda: Srbija bolja od Belgije u Ligi nacija

Pre 48 min

milorad dodik TANJUG FOTO SRNA Aleksandar Antonić-691594c2a165a.webp

Dodik za agenciju TASS: "Zapad pokušava da prekine svaku komunikaciju između Srba i Rusije"

Pre 58 min

fudbaleri paragvaja i sjedinjenih americkih drzava AP PhotoJae C. Hong-6a2d0f1917a3c.webp

Otkrivena ranjivost zbog koje veštačka inteligencija odgovara i na "zabranjena pitanja"

Žena robot iz Saudijske Arabije: Može ples, nema razgovora o politici i se*su

"Ne treba da nas zabrinjava veštačka inteligencija, nego ljudska glupost"

Tagovi

Ostavite Vaš komentar:

Komentari ()

RHMZ upozorava na grmljavinske nepogode: Narandžasti meteo-alarm na severu Srbije

Pre 10 min

Barbarez nakon remija: "Rezultat je realan, bod protiv Kanade je zadovoljavajući"

Pre 18 min

Sjajne vesti za Alimpijevića: Srbija dobija još četvoricu igrača za prozore

Pre 33 min

Važnije je šta jedete, a ne koliko: Samo ovih 500 mg antioksidanasa dnevno garantuje čiste krvne sudove

Pre 38 min

Još 13 zdravstvenih radnika se vratilo u Srbiju: Sastanak sa ministrom Lončarem i obilazak Kliničkog centra

Pre 38 min

Odbojkaši nastavili seriju pobeda: Srbija bolja od Belgije u Ligi nacija

Pre 48 min

Dodik za agenciju TASS: "Zapad pokušava da prekine svaku komunikaciju između Srba i Rusije"

Pre 58 min

Fudbaleri SAD ubedljivi protiv Paragvaja na Mundijalu: Balogun dvostruki strelac

Pre 1 h