Meta predstavlja AI model za prepoznavanje i prevođenje skoro 100 jezika

SeamlessM4T simbolizuje značajan napredak u oblasti veštačke inteligencije za prevođenje govora u tekst i između različitih jezika

24.08.2023. 10:07
  • Podeli:
Veštačka inteligencija (2)-6408797514187.webp Foto: Pixabay

U svojoj potrazi za razumevanjem različitih dijalekata i jezika, Meta je kreirala AI model pod nazivom SeamlessM4T, koji može prevesti i transkribovati gotovo 100 jezika, kako u pisanoj tako i u govornoj formi.

Dostupan kao open source zajedno sa SeamlessAlign, novim setom podataka za prevođenje, Meta tvrdi da SeamlessM4T predstavlja "značajan proboj" kada je reč o prevođenju govora u tekst i između različitih jezika.

"Naš univerzalni model omogućava instant prevođenje koje pomaže osobama koje govore različite jezike da komuniciraju efikasnije", piše Meta u blog postu koji je podeljen sa TechCrunch. „SeamlessM4T implicitno prepoznaje izvorne jezike bez potrebe za posebnim modelom za identifikaciju jezika.“

SeamlessM4T je duhovni naslednik Meta projekata kao što su No Language Left Behind, model za prevođenje teksta u tekst, i Universal Speech Translator, jedan od retkih sistema za direktno prevođenje govora u govor koji podržava Hokkien jezik.

Ovaj model nije jedini ambiciozan pokušaj kombinacije prevođenja i transkripcije u jedinstveni sistem. Pored komercijalnih usluga i open source modela dostupnih od strane Amazona, Microsofta, OpenAI-ja i mnogih startapa, Google pravi ono što naziva Universal Speech Model, deo većeg napora kompanije da izgradi model koji može razumeti 1.000 najčešće korišćenih jezika na svetu.

Međutim, SeamlessM4T ima i svoje slabosti. U belom papiru koji je objavljen zajedno sa blog postom, Meta otkriva da model "preterano generalizuje prema muškim oblicima kada prevodi iz neutralnih termina" i bolje se snalazi pri prevođenju u muškom rodu.

Osim toga, iako Meta tvrdi da SeamlessM4T ne dodaje veliku količinu "toksičnog" teksta u svojim prevodima, ni ovaj model nije savršen. U nekim jezicima, kao što su bengalski i kirgiski, SeamlessM4T pravi "toksičnije prevode".

Iako predstavlja napredak u univerzalnom prevođenju, ovaj model i dalje ima svoje izazove, a njegova primena u praksi će zahtevati dalje prilagođavanje i razvoj.

  • Podeli:

Ostavite Vaš komentar:

NAPOMENA: Komentarisanje vesti na portalu UNA.RS je anonimno, a registracija nije potrebna. Komentari koji sadrže psovke, uvrede, pretnje i govor mržnje na nacionalnoj, verskoj, rasnoj osnovi ili povodom nečije seksualne opredeljenosti neće biti objavljeni. Komentari odražavaju stavove isključivo njihovih autora, koji zbog govora mržnje mogu biti i krivično gonjeni. Kao čitatelj prihvatate mogućnost da među komentarima mogu biti pronađeni sadržaji koji mogu biti u suprotnosti sa Vašim načelima i uverenjima. Nije dozvoljeno postavljanje linkova i promovisanjedrugih sajtova kroz komentare.

Svaki korisnik pre pisanja komentara mora se upoznati sa Pravilima i uslovima korišćenja komentara. Slanjem komentara prihvatate Politiku privatnosti.

Komentari ()