Rukopis pretvara u digitalni tekst: Google Resarch pomoću veštačke inteligencije otišao korak dalje

Ako volite da pišete rukom, InkSight ima brojne potencijalne prednosti

11.11.2024. 15:00
  • Podeli:
rukopis pixabay-67320dcfca2d8.webp Foto: Pixabay

Google Research prikazuje novi način korišćenja veštačke inteligencije za čitanje rukopisa, što bi moglo radikalno da promeni način na koji mašine pretvaraju ono što pišemo na papiru u digitalni tekst.

Ovo bi mogao biti ključni alat za dešifrovanje i prebacivanje rukopisa iz proteklih vekova u digitalnu formu
Sistem pod nazivom InkSight transformiše fotografije rukom pisanih reči u digitalni tekst koristeći veštačku inteligenciju, bez potrebe za dodatnim uređajima.

Ideja je da se zameni ponekad nepouzdano optičko prepoznavanje karaktera (OCR) AI-em koji može da oponaša način na koji ljudi zapravo uče da čitaju, konkretno tako što prepisuje postojeći tekst da bi naučio kako izgledaju i šta znače cele reči. Zbog toga su istraživači obučili AI da prepoznaje i oponaša ljudski rukopis.

“Digitalno vođenje beležaka postaje sve popularnije, jer pruža trajni, lako uređiv i indeksabilan način čuvanja beležaka u vektorskom formatu, poznatom kao digitalni ink,” objašnjavaju istraživači u svom radu. “Ipak, postoji značajan jaz između ovog načina beleženja i tradicionalnog pisanja na papiru, prakse koja je još uvek omiljena kod većine ljudi.” Njihov pristup kombinuje veštine čitanja i pisanja, omogućavajući obuku modela bez velikih količina uparenih primera, koje je teško pribaviti. Koliko je nama poznato, ovo je prvi rad koji efikasno derenderuje rukopisni tekst sa proizvoljnih fotografija sa različitim vizuelnim karakteristikama i pozadinama.”

InkSight je više od alternative OCR-u. Obezbeđuje preciznije rezultate u nepovoljnim uslovima, kao što su fotografije u lošim svetlosnim uslovima, delimično pokriven tekst ili zbunjujuća pozadina, gde OCR često nije pouzdan. Istraživači su otkrili da su ljudi mogli da pročitaju 87% tekstova koje je generisao InkSight. Dve trećine tih tekstova bile su toliko precizne da ljudi nisu mogli da ih razlikuju od stvarnog rukopisa.

Ako volite da pišete rukom, InkSight ima brojne potencijalne prednosti. Zamislite da pišete rukom u papirnoj beležnici, a zatim pokazujete beleške kameri kako bi se odmah pretražile i organizovale u kontekstu sa prethodnim beleškama na fizičkim stranicama. Ako vam je rukopis naročito neuredan, InkSight bi mogao da pomogne da se vaši zapisi pretvore u kucani tekst koji i dalje tačno prikazuje ono što ste napisali.

Na širem planu, ovo bi mogao biti ključni alat za dešifrovanje i prebacivanje rukopisa iz proteklih vekova u digitalnu formu. Čak i kada je tekst na jeziku koji nema veliki digitalni korpus, InkSight bi mogao pomoći u očuvanju rukopisa i obezbeđivanju izvora za obuku na tim jezicima.

Google nije jedini koji razvija AI alate za prepoznavanje rukopisa. Na primer, Amazonov novi Kindle Scribe unapređuje mogućnost e-čitača da pretvara rukom pisane beleške u čitljiv tekst. Takođe, Goodnotes, aplikacija za digitalne beleške, koristi tehnologiju Goodnotes Smart Ink kako bi rukopis pretvorio u kucani tekst i omogućio uređivanje beleški kao da su kucane, uključujući poravnavanje, kopiranje, lepljenje i logičko ređanje teksta, piše PC Press.

  • Podeli:

Ostavite Vaš komentar:

NAPOMENA: Komentarisanje vesti na portalu UNA.RS je anonimno, a registracija nije potrebna. Komentari koji sadrže psovke, uvrede, pretnje i govor mržnje na nacionalnoj, verskoj, rasnoj osnovi ili povodom nečije seksualne opredeljenosti neće biti objavljeni. Komentari odražavaju stavove isključivo njihovih autora, koji zbog govora mržnje mogu biti i krivično gonjeni. Kao čitatelj prihvatate mogućnost da među komentarima mogu biti pronađeni sadržaji koji mogu biti u suprotnosti sa Vašim načelima i uverenjima. Nije dozvoljeno postavljanje linkova i promovisanjedrugih sajtova kroz komentare.

Svaki korisnik pre pisanja komentara mora se upoznati sa Pravilima i uslovima korišćenja komentara. Slanjem komentara prihvatate Politiku privatnosti.

Komentari ()