【ITBEAR】Google Research近日發(fā)布了一項(xiàng)名為InkSight的前沿人工智能技術(shù),該技術(shù)能夠直接提取手寫文字圖片中的數(shù)字文本,無需任何中轉(zhuǎn)設(shè)備,為手寫文字識(shí)別帶來了革命性的進(jìn)步。
與傳統(tǒng)的依賴光學(xué)字符識(shí)別(OCR)技術(shù)相比,InkSight在處理含有復(fù)雜背景、模糊或光線不足的手寫文字時(shí)展現(xiàn)出更高的性能。該技術(shù)采用了一種模擬人類學(xué)習(xí)閱讀的方法,通過反復(fù)重寫文本來掌握單詞的外觀和意義。
特別InkSight在應(yīng)對(duì)復(fù)雜場(chǎng)景下的手寫文字識(shí)別時(shí)表現(xiàn)尤為出色。即便文本部分被遮擋或存在背景干擾,它也能精準(zhǔn)地識(shí)別出手寫內(nèi)容。研究結(jié)果顯示,人們閱讀由InkSight生成的文本描摹時(shí),準(zhǔn)確率高達(dá)87%,且其中三分之二的描摹與真實(shí)手寫極為相似,難以區(qū)分。
對(duì)于喜愛手寫的人群而言,InkSight技術(shù)無疑具有巨大的應(yīng)用潛力。用戶只需拍攝手寫筆記的照片,便可迅速將其轉(zhuǎn)換成可搜索的數(shù)字文本。即便是對(duì)于字跡潦草的內(nèi)容,InkSight也能實(shí)現(xiàn)清晰、精確的打印文本轉(zhuǎn)換。
然而,在手寫識(shí)別AI技術(shù)領(lǐng)域,谷歌并非孤軍奮戰(zhàn)。亞馬遜的Kindle Scribe電子閱讀器以及數(shù)字筆記應(yīng)用Goodnotes等也已推出類似功能,旨在將手寫文字轉(zhuǎn)換成可編輯的數(shù)字文本,共同推動(dòng)這一領(lǐng)域的發(fā)展。