【ITBEAR】Google Research近日發(fā)布了一項名為InkSight的前沿人工智能技術,該技術能夠直接提取手寫文字圖片中的數(shù)字文本,無需任何中轉設備,為手寫文字識別帶來了革命性的進步。
與傳統(tǒng)的依賴光學字符識別(OCR)技術相比,InkSight在處理含有復雜背景、模糊或光線不足的手寫文字時展現(xiàn)出更高的性能。該技術采用了一種模擬人類學習閱讀的方法,通過反復重寫文本來掌握單詞的外觀和意義。
特別InkSight在應對復雜場景下的手寫文字識別時表現(xiàn)尤為出色。即便文本部分被遮擋或存在背景干擾,它也能精準地識別出手寫內容。研究結果顯示,人們閱讀由InkSight生成的文本描摹時,準確率高達87%,且其中三分之二的描摹與真實手寫極為相似,難以區(qū)分。
對于喜愛手寫的人群而言,InkSight技術無疑具有巨大的應用潛力。用戶只需拍攝手寫筆記的照片,便可迅速將其轉換成可搜索的數(shù)字文本。即便是對于字跡潦草的內容,InkSight也能實現(xiàn)清晰、精確的打印文本轉換。
然而,在手寫識別AI技術領域,谷歌并非孤軍奮戰(zhàn)。亞馬遜的Kindle Scribe電子閱讀器以及數(shù)字筆記應用Goodnotes等也已推出類似功能,旨在將手寫文字轉換成可編輯的數(shù)字文本,共同推動這一領域的發(fā)展。