【ITBEAR】Google Research近日推出了一項革新的人工智能技術——InkSight系統,該技術能夠直接識別并轉換手寫文字圖片中的信息,省去了傳統轉換方式中的中間環節。
與傳統的光學字符識別(OCR)技術相比,InkSight在處理模糊、低光照或背景復雜的手寫文本時,展現出更高的識別準確率。這一技術模仿了人類學習閱讀的過程,通過不斷重寫來深入“理解”文字的外觀和意義,從而提高了識別的精準度。
實驗結果顯示,人們在閱讀由InkSight生成的文本時,識別準確率高達87%,且其中三分之二的輸出與真實手寫難以區分。
這項技術對于那些喜歡手寫記錄的人來說,無疑是一大福音。今后,他們只需拍照上傳手寫筆記,即可輕松轉換為可搜索和編輯的數字文本。即便是字跡難以辨認的潦草手寫,InkSight也能精準轉換,生成清晰、準確的文本。
InkSight技術在文化遺產保護領域也大有可為。它能夠將珍貴的手寫文獻數字化,為歷史研究提供便利,同時也有助于保護和傳承那些數字化程度較低的語言和文化。
谷歌并非手寫識別AI領域的唯一探索者。亞馬遜的Kindle Scribe以及Goodnotes等應用也在該領域取得了顯著進展,共同推動著手寫識別技術的發展。