8月24日消息,近期,2022中國圖象圖形大會(CCIG 2022)在成都落幕,本次大會由中國科學技術協會指導,中國圖象圖形學學會主辦,四川大學承辦,電子科技大學協辦,匯聚了百余位國內知名學者,以及來自百度、華為、OPPO、合合信息等企業的技術專家,共話圖像圖形學術研究與技術創新趨勢,共謀行業新發展。
合合信息自然語言算法研發總監丁凱博士認為,盡管OCR技術已走過一個世紀的發展,現今仍存在文檔圖像質量退化嚴重、文字檢測及版面分析困難、非限定條件文字識別率低、結構化智能理解能力差等亟待解決的問題。OCR技術的進階之路上,文檔圖像質量的增強是重要的研究方向,需克服頁面彎曲、陰影遮擋、摩爾紋、圖片模糊等現代文本圖像處理中常見的干擾狀況。通過引入AI(人工智能)技術,合合信息智能文字識別及圖像處理技術能夠幫助各應用領域簡化下游文檔處理任務,提升文字識別效率與準確性。
以彎曲矯正為例,丁凱博士介紹了基于文本行線擬合和坐標變換、基于文本行線優化矯正的方法原理和優缺點,并提到合合信息采用的基于位移場網絡學習的方法的系統架構,可有效解決多種彎曲文檔圖像的矯正問題。除此之外,在教育領域,合合信息“字跡擦除”技術融合了內容切分、手寫字跡分離網絡、文檔質量增強技術,對復雜場景進行準確處理,實現作業及試卷筆記“一鍵擦除”。

另外一方面,文檔數字化流程的建立是加速企業數字化轉型的關鍵,也是技術落地中的痛點。為了更好地解決不同業務中存在的文檔版式繁雜、訓練樣本匱乏、模型定制化調優周期長且效率低的問題,合合信息推出了TextIn Studio智能文字識別訓練平臺,可將底層資源、數據、模型訓練、集成部署和服務管理應用多個模塊整合在一起,針對性解決各項問題的同時,建立業務流程之間的閉環,實現模型自動化訓練和部署。
大會還舉行了第三屆CSIG圖像圖形挑戰賽總決賽頒獎儀式。CSIG圖像圖形挑戰賽旨在促進我國圖像圖形技術及相關產業的發展和應用,解決企業面臨的技術難題,幫助企業引入更多的優秀人才。本次大賽吸引了來自高校、科研機構、企業的上百支參賽隊伍參與。憑借在視覺關鍵信息理解層面的算法優勢與多語言票據識別場景的實踐沉淀,合合信息與高校及企業生態伙伴組成的參賽隊伍繼獲得“中英文購物小票信息理解賽道”單項冠軍后,通過終輪現場比拼,獲得CSIG圖像圖形技術挑戰賽總冠軍。