表格大小、種類與樣式復雜多樣,例如表格中存在不同的背景填充,不同的行列合并方法,不同的內容文本類型等。并且現有文檔既包括現代的、電子的文檔,也有歷史的、掃描的手寫文檔,它們的文檔樣式、所處光照環境以及紋理等都有比較大的差異。因此,表格識別一直是文檔識別領域的研究難點。好在,合合信息智能文字識別技術讓高精度表格識別成為現實。
在16年領域深耕中,合合信息智能文字識別技術覆蓋了圖片、PDF格式文檔中多種類的表格識別需求,包括有線表,三線表,無線表等,并且支持合并單元格、多表格并存等復雜情況的識別。
基于分治思想,合合信息引入深度學習技術,將表格識別分為有線表識別和無線表識別兩種方案。有線表識別中,合合信息利用語義分割、角點回歸等技術方案還原有線表,在財報相關表格識別測試中,有線表識別單元格結構準確率高于98%。無線表識別則采用序列模型、規則匹配等方案,通過自研模型直接預測表格的邏輯結構,再得到表格的物理結構,在保證表格區域內容的完整性的同時,檢測準確率較傳統方法顯著提升。
現階段,合合信息智能文字識別技術中的表格識別技術已被應用于以“掃描全能王”為代表的C端APP中,通過“文件轉換excel”功能服務于大眾生活和辦公需求。近半年來,“文件轉換excel”相關功能累計被調用百萬次。
B端領域中,作為合合信息智能文字識別引擎中的重要模塊,表格識別技術已落地在保險、銀行、證券等行業中,應用于合同、銀行流水、物流單據識別等多個場景。
據悉,合合信息是一家人工智能及大數據科技企業,從2006年創立至今,堅持深耕智能文字識別應用及商業大數據核心技術領域,通過C端、B端產品以及行業解決方案,為全球百余個國家和地區的億級用戶及近30個行業的企業客戶提供創新的數字化、智能化服務。
近三年來,合合信息先后在ICDAR、ICPR等人工智能國際競賽中斬獲15項冠軍,學術成果在CVPR、AAAI、ACL、ACM MM等頂會上發表,相關項目獲中國圖象圖形學學會(CSIG)科技進步獎二等獎。在今年8月的CSIG圖像圖形技術挑戰賽中,合合信息參與的賽隊奪得總冠軍。