2023年合合信息帶著智能文檔處理技術亮相年度視覺與學習青年學者研討會 (Vision And Learning SEminar, VALSE) 。VALSE是一個面向計算機視覺與機器學習領域國內外華人青年學者的高規格學術研討會,本屆會議專注于視覺知識和多重知識表達、語言文字識別與理解等技術研發及應用熱點。而在信息技術高速發展的今天,隨著人們對文檔處理的要求越來越高,文檔的智能化處理技術也備受關注。
現階段我們常見的智能文檔處理技術包含智能OCR技術、智能語音識別技術、智能文本分析技術等,通常應用于紙質文件數字化處理、快速整理分類和分析繁瑣信息、合同管理、報告撰寫分析、數據統計等。這項技術也是目前計算機視覺在產業中的重要應用方向,然而現階段這項技術還面臨著諸多挑戰。作為智能文檔處理領域的代表,合合信息在會議上進行智能文檔處理技術研發與實踐成果分享。
VALSE Workshop環節,合合信息技術代表就《智能文檔圖像處理技術應用與實踐》主題進行分享
合合信息技術代表在workshop環節就OCR技術應用的拓寬帶來的新挑戰以及未來公司重點發力的技術方向進行了分享。他提到隨著OCR技術被更廣泛的應用,版面分析與文檔還原技術是否能夠提升文檔圖像電子化的視覺效果以及精準提取信息是重中之重。
隨著我們面對的信息日益繁雜,需要處理的文檔通常有著復雜的版面和多樣化的文本內容。以一篇普通的論文為例,除文字信息外,其版面往往包含頁眉、頁腳、表格、二維碼等多種非文字類的內容。這些都是版面分析技術在區域分割、邏輯排序方面所面臨的的挑戰,如何精準地辨別各類元素,并在文檔電子化過程中讓它們回歸到應有的位置,是該項技術的難點之一。
在分享環節中,合合信息技術人員提到,文檔圖片的格式轉化流程中,在檢測、識別完出文字信息中的字符、坐標信息,以及版面中段落、印章、表格等元素信息后,機器才能“理解”文檔的組成,更好地將圖像“還原”成一個可編輯的Word或Excel文件。
合合信息“智能文檔處理——文檔還原系統架構”展示
版面分析與文檔還原技術能夠幫助機器‘看懂’文檔結構,讓文檔電子化獲得‘所見即所得’的處理效果。合合信息版面分析技術通過解決版面分割、區域間的邏輯關系處理等方面的難題,可將文檔圖像切分成不同類型內容(文本、圖形、公式、表格等)的區域,并分析區域之間的關系,讓機器更精準地確定文檔中的文字位置、字體、大小和排版方式,從各類版式復雜的圖片文檔中精準獲取信息。
合合信息“版面分析與還原”技術處理效果展示
在全球企業和個人用戶數字化、智能化服務的需求環境下,合合信息將持續升級智能文檔處理技術,有效提升工作效率、促進組織和企業的數字化轉型、增強智能決策能力、推動業務的自動化流程、改善用戶的實際操作體驗。