光學字符識別OCR技術是指從圖像中自動提取文字信息的技術,這項技術橫跨了人工智能里的兩大領域:CV(計算機視覺)和NLP(自然語言處理),綜合使用了這兩大領域中的很多技術成果。在過往的發展歷程中,OCR始終具備很強的產業應用背景,是計算機領域里少數幾個一開始就由工業界和學術界雙輪驅動的領域。
不過,盡管OCR技術已走過一個世紀的發展,現今卻仍存在文檔圖像質量退化嚴重、文字檢測及版面分析困難、非限定條件文字識別率低、結構化智能理解能力差等亟待解決的問題。OCR技術的進階之路上,文檔圖像質量的增強是重要的研究方向,需克服頁面彎曲、陰影遮擋、摩爾紋、圖片模糊等現代文本圖像處理中常見的干擾狀況。
合合信息基于自研的計算機圖形圖像技術,推出多種圖像智能處理引擎,可實現圖像切邊增強、形變矯正、PS篡改檢測、去摩爾紋、水印去除、陰影處理、手寫文字擦除、圖像質檢等多種圖像智能處理效果,規范圖像采集,提升圖像質量,幫助各應用領域簡化下游文檔處理任務,通過圖像預處理提升文字識別效率與準確性。
切邊增強
智能判斷圖像中的主體邊緣并切除多余背景,同時通過增強銳化提升圖像質量、突出文字。通過合合信息的切邊增強技術,可自動裁切出圖像主體區域,并增強圖像質量,經過該項處理后再進入后續的文字識別、信息提取、材料審核等業務。
彎曲矯正&透視矯正
合合信息采用基于位移場網絡學習方法的系統構架,可對形變文檔進行智能矯正,包括彎曲矯正與透視矯正,同時智能定位文檔邊緣,切除多余背景。
依托合合信息的圖像形變矯正技術與圖像增強能力,可將手機、相機等設備拍攝的文檔、書籍圖像優化為如同平面掃描儀獲得的圖像。而對于本身就存在于彎曲載體上的文字,通過彎曲矯正技術,可自動“拉平”圖像,提升各類非常規載體文字的識別效率與質量。
PS篡改檢測
合合信息自研了基于深度學習的圖像篡改檢測方法,采用神經網絡模型捕捉圖像在篡改過程中留下的細微痕跡,基于百萬級的數據學習圖像被篡改后統計特征的變化,可智能判斷圖片是否被篡改,支持檢測復制粘貼、拼接、擦除等多種篡改形式與混合篡改,還可定位修改區域,以熱力圖形式展示圖像區域篡改置信度。
去摩爾紋
合合信息采用多重神經網絡技術,通過分析暗角、摩爾紋的形成原理,對圖像中存在的干擾因素進行對應處理,可去除所有樣式的摩爾紋,同時保證圖像信息完整、顏色不失真。
水印去除
合合信息基于全卷積網絡搭建圖像水印去除模型,支持對圖像中日期、logo、文字等形式的水印進行自動擦除,高保真處理,無痕還原圖像。
陰影處理
智能消除圖像中存在的各類形狀的陰影,解決圖像因光線條件復雜產生的有陰影、亮度不均勻問題。
手寫文字擦除
合合信息融合了內容切分、手寫字跡分離網絡、文檔質量增強等技術,將待處理圖像劃分為手寫的“擦除區域”和印刷的“非擦除區域”,快速識別與自動擦除手寫文字,并對噪點、陰影、背景雜亂等復雜場景進行處理,將文檔圖像恢復至手寫前的狀態。
圖像質檢
智能判斷圖像是否內容完整、拍攝清晰、光線充足等,對圖像質量進行自動化的準入判斷與實時反饋。
目前,合合信息相關智能文字識別及圖像處理技術已被應用于公司旗下掃描全能王等C端APP中及行業解決方案中,輻射全球百余個國家和地區的億級用戶。