OCR(文字識別)技術是最早應用于企業降本增效的 AI 方向之一,如今已逐漸下沉為企業智能化升級的一項重要基礎設施能力。10月29日,百度智能云線上線下同期舉辦了TechDay OCR技術創新沙龍,深度分享OCR產品矩陣、功能、應用案例等最新進展,并重磅全新發布EasyDL OCR自訓練平臺。泰康保險集團、北京融匯金信等企業伙伴在現場分享了OCR在企業內的應用經驗和心得。百度智能云OCR產品為企業打造了技術領先、類型豐富同時支持便捷自定制的解決方案,已廣泛應用于金融服務、財稅報銷、快遞物流、法律政務、交通出行、教育培訓、內容審核等全行業領域,加快推動企業實現產業智能化升級。
業界首發EasyDL OCR自訓練平臺,低成本滿足OCR定制化需求
近年來,OCR的識別能力不斷突破,逐漸在更加復雜的數字化場景發揮作用,有效降低信息提取和錄入的人力成本,幫助企業專注于上層業務應用。與此同時,企業對于OCR識別模型定制化的需求日益旺盛,包括OCR在特定場景下是否有高精度識別效果、能否高效響應自身業務需求、是否能在模型訓練過程中保證數據安全,以上三點成為行業共性訴求。
為滿足企業快速定制OCR識別模型的訴求,EasyDL OCR自訓練平臺應運而生。據介紹,EasyDL OCR 自訓練平臺具有兩大核心產品功能,即自動訓練OCR和定制化訓練OCR;同時具備三大產品特性,包括內置成熟OCR技術方案,預置經過真實業務檢驗的多種自動化機制,如智能標注、自動數據預處理、虛擬數據生成等,同時還開放了調參能力,滿足多種場景OCR模型定制訓練需求,保證高準確率;可視化模型訓練,預置領先的OCR算法,可實現零門檻模型訓練,高效響應業務需求;支持本地私有化部署,數據無需出廠,有效保障數據安全。
會上,EasyDL OCR產品負責人還分別演示了自動化訓練OCR和定制化訓練OCR模型訓練過程,并在最后總結了適合應用的不同場景和優勢。
具體而言,自動化訓練OCR每個版式僅需1張訓練圖片,“智能標注”功能支持快速標注關鍵字段,顯著提升標注效率,系統自動完成模板分類,可應用于版式多樣、識別特定字段、圖像質量統一的場景,同時模型重訓功能支持新增版式的快速擴充。定制化訓練OCR則具有數據自動生成能力,可模擬各類真實場景中復雜數據狀況,如模糊、變形、缺角等,少量標注數據即可獲得更高的識別準確率,可應用于版式固定、全字段識別、圖片質量復雜的場景。
百度OCR“技術+產品+應用”行業領先,助力企業智能化升級
百度OCR是國內應用最廣泛的文字識別服務,依托業界領先的深度學習技術和海量優質數據,提供多場景、多語種、高精度的文字檢測與識別服務,并針對圖片模糊、傾斜、翻轉等情況進行深度優化,魯棒性強,多項ICDAR指標居世界第一,通用、主流卡證識別準確率高達99%。
而其背后正是由百度AI核心技術引擎——百度大腦支撐,如今升級到6.0的百度大腦已成為AI新型基礎設施。從基礎層的算力、數據、飛槳深度學習平臺,到感知層的語音、視覺、AR/VR,再到認知層的語言與知識,以及平臺層的AI平臺與生態,百度大腦始終保持核心技術持續領先,不斷夯實“軟硬一體AI大生產平臺”,并通過百度智能云整合輸出產品服務,加速產業智能轉型升級。截至目前,百度大腦已經開放了273項AI能力,凝聚超過230萬開發者,培養了超過100萬AI人才,在眾多行業領域落地應用,推動了中國AI技術研發、實踐應用與生態建設。
產業智能化升級一個核心前提就是,信息數字化和結構化。OCR作為最早應用于企業效率提升的AI方向之一,顯著提升了信息提取和錄入的效率,實現了信息處理的“電子化”、“自動化”,為上層業務應用提供有力支撐。
據現場介紹,百度OCR技術經過多年沉淀和實踐打磨,在多項行業競賽評比當中持續摘得桂冠。例如:2019年從90多支參賽隊伍中脫穎而出,獲得中國最高等級商業領域人工智能技術競賽唯一A級別證書;在OCR領域最具影響力的ICDAR 19 MLT (多語種task)榜單當中獲得文字檢測領域世界冠軍;。同時,百度OCR也在不斷推進算法創新和突破,引領行業技術發展,例如:發布了業界最大的中文OCR數據集,首次提出端到端OCR-部分監督算法End2End-PSL,實現精標數據+弱標數據的混合訓練,克服精標數據成本高問題,使得標注成本降低至1/90。
依托百度大腦領先的深度學習技術,百度OCR已開放全系列50多款產品,不僅可以實現通用場景的文字識別,還可滿足各類垂直場景的信息電子化、結構化識別需求,例如財務票據識別、醫療票據識別、教育場景的公式識別和試卷識別等等。
打破封閉研發生態,積極賦能企業在具體場景落地
作為保險醫療領域的代表,泰康保險集團科技研究院、圖文分析實驗室負責人劉興旺在會上表示:“如何提高理賠效率,降低成本成為各大保險公司非常關注的一點。基于百度OCR識別提取各類醫療票據/單據字段信息的技術能力,我們共同首創的端到端關系識別模型,整個質檢分類準確率可達到97%,實際復雜生產環境中的結構化識別準確率可達86%,大大節約了人力成本,同時顯著提升了理賠業務效率。”
北京融匯金信信息技術有限公司創始人羅彤從金融服務的角度發表了自己的看法,他講到:“金融主要做的兩件事其實就是,需要大量數據進行預測,以及大量文檔、圖片等信息進行客戶服務。而百度OCR提供的解決方案,可以讓我們把數據和知識打通,解決人工錄入信息出錯率高、效率低等行業痛點的同時,能夠顯著節約成本、得到更加精準的預測結果,同時提升整體業務效率。”據悉,在金融服務領域,百度OCR已在銀行、保險、證券、信貸、支付等場景應用落地。
除此之外,百度OCR還已廣泛應用于財稅報銷、快遞物流、法律政務、交通出行、教育培訓、內容審核等眾多領域,為企業降本增效,提升用戶體驗。例如:代賬公司借助百度OCR,為中小企業提供智能報賬服務,大幅提升業務流程效率;中國移動設計院使用百度OCR對內部報賬系統進行智能化改造,20分鐘的人工填報流程縮短至1分多鐘;在快遞物流領域,則可以綜合應用OCR、NLP地址識別、語音識別等多項AI能力,提升分揀、配送效率及用戶使用體驗。
目前,使用百度OCR的用戶已超過70萬。未來,百度OCR作為百度智能云服務的重要一環,在百度大腦領先技術的支持下,將持續快速迭代,不斷優化產品服務,探索更多應用場景,同時賦能更多合作伙伴,助力企業開啟智能化升級快速通道,創造更大價值。