【ITBEAR】在湖南長沙舉辦的第五屆長沙·中國1024程序員節上,智能文檔處理成為熱議話題。活動期間,合合信息面向開發者推出了智能文檔處理“百寶箱”系列產品,提供免費體驗。這一產品旨在解決文檔解析精度低、效果評估難等問題,推動文檔處理應用的個性化與高效開發。
在《模型與工具》論壇上,合合信息智能創新事業部研發總監常揚詳細介紹了“百寶箱”的三大產品。這組工具包含前端可視化組件,讓開發者能夠直觀交互并編輯解析效果,提升解析精度。還開源了自研的文本向量模型acge,助力大模型性能優化。
針對市面上文檔解析產品效果缺乏統一標準的問題,“百寶箱”提供了文檔解析測評工具,從多個維度為工具篩選提供定量測評依據,節省開發者時間。這一工具通過雷達圖等可視化形式,直觀展示文本識別、解析和翻譯結果。
在知識庫搭建、智能文檔抽取等場景中,“百寶箱”也展現出了深度應用能力。以工程制造業為例,通過“百寶箱”及合合信息的智能文檔處理技術,開發者可以精準提取復雜文檔信息,優化知識庫構建。在面對多語種文檔時,“百寶箱”也能批量、精確區分并提取信息,提高翻譯質量。