隨著AI大模型技術逐漸深入到應用層面,手機掃描的功能和體驗迎來了全面升級。日前,阿里智能信息事業群推出搭載AI大模型技術的手機掃描產品“夸克掃描王App”,集合高清掃描、提取文字、格式轉換、去除手寫筆跡、自拍證件照等20余種功能,更精準、更高效地識別、分析與理解復雜內容,成為用戶提升工作、學習效率的掃描AI助手。
AI大模型技術加持 讓掃描更精準、更高效
近年來,隨著移動辦公、學習需求的爆發,手機掃描市場悄然生變。據夸克掃描王數據顯示,用戶掃描學習相關內容數量長期位居第一;職場人群的掃描內容量過去一年增長三倍。Z世代用戶不僅要求掃得清晰,他們對編輯、分享、存儲乃至創作都有了更加個性化的需求,而傳統的手機掃描已經很難滿足這一變化。
據悉,夸克掃描王App應用了最新AI大模型的技術能力,基于大語言模型的結果優化,能夠在復雜場景下模仿人類思維,更精準地識別、分析和提取文字、公式及圖片等內容,從而實現更完美的掃描效果。
記者體驗時發現,AI大模型在提取文字的過程中發揮了全新作用。當被掃描文字存在陰影遮擋或破損等情況,夸克掃描王在結合數據庫里的訓練樣本后,可以根據上下文的語義解析,去進行匹配定位,從而掃描出一份清晰、平整、有邏輯的電子文檔。
過去一年,夸克掃描王自研的AI大模型,通過對海量圖文數據的訓練,首次將多模算法引入文字識別領域,讓公式識別、手寫識別的效果大幅度提升,印刷文字識別精度為99.99%,手寫文字識別精度超過98.5%。同時,夸克掃描王將游戲引擎數據模擬方法與半監督模型訓練方法引入到文檔掃描的模型開發中,快速提升文檔矯正、字跡清晰度、背景雜質擦除效果。
通過強大的OCR和版式識別技術,夸克掃描王可以幫助用戶掃描文檔、手賬、單據、屏幕等,完成從圖片到資料的轉化。同時,借助便捷的資產管理功能,用戶可以隨時在本地和云端找到重要掃描文件,根據需求進行二次編輯和分享,成為用戶隨身的掃描AI助手。
多款生產力工具持續迭代 服務不同類型用戶
“堅持用戶第一,創造和滿足不同類型的信息服務需求,是夸克始終堅持的產品理念。夸克掃描王App正式上線,是夸克'內容+智能工具'戰略的重要進展。”夸克掃描王產品負責人表示。在掃描、網盤、文檔等垂直領域,夸克持續為用戶提供專業、智能的產品技術和功能體驗。
對行業來說,夸克掃描王通過「AI+掃描」也將促進手機掃描從記錄走向深度編輯、個性化生成等全新領域,繼續擴大行業發展前景。夸克掃描王產品負責人認為,掃描是用戶資產數字化的重要場景,搭載AI大模型的能力后,一方面可以讓被掃描內容呈現出更好的效果,也會讓用戶擁有更加自由的創作空間,進而幫助用戶實現掃描場景下的提質增效。
為了更好的滿足用戶需求,夸克以搜索為核心,打造了智能信息服務的底座,再通過網盤、掃描、文檔等垂直領域的生產力工具,進一步滿足用戶不同領域中的場景化需求。
業內專家指出,夸克多端一體化的發展戰略,不僅惠及用戶更好地使用數字資產,同時考驗產品、技術在不同場景上的協同能力。夸克掃描王的推出不僅給掃描重度用戶提供了專業工具,也是夸克探索新一代智能信息產品的必由之路。