近日,科技創新情報SaaS服務商智慧芽宣布,其數據庫中的專利分類號在兩方面取得重大突破——專利分類號說明精準翻譯、CPC智能補全,全面幫助用戶提升專利檢索的便利性和準確性,提升用戶效率。
一直以來,業內使用的專利分類號面臨的兩大痛點:一是大量分類號缺少精準的中文解釋說明,用戶無法清晰明白專利號的非中文準確含義;二是全球近1.7億條專利中,近四成專利缺少CPC分類信息,這些專利無法從分類號上判斷其領域特征。智慧芽在專利數據分類號中的重大突破,開創性解決了業內這兩大難題。
如何解決這兩大難題?智慧芽技術副總裁屠昶旸解釋到:“第一,智慧芽聘請專業人士,人工翻譯了超78萬條分類號;第二借助機器學習等人工智能技術,對5000多萬條未覆蓋CPC分類的專利進行補全,完善其CPC分類,大幅提升產品用戶體驗。”
突破一:專業人士翻譯78萬條分類號說明
由于專利分類號環環相扣、互相補充,加上分類號中存在較多行業性和專業性詞匯,使得機器翻譯分類號說明準確性相對較低。智慧芽邀請不同領域知識產權專業人士,對海量分類號進行一一人工翻譯,確保分類號說明的準確性,使翻譯后的分類號中文說明同樣能夠相互包含,易于理解。
除了內容難度之外,龐大的分類號數量,也增加了分類號翻譯的難度。當前,智慧芽還實現了17萬條UPC英文的翻譯、20萬條FI和41萬條F-term的日文翻譯,使得專利檢索更加全面,可以更好地服務客戶。
圖1:UPC分類號
圖2:FI分類號
圖3:F-term分類號
突破二:智能技術補全5000萬條CPC
CPC分類號是進行專利檢索分析的重要工具,但由于CPC分類號是2010年才發布使用,部分國家/地區/組織才逐漸采用CPC分類號,因此導致有近四成專利未覆蓋CPC分類號信息,影響專利檢索結果的全面性。
圖4:CPC分類號預測
圖5:支持檢索預測的CPC分類號
智慧芽通過人工智能機器學習技術,將文本信息和已有分類號作為訓練數據進行機器學習,構建分類號預測模型。對缺失CPC、存在摘要或權利要求的專利進行CPC分類補全,進而提高用戶使用CPC檢索結果的準確性。當前,智慧芽已經實現CPC的覆蓋度從59%提高到 95%。
未來,智慧芽將腳步不止,不斷迭代產品功能,持續更好地服務用戶。
文末福利,掃碼領取
數據庫7天免費試用權限
*申請成功后,我們會在2個工作日內幫您開通賬號