近日,百度文心(ERNIE)重磅發布三項功能,新增定制多標簽文本分類、情感傾向分析模型等功能,同時數據管理能力也進一步增強,更好地滿足自然語言處理(NLP)領域開發者需求,開發者可通過百度AI開發平臺EasyDL進行使用。
文心(ERNIE)是依托百度深度學習平臺飛槳打造的語義理解技術與平臺,集先進的預訓練模型、全面的NLP算法集、端到端開發套件和平臺化服務于一體,為企業和開發者提供一整套NLP定制與應用能力。在2020世界人工智能大會,百度文心(ERNIE)榮獲最高獎項SAIL獎(Super AI Leader,卓越人工智能引領者)。
EasyDL是百度大腦面向企業開發者推出的零門檻AI開發平臺,基于百度自主研發的深度學習平臺飛槳,結合業界先進的工程服務技術打造,覆蓋視覺與自然語言處理兩大技術方向,支持一站式智能標注、模型訓練、服務部署等全流程功能。使用EasyDL簡單三步即可完成NLP任務配置與訓練,性能優異。
面向零算法基礎的開發者和專業算法工程師,EasyDL提供了經典版、專業版兩種產品形態,開放不同層次的開發靈活度。在經典版與專業版中,NLP功能與使用場景存在區別,用戶可根據需求靈活選擇。
· 經典版:適合算法零基礎或追求高效率開發的用戶,無須了解算法細節,最快5分鐘上手??煽焖俣ㄖ贫喾NNLP模型,覆蓋NLP基礎任務和場景化任務。
· 專業版:適合NLP初學者和專業算法開發者,內置豐富的NLP經典網絡和預訓練模型,可靈活腳本調參,只需少量數據可達到較優模型效果。
文心(ERNIE)三項能力在EasyDL中全新發布
文心(ERNIE)公有云服務本次新增了多標簽文本分類、情感傾向分析等模型定制功能,并且豐富了數據標注、數據管理能力,以更好地滿足開發者需求。
新增定制化多標簽文本分類功能
“多標簽文本分類”指對一段文本同時標記多個標簽,如:“未來的學和教正在發生顛覆,學生將會在家里學習,機器人將走上講臺。”可對應標簽為“教育”、“科技”。該功能應用場景廣泛,如媒體場景中對新聞內容進行自動歸類,在內容推薦場景中利用內容標簽提升召回,通過自動標簽功能對知識文檔進行多層級分類等。
目前,EasyDL平臺經典版和專業版均新增了這項功能,在“專業版”的任務配置過程中,開發者還可選擇ERNIE Tiny、ERNIE Large、ERNIE Base三種各有所長的預訓練模型。
新增定制化情感傾向分析功能
“情感傾向分析”指對一段文本進行“積極情感”或“消極情感”的判斷,如“酒店位置很好,服務周到熱情,下次一定會再來”的用戶評價,部署模型后可直接得到“Positive(積極情感)”的標簽和99%的置信度。
該功能最常應用于用戶評論分析和輿情分析,比如商品、店鋪的口碑分析,對事實性的新聞事件或互聯網話題進行輿情分析等,在汽車、餐飲、酒店等多個垂類上,分析準確率可達到95%以上。
目前,該功能已經上線EasyDL經典版,后續平臺將逐步增加基于實體級和句子級的情感分類,力求覆蓋更多的應用需求。
文本數據管理和數據標注功能全面升級
針對開發者數據管理和數據標注過程中的痛點,EasyDL支持了更加靈活的數據格式,當前可支持zip、Excel、TXT三種文件格式進行上傳。除了提供在線標注能力外,還提供智能標注功能,大幅降低了開發者的標注成本,開發者可直接上傳未標注數據體驗該功能。
圖:文本智能標注示意圖
以上是本次EasyDL平臺升級帶來的新增能力,百度搜索EasyDL可訪問官網體驗。
文心(ERNIE)目前已廣泛服務于傳媒、金融、醫療等多個行業,助力多家企業完成業務的智能化轉型,向智能經濟時代邁進。未來,文心(ERNIE)將繼續推動技術創新、產品功能豐富與體驗優化,讓更多的企業級開發者方便快捷地應用前沿NLP技術,以強大的文本智能助力各行各業。