日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

近日,第11屆CCF自然語言處理與中文計算國際會議(NLPCC 2022)揭曉了開放評測任務評比結果。網易云商(網易智企旗下服務營銷一體化平臺) AI 技術團隊在命名實體識別評測任務中勇奪冠軍,展現了在自然語言處理和深度學習技術領域的領先實力。

NLP領域權威賽事網易云商一鳴驚人

CCF自然語言處理與中文計算國際會議(The CCF International Conference on Natural Language Processing and Chinese Computing,簡稱NLPCC)是CCF-NLP(中國計算機學會自然語言處理技術委員會,前身為中國計算機學會中文信息技術委員會)的年度會議,也是自然語言處理(NLP)和中文計算 (CC)領域最為知名的國際學術會議之一。NLPCC專注于自然語言處理及中文計算領域的學術和應用創新,致力于推動該領域學術界和工業界研究、創新與應用的發展,目前已發展成為覆蓋全國、具有國際影響力的學術與創新交流平臺。

NLPCC 2022沿襲了NLPCC大會傳統,舉辦了若干自然語言處理任務的開放評測,既涵蓋了經典的自然語言處理任務,也包括了時下頗受關注的前沿任務,包括:用知識模型回答問題、語音實體鏈接、多模態產品總結、多模態對話理解和生成、"多標簽分類、命名實體識別、科學文獻內容提取"、"對話文本分析、主題提取和對話總結 "以及細粒度對話社會偏差測量等七大評測任務。

本次評測受到了學術界和工業界的廣泛關注。以網易云商AI團隊報名參賽的評測任務(五)——多標簽分類、命名實體識別、科學文獻內容提取為例,共吸引了57支隊伍報名,包括清華大學、北京大學、哈爾濱工業大學、大連理工大學、華東師范大學、南京理工大學、北京郵電大學、中國科學院信息工程研究所等科研機構和華為、騰訊、阿里巴巴、招商銀行等知名企業,競爭極其激烈。

網易云商AI團隊首次在業內公開賽事中亮相,并在命名實體識別子任務中一舉奪魁,展現了在自然語言處理,特別是命名實體識別領域的頂級技術能力。

創新NER算法模型提升預測準確率

命名實體識別(Named Entity Recognition,簡稱NER),是自然語言處理中的一項基礎任務,有著非常廣泛的應用。命名實體通常指文本中具有特定意義或者指代性強的短語,包括人名、地名、組織機構名、時間日期、專有名詞等。NER系統就是要從非結構化的自然文本中抽取出上述實體,并且可以按照業務需求識別出更多種類的實體,比如產品名稱、型號、大小等。同時,NER技術也是關系抽取、事件抽取、知識圖譜、問答系統等諸多NLP應用的基石。

在傳統機器學習的方法中,通常以序列標注方式對NER進行建模,利用大規模語料來學習出標注模型,從而對句子的各個位置進行標注。隨著深度學習的發展,深度神經網絡可以有效處理眾多NLP任務,對于NER來講,利用神經網絡自動完成特征提取,可以大幅提高NER的識別準確率。尤其是近兩年,得益于BERT、GPT等大規模預訓練語言模型的出現,NER識別準確率又得到了一次大幅度的提升。

在NLPCC 2022 命名實體識別評測任務中,參賽團隊需要基于最先進的NLP和深度學習技術,設計命名實體識別模型對專業領域內的文本內容進行識別。不同于以給定的文本內容為基礎的傳統識別模型,網易云商AI團隊通過爬蟲獲取給定文本的上下文,為給定的文本增加額外的領域相關知識,從而進行文本內容層面的增強,提高模型整體的識別能力。另外,為了解決訓練語料稀缺的問題,團隊采用了相似實體替換以及遠程監督兩種方式對原始數據的數量進行擴增,將總訓練語料提升至原來的5倍,整體提高了模型的性能。

網易云商冠軍算法采用了業界領先的W^2NER模型,突破了傳統序列標注的建模方式,將實體識別問題轉換為了詞與詞之間的關系分類問題。通過這種建模方式,可以同時解決多種不同的實體識別,包括扁平實體、嵌套實體、非連續實體。該模型除了使用常見的TransformerEncoder結構捕捉文本信息,還額外引入了多粒度的空洞卷積來挖掘詞與詞之間的關系,并在解碼階段采用了雙線性分類器和多層感知器共同解碼,提高了整體的預測準確率。

落地實際業務冠軍算法加速任務處理

目前,本次比賽中所使用的命名實體識別技術已經成功運用在了網易云商的實際業務中。例如多輪對話機器人、外呼機器人等,在真實業務場景中實現機器人問題匹配率和解決率的提升,進一步加速任務處理。

多輪對話機器人能夠基于任務場景搭建任務流程,通過上下文追蹤明確訪客意圖,解決復雜場景,完美契合任務型場景。當用戶在進行退換貨、維修等售后問題咨詢時,大都會與機器人產生多輪對話,以幫助機器人獲取足夠的信息,快速提供精準的答案。

比如,當用戶詢問 “我的WN54洗衣機壞了,北京哪里可以修”時,NER識別技術可以將 “WN54” 識別為具體的型號,將“北京” 識別為地點,由此快速找到對應答案(例如此商品在北京的維修地點)并推送給用戶。該場景中,NER識別技術的應用輔助機器人提升了知識點的匹配率,也控制了一觸即達流程的跳轉。此外,在FAQ單輪問答場景中,通過識別實體,也可以提供更好的答案。

NER識別技術不僅可以應用在文本機器人中,在語音機器人的應用中也發揮著巨大作用。傳統人工電話每人每天可撥打約120通,而外呼機器人可撥打近1200通,還可以通過語音識別理解用戶意圖,進行自助任務辦理,因此當下被廣泛應用于批量通知或回訪的場景中。

以反詐案件處理場景為例,當機器人詢問“你給他們轉了多少錢”,用戶回復:“第一次八十,第二次三百多,總共不到四百”,其中的“八十”、“三百多“ 以及 “不到四百”,都可被NER識別技術進行抽取識別,在判定為詐騙金額后將結果記錄并反饋,按照預置的標準處理流程進入到下一步,例如反詐中心工作人員介入處理等。得益于NER識別技術的應用和高識別準確率,反詐案件的信息搜集環節可以直接交給外呼機器人,使得有限的工作人員專注于重要案件處理,既實現了任務及時受理不遺漏,也節約了人力成本,提升處理效率。

未來,網易云商將加大對前沿技術的研究力度,探索深度學習、自然語言處理等技術的新方向,打造更智能的服務營銷一體化平臺。

分享到:
標簽:網易 實體 賽事 命名 識別 冠軍 權威 創新
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定