近日,在NLP(自然語言處理)領域的頂級賽事LIC 2022語言與智能技術競賽中,商湯科技研究院NLP團隊攜手香港中文大學團隊,在王歷偉教授的指導和帶領下,從超過500個注冊隊伍中脫穎而出,斬獲視頻語義理解任務冠軍。這也是商湯科技在人工智能學術領域獲得的又一項超高含金量的技術殊榮。
語言是人類信息傳遞最重要的媒介,讓機器理解語言并進行交互是人工智能的基本挑戰。作為由中國中文信息學會(CIPS)和中國計算機學會(CCF)主辦的NLP學術競賽,LIC已連續成功舉辦五年。本屆LIC覆蓋自然語言處理和人工智能領域的重要前沿課題,設計了圍繞跨模態、知識驅動、可信學習等方面的四大任務,難度相比往屆也進一步提升。競賽吸引了包括騰訊、阿里巴巴、清華大學等在內的學術界、工業界的知名研究者和開發者約3000余名選手共同參與,展開激烈角逐。
本次競賽的視頻語義理解任務包含分類標簽預測和語義標簽預測兩個子任務。在分類標簽預測任務中,商湯NLP團隊利用預訓練模型和類Transformer結構對不同模態的數據進行編碼和融合,并進行了數據增強和模型融合,出色地完成了視頻中兩個級別的標簽分類。在語義標簽預測任務中,商湯NLP團隊提出了將命名實體識別模型和標簽分類模型結合的方案,經過創新地數據增強和模型融合后,不僅可以發掘文本中存在的標簽,還可以提供額外的標簽預測。憑借在多模態和NLP領域的不斷積累和創新能力,商湯NLP團隊在這兩個子任務中均摘得桂冠。
隨著人工智能技術的發展以及在不同場景的快速落地,NLP領域的需求和應用越來越廣泛,重要性日益突顯。例如在數字人領域,語音語義理解是數字人“AI大腦”的重要組成部分。基于語音識別(ASR)、語音合成(TTS)、自然語言理解(NLP)等技術組合,結合商湯所積累的語音語義理解和生成能力,以及知識庫自動學習和模型訓練能力,可以根據不同行業業務需求,快速定制AI數字人的智能語音對話和問答系統,并可通過接入后臺運營管理平臺,支持知識庫的在線更新和維護,實現AI數字人的深度學習和迭代升級。依托深厚的技術積累,商湯數字人解決方案已覆蓋超過200款手機、平板電腦、AR/VR眼鏡、智慧大屏及線下一體機等多種終端設備。在不久前知名研究機構沙利文聯合頭豹研究院發布的報告中,商湯被列入數字人領導者陣營。
自成立以來,商湯科技長期持續投入引領全球的人工智能技術研究,不斷斬獲佳績,積累了深厚的技術基礎與人才優勢。目前,商湯已在各項全球競賽中已獲得70多項冠軍,發表超過600篇頂級學術論文,擁有8,000多項人工智能專利及專利申請。商湯科技還前瞻打造了行業領先的人工智能基礎設施SenseCore商湯AI大裝置,為技術研發和落地提供重要支撐,并幫助研究人員快速實驗并驗證新的想法,加速創新與迭代。
通過凝聚頂尖人才,持續打造更具擴展性、更普惠的人工智能軟件平臺,商湯未來將更加高效地推動前沿AI技術的創新轉化和落地應用,更好地滿足多領域、多場景的產業應用,為學術及產業界發展貢獻力量。