歷經(jīng)3個(gè)月的激烈角逐,2021語(yǔ)言與智能技術(shù)競(jìng)賽于近日發(fā)布了競(jìng)賽結(jié)果的榜單。本次競(jìng)賽由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)和中國(guó)中文信息學(xué)會(huì)(CIPS)聯(lián)合主辦,百度公司、中國(guó)計(jì)算機(jī)學(xué)會(huì)自然語(yǔ)言處理專委會(huì)和中國(guó)中文信息學(xué)會(huì)評(píng)測(cè)工作委員會(huì)共同承辦。比賽將在第六屆“語(yǔ)言與智能高峰論壇”上舉辦技術(shù)交流和頒獎(jiǎng),獲勝團(tuán)隊(duì)將分享總計(jì)30萬(wàn)元人民幣的獎(jiǎng)金。屆時(shí),論壇還將邀請(qǐng)國(guó)內(nèi)外學(xué)術(shù)界、工業(yè)界知名專家學(xué)者,面向社會(huì)公眾介紹語(yǔ)言與智能及相關(guān)領(lǐng)域的發(fā)展趨勢(shì)和創(chuàng)新成果。
2018年至今,該競(jìng)賽已經(jīng)成功舉辦了三屆。今年競(jìng)賽設(shè)立了來(lái)源于真實(shí)應(yīng)用需求的三大任務(wù)——機(jī)器閱讀理解、多技能對(duì)話、多形態(tài)信息抽取,采用的數(shù)據(jù)集均來(lái)源于中文開(kāi)源數(shù)據(jù)集項(xiàng)目“千言”。同時(shí),在競(jìng)賽結(jié)束后,“千言”將持續(xù)提供本次競(jìng)賽的數(shù)據(jù)集下載和常規(guī)評(píng)測(cè),支持自然語(yǔ)言處理領(lǐng)域的研究者、開(kāi)發(fā)者的日常技術(shù)研發(fā)工作。
三千余支隊(duì)伍激烈角逐超往年 覆蓋廣泛競(jìng)技水平高
據(jù)統(tǒng)計(jì),本屆競(jìng)賽三大任務(wù)賽題共有超過(guò)4300人次、3500支隊(duì)伍報(bào)名參加,累計(jì)收到有效提交結(jié)果1萬(wàn)多次。
本屆競(jìng)賽的三大賽題——機(jī)器閱讀理解、多技能對(duì)話、多形態(tài)信息抽取較往年賽題在難度上全面升級(jí),覆蓋了更多的數(shù)據(jù)集和更加豐富的評(píng)測(cè)維度,對(duì)模型的魯棒性和泛化性等提出了更高的挑戰(zhàn)。盡管難度提升,根據(jù)比賽報(bào)名及提交情況來(lái)看,單任務(wù)參賽及提交隊(duì)伍較往屆數(shù)量反而提升、參賽熱情不減。
從參賽隊(duì)伍分布看,比賽延續(xù)了參賽隊(duì)伍一貫的多元化特點(diǎn),大部分985、211高校均有參與,包括清華大學(xué)、北京大學(xué)、復(fù)旦大學(xué)、中國(guó)人民大學(xué)等知名高校,還有慕尼黑工業(yè)大學(xué)、南洋理工大學(xué)、早稻田大學(xué)、愛(ài)丁堡大學(xué)等國(guó)際學(xué)府。除了國(guó)內(nèi)外多所高校、科研機(jī)構(gòu)等的積極參與之外,本屆比賽中企業(yè)參賽隊(duì)伍達(dá)到五百多支,體現(xiàn)了產(chǎn)業(yè)界對(duì)于前沿NLP中文任務(wù)的關(guān)注和重視。參賽企業(yè)覆蓋了互聯(lián)網(wǎng)、AI、通訊、金融、能源、航空航天等多個(gè)領(lǐng)域,包含騰訊、華為、阿里、網(wǎng)易、頭條、中國(guó)移動(dòng)、平安等知名企業(yè)。
從提交結(jié)果來(lái)看,本屆競(jìng)賽也在三大賽題的得分上取得了新突破。如機(jī)器閱讀理解任務(wù)F1最高得分為69.41,較基線提升22.87%;多技能對(duì)話系統(tǒng)總得分從基線0.60提升到最好成績(jī)的1.17;多形態(tài)信息抽取任務(wù)綜合最高得分為79.481,較基線提升19.12%。其中,企業(yè)隊(duì)伍也展現(xiàn)了不俗的競(jìng)賽實(shí)力,在三大賽題榜單上成績(jī)亮眼。
近日,2021語(yǔ)言與智能技術(shù)競(jìng)賽已于官網(wǎng)公布獲獎(jiǎng)榜單。未來(lái)將在第六屆“語(yǔ)言與智能高峰論壇”上舉辦頒獎(jiǎng)儀式,屆時(shí)獲獎(jiǎng)隊(duì)伍也會(huì)進(jìn)行技術(shù)交流報(bào)告,對(duì)優(yōu)秀技術(shù)方案進(jìn)行解讀。
機(jī)器閱讀理解任務(wù)榜單
多技能對(duì)話任務(wù)榜單
多形態(tài)信息抽取任務(wù)榜單
從真實(shí)應(yīng)用需求出發(fā) 三大賽題攜手千言實(shí)現(xiàn)“反哺”式創(chuàng)新
理解和運(yùn)用自然語(yǔ)言是人工智能的核心問(wèn)題之一,語(yǔ)言智能的發(fā)展將推動(dòng)人工智能技術(shù)加快落地。本屆競(jìng)賽設(shè)立的三大任務(wù)——機(jī)器閱讀理解、多技能對(duì)話、多形態(tài)信息抽取均源于真實(shí)應(yīng)用需求,每項(xiàng)任務(wù)設(shè)置了更加豐富的數(shù)據(jù)集合和評(píng)測(cè)維度,可以從多任務(wù)、魯棒性和泛化性等角度對(duì)技術(shù)效果進(jìn)行綜合評(píng)價(jià),從而推動(dòng)技術(shù)更好地適應(yīng)多領(lǐng)域、多場(chǎng)景的產(chǎn)業(yè)應(yīng)用。
本次語(yǔ)言與智能技術(shù)競(jìng)賽所采用的數(shù)據(jù)集均來(lái)自于中文開(kāi)源數(shù)據(jù)集項(xiàng)目“千言”。作為面向自然語(yǔ)言理解和生成任務(wù)的中文開(kāi)源數(shù)據(jù)集合,“千言”旨在為研究人員帶來(lái)一站式的數(shù)據(jù)集瀏覽、整理、下載和評(píng)測(cè)的科研體驗(yàn)。在本次比賽結(jié)束后,自然語(yǔ)言處理領(lǐng)域的研究者、開(kāi)發(fā)者可通過(guò)“千言”官網(wǎng)(https://luge.ai)繼續(xù)下載和使用相關(guān)數(shù)據(jù)集,并參與相應(yīng)的常規(guī)評(píng)測(cè),不斷打磨和提升相關(guān)任務(wù)的技術(shù)水平,形成創(chuàng)新閉環(huán)。
百度全程提供技術(shù)支持 AI硬實(shí)力為大賽選手“保駕護(hù)航”
為了全力創(chuàng)造最佳競(jìng)賽條件,充分激發(fā)選手的創(chuàng)新靈感,百度作為本次大賽承辦方為參賽選手提供了全面的技術(shù)資源和平臺(tái)支持。
其中,百度飛槳平臺(tái)為三大競(jìng)賽任務(wù)提供了基線系統(tǒng),助力選手快速上手。同時(shí),基于百度飛槳的人工智能學(xué)習(xí)與實(shí)訓(xùn)社區(qū) AI Studio還提供了在線編程環(huán)境、免費(fèi) GPU算力支持,打破算力桎梏,在競(jìng)賽全流程為選手?jǐn)孬@佳績(jī)“保駕護(hù)航”。
一直以來(lái),百度以持續(xù)深耕的核心AI能力為各行各業(yè)賦能,助力中國(guó)產(chǎn)業(yè)智能化轉(zhuǎn)型升級(jí)。連續(xù)三屆與學(xué)界、業(yè)界共同舉辦語(yǔ)言與智能技術(shù)競(jìng)賽,百度希冀能夠進(jìn)一步挖掘和培養(yǎng)AI技術(shù)人才,同時(shí)為技術(shù)在實(shí)際產(chǎn)業(yè)場(chǎng)景中的落地和應(yīng)用提供更多新思路與可能,為人工智能技術(shù)與產(chǎn)業(yè)的發(fā)展貢獻(xiàn)不竭源動(dòng)力。