砍柴網(wǎng)訊 2018年歲末,暨“法研杯”奪冠之后,國(guó)雙數(shù)據(jù)科學(xué)團(tuán)隊(duì)又從專業(yè)賽場(chǎng)中摘得一項(xiàng)大獎(jiǎng)歸來(lái)——“AI Challenger 2018全球AI挑戰(zhàn)賽”季軍!若要了解這項(xiàng)榮譽(yù)的含金量,還得從比賽的背景說(shuō)起。
國(guó)雙獲獎(jiǎng)團(tuán)隊(duì)與創(chuàng)新工廠董事長(zhǎng)李開復(fù)合影
什么是全球AI挑戰(zhàn)賽?
“AI Challenger 全球AI挑戰(zhàn)賽”是面向全球人工智能人才的開源數(shù)據(jù)集和編程競(jìng)賽平臺(tái),致力于滿足AI人才成長(zhǎng)對(duì)高質(zhì)量豐富數(shù)據(jù)集的需求,推動(dòng)AI在科研與商業(yè)領(lǐng)域結(jié)合來(lái)解決真實(shí)世界的問題,首屆AI Challenger 全球AI挑戰(zhàn)賽于2017年舉辦。
本屆全球AI挑戰(zhàn)賽由創(chuàng)新工場(chǎng)、搜狗、美團(tuán)點(diǎn)評(píng)、美圖公司聯(lián)合主辦,于2018年8月29日正式啟動(dòng),吸引了來(lái)自全球超過10000支團(tuán)隊(duì)參賽。其中美團(tuán)點(diǎn)評(píng)NLP(自然語(yǔ)言處理)中心提出的”細(xì)粒度用戶情感分析”賽道最受歡迎,參賽隊(duì)伍數(shù)量最多。值得一提的是,國(guó)雙正是在此賽道中獲得季軍。
截至目前,AI Challenger平臺(tái)用戶超過30000名,覆蓋國(guó)家增至81個(gè),覆蓋高校1100所,覆蓋公司990家。2018年AI Challenger平臺(tái)用戶增長(zhǎng)了170%。部分參賽名單可以了解一下:
經(jīng)過層層篩選,最后共有40支隊(duì)的83位參賽者進(jìn)入 AI Challenger 2018 年度總決賽答辯。12月18-19日,經(jīng)過兩天總決賽答辯的激烈角逐,最終評(píng)選出冠亞季軍與優(yōu)秀獎(jiǎng)。
為什么細(xì)粒度用戶情感分析最受關(guān)注
本屆大賽共分為觀點(diǎn)型問題閱讀理解、英中文本機(jī)器翻譯等10個(gè)不同賽道,對(duì)應(yīng)的10個(gè)數(shù)據(jù)集均為行業(yè)最大、其中5個(gè)為行業(yè)首創(chuàng)。那么,最受關(guān)注、參賽人數(shù)最多的賽道為何是細(xì)粒度用戶評(píng)論情感分析?
眾所周知,作為人類智慧結(jié)晶,自然語(yǔ)言處理是人工智能領(lǐng)域最為困難的問題之一,而這其中又以人類的情感為最,但也正因如此激起了無(wú)數(shù)人挑戰(zhàn)高峰的探索精神。如何讓機(jī)器通過網(wǎng)上評(píng)論分析用戶情感?為此,本屆大賽的主辦方之一美團(tuán)點(diǎn)評(píng),提供了一個(gè)高質(zhì)量海量數(shù)據(jù)集(即用戶評(píng)論數(shù)據(jù)集),共包含6大類20個(gè)細(xì)粒度要素的情感傾向,助力參賽選手尋求更精準(zhǔn)的算法預(yù)測(cè)用戶情感。
這些數(shù)據(jù)集中的評(píng)價(jià)對(duì)象,按照粒度不同一般劃分為兩個(gè)層次:例如服務(wù)、位置、價(jià)格等為粗粒度評(píng)價(jià)對(duì)象;而服務(wù)人員態(tài)度、交通是否便利等則為細(xì)粒度情感對(duì)象。每一個(gè)細(xì)粒度又分為正向、中性、負(fù)向、未提及4種狀態(tài),參賽隊(duì)伍通過對(duì)海量數(shù)據(jù)不斷地重復(fù)訓(xùn)練、建模、打標(biāo)簽,最終找到最佳算法。盡管在參賽之前,國(guó)雙一直有在自然語(yǔ)言處理領(lǐng)域進(jìn)行相關(guān)研究,比如汽車、司法等垂直領(lǐng)域的經(jīng)驗(yàn)就走在行業(yè)前列,司法領(lǐng)域更是在“法研杯”中奪得冠軍,但如此次針對(duì)用戶五花八門的評(píng)論進(jìn)行研究還是第一次,很多事情都得從頭開始研究,畢竟人類的語(yǔ)言表達(dá)能力還有想象力實(shí)在充滿了無(wú)窮奧妙。不過,也正是因此才更加突顯了獲獎(jiǎng)隊(duì)伍的綜合素質(zhì)。在這次比賽中,國(guó)雙團(tuán)隊(duì)短短時(shí)間內(nèi)就完成了學(xué)習(xí)、消化、吸收、輸出、優(yōu)化并最終摘得大獎(jiǎng)的全過程,其驚人的學(xué)習(xí)能力以及創(chuàng)新精神令人側(cè)目。
國(guó)雙參賽團(tuán)隊(duì)的獲獎(jiǎng)感言
這是一支低調(diào)到“令人發(fā)指”的團(tuán)隊(duì)!獲獎(jiǎng)這件事兒壓根沒想過宣傳。不過,在之后的采訪中又漸漸被他們的認(rèn)真與執(zhí)著打動(dòng),這就是一群專注于技術(shù)的年輕人啊!
聽聽他們?cè)趺凑f(shuō):
首先獲獎(jiǎng)這件事,不到最后一刻誰(shuí)也無(wú)法得知結(jié)果,所以更不能對(duì)別人說(shuō)了。而且,因?yàn)榧尤氲帽容^晚,前面初審時(shí)我們的成績(jī)并不算太好,不太好意思說(shuō)出來(lái)。至于得知獲獎(jiǎng)之后,只顧著自己高興了,沒有想到宣傳這件事……
并且,比賽對(duì)我們來(lái)說(shuō)收獲最大的還是參與過程中自身的積累以及向?qū)κ謱W(xué)習(xí)的地方。在短短的時(shí)間內(nèi)圍繞一個(gè)主題迅速學(xué)習(xí)、操作再優(yōu)化,可以說(shuō)是最高效率的技術(shù)創(chuàng)新了。并且,這次參賽隊(duì)伍非常多,都是來(lái)自國(guó)內(nèi)外高等院校、科研院所、企業(yè)的專業(yè)人才,是一個(gè)非常好的了解行業(yè)水平的地方,我們也學(xué)到了很多知識(shí),包括其他隊(duì)伍的一些建模思路等,這些就是最大的收獲。
走到總決賽時(shí)其實(shí)大家的差距都不是很大。我相信不僅是我們,所有的參賽隊(duì)伍技術(shù)上都沒有做到極致,只要還有時(shí)間,我們的技術(shù)就還有繼續(xù)優(yōu)化的地方。因此,我們也清楚地知道,總決賽并不是結(jié)束,只是一個(gè)開始。賽后我們的工作反而更多,需要花時(shí)間沉淀、吸收,繼續(xù)優(yōu)化,并擴(kuò)展到應(yīng)用場(chǎng)景,說(shuō)到底這只是一次比賽,未來(lái)的旅途還長(zhǎng)!
還有什么好說(shuō)呢?為他們鼓掌吧!期待這群年輕人走得越來(lái)越遠(yuǎn),國(guó)雙發(fā)展得越來(lái)越好!