1月23日、24日,由中國計算機學(xué)會(CCF)主辦,CCF七大優(yōu)秀專委會、教育部易班發(fā)展中心、長沙市科技局、長沙高新區(qū)管委會、湖南大學(xué)、數(shù)聯(lián)眾創(chuàng)共同承的2020 CCF大數(shù)據(jù)與計算智能大賽(簡稱CCF BDCI)決賽暨中國大數(shù)據(jù)技術(shù)大會在湖南長沙圓滿落幕。
中國大數(shù)據(jù)技術(shù)大會歷經(jīng)13年,已成為大數(shù)據(jù)領(lǐng)域極具影響力的行業(yè)盛會。本屆大會邀請到中國科學(xué)院院士、CCF理事長梅宏,中國工程院院士桂衛(wèi)華,中國科學(xué)院院士王懷民,中國工程院院士王耀南及多位學(xué)術(shù)專家、企業(yè)負責人等齊聚一堂,圍繞大數(shù)據(jù)產(chǎn)業(yè)前沿領(lǐng)域進行分享與交流。開幕式上,長沙市政府副市長邱繼興,中國科學(xué)院院士、CCF理事長梅宏和湖南大學(xué)校長段獻忠分別致辭,希冀通過此次活動搭建交流平臺,為技術(shù)創(chuàng)新、資源共享凝聚更多力量。中科院計算所副所長、CCF大數(shù)據(jù)專家委員會秘書長程學(xué)旗發(fā)表大賽影響力報告,探討了大賽呈現(xiàn)出大數(shù)據(jù)與AI交叉融合的趨勢。在以《大數(shù)據(jù)新十年-數(shù)字經(jīng)濟機遇與挑戰(zhàn)》為主題的院士論壇上,梅宏、王懷民、桂衛(wèi)華和王耀南四位院士分享了各自觀點。
(圖:《大數(shù)據(jù)新十年-數(shù)字經(jīng)濟機遇與挑戰(zhàn)》院士論壇)
現(xiàn)場,來自高校、企業(yè)等行業(yè)內(nèi)專家與負責人圍繞大數(shù)據(jù)與AI,從不同角度進行了精彩的分享。百度技術(shù)委員會主席吳華受邀參與,并作《知識與語言智能》主題演講。“自然語言處理是研究人和計算機之間有效溝通的理論和方法,要使計算機擁有人類的語言溝通以及超越人類的跨語言溝通能力。”吳華詳細介紹了百度自然語言處理方向的深耕與布局,并介紹了基于飛槳的NLP開源算法庫PaddleNLP。
(圖:百度技術(shù)委員會主席吳華進行演講)
吳華表示,目前自然語言的發(fā)展已經(jīng)歷了符號邏輯階段、淺層學(xué)習(xí)階段,現(xiàn)在正經(jīng)歷深度學(xué)習(xí)階段。在這樣的背景下,百度構(gòu)建了完整的語言與知識技術(shù)布局,基于產(chǎn)業(yè)級開源深度學(xué)習(xí)平臺飛槳,研發(fā)了語義表示、序列標注、文本分類等核心技術(shù),并對大眾開源開放。
自然語言處理實現(xiàn)基本常識和推理能力離不開知識圖譜。吳華介紹道,目前已經(jīng)構(gòu)建了十億級實體、千億級事實的多元異構(gòu)知識圖譜,以醫(yī)療圖譜為例,已落地應(yīng)用并輔助國內(nèi)130余家基層醫(yī)院的基層醫(yī)生有效降低了誤診率。此外,百度知識增強的語義理解框架文心(ERNIE)大幅提升機器理解語言的水平,并持續(xù)推出知識增強視覺-語言預(yù)訓(xùn)練模型ERNIE-VIL、多語言預(yù)訓(xùn)練模型ERNIE-M、結(jié)合語義與結(jié)構(gòu)信息的圖神經(jīng)網(wǎng)絡(luò)模型ERNIESage等多個模型,持續(xù)有效提升視覺推斷、多語言任務(wù)、文本推斷的效果。
有了文本的基礎(chǔ)知識,百度還提出了基于隱式知識和顯式知識的知識對話系統(tǒng):在隱式知識方面推出PLATO對話模型取得優(yōu)異效果,在顯式知識系統(tǒng)中開發(fā)了首個基于千萬級節(jié)點的對話式推薦系統(tǒng)。通過嵌入知識的模型,人機對話、機機對話得以更加流暢。
機器翻譯一直是自然語言處理領(lǐng)域的熱點之一。“百度不僅提出了基于語義單元的順句翻譯,使機器翻譯效果可以說媲美人類同傳,還構(gòu)建了目前最大的中英同傳語料庫進行開源。”吳華表示,為了促進同傳的發(fā)展,百度組織了國際同傳的Workshop和Tutorial,同時百度的同傳技術(shù)也在國內(nèi)國際上服務(wù)了如服貿(mào)會、全球人工智能博覽會等重要國際會議,都收到了良好反饋。
在不斷提升自身技術(shù)實力的同時,百度聯(lián)合中國計算機學(xué)會、中文信息學(xué)會共同發(fā)布的“千言”數(shù)據(jù)共建計劃也在持續(xù)進行著數(shù)據(jù)集與算力的共建共享。現(xiàn)場,吳華再次發(fā)起號召,希望更多開發(fā)者參與到千言數(shù)據(jù)共建計劃,與學(xué)界、產(chǎn)業(yè)界共同推進技術(shù)進步。
在以《長沙大數(shù)據(jù)與人工智能產(chǎn)業(yè)發(fā)展戰(zhàn)略與對策》為主題的圓桌訪談環(huán)節(jié)中,來自湖南大學(xué)的主持人李肯立與嘉賓們圍繞“長沙應(yīng)該怎樣發(fā)展大數(shù)據(jù)和人工智能產(chǎn)業(yè)”等問題進行了深度交流。嘉賓長沙市科技局總工程師盛湘饒首先介紹了長沙技術(shù)實力人才儲備強,但產(chǎn)業(yè)發(fā)展方面薄弱、缺少頭部企業(yè)的情況。對此,悉尼大學(xué)教授陶大程表示,長沙有機會通過政府、企業(yè)、高校三方合作促進可信人工智能在未來產(chǎn)業(yè)的落地。吳華認為湖南不缺人才,問題是能否抓住機會推進重點扶持創(chuàng)新創(chuàng)業(yè)的相關(guān)機制,長沙立足于自身優(yōu)點孵化高尖企業(yè)的機會是非常大的。
(圖:《長沙大數(shù)據(jù)與人工智能產(chǎn)業(yè)發(fā)展戰(zhàn)略與對策》圓桌訪談合照)
除此之外,在決賽與大會主論壇開幕的第二天,九場精心策劃的線上專題技術(shù)和行業(yè)主題分論壇也相繼舉辦。百度深度學(xué)習(xí)技術(shù)平臺高級總監(jiān)馬艷軍作為“人工智能分論壇”論壇主席,與中南大學(xué)計算機學(xué)院黨委委員、副院長奎曉燕,中國開源軟件群體協(xié)同研究中心主任尹剛,湖南湘江人工智能學(xué)院執(zhí)行院長謝斌,湖南師范大學(xué)信息科學(xué)與工程學(xué)院人工智能系副教授江沸菠,天津飛騰信息技術(shù)有限公司飛騰大學(xué)執(zhí)行校長任巨,以及北京東方國信科技股份有限公司深度學(xué)習(xí)算法總監(jiān)李晶,在會上分享了關(guān)于人工智能下產(chǎn)業(yè)創(chuàng)新與人才培養(yǎng)的經(jīng)驗與成果。馬艷軍表示,人工智能時代需要復(fù)合型人才,復(fù)合型人才需要了解掌握人工智能技術(shù),同時對業(yè)務(wù)、行業(yè)甚至是商業(yè)有很好的理解,這樣的人才能真正把人工智能帶到行業(yè),帶動整個國家實體經(jīng)濟的產(chǎn)業(yè)化升級。而飛槳也正持續(xù)為復(fù)合型人才的培養(yǎng)提供著全面支持。
(圖:百度深度學(xué)習(xí)技術(shù)平臺高級總監(jiān)馬艷軍)
大會舉辦的同時,2020 CCF大數(shù)據(jù)與計算智能大賽(簡稱CCF BDCI)也完成了總決賽的激烈角逐。本屆大賽吸引了全球3萬多支隊伍參賽,提交作品8萬余件,參賽人數(shù)與競賽成果質(zhì)量再創(chuàng)新高。決賽共有64支隊伍獲得賽道一二三等獎和CCF BDCI四個特別獎項。百度作為本次比賽的唯一戰(zhàn)略級合作伙伴,在算法賽道設(shè)置“千言:多技能對話”賽題,并在大賽首次設(shè)立的自主平臺賽道首發(fā)“遙感影像地塊分割”賽題,飛槳作為該賽題的指定深度學(xué)習(xí)平臺為選手提供技術(shù)支持。該賽題的冠軍——中國科學(xué)院大學(xué)“隨緣分割”團隊摘取大賽含金量極高的CCF BDCI綜合特等獎。
作為國內(nèi)首個開源開放、自主可控、功能完備的產(chǎn)業(yè)級深度學(xué)習(xí)平臺,百度飛槳目前凝聚了超過265萬開發(fā)者,創(chuàng)造了34萬個模型,服務(wù)10萬家企業(yè);作為技術(shù)底座,飛槳通過百度智能云持續(xù)將AI能力輸出到各行各業(yè)實際應(yīng)用場景中,在城市、工業(yè)、電力、通信等領(lǐng)域發(fā)揮了重要價值。
同時,作為國內(nèi)AI頭雁企業(yè),百度一直積極布局“人工智能+X”復(fù)合型人才培養(yǎng)生態(tài),以百度飛槳為核心,圍繞學(xué)習(xí)、就業(yè)、認證、實踐、比賽等環(huán)節(jié),將高校科研人才與企業(yè)應(yīng)用人才培養(yǎng)緊密結(jié)合,綜合素質(zhì)與實踐能力培養(yǎng)雙管齊下,洞悉產(chǎn)業(yè)需求的人才培養(yǎng)標準、構(gòu)建產(chǎn)教融合的人才培養(yǎng)體系。面向高校,百度飛槳通過AI Studio學(xué)習(xí)與實訓(xùn)社區(qū)提供教學(xué)資源、實訓(xùn)項目和算力等支持,并“以賽促學(xué)”,舉辦各類多項AI競賽。百度深度學(xué)習(xí)師資培訓(xùn)班已累計培訓(xùn)了1800多名AI專業(yè)教師,支持200余所高校開設(shè)AI學(xué)分課提升教學(xué)師資水平。面向企業(yè),百度推出AI快車道、AI私享會、黃埔學(xué)院等進階式培訓(xùn)渠道,讓前沿技術(shù)深入業(yè)務(wù)場景,為產(chǎn)業(yè)智能化賦能。截止目前,百度已經(jīng)培養(yǎng)AI人才超過100萬,未來5年百度還將培養(yǎng)500萬AI技術(shù)與產(chǎn)業(yè)人才,為中國智能經(jīng)濟和智能社會的發(fā)展提供AI人才保障。
未來,百度將持續(xù)技術(shù)創(chuàng)新,并將技術(shù)優(yōu)勢通過開源開放平臺與智能云賦能行業(yè)與個人,積極聯(lián)動政府、企業(yè)、高校等多方將“產(chǎn)學(xué)研用”有機結(jié)合,加快讓AI滲透到產(chǎn)業(yè)、社會以及生活中,提速智能經(jīng)濟發(fā)展。