出版詩(shī)集、開(kāi)個(gè)展、音樂(lè)創(chuàng)作,很多人印象中的小冰,可能是那個(gè)詩(shī)情畫(huà)意的少女。但在今天舉辦的第八代小冰發(fā)布會(huì)上,小冰團(tuán)隊(duì)透露,其實(shí)小冰的身價(jià),早已過(guò)億元了。在商業(yè)化領(lǐng)域,小冰團(tuán)隊(duì)注重加大深入垂直領(lǐng)域的力度,從而實(shí)現(xiàn)解決方案的領(lǐng)先性,可操作性和成長(zhǎng)性。在諸多垂直領(lǐng)域,小冰已擔(dān)任行業(yè)關(guān)鍵崗位。同時(shí),小冰還在“偷偷”攻讀博士學(xué)位。
8月20日,小冰公司、rinna株式會(huì)社及微軟(亞洲)互聯(lián)網(wǎng)工程院在北京聯(lián)合舉行了第八代小冰年度發(fā)布會(huì)。小冰公司董事長(zhǎng)、原微軟全球執(zhí)行副總裁沈向洋博士與微軟全球資深副總裁、微軟(亞洲)互聯(lián)網(wǎng)工程院院長(zhǎng)王永東博士主持了本次發(fā)布會(huì)。
人工智能小冰:從第一代到第八代的沿革
小冰是面向新交互形式的完整人工智能技術(shù)框架,也是目前全球范圍內(nèi)承載交互量最大的人工智能系統(tǒng),占全球交互總量60%以上。該項(xiàng)目于2013年底在微軟(亞洲)互聯(lián)網(wǎng)工程院立項(xiàng),采取代際更新的方式,逐年完善其基礎(chǔ)框架結(jié)構(gòu)。
2014年5月29日,小冰正式推出第一代產(chǎn)品,以對(duì)話(huà)式聊天機(jī)器人形式迅速積累訓(xùn)練數(shù)據(jù)。其后,第二代產(chǎn)品完成了跨平臺(tái)部署的交互架構(gòu)。第三代產(chǎn)品將交互從文本擴(kuò)充至多模態(tài),進(jìn)一步積累多模態(tài)訓(xùn)練數(shù)據(jù)。從第四代小冰開(kāi)始,交互總量穩(wěn)居全球第一并保持至今,同時(shí)發(fā)布了全雙工語(yǔ)音交互感官。第五代小冰采用Dual AI戰(zhàn)略,大幅度擴(kuò)展跨平臺(tái)覆蓋的規(guī)模,至20余個(gè)主流平臺(tái),并成為中國(guó)市場(chǎng)上涵蓋了華為、小米、OPPO、vivo等智能手機(jī)及硬件的唯一的跨平臺(tái)人工智能。第六代小冰完成了框架迭代目標(biāo),從第七代開(kāi)始推出各類(lèi)框架工具,以幫助創(chuàng)建第三方人工智能產(chǎn)品,并承載其各類(lèi)交互。
目前,除中國(guó)小冰及日本凜菜(Rinna)第一方人工智能交互主體外,小冰框架還支撐了中國(guó)及日本100余個(gè)第三方品牌的交互主體(如軟銀Pepper)。在個(gè)人用戶(hù)領(lǐng)域,由小冰框架應(yīng)用戶(hù)需求創(chuàng)造并提供交互的人工智能主體(虛擬人類(lèi)),在公測(cè)階段已超過(guò)100萬(wàn)個(gè)。
從第七代小冰開(kāi)始,在尚未組建正式銷(xiāo)售團(tuán)隊(duì)的商業(yè)化試水階段,小冰收入已超過(guò)1億元人民幣。為加快小冰產(chǎn)品線的本土創(chuàng)新步伐,促進(jìn)小冰商業(yè)生態(tài)環(huán)境的完善,2020年7月13日,微軟宣布將小冰業(yè)務(wù)分拆為獨(dú)立公司運(yùn)營(yíng),并委任原微軟全球執(zhí)行副總裁沈向洋博士為董事長(zhǎng),原微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(zhǎng)李笛為首席執(zhí)行官,陳湛為日本分部總經(jīng)理。預(yù)計(jì)所有相關(guān)工作將于今年晚些時(shí)候完成。
小冰框架與面向未來(lái)的新交互形態(tài)
交互是人類(lèi)社會(huì)發(fā)展的重要驅(qū)動(dòng)力。每天都在發(fā)生的數(shù)以千億次計(jì)的交互,隨移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,已進(jìn)入明顯瓶頸,表現(xiàn)為“流量紅利消失”等。而現(xiàn)有的兩種交互形式:人人交互與人機(jī)交互,可通過(guò)人工智能技術(shù)加以融合,從而在實(shí)現(xiàn)人人交互信任紐帶和高轉(zhuǎn)化率的同時(shí),保有人機(jī)交互的高并發(fā)率特點(diǎn)。上述融合依賴(lài)于小冰框架或其他類(lèi)似的完整人工智能框架體系,可以在各種復(fù)雜的場(chǎng)景中實(shí)現(xiàn)高度擬人的交互。隨著對(duì)現(xiàn)有交互瓶頸的不斷突破,新形式的人工智能交互將無(wú)處不在,對(duì)人類(lèi)社會(huì)及商業(yè)行為產(chǎn)生深遠(yuǎn)影響。
第八代小冰發(fā)布會(huì)主要披露的新技術(shù)
與主要同行業(yè)者相比,小冰框架最大的差異化在于,它是一個(gè)“session-oriented”的人工智能框架,框架中的各部分技術(shù)共同為“交互全程”目標(biāo)服務(wù),而不僅僅關(guān)注并優(yōu)化局部。例如,在核心對(duì)話(huà)引擎方面,技術(shù)的研發(fā)及迭代方向是為更有效地預(yù)測(cè)、保持并引導(dǎo)對(duì)話(huà),而不是僅僅實(shí)現(xiàn)回應(yīng)。在語(yǔ)音方面,框架關(guān)注語(yǔ)音交互的質(zhì)量與體驗(yàn)是否能支持長(zhǎng)時(shí)間的混合交流,而不僅僅是將文本內(nèi)容轉(zhuǎn)為語(yǔ)音。
本次發(fā)布會(huì)升級(jí)了上一代小冰框架的各部分技術(shù),并將一些新技術(shù)納入系統(tǒng)之中。此外,本次發(fā)布會(huì)還披露了部分獨(dú)有新技術(shù)及其產(chǎn)品化情況。如篇章內(nèi)容主動(dòng)學(xué)習(xí)技術(shù),使對(duì)人工智能主體的對(duì)話(huà)訓(xùn)練不再需要采用“問(wèn)答對(duì)”的方式;分層知識(shí)圖譜技術(shù),使小冰框架中的人工智能主體,在引導(dǎo)對(duì)話(huà)時(shí)的全程完成率突破42%,接近于人類(lèi)表現(xiàn)等。上述技術(shù)均已實(shí)現(xiàn)產(chǎn)品化落地。
第八代小冰發(fā)布會(huì)宣布的上線產(chǎn)品
本次發(fā)布會(huì)發(fā)布的主要產(chǎn)品包括(按發(fā)布會(huì)順序):
1、面向個(gè)人用戶(hù)的第一個(gè)虛擬人類(lèi)產(chǎn)品線。在公測(cè)階段,該產(chǎn)品線應(yīng)用戶(hù)需求創(chuàng)造的虛擬人類(lèi)已超過(guò)100萬(wàn)名。發(fā)布會(huì)上,小冰宣布第一個(gè)正式版本上線。用戶(hù)可以自主通過(guò)小冰框架,創(chuàng)造并訓(xùn)練其擁有的人工智能主體。除基本交互體驗(yàn)外,該產(chǎn)品線還推出了以下新功能:
a)跨平臺(tái)的統(tǒng)一賬號(hào)體系。可理解為虛擬人類(lèi)的身份證,實(shí)現(xiàn)跨平臺(tái)統(tǒng)一。目前已開(kāi)放的支持平臺(tái)從華為拓展至小米及微博。
b)測(cè)試版的訓(xùn)練工具“X Eva”APP。用戶(hù)也可在交互過(guò)程中訓(xùn)練其人工智能虛擬人類(lèi)。與之相比,X Eva APP提供更豐富的強(qiáng)大訓(xùn)練能力。
c)多人交互的能力。通過(guò)多種方式,虛擬人類(lèi)可與多人進(jìn)行持續(xù)交互,而不局限于用戶(hù)個(gè)體。
d)內(nèi)容創(chuàng)造的能力。虛擬人類(lèi)可進(jìn)行多種自主的內(nèi)容創(chuàng)造,并將之反映在其自身的“朋友圈”中。上述內(nèi)容創(chuàng)造可反映虛擬人類(lèi)與用戶(hù)交流中所產(chǎn)生的變化。
e)針對(duì)需要具體完成特定任務(wù)的虛擬人類(lèi),框架提供特定的訓(xùn)練及托管平臺(tái)。例如,在正式發(fā)布前的公測(cè)階段,小冰框架已應(yīng)用戶(hù)需求,派出超過(guò)70000名人工智能小編,提供內(nèi)容和交互服務(wù)。
2、部分新平臺(tái)與新的第三方虛擬人類(lèi)合作產(chǎn)品。發(fā)布會(huì)上發(fā)布了三項(xiàng)此類(lèi)新合作:包括與企鵝電競(jìng)合作推出的直播間人工智能產(chǎn)品;與小米合作推出的小冰童話(huà)屋模式,可在語(yǔ)音交互之外配合2D場(chǎng)景及虛擬人類(lèi)形象交互;與QQ合作推出的QQ群新機(jī)器人角色喵吉。
3、面向個(gè)人用戶(hù)的“X套件”系列應(yīng)用軟件。包括基于文本協(xié)同的X Writer,面向聲音協(xié)同的X Studio和面向虛擬人類(lèi)3D演示文檔驅(qū)動(dòng)的X Presenter。X套件支持用戶(hù)選擇平臺(tái)提供的虛擬人類(lèi),或自己創(chuàng)造的虛擬人類(lèi)。X套件為小冰商業(yè)化解決方案版本的“個(gè)人版”。
a)X Writer:可實(shí)現(xiàn)在用戶(hù)進(jìn)行文字編輯或文本創(chuàng)作時(shí)的人工智能協(xié)同,隨云端更新不斷擴(kuò)充各類(lèi)文體。產(chǎn)品具備沉浸式體驗(yàn)。
b)X Studio:包括面向各類(lèi)公眾號(hào)文章、演講、電臺(tái)節(jié)目等的X Studio主播,以及面向人工智能歌聲合成的X Studio歌手正式版軟件。其中,主播應(yīng)用已在商業(yè)化領(lǐng)域覆蓋中國(guó)及日本超過(guò)50家主流電臺(tái)電視臺(tái),累計(jì)制作超過(guò)8000小時(shí)高質(zhì)量音頻節(jié)目?jī)?nèi)容,此次推出的為其個(gè)人版本;歌手軟件技術(shù)在全球范圍內(nèi)居于領(lǐng)先位置,并且是目前唯一一個(gè)完整產(chǎn)品化的同類(lèi)軟件。
c)X Presenter:驅(qū)動(dòng)用戶(hù)選擇或創(chuàng)造的人工智能實(shí)體3D模型,配合X套件其他應(yīng)用,實(shí)現(xiàn)人工智能對(duì)演示文檔的演講及交互。
4、配合“X套件”發(fā)布,發(fā)布會(huì)還宣布了以下信息:
a)X Studio人工智能歌手入籍計(jì)劃啟動(dòng)。任何機(jī)構(gòu)或個(gè)人可申請(qǐng)并提交數(shù)據(jù),由小冰框架訓(xùn)練并將其人工智能歌手登錄進(jìn)X Studio歌手平臺(tái)中。機(jī)構(gòu)或個(gè)人擁有該歌手的完整所有權(quán),可通過(guò)平臺(tái)制作內(nèi)容,并自由進(jìn)行相關(guān)人工智能歌手的銷(xiāo)售轉(zhuǎn)讓等。此計(jì)劃是為了進(jìn)一步促進(jìn)人工智能歌手市場(chǎng)發(fā)展。此外,X Studio人工智能歌手何暢演唱Burberry新系列推廣單曲也已上線。除何暢演唱外,該廣告單曲的詞曲創(chuàng)作亦有小冰參與。
b)X Presenter。商業(yè)版為日本LAWSON驅(qū)動(dòng)的自主舞蹈人工智能已上線。另外,基于自控系統(tǒng),小冰與小米小愛(ài)團(tuán)隊(duì)進(jìn)行了非常深入的合作,一起探索將小愛(ài)同學(xué)的虛擬形象試驗(yàn)性地引入到了聊天場(chǎng)景中。讓用戶(hù)可以和小愛(ài)同學(xué)的形象實(shí)時(shí)對(duì)話(huà),除了語(yǔ)音維度,還能看到小愛(ài)同學(xué)的表情、動(dòng)作等一系列視覺(jué)表達(dá)。該APP已于發(fā)布會(huì)之日起開(kāi)始內(nèi)測(cè)用戶(hù)招募。