原標(biāo)題:親愛(ài)的,你連閱讀理解都做不過(guò)AI了
提起閱讀理解這四個(gè)字,你會(huì)想到什么?
被四六級(jí)、雅思、托福支配的恐懼?英語(yǔ)試卷上連原作者都搞不懂的選擇題?
不管哪種答案,肯定都逃不出一個(gè)規(guī)律:進(jìn)行閱讀理解這項(xiàng)“有益身心運(yùn)動(dòng)”的主體,必然是跟你我一樣的人類。
畢竟嘛,這東西需要閱讀一大段文字,然后理解了意義之后再做題目,堪稱一場(chǎng)英語(yǔ)考試中最復(fù)雜最費(fèi)腦筋,也最考驗(yàn)綜合能力的一個(gè)環(huán)節(jié)。所以你的英語(yǔ)老師一定說(shuō)過(guò)這樣一句話:得閱讀理解者得天下。
但是,我如果告訴你今天得這個(gè)天下的,已經(jīng)不再是人類而是AI了,你會(huì)怎么想?也許此前我們想象過(guò)AI可以完成單詞聽(tīng)寫、句子翻譯甚至寫作,但可能很多人可能都沒(méi)有想到,AI做閱讀理解現(xiàn)在也能甩人類幾條街。
可事實(shí)就是這樣,1月11日,斯坦福大學(xué)著名的機(jī)器閱讀理解賽事SQuAD刷新了全球排名,阿里巴巴憑借82.440的精準(zhǔn)率打破了世界紀(jì)錄,超越了人類82.304的平均得分。
當(dāng)然了,AI是不會(huì)去跟你比托福刷分的,這件事的背后,腦洞有點(diǎn)大哦......
什么是機(jī)器閱讀理解?
機(jī)器閱讀理解,雖然看起來(lái)只是讓AI上陣來(lái)一場(chǎng)考試。但是卻是自然語(yǔ)言處理技術(shù)中,繼語(yǔ)音判斷、語(yǔ)義理解之后最大的挑戰(zhàn):讓智能體理解全文語(yǔ)境。
而斯坦福大學(xué)發(fā)起的SQuAD挑戰(zhàn)賽,則是業(yè)內(nèi)公認(rèn)的機(jī)器閱讀理解最高水平賽事。
SQuAD挑戰(zhàn)賽的基本規(guī)則,是通過(guò)眾包的方式構(gòu)建一個(gè)包含10萬(wàn)個(gè)問(wèn)題左右的大規(guī)模數(shù)據(jù)集,并給出來(lái)源于維基百科長(zhǎng)度大約在幾百個(gè)單詞左右的文章。參賽者提交的AI模型在閱讀完數(shù)據(jù)集中的一篇短文之后,回答若干個(gè)基于文章內(nèi)容的問(wèn)題,答案與標(biāo)準(zhǔn)答案進(jìn)行比對(duì),最終得出成績(jī)。
由于閱讀理解這項(xiàng)“智能”調(diào)整,需要運(yùn)用到大量邏輯、細(xì)節(jié)和結(jié)構(gòu)分析能力,并且直接作用于現(xiàn)實(shí)中的文本資料,所以實(shí)際價(jià)值很大。
比如說(shuō),我們首先要面對(duì)的問(wèn)題就是,假如AI已經(jīng)比人類平均水平更擅長(zhǎng)于對(duì)文本中的精準(zhǔn)信息進(jìn)行理解和回答,會(huì)帶給我們什么呢?
當(dāng)AI的“閱讀理解”得分超越人類,意味著什么
舉個(gè)例子或許可以很簡(jiǎn)單地理解這個(gè)問(wèn)題:英語(yǔ)考試上,當(dāng)AI可以翻譯單詞的時(shí)候,我們一點(diǎn)都不驚奇;但AI可以聽(tīng)寫整句話的時(shí)候,我們會(huì)感嘆技術(shù)進(jìn)步了;當(dāng)AI自己做閱讀理解的時(shí)候,我們大概會(huì)想,還要我考這個(gè)試干什么?
這里面的差別,在于處理閱讀理解相關(guān)問(wèn)題時(shí),AI不只是要運(yùn)算和記錄,而是要主動(dòng)去分析和理解。所以閱讀理解問(wèn)題一直被人當(dāng)成是NLP的標(biāo)志性臨界點(diǎn)。但這個(gè)點(diǎn)被AI破解,直接意味著原本很多必須由人類才能完成的工作,已經(jīng)能夠被AI接管。
因?yàn)殚喿x理解問(wèn)題,不只是要處理語(yǔ)音和簡(jiǎn)單的語(yǔ)義,而是要理解和關(guān)注詞匯、語(yǔ)句、篇章結(jié)構(gòu)、思維邏輯、輔助語(yǔ)句和關(guān)鍵句等等元素構(gòu)成的復(fù)雜組織網(wǎng)絡(luò)。
機(jī)器閱讀理解“達(dá)標(biāo)”,最直接的產(chǎn)業(yè)影響是大多數(shù)今天還必須由人工完成的規(guī)則、對(duì)話、服務(wù)信息類的相關(guān)工作,都可以被AI所取代。比如說(shuō)客服、信息管理和推薦類的工作,都可以考慮用不眠不休、高運(yùn)算速度的機(jī)器來(lái)取代。
機(jī)器閱讀理解如何工作
或許我們都注意到了這樣一個(gè)問(wèn)題:今天的互聯(lián)網(wǎng)世界,文本內(nèi)容在變得越來(lái)越多,各種各樣的信息爆炸而來(lái)。太多你知道的、你不知道的、你以為自己知道的卻實(shí)際不知道的事情呼嘯而過(guò)。甚至你雙11想要剁個(gè)手,都有各種各樣的游戲規(guī)則等著你。自己讀吧,太累太痛苦還沒(méi)時(shí)間,問(wèn)客服吧,很可能出錯(cuò)還很慢,簡(jiǎn)直是薛定諤式問(wèn)題。
這里或許就可以用AI閱讀理解來(lái)解決了。比如客戶對(duì)某個(gè)電商促銷規(guī)則有疑問(wèn),就可以直接向AI提問(wèn),而AI就可以把這個(gè)問(wèn)題當(dāng)做閱讀理解來(lái)進(jìn)行解決方案回饋。
AI的閱讀理解能力,將在如何向客戶提供非模板式的智能客服服務(wù)中發(fā)揮作用。而當(dāng)AI在這些能力上超越人工,那么AI客服的利用價(jià)值將可能快速提升。換句話說(shuō),AI客服終于可以不那么機(jī)械化了。
由此不難看出,這種關(guān)鍵能力的突破,對(duì)大量強(qiáng)調(diào)與普通消費(fèi)者交互的產(chǎn)業(yè)線益處最多。
推而廣之,AI閱讀能力也是文娛領(lǐng)域進(jìn)行內(nèi)容尋找和推薦的有效方式,比如閱讀用戶提出的復(fù)雜需求,進(jìn)行精準(zhǔn)推薦;與IoT產(chǎn)品相結(jié)合,給出對(duì)用戶大段語(yǔ)言的回饋,乃至對(duì)話互動(dòng),都必須以機(jī)器理解能力為依托。
理解力,讓我們?cè)谖磥?lái)面前不僅是個(gè)孩子
除了知道AI可以充當(dāng)更好的客服之外,究竟我們?yōu)槭裁磻?yīng)該關(guān)注AI閱讀理解這件事?或許關(guān)鍵,是我們應(yīng)該知道“理解力”在目前AI世界中的重要程度和期待指數(shù)。
AI作為一種從計(jì)算機(jī)科學(xué)下的分支,一個(gè)智能體先天具備的是運(yùn)算能力,而希望進(jìn)行仿人類智慧的智能模擬,第二步就是模仿人類的感知。今天我們看到的機(jī)器視覺(jué)、語(yǔ)音識(shí)別、語(yǔ)義理解,都是在做這件事。而第三步,就是讓AI產(chǎn)生理解力。
顯然,識(shí)別有著龐大應(yīng)用場(chǎng)景,并會(huì)在接下來(lái)很長(zhǎng)一段時(shí)間內(nèi)占據(jù)主流。但是AI的理解能力是大多數(shù)識(shí)別能力的進(jìn)化,假如單純識(shí)別出卻無(wú)法產(chǎn)生輸出,那么AI無(wú)非只是更靈活的傳感器而已。
從這個(gè)邏輯上看,閱讀理解對(duì)于AI來(lái)說(shuō)絕不僅僅是個(gè)測(cè)試,或者商業(yè)應(yīng)用的技術(shù)加持,更重要的是開(kāi)啟AI紀(jì)元里理解力的加速器。
更廣闊的意義在于,當(dāng)我們不再考慮AI是否能理解人類文本和語(yǔ)言,那么DeepNLP將可能達(dá)成,人機(jī)交互的范圍將級(jí)擴(kuò)大。AI可以開(kāi)始捕捉人類的邏輯和函指。
可能那還很遠(yuǎn),也可能很近,但機(jī)器理解力讓我們?cè)谖磥?lái)面前不再是個(gè)孩子,這應(yīng)該是毫無(wú)疑問(wèn)的。