近日,昆侖芯科技應(yīng)邀出席百度技術(shù)沙龍第99期“智能芯片”專場:昆侖芯一周年——構(gòu)筑國產(chǎn)數(shù)智基石,AI算力賦能千行百業(yè)。四位專家首次同臺,揭秘十年磨一劍的中國芯的神秘技術(shù)面紗,并系統(tǒng)介紹昆侖芯兩代產(chǎn)品賦能千行百業(yè)的最新成果及應(yīng)用實踐。
本篇以下內(nèi)容整理于沙龍第四位演講嘉賓——昆侖芯科技研發(fā)總監(jiān)羅航題為 “AI芯片產(chǎn)業(yè)發(fā)展和昆侖芯應(yīng)用實踐”直播分享。
昆侖芯科技研發(fā)總監(jiān)羅航
我是昆侖芯科技研發(fā)總監(jiān)羅航,今天分享AI芯片產(chǎn)業(yè)發(fā)展和昆侖芯應(yīng)用實踐,主要圍繞以下四個問題:
1. AI芯片為什么是產(chǎn)業(yè)發(fā)展的必然趨勢?
2. 聚焦到國內(nèi)的AI芯片產(chǎn)業(yè),宏觀變量怎樣影響AI芯片產(chǎn)業(yè)的供給端和需求端?
3. 國內(nèi)的AI芯片公司要實現(xiàn)產(chǎn)業(yè)化需要跨越哪些門檻?
4. 昆侖芯在產(chǎn)業(yè)化道路上做了哪些探索和實踐?
AI芯片是產(chǎn)業(yè)發(fā)展的必然趨勢
整個計算產(chǎn)業(yè)的周期基本上可以粗略劃分為四個階段:
1. 互聯(lián)網(wǎng)上古時期。它是一個定制化的UNIX操作系統(tǒng),主要群體是科學(xué)家,它的互聯(lián)網(wǎng)形態(tài),是一個很小規(guī)模的局域網(wǎng)形態(tài)。
2. PC互聯(lián)網(wǎng)。這個時候才真正進入了普羅大眾,我們才能感受到計算產(chǎn)業(yè)的魅力。它和上古形態(tài)有很大區(qū)別,它形成了一個x86 Windows強生態(tài)組合,有很多應(yīng)用百花齊放。
3. 移動互聯(lián)網(wǎng)時代。這個產(chǎn)業(yè)形態(tài)的組織形式是基于3G、4G乃至5G的移動互聯(lián)網(wǎng),相比上一個階段,它的網(wǎng)絡(luò)規(guī)模和通訊速度有一個質(zhì)的飛躍,并且產(chǎn)業(yè)形態(tài)有一個很重要的變化,可以看到這張圖中間出了一條線,這條線代表分化。它分化成了左邊移動端的架構(gòu)和右邊中心端或叫云端的架構(gòu)。為什么會有這樣分化?因為在移動互聯(lián)網(wǎng)時代,原先x86和Windows的組合沒法滿足移動端低功耗的場景,所以分化催生出了ARM加Android和IOS的生態(tài),形成了移動端和云端并存的形態(tài)。
4. AI時代。可以看到它的分化更復(fù)雜了。為什么會出現(xiàn)這樣的分化?因為AI的蓬勃發(fā)展,導(dǎo)致數(shù)據(jù)量爆炸以及計算需求的爆發(fā)式增長,傳統(tǒng)CPU通用計算提供的算力,已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足AI時代的計算需求,所以催生出了多種計算架構(gòu),不同的計算架構(gòu)處理各自擅長的數(shù)據(jù)需求,AI芯片應(yīng)運而生。多種計算架構(gòu)的有機整合就叫異構(gòu)計算。未來很有可能還會沿著這種分化趨勢繼續(xù)演變。
從這里可以看到,計算產(chǎn)業(yè)體系結(jié)構(gòu)的演化很像生物的演化,都是從簡單到復(fù)雜,比如生物演化是從單細(xì)胞到分化出各種器官,從而組成復(fù)雜精密的人體。我們借用“十九大”對社會主要矛盾的表述:人民群眾對計算的需求,與計算系統(tǒng)的算力發(fā)展不平衡之間的矛盾,驅(qū)動著整個產(chǎn)業(yè)的迭代和發(fā)展。
每一次的迭代、分化,都會涌現(xiàn)出巨大的產(chǎn)業(yè)機會。
這張圖表達的是一個客觀事實:AI模型的規(guī)模呈指數(shù)型爆發(fā)式增長。模型在某種意義上等同于數(shù)據(jù),模型越來越大代表數(shù)據(jù)量越來越大。模型簡單來講就是經(jīng)驗,相對于人是經(jīng)驗,相對于機器就是模型。圖中有前段時間非常火的GPT3,這個模型的參數(shù)量達到了1750億個,后來Google又發(fā)布了一個1.6萬億的超大模型。國內(nèi)有很多機構(gòu)也推出了大模型,百度前段時間就發(fā)布了文心大模型。
大模型是現(xiàn)在正在發(fā)生的事實,是很大的趨勢。模型越來越大,對算力的要求就越來越高。上面這張圖也從側(cè)面佐證了計算產(chǎn)業(yè)的發(fā)展和分化的趨勢。
可以看到,AI芯片跟CPU一樣,處于整個生態(tài)的基座位置,它提供了算力,跟CPU等各種架構(gòu)的芯片一起組成異構(gòu)計算。在這樣的AI生態(tài)基礎(chǔ)之上,我們才能實現(xiàn)各種垂直行業(yè)的智能化場景。
國內(nèi)AI芯片產(chǎn)業(yè)機遇與挑戰(zhàn)并存
在宏觀層面,目前有兩大變量。一個是疫情,一個是國際形勢。疫情極大加速了數(shù)字化和智能化的產(chǎn)業(yè)趨勢,把原本十年才能完成的產(chǎn)業(yè)轉(zhuǎn)變壓縮到五年。
我重點講一講國際形勢可能會造成的影響。國內(nèi)很早就開始造芯片,包括CPU芯片,但為什么好像沒形成氣候?實際上國內(nèi)缺的不是人才、資金、技術(shù),缺的其實是市場生態(tài)——比造不出來芯片更麻煩的是賣不出去。原先國際形勢沒有那么激烈沖突時,國外的芯片是敞開賣的,這導(dǎo)致國內(nèi)的芯片需求是鎖死的狀態(tài)。現(xiàn)在國際形勢為國產(chǎn)芯片打開了一扇窗,相當(dāng)于需求側(cè)解鎖了,由此帶來國內(nèi)供給側(cè)的蓬勃發(fā)展。AI芯片相對于CPU又是一個新的需求賽道。現(xiàn)在國內(nèi)也有很多企業(yè)都聚焦到AI芯片賽道做產(chǎn)業(yè)的升級迭代。
宏觀趨勢的影響為國內(nèi)AI芯片產(chǎn)業(yè)帶來了機遇,同時也帶來了挑戰(zhàn)。
• 從機遇方面來說,這是一個新的市場、新的賽道:
需求側(cè):相對于傳統(tǒng)CPU來講,AI芯片是比較年輕的產(chǎn)業(yè)。目前國家提倡新基建、智能化等各種政策扶持整個國內(nèi)市場,同時全球的生態(tài)格局還沒固化,這就為國內(nèi)AI芯片創(chuàng)業(yè)者提供了需求側(cè)的機遇。
供給側(cè):現(xiàn)在摩爾定律最新的工藝開始研究2nm,如果工藝越來越先進,尺度越來越小,會面臨一個量子隧穿的效應(yīng)。這不僅是工藝的問題,還可能涉及到物理學(xué)、材料學(xué)等方面,需要依賴基礎(chǔ)科學(xué)的突破。也就是說,摩爾定律很有可能已經(jīng)逼近極限。這意味著領(lǐng)先者快撞到墻了,國內(nèi)的追趕者縮小代差就只是一個時間問題。現(xiàn)在無論是芯片的設(shè)計還是制造研發(fā),都已經(jīng)有全鏈路和28nm的工藝儲備,所以中國具有資本、技術(shù)和人才的后發(fā)優(yōu)勢。
• 與此同時,我們也面臨很大的挑戰(zhàn):
需求側(cè):國內(nèi)AI芯片或者AI產(chǎn)業(yè)還處于發(fā)展的早期階段,非常不成熟,特別是商業(yè)化很不成熟,需求也還沒爆發(fā)。大家都在尋求AI芯片與自身產(chǎn)業(yè)的結(jié)合,即如何用AI升級自己的產(chǎn)業(yè),這是產(chǎn)業(yè)早期的一個特征。
供給側(cè):我們跟國際代際差距非常大。不僅表現(xiàn)在硬件上的差距,也表現(xiàn)在軟件和生態(tài)上的差距。特別是從設(shè)計、制造到封測等這一條產(chǎn)業(yè)鏈上,比如EDA工具、光刻機等,我們與國外都存在巨大的代際差距。
綜上可以看到,國內(nèi)的AI芯片產(chǎn)業(yè),機遇和挑戰(zhàn)并存。
國內(nèi)AI芯片產(chǎn)業(yè)要跨過三道窄門
1. 首先是量產(chǎn)。做芯片要有米下鍋,AI芯片就是我們的米。如果要讓AI芯片產(chǎn)業(yè)持續(xù)發(fā)展,形成商業(yè)的正循環(huán),量產(chǎn)是前提。大家都知道,量產(chǎn)可以極大攤薄先期流片的巨大投入,通過量產(chǎn)攤薄成本是實現(xiàn)盈利的唯一方式,量產(chǎn)也是衡量芯片成熟度的指標(biāo)之一。
2. 軟件生態(tài)。其實這是整個行業(yè)正在面臨的問題,或者說是我們需要跨過的窄門。如果我們只有芯片而沒有軟件生態(tài),客戶不太好把它用起來,也就沒法完成價值的傳遞。為了讓客戶更好地把它用起來,我們構(gòu)建一個合理、合適的軟件生態(tài),是非常有必要的。國際上的友商構(gòu)建了一個非常強大的軟件生態(tài),通過這個軟件生態(tài),很多開發(fā)者和廠商能夠很好地用起來,這個軟件平臺也構(gòu)筑了很強大的壁壘。作為國內(nèi)的產(chǎn)業(yè)玩家來說,軟件生態(tài)的構(gòu)建也是非常重要的。
3. 落地,做產(chǎn)品化。如果只有軟件生態(tài)還遠(yuǎn)遠(yuǎn)不夠,還需要跟具體的垂直行業(yè)做產(chǎn)品化。芯片是無法獨立存在的,必須要和垂直行業(yè)結(jié)合起來才能實現(xiàn)價值傳遞。這也是現(xiàn)在產(chǎn)業(yè)面臨的問題,因為沒有產(chǎn)品化,所以我們不得不做項目。不知道大家是否理解這個表述,做項目和做產(chǎn)品的區(qū)別是什么?做項目是case by case,做產(chǎn)品相對通用化,邊際成本遞減,這是芯片商業(yè)模式成功的關(guān)鍵因素。成熟的產(chǎn)品有量產(chǎn)規(guī)模,用強大的生態(tài)構(gòu)建產(chǎn)品化,做成商業(yè)閉環(huán),才能形成商業(yè)飛輪。
AI芯片的產(chǎn)業(yè)化機會
可能有人會問:產(chǎn)業(yè)化機會到底在哪?怎樣去做產(chǎn)業(yè)化,在哪里可以找到產(chǎn)業(yè)化的場景?
首先,AI芯片一定要跟各種產(chǎn)業(yè)結(jié)合。接下來我會站在更廣義的AI的概念討論,而不僅是AI芯片。因為有AI的地方,就需要AI芯片提供算力支持。
在這里給大家提供一個分析框架和思路。我們現(xiàn)在所說的人工智能,假如對照本來就有智慧的人來說,AI應(yīng)該具有哪些特征和要素?借用佛家的說法,人具有六根,眼、耳、鼻、舌、身、意,這是生而為人的基礎(chǔ)。那么,AI產(chǎn)業(yè)化的六根是什么呢?
• 眼,計算機視覺,賦予AI“看”的能力。這是目前AI應(yīng)用最廣泛的領(lǐng)域。比如安防監(jiān)控、園區(qū)監(jiān)控。如果我們把全球的AI看作一個整體,所有采集光信號的設(shè)備,無論是路邊攝像頭、手機攝像頭,還是光傳感器,都可以看作是全球AI的“眼”。
• 耳,語音處理,賦予AI“聽”“說”的能力。比如語音識別、語音合成等場景,所有采集和處理音頻信號的設(shè)備,都可以看作是AI的“耳”。
• 意,NLP的自然語言處理,賦予AI讀寫和理解的能力。這一應(yīng)用領(lǐng)域非常廣泛,包括文章理解、知識圖譜、知識提取、知識檢索等。
除了這三個領(lǐng)域外,我們完全想象不到“鼻、舌、身”是什么樣的場景。目前AI完全無法具備嗅覺,也無法具備味覺、觸覺,也就是說現(xiàn)在還沒有能夠采集這些信號的傳感器、設(shè)備,或者說這些場景還沒被挖掘出來。所以,相比于人,AI還差得很遠(yuǎn)。就僅僅拿計算機視覺這個AI最成熟的領(lǐng)域來說,相比人眼的識別效率來說也相距甚遠(yuǎn)。
反過來看,有差距的地方或者空白的地方,不正是產(chǎn)業(yè)化的機會所在嗎?我們把“六根”整合起來看,一個完整的AI體系,既要實現(xiàn)所有現(xiàn)實信號——眼、耳、鼻、舌、身、意,即全時空信號的捕捉體系,也就是數(shù)據(jù)生產(chǎn);又要有信號處理體系,比如數(shù)據(jù)消費,所以AI與IoT的結(jié)合一定是未來產(chǎn)業(yè)化的大方向。
AIoT,就是萬物數(shù)據(jù)——萬物在現(xiàn)實中捕捉到的萬物的數(shù)據(jù),再加上超強的算力支撐的數(shù)據(jù)處理能力,一起組成的一個整體。IoT和AI這兩者都處于快速變化的發(fā)展階段,所以這兩者的結(jié)合機會是非常多的。物聯(lián)網(wǎng)負(fù)責(zé)海量的數(shù)據(jù)生產(chǎn)和消費,AI芯片負(fù)責(zé)數(shù)據(jù)的處理和再造,兩者是相輔相成,或者說螺旋迭代、缺一不可。
昆侖芯的探索與實踐
接下來講一講昆侖芯的實踐和應(yīng)用案例。
昆侖芯有非常成熟和完善的全棧國產(chǎn)化的技術(shù)生態(tài)。從底層往上看,所有你知道的國產(chǎn)CPU和國產(chǎn)操作系統(tǒng),我們都做了適配,而且適配得非常完善。再往上還有國產(chǎn)的深度學(xué)習(xí)框架,代表就是PaddlePaddle(百度飛槳),我們也做了適配。同時,我們還提供了昆侖芯的推理框架,以及之上的國產(chǎn)算法。我們可以基于這樣的生態(tài)去做很多國產(chǎn)化的行業(yè)落地。
在智慧政務(wù)、智算中心、智慧金融、智慧電力這些方面,我們都有很多探索和落地:
1. 智慧質(zhì)檢。我們已經(jīng)跟國內(nèi)某質(zhì)檢廠商深度合作,打造解決方案并落地,也上了《新聞聯(lián)播》的報道。
2. 智算中心。這是非常典型的應(yīng)用場景,現(xiàn)在國內(nèi)智算中心的建設(shè)也如火如荼。昆侖芯可以為當(dāng)?shù)靥峁┓€(wěn)定的算力支撐和算法服務(wù),助力當(dāng)?shù)氐漠a(chǎn)業(yè)升級。
3. 大規(guī)模知識檢索。簡單理解就是搜索,其實百度搜索引擎后面算力的支撐,很大一部分都?xì)w功于昆侖芯。我們在百度的搜索集群大規(guī)模上線過萬片,穩(wěn)定運行了很長時間。
這三個典型案例,是我們助力新基建案例探索很小的一部分。
接下來結(jié)合“六根”這個分析框架展開講講。比如這個案例就是“眼”與昆侖芯的一個結(jié)合,在高速的流水線上自動化作業(yè)。這個生產(chǎn)節(jié)拍是很快的,一個節(jié)拍可能一秒,甚至不到一秒,如果人眼去判斷產(chǎn)品是否有缺陷不僅非常費眼,也非常費人力。經(jīng)過昆侖芯算力的賦能,再加上AI的“眼”,即工業(yè)相機/光源陣列去拍攝產(chǎn)品圖片,通過計算機視覺來識別產(chǎn)品是否有缺陷,極大提高了工業(yè)高速公路流水線的自動化和作業(yè)效率。
這也是“眼”加昆侖芯的一個案例,是我們落地到某個智慧城市云邊一體的案例。攝像頭作為“眼”,看到了很多視頻流進來之后,在邊緣側(cè)有搭載昆侖芯2代產(chǎn)品R200的分布式邊緣設(shè)備。在這個設(shè)備上可以完成解碼并同時進行AI檢測,完成整個全鏈路。比如說可以做邊緣側(cè)的一些粗略識別,提取視覺的一些特征,也可以把大圖切成小圖,然后跟中心側(cè)的集群配合起來,中心側(cè)的集群是以昆侖芯算力構(gòu)成的極大規(guī)模的集群基座。邊緣側(cè)把經(jīng)過的信息進行初步處理之后,跟中心側(cè)配合起來,就可以實現(xiàn)云邊一體的AI落地案例。中心側(cè)集群還可以比較方便的關(guān)聯(lián)人臉的數(shù)據(jù)庫和布控數(shù)據(jù),這就形成了一個比較典型的安防系統(tǒng)架構(gòu)。
這是“意”加昆侖芯的一個落地場景,是在某省高檢的一個落地項目。它實現(xiàn)了檢察院業(yè)務(wù)的全流程和全數(shù)字化。檢察院有很多文檔,不管是PDF、Word,有很多文檔,如果由檢察官人工分析文檔的話,會很費時、費力,而且很難形成可復(fù)用可傳播的知識體系。如果通過計算機把文檔讀取進來,給它做OCR文字識別,再做文檔特征和知識提取,塞入到知識圖譜中構(gòu)建知識網(wǎng)絡(luò),再部署一套私有化的檢索系統(tǒng),就能很好地實現(xiàn)文檔的數(shù)字化和智能化。這其中所有的業(yè)務(wù)流程全都是基于一個AI智能開發(fā)管理平臺搭建的。管理平臺里面也搭載了昆侖芯的算力集群,集群里還內(nèi)置了一些面向開發(fā)者的技術(shù)棧、深度學(xué)習(xí)框架、深度學(xué)習(xí)模型庫等,可以讓第三方開發(fā)者或客戶自行在平臺上做特定模型的重新訓(xùn)練,以及生產(chǎn)環(huán)境的自動化部署。
再講一個“意”加昆侖芯的案例。這是大規(guī)模知識檢索的在線服務(wù),類似于百度的在線檢索系統(tǒng)。可以看到,用戶在搜索框中輸入關(guān)鍵字或很多關(guān)鍵字的組合,發(fā)起請求之后,有一個在線的推理集群去分析用戶的搜索意圖,再結(jié)合用戶畫像去分析用戶想問什么,然后做一些embedding,從離線訓(xùn)練的集群中找出了很多物料,從這里面找出一個跟用戶意圖最匹配的物料排序,最后在精排之后返回給用戶最佳的檢索結(jié)果。可以看到,在線集群和離線集群都有昆侖芯的應(yīng)用案例。
上面介紹到了很多真實的落地案例,接下來我介紹的是一種商業(yè)模式,這是目前昆侖芯已經(jīng)在運作的一種商業(yè)模式,我們叫做技術(shù)賦能模式。
昆侖芯可以為賦能伙伴提供以下支持。比如說如果你買了昆侖芯的產(chǎn)品后,就可以得到貼心的技術(shù)支持,或者如果你想要做自己的板卡產(chǎn)品,我們也可以賣芯片給你,你可以封裝成自己的板卡。如果你對在昆侖芯上開發(fā)不是很熟,我們還可以手把手教你編程,教你在昆侖芯上怎么去開發(fā)算子和模型。我們也會提供培訓(xùn)課程,還會提供很豐富的demo給你參考。如果你基于昆侖芯的產(chǎn)品要做項目交付,昆侖芯也可以支持你做定制化模型和定制化服務(wù)器的適配。總之,通過技術(shù)賦能,賦能伙伴可以基于昆侖芯去開發(fā)自己的硬件和軟件方案,去觸達更多的場景和客戶,做更多的AI芯片產(chǎn)業(yè)化、智能化升級改造的項目。
我們希望有更多的產(chǎn)業(yè)伙伴能跟昆侖芯一起,為國家的智能化產(chǎn)業(yè)升級做更多的貢獻,一起共創(chuàng)智能化產(chǎn)業(yè)的新時代。