【TechWeb】前言:芯片戰爭未曾停歇。飛速發展的自動駕駛為芯片廠商帶來了新的機會,IC設計商嘗試推出更適用于AI場景的芯片,晶圓與封測廠商圖加速換代生產線,以便趕上下一波AI時代的“潮流”。為了更直觀的理解AI芯片,我們需要“拆解”兩部iPhone。
一.揭開iPhone 4后蓋,卸下主板PCB,可以看到一塊拇指大小黑色塑料片。這是蘋果第一代自家產的SoC(片上系統),名為A4處理器,它被焊接在iPhone 4主板背部,曾與喬幫主一同站在2010發布會舞臺上。如今蘋果自產SoC升級到了A12X,除了運算能力的增長,其內核架構也隨著工業界芯片制造工藝進化而日趨精湛。
8年前的A4處理器撐起了iPhone的市場地位,這塊搭載ARM核心、內部脈沖震蕩可以飆升至1GHZ的芯片,僅一半的計算能力就可把上個世紀登月的阿波羅飛船甩在幾條街后,而大部分用戶只需用它打電話、收發郵件、偶爾玩一玩《憤怒的小鳥》。A系芯片演進到今天,蘋果推出搭載最新處理器A12x的iPad Pro,庫克試圖說服人們一款不足6毫米厚度的電子設備就可勝任生活工作的全部需求,從而不在需要攜帶厚重的筆記本,確實有他的道理。
A12X代表著消費電子處理器已到達前所未有的高度。這款A12X內置模擬人腦神經元的集成電路,可以在人眼不可察覺的瞬間完成神經引擎、圖像處理、數據處理的工作(FaceID),這在幾年前還是科幻電影的元素。
我們沒有辦法展示A12X的照片,但可以參照A11,視覺化蘋果移動端SoC集成度變化。
今天再來對比兩款芯片:兩張單薄晶體板下方隱藏著一道巨大的技術鴻溝,從硅晶打磨、光刻、再到封裝技術,背后是多年來理論學者與芯片工程師的嘗試,以及全球芯片巨頭間的角逐結果。如果不是制造工藝的進步、整個芯片的社會生產力不斷提升,誰也不會想到會有類似科幻元素的產品觸達我們的生活,影響到我們的感官體驗。
國內華為也有自己的SoC系統:麒麟980。為證明最新麒麟980的實力,華為號召了幾位大學生,設計出一套可以預裝在榮耀Magic2上便可操縱車輛的駕駛程序,佐證了麒麟980計算能力。
這是一次創新式的嘗試,但手機能夠處理的道路信息還是非常有限,為了提供安全可靠的自動駕駛體驗,我們需要更快、更靈活、更低功耗的的AI芯片。
二.在未來,無人駕駛汽車將集成諸多算法。
想象一下,用戶可以在手機App上“召喚”一輛附近空閑的無人車。無人車啟動“大腦”,開始獲得實時路況信息,這幾乎占用了目前無人車“大腦”的運算帶寬。每一秒鐘,攝像頭采集車附近360度視野圖像,實時地運行卷積神經網絡來區分行人與車輛。
與此同時,毫米波雷達收集到距離信息為車載決策層準確的判斷依據:是繼續直線行駛,還是轉向避讓?決策層需要在不到50毫秒的時間內反應,控制車輛動力及轉向控制器,下位機繼而將指令轉化成PWM脈沖信號,指揮毫無思考能力的方向電機和動力電機。
幾分鐘后,無人車戰勝了復雜的路況、穿過嘈雜街道,停靠在到精準的目標位置,等待乘客上車。隨后,通過車載語音交互模塊,無人車可獲知用戶的目的地。根據最新的高精度地圖信息,再結合車身上的全方位傳感器感知周遭情況,最終安全的抵達目的地。這一套流程,重復而單一,會使人類司機感到疲憊。
所以不難看出,AI芯片有三大要求:大吞吐,低延時,低能耗。對于廠商來講,只要能占據更大的無人駕駛市場,錢不是問題。
三.為實現這一目標,Nvidia在2016年推出K字頭運算GPU加速器,黃仁勛試圖討好馬斯克以便擠掉以色列公司Mobileye,但顯然后者不吃這一套,選擇表面合作暗地卻從AMD挖高管,打算自己搞AI芯片。只不過事實證明,最新的Model 3依然使用Nvidia的處理器,自研芯片之路還很長。
目前在業界中,有一種說法是AI芯片將沿「CPU-GPU-FPGA-ASIC」的路線演進。CPU曾在PC、服務器端時代統領江山,卻不及GPU的大吞吐特性而淪為輔助,Nvidia曾在Drive Xavier架構上投入30億美元,2018年CES上展示出了一款能夠以500瓦的能耗代價實現每秒320萬億次運算。500瓦的能耗水平非常低,滿載的車內空調大約在5千瓦時左右,占用傳統燃油車2匹馬力。
然而未來國內能源屬性趨勢來看,無人駕駛模塊將限制車輛的續航里程,500瓦的功耗還是太高。
中國一家名為深鑒科技創業公司在去年被國際FPGA巨頭賽靈思(xilinx)收購,深鑒科技的一篇論文曾在FPGA 2017大會上評為最佳,在論文中他們設計的模型可以在XCKU060(一款FPGA芯片)上運行更高精度的語音識別效果,而且擁有更低的功耗。矛盾在于FPGA屬于半定制化的工業產品,成本相對較高,XCKU060單片價格在4000美元左右。在相同計算力下,FPGA價格不占優勢。谷歌旗下的Waymo目前使用的KU115(一款來自賽靈思的FPGA芯片),單片價格在5400美元左右,雖然換掉了早年使用的英特爾Xeon系列服務器芯片,運算性能不斷提升,但整車價格也一路高歌猛進。
待算法、傳感器成熟,ASIC才有施展拳腳的機會。我們之前提到的Mobileye,其產品便是基于的ASIC架構加速器,和Nvidia走截然不同的系統級處理器路線,ASIC全稱為“專用集成電路”,其內置的異構模塊可以針對信號、圖像等處理算法進行特殊優化,但在設計流程上用到更長時間。
FPGA這個詞想必就更加陌生了。簡單來說,ASIC芯片是一個“KFC的漢堡包”,而FPGA更像“賽百味的三明治”,后者有更大的“重新設計”空間,可以根據用戶需求添加內容、功能和優化。不過,針對FPGA進行編程,也可以設計出ASIC,但單片成本更高,而且需要大量專業腦力工作,是項“硬核”工藝,而想靠自家設計的FPGA落得應用,更是件困難的事情。
四.近年,國內涌現一批AI芯片的IC設計商,寒武紀、阿里、華為、百度、地平線、比特大陸等。在設計技術和制造技術之間,國內初創IC設計商處在很尷尬的境地,其設計成果若不能找到合適產品并量產,將意味著所有設計毫無商業意義。
于是,我們將目光放到晶圓與封裝廠商上來。
中芯國際是一家成熟的本土圓晶加工商,2017年市場占有率5.4%,YoY(增長率)達到6.35%,2018年28nm以上制程的芯片月產44萬片,這些芯片會被安裝到低功耗計算機、通訊設備、汽車等其他消費電子產品上。但是AI芯片領域,至少在云端訓練計算方向上,14nm以下制程才算剛剛入門,截至2019年2月21日,中芯國際尚未交付任何14nm或以下制程的產品,但在媒體報道中稱:“14納米技術研發已進入客戶導入階段”。
這么來看,中芯國際確實已經有14納米技術:FinFET工藝。FinFET是什么概念?簡單來說,中芯將刻芯片的工藝水平從2維(CMOS)升級到3維(FinFET),是集成芯片工藝中值得“秀”的資本。 此前中芯的28nm多晶硅(Poly/SiON)工藝是相對臺積電比較落后的技術,后來才有了HKMG制程工藝,雖然仍是28nm制程,但產品優化效果好,良品率也有所提升。對于大廠而言,前幾年在20nm的工藝突破是一個分水嶺,因為越低制程將越接近材料極限,例如:量子隧穿效應。FinFET工藝是目前應對量子隧穿效應最有效的方法,中芯國際的FinFET尚處在“有技術沒產品”的階段,正在2019年希翼實現突破。
在世界前三的封測企業中,有兩家是本土品牌,一家是臺灣日月光,另一家是江蘇長電。2017年的數據統計顯示,臺灣日月光的市場占有率最高、營收最大。寒武紀的第一款SoC就是在日月光協作下完成的。
長電科技2018年第一季營收達54.90億元,相較去年同期50.25億元增長9.27%;實現凈利潤9600萬元,而去年同期虧損1億元。歸屬上市公司凈利潤為525萬元,較去年同期3830萬下降86.29%。而我們單獨看江蘇長電的產能,在較為復雜處理器封裝工藝還是研發階段,暫時沒有量產可能。同樣的,與長電科技各分秋色的華天科技、通富微電,均無較大功耗的AI芯片封裝工藝,而小型SoC也難以勝任。蘇州晶方是一家小型化晶圓的半導體廠商,主要靠TSV工藝吃飯,在AI芯片領域暫無涉足,不過相類似廠商可能會在智能設備普及、愈發依賴生物傳感的情況下大有可為。
國內封測企業興起的具有國際因素,例如松下等日韓封測廠在馬來西亞因工人債務問題,于2016起陸陸續續撤離當地,將新廠設立在中國大陸。
五.在IC設計領域,2016年創立的寒武紀需要依托上游知識產權保護,下游需要借助圓晶制造廠、封測(日月光等)廠商實現量產,其產品出口有二:SoC廠商和系統廠商。
2017年,寒武紀參與完成了一款華為的AI芯片設計,也就是讀者常聽到的麒麟970。這顆芯片本身不是寒武紀生產,而只負責設計了其中部分模塊。麒麟970本身屬于SoC概念:將符合需求的功能ARM加上自己的IC晶片封裝到一起。其優點在于集成度高、體積小巧,適合移動端設備。而要設計一顆SoC需要相當多的技術配合,例如上游的IP(intellectual property)授權、遵循晶圓制造標準。能從IC一路走到最后的測試階段的SoC都是了不起的工程項目。
寒武紀和華為合作的麒麟970具有一定戰略意義:去年(2018)全球手機市場整體下滑,唯獨華為手機出貨量上漲趨勢(+43.9%),市場份額達到了世界第三的水平,但此前卻沒有自己的芯片,消耗了大量的IP授權費。與此同時,寒武紀正愁沒機會進入移動端市場,干柴與烈火的相遇,進一步推動搭載麒麟970的Mate10出貨量達到4000萬臺,如果保守估計,麒麟970為寒武紀帶來不小于2億美元收入。寒武紀本身是中科院計算所孵化的國家級AI及芯片團隊。在過去3年里已經進行3輪融資,B輪融資后,估值躍升到25億美元,在國內AI芯片處于領先地位。
結束:國內AI芯片產業逐漸入軌,越來越多的互聯網系和科研孵化系企業希望加入未來的芯片格局。一片拇指大小的硅晶體,此時仿佛一把通往新世界的入場券,吸引著IC廠商與下游制造商竭力一搏。
以上所有內容均來自互聯網公開信息,由TechWeb人工智能領域記者整理發布。