近日,英飛凌和臺積電宣布,兩家公司正準備將非易失性存儲器 (NVM) RRAM (ReRAM) 引入英飛凌的下一代 AURIX ™微控制器 (MCU),并將在臺積電的28納米節點上制造。
英飛凌選擇RRAM而不是嵌入式閃存(eFlash)的背后有其考量:在新型存儲器中,RRAM不僅滿足高讀寫速度和存儲密度的要求,同時延遲可降低1000倍,可滿足未來智能駕駛高實時數據吞吐量。安全性方面,RRAM具備可靠性,未來有望出現高性能、高集成度、高穩定性和低功耗的車規RRAM存儲器。英飛凌汽車微控制器總經理 Thomas Boehm 說:“RRAM為性能擴展、功耗降低和成本改善創造了巨大潛力。”
這不是英飛凌第一次嘗試新型存儲器。今年7月,英特爾透露將逐步停下自有Optane存儲器業務。Optane 是相變存儲器 (PCM) 的一種變體,基于英特爾與美光聯合研發的3D Xpoint技術。
這到底是器件或者技術本身導致的注定失敗,還是新型存儲器在崛起之路上的一段嘗試?eeNews 在其文章《為何新型存儲器尚未成功》中傾向于后者: “正如我們在新報告《新興存儲器進入下一階段》中所解釋的那樣,越來越多的公司使用的 CMOS 代工邏輯無法將 NOR 閃存嵌入到小于 28nm 的工藝中,除非 NOR 是使用 28nm 或更大的工藝技術生產的。換句話說,芯片的邏輯部分會隨著工藝的縮小而繼續縮小,但 NOR 的尺寸會保持不變,這將大大減緩芯片成本的降低。SRAM 似乎也是如此。在大約 10nm 的工藝中,SRAM 的擴展速度比邏輯慢得多,盡管它并沒有像 NOR 那樣完全停止。”
傳統存儲器所具有的易失性、微縮性差等問題可以被新型非易失性存儲器很好地解決。而新型存儲器如何打開市場,《中國電子商情》11月刊中的《供需混沌,迭代如常,存儲器迎來怎樣的 2023》一文認為:“新技術要有市場,關鍵在于能否解決應用的計算和內存瓶頸。”
突破傳統架構,RRAM(ReRAM)存算一體有望提升計算系統能效比
開發新計算系統源于幾點:數據指數增長、功耗增加,當前計算系統的性能限制也是原因之一。對此,業界提出“近內存”或存內計算(In-memory Computing),以解決數據中心的幾個問題,包括數據傳輸“存儲墻”(Memory barrier)、高功耗和時間成本。涉及深度學習網絡的數據中心需要巨大的計算能量,要求高可靠性、更出色容量、帶寬和性能的存儲器,從而衍生出關于新的非馮·諾依曼系統的新興存儲技術研究。
普遍認為,RRAM(也即 ReRAM,阻變式隨機存取存儲器)、PCM(相變隨機存取存儲器)和 MRAM(磁隨機存取存儲器)等新型存儲器是下一代存儲技術路線,這些也是“存內計算”的基礎技術,從技術特征來看,這些技術有哪些獨特性?
資深電子器件專家 Ray 表示,上述的下一代非易失性存儲器首先是作為存儲級內存被提出的,在存儲層級中介于內存和硬盤之間,因此,存儲的性能指標對這些下一代非易失性存儲器仍然適用,如面積、功耗、讀寫速度、集成性、成本等。此外,下一代非易失性存儲器也非常適用于存內計算,而存內計算又對這些存儲器提出了新的要求,如開關比、多阻態、魯棒性等。RRAM、PCM 和 MRAM 等是目前研究較多的下一代非易失性存儲器,它們各有優勢和不足。
MRAM 中的磁性材料磁化方向變化的時候,從磁性材料兩端電極上讀取得到的隧穿電流會發生變化,從而得到不同電阻,其編寫速度快、重復編寫周期長,但其材料制備較復雜、開關比較低、易受擾動。
PCM 是利用相變材料在焦耳熱作用下,在結晶態和非晶態之間轉換,從而呈現出不同阻態,其已經在英特爾等公司的產品中使用,大規模集成性較好,但其寫入速度較慢、寫入能耗較大。
RRAM 主要依靠絕緣層在電場作用下,通過離子的遷移形成導電細絲,再通過控制導電細絲的通斷控制阻態,綜合來看在各個指標上均具有比較優異的性質,其結構簡單、存儲密度高且支持片上3D 集成、開關比可達1000以上、讀寫速度和功耗適中,且其可通過控制導電細絲的形態形成多阻態,從而模仿生物大腦中神經突觸功能,適合存內計算和類腦計算。
目前 RRAM 作為新興存儲器,其規模化制備的良率、成本、外圍控制電路等還需進一步優化,同時,我們也很欣喜地看到國內和國際的多家制造廠商已經布局 RRAM 的制備,并且已完成晶圓級 RRAM 芯片的流片。
在 RRAM 商業化之前,還需要解決哪些難題?Ray 說道,同其他研究一樣,RRAM 的科研主要解決科學問題,在進行商業化的時候還有很多工程問題需要解決,包括大規模制造、架構和軟件的配合、應用場景等,但目前來看,其很多科學問題已經經過了大量的研究,取得了很多突破,這些技術問題相信隨著時間的推移也將逐步解決。
物聯網和網絡邊緣的人工智能(AI)和機器學習(ML)快速增長,這些應用端的計算系統的能效比的問題日益突出,而 RRAM 作為一種較佳的解決方案,成為研究的焦點。
Ray 進一步說道,目前的計算架構采用馮諾伊曼架構,其存儲與計算單元分離,因此,在 AI 等計算應用中,大量數據需要不斷在片下的內存和片上的計算單元之間搬運,然而由于內存帶寬不足帶來的“存儲墻”問題,導致計算延時和能耗較高,難以滿足 AI 模型的算力和功耗需求。存算一體技術將存儲單元與計算單元融合,在存儲器內利用物理定律進行計算,避免了“存儲墻”問題,極大地降低了數據搬運的能耗和延時,并提升了計算的能效比。基于 RRAM 的存算一體目前是國內外的研究熱點和前沿,其主要實現方式分為兩種,即模擬式存算一體和數字式存算一體。
模擬式存算一體利用了 RRAM 的模擬式阻態特性,通過電導存儲多比特數據。以神經網絡中應用較廣泛的矩陣乘積運算為例,其電導值存儲神經網絡的權值,輸入為電壓值,利用歐姆定律完成乘法,得到電流值,然后陣列中同一條數據線上的電流根據基爾霍夫電流定律相加,從而完成乘加運算。模擬式存算一體可以達到較高的存儲密度,但其對環境噪聲和溫度較敏感,運算精度較低,主要適合低精度、小算力的應用場景。
而數字式存算一體中,其每個 RRAM 只存儲一比特數據,經過乘法運算得到電流后再經過數字電路進行后續加法等運算,此種方法雖然存儲密度低于模擬式存算一體,但其優勢是在保證計算能效比的前提下,支持高精度、大算力的運算,提高計算的魯棒性,從而極大地拓展了存算一體的應用場景。
相比于 CMOS 器件,目前 RRAM 的局限性主要體現在編寫周期有限上,因此目前 RRAM 主要適用于 AI 推理等操作,而相信隨著工藝的演進,得到更高編寫周期的 RRAM 也是非常有希望的。另一個局限性是 RRAM 阻值的波動性,而此問題在數字化存算一體中可以得到很好的解決。
矽說在《存算一體是大勢所趨還是審美疲勞?》一文中提到,在即將召開的ISSCC 2023上,存算一體相關的論文至少有21篇,占了整個ISSCC錄用論文的10%。而從技術路徑來分類,純模擬的存算一體在session 7 (SRAM存算一體Macro)中只有2篇,其余均是數字。數字化技術將成為“存算一體”的大趨勢。
緊跟趨勢,國內初創公司勇闖“無人區”?
提到RRAM和數字化存算一體,就不得不提一下日漸名聲鵲起的一家國內企業——億鑄科技。根據其官網描述,自2020年成立以來,就專注于“基于ReRAM的全數字化存算一體AI大算力芯片”的研發。放眼全球,這種結合與嘗試都是非常新的,但是這種組合否能助力新型存儲器市場崛起、甚至在國產化AI大算力芯片上取得亮眼成績,還需時間去驗證。好在這個未來并不遠——億鑄科技曾透露,其第一代芯片將于2023年落地,并于同年投片第二代芯片。且讓我們拭目以待。