編者按:近兩年,RISC-V 作為 IT 產業鏈中國產替代中的重要一環備受關注。這個基于 BSD 協議開源,基金會總部設在瑞士的開源指令集也一直被視為 X86 和 ARM 強有力的競爭對手。不過,由于起步較晚,性能與生態尚未成熟,RISC-V 以往更多地是用在物聯網領域。今年,算能科技基于阿里平頭哥玄鐵 C910 開發了一臺 64 核 RISC-V 服務器 SG2042。這一動作則拉開了 RISC-V 挺入云計算領域的序幕,2023 也被業界看做是 RISC-V 進入云計算的元年。本期開源訪談我們邀請中國電信研究院云計算技術研究中心博士崔恩放為大家介紹 RISC-V 指令集落地的相關歷史與現狀,今年 5 月 27 日 - 28 日,崔恩放也將擔任 GOTC 2023 全球開源技術峰會講師,帶來有關 RISC-V 的深度主題演講,與到場觀眾共同分享 RISC-V 云計算軟件開源現狀與探索工作。
嘉賓介紹
崔恩放,博士,就職于中國電信研究院云計算技術研究中心,目前為 RISC-V 研究負責人,負責 RISC-V 云計算開源軟件供應鏈建設以及 RISC-V 輕量級虛擬機研發。先后參與 3 項國家重點研發計劃、1 項國家自然科學基金項目、1 項北京市科委項目等。近年來發表 SCI 論文 4 篇,EI 論文 7 篇,中文核心 1 篇,授權專利 6 項等。曾擔任 IEEE EUC 2022 會議 Workshop Co-organizer、IEEE Infocom 2023 會議 Workshop TPC Member。
OSCHINA:先和大家介紹下您正在做的項目吧?
崔恩放:
我是來自中國電信研究院云計算研究團隊的崔恩放,我們近期工作重點之一就是研究與驗證以 RISC-V 為代表的先進計算技術在云計算場景中的應用。舉例來說,計算虛擬化作為云計算領域的核心技術之一,目前在 x86 和 ARM 芯片方面,技術已經比較成熟。在核心技術自主掌控的大環境下,如何基于開放 RISC-V 指令集實現計算虛擬化是云計算行業的研究與驗證的焦點問題。在上述的技術發展背景下,中國電信以我們研究院團隊為主,聯合天翼云相關團隊,經過半年多的重點攻關,成功完成了基于 RISC-V 指令集的輕量級虛擬機的研發與驗證。
中國電信研究院團隊在 openEuler 開發者大會交流 RISC-V 輕量級虛擬機研發工作
OSCHINA:您個人最早接觸到開源軟件和 RISC-V 分別是在什么時候呀?
崔恩放:
我最早接觸開源軟件是在本科求學期間。歐美興起的開源軟件文化推動了軟件領域的迅速發展和進步,我在學生時期就體驗了各種各樣的開源軟件。硬件領域開源的進展要慢一些,但后來也參照了軟件領域的開源趨勢,出現了 RISC-V 開源指令集。RISC-V 自由開放的信念讓我對計算硬件領域的技術發展充滿了信心。借著作后也游行區常興奮,軟件的歷史社中國電信近年來著力打造云計算原創技術策源地,積極探索 RISC-V 開源芯片技術的絕佳機會,我本人積極爭取到了這個機會,希望能發揮自身力量,推動 RISC-V 技術在云計算產業的技術創新與產業化應用。
OSCHINA:RISC-V 在物聯網領域的應用歷史可以簡單介紹下嗎?
崔恩放:
物聯網設備通常需要具有低功耗、小尺寸和低成本等特點,RISC-V 指令集開源免費、簡單靈活、易于裁剪和優化,很好的滿足了物聯網的需求,使得物聯網是 RISC-V 最早成功的場景,到今天有接近 10 多年的歷史。
RISC-V 在物聯網領域的應用歷史可以分為三個時期:初始探索時期、快速發展時期和應用推廣時期。初期探索時期大約是 2010 年至 2014 年,RISC-V 的開發工作剛剛開始,主要由加州大學伯克利分校的科學家推進,研發了學術研究性質的 RISC-V 物聯網芯片。快速發展時期大約是 2014 年至 2018 年,在這個階段,一些公司開始采用 RISC-V 架構來設計物聯網設備,并將其應用于物聯網的傳感器數據采集、智能家居等領域。2018 年至今是應用推廣時期,一些大型公司開始支持和推廣 RISC-V 架構,包括西部數據、英特爾等。到如今全球 RISC-V 芯片出貨量已超 100 億,其中絕大部分用于物聯網場景。
OSCHINA:從物聯網走向數據中心走、云計算領域,RISC-V 自身的優勢在哪?
崔恩放:
您提的這個問題非常好,這個問題也是業內經常思考的一個問題。有研究顯示云計算處理了近 95% 的工作負載和計算實例,是對芯片底層技術要求最高的領域之一,如果一個指令集不能在云數據中心實現規模化應用,很難稱其在云計算領域獲得了成功。
不同于物聯網領域,在云數據中心領域,指令集一般被期待用于解決如下三個問題:高性能問題、高效能問題和技術生態問題。這正是 RISC-V 指令集的主要技術優勢。具體來說 RISC-V 的優勢包含三個方面:首先,RISC-V 設計了多種用于任務加速的指令集擴展,可以實現向量計算、加解密等任務的加速,有較高的計算性能;其次,RISC-V 簡潔的特性,可以降低芯片的功耗,提升效能;最后,RISC-V 在國際上已經形成了一定范圍內的技術共識,有較好的技術委員會指導,有助于建立體系化、繁榮的生態。
OSCHINA:RISC-V 走向云計算已經進展到哪一步了?
崔恩放:
一般來說,芯片指令集走向云計算可以分為四個階段。第一個階段是指令集的設計和完善以及高性能芯片設計制造;第二個階段是服務器等整機設備的研發;第三個階段是應用生態適配;第四個階段是大規模應用普及。
目前業界已經突破了高性能 RISC-V 芯片的設計制造和服務器的研發,正在積極推進云計算應用生態的適配。中國電信也積極的參與到了各個階段,并將跟合作伙伴一起做應用適配、互認證,對 RISC-V 上云起到應用牽引作用,同合作伙伴共同將 RISC-V 云計算產業做大。
OSCHINA:行業關于 RISC-V 走向云計算的研究大概從什么時候開始的?
崔恩放:
RISC-V 國際基金會在 2021 年成立了 Datacenter/Cloud Computing SIG,開始研究將 RISC-V 應用到云計算和數據中心領域,這算是一個標志性的時間節點。RISC-V 應用到云計算主要涉及到芯片的研發和云計算軟件的適配。服務器芯片是近兩年開始研發的,2022 年到 2023 年國內外相繼發布了數據中心高性能 RISC-V 芯片及服務器。云計算軟件的適配實際上開始的比較早,像一些常用的編程語言、編譯器其實在 2021 年之前就已經開始適配了,國內軟件適配工作研究最早的像中科院軟件所的 PLCT 實驗室,2020 年就在 OpenEuler 操作系統開源社區成立了 RISC-V SIG,也在 2023 年發布了 OpenEuler RISC-V 23.03 版本。中國電信也于去年開始進行 RISC-V 上云技術的研究與驗證,以打造自主可控、高效能的國家云為長遠目標,推進了天翼云自研云操作系統 CTyunOS 在國內首臺 RISC-V 服務器的適配,并自研了支持 RISC-V 輕量級虛擬機。
OSCHINA:您所在的這個部門決定開始做 RISC-V 相關研發的目的是什么?中國電信處于產業鏈上的什么角色和地位,優勢在哪?
崔恩放:
中國電信作為全球最大的運營商云提供商,憑借在云網領域特有的資源稟賦優勢,不僅具有極強的產業牽引作用,同時也一直致力于推動云計算技術、邊緣計算技術的創新和應用。在這個過程中,RISC-V 憑借其開放性、靈活性以及成本、性能優勢正在成為上述兩個場景下全新的指令集架構選擇。
2022 年以來,中國電信已經實現云計算核心系統技術棧的全棧自研,并且完成一云多芯的國產化適配。在上述技術積累的基礎之上,2023 年開始,我們開始推動基于 RISC-V 開源指令集芯片的云化進程,在這個方面中國電信具有技術先進性。此外,中國電信可以發揮作為云計算原創技術策源地作用,承擔央企責任,協同上游 RISC-V 芯片廠商聯合推動 RISC-V 相關技術的發展與生態成熟。
無論在邊緣云還是中心云場景,中國電信不僅具有豐富多樣的應用場景,同時還有巨大的規模優勢,可在自身的業務中積極探索基于 RISC-V 架構芯片和設備的采用,由此中國電信對于推動 RISC-V 生態建設、RISC-V 技術研發與應用方面都能發揮重要作用。
OSCHINA:近幾年關于 RISC-V 的研究與討論聽起來還挺多的,為什么這個成熟度還沒上來?
崔恩放:
當前很多人認為 RISC-V 還不夠成熟,這其實對于 RISC-V 的一種誤解,我們應該分場景來看待 RISC-V 成熟度的問題。RISC-V 架構的開源、低功耗特性和可擴展性能夠很好的滿足物聯網、嵌入式設備要求的低成本、低功耗、小型化的需求,可以說在這些場景下,RISC-V 是成熟的,并且已經取得了很大的成功。在 2022 年 7 月,RISC-V 國際公司的首席執行官 Calista Redmond 表示:“估計市場上已經有 100 億個 RISC-V 核”,如此大規模的應用就是一個很好的例證。
所謂 RISC-V 不成熟,主要還是指在面向數據中心、云計算場景的通用計算領域。這是由于多方面的原因導致的,第一,RISC-V 針對通用計算還需要進一步的優化,例如 IP 核設計、處理器架構、編譯器等方面,都有待改進以提高其性能核能力。第二,通用計算意味著更復雜的軟件生態,而這也是 RISC-V 亟需完善的地方。第三,RISC-V 在通用計算領域缺乏廣泛的應用場景,整體還處于探索階段。這正是中國電信正在做的 RISC-V 在云領域的探索與實踐的意義,我們對于 RISC-V 還是抱有積極樂觀的態度。中國電信在云計算原創技術策源地的框架下會積極探索并推動 RISC-V 云計算場景應用及關鍵技術的研究,加速 RISC-V 云計算場景落地應用的進程。
OSCHINA:RISC-V 指令集的構成是怎樣的?
崔恩放:
RISC-V 指令集主要包括非特權指令集和特權指令集,其中,非特權指令集又包括基礎指令集和擴展指令集,基礎指令集就是整數計算指令集(整數加、位移等操作),擴展指令集會針對一些特定的場景提供一些指令,比如 RISC-V 針對向量計算專門提供了 V 擴展,針對加解密提供了 K 擴展。特權指令集主要提供相關指令支持操作系統及虛擬機,如針對虛擬化提供了一個 H 擴展。
OSCHINA:RISC-V 可靈活定制的特性是如何實現的?
崔恩放:
X86 和 ARM 由于歷史原因,指令集多達上千頁、沒有模塊化區分,導致很難靈活定制。RISC-V 指令集簡潔,并進行了模塊化區分,基礎指令只有 40 多條,其它指令可模塊化添加,使其具備了可靈活定制的特性。例如 RISC-V 基金會制定了向量計算、加解密、壓縮等指令集擴展,用戶在設計芯片時可以選擇是否使用上述擴展,也可定制私有的指令集擴展,如針對通信任務加速定制編解碼指令擴展等。
OSCHINA:您認為 RISC-V 可能會在接下來的兩三年里擴展到什么領域或是場景下?
崔恩放:
我認為當下兩三年 RISC-V 會在邊緣計算和部分云計算場景中應用。邊緣計算可應用的場景包括邊緣數據存儲、邊緣 AI 等,具體形態可以是邊緣盒子或者邊緣服務器、邊緣一體機等。云計算場景包括離線大數據分析、HPC,或者像一些冷數據存儲應用可能會進行一些試點。而且近兩年 RISC-V 服務器的虛擬化能力有望增強,可能會出現 RISC-V 指令集的云主機。
全球開源技術峰會(Global Open-source Technology Conference),簡稱 GOTC,是由開放原子開源基金會、上海浦東軟件園、Linux 基金會亞太區和開源中國聯合發起的,面向全球開發者的一場盛大開源技術盛宴。 5 月 27 日至 28 日,GOTC 2023 將于上海舉辦為期 2 天的開源行業盛會。大會將以行業展覽、主題發言、專題論壇、開源市集的形式展現,與會者將一起探討元宇宙、3D 與游戲、eBPF、Web3.0、區塊鏈等熱門技術主題,以及開源社區、AIGC、汽車軟件、AI 編程、開源教育培訓、云原生等熱門話題,探討開源未來,助力開源發展。
GOTC 2023 報名通道現已開啟,誠邀全球各技術領域開源愛好者共襄盛舉!