“人工智能帶來指數級增長的算力需求,一方面多樣化的智能場景需要多元化的算力,巨量化的模型、數據和應用規模需要巨量的算力,算力已經成為人工智能繼續發展的重中之重;另一方面從芯片到算力的轉化依然存在巨大鴻溝,多元算力價值并未得到充分釋放。如何快速完成多元芯片到計算系統的創新,已經成為推動人工智能產業發展的關鍵環節。”在10月26日舉行的2021人工智能計算大會(AICC2021)上,中國工程院院士、浪潮首席科學家王恩東闡釋了計算系統創新在計算到智算轉變的產業新格局下的重大意義。
隨著人工智能在算法領域的不斷突破,不同數值精度帶來了跨度更大的計算類型,對計算芯片指令集、架構的要求更加細分。圖靈獎獲得者 John Hennessy和 David Patterson共同發表的《計算機架構的新黃金時代》中提出:當摩爾定律不再適用,一種更以硬件為中心的針對特定問題領域定制設計計算機體系架構的方法DSAs(Domain-Specific Architectures)會成為主導,這種設計的核心在于針對特定問題或特定領域來定義計算架構?;贒SAs思想設計的AI芯片,在特定AI工作負載上表現出遠超通用芯片的處理能力,大大推動了AI芯片的多元化發展。
王恩東認為,芯片多元化為產業AI化的加速提供了重要的產業基礎和更加豐富的選擇。但是,芯片從造出來到大規模用起來,還存在巨大的產業鴻溝,“因此,如何將百花齊放的AI芯片轉變成一個通用性強、綠色高效、安全可靠的計算系統,變得至關重要。”
然而,由于AI芯片在單一計算系統中往往高密度集成,帶來系統功耗、總線速率、電流密度的不斷提升,AI計算系統的設計面臨巨大挑戰。例如一臺浪潮AI服務器,需要整合超過10000個零部件,包含50多類專用芯片、30多個技術方向以及100多種傳輸協議,涉及到材料、熱力學、電池技術、流體力學、化學等一系列學科;需要經歷30多個流程、150多種加工和制造的工藝、280多個關鍵過程的控制點,如何確保整個系統的可靠性是一個非常精細且復雜的工程。
“從火箭發動機到運載火箭,要在循環、控制、結構等很多領域做大量的工作。芯片到計算系統同樣如此,需要完成體系結構、信號完整性、散熱、可靠性等大量系統性設計工作。”王恩東院士用一個生動形象的比喻,描述了計算系統創新的難度。
值得關注的是,計算系統創新的根本目的,就是要讓算力、算法和數據去服務數字經濟,去支撐科研創新,去推動智慧轉型,這就需要加大以智算中心為代表的新型人工智能基礎設施建設,以此推動AI產業化、產業AI化和政府治理的智能化。
對此,王恩東院士強調說:“我們一方面要重視智算系統的創新,加大人工智能新型基礎設施建設,把從技術到應用的鏈條設計好,從體系結構、芯片設計、系統設計、系統軟件、開發環境等各個領域形成既分工明確又協同創新的局面。同時,也要加快推動開放標準建設,通過統一的、規范的標準,將多元化算力轉變為可調度的資源,讓算力好用、易用。”