計算正在CPU、GPU、應用加速器、互聯處理器、邊緣計算設備和FPGA的異構組合中延伸,所有這些都需要持久穩定的內存和軟件,將這些要素組合成一個完整的解決方案。為了實現大規模生成、存儲和分析數據,通往Z級(1Z=1021,十萬億億級)計算的賽道已然開啟。之前,從P級(1015,千萬億級)計算發展到E級(1018,百億億級)計算用了超過12年的時間。
10月28日在英特爾On技術創新峰會上,英特爾宣布要與開放生態系統合作,確保開發者擁有優化的工具和軟件環境,以加速他們的部署,并預計在五年內也就是2027年實現Z級計算。此外,英特爾在開發者生態系統、工具、技術和開放平臺方面的深度投入,正在為人工智能的普及掃清障礙。
從云到邊緣的基礎設施:結合規模和容量無限擴展的云以及無限延伸的智能邊緣
. Ponte Vecchio和oneAPI支持的SiPearl 公司的微處理器: SiPearl正在為歐洲的百億億次(E)級超級計算機設計一種微處理器,選擇英特爾Ponte Vecchio GPU作為該系統高性能計算(HPC)節點內的HPC加速器。為了打通各種計算環境,SiPearl采用oneAPI作為開放的軟件規范,從而幫助開發者提高生產力并優化工作負載性能。
. 下一代英特爾®至強®可擴展處理器(代號為“Sapphire Rapids”)的優化:英特爾正在與開源社區及其龐大的生態系統伙伴合作,使開發者在其下一代處理器上進行開發時更便捷,還將整合多個全新的加速引擎,旨在解決數據中心規模部署模式中的開銷問題,同時提高處理器內核的利用率,降低功耗和占地面積成本。
除此之外,英特爾還強調,云應用開發者可以在主要的云服務提供商中使用最新的第三代英特爾®至強®可擴展處理器,包括阿里巴巴、AWS、百度、谷歌、微軟、Oracle和騰訊。
人工智能:讓人工智能更便捷、更具可擴展性,賦能開發者
英特爾在開發者生態系統、工具、技術和開放平臺方面的深度投入,正在為人工智能的普及掃清障礙。英特爾的作用是負責任地擴大人工智能技術的應用規模。英特爾通過在英特爾至強可擴展處理器上對流行的庫和框架進行廣泛的優化,讓人工智能更便捷、更具可擴展性,賦能開發者。英特爾投入開發多種人工智能架構以滿足不同的客戶需求,采用開放、基于標準的編程模型,讓開發者能更輕松地在更多的用例中運行更多的人工智能負載。目前有許多世界領先的研究組織和機構正利用英特爾的人工智能技術來解決復雜的任務,今日的發布恰好印證了這點:
. 阿貢國家實驗室的“極光”(Aurora)超級計算機提供每秒兩百億億次的浮點運算性能:該款聯合設計的“極光”(Aurora)超級計算機,將搭載下一代英特爾至強可擴展處理器(代號為“Sapphire Rapids”)和英特爾下一代GPU(代號為“Ponte Vecchio”),提供每秒超過兩百億億次的雙精度峰值計算性能。“極光”(Aurora)為高性能計算、人工智能/機器學習和大數據分析工作負載而設計。阿貢國家實驗室是美國能源部的一個國家實驗室,也是致力于提供未來百億億次(E級)計算能力的前沿機構。
. 英特爾人工智能技術賦能阿里巴巴推薦引擎:英特爾與阿里巴巴合作開發了端到端的工具包DeepRec,以促進推薦系統的深度學習訓練和部署,這一工作負載會耗費所有數據中心和云端人工智能生命周期的很大一部分,并有不同的計算、內存、帶寬和網絡需求。DeepRec開發者能更輕松地加載和更新模型,處理嵌入層,利用現有模型庫,以及部署具有數萬億個樣本的極大規模推薦服務。
. 針對英特爾至強可擴展處理器優化的AI工具包:英特爾優化的AI工具包為數據科學家提供了更高性能和生產力,方便快捷。英特爾已經與開源社區,以及亞馬遜、百度、Facebook、谷歌和微軟進行合作,以確保支持最流行的數據科學軟件,優化了在英特爾硬件上的運行,這些軟件包括Pandas、scikit-learn、MXNet、PaddlePaddle、PyTorch、TensorFlow、ONNX Runtime等。
. 加速下一代英特爾至強可擴展處理器的AI性能:英特爾計劃通過下一代英特爾至強可擴展處理器(“Sapphire Rapids”),實現人工智能總性能增益與上一代相比提高30倍。這些性能提升是通過廣泛的軟件優化和即將推出的內置于處理器的英特爾高級矩陣擴展(AMX)引擎實現,在不需要獨立GPU的情況下,可執行更多的AI用例。
英特爾公司CEO帕特·基辛格說道:“我相信開源會使所有最終用戶、開發者、合作伙伴和企業獲得成功,因為它能夠激發全新的研發熱情。我相信一個強大、開放的生態系統將無往不勝。”