2009 年,飛天的第一行代碼敲在了阿里云最早的辦公室里,也敲在了國內云計算的里程碑上。十幾年后的今天,我們仍然能夠看到這股創新力量在阿里云不斷匯聚,等待某一刻的爆發,而這一刻似乎已經到來。早在今年 4 月的阿里云峰會上,阿里巴巴集團董事會主席兼首席執行官、阿里云智能集團 CEO 張勇表示,目前阿里云已形成了全棧的技術服務,搭建了模型即服務(MaaS)、平臺即服務(PaaS)、基礎設施即服務(IaaS)三層架構。在此之后,阿里云推出了“飛天發布時刻”這一產品技術發布平臺,并開始以這一平臺高頻地對外發布在智能時代云計算創新體系下的一系列新技術和新產品。在剛剛過去的 7 月 31 日,飛天發布時刻再次帶來了一系列新產品,并引發了業內對智能時代云計算技術體系相關理念的關注。
一直以來,業界對于 MaaS 存在諸多討論。那么,MaaS 理念之下是否實現了業務場景的適配與落地?被熱議的全棧 Serverless 化做到了哪一步?對企業和開發者又有何價值?云廠商如何才能真正做到“普惠”?什么樣的云計算體系架構適合智能時代?本文將針對上述問題進行探討并尋找答案。
一、MaaS 理念下如何實現大模型能力產品化?
AI 浪潮下,作為大模型底層基石的云計算發生了新的變化。當前階段,云廠商已經基本達成共識:AI 與云計算互生互融成為必然趨勢,應用將大規模建立在大模型上。與此同時,業界在討論大模型時普遍提到了一個關鍵詞:MaaS。
MaaS 是什么?去年 11 月,阿里云在云棲大會上首次提出了 MaaS(Model-as-a-service ,模型即服務)概念。阿里云 CTO 周靖人曾對 MaaS 做了如下表述“MaaS 最底層的含義是要把模型作為重要的生產元素,圍繞模型的生命周期設計產品和技術,從模型的開發入手,包括數據處理、特征工程、模型的訓練和調優、模型的服務等,提供各種各樣的產品和技術。”可以明確的一點是,MaaS 并非一個技術層,而是一種理念。
隨著“百模大戰”日趨白熱化,MaaS 理念成為越來越多大廠選擇的商業路徑。MaaS 是否能重塑云計算改變云計算的游戲規則,目前定論還尚早。但可以肯定的是,以往的 PaaS 和 SaaS 架構都將被置于大模型的底層能力之上,大模型將成為生產要素,在各行業釋放力量。
盡管大模型對未來的顛覆性影響已成為共識,但是我們仍然需要面對的現實是,國內對大模型的探索處在早期階段,多數企業對于大模型仍然持有觀望態度,原因在于其在業務場景適配與落地上存在較大難題。當各大廠正在跟隨 MaaS 理念紛紛研發自己的大模型或者尋找大模型落地場景時,阿里云已經實現了大模型能力的產品化。
今年的 WAIC 大會上,阿里云通義大模型家族揭開了最新成員的面紗,基于自研的組合式生成模型 Composer 的 AI 繪畫創作大模型——通義萬相。其實,在這之前阿里云已先后發布了超大規模的語言模型——“通義千問”和專攻音視頻生產力的 AI 產品“通義聽悟”。至此,阿里云在 AI 的三大主要方向全部打通。
“面向 AI 時代,所有產品都值得用大模型重新升級。”是阿里云對大模型產業落地的判斷。當所有聚光燈都打在兩個月內迅速誕生的通義千問和通義萬相兩個大模型上時,阿里云已經同步實現了諸多產品的智能升級,通義聽悟、釘釘都是其中的先行者。
通義聽悟是一款面向工作和學習的 AI 助手,通義聽悟強大的理解能力背后除了以自研的通義千問大模型為基座,更重要的是內置了阿里云新一代工業級語音識別模型 Paraformer,這是業界首個應用落地的非自回歸端到端語音識別模型,在推理效率上最高可較傳統模型提升 10 倍。最新數據顯示,通義聽悟在發布首月累計訪問用戶數 49.1w。
除此之外,通義大模型能力也足以賦能其他企業級產品。在釘釘宣布全面接入通義千問大模型的 3 個月之后,我們看到了大模型對企業級產品智能化升級的真正實力。知識庫、Teambition、白板等加入 AI 能力,釘釘 12 條產品線、40 多項場景接入大模型。用戶通過斜杠“/”輸入自然語言,即可生成 PPT、思維導圖、數據分析圖表、項目看板等。在智能化升級中,釘釘將大模型深度融入到工作流程的各個環節,用戶可以在釘釘上完成從溝通到協作、從創意到實現、從管理到決策的全流程并能充分感受到大模型交互與理解能力所帶來的新功能、新體驗。
在開發者生態層面,為進一步降低大模型使用門檻,阿里云推出國內首款大模型調用工具魔搭 GPT(ModelScopeGPT),它能接收用戶指令,通過“中樞模型”一鍵調用魔搭社區其他的 AI 模型,大小模型協同完成復雜任務。魔搭 GPT 現已能夠調用魔搭社區十多個核心 AI 模型的 API,未來隨著更多模型 API 的加入,魔搭 GPT 的能力也將不斷增強。構建這一模型調用工具的數據集和訓練方案將會對外開放,供開發者自行使用,開發者可以根據需要對不同的大模型和小模型進行組合。值得一提的是,就在昨天,阿里云通義千問開源。AI 模型社區魔搭 ModelScope 上架兩款開源模型 Qwen-7B 和 Qwen-7B-Chat,阿里云確認其為通義千問 70 億參數通用模型和對話模型,兩款模型均開源、免費、可商用。在多個權威測評中,通義千問 7B 模型取得了遠超國內外同等尺寸模型的效果,成為當下業界最強的中英文 7B 開源模型。
從通義聽悟到釘釘再到魔搭 GPT,我們看到阿里云在用戶層面、企業層面、開發者層面實現了大模型產品化的全面布局。這也意味著,阿里云最先實現了在 MaaS 理念之下大模型與業務場景的創新落地。然而,大廠的理念再先進、產品落地再好,普通企業和開發者要想玩轉 AI,尤其是在云上玩轉 AI,依舊難度不小,降低 AI 開發甚至應用開發的門檻,是開發者們提出的訴求,也是云廠商最重要的功課之一。
二、降低 AI 開發門檻,全棧 Serverless 化,做高質量的 PaaS 層
大模型浪潮,率先將算力推至風口浪尖。據 OpenAI 測算,全球 AI 訓練所用的計算量呈現指數級增長,平均每 3.43 個月便會增長一倍,目前計算量已擴大 30 萬倍,遠超算力增長速度。國家信息中心發布的《智能計算中心創新發展指南》顯示,當前我國超過 30 個城市正在建設或提出建設智算中心,但仍然無法滿足相關需求。
打造一個 AI 大模型究竟需要多少算力?據公開數據顯示,ChatGPT 初始所需的算力就是 1 萬塊英偉達 A100,價格超過 7 億元。后續的調優訓練每天消耗算力大概是 3640PFLOPS,需要 7 至 8 個算力達 500PFLOPS 的數據中心支持,建設成本約為三、四十億元。
然而,提供算力的所有 GPU 不能只是簡單堆砌,更需要讓所有算力聯合起來為模型訓練服務。大模型的訓練和推理過程需要海量數據資源,相比于傳統中央處理器 CPU,GPU 擁有上千個小型處理核心,能夠同時處理大規模數據的并行計算任務,運算速度更快。憑借這些優勢成為了智能計算的理想選擇。但是,算力的構成并不僅僅只是 GPU 加速芯片,還需要構建包括網絡互聯、操作系統、深度學習框架以及相應 SDK、算法與應用程序等,形成一個完整的計算生態系統,通過體系化的技術支撐匯聚 AI 算力。
而智算服務 PAI-靈駿恰恰就能將這一體系整合。智算服務 PAI-靈駿包含的基礎設施層的 RDMA 網絡和融合算力集群、智算工程平臺和智算資產管理以及強大的 Serverless 化的調度能力和運維管控能力等,都助力開發者擺脫堆砌算力的老路。
同時,智算服務 PAI-靈駿面向大規模深度學習及融合計算場景,一站式地提供覆蓋 Al 開發全流程的工程平臺和深度優化的融合算力,支撐了 10 萬億參數規模的大型模型訓練?;?PAI-靈駿智算服務,單訓練任務可達萬卡級別規模,訓練性能可提高近 10 倍,千卡規模的線性擴展效率達 92%,極大降低 AI 開發門檻。
智算服務 PAI-靈駿本質上是一個 Serverless 化的產品,為 AI 開發新范式提供了 Serverless 化的平臺支持。而在 AI 開發之外,Serverless 也已經是大家普遍認同的應用開發的范式。根據 Gartner 預測,到 2025 年將會有 50% 以上的全球企業采用 Serverless 化架構。為什么越來越多企業會使用 Serverless ?
Serverless 的核心目的是在云計算的基礎上,徹底“包攬”所有的環境工作,直接提供計算服務。在 Serverless 架構下,開發者只需編寫代碼并上傳,云平臺就會自動準備好相應的計算資源,完成運算并輸出結果,從而大幅簡化開發運維過程。隨著企業數字化進程加快,Serverless 的全托管服務、自適性彈性、按實際用量計費等特點越來越滿足企業的業務需求。
Serverless 的價值不言自明,但是要想讓用戶用好 Serverless,單純在應用運行時層面進行 Serverless 化是遠遠不夠的,應用依賴的下游數據庫等系統,如果沒有良好的彈性,就會成為系統整體的“短板”。
全面實現 Serverless 化取決于整個研發鏈路上有多少云產品提供了這樣的形態。阿里云是國內對 Serverless 探索最早的廠商之一,其于 2017 年推出了函數計算產品 FC,2018 年推出了 Serverless 應用引擎 SAE 和 Serverless 容器服務 ASK,2020 年開源了 Serverless Devs,2021 年阿里云 Serverless 產品能力在 Forrester 評測中拿下國內第一 ,2022 年 Serverless 應用中心發布……在去年的云棲大會上,阿里云宣布全棧 Serverless 化之后,業內都在期待相關成果。
“讓云計算從資源真正變成一種能力”,阿里云一直堅定地推進全棧 Serverless 化并通過多年的 Serverless 產品創新積淀等待新的突破。
在本周一的飛天發布時刻上,阿里云陸續帶來了 Serverless 領域的最新進展:函數計算 FC 與 AIGC 的創新融合、容器服務 Serverless 版(ACK Serverless)以及 Serverless 應用引擎 SAE2.0。這意味著,阿里云在全棧 Serverless 化又前進了一步。
在權威咨詢機構 Forrester 發布的最新全球 FaaS 能力報告中,阿里云函數計算憑借產品能力在 40 個嚴苛的評分項目中拿下 24 個最高分,綜合穩居領導者象限,成為國內唯一兩度進入該象限的科技公司。函數計算的產品實力加速了與 AIGC 的創新落地。
面對應用開發的高門檻,阿里云函數計算整合了 AIGC 應用開發,集結經典的 AIGC 模版,5 分鐘就可以完成 AIGC 應用部署,使模型托管的難度降低、效率提高。
阿里云的容器服務 Serverless 版,則是將 ACK 和 ASK 兩款產品融合,在彈性能力和調度能力上實現了更大提升。例如,升級了智能彈性預測 AHPA,相比人工配置,彈性準確率提升 80%;基于庫存感知調度和可用區打散調度,提高了彈性的確定性以及應用的高可用性。
全托管、免運維、高彈性是 SAE 的主要特點,本次升級的 SAE2.0 將研發運維提效 50%、應用成本下降 40% 以上并實現百毫秒級彈性伸縮,應用冷啟動提效,支持縮容到 0,這對于新興業務以及一些創新創業的公司更加友好。
我們看到,從智算服務 PAI-靈駿到全棧 Serverless 化的最新進展,都是在降低 AI 開發門檻和應用開發門檻,背后的本質是云計算技術的不斷創新與發展,而云計算技術創新和發展的終極目標則是降低算力成本,讓每個企業甚至每個人都能用得起、用得好算力,讓計算真正成為公共服務。
三、創新與規模效應加持下,將“普惠”進行到底
目前,國內大部分算力掌握在少數廠商手里,而云廠商占了很大比重。算力,在很多情況下成為了想法落地的最關鍵一環,是很多機構和企業邁不過去的坎。
普惠在任何行業都是具有巨大價值的事情,算力普惠更是如此。但做這件事情是有門檻的,首先就是技術創新。阿里云掌握著國內云計算核心技術體系,擁有自研軟硬件一體研發系統,例如,自研 CPU 倚天 710、云數據中心處理器 CIPU 以及飛天操作系統,構建了從芯片、板卡、服務器、操作系統和上層云原生應用軟件、數據庫等核心云基礎設施。阿里云對軟硬件一體技術整合的持續大力投入所推動的算力提升、資源調度能力增強、以及細顆粒度的運營,是阿里云能夠降本讓利的底氣所在。
讓更多企業和開發者享受到云計算的紅利,是阿里云的初心。
降低開發者的獲取門檻是阿里云“普惠”的重要一步。今年 4 月中旬,阿里云推出了“飛天免費試用計劃”,面向 1000 萬云上開發者,提供核心云產品的免費試用,最長達三個月,可支持開發者構建包括業務在線、大數據類、AI 等不同類型應用,并且支持 Serverless 的開發模式。
目前該計劃也推出了國際版,涵蓋 50 多款產品,包括 ECS t5 實例的一年期免費試用、PolarDB 數據庫永久免費試用,以及指定規格試用期滿折扣續費等多種產品優惠。據悉,阿里云還將進一步擴大免費試用范圍,針對學生、中小企業的專屬免費試用計劃也在籌備中。
成本是云計算發展的命門,在降低用戶成本上,阿里云展現了最大的決心和誠意。今年的 4 月阿里云宣布核心產品價格全線下調 15%-50%,存儲產品最高降價 50%。例如,彈性計算 7 代實例和倚天實例降價最高 20%,存儲 OSS 深度冷歸檔降價 50%,網絡負載均衡 SLB 降價 15%,數據庫 RDS 倚天版降價最高 40%。被外界稱為“阿里云有史以來規模最大的降價”。
然而,降本并不等于降價也不是價格戰,而是通過產品優化和規模效應帶來 IT 總成本的降低。
作為國際領先的云計算廠商,阿里云在過去的十年里持續降低云計算的“使用門檻”。其提供的算力成本下降了 80%,存儲成本下降了近 90%。在不斷降價的過程中,阿里云所期待的是聯合更多分銷商和集成商一起,擴大云的用戶基數和規模,推動更多產業進一步從傳統 IT 向云計算轉移,提高計算資源的利用率,帶動算力成本不斷下降。利用技術改進、規模效應釋放讓利空間,價格下降又為技術改進、規模增長帶來更多推力的正循環。
即便降低用戶成本,但是阿里云在安全層面并不打折扣。特別是在降低企業確保業務安全穩定運行的成本上。例如,云安全中心的多云統管能力和辦公安全平臺的輕量版。尤其是辦公安全平臺的輕量版,適合中小企業使用的同時,核心功能和標準版基本一致且價格只有標準版的不到 10%??梢钥闯觯⒗镌茖χ行∑髽I的關注與支持印證了其普惠理念。
四、寫在最后
從 MaaS 理念下的大模型能力的產品化,到 PaaS 層技術迭代與積淀迸發,再到 IaaS 層創新與規模效應下的成本降低。在這些產品和理念的背后,我們看到阿里云是“一家云計算產品公司”的核心定位,并堅定走向“產品被集成”。大模型時代,企業都在探索新的商業模式和生存之道,對于企業而言,找到靠譜的合作伙伴是未來發展的重要一步,阿里云趟出了一條可能路徑并走在了最前面。我們需要給先行者們更多的時間,來共同建立適合智能時代的云計算體系。