作者:蛋醬
十年來,人工智能一直是科技領域的熱門主題。我們看到了高準確率的人臉識別系統、戰勝人類頂級棋手的圍棋 AI、預測蛋白質結構的 AI…… 這些技術進步都曾引起大眾的震撼,也曾在各自的領域內被賦予「顛覆格局」的期待,但在通用能力上還不夠理想。
直到這兩年,預訓練大模型技術使得 AI 的通用能力往前邁了一大步。幾十億、上百億參數的模型不僅能夠迅速處理海量信息,還能理解人類自然語言的輸入、進行復雜的邏輯推理,并掌握了優秀的內容生成能力。AI 正在從特定任務的解決方案轉向具有更廣泛應用性的解決方案,或者說,有望大規模地創造價值。
比如,Stable Diffusion 背后的公司 Stability AI 推出了一項新的生成工具「Stable Doodle」。在這一工具的輔助下,從寥寥幾筆的草圖到生成品質不輸專業畫師的原創插畫,不過幾秒鐘的時間:
一場關于生產力的革命已在醞釀之中。全球管理咨詢公司麥肯錫在最近的報告《生成式人工智能的經濟潛力:下一波生產力浪潮》中指出,生成式 AI 每年可能為全球經濟增加 2.6 萬億到 4.4 萬億美元的價值。
在幾天前的亞馬遜云科技紐約峰會中,「生成式 AI」同樣是全場提及頻率最高的關鍵詞。
「如今,大模型可以在大量無標注數據中進行預訓練,實現開箱即用,以處理各種通用性問題。此外,只需相對少量的標注數據進行微調,它們就能用于特定領域的應用。」亞馬遜云科技數據庫、數據分析和機器學習全球副總裁 Swami Sivasubramanian 表示,「通過微調輕松定制預訓練模型的能力,絕對是游戲規則的改變。」
亞馬遜云科技數據庫、數據分析和機器學習全球副總裁 Swami Sivasubramanian 在亞馬遜云科技紐約峰會上發表演講
那么,對于廣闊的各行各業,這種 AI 帶來的生產力變革究竟是如何一步步發生的?
憑借過去數年的客戶需求洞察和技術積累,亞馬遜云科技將大量的 AI 能力集成到了簡單易用的產品之中,希望以最簡潔的方式將技術進步輸送到各行各業。在這場技術盛會上,亞馬遜云科技一口氣推出了七項生成式 AI 新功能。
最強的生成式 AI 大模型,在這里輕松調用
半年來,大模型之戰如火如荼。當 OpenAI 和谷歌你追我趕,迅速崛起的「開源」力量也不容小覷。可以預見的是,在未來的大模型競爭格局中,「沒有一個模型可以統治一切」。
在 ChatGPT 發布兩個月后,Anthropic 公司就迅速開發出了「最強競品」 Claude,又在 7 月初完成了 Claude 2 的升級。被稱為是「AI 社區內最強大的開源大模型」的 LLaMa,在不久前也升級為 LLaMa 2,不斷抬高開源大模型的能力上限。
正像一些業內人士所說,任何一家閉源的大模型提供商都沒有護城河。不管是 LLaMa 還是 Claude,開源大模型都顯示出了迭代速度更快、可定制性更強、更具私密性的優勢。
而這些開源大模型的力量,正在越來越多地匯聚于亞馬遜云科技的服務之中。
今年 4 月,亞馬遜云科技發布了全托管基礎模型服務「Amazon Bedrock」,以「關鍵基礎設施提供商」的角色加入了大模型之戰。
從希望應用大模型的企業角度來說,自研大模型需要數十億美元和多年的訓練,更優的解決方案是對一些已經非常強大的開源基礎模型進行定制化的微調,以滿足自身的多樣化業務需求。
Amazon Bedrock 的重要價值就在于此。這項服務可以讓所有人都可以基于已有的大模型、專用的 AI 算力和工具,再結合自己的數據開始構建生成式 AI 應用。
在最新擴展后的 Amazon Bedrock 中,匯聚了來自一批頂級大模型供應商的最新成果:
目前,Amazon Bedrock 提供了 Anthropic 最新語言模型 Claude 2、AI21 的 JURASSIC-2、亞馬遜自研的 Amazon Titan 系列模型的訪問。Stability AI 也在 Amazon Bedrock 中首發了最新版的文生圖模型套件 Stable Diffusion XL 1.0。此外,Cohere 成為了最新加入 Amazon Bedrock 的基礎模型供應商,并帶來了文本生成模型 Command 和文本理解模型 EMBED。
相比于其他的一站式的大模型服務平臺,Amazon Bedrock 的優勢在于,用戶可將其與亞馬遜云科技平臺的其余部分集成在一起,更輕松地訪問存儲在 Amazon S3 對象存儲服務中的數據,并能夠從 亞馬遜云科技訪問控制和治理策略中受益。
生成式 AI 讓云計算服務的競爭格局發生了改變,除了原有的存儲、計算、網絡等基礎設施,模型、框架和應用層面的能力提供變得更為重要。在過去一段時間,我們見到了「模型即服務」這種全新商業的誕生。如同 Amazon Bedrock 這樣的一系列平臺,正在將大模型變為直接可用的服務,幫助各行各業的用戶接入生成式 AI,撬動了一個全新的藍海市場。
推動生成式 AI 走完落地的「最后一公里」
在今天,即使生成式 AI 模型的功能已經如此強大,它們仍然無法代替人類「執行」一部分關鍵的、個性化的任務。
比如一位顧客想咨詢換貨,電商平臺的 AI 客服當然可以迅速地告知顧客想要的款式、尺碼、顏色是否還有庫存,但無法完成接下來的訂單更新或交易管理的操作。
這恰恰是「生成式 AI」轉化為「生產力」過程中非常關鍵的一步。
問題并非不能解決:模型通常可以附加 API、插件、數據庫以擴展功能,為用戶自動完成某些特定的任務。比如 ChatGPT 此前就推出了插件機制,還為開發者提供了開放平臺,允許更多用戶根據自己的需求、想法和專業能力進行擴展。
為了簡化這一環節所需的工作,亞馬遜云科技正式推出了 Amazon Bedrock Agents。
Amazon Bedrock Agents 可以擴展基礎模型以理解用戶請求,將復雜任務分解為多個步驟,開展對話以收集更多信息,并采取行動來滿足用戶請求。開發者只需點擊幾下,就能創建完全托管的 Agents:
該功能創建的對話式智能體可根據專有數據提供個性化的最新答案并執行操作,幫助企業加速交付生成式 AI 應用程序,推動解決生成式 AI 落地的「最后一公里」問題。比如,企業可以使用 Amazon Bedrock Agents 創建一個可以處理訂單的客戶服務聊天機器人,利用其內部信息(包括客戶資料和退貨政策)來定制化服務于每個訂單。
如果做個比喻的話,Amazon Bedrock Agents 就像是一個得力的助手。或許在不久的將來,我們就能享受這一功能所提供的用戶端服務:不只是顯示有哪些合適的航班、推薦口碑好的餐廳,還能直接幫忙預訂、跟進。
生成式 AI 時代的搜索技術變革
在解決大模型落地挑戰的火熱討論中,「向量搜索」和「向量數據庫」的概念開始被越來越多的人熟知。這是檢索技術層面在生成式 AI 時代正在發生的變革。
首先,伴隨數據規模的增長,關鍵詞檢索已經不能滿足需求,向量檢索可作對傳統搜索技術的補充。通過將數據表示為向量,模型可以快速分析和理解大量信息,準確地識別和匹配相似的項目。
其次,經過預訓練的大模型固然能力出眾,但也存在一些不足,比如缺乏領域知識、缺乏長期記憶、缺乏事實一致性的問題。而在數據規模不斷增長、算力日益珍貴的現狀下,向量數據庫可作為大模型的「超級大腦」,打一份小抄,相對較低的成本補充動態知識,滿足用戶不斷增長的需求。
與向量數據庫的結合,讓大模型的綜合實力增色不少。此外,向量數據庫為任何希望接入大模型的企業用戶提供了一種規避核心數據泄露問題的方法。
可以說,向量數據庫會成為未來大模型研發、落地必不可少的基礎設施之一。
對于這一方向,亞馬遜云科技早早發力,此前已上線多項支持向量的數據存儲服務,包括 Amazon Aurora PostgreSQL 兼容版關系型數據庫,兼容 PostgreSQL 的 Amazon RDS(Amazon Relational Database Service)關系型數據庫等。
在這一次的峰會上,亞馬遜云科技又推出了適用于 Amazon OpenSearch Serverless 的向量引擎。該向量引擎支持簡單的 API 調用,可用于存儲和查詢數十億個 Embeddings。
該引擎由 Amazon OpenSearch 項目中的 k 最近鄰 (kNN) 搜索功能提供支持,為客戶提供無服務器環境下的語義搜索服務。即使向量從原型設計期間的幾千個增長到數億甚至更多,引擎也能無縫擴展,無需重新索引或重新加載數據來擴展基礎設施。
順應大模型時代的廣泛需求,亞馬遜云科技還正式宣布,平臺上所有的數據庫未來都將具有向量功能,幫助客戶簡化運營,方便集成數據。
讓生成式 AI 落地多重加速
在這些重磅發布之外,為了加速生成式 AI 的訓練和應用,亞馬遜云科技已推出了一系列服務和工具。
最新動態是,兩項關鍵服務已正式可用:
其中一項服務是關于計算基礎設施,基于英偉達 H100 Tensor Core GPU 的 Amazon EC2 P5 實例已正式可用,滿足客戶在運行工作負載時對高性能和高擴展性的需求。
很多業界知名的生成式 AI 模型同時涵蓋問題回復、代碼生成、視頻和圖像生成、語音識別等功能,規模通常有千億或萬億參數,訓練時間甚至長達數月。這勢必會成為普遍影響生成式 AI 落地速度的因素之一。
與上一代基于 GPU 的實例相比,Amazon EC2 P5 實例使得訓練最高提速 6 倍,曾經的幾天訓練時間可縮短到幾小時,幫助客戶降低高達 40% 的訓練成本。
另外一項服務是有關于開發工具。去年,亞馬遜云科技推出了 AI 編程助手 Amazon CodeWhisperer 預覽版,獲得了開發者的高度關注。數據表明,與未使用該編程助手的開發者相比,使用者完成任務的速度平均快 57%。
現在,Amazon CodeWhisperer 已經正式可用,并且實現了與 Amazon Glue 的集成。
從此以后,開發者可以用自然語言編寫特定任務,Amazon CodeWhisperer 會直接在 Amazon Glue Notebooks 中推薦一個或多個可完成此任務的代碼片段,用戶可以選擇「接受最推薦的建議」、「查看更多建議」或「繼續自己編寫代碼」。
也就是說,即使完全不會寫代碼,你也可以嘗試用「說人話」的方法構建出完整的應用程序。
寫在最后
技術的發展往往超乎人們的預設。曾幾何時,研究者們還需要花費數月的時間進行數據準備、數據處理和模型訓練,不得不投入極其高昂的成本,只為了完成某一項特定的任務。
今天,生成式 AI 已經能夠給出與人類創作無法區分的內容,處理此前 AI 并不擅長的知識性工作和創造性工作。行業的壁壘在某種程度上被打破、重構,一場由生成式 AI 引發的生產力革命正在發生。
通用人工智能(AGI)是否真能實現?想必現在,已經不會有人再站出來表示質疑。
在這場浪潮中,亞馬遜云科技選擇的路線是做好「關鍵基礎設施提供商」的工作。它的優勢在于過去 20 年在人工智能技術上的深厚積累,在于對于超過 10 萬家客戶的深刻理解,在于打磨多年的高可用、強大的基礎設施。這些都會有力地推動亞馬遜云科技加快生成式 AI 落地的征程,幫助到每一位開發者或創業團隊。
我們能看到的是,在一系列面向生成式 AI 的基礎設施和開發工具源源不斷投入應用之后,大模型落地的門檻被打了下來,開始走向各行各業的深處。
這場生產力革命,顯然已經在加速了。