生成式AI掀起巨大聲勢,而它自身也不斷展現出越來越大潛力。比如讓AI自動設計芯片,或者讓AI給人看病。
為搶占領先地位,趨之若鶩的企業不僅使出渾身解數,釋放自身技術力,AI模型也越做越大,以達到力大磚飛的效果,實現智能涌現(emergence)。
科技部新一代人工智能發展研究中心的《中國人工智能大模型地圖研究報告》顯示,迄今為止,中國已發布79個10億參數規模以上的大模型,大模型之戰逐漸步入后半場,更多人開始關注大模型與實體產業的結合上,企業也接連展示其產品的應用場景。
但平心而論,原本使用傳統AI技術的應用,真的需要使用大模型嗎,什么樣的大模型才是行業所需的?華為開發者大會2023(HDC.Cloud 2023 )上,華為云展示其在“AI for Industries”、盤古大模型方面的最新進展,并提出讓AI重塑千行百業。
行業大模型成新風向
任何企業都不想在大模型熱潮中掉隊,你方唱罷我登場,近幾個月每隔幾天都會有一個大模型的新聞。市場輪轉下,企業已紛紛從搶占先機,上馬通用大模型,逐漸謀局落子,轉向行業大模型,盡顯自家產品實用性,其中不乏實機演示和方案展示。
大模型之所以被大眾所熟知,是因為ChatGPT這樣to C的產品,讓人實實在在體會到技術的價值。實際上,大模型的關鍵不在于有多大,或是通用能力有多強,而在于能不能解決現有應用的問題,只有立足應用本身,重塑千行百業,改善提升人們生活品質,才能被人所接受。
縱觀全球,因算力成本高昂、信息泄露、政策監管等挑戰,大模型的to C商業化進程更為緩慢,大多企業選擇務實地面向to B端企業客戶落地,滿足特定行業場景所需要求。可以說,做行業大模型已成普遍共識。
傳統小模型AI通常只能執行特定任務或特定問題,對to B行業而言,大模型不僅可以將傳統系統信息串聯在一起,還可實現更為復雜的決策和規劃。
但做行業大模型談何容易,許多想要應用AI的企業,最終都只能作罷。
首先,企業業務場景復雜,且多數需定制化,要對文本、圖片、音頻、視頻、機理等多樣化任務進行處理,與之相悖的是,大多企業稀缺數據樣本。
其次,大模型是燒錢的游戲,不僅要在訓練階段使用千卡起步的大算力,還需技術力極高的專業AI應用開發人才。
最后,數據和知識是企業核心資產,需保證企業數據的隱私安全及合規。
專業的事,就應該交給專業的人來做,大模型亦如此,而不是讓企業與去制造螺絲、軸承、齒輪這樣的基礎性工作。
華為云作為早在2021年就發布盤古基礎大模型的企業,在大模型領域絕非新手,彼時便以AI工業化為目標。而到今天,華為云正式發布盤古3.0和昇騰AI云服務,成為中國首個全棧自主的AI大模型,堅持AI for Industries方向,讓AI和各行各業深度結合。
就如華為常務董事、華為云CEO張平安發所提到的,盤古大模型不作詩、只做事,聚焦行業場景,致力于深耕政務、金融、制造、煤礦、鐵路、制藥、氣象等行業。
以大代小引發的改變
事實上,大模型早已脫離講概念的階段,而是正在悄然改變生活中的一切。
氣象與人類密不可分,而它也為我們的發展之路上帶來許多損害。就比如,每年,全球大約會生成80個臺風,其中影響西北太平洋和南海的大約有25個,平均有7個會登陸我國。2022年,臺風災害造成的直接經濟損失54.2億元。
傳統氣象預測多采用HPC高性能計算機計算,如要預測臺風未來10天路徑,需在超級計算機上,利用超過3000個節點的超級計算機上花費數小時進行仿真。隨著算力增長趨勢和物理模型復雜化,傳統數值預報瓶頸凸顯。
盤古氣象大模型則只需單機單卡,10秒內就可完成一次氣象預測。它是全球首個精度超過傳統預報方式的AI模型,可在秒級時間內完成一個臺風未來10天的路徑,臺風路徑預測準確度世界第一,相比歐洲氣象局提升約20%。
同樣的改變,發生在制藥領域。
抗生素曾挽救無數人生命,但自1987年達托霉素被發現以后,人類已有近40年沒有發現新的抗生素。耐藥性不僅會威脅每個人的身體健康,還可能會導致到2030年GDP每年下降至少3.4萬億美元,使2400萬人陷入極端貧困。世界急需全新類別的抗生素,改變病人面對“超級耐藥菌”感染時無藥可用的局面。
研究一款新藥談何容易,一直以來,新藥研發難逃“雙10定律”魔咒,即平均成本超過10億美元、研發周期大于10年。不止如此,這還是最佳的業態,現實中一款新藥從研發到獲批上市,平均需要10年~15年時間,耗費超過26億美元,且臨床成功率不到10%。
華為云盤古藥物分子大模型采用全新深度學習網絡架構,生成了1億個100%結構新穎的類藥小分子庫,相比傳統方式,成藥性預測準確性可提升20%。
西安交通大學第一附屬醫院劉冰教授在新藥研發中采用基于華為云盤古藥物分子大模型打造的AI輔助藥物設計服務,研發出一款超級抗菌藥Drug X(肉桂酰菌素),有望成為近40年來首個新靶點、新類別的抗生素,并將先導藥的研發周期從數年縮短至一個月,研發成本降低70%,打破醫藥界“雙十定律”。
被改變的,不止是患者。
幽暗的礦山之下,是工人的人生。下井工人長期處于高危高壓環境,不僅被死亡陰影所困,更是伴隨著一生的傷病。但與之相悖的是,當前300米井下仍需大量人員現場作業,他們更需技術的人文關懷。
AI就是保障井下作業安全的好手,能夠讓不確定的人工流程多一個好幫手。然而,要AI進入煤礦行業并沒有想象那樣簡單。井下作業環境惡劣,對圖像、視頻識別精度要求高。況且,礦山與礦山間差別大,現場作業情況復雜,模型不可能簡單復用。同時,煤礦行業缺乏高素質的人工智能人才。
盤古礦山大模型只需導入海量無標注的礦山場景數據進行預訓練,即可進行無監督自主學習,一個大模型就能覆蓋煤礦的采、掘、機、運、通、洗選等業務流程下的1000多個細分場景,能夠實現全時段巡檢,幫助工作人員及時發現問題,避免因漏檢造成的安全事故,縮短停機時間,同時提升井下巡檢人員的工作效率。目前,它已在全國8個礦井規模使用。
無數大中小城市因鐵路而串聯,迄今為止,我國鐵路營業里程15.5萬公里,鐵路貨車超過100萬輛。隨著我國鐵路安全水平提升,很多故障已極少發生,多數人都沒有見過,但故障一旦發生通常都是大故障。比如搖枕心盤脫出,全國范圍內只找到一張故障樣本。
安全的背后是無數人的辛勞。受制于技術發展,當前廣泛采用的TFDS(貨車運行故障動態圖像檢測系統)仍采用人工方式進行故障識別。以某樞紐站5T檢測車間為例,日均檢車近800列4萬余輛,TFDS系統拍攝圖片280萬余張,列檢員每天需檢查大量極其類似的圖片,且需在5秒左右的時間及時發現細微的差別,找出列車存在的故障。
通過盤古大模型,原來人工需要識別4000張圖片,現在僅需要復檢170多張圖片,工人勞動強度下降95.75%。實際應用中,能精準識別67種貨車430+種各類故障,重大異常故障100%識別,無故障圖片篩除率高達95%,超過客戶預期。
這樣的例子不勝枚舉,事實上,每次使用一網通辦業務,每次使用智能產品的背后,或許都是大模型的功勞,我們也一直在直接或間接地享受到技術升級所帶來的紅利。
盤古大模型又有何不同
如今的大模型領域,依然熱得發燙,國內選手上演了一出”百模大戰“,其中不乏實力強勁的互聯網大廠,那么盤古大模型又有什么差異化優勢?
首先,華為云在AI領域已有數百個項目,并堅持AI for Industries,結合自身超過30年行業積累經驗及10余個行業軍團持續場景深耕,將行業客戶和伙伴沉淀的豐富的Know-how與大模型進行融合,讓大模型具備行業知識與經驗。
其次,盤古大模型除了學習大量通用知識外,還學習了10多個行業公開數據,涵蓋金融、政務、氣象、醫療、健康、互聯網、教育、汽車、零售等。
更為重要的是,盤古大模型從底層芯片到全流程平臺都實現了自主創新。要知道,AI熱潮中,GPU已成為炙手可熱的香餑餑,但在地緣政治摩擦和供貨短缺多重影響下,部署高性能計算卡只會困難重重,因此,自主創新已成行業普遍共識。
回顧盤古大模型歷史,是不斷滿足行業需求的過程。2020年3月,田奇加入華為云后便開始組建團隊;2021年4月,盤古大模型正式對外發布,包括NLP大模型和CV大模型;2021年9月,華為云發布科學計算大模型和藥物分子大模型;2022年6月,華為云發布盤古礦山大模型;2022年11月,華為云發布氣象大模型。
時間回到現在,華為云正式發布盤古大模型3.0,同時發布政務、金融、制造大模型。大模型在前一陣子異常火熱,為什么華為云要選擇這個時間點公布盤古大模型的進展?
事實上,華為云在面對產業新技術和新趨勢時,優先考慮的都是行業需求,只有當技術做得足夠成熟才會向市場推行新技術。而從盤古大模型3.0上來說,此次華為云更為明確了其產品在工業上的定位,整合了以往的大模型,重新梳理架構,并通過新的大模型把這張網拉的更大,以覆蓋到每一個行業。
華為輪值董事長胡厚崑在日前的2023世界人工智能大會上也強調,人工智能的發展,關鍵是要“走深向實”,賦能產業升級。當前階段,華為在人工智能發展上有兩個著力點:第一,打造強有力的算力底座,支撐中國人工智能產業的發展。第二,從通用大模型到行業大模型,讓人工智能服務好千行百業、服務好科學研究。
盤古大模型3.0采用分層設計,包括5+N+X三層架構:5大L0層基礎大模型提供各種通用技能,N個L1層行業大模型幫助企業打造自己的大模型,海量L2層場景模型專注于具體應用場景或特定業務,為客戶提供開箱即用的模型服務。
算力是大模型的食糧,訓練過程中,盤古各個系列大模型幾乎都需要幾百張、甚至上千張昇騰芯片訓練,昇騰AI云服務則是盤古大模型的底座,為它提供堅實的基礎。
華為云單集群達2000P Flops算力的昇騰AI云服務在烏蘭察布和貴安同時上線,采用天成液冷平臺的華為云數據中心能夠保障千卡訓練30天長穩率達到90%,斷點恢復時長不超過10分鐘。
“為了幫助全球客戶、伙伴、開發者訓練和使用大模型,我們致力于為全球客戶打造世界AI另一極,為所有AI開發者提供新的選擇”,張平安如是說。
對很多企業來說,數據安全合規是首要考慮因素,盤古大模型除公有云部署模式,可進一步提供大模型云專區,建立云專屬資源池供大模型訓練和推理,確保數據安全合規。對于更嚴格數據本地化要求,還提供混合云部署,幫助客戶在自己的私有化HCS上訓練大模型。
一款產品,好用才是關鍵。華為云提供了易用可靠的大模型工具套件、匯聚海量多行業場景API的開天aPaaS,以及包含豐富優質課程和技術認證的大模型專屬社區,以幫助開發者快速開發。
誠然,技術本身是革命性的,但對盤古大模型進入千行百業這件事,仍然需要給它時間在行業中生根發芽。
正如AI四大天王之一的Andrew Ng所說,“很難想象哪一個大行業不會被人工智能改變。大行業包括醫療保健、教育、交通、零售、通訊和農業。人工智能會在這些行業里發揮重大作用,這個走向非常明顯。”未來,每個行業或許都會由各個行業大模型所改變。