【ITBEAR】10月28日,由微博、新浪新聞聯合主辦,清華大學經管學院EMBA傾力支持的“新浪新聞·2024探索大會”在北京舉行。華為云Marketing部總裁董理斌分享了題為《解難題,做難事,AI重塑千行萬業》的演講。
華為云Marketing部總裁董理斌——主題演講
以下是董理斌先生演講實錄,內容經編輯略有刪減:
先生們、女士們,大家下午好。
華為云在去年發布盤古大模型的時候,提出來“解難題做難事”,目標是希望通過解行業難題,能夠讓AI的能力,AI的技術,普惠到我們各行各業。
今天好幾位嘉賓提到了諾貝爾獎這個事情,我想在座的很多人和我可能有類似的想法。當諾貝爾物理學獎頒發給AI科學家,心里想為什么把物理學獎頒發給AI的科學家。但是看到這個化學獎也頒發給AI科學家的時候,我想在座的諸位可能跟我一樣,意識到今天無論是在我們企業界,還是在我們的科學界都已經深深地認識到AI將重塑千行萬業,改變我們的生產生活的方式,也會改變我們科學研究的方式。今天我也是想借助探索大會這個機會,分享一下華為云和我們的客戶伙伴,在AI領域里面的探索的一些創新實踐。
首先是在新藥發現領域。其實相對于其他的疾病,包括我們談之色變的腫瘤,細菌感染而導致的人類死亡的人數是遠遠超過腫瘤的,如果說有一天,人類能夠攻克細菌感染,就有可能極大地提升我們人類的壽命。
治療細菌感染對應的藥是抗生素,大家都知道青霉素,它是我們人類科學家發現的第一支廣譜抗生素。由于青霉素的發現,使我們人類的壽命普遍提升了至少20歲。大家看我上面分享的圖,其實在最近這40年間,人類都沒有發現新類別的廣譜抗生素,大家可以看到,有一些大家可能不是很了解的超級細菌,如鮑曼不動桿菌,用青霉素治還治不好,它對我們人類有很大的影響。
新的抗菌藥應該怎么研發?西安交通大學第一附屬醫院的劉冰教授團隊,通過噬菌體入侵細菌的機制研究發現了全新的抑菌機制,同時找到了殺死細菌的新的靶點。這個靶點大家可以理解成,要把細菌攻克,就像是要在細菌細胞壁上找到一個“鑰匙孔”,這個鑰匙孔就是靶點,但是你還要找到一個“鑰匙”才能把它打開。找到靶點已經很難得,還要找一把鑰匙出來,過去需要通過大量的科學實驗,大量的推理才能夠最后找到。
劉冰教授團隊通過盤古大模型,學習了17億種小分子化合物的化學結構,然后生成了1億種新的小分子化合物,再用盤古大模型進一步進行藥物的篩查。我們和劉冰教授合作,把藥物要求,比如說一系列的特征設定到篩選條件里面,通過盤古大模型,在1億種小分子化合物里面篩選出來100種作為候選。劉冰教授團隊就從這100種的前10種中挑出4種,然后進行化學的合成,然后才發現了這樣一個新的藥物。這個藥物名稱叫肉桂酰菌素,它有可能是我們人類發現的,近40年來首個新類別、新靶點的一款廣譜抗生素,它將會對我們的身體、生命健康起到極大的作用。
另外一個案例想給大家分享,就是氣象預測。當前主流的氣象預報模式是通過數值計算,這種大氣流體力學的方程是極為復雜的,差不多有1000多行的方程,所以需要用超級計算機來進行方程求解。
AI提供了另外一種預測方式。我們中國有一句俗語,“看云識天氣,朝霞不出門,晚霞行千里”。過去人們預測天氣是通過看到的一些天氣現象,總結其中的規律,然后得出對天氣的預測。AI現在能夠做到什么?我們將過去40年的氣象數據,通過AI進行學習。比把整個地球的大氣分成13層,每一層上面的每一個點,包含了這個點的高度、溫度、濕度、氣壓等等這些參數,都輸入到大模型里面進行學習,然后通過神經網絡進行計算。我們發現通過這種AI預測天氣的方式,改變了過去的傳統數值計算方式。過去大家可以看到,預報一個臺風未來7天的路徑,起碼需要三四個小時,現在用這種AI的大模型推理,幾秒鐘就可以推理出來。
這里給大家分享的就是華為云和深圳氣象局的合作。深圳氣象局基于盤古氣象大模型開發了區域預報模型智霽。我分享的這幾張圖,就是對今年摩羯臺風進行預測的結果。從預測可以看到,黑色這條線是“摩羯”臺風的實際路徑,紅色就是盤古和智霽的預測路徑。大家可以看到,相對于歐洲氣象中心,以及美國氣象中心的預測,盤古和智霽能夠極為精準地預測到臺風移動的方向,包括臺風可能登陸的地點。這邊是深圳氣象局當時用智霽預測的結果,從臺風生成開始就預測這個臺風將靠近粵西和海南。前兩天去迪拜,迪拜這種干旱的地方,也可以通過AI預測人工降雨的條件,對大氣環境污染也可以用這些模型。從這些例子我們看到,AI逐漸在我們的生活、工作、科研都在產生影響。
除了藥物研發和氣象預測這兩個領域,大家也可以看到, AI正在重塑千行萬業。比如說我們在煤礦,可以通過AI進行遠程的異物識別,使工人可以遠程操作。在武漢高鐵動車段,過去需要大量的人工檢測,因為高鐵要保障絕對的安全,工人每天晚上都得檢測,現在可以通過AI+機器人來輔助工人進行檢測。另外在港口、鋼鐵等等一系列場景中,大家可以看到AI正在幫助我們各行各業打開新的解題方式。華為云最近也提出“從現在開始構建AI原生思維”的理念,中國有一個很核心的優勢,并不僅僅是在算力、算法方面,我們有無窮無盡的場景,我們可以把各個場景開放出來,和AI結合,我們就會找到更優的解題之道。
華為云能夠給我們的客戶、伙伴、開發者提供些什么?首先我們能夠提供AI-Native的云基礎架構。大家可能會看到,現在已經有千億參數大模型、萬億參數大模型,甚至有更高的10萬億參數大模型等等。但是大家想一想,這個模型怎么訓練出來的,它到底是用100張卡組建一個集群來訓練最優,還是是200張卡、1000張卡最優?這些計算的資源,無論是CPU、GPU、NPU,要可組合,可以把它們組合起來,實現一個最優的訓練方案。華為云提供了CloudMatrix架構,把過去的主從架構轉化成全分布、全池化的架構。通過全分布、全池化的架構,就會使得你需要多少的計算資源,就能提供多少計算資源;需要多少的存儲資源、內存資源,就能提供多少的內存資源,所以我們把它叫作“一切可組合、一切可池化、一切皆對等”的AI原生云基礎設施架構。
基于這樣的架構,華為云還提供了昇騰AI云服務,支持大模型的長穩訓練。過去訓練千億參數的大模型,兩三天可能就要中斷一次,現在可以做到40天不中斷,幫助大家加速AI的開發、模型的開發。
華為云在中國有三大核心樞紐節點,分別在內蒙古烏蘭察布、貴州貴安、安徽蕪湖。現在三大樞紐節點都已經升級到AI的算力中心,能夠在全國提供30毫秒的低時延,無論你在哪里,你只要接上去,就可以使用充足的、澎湃的算力。
與此同時,我們經常提到AI for Science、AI for industries,AI能夠幫助我們重塑千行萬業,提升生產效率。為了幫助客戶打造自己的大模型,華為云還提供了豐富模型的訓練工具,使模型開發、應用的開發更加的簡單。
今天我想稍微著重講一下數據這一塊。當企業訓練模型的時候,第一個是數據的質量很重要,第二個是數據怎么“喂”給模型做訓練。企業要把數據做標注,為了讓這個數據訓練以后能夠成為所在企業的知識庫,要制作大量的問答對,這些事情如果是我們人工來做是很痛苦的。今年華為云對DataArts數據治理生產線進行升級,希望能夠幫助企業構建以知識為中心的數據底座,通過這種工具進行標注、重新數據治理了以后,直接可以轉化成大模型可以學習的知識,這樣企業再訓練自己專有的大模型,或者說優化自己AI的應用,就像是插上了飛翔的翅膀。
最后,很多中國企業都希望有一天,一方面服務好國內的客戶,一方面也能夠走到海外去。華為云在過去的一年,相繼在沙特、土耳其、埃及等地開服,今年還將不斷新增一些海外節點,希望大家無論走到哪里,都可以用華為云上創新的服務,去構建自己企業的數字底座,去實現自己產品的創新、技術的創新。
我們希望和大家一起,讓云無處不在,讓智能無所不及,共建智能世界云底座,謝謝大家!