11月27日,在2022全球人工智能技術大會上,由CAAI智能傳媒專委會、中國傳媒大學媒體融合與傳播國家重點實驗室、新浪AI媒體研究院聯合支持的“融合與發展”新智者·智能媒體專題論壇在線上舉行。華為云副總裁黃瑾在本次專題論壇上,與來自業界、學術界的嘉賓們分享了《華為云持續創新,釋放數字生產力》的主題演講。黃瑾認為,當前行業正在從移動互聯網進入虛實融合的3D互聯網的時代,媒體產業將迎來蓬勃的發展機會。
圖注:華為云副總裁黃瑾-“融合與發展”新智者·智能媒體專題論壇
以下為黃瑾演講實錄,內容經編輯略有刪減:
黃瑾:尊敬的各位領導,各位朋友,大家好,非常榮幸有機會參加本次會議。我在華為云負責戰略與產業發展工作,今天的主題是《華為云持續創新,釋放數字生產力》。今天我將分享兩個方面的內容,首先來看一看人工智能領域的創新與實踐。人工智能已經應用到了華為自身業務的所有主業務流程中,目前已經有超過900多個場景的應用,如銷售、研發、制造、供應鏈等等,創造了相當于增加了12,000名數字員工。
舉個例子,在供應鏈領域,華為的業務遍布了全球170多個國家,有190個中心倉引入了AI之后,實現了貨量預估的準確率提升70%,訂單履行周期下降76%,在很多的業務環節都可以使用AI來提升效率。比如智能裝箱、OCR單據識別等等。在運輸的環節,通過路徑智能優化,就可以降低車輛租賃成本約35%。在裝箱的環節,華為有8000多種各種各樣的包裝箱,有30多種車型,引入了AI的裝箱算法之后就可以讓每輛車的裝載效率提升很多,每年可以節約近1億人民幣。
從華為的實踐來看,我們有幾點體驗和心得。第一,AI已經完全具備進入所有主業務流程的能力。第二,選擇價值場景非常重要,一定要沿著業務流程來識別業務對象和價值場景,尤其是要關注海量重復復雜的場景,效果是最好的。第三,業務部門的深度參與,甚至是業務部門牽頭是項目成功的關鍵。
同時,要成功的應用好人工智能,需要實現場景、算法、數據、算力四位一體。
在華為云應用AI來服務外部的客戶,我們也進行了大量的實踐和積極的探索,感謝所有的客戶和伙伴的支撐。那么主流的應用場景已經涵蓋了,醫療、氣象、智慧工業、互聯網、智能媒體、城市治理、科研探索等等,已經超過了800多個項目的實踐。其中30%的項目已經進入了客戶的業務核心系統,凡是能夠用AI進入業務核心系統的客戶,平均盈利能力提升約18%。
下面我們將重點介紹幾個案例,在醫藥行業,華為云研發了盤古藥物分子大模型,大家知道新藥的研發工作風險非常大,周期長、成本高,醫藥界存在一條“雙十定律”,即一款新藥從研發到上市,平均成本超過10億美金,研發周期大于10年。即使如此,大約也只有10%的新藥能被批準進入臨床期。那么在抗生素研發領域,甚至有的藥物剛進入臨床階段,細菌就已經產生了對其的耐受性。我們和西安交大合作,西安交大一附院劉冰教授,他帶領團隊在抗生素領域采用了華為云的AI盤古藥物分子大模型,來做AI輔助藥物設計,突破性的研發出超級抗菌藥,突破了業界這個雙十定律,將先導藥的研發周期從數年縮短到了一個月,研發成本降低70%。
在知識計算這個領域也是一個新的創新領域。知識計算就是用AI的技術來實現,機器將知識轉化成可計算的模型。在石油勘探領域,華為AI的知識計算顯著地降低了從業門檻,傳承了專家的知識經驗,提升了油氣識別的效率。油田勘探是一個復雜的過程,高度的依賴人員的經驗。
例如,對數千米以下的地下構造和油藏特點進行準確判斷是非常困難的,需要對大量的信息進行綜合的計算,需要經驗非常豐富的專家來做準確的分析。那么華為云將測井領域的知識圖譜中實體關系屬性表達成向量的形式,并構建深度的神經網絡。油氣層識別效率比傳統的方法提升了5%,同時節約了專家約70%的時間,并提供智能推薦的能力,為決策層提供了更好的依據。大港油田將知識計算應用到超過900口的油井,實現了油氣水層位的智能識別,平均時間縮短了70%,識別準確率達到了解釋專家的水平。
我們看看焦化領域,焦化企業80%左右的成本在配煤。焦炭的質量與輸入的各種因素關系非常復雜,當前配煤比例主要是依賴技術工程師的人的經驗,很難做到精準。那么,在配煤主業務場景,AI就可以給客戶帶來更大的價值。例如鞍鋼通過機理模型和AI模型的融合,構建高精度焦炭質量預測模型,預測焦炭的質量,優化配比耗時縮短至10秒以內,焦炭的質量預測準確率在98%,平均煤的成本可以降低5-20元每噸。如果年產量超過200萬噸的焦煤,就可以節約成本上千萬人民幣。
煤礦行業,通過AI的大模型,能夠圍繞著安全生產、工業優化、決策指揮、經營管理等場景進行全方面的優化,可以實現智能化,減少事故,大幅提升生產質量和效率。例如,在山西沙曲礦離線驗證精煤的產量預計提升0.2%。山東能源濟二煤礦啟動驗證,按每噸精煤700元測算,預計落地收益達到1.96億人民幣。還有煤礦的現場管理是非常重要的,煤礦現場同樣能通過AI來優化。
在智能汽車領域,通過應用華為云的知識計算,一汽紅旗的4s店,一次性修復率提升了4%,客戶維修等待時間下降了23%,廠家支持介入率下降了30%,維修技師的培養時間縮短了30%,客戶反饋從過去的人找知識變成現在的知識找人,可以幫助員工快速的成長,成為領域的專家,推動了集團的知識化轉型。
我們再看看城市治理,目前很多的城市都整合了熱線系統,統一到12345,那么,華云的AI應用到了上海、廣州、長沙、貴陽、湛江等很多城市的熱線整合過程中。以上海的12345熱線為例,這條熱線的響應速度現在非常的快,而且能回答的問題非常的多。這是因為該系統去年開始就引入了人工智能的技術,用到了自動派單,語音識別,甚至有情緒感知等功能。有了這些技術的加持,整個熱線的服務速度加快了,過去一張單要好幾分鐘的時間,現在幾秒鐘就搞定了,同時這些單的分發更加智能,客戶的滿意度得到提升。
除了效率提升和滿意度提升之外,這條熱線變得越來越智能,甚至可以主動的預測風險事項。例如:寒潮來了,哪些地方的水管爆裂,會提提前做出預測,讓城市部門做好更好的預案,快速處理。得益于AI的加持,不僅是熱線的服務效率提升了,也讓市民感受到了城市管理的溫度。除了生產效率改進之外,我們認為 AI也可以讓世界變得更加美好。
接下來,我給大家分享智能媒體創新的實踐。過去10年移動互聯網的時代,整個視頻用戶增加超過了10億,已經非常接近于我國的人口總數。當前行業正在從移動互聯網進入虛實融合的3D互聯網的時代,媒體產業帶來蓬勃的發展機會。
2025年全球VR設備出貨量將超過1億臺,AR的設備預計會達到5,000萬臺,應用于B端的數字人預計超過300萬,C端以10億來計。未來幾年,我們可以看到3D的內容和應用會帶來萬億美金的市場,但是在這個大市場的背后,仍然有非常多的制約性的技術問題,這些問題需要我們一起去探索去解決。
第一個問題,視頻是內容為王的。但是目前面臨的最大問題是精品的內容還是比較少,制作周期非常的長,產能低,整個中國傳統的長視頻產量年可以達到5萬個小時。反過來我們看到優質的VR視頻內容,每年產能還不到100個小時。在游戲領域熱門的VR游戲《節奏光劍》在全球售出僅有500萬份,但大家都熟悉的2D游戲《王者榮耀》日活就過億了,在華為應用市場下載就超過39億次,那么這是幾個量級的差別,為什么會有這樣的差別?
除了終端的普及率和體驗之外,核心問題是整個3D音視頻制作的效率太低了。好的內容生產周期要18個月,甚至是24個月,這就導致內容的供給非常的弱,制約了整個產業的發展。
第二個問題就是我們有內容制作,有直播,但當前最大的問題是網絡技術,還有一些結構性的問題需要去創新、去解決。
大家現在看一個短視頻,一般是720p、1080p一般最多需要5兆bps,但是我們看VR至少需要30兆的帶寬,而精品的VR甚至到到百兆。所以,我們談元宇宙,我們判斷以后最少需要300兆,甚至要到一個G的帶寬。從時延的角度來看看,一個普通視頻時延可能不是問題,但是VR如果時延大于50毫秒,就會有很強的眩暈感。那么我們看到這個帶寬需要百倍千倍的提升,時延50倍以上的提升來降低時延。所以,單靠5G光的技術是解決不了的,這個時候需要網絡架構上的創新,云、網、邊端的協同來解決這些問題。
華為云如何來不斷的創新來釋放媒體產業,更多的是數字生產力。今天我們重點探討兩個方面的內容。一個方面就是華為云能夠提供四條場景化的管線,影視綜藝后期管線、云上智能直播管線、虛實融合內容管線、云上虛擬互動管線來幫助大家做媒體內容生產的時候更加高效。
第二就是我們講講有六個方面的技術創新,使我們有更好的體驗。
首先我們看看影視綜藝后期管線,這個管線從DIT開始到制作成片結束,通過云上的制片系統、制作系統、云桌面、云渲染以及相關的計算存儲的能力,使能整個制作團隊從解決大素材上云開始,通過云上編碼實現素材的套剪,通過華為影視工作站級的云桌面,解決藝術家隨時隨地的可以創作與剪輯,素材安全的保存,云上協同的審片,快速的渲染等等。那么,AI的應用可以大幅提升藝術家的工作效率,包括老舊素材的修復、上色、搜索、字幕生成、多軌合板,不良藝人與競品的擦除等等,讓我們的藝術家從繁瑣的重復勞動中釋放出來,更加聚焦于藝術的創意。
第二個是云上的智能直播管線,針對直播的需求,如高碼率、高色域、融媒體、播控、5G直播等等,以及一些智能互動的直播場景。采用多地互動,AI導播切換,AI畫面優化,虛擬場景等等。華為云上構建了智能直播管線,輕量化的處理,采用5G技術加云上IP壓縮流,代替傳統的SDI線路,降低了傳統直播的轉播車依賴,極大的提升了媒體從業人員的單兵作戰能力,引入更多的IP化終端,如手機、無人機、VR自由視角矩陣等等,提升了直播設備的豐富性與多視角。專業的云上導播配合各種云端生產的開發 kit,如AI切換、虛擬場景制作、3D特效包裝等等,給傳統導播能力升級換代。通過RTC的技術將直播引入雙向轉動能力,極大的延伸了直播業務形態和打破地域的限制。
第三虛擬融合的內容管線。在虛實融合的時代,數字內容的制作方式,從攝像機實拍轉向3D內容的建模、仿真、渲染,主要制作的內容就是數字人、數字物、數字場景。
精品的數字內容生產實際上面臨了非常多的挑戰,例如《阿凡達》當年從制作到成片花了5年的時間,有48家公司,超過1800多個特效人員,使用了超過4萬多盒的CPU用于內容制作和特效渲染,很明顯這個行業需要更加便捷的工具。
華為云的云上數字內容生產線,擁有百萬盒的渲染資源,將影視制作的拍攝、剪輯、建模、綁定、驅動、渲染、合成到分發的全流程,在云上進行了重構,實現了流程自動化。全球的影視創作者可以無縫協作,高效協同,大幅提升制作效率,讓大片內容制作周期從數年可以縮短到幾個月。
第四是云上的虛擬互動管線。傳統的會議、培訓、展會、會談在未來會有很大的變化。例如沉浸式的體驗,更加的實時互動模式。
實際上我們看到周邊的工作和生活已經有越來越多這樣的例子,例如云上虛擬會議,可以提供包括會議、培訓、峰會、宣講,讓參會人員以數字人的方式進入虛擬場景,全新的體驗。例如云上展廳現在越來越流行,可以將實際的物理展廳搬到云上,隨時隨地可以參觀,可以提供更加互動的參展方式,遠程的接待海外的客戶對我們來說非常有用。在疫情期間,我們華為利用這個能力,實際上接待了非常多的海外客戶。
接下來,我們重點看看技術點上的創新,第一個是云網邊端的協同。在未來的虛擬融合的世界需要通過分布式的云,通過全球一張網連接無數虛擬數字空間,在數字空間中有社交、工作、娛樂,同時通過彈性的調度,將海量的用戶分配到全球不同的數字空間中,實現消息交互框架能夠支持上億次每秒的交互,交互時延低于20-50毫秒,這就是云網邊端協同的價值,可以達到虛擬人、虛擬空間,真實人、真實空間,進行實時的交互和互動,最終實現萬人同服的數字體驗。
第二是數字人大腦。讓數字人真正的智能化,AI是核心。我們稱之為數字人大腦。通過AI的逐步應用,讓數字人越來越聰明。首先是表情和肢體的控制能力,其次是記憶和學習能力。通過AI的大模型讓數字人驅動,由專業動捕面捕驅動,眼睛到無中之人的自我驅動。同時通過云上的記憶和存儲,通過大模型知識訓練,讓數字人學習到不同的知識和技能,甚至培養獨特的個性魅力。
第三是區塊鏈的能力,為了快速跨越產業裂谷,我們需要從傳統的線下生產模式走向集約化協作共享的生產方式。我們聯合合作伙伴打造了面向媒體產業的數字資產聯盟鏈,讓原來每個工作室的數字資產在云上可以安全的分享和流轉,從而激發整個行業的創造力。
第四是云上的渲染,萬核渲一圖以及AI加持的渲染。我們知道《阿麗塔:戰斗天使》的特效非常好,阿麗塔的一只眼睛比《魔戒》中咕嚕全身的像素都高,這背后《阿麗塔》平均每一幀需要100個小時來渲染,總計用了超過4億個小時的渲染時間,是《阿凡達》的三倍。
所以,渲染是創造高品質數字內容的基礎。華為云借助云上的海量算力、高效存儲、快捷網絡和彈性調度,可以實現萬核渲一圖,例如《流浪地球》用5,000萬美金的費用拍出了媲美好萊塢幾個億的大片的效果,其中就有華為云和我們伙伴的貢獻。
那么,我們也推出了MetaEngine,這是華為自研的圖形引擎。通過將云AI和計算機圖形學相結合,可以大幅的提升渲染的效率。以一部90分鐘的3D電影為例,原來在線下渲染大約需要6個月,使用我們部在烏蘭察布的這個云渲染服務,可以降低到兩周完成,如果進一步使用了我們的MetaEngine只需要7天。
第五個是多模態標簽。基于AI的盤古多模態大模型,可以從視頻、人像、語音、文字等多個模態自動輸出對應的標簽。也就是我們放一段視頻之后,我們就可以自動的形成非常多的標簽,然后開始來做場景的編目,智能的檢索、歸檔和推薦。傳統的方法可能需要3-6個月的時間才能完成一套自定義的標簽體系。
由于盤古多模態大模型已經學習了100億對的數據,支持萬級別的數據標簽,所以很容易快速自動的形成客戶需要的標簽體系。這個服務已經開始友好客戶的試用,例如億幕科技、銀河威爾、貴州多彩新媒,GITV等等。其中天合智造通過AI多模態智能標簽識別,實現了對視頻智能剪輯,包括智能生成封面、視頻拆條、人臉替換、目標擦除、智能剪裁等等。
第六是自由視角。大家看這個圖的左邊的子彈時間是用戶可以在終端上切換第一視角,而右邊的時空凝結是我們一般導演可以控制視角,給大家展示更好的全景視角。
自由視角已經在湖南臺、央視等多個項目中參與了節目的創新與制作,華為云進一步將自由視角引入到直播中,我們可以允許客戶獲得更多更好的直播體驗,提升客戶的觀感。
最后,回顧一下,今天我們主要是探討了兩個方面的內容。第一是華為云的AI在各行業創新的實踐,第二就是我們在媒體領域的創新與實踐。華為云將在人工智能和媒體領域持續的創新,不斷的來釋放我們產業的數字生產力。華為的公司的愿景是把數字世界帶入每個人、每個家庭、每個組織,構建萬物互聯的智能世界。
我的匯報就到這里,謝謝大家。