2020第二屆梅州互聯網大會(簡稱“MIC2020”)于2020年11月15-16日在廣東省梅州興寧會展中心舉辦。MIC2020由廣東省互聯網信息辦公室、廣東省工業和信息化廳、廣東省通信管理局指導,梅州市人民政府主辦,中共興寧市委、興寧市人民政府、梅州市工業和信息化局承辦,廣東省互聯網協會、興寧市互聯網協會協辦,本屆大會以“創新引領 · 慧聚蘇區”為主題,大會內容全面升級,進一步加速梅州的互聯網產業升級,聚集更多互聯網產業專家學者、行業大咖展開思維碰撞,為梅州的新基建建言獻策,為梅州的數字經濟高速發展群策群力,共商共贏!
本次大會邀請到中山大學數據科學與計算機學院教授、博導、天河二號副總設計師、國家超級計算廣州中心主任盧宇彤女士帶來主題為“超算與人工智能融合創新發展”精彩分享,以下為演講實錄:
實錄正文
尊敬的黃局長、各位來賓大家好!很高興今天來到梅州的互聯網大會,跟大家探討超算賦能融合創新。今天是一個好日子,今天上午國家超算廣州中心心梅州分中心正式掛牌,我們希望超算更好幫助梅州各個產業轉型升級,能夠更好地融入到數字經濟的發展大趨勢里面。
我今天分享的是超算賦能融合創新,其實大家一直都聽過,超級計算機,到底什么是超算?我們講超級計算機對科學發現、技術創新和產業革命都具有非常重要的作用,高性能計算也是繼理論和實踐之后科學研究的第三大手段,近年來,大數據處理正在成為科學研究的第四范式,超級計算比照筆記本、小規模的集群算,它到底有什么樣的特點?超算幫助人們解決一系列最重要的挑戰性問題,到底什么是挑戰性的問題?在超算的領域里面,我們一直講哪些問題是最具挑戰性的問題?比如說在時空的范圍里面,空間的尺度非常大像宇宙、黑洞,人的觀測都是很難企及的,小到像分子、蛋白質,像這種微觀世界的研究,還有像識辨非常快的或者識辨非常慢的,還有一些很危險的核爆燃燒之后的場景模擬,還有很昂貴的風洞試驗,一次可能是500萬的花費,比如說汽車的碰撞試驗,一次也是80-100萬的開銷。
超級計算機可以幫助人們解決一些人類的智力、體力和實驗難以企及的問題,過去40年超級計算幫助人們在科學研究方面不斷向微觀深入,向宏觀拓展,向極端條件發展,一方面促進人類更好地了解自然的奧妙,另一方面也在幫助人們不斷創造美好的生活。
超算有一個非常明顯的特點,就是時代性,某一時代有某一時代的超級計算機,它是那個時代性能最高的系統,比如說我們40年以前的超算,可能性能還不如現在的手機,20年以前的超算的系統可能是現在筆記本電腦,它的時代特性是非常鮮明的,它也是服務于國家的戰略目標,它的戰略性、前沿性屬于戰略前沿性的高技術,一直以來是國家創新體系的重要組成部分,而且它產生的原始創新和高端技術能夠快速輻射到下游產業。
超算的處理器CPU互聯網絡存儲器、軟件這些技術被超算使用以后,可以快速輻射到信息領域各個產業,整體提升IT產業的水平。在這個方面,世界上各個大國像美國、歐洲、日本都是非常重視超算的研發,我給到的這些圖片是過去45年間世界上最快的超級計算機,在我們這個領域大家也有爭論,到底誰才是第一臺超級計算機,我們有一個共識是1976年世界第一最快的系統,比現在的手機性能還要慢,它的占地有4個會議室這么大,當時是人類在信息技術里面的一個里程碑。
在這張圖上大家可以看到,信息很多,這里面的機器大部分是美國的系統,美國在過去幾十年里面對超算有非常大的投入,而且是持續投入,奧巴馬政府上臺以后有一個NSCI計劃,包括川普對高科技不是很感興趣,砍掉了很多經費,唯獨加大了對超算的投入,我的美國同行拿到有史以來最高的超算經費,可以看出,超算是各個國家戰略爭奪的一個非常重要的領域。而且超算的能力從某種意義上可以代表一個國家或者地區科技實力、經濟實力、綜合實力的體現。
超算的技術發展是非常快的,這是1976年的機器,這個機器已經是接近下一代一級系統,它的峰值是500P。我們中國的超算系統天河二號是6次蟬聯世界超算500強排行榜的冠軍,當時破了記錄,這個記錄到現在也沒有被打破,應該說天河二號改寫了世界超算的格局,是繼美、日之后第三個實現了超算系統世界第一,使中國稱為第三個擁有世界第一超算系統的國家,這是跨時代里程碑的系統。
這個系統現在坐落在廣東省廣州市中山大學里面,大家可以看出,超級計算機本身的發展,1976年第一臺超算出現的時候還沒有互聯網,它實際上是隨著技術的進步在不斷進步,我們的超級計算為了解決人類智力和體力包括實驗無法企及的挑戰性問題,它的核心是做模擬的,是做數字模擬的,隨著技術的發展,數據的產生和積累,大數據處理從海量的數據里面挖掘出背后的知識,知識里面所能夠看到的我們叫洞見。發展到人工智能的應用或者技術的時候,它和超算還是有一定的區別,比如說超算也好,大數據分析也好,我的計算規模特別大,難度特別大,數據量規模特別大,人不可能做得很好,我要借助機器,但是對于人工智能來講,比如說我駕駛汽車也好,人臉識別也好,人做得好好的,現在要教機器做這些事情,替代人去做一些決定。
在這個過程里面,它對整個系統的結構和軟件的配置不一樣,人工智能是機器替代人做重復的勞動,或者使這些操作更不容易出錯,或者更快速,或者準確度更高,在這個過程里面,我們看人工智能過去60年的發展史,背后是有計算能力的推動,早在2010年以前,人工智能的發展或者實用性比較差,隨著超級計算能力提升25億倍,它對人工智能的發展產生了非常大的促進作用。我們講超算、大數據、人工智能融合,不管從系統的結構、技術上來講,還是從應用的需求上來講,都是一個大的趨勢。
右邊的圖片是傳統認為人工智能的應用領域,但是左邊的圖片是美國ECP下一代一級系統要支持的應用,這些都是科學應用,超算和人工智能的融合有兩個方向,一方面支持傳統的人工智能應用不斷擴大規模,提升準確度,另一方面人工智能的技術幫助傳統科學發現能夠提升準確度,提升精度,用數字模擬和人工智能相結合的方法幫助人們更好解決科學問題。在這兩個需求的共同推進下,超算又迎來發展新的機遇。
我們國家超算廣州中心組機天河二號系統是國家“十二五”重點專項支持的結果,我們的系統不但在世界超算500強排行榜六連冠,我們在另外的排行榜更偏向具體應用的排行榜獲得五連冠,天河二號這個系統和美國、歐洲、日本的超算中心有比較大的差異,我們的機器是世界一流的,我們的目標是做世界一流的超算應用,在這個過程里面,我們結合廣東省、廣州市和國家的實際,我們超算支持傳統大科學、大工程的應用,我們也通過一些平臺的搭建支持區域的產業轉型升級。
這是我們現在支持的應用,大家可以看到,已經不局限于傳統的應用,我們支持高性能計算、云計算、大數據處理和人工智能,這兩個餅圖可以看到,我們的應用領域非常廣,包括新能源、工業制造、大氣海洋、天文、地球、物理,這些都是傳統的超算應用的領域,但是像生物醫藥健康、智慧城市、人工智能,現在在我們的超算占比都是在不斷提升,尤其是近3年提升非常快。最右邊的是用戶的分類,主要是高校、科研機構、企業、公共服務部門比較大的占比,特別是近年來企業的用戶占比和資源利用率提升得很好。超算軟件使用的門檻相對比較高,我們中心主要面向領域的應用平臺,因為超算的應用領域實在太多了,我們如果把軟件不做區分的話,用戶用傳統的高性能計算的軟件界面對很多行業用戶來講,其實是比較困難的,我們搭建了面向不同領域的超算應用平臺,能夠很方便支持像一些領域的科學家,像一些企業的用戶能夠方便高效使用超算。
我們通過科學運維管理,打造了行業標桿級的應用服務體系,我們現在用戶賬號超過4000家,服務的用戶超過30萬,我們超算中心的應用既有研究型的,也有業務型的,現在國家超算中心里面支持業務級應用難度比較大,我們在超算中心里面支持各種層次的應用,我們的系統資源平均利用率超過75%,最高超過90%,每天有超過4萬個作業在中心運行。我們的超算中心經過這幾年的發展,已經實現良性運轉,我們每年應用服務的收益已經過億,過去4年已經過億了,實際上我們國家為止唯一一個沒有政府補貼的超算中心,應該說我們通過自己的努力,應用和研發并舉,走出了一條自主創新具有中國特色的超算中心的發展之路。大家熟知的六連冠是根據機器性能來排名的,這是最具應用影響力的排行榜,我們排名第五,前四個都是美國的國家實驗室,應該說這幾年廣州中心的應用取得非常大的成效。還有一方面,在廣東省灣區包括中國隨著經濟的發展,科技的發展,超算應用的需求非常旺盛。
超算中心主要面向前沿基礎科學的研究,我們在大氣、海洋、能源、材料、電子信息等方面做了很多超算應用的支持。我們還面向國家重大戰略工程,支持了航空航天、高鐵、水利工程、核電等等的應用。第三個方面是面向區域的地方經濟社會的發展,助力智慧城市的建設,支撐大數據產業、支撐人工智能的產業發展,支持數字經濟的發展。
我們超算中心大家一直也問,廣州超算怎么做到支持大科學、大工程、新產業?這三個要在一個平臺上支持,所以這個關鍵技術是面向領域的應用平臺,突破超算應用平臺技術,搭建復雜的超算系統和多目標、多類型應用之間的橋梁,我們有一個整體的超算融合應用支撐平臺,這個平臺是我們超算中心自主研發的大數據、人工智能融合應該的環境,我們把所有的面向不同領域的應用平臺集成到這個平臺上,覆蓋的領域包括大氣海洋環境、新材料與新能源、生物醫藥健康、大數據處理、人工智能和智慧城市的應用。
這個平臺軟件的建設,我們已經投入使用,邊使用邊完善的過程,我們的用戶尤其是行業用戶還有領域科學家也給了我們很多反饋,讓我們不斷優化應用環境,這是掛在互聯網通過云計算的新模式使用超算的,我們也是國家高性能應用軟件中心,也是大數據創新的工程中心。
我用一點時間給大家介紹我們中心的典型應用案例,案例實在太多了,我在各個領域選1-2個案例給大家分享一下。在天河二號我們有很多自主研發的軟件和模型,比如說這個新一代多尺度的海洋模型是和我們中大大氣學院合作研究的,這個模型可以支持25分鐘完成全球未來10天的海洋模擬,也是國際上首次耦合南北極海冰及海洋因素全面監測氣候變化帶來的環境影響,這個模型是自主研發的,已經在國家氣象局和氣候中心推廣。
后面兩個是業務系統,國家氣候中心中短期的氣候預測系統在天河二號上運行,每個月運行一次,滾動做氣候預報,在天河二號上4小時可以完成未來半年的氣候預測,這些預測報告都是反饋給中央做第二年或者下半年的決策,為我國防災減災提供一些科學依據。
后面我要著重介紹的是,廣東省廣州市氣象預報的業務系統在我們超算中心上運行,大家在電視臺或者地鐵的大屏上看到的,我們在天河二號的支持上,使廣州市氣象局成為國內唯一一個可以實現1公里模式業務級運行的氣象局,現在廣州市的區域高精度的天氣預報在國內走在前列。1公里的高分辨率天氣預報在天河二號上每10分鐘預報一次,可以準確預報到大學城明天上午10點是否下雨,雨量是什么樣的,下多長時間的雨,這個需要很大的計算量和IO吞吐能力,只有天河二號可以完成。在國際上也是領先的,國際上只有英國的氣象局可以做1公里的天氣預報,我們這個除了做日常的預報以外,對一些極端的天氣比如說準確預測“山竹”、“天鴿”登陸的路徑和對天氣的影響。
在天河二號上我們實現了很多世界第一,我們也實現了國際上最大規模的地震模擬應用,使用168萬個處理器,這些都是做科學研究的,其實我們在城市建筑災害模擬方面,百萬數量級的建筑群精細仿真碰到災害、地震,一個城市的建筑群到底有什么樣的影響,我們10分鐘之內可以做完精細的仿真。有很多應用研究成果已經應用在珠三角的城際軌道、深圳地鐵、長沙地鐵、廣州金融城地下空間等大型工程項目里面都有天河二號模擬的設計結果。
我們在國家戰略工程和裝備制造上,我們依托天河二號搭建應用服務平臺,大飛機C919全機模擬的時間在天河二號上只要6天,過去是兩年,所以天河二號為大飛機的試飛和落地起到非常重要的作用。包括核電站的設計都用到天河二號,主要極大縮短設計的周期,還有高鐵,高鐵我們不但做外型的設計,這是蘭新線,要建一個百里的擋風墻,整個設計在天河二號上完成的。像新能源、新材料、石墨烯等等,這些材料的設計最開始是尖端科學的研究,比如說這些研究團隊依托天河二號發表了《自然》上高水平的文章,背后都有產業轉化的可能性,也有很多在路上,現在在做新材料的研發和產業成果的轉化。
我們還支持全國最大的能源企業風能企業,它構建了整個風光能一體化全生命周期的管理平臺,這上面已經走出國門,我們支持3年多,它的業務規模依托天河二號可以不斷擴大,現在服務全球十多個國家,有2000多個風場的項目評估在天河二號上,每年可以節約20億的產值。在新產業的應用和傳統產業的轉型升級,我們和廣船、廣汽有非常好的合作,廣船前幾年整個全球船舶的市場不是非常景氣,依托天河二號的模擬和歐洲的船廠競爭中屢次勝出,廣汽集團和我們合作,廣汽集團依托我們超算中心建立全球一張辦公桌,疫情期間廣汽的設計師們不能到辦公室上班,但是借助互聯網可以登錄到超算中心,還可以照樣完成設計,現在是多級的設計平臺和環境,可以利用超算中心的資源,也可以利用廣汽自己需要的數據和設計模型,今年完成了3款車型的設計,在傳統產業的轉型升級上,依托超算可以做出很好的成果。
我們也支持像微電子元器件的輔助設計,我們超算中心這紀念支持很多新興企業,像AI賦能產業應用,像圖譜科技,他們現在都是上市公司,當時與我們合作的時候,企業規模并不是特別大,但是運用超算因為它有很大的資源,只要你把模型開發好,把應用規模用上去,覆蓋用戶的范圍非常廣,像三維家的設計也是走到歐洲,因為后端的計算能力不夠,你不能夠支撐你的服務。
還有生物醫藥健康領域,這幾年在大健康的概念里,應用的需求是非常旺盛的,但是要解決的問題是,生物領域的應用千差萬別,我們怎么用超算,可能有些情況是自己小的集群都用不好,如何用超算?我們在超算上搭建應用服務的平臺,比如說我們搭建高通量的虛擬篩選平臺,這是源于科學研究的成果,我們有一套軟件系統,一天能夠完成4000萬分子化合物篩選,當有突發的疾病、傳染病出現的時候,我們如何最快速在所有的化合物里面找到能夠抗病毒的化合物,當然你找到化合物到藥有很長一段時間,這個技術的使用一個是支持藥物研發,還有一個是老藥新用,在“非典”期間這個平臺也發揮了非常重要的作用。
還有人類基因組測序的平臺,包括組學分析的平臺,我們8小時可以完成過去8個月的工作量,我們在天河二號上也實現了全球第一個基于3代測序亞洲人基因組的分析,這是在1小時可以完成,這個成果是當時武漢未來基因和韓國的研究團隊競爭的,以前他們沒有用天河二號,韓國團隊的研究走在他們前面,但是他們找到我們,與我們一起合作,讓他們先于韓國團隊得到這個研究成果發表了文章。這只是一方面,另一方面,他的分析縮短到1個小時以內,以前要兩個月,一個小時的時間使未來的臨床應用變為可能,所以超算既能夠解決科學問題,也能解決產業轉化的問題。
國家衛健委首次做三級公立醫院績效考核,我們唯一一個拿到全國2400多家三級醫院的數據。去年他們委托一家技術公司幫助他們做這個事,找到我們的時候已經是七八月份了,國家規定他們去年年底要完成整個績效評估的工作,但是到8月份用自己的系統要260天才能評估一次,所以他們找到我們以后,我們把整個系統進行重構,在我們天河二號上7天就可以做一次,所以在10月底已經完成了這個工作,在我們天河二號上面做了三次,得到衛健委非常高的評價。今年會做全國二級公立醫院的績效考核,這涉及到大數據分析處理,這是非常復雜的系統,也是實實在在為國家的衛生健康系統怎么樣使醫療資源更公平?怎么樣評價醫療資源?也因為這個原因,后面我會講到疫情期間超算中心也是國家衛健委唯一指定新冠的數據存儲使用分析的中心。
在人工智能和智慧城市的應用方面,我們也做了很多工作,大家知道,廣州市的公共服務交易平臺大宗的土地拍賣和其他拍賣在上面做,每年大概是9000億以上的成交量,我們也支持,中山大學有10家附屬醫院,和超算中心都有密切合作,我舉的這個例子是眼科中心,因為我們眼科中心是全國第一,也是亞洲第一的眼科中心,他們對新技術是非常敏感的,在天河二號上他們部署了人工只能眼科醫生診療準確度超過90%,在200多家醫院進行了應用。
這是我給大家分享的平戰結合,面向領域的應用平臺像生物醫藥的平臺,我們平時做科學研究的工作,戰時可以快速發揮作用,大年三十我們開始做抗病毒藥物的篩選,我們也做了一個肺部CT輔助診斷平臺,也是國家衛健委新冠肺炎患者數據收集平臺,因為這個應用的范圍實在非常廣,所以我想怎么講都是掛一漏萬,希望在座的各位或者通過你們把有超算需求的人與我們對接,對于超級計算的未來可以看到,現在是無處不在的計算,也是無處不在的網絡,而且有快速增長的數據和快速發展的智能,超算的應用是一個多樣化的需求,作為超算中心,我們也是經歷技術的演變,從計算模擬、數據驅動和AI賦能這三個角度進行超算、大數據和人工智能的融合,其實要實現各行各業的應用都能夠高性能、高產出,能夠保證系統和應用的長期穩定的運行。超算的關鍵技術是非常多的,所以它和信息產業IT的產業結合非常密切。
計算驅動一切,當然我們也是從應用的需求牽引,為了滿足這個目標設計軟硬件一體的系統,目的是高效使用,它現在是計算科學、數據科學和智能科學的融合,我們也是新型的應用不斷在牽引超算的新業態,我的對外使用模式可能是一個類似于云計算的模式,但是核心是提供超算巨大的能力。計算是創造力,是科技創新的需求,計算是生產力,是戰略性新興產業的需求,它也是一個區域競爭力的表現,它是高水平人才匯聚的需求,計算也是影響力,灣區區域引領作用的需求,我們講的主題是,超算的集群是賦能各行各業的產業集群。
因為梅州分中心也落地了,希望能夠對接梅州更多的產業需求,為加快數字產業化,推動數字經濟和實體經濟的深度融合做出自己的貢獻,謝謝大家。