大規模語言智能如何為商業搭建橋梁?AI計算的未來突破在于類腦芯片嗎?當人工智能遇上量子計算,又會展現出怎樣的場景?作為WAIC期間內容最硬核、最受AI開發者關注的技術活動,今年的WAIC·AI開發者論壇以「后深度學習的AI時代」為主題,邀請到了全球最具影響力的學術泰斗、企業高管、技術專家為開發者們帶來了最前沿的分享。
2021 WAIC世界人工智能大會已于近日在上海落幕。
7 月 10 日,在機器之心承辦的WAIC·AI開發者論壇上,阿里巴巴副總裁 & 達摩院語言技術實驗室負責人司羅、類腦芯片研究領軍人物及SynSense時識科技聯合創始人和首席科學家 Giacomo Indiveri、中國惠普有限公司副總裁暨大中華區個人信息產品事業部總經理周信宏、登臨科技創始人兼 CEO 李建文、RISC-V 國際開源 (RIOS) 實驗室執行主任譚章熹、上海交通大學特聘教授陳海波、百度研究院量子計算研究所所長段潤堯、好未來集團技術副總裁吳中勤、九章云極 DataCanvas 董事長方磊、云天勵飛副總裁 & AI 產品中心負責人肖嶸、知乎合伙人兼 CTO 李大海、思謀科技聯合創始人兼技術負責人劉樞博士以及 MindSpore 開源社區運營負責人黃之鵬等多位 AI 產業界代表進行主題演講。
此外,機器之心于2021WAIC·AI開發者論壇期間啟動 ‘AI開發者十問’ 特別策劃,該策劃將在接下來的一年內滾動邀請中外人工智能頂級專家向全球AI開發者分享專業研究洞見,解讀最新的AI技術突破,解答AI開發者關心的趨勢性問題。通過‘開發者十問’特別策劃,機器之心將持續為全球AI開發者打造高質量的專業內容,為全球人工智能開發者提供最前沿的學術趨勢,促進中外AI技術社區間的交流互動。特別策劃內容將在機器之心旗下多渠道華語內容平臺及英文AI科技媒體品牌Synced Review滾動首發。
除了這些精彩的主題演講,WAIC·AI開發者論壇還揭曉了今年的WAIC·云帆獎得主,現場頒發了WAIC·黑客松獎杯。歡迎大家關注機器之心公眾號了解云帆獎與黑客松獲獎詳情。
阿里巴巴副總裁司羅大規模語言智能為商業搭建橋梁
自2018年以來,谷歌BERT、OpenAI GPT-3等大規模預訓練語言模型逐漸成為NLP界的主流,不僅可以完成問答、翻譯、小說創作等一系列NLP任務,更開始了語言模型的商業化探索,催生一系列落地應用。「煉大模型」,為什么成為了NLP領域的大勢所趨?
2021 WAIC•AI開發者論壇,阿里巴巴副總裁、達摩院語言技術實驗室負責人司羅分享了「大規模語言智能如何為商業搭建橋梁」的主題內容。
說到自然語言智能領域的發展現狀,司羅總結了三個關鍵點:
1.深度語言模型突破式發展, 引領重要自然語言技術取得進展;
2.公有云NLP技術服務從通用功能走向定制化服務;
3.自然語言技術逐步與行業/場景緊密結合, 產生更大價值。
第三個方向是各大科技巨頭奮起爭先的重點方向。阿里巴巴達摩院是最早投入預訓練語言模型研究的團隊之一,2017年10月,阿里巴巴成立了專注于自然語言智能的達摩院語言技術實驗室,成立3年多來,達摩院語言技術實驗室在國內外各類技術評測中取得了多項優異的成績,并把完善后的技術沉淀到自身打造的自然語言技術平臺中。
平臺技術背后,是Alicemind自然語言預訓練體系。AliceMind包括通用語言模型 StructBERT、多語言VECO、生成式PALM、多模態StructVBERT、結構化StructuralLM、知識驅動LatticeBERT、機器閱讀理解UED、超大模型PLUG 等,目前大部分已經開源。
AliceMind具有閱讀、寫作、翻譯、問答、搜索、摘要生成、對話等多種能力,目前已成為阿里的語言技術底座,日均調用量超過50億次,活躍場景超過200個,已在跨境電商、客服、廣告等數十個核心業務應用落地。未來,AliceMind將持續完善,向著更加智慧的方向發展,并持續進行生態技術開源。
類腦芯片研究領軍人物、SynSense時識科技聯合創始人Giacomo Indiveri
AI計算的未來突破在哪里
作為類腦芯片設計領域的絕對權威,Giacomo Indiveri教授具有20多年的模擬與混合信號硬件設計經驗,并曾三次獲得ERC歐洲研究理事會經費支持,這在類腦芯片領域前無古人。Giacomo Indiveri也是 「類腦計算概念提出者」、 加州理工學院傳奇人物Carver Mead的學生之一。
2021 WAIC•AI開發者論壇,Giacomo Indiveri通過視頻連線的方式進行了主題為《仿生的低功耗人工智能計算系統》的演講。
Giacomo Indiveri先是回顧了近年來人工智能領域的突飛猛進。2011年,第一個使用反向傳播方法訓練的卷積神經網絡大獲成功。反向傳播和卷積神經網絡均早已被提出,但那一次獲得真正令人印象深刻的性能,要歸功于算力的提升和數據量的增長。
但我們仍注意到,現有計算模式仍需消耗大量資源在存儲及功耗上。如何改善這些問題?最有希望的方法之一就是類腦計算,這恰好是SynSense時識科技聚焦的領域。
2017年3月,Giacomo Indiveri教授與其學生喬寧博士(現任SynSense時識科技CEO兼董事長)在瑞士蘇黎世成立aiCTX公司,并在中國和瑞士兩地積極推動可商用的類腦芯片研發。2020年4月母公司落地中國,之后又將aiCTX更名為SynSense時識科技。
仿真的人工神經網絡真正的特征在于大規模的權重乘法或矩陣乘法,人工神經網絡也會有類似加權的輸入,但物理學在此類計算過程中發揮著更重要的作用,而突觸不只是在做乘法。因此前者實際上是一種運行在計算機和GPU上的算法,生物神經網絡真正使用的是時間-空間域運算和物理學。因此,人工智能領域需要一場計算范式方面的徹底轉變。標準的計算基本基于馮諾依曼架構,CPU與內存的數據往復消耗了很多能量,而CPU內部的計算是很高效的,比大腦內部傳輸數據的成本更低。
一直以來,SynSense時識科技都在從事類腦芯片的設計,推出了DYNAP-SE2、DYNAP-CNN、SPECK、XYLO等系列類腦芯片。在當前的類腦芯片領域,市場上依然沒有出現量產的可商用的類腦芯片。Giacomo Indiveri教授曾表示:「我們研發類腦芯片并不是要取代CPU和GPU,而是要提供可以放在機器人和物聯網終端設備的實時傳感,是一個非常低功率,緊湊而小型的計算單元。」
中國惠普有限公司副總裁周信宏
AI 基礎設施——邊緣計算演進及趨勢
近年來,AI從實驗室走向大規模的商業應用,在金融、農業、醫療、文娛、交通等眾多領域加速落地,深刻改變著人們的生產、生活和學習方式。與此同時,人工智能的加速落地帶來了爆發式的數據增長,對未來的計算力提出了新的挑戰。面向高速發展的智能時代,邊緣計算憑借著其獨有的先天優勢,可以有助于滿足未來更多樣化的應用場景需求。
2021 WAIC•AI開發者論壇,中國惠普有限公司副總裁周信宏從邊緣計算的角度,分享了惠普的經驗與思考。
邊緣計算的誕生可以追溯到1998年,但「邊緣計算」這一概念正式被提出的時間是2013年,邊緣計算的發展經歷了一系列的探索和架構的演變。到了2020年,5G技術落地開始加速邊緣計算的成熟和應用,同時惠普以突破性的技術推出了Z系列數據科學工作站,助推邊緣計算的發展。
周信宏介紹說,隨著邊緣計算的發展,廣泛的應用場景正在帶來更加多元化的市場需求,可以總結為四個關鍵詞:算力強勁、靈活敏捷、穩定可靠、經濟實用。
正是基于對前沿趨勢、用戶需求的洞察,惠普打造了包含數據采集工作站、微型工作站、Z8 Multi-GPU工作站、VR可穿戴設備以及Data Science Stack在內的Z系列革命性產品,以多形態產品滿足不同應用場景的計算需求,以一體化的解決方案助力行業實現創新突破。
惠普數據科學工作站的強勁性能可以滿足對計算性能要求最為嚴苛的行業需求,尤其是在 AI已經廣泛應用的安防、文娛、醫療、零售、汽車等領域,都有惠普數據科學工作站的身影。
面向未來, 5G、物聯網的不斷發展將帶動邊緣計算向更廣泛的領域滲透,周信宏表示,惠普將繼續攜手軟件、硬件以及行業伙伴,通過整合硬件技術與合作伙伴的軟件開發成果,拓展技術應用的使用場景,搭建多方共贏的生態系統,共同借助創新技術引領行業生產力變革,合力締造一個更加美好的智慧未來。
登臨科技創始人兼CEO李建文
AI新時代下的軟硬件協同異構計算平臺GPU+
2019 年,OpenAI發布的AI算力報告顯示:AI計算量每年增長10倍。從AlexNet到AlphaGo Zero,AI模型對計算量的需求增長了30萬倍。激增的 AI 算力需求遠遠超出了摩爾定律的客觀發展規律,加之傳統GPU在AI加速方面存在局限,因此業界亟需出現滿足新時代下AI算力巨大需求的全新GPU產品。
2021 WAIC•AI開發者論壇,登臨科技創始人兼CEO李建文就該主題與現場觀眾展開交流分享,并介紹了其公司在該領域的探索GPU+架構以及在商業化落地方面的進展。
李建文指出,算力是由計算機提供,計算機的核心技術是半導體和芯片,但過去幾十年,它們的更新和計算性能的提升大大放緩。功耗、散熱也是造成計算機性能提升放緩的重要原因。
GPU是解決AI問題的三大核心動力之一,但對于AI應用來講,GPU整體架構的計算密度提升不快,效率不高。片上內存子系統對于AI計算來講效率非常低。所有這些都呼吁業界推出全新的GPU產品。登臨科技推出了片內異構架構GPU+以及Goldwasser系列產品。
作為國內目前唯一規模量產的 GPGPU高性能通用AI加速器,Goldwasser在現有市場主流的GPU架構上,創新性地采用軟硬件協同的異構設計,解決了通用性和高效率的雙重難題,在國內外申請了多個核心專利,部分已獲得授權。
Goldwasser具有多個亮點,包括完全自主創新架構GPU+、同時支持推理和訓練、無縫接入現有軟件生態、在12nm/14nm工藝上取得與國際主流同類產品3倍以上效能優勢等。
此外,Goldwasser覆蓋主流系統生態,支持主流國內外AI計算框架和適配國內外主流CPU廠家,應用場景覆蓋視頻審核、AI創作、智能安防等。
RISC-V國際開源(RIOS)實驗室執行主任譚章熹
RISC-V——從開源芯片制造、EDA到處理器
在CPU架構領域,Arm和x86占據了絕大部分市場份額。但是,Arm收費授權模式和x86不對外授權使得芯片研發企業紛紛轉向開源架構RISC-V。
2021 WAIC•AI開發者論壇,RIOS實驗室執行主任譚章熹、睿思芯科創始人兼董事長譚章熹從開源芯片、EDA和處理器全方位分享了RISC-V在芯片領域的重要作用。
譚章熹首先介紹了 RIOS實驗室,它是一個致力于RISC-V開源指令架構生態建設的非盈利組織。接著他從transistor架構、單線程性能、頻率、典型功耗和多核等方面解讀了微處理器的發展,并分析了芯片性能與成本之間的變化。
計算機的發展基于指令集架構(ISA),但Arm、x86的私有性造成了封閉,RISC-V應運而生。RISC-V在全球50個國家有2000多個成員。到2025年,市場將消耗624億個RISC-V CPU核心,工業領域167億個。2010年至今,RISC-V經歷了四個階段的發展。
處理器的發展依賴生態系統的建設和開源。RIOS實驗室發布了全球首個可運行Linux的全開源RISC-V微型電腦系統PicoRio項目,構建更透明、低功耗、定制能力強的高效能邊緣計算平臺。未來PicoRio的軟硬件發展將分為3個階段,通過整個開源平臺,探索RISC-V軟硬件生態。
最后,譚章熹呼吁大家積極參與開源項目的貢獻,不斷促進開源社區的發展。
上海交通大學特聘教授陳海波
AI原生計算機系統——機遇與挑戰
人工智能發展的三大要素包括算力、算法、數據,其驅動力可總結為算法引領+系統支撐。在未來時代,計算機系統將帶來哪些機遇與挑戰?
2021 WAIC•AI開發者論壇,上海交通大學特聘教授陳海波分享了「AI原生計算機系統:機遇與挑戰」的主題演講。
陳海波教授認為,首先對于整個系統而言,如果把系統分成三層來看,有硬件抽象、操作系統、系統框架。在AI時代,計算機系統面臨一些新的機遇,包括BY AI(發揮AI算力)、USE AI(運用AI方法)、FOR AI(支撐AI應用)。
AI原生計算機系統目前面臨三大挑戰,挑戰一:如何實現新型異構智能硬件的高效抽象?挑戰二:如何實現智能算法與傳統設計互補協作?挑戰三:如何兼顧智能應用(各任務)的多樣需求?
接著,陳海波教授從三個層面進行了介紹。
•首先,如何發揮AI算力,即BY AI。系統軟件如何發揮智能硬件價值?陳海波教授認為有兩種嘗試:第一種是智能網卡的高效抽象方式;第二種是面向AI芯片的實時支撐,從而更大的發揮智能硬件效率。
•第二,運用AI方法,即USE AI。人工智能為系統軟件帶來新方法:人工智能賦能系統軟件。可嘗試將智能方法應用于分布式存儲(Learned Cache)。
•第三,如何去支持AI的應用,即FOR AI。陳海波教授以圖神經網絡框架為例進行了講解。FOR AI在系統方面可以做優化,可以讓系統軟件更好支撐智能應用,通過面向圖神經網絡的通用計算框架,結合下面底層框架可以對系統效率有非常顯著提升。
陳海波教授認為,現在計算機系統軟件研究迎來黃金時期:第一,AI對于計算機系統研究進入新維度,從人工智能賦能系統軟件設計的維度,提供新思想、新方法,使傳統方法和智能方法進行更好融合;第二,可以用系統軟件更好支撐人工智能的應用,帶來一些新需求,提出新動力。使得能夠有機會去重新思考經典技術在新興場景下的重生。
百度研究院量子計算研究所所長段潤堯
量子人工智能——從理論到實踐
當前,人工智能和量子計算早已經是各自領域炙手可熱的研究話題。現如今,人工智能在智慧醫療、智能駕駛等領域開始被廣泛應用,其產業化獲得了令人矚目的效果。量子計算也是推動數字社會進步的一把利器。當人工智能遇上量子計算,將展現出怎樣的場景?
2021 WAIC•AI開發者論壇,百度研究院量子計算研究所所長段潤堯分享了「量子人工智能:從理論到實踐 」的主題演講。
為什么我們需要量子計算?段潤堯認為主要原因有三。一是邏輯上的必然性:經典邏輯存在困局,必須推廣經典比特和邏輯門到量子情形。二是技術上的必然性:理論預估的極限實際上已經達到,芯片設計必須考慮量子效應。三是應用上的必然性:經典計算機模擬量子系統通常需要指數多的時間效率低下,而量子計算機幾乎可以高效模擬自然界中所有量子系統。同時,段潤堯表示量子計算已上升為國家戰略,其市場趨勢未來可期。
目前,量子計算的應用領域包括密碼安全、人工智能、量子化學、材料模擬等。量子計算與人工智能正在深度融合。量子人工智能在算法、框架、硬件三個層面進行AI基礎能力的創新突破,預計在準確率提升的同時大幅降低時間和能源成本。
百度量子計算研究所成立于2018年3月8日,以實現「百度量子,量子百度」為使命,制訂了QAAA戰略規劃:聚焦量子算法(Quantum Algorithm)、量子人工智能(Quantum AI)和量子架構(Quantum Architecture)的研發,并初步建成了以量脈、量槳、量易伏三大項目為主體的百度量子平臺。百度量子平臺旨在扮演量子時代操作系統的角色,降低普通用戶學習量子軟硬件專業知識的成本,使非量子專業用戶也能實現量子編程、量子機器學習等相關內容。
其中量易伏重磅升級至2.0版本,成為國內首個接入量子計算真機的云原生量子計算平臺,提供從應用到真機的一站式量子計算服務。量易伏通過接入中科院物理研究所的超導量子比特芯片,以及諸如混合語言支持、QCompute SDK、云上量子IDE、自動化模塊工作流等技術,打造企業級量子計算開發環境。
百度的量子生態是一個開放、可持續的生態,通過為用戶與開發者提供量子服務、和研究機構與高校開展項目合作、主辦或贊助領域頂級會議等多種途徑持續為量子計算的發展和繁榮作出貢獻,力爭實現「人人皆可量子」的美好愿景。
好未來集團技術副總裁吳中勤
多模態機器學習及大規模自動生成技術
多模態機器學習(MultiModal Machine Learning,MMML)旨在從多種模態建立一種模型,能夠處理和關聯多種模態的信息,解決單一模態模型無法解決的問題。
2021 WAIC•AI開發者論壇,好未來集團技術副總裁吳中勤為我們解讀了多模態機器學習及大規模自動生成技術,并介紹了好未來AI 研究院的最新研究成果及成功案例。
基于數據的異構性,MMML領域總體有五種研究方向:表征、轉換、對齊、協同和融合。在教育領域存在很典型的多模態場景,好未來是國內頂尖的教育科技企業,課堂中師生互動、授課質量評價等問題都需要該領域的技術支撐分析和解決。
好未來AI研究院研發的Godeye授課質量分析系統,是針對授課過程中老師/學生之間發生的講解、互動、鼓勵等各類學情進行智能識別,此系統可以幫助教師準確定位自身授課過程中有待提升的部分,給出專業建議配合教學方案,最終達到提升教師族群整體教學質量的目標。
Godeye授課質量分析系統已經在好未來集團內部廣泛應用,并且獲得了CSDN 2019全國優秀AI應用案例。
想要真正實現授課質量分析需要多個模態算法的協同和融合,語音分析方向大多數教室中,教師和學生的聲音數據是混雜在一起收錄的,很難把教師和學生的說話內容分離開,并作單獨分析。但準確分析一堂課中的學習過程,分別分析教師授課情況和學生的吸收情況非常重要。他們提出一個不需任何提前錄制聲紋,同時結合發聲特征、說話內容的1on1課堂中師生說話分離的多模態算法框架,并已經發表在語音頂會ICASSP 2020會議上。
除了將師生對話內容分離外,課堂中老師情感的表達對學生的參與感、學習體驗有重要影響。除了面部表情,情感表達更重要的途徑是聲音以及說話內容。語音情感識別領域是挑戰很高的,因為情感的表達是復雜的、多模態的以及細粒度的。針對問題,好未來AI研究院也提出了一個新型的多模態深度學習方法來對現實生活中的語音進行細粒度情感識別。相關論文發表在InterSpeech 2021會議中。
同時當前音頻-語言雙模態預訓練模型應用還比較少,好未來提出了一個針對音頻-文本雙模態的交叉模態的預訓練Transformer,簡稱CTAL。這套預訓練框架目標在于學習音頻和語言間的模態內和跨模態的聯系。
外在文本生成方面,好未來借助大規模自動生成技術架構,在1個小時內就能生成10萬級數量的練習,速度是人工的數千倍,而且多樣性高、來源廣泛,更好地解決了人工思考和效率的問題。
好未來作為智慧教育國家新一代人工智能開放創新平臺承建單位,AI研究院2021年以來取得多個AI領域重要前沿技術成果,5篇論文入圍人工智能教育國際頂級會議 AIED 2021,在CVPR 2021挑戰賽中獲得四項冠軍,斬獲INTERSPEECH 2021「非母語兒童識別」雙料冠軍,此外今年已經發表超過17篇業界一流論文。
九章云極DataCanvas董事長方磊
Hypernets——自動化機器學習的基礎框架
當AI進入落地期,從業者越來越多地關注如何降低構建模型的門檻,一款優秀的AutoML框架應該是什么樣的?
九章云極DataCanvas董事長方磊的分享主題是「Hypernets:自動化機器學習的基礎框架」。他認為,好的AutoML框架一定要具備富有表現力的搜索空間描述語言、支持高維空間的高效搜索算法和高性能的評估策略。
作為基礎的AutoML框架,九章云極 DataCanvas開源了Hypernets可解決自動建模領域的三個關鍵技術,率先突破了機器學習建模過程中不均衡數據、概念漂移、模型泛化能力和大規模數據等諸多挑戰,支持最新的神經網絡架構搜索(NAS)算法,提供開放的訓練服務框架,滿足單節點及分布式高性能的模型訓練需求,可以在不同的空間進行搜索與訓練,并且作為幫助用戶快速開發專用領域的AutoML工具,降低了AutoML工具的開發門檻,實現深度學習的網絡架構設計自動化。
方磊介紹了Hypernets的兩個具體示例:HyperGBM與HyperKeras。HyperGBM融合了先進的GBM模型,包括XGBoost、LightGBM、CatBoost自動建模工具,實現建模全過程的全自動機器學習,效果出眾,在多個公開數據集和客戶實際業務場景上的表現接近或超出人類專家水平;HyperKeras建立在Tensorflow和Keras上,支持神經網絡架構搜索(NAS)和超參數優化(Hyperparameter tuning)方便復現各種經典NAS中的搜索空間,專注非共性問題,靈活高效地擴展。
對于Hypernets用戶來說,5到10行代碼即可完成Full-Pipeline AutoML,簡單易用。Hypernets的未來愿景是融合更多的深度學習框架,推動神經網絡架構搜索的前沿發展,助力實際應用場景中的深度學習模型落地。
云天勵飛副總裁 & AI產品中心負責人肖嶸
創「芯」時代 ,打造自進化城市智能體
當前,全球智慧城市建設都處在初期階段,但智慧城市最終將會發展成為一個自進化的城市智能體。自進化城市智能體需要具備哪些要素?端側智能又在其中發揮怎樣的作用?
2021 WAIC•AI開發者論壇,云天勵飛副總裁 & AI產品中心負責人肖嶸闡述了這些問題,并介紹了他們在硬件和算法平臺的布局和最新進展。
回顧過去,「智慧城市」這一概念可以追溯到2008年,經過了2012年的探索期。2016年,「十三五」規劃綱要提出「新型智慧城市」,緊接著,阿里云城市大腦項目誕生,騰訊推出WeCity未來城市解決方案,百度大腦正式發布,華為在多地建立智慧城市 IOC。
隨著5G、物聯網的建設,每天都會有海量的數據實時產生,對邊緣設備及其算力的需求呈爆炸式增長。目前,智慧城市主要面臨多樣化場景帶來的復雜需求、智能端側應用不足、網絡可靠性和系統可靠性差、個人隱私數據與信息安全難以保障等問題。
肖嶸認為,自進化城市智能體需要具備兩個要素:AI的普適性和自學習、自進化。
針對「云側」可靠性低、延時高等問題,云天勵飛著重強調了自進化城市智能體體系的底層基礎——「算法芯片化」。自成立之初,云天勵飛就一直專注于芯片的研發,早在 2016年,云天勵飛研發了其第一代深度學習神經網絡處理器NNP100 ,目前正在進行第三代處理器架構的迭代開發。
同時,城市治理的應用場景多樣、需求復雜,對算法的場景適用性要求高,云天勵飛結合主動學習、半/弱監督學習和超大規模預訓練模型正在打造城市邊緣智能平臺。
肖嶸展示了云天勵飛算法平臺助力龍崗區12345政府便民熱線、賦能龍華區城市治理兩個實際案例。在真實的場景下打磨和訓練出來的算法,才會在實戰中有突出的表現。基于這些成熟的算法,云天勵飛打造出來的芯片,才會更貼合場景的需求。
知乎合伙人兼CTO李大海
基于AI的智能社區多模態數據融合研究與實踐
作為中文互聯網最大的知識分享平臺,知乎以問答業務為基礎,以高質量內容和良好的社區氛圍受到廣泛贊譽。從2019年開始,視頻化成為大趨勢,知乎也投入了大量資源在富媒體化的工作中。
2021 WAIC•AI開發者論壇,知乎合伙人兼CTO李大海帶來了知乎在智能社區時代多模態數據融合中的研究以及實踐進展。
李大海表示,AI技術已經廣泛應用于知乎的每個核心環節,構建智能社區實現知識普惠。隨著越來越多的用戶在知乎上通過視頻分享自己的知識、經驗、見解,知乎確定了以多模態為核心的視頻智能化技術戰略。
去年10月,知乎發布了PPT創作工具,圖文創作者可以利用這個工具快速把自己的文字回答或者文章生成為一個視頻。轉化過程的主要思路是把文章里每一段話或者每一個句子,通過模型找到對應的圖片、動圖或者短視頻,然后通過預訓練模型把每一段文字與素材庫里圖片的相關性進行計算。此外還有其他應用,創作者可以主動輸入關鍵詞,在素材庫里面找到和關鍵詞匹配度最高圖片,讓它自己主動構建視頻素材流。
未來,知乎將基于積累的海量圖文視頻數據,致力構建綜合圖文、視頻、音頻等媒介于一體的大規模預訓練模型,并將成果完全開放出來,讓學界、業界的更多開發者使用。
思謀科技聯合創始人兼技術負責人劉樞
智能制造中的算法平臺——不只為客戶降本增效
很多To B公司的初心都是為客戶降本增效,但To B公司可不可以為自己好一點?可不可以為自己降本增效?
2021 WAIC•AI開發者論壇,思謀科技聯合創始人兼技術負責人劉樞發表了「智能制造中的算法平臺——不只為客戶降本增效」的主題演講。
在這里,劉樞介紹了思謀科技的智能制造算法平臺SMore AI Platform (SMap),同時指出:「AI制造將顛覆傳統工業,AI是變革的核心驅動力。」
SMore AI Platform (SMap)具有工具化、平臺化、范式化、產品化等特點:
•工具化:工程師可以輕松使用,也可以將其作為知識沉淀的載體。
•平臺化:平臺具有有優秀的抽象功能,為后續的拓展提供可能;還具有統一不同工具的設計與使用界面的功能,功能靈活可插拔。
•范式化:平臺可以實現項目流程的范式化,可以快速復制,同時可實現模型自動化生產。
•產品化:該平臺可打通項目交付最后一環,成為產品的一部分,從而加速價值傳遞。
未來,思謀科技將持續運用新一代AI系統架構和自動化硬件能力,通過AI技術與制造業融合中的神奇反應,進一步推動傳統制造業的智能化轉型,牽手合作伙伴共同開創智能制造新未來。
MindSpore 開源社區運營負責人黃之鵬
下一代AI基礎軟件能力展望
從2010年開始,支撐深度學習發展最重要的就是框架以及支撐框架的基礎軟件,沒有這些軟件的發展,就沒有如今實現的這么多模型和系統。
2021 WAIC•AI開發者論壇, MindSpore開源社區運營負責人黃之鵬分享了「下一代AI基礎軟件能力展望」的主題演講。
黃之鵬表示,下一代AI基礎軟件核心能力將會有巨大突破,其發展的著力點主要集中于發效率和執行性能的提升、AI研究到生產之間巨大鴻溝的突破、AI求解技術的升級以及中國人工智能AI應用生態的建設等方面。
近年來,華為投入大量資金進行人工智能開發,建立了MindSpore開源社區、昇騰CANN社區等一系列人工智能研發生態系統。黃之鵬認為,MindSpore和CANN的出現代表著下一代基礎設施的一整套全新思路正式走上舞臺,而未來的深度學習框架發展會集中在幾個重點方向上:
1.互操作性。隨著預訓練模型、跨模態預訓練模型的大量豐富,解決面向不同框架、不同平臺、不同硬件的互操作問題,尤其是通過業界標準解決互操作問題只是時間的問題;
2.高階API。能否有非常好用的高階API,是未來深度學習框架能否發展出茁壯的應用及開發者生態非常重要的一環;
3.SciML。對科學計算/傳統數值計算與深度學習結合的支持,完整的端到端自動可微能力,將成為深度學習框架發展的一個重要趨勢
4.編譯優化。如何設計、擴展能夠更好地優化相關編譯流程,如何進行面向域專有架構的軟硬件協同編譯優化,將成為深度學習框架及編譯基礎設施需要解決的主要問題。