20位行業大咖激辯
編輯部 發自 凹非寺
量子位 | 公眾號 QbitAI
不包含大廠在內,中美相加最后將有五、六家大模型公司笑到最后。
真正有野心的開發者該去做AI-First/AI-Native這類應用。
最快兩年,自動駕駛將迎來「ChatGPT」時刻。
端側推理會造真正的殺手級應用。AI下一個階段更像是“掃雷”游戲。
大模型元年,在MEET2024智能未來大會上,20位行業大咖給出了這樣的年終總結。
ChatGPT給予了高度的評價:看到AI技術在不同領域的應用,真是讓人激動不已。
數百位線下以及近三百萬線上的人類觀眾們也直呼干貨滿滿。
不知道是不是因為科技濃度過高,以至于有網友懷疑嘉賓到底是真人還是數字人……
嗯或許明年就是了。
圍繞著「新起點·再出發」這一主題,本次大會主要分為了大模型時代下的「新思考」、以及給行業玩家帶來的「新應用」、「新終端」以及「新模式」的變革變化。
來,跟著ChatGPT、Claude2等大模型一起來劃重點。
新思考新趨勢
李開復:真正有野心的開發者該去做AI-First/AI-Native這類應用
首先出場的,是創新工場董事長、零一萬物CEO李開復博士,他在今年被《時代》雜志評選為2023年度全球25位“AI領袖”。今年,創新工場塔尖孵化了AI 2.0公司零一萬物,其Yi系列大模型已經交出了業界領先的成績。
40多年前,李開復先后求學于哥倫比亞大學、卡內基梅隆大學,從而入行AI并成為這個領域國際著名專家和投資人。他坦言,40多年來,一直期盼親歷AGI的發生,曾經一度躊躇于“我這一生看不到AGI了”。
但現在,通向AGI的道路正在逐漸清晰。
李開復認為,AI 2.0是有史以來最偉大的技術革命和平臺革命,不僅改寫所有的用戶界面和APP,更會穿透各行各業創造巨大的價值。“AI 2.0帶來的平臺型的機會比PC、移動互聯網時代大十倍。”
當前,中國大模型賽道已經進入到了“百模大戰”階段,競爭白熱化。從創業機會看,雖然大型預訓練模型的創業窗口正在逐漸關閉,但在其他方面,如AI 2.0基礎設施和應用方面,仍有很多機遇。
AI 2.0時代的APP將被注入超級智能,帶來全新的界面和用戶體驗,成長速度將會洗刷新的記錄,會比移動互聯網來得更兇猛,創造更多的價值,帶來更多的用戶。
真正有夢想、有野心的開發者應該去做AI-First、AI-Native這類應用,這些應用將能充分利用AI技術,從而成為最偉大和最具商業價值的公司。
其次,面對現在開閉源模型的激烈戰況,在李開復看來,二者的成長是一個延續的、你追我趕的事情,但是,“最終不會只有一家閉源的、偉大的GPT或大模型公司”。
他預判,不包含大廠在內,中美相加最后將有五、六家大模型公司笑到最后。
在收尾的快問快答環節,李開復表示,并不是擅長所有人類做的事情才叫AGI,只要在某些領域能比人類聰明100倍,這就是一個有價值的AGI。雖然無法評判AI什么時候能夠具有真正的情感比如愛和同理心等,但它在一些領域已經比人類聰明100倍。面對AI 帶來的風險和挑戰,但他認為,技術帶來的問題可以用技術來解決,同時輔以合理完善的法律法規來進行AI治理,讓AI造福更多的人類。
他還表示,傳統的圖靈測試已經不適用于當前快速發展的AI 2.0時代,Agent進入快速落地階段,我們需要更高級的技術來區分AI和真人。
李開復留下一個彩蛋:明年的量子位活動,將由他的數字化身來參會。
李培根院士:機器很難具有像人類那樣的不可名狀的意識流
“制造業需要站在AI巨人的肩上實現突破”,這一點在李培根院士的演講中得以充分闡述。
李培根院士認為AI是一個既知道已知知識又可能生成新知識的“知識巨人”,而制造業要考慮的問題是如何充分利用AI進行創新設計,站在AI的肩上去洞察復雜的關聯。
比如傳統的工業自動化主要處理固定模式、確定性、有因果關系的問題。
然而,工程中實際上也存在大量不確定性、沒有固定模式、并非基于因果關系的但存在復雜關聯的問題:
知識可以看作是數據在時空中的關系。人類通常只能理解和認知一些簡單的、線性的、低階關系,而高階關聯往往認識不到,這就會掉入所謂“暗知識”的大海。
但現在,有大數據、AI技術加持,我們可以站在AI巨人的肩上洞察復雜的關聯。
需要特別注意的是,李培根院士表示雖然機器在很多方面可以超越人類思維,但很難具有像人類那樣不可名狀的意識流。
“意識流”這一概念由美國心理學家威廉·詹姆斯提出:
意識流像一條綿延不斷、不可分割的河流,人的意識由兩方面組成,一些是理性的、自覺的意識,有一些是無邏輯的、非理性的無意識。
李培根院士表示,正是意識流使人類不至于被AI所役使,反而能夠利用AI增強自己的創造能力。
歐陽萬里:AI For Science能讓科學家“多快好省”地端出“美味佳肴”
上海人工智能實驗室領軍科學家歐陽萬里分享了他們實驗室在AI For Science的科研探索。
他將AI For Science形容為美食烹飪,需要AI學者同自然科學家一起合作。
如果把科學研究比作美食烹飪,實驗數據相當于優質食材,而AI for Science則讓科學家們能夠“多、快、好、省”地端出美味佳肴。
于他個人而言,為何從計算機視覺轉型做AI For Science,有兩方面原因:第一、問題本身很重要;第二、問題本身很有趣。
關于問題重要性上,在歐陽萬里看來,自然科學領域面臨著AI領域同樣的問題,甚至還更為嚴峻。
一方面是少標注、少樣本的問題。例如獲得一個蛋白質結構所需的投入時間和資源巨大,可能一位學者投入一年時間才能獲取一個蛋白質的結構,即一個樣本標注。
另一方面還會面臨數據表現形式多樣。自然科學從物理到生物到地球科學,有不同的表現形式,從非常底層的原子表示,分子表示,有基因蛋白表示方式,如果來到地球科學又有大氣的表示。
表現形式本身多樣的形式下,怎么把數據處理好就是一個問題。
既然如此那應該如何解決呢?隨后歐陽萬里結合自己研究團隊成果做了進一步解釋:
在氣象方面,他們推出的全球中期天氣預報大模型風烏,首次實現了在高分辨率上對核心大氣變量進行超過10天的有效預報。風烏提出將大氣變量視作多模態輸入,從而使其得以運用多模態和多任務深度學習方法。風烏突破了傳統預報方法瓶頸并獲得對氣象數據關系的強大擬合能力,僅需30秒即可生成未來10天全球高精度預報結果,在效率上大幅優于傳統模型。
新應用新場景
昆侖萬維方漢:端側推理會造就真正的殺手級應用
昆侖萬維董事長兼CEO方漢分享了《昆侖萬維AGI與AIGC探索之路,從大模型到AI Agent開發平臺》。
方漢分享了昆侖萬維關于AGI的探索歷程。目前昆侖萬維已經構建出自己的六大AI業務矩陣,包括AI大模型、AI搜索、AI音樂、AI游戲、AI動漫、AI社交。他認為,擁有自己的模型生成能力和專有模型對于企業在AI領域的發展至關重要。目前公司已經在國內推出了面向C端的AI搜索產品,此外還計劃面向海外市場推出游戲、音樂、動漫和社交方向的AI產品。
隨后他詳細談到了AI搜索、Agent以及端側推理這三大機遇。
比如AI搜索,他認為能大幅縮短用戶搜索時間并提高信息獲取質量。
他還談到了Agent的重要性,AGI的真正表現形式是Agent,但目前像不少大模型API還是需要一定的門檻。方漢認為,這時候需要Agent,這種低代碼的、大模型的二次開發接口,讓所有用戶都能夠通過Agent讓大模型替自己做實際的工作以及更好地落地。
他還提到了降低AI訓練和推斷成本的途徑,包括技術迭代、內容革命和端側推理。
談及端側推理 ,方漢認為這是個面向所有企業的機遇。只有“端側推理”才是最終的解決方案,才會造就真正殺手級應用的產生。
他認為,目前大模型付費模式只是過渡階段,隨著技術迭代、內容革命和端側推理的實現,AI大模型最終會真正實現免費模式,也只有實現了免費模式,C端應用才會迎來真正的大爆發。
這一波AI一定是大潮將起,落地為王。
商湯王曉剛:未來1-2年智能汽車處在關鍵時間點
商湯聯合創始人、首席科學家王曉剛則是分享了通用人工智能和大模型給智能汽車帶來的技術突破和發展的機遇。
王曉剛認為,ChatGPT改變了人工智能新范式,給AI規模化產業應用打開新道路。這過程最明顯感知到的是算力需求激增,2018年商湯花50億建AI大裝置,很多人不理解。但今天所有談到的大模型,都建立在強大軟硬件基礎設施系統能力基礎之上。
那么現在大模型時代,又有什么樣的趨勢值得關注。王曉剛主要從智能座艙、智能駕駛兩個方面談了談。
在智能座艙方面,他談到了未來可基于大語言模型能力構建座艙大腦,控制艙內各種軟硬件,并借助艙內外傳感器去全方位感知環境和乘客,包括駕駛員的需求。從應用層面來說,目前已經可以看到的趨勢,比如內容生成、AI說明書、健康問診、旅游規劃等等,這些都將座艙內的智能化體驗提升到新層次。
在智能駕駛方面,他主要談到了純視覺方向的發展趨勢。目前智能駕駛系統只有感知這部分用的是AI,其他很多都是基于手寫規則。但要想真正解決各種Corner Case更多還是需要依賴數據驅動,通過大模型去做感知、融合、定位、決策、規控,將所有模塊串聯起來,然后覆蓋盡可能多的場景。
比如像特斯拉端到端自動駕駛解決方案,還有像今年商湯CVPR最佳論文實現多模塊連通的大模型,都是這種思路。
王曉剛做了對智能汽車未來的展望:未來一到兩年,我們智能汽車其實處在一個關鍵突破的時間點。
實際上有三件事,一是端到端數據驅動的自動駕駛,二是以大模型為核心、為基礎的座艙大腦的出現,三是駕艙融合,所有座艙和駕駛的體驗在同一顆芯片,同一個用戶上實現,大幅降低成本和算力,在產品級實現更好的融合,實現更好的智能駕駛和座艙的智能化的體驗。
而所有這些都是以大模型為基礎的。
百度馬艷軍:AI原生應用發展正迎來最好的時代
百度AI技術生態總經理馬艷軍以文心一言為例,全面介紹了知識增強大語言模型,還介紹了圍繞大模型建設的生態以及未來發展趨勢。
馬艷軍指出,要提升大模型的效果,數據和對齊技術尤為重要:
如何使用數據,如何挖掘分析、合成、標注、評估數據,整個閉環非常關鍵。
此外,馬艷軍還從三個方面總結了大模型和此前AI領域其它技術突破的不同之處。
首先是交互方式,“這次真正有了一個顛覆式變化”,未來的應用是通過自然語言的提示詞來調動原生AI應用實現的。交互效果行不行,直接影響了技術的普及。
第二是大幅降低了AI開發門檻,在這之前“要開發一個AI應用要寫非常多的代碼”,基于大模型的應用開發幾乎可以零代碼。
最后大模型不僅對產業應用有影響,也推動了科研的AI for Science新趨勢。
在這幾點突破的驅動下,馬艷軍表示AI原生應用發展正迎來最好的時代,以大模型插件接入為基礎進一步衍生出更強大的Agent智能體,基于這些能力將會催生更多的AI原生應用,數字技術和實體世界加速連接與融合。
馬艷軍也提到,訓練大模型的挑戰很大,這其中包括模型體積大,訓練難度高;算力規模大,性能要求高;數據規模大,質量參差不齊等等。這些問題的存在,目前也對基礎軟硬件提出了更高的要求。
面壁智能李大海:大模型讓人和機器更加平等
面壁智能聯合創始人、CEO李大海分享主題為《智周萬物:讓AI智能體釋放大模型生產力》。
面壁智能是國內最早做大模型的團隊,李大海認為大模型要用在真實生產環境里,最關鍵的能力是邏輯推理。而面壁智能也著重在模型的邏輯推理能力方面進行了攻關和提升。
據他介紹,面壁智能最新推出的千億多模態大模型CPM-Cricket可以對標GPT-3.5的水平,同時邏輯推理能力十分突出。為了測試模型的邏輯推理表現,面壁智能還給大模型做了公考行測考試,結果顯示其總正確率達到63.76%,甚至超過GPT-4的61.88%。在英文的GMAT測試中,面壁智能大模型的分數是GPT-4的93%,已經非常趨近。
當下大模型的技術路線在整個產業界已經形成了共識,但大模型變革到底是像web3這樣的技術浪潮還是十年為期的產業革命?
李大海認為,大模型是第四次技術革命,可以和工業革命、信息革命相提并論,這場革命將至少持續20-30年。
除了大模型之外,李大海還談到了智能體(AI Agent)的發展,他認為智能體需要這樣幾個特性:人設、智商、情商、感知、價值觀和成長性等。對于成長性,李大海認為目前還是基于數據閉環類似T+1或T+2的模式,未來希望能實現更為實時的成長性。
李大海打了個比方,大模型像是汽車引擎,但還需要轉向系統、汽車底盤、內飾等各種配件組裝起來,才能真正提供一個完整的汽車產品。所以智能體需要在大模型基礎上疊加更多能力才能實現更多應用和想象空間。
當更多單體智能開始協作之后,它們將能發揮出更大的生產力。這時候就形成了更高級的智能——群體智能。自然界中就有很多類似案例,比如蟻群、蜂群、魚群等,它們帶來比個體更高的智能表現。
基于這種思考,過去幾個月,面壁智能共發布了三個智能體框架:AgentVerse,內部包含非常多專家的智能體通用平臺;ChatDev,多智能體智協作開發平臺;XAgent,綜合能力全面超越AutoGPT的超強單體智能應用框架。目前,面壁智能的“大模型+Agent”技術已在金融、法律等場景都有落地。
未來是否會存在基于大模型的超級應用呢?李大海認為大模型技術帶來的最根本變化,是人與機器之間關系的變化:機器變得更像人,人和機器會更加平等。
演講他還分享了面壁智能提出的“Internet of Agents”概念,他們認為未來世界將會是一個由智能體所連接的萬物智聯的世界。
小冰李笛:AI下一階段更像“掃雷”游戲
小冰公司首席執行官李笛的分享,從人們熱議的“人工智能著作權第一案”開始說起。
乙某在文章中使用了一張圖片,而圖片由甲某用開源AI繪畫軟件生成。法院判定乙某侵犯了甲某的知識產權,支付了500元賠償費用。
“500元的賠償費,可能是這張圖片目前為止在商業世界中,所能夠獲得最大的一筆回報了。”這就引出一個話題點——AI在創造巨大的價值,但并不會收獲同等高的價值回報。
李笛表示,其實這就是今天AI領域商業模式的困局之一。
過去一年,AI技術取得了巨大進展,針對AI產品的偏見在迅速消融,李笛眼中,過去的一年是這個行業的黃金一年。
具體來看:
生成式AI模型效率提升巨大。幾年前,想要創造能夠一個能評價文章的AI-being時,需要針對82類知識圖譜構建它的三觀,要花費約6個月時間。現在只需極短時間就可實現。
社會對AI的偏見正在消解,給予AI更大容錯空間,有利于技術快速發展。
但是,李笛觀察到,目前AI應用普遍面臨商業化難題:
一方面,現有API調用付費模式難以體現AI系統的創造力價值。以文章寫作為例,AI完全取代撰稿員后獲得的市場規模非常有限。
另一方面,多數垂直領域AI系統替代人工作后獲得的收入,與替代的商業價值嚴重不匹配。
李笛認為需要找到新的商業模式,讓AI系統能夠直接從內容創造中獲得收益份額。
他還在分享中強調,AI仍處于技術創新高速迭代的階段,未來在他眼中不像是槍響后賽道確定的賽跑,更像是不知AI能力上限的“掃雷”游戲。
這一階段,需要多樣化探索和寬容心態,才能抓住近兩年巨大機遇,真正實現技術向應用場景的轉化,改變人類生活。
螞蟻楊銘:從業務和應用緯度擁抱多模態大模型
科技是創造未來的核心動力——螞蟻集團研究員、百靈多模態大模型研發負責人楊銘一上臺,就拋出了這句話。他表示,這是螞蟻集團一直所堅信的。
在這句話的引領下,在過去一年,螞蟻集團集中力量技術攻堅交出了答卷:百靈語言大模型和多模態大模型。
螞蟻為什么需要多模態大模型?
楊銘介紹,螞蟻具備豐富的多模態理解應用場景,可以分為兩個緯度來看。從業務緯度來看,有數字支付和數字金融;從應用緯度來看,有圖文理解、視頻分析、和圖像視頻內容生成。
為此,螞蟻集團從無到有,收集了數十億張中英文圖文對,通過無監督學習,訓練出一個百億參數級別的圖文理解基礎大模型。
從零開始訓練會面臨許多難題,比如缺乏開源初始化權重,train from scratch不收斂;比如訓練成本高昂,迭代周期長;再比如訓練集群調度和穩定性問題。
最終,通過分階段訓練策略,螞蟻解決了收斂問題;高昂的訓練成本則通過優化訓練算法、IO與存儲、高效并行訓練平臺解決。
楊銘在現場介紹,在這個圖文模型的基礎上,螞蟻衍生出了很多下游的垂類模型,包括將圖文理解模型應用到圖文對話、視頻理解,以及文生圖、圖生圖等。
有了圖文對話的能力,從應用角度,螞蟻開始逐漸落地到業務領域。譬如,廣告內容審核就是業務領域的典型場景。在圖文理解的基礎上,螞蟻引入了時序的建模,分析幀與幀之間的關系,理解運動,從而能將圖文模型擴展成視頻任務模型,支持視頻到文本的檢索、文本到視頻的檢索以及視頻內容生成跟理解。
此外,楊銘表示針對圖像生成模型難以直接投入產品應用的問題,螞蟻開發了若干可控生成技術,通過自參考圖提取目標風格實現可控風格泛化,只需要輸入單張圖像即可實現風格遷移、人臉特效等效果,大大加快了技術到產品的節奏。
360梁志輝:大模型時代讓所有人可被增強而非被取代
360集團副總裁、360大模型應用負責人梁志輝則分享了他們大模型應用在企業生產的落地心得和案例。
首先梁志輝認為大模型時代,模型跟人的關系不是取代而是增強。所有人無論在日常辦公、企業營銷上,大模型能將人的閱讀、寫作、查找的速度大大提升起來。
但生成式AI或生成式大模型并非萬能,很多大模型現在還存在幻覺、缺乏行業知識、需要提示詞工程等挑戰。
以提示詞工程這一點為例,提示詞模版非常復雜,只有AI發燒友才有可能精通,這樣不有利于大模型的推廣。其次,高質量內容很難靠大模型生成,要想推廣大模型就要揚長避短。
基于這種思考,他們選擇以一種全新的人機協同方式落地——讓大模型變成每個人的助手。
大模型的長處在于內容生成和內容理解。過去很長一時間,看到很多聊天機器人的誕生。但這種機器人就像是小學生對大模型進行催眠,告訴大模型現在是某個角色,并按套路提供答案;但它并不了解產品、公司以及協作方式。
梁志輝表示,我們希望讓大模型能夠像一個掌握多種技能、具備行業知識,會使用多種工具的自主智能體Agent。這個Agent以整個互聯網做它的知識背景,能夠被訓練,可以幫你查匯率、查天氣,甚至訂機票。
基于千億大模型和Agent架構,梁志輝分享了他們現在關注的三大場景的應用:智能營銷、智能辦公以及智能客服。
尤其像這個諸葛亮數字人做文旅,會上備受觀眾和網友們好評。
新終端新交互
Rokid祝銘明:明年XR技術熱度可能超過AI
未來5年,希望把所有人的眼鏡換成智能眼鏡。
上述這句話,就是Rokid創始人&CEO Misa對不久的未來的堅定展望。
在演講中,Misa分享了他對AI與AR技術融合的看法,以及Rokid如何將這兩項技術結合在一起,打造新一代人機交互平臺。
2014年,Misa離開阿里巴巴,創立了Rokid。在他看來,AI和AR技術分別代表了對物理世界和數字世界的理解和交互能力,而他本人背負的使命,就是把AI和AR融合在一起,“融合成一件事情”。
大家更容易被硬件抓住眼球,但實際上,Rokid(不僅僅是一家眼鏡公司,而)是一家致力于AI和AR人機交互的公司。
現場,Misa將Rokid的打法進行了拆解:通過在硬件、軟件、算法等方面的持續打磨,逐步將產品推向消費者市場。
今年,Rokid發布了消費級OST(Optical See Through光學透視)個人空間計算平臺Rokid AR Studio。
空間計算是什么?Misa給出的解釋,是其本質是物理世界和數字世界的融合,以及在這種融合下如何用自然、易用的方式進行信息的展示和交流。
他進一步補充道,行業目前有兩條路線——
一條是以Apple為代表的VST(Video See Through),是把用戶包裹在一個純粹的數字世界里,通過傳感器把物理世界數字化、在虛擬世界里重建。
一條則是Rokid選擇的OST,更輕量化,在數字世界疊加真實世界,讓用戶用肉眼去感知。
Misa給出了自己的判斷:短期內,兩條路線沒有對錯,并將長期共存。
“誰是更好,誰不好,還是交給時間去解決。”Misa最后表示,他相信明年XR技術將取得更大的突破,熱度甚至可能超過AI。
vivo周圍:大模型目前最能完成體驗閉環和商業閉環的場景就是手機
2023年下半年開始,全球手機廠商紛紛加速,把大模型“塞”進手機。
以vivo為例,該公司的大模型戰略可總結為5點:大而全、算法強、真安全、自進化、廣開源。
具體做法圍繞兩步走,一是大模型開發,一是大模型落地。
大模型開發方面,該公司正式發布自研AI大模型矩陣藍心大模型,以及全新手機操作系統OriginOS 4。
vivo副總裁、OS產品副總裁、vivo AI全球研究院院長周圍在MEET2024大會現場分享,藍心大模型包含十億/百億/千億三個參數量級,共5款大模型。如今,70億參數版本對外開源,130億版本在端側跑通。
大模型如此神奇,是因為它將人類數千年的文明知識進行了高緯度的抽象,并壓縮成每個人都可以獲取的知識和信息。
再來看大模型落地應用方面,vivo的軟硬結合路線。
硬件方面,和芯片廠商深度合作,加速大模型上手機;軟件方面,推出多種應用形式、并和底層系統深度融合,讓消費者能更快上手體驗。
但腳步不應該在這里停滯。
周圍透露道手機廠商更加關注大模型應用給人帶來的實際體驗如何,因此他認為,大模型還要有像人類一樣的邏輯思維、情感和價值觀。
在這一點上,最能完成體驗閉環和商業閉環的場景就是落地在手機上,打造智能體。
周圍說道:“未來,我們希望利用AI的能力,進一步重構系統,并通過智能手機的普及,攜手邁向智能體時代。”
小米欒劍:大模型從技術參數上秀肌肉,沒什么意義了
在小米看來,大模型有三要素:大數據、大參數、大任務。這里面哪個才是大模型產生泛化能力的關鍵?
小米集團技術委員會AI實驗室大模型團隊負責人欒劍給出了他的觀點:
我們覺得參數量并不是一個最關鍵的因素,小一點的模型也能產生泛化能力。
這一觀點,也體現在了小米對大模型研發的全過程中。
2016年,小米就已開始在AI領域布局,近幾年對AI的投入更是持續增長。據透露今年技術研發總投入預超200億,預計最近5年(2022-2026)會投入1000億。
小米大模型的突破點不是“大”,而是輕量化和本地部署。
欒劍表示,這和小米的特色有關,小米有各種各樣的硬件設備,是全球最大的消費級IoT平臺,截止今年第三季度,聯網設備總量近7億,擁有5臺以上小米IoT設備的用戶數達到1370萬。
小米的想法是把大模型當作大腦,搭載到硬件設備中。
就像有一臺掃地機器人,它可以不會聊天,也可以不用寫小作文,但它需要會路徑規劃、躲避障礙物等。
欒劍談到,“小米特別關注的,并不是行業所說的通用大模型,也不是垂類大模型,而是場景大模型”。
從技術參數上來秀肌肉我覺得沒有什么意義了,接下來我們回歸到怎么把大模型用好。
接下來小米還要探索同場景多設備協同、跨場景設備。欒劍表示云邊端結合是將來發展很重要的一條路徑。
最后欒劍就“大模型應用成敗關鍵是什么?”這一問題,給出了自己的看法:
所有應用都有兩個關鍵點,一個是流量入口在哪里?另一個是用戶粘性靠什么?
欒劍認為大模型本身是一個入口,而跟操作系統深度融合,操作系統就是入口,歸根結底操作系統需要一個硬件。至于用戶粘性,要探索如何讓大模型無處不在地融入日常生活。
即“入口在硬件,粘性靠生態”。
新模式新機遇
高通顏辰巍:只有當生成式AI在端側廣泛部署,才能實現真正大爆發
當前,生成式AI模型復雜度持續上升,圍繞基礎模型的新應用在不斷涌現,并且用戶數量也在不斷增加。
基于此,高通技術公司產品管理高級副總裁顏辰巍帶來的思考是:AI最終要落地在端側,才能實現真正大爆發。
為什么要在端側支持生成式AI,高通有三點考量。
一是云端AI模型推理成本高昂,當數十億用戶都在使用越加復雜的模型時,云計算推理綜合成本會急劇增加,云經濟難以支持生成式AI規模化擴展。
二是大量數據本身就發生在端側,在終端側處理AI是最經濟的,也能夠更好的保護用戶隱私。
三是有些應用場景可能沒有5G數據連接,比如在野外,車座艙里的司機與車交互的應用。這時候就必須有本地計算能力。
所以只有當終端就能運行基于AI大模型的用例時,端側與云側能很好的結合,生成式AI才能大規模普及,發揮出所有的潛力。
此外,大語言模型的性能正在變得愈發強大,隨著基礎模型的創新,很多用例可以完全在終端上運行。而這將實實在在的改變人們互動的方式。
為實現端側AI算力突破,顏辰巍介紹到高通近期發布了兩款專為生成式AI而打造的全新平臺,面向PC的驍龍X Elite和面向智能手機的第三代驍龍8。顏辰巍指出,第三代驍龍8能夠支持在終端側運行高達100億參數的生成式AI模型,并以20 token/秒的速度運行大語言模型,而驍龍X Elite是高通公司迄今為止面向PC打造的最強計算處理器,支持在終端側運行超過130億參數的生成式AI模型,憑借快達競品4.5倍的AI處理速度,將繼續擴大高通在AI領域的領先優勢。
浪潮信息吳韶華:從GPT-3到GPT-4訓練模式的變化需要算法與數據的同步改進
浪潮信息AI軟件研發總監吳韶華,在MEET大會的舞臺和大家一起回顧了GPT-3到GPT-4/ChatGPT發生的重要變化。
GPT-3是一種預訓練大模型,直接通過提示詞來使用;而GPT-4則在預訓練之外,引入了微調和強化學習等技術,極大提升了模型的能力。
“OpenAI和DeepMind等都在大模型的擴展率上做了很多工作。”吳韶華補充了目前業界的一種共識,他舉例說,“比如說在給定模型結構的情況下(即Transformer結構),隨著模型參數量增大、投入算力規模和數據規模越大,模型的精度往往會更高。以往這些擴展率的研究是在預訓練的范式下開展的。在預訓練+微調的范式下,尤其在微調的重要性越來越高的情況下,如何改進算法、數據以適應預訓練與微調不同階段的特性,值得我們重新思考。”
吳韶華分析認為,從GPT-3到GPT-4訓練模式的變化需要算法與數據的同步改進。
他拿實踐經驗來證明浪潮信息在這方面的思考:
2021年9月,2457億參數的經典Transformer結構大模型源1.0發布,2023年9月,浪潮信息又新發布了源2.0。兩個版本的迭代的最主要改進,體現在三個方面——
第一是算法的改進。浪潮信息提出了一種新型注意力機制LFA(Localized Filtering-based Attention),針對自然語言的局部依賴關系進行了建模,通過考慮單詞之間的局部依賴關系,相比LLaMA結構模型精度提高4.4%。
第二是數據的改進。源2.0與源1.0相比,在訓練數據來源、數據增強和合成方法方面進行了創新。與一味提升數據的體量相比,源2.0更注重提升數據的質量。由于中文數學、代碼數據資源有限,源2.0的訓練數據來源除了互聯網,還采用了基于大模型的數據生產及過濾方法,在保證數據的多樣性的同時也在每一個類別上提升數據質量,獲取了一批高質量的數學與代碼預訓練數據。
第三是計算的改進。針對多元異構芯片間P2P帶寬的極大差異,浪潮信息提出了一種非均勻流水并行的分布式訓練方法,大幅減少對芯片間互聯帶寬的需求。
吳韶華介紹,源2.0發布后,浪潮信息發布了“源2.0大模型共訓計劃”。開發者可以將模型在應用場景中的能力缺陷進行反饋,浪潮信息研發團隊將收集、清洗相關數據進行模型增強訓練,訓練后的模型將持續開源。
潞晨卞正達:分布式算法降低大模型部署門檻和訓練成本
潞晨科技聯合創始人兼CTO卞正達帶來的主題是“Colossal-AI:AI大模型的挑戰與系統優化”。
他首先介紹了大模型的時代背景,AI模型訓練成本日益增長的趨勢。由此引入Colossal-AI框架,通過分布式算法來降低大模型的部署門檻和訓練成本。
卞正達具體介紹整個框架的設計思路,主要包括三大核心技術。
一是N維并行系統。卞正達團隊發現此前市面上已有眾多并行技術,但更多普通用戶拿到實際需求以后,很難選擇真正合適的并行方案,來轉化成實際落地的解決方案。
由此,Colossal-AI框架的核心思路是把目前最高效的并行技術整合到一套系統里,根據不同用戶的需求選擇合適的并行方案,同時提供最高效的落地實現。
第二點是高效的內存管理系統。卞正達表示,在深度學習訓練中,計算較重的板塊集中于存儲開銷比較少的部分,反而存儲開銷比較大的部分都集中在優化器的參數更新上。
所以他們的思路是把冗余的存儲開銷放在比較便宜的存儲設備上,反映到Colossal-AI框架中,他們通過自適應的管理系統實現更高效的管理參數的存放。
除此以外,Colossal-AI還實現了Chunk的管理系統,為異構的存儲也提供靈活管理。
通過上述系統優化,Colossal-AI框架大幅降低了部署AI大型模型的門檻,模型訓練和推理速度都得到了提升。
卞正達分享了Colossal-AI框架的實際應用效果,只用了不到1000美元,就把LLaMA-2模型成功遷移到了中文模型上。
圓桌對話:最快兩年,自動駕駛將迎來「ChatGPT」時刻
還有每年MEET大會的保留節目自動駕駛圓桌對話。今年討論的話題是「自動駕駛的ChatGPT時刻,還有多遠?」
ChatGPT掀起的浪潮讓所有人都看到了生成式AI帶來的顛覆性影響,那一直備受關注的自動駕駛,什么時候才會迎來自己的ChatGPT時刻?本次大會邀請到新一波自動駕駛創業代表前來分享。他們是:
DeepWay深向聯合創始人兼CTO田山,也曾是百度Apollo商用車項目負責人。
千掛科技聯合創始人廖若雪,他是曾在李彥宏和張一鳴身邊被稱為“技術天花板”的男人。
還有“自動駕駛領域天才少年”、零一汽車創始人兼CEO黃澤鏵,之前是圖森的聯合創始人。
對于這個話題,田山從兩個角度來看,技術本身,通常完全自動駕駛一定是需要的,但還需要一段時間的突破。但從需求看,目前很多限定場景里面自動駕駛不需要使用大模型就能完成的很好,但要實現通用場景,大模型不可或缺。
廖若雪就談到實現「ChatGPT時刻」的關鍵標志,則是自動駕駛能不能被廣泛認知到和看到。從他們商用車角度,就是越來越多客戶意識到自動駕駛能帶來明顯的降本增效。
黃澤鏵的觀點則更為樂觀一些,他認為現在ChatGPT展現出來的能力已超過了自動駕駛本身所需的知識能力。
「ChatGPT時刻」的關鍵要素
那么具體如何實現呢?黃澤鏵談到了背后一個關鍵要素,就是將分模塊融合起來,在路徑上實現端到端。以往去做感知需要人為去定義,但如果以數據驅動、基于大模型就可以解決更多長尾場景。
廖若雪則提到了閉環的重要性,他認為自動駕駛相關數據還是低數量級,那么如何獲取并使用好數據,大模型是很好的路徑,但數據從何而來,只有有足夠多的客戶能夠用起來,才能獲取大量的數據。這樣技術生產與商業落地形成一個相互促進的閉環。
田山則談到了三個方面的挑戰,第一是公認的數據挑戰,且各家都不一樣導致復用很困難;第二是算力的限制,端到端自動駕駛需要足夠大的數據量和算力;第三,安全性問題。建議在端到端的學習過程中,能夠加入一些人工干預來確保安全性。
什么時候能到ChatGPT時刻?
今年還有個很大的因素在于政策。創始人們談到政策給整個行業,包括客戶、投資人很強的信心,是一個很好的推動方式。?澤鏵還補充道,但這并不是終極的政策。只有足夠多的數據做支撐,才能有進一步探索。
既然如此,什么時候能到ChatGPT時刻呢?
廖若雪認為是2025年。
?澤鏵認為也是兩年時間。
而田山則保守估計在三到五年時間。
后續還將有大會嘉賓更詳細版內容分享,敬請關注!