5 月 12 日,2023《麻省理工科技評論》中國“十大突破性技術”主題峰會在杭州余杭舉行。峰會不僅將對 2023 年的《麻省理工科技評論》“十大突破性技術”進行深度解讀,同時也回顧、梳理了過去二十多年來“十大突破性技術”背后的科技、經濟、社會乃至人文的發展脈絡。在技術變革風起云涌的當下,峰會還將今年的“十大突破性技術”與當前科技熱點進行結合,探討了 AIGC、芯片、新能源和生命科學等技術領域的前沿變革與展望。
在“打開 AIGC 的‘黑匣子’”板塊,峰會邀請了之江實驗室智能計算平臺研究中心高級工程專家潘鵬凱擔任主持人,圓桌嘉賓包括了 HiDream.ai 創始人兼首席執行官,加拿大工程院外籍院士梅濤、IDEA 研究院講席科學家張家興、微軟亞洲研究院首席研究員段楠,四人作為業內專家以圓桌討論的形式深入剖析 AIGC 背后原理與隱患,分享 AIGC 最新趨勢和發展方向,并探討它將如何顛覆傳統行業。
圖:圓桌討論:打開 AIGC 的“黑匣子”
作為此次圓桌討論的開場,潘鵬凱表示,如今 AIGC 已經成為最熱門的技術話題,同時這個行業的發展速度超過了外界的預期,在驚艷全球的同時也引起了很多人的焦慮。
關于 AIGC 的現狀與發展,如今的大語言模型在自然語言的理解和生成方面取得了非常顯著的進展。但同時也還存在一些顯著的問題,比如大家在使用過程中依然能看到其生成的內容并不保證完全正確,以及在為人類完成更復雜的任務時,大語言模型也會暴露出較為明顯的能力邊界。以通用人工智能的標準來衡量的話,目前進步的空間還很大。
圖:之江實驗室智能計算平臺研究中心高級工程專家潘鵬凱
對于 AIGC 引發的擔憂,段楠在圓桌討論中表現出樂觀的態度,他認為尤其從 ChatGPT 開始,很多人已經真切地在工作或者生活中體會到了人工智能模型的賦能效果,在工作、生活、以及娛樂等方面,ChatGPT 等 AIGC 產品極大地提升了人們的效率,也讓人們在工作時可以更注重生產力和創造力。段楠認為現在人工智能的發展還是處在非常可控的階段,對于人類社會的影響是利遠遠大于弊的。
張家興表示,AIGC 的誕生可以說是機器學習發展到巔峰的一個產物,借助非常海量的數據、非常強大的算力(這是目前很多公司都無法負擔得起的強大算力),讓我們終于可以看到 ChatGPT 這樣的產品的誕生。
如果要進行一個對比,機器學習最大的優勢就是模型能學習的數據量遠大于人學習的數據量,但機器學習和人類相比,最大的劣勢是沒有進化的部分,人類的智能不只是出生之后學習得來,一個人在出生時就已經具備了一定的學習基礎,這部分先天的能力就是進化的產物。考慮到幾十億年進化過程,實際上人類擁有的智能如果都換算成數據和算力,現在機器學習仍然比不上人類。所以,隨著機器學習繼續發展,最終到底是見過足夠多數據的機器學習方式更有優勢,還是人類的學習方式更好,這都是沒有答案的問題,當然,兩種智能學習方式的互補是更值得期待的。
圖:IDEA 研究院講席科學家張家興
在拿 ChatGPT 與人類做對比時,梅濤表示,如果僅從參加各種考試的表現來看,ChatGPT 已經達到了人類大學生水平,但在更多推理、意識的層面,就算是 ChatGPT 這一業界頂尖的產品也還處在很早期的階段。為了規避 AIGC 未來發展可能帶來的風險,梅濤認為,業界應該要讓 AI 學習更好、更優質的數據,同時在應用時也應該考慮加上一些合規的手段,來控制模型或者算法能夠始終走在正確的路徑上。
對于 AIGC 的未來展望,AI 的橫向、縱向發展問題也是業界討論的焦點,在 AI 發展迅速已經被大家認可的情況下,這兩種潛在的發展路徑也被逐漸展開討論。沿著縱向發展意味著,AI 技術、AGI 真正能創造一些人類沒有創造出來的成就;而橫向發展,意味著 AI 會在各個細分領域逐漸延伸,達到人類最聰明的科學家在各個領域設下的認知邊界。
梅濤表示,AIGC 領域的模型還有很多的突破空間,比如在文本創作、語言創作方面,目前 GPT 已經到了相當高的水平,但是能力還沒有到達邊界。但是在多模態領域,目前的模型還處于 GPT1.0 或者 2.0 的階段,所以梅濤認為 AIGC 依然有很多成長的空間。
圖:HiDream.ai 創始人兼首席執行官,加拿大工程院外籍院士梅濤
在這個話題上,張家興認為 AIGC 在橫向和縱向兩個方面都會有進一步的發展。橫向,就是基于當下大模型的技術推動各種產業、各個領域、垂直方向上的落地。但在這件事上,由于每個行業、領域乃至公司,都擁有自己的技術、產品、用戶和數據,通用大模型需要更多細分領域的數據才能在細分場景里形成閉環,但這個閉環還遠未成形。
縱向上,今天 ChatGPT-4 已經做得相當優秀,不過我們看到它能實現的功能還只是冰山一角,以通用人工智能的標準,GPT 沒有實現的功能還遠遠多于已經實現的功能。當下的 GPT 具備的能力都是算法工程師通過機器學習的算法讓它具備的,但要在和人交互的過程中繼續學習,逐漸具備中學生、大學生的水平,顯然這個模型目前是不具備的這個能力的。張家興表示,我們在提到通用人工智能時,其中有一個重要的標準就是學習能力,目前的通用人工智能是完全沒有學習能力的,因此這是我們接下來要去攻克的一點。
圖:微軟亞洲研究院首席研究員段楠
段楠在談到這一問題時也表示,橫向縱向都有廣闊的發展機會。首先,大模型在縱向上仍有很大的成長空間,目前的大模型的能力更多留在文本、代碼和圖像方面,未來還可以覆蓋更多數據類型,比如聲音、視頻甚至是觸覺、嗅覺等,因此現有的模型還可以按照不同模態的數據繼續發展。此外,段楠表示 AI 的系統不一定僅限于某個單一的模型,而可能是一個模型網絡,通過鏈接其他的模型和功能,在組合中創造出更加豐富的任務能力。
延續著 AI 往橫向或縱向發展的問題,潘鵬凱繼續對話段楠:AI 何時能夠創造人類從未看到過的范式或數學公式?段楠表示,以數學為例,目前的大模型在創造力方面還沒有達到人類頂級數學家的高度,不過模型已經在大量的樣本里學習,目前業界的努力方向是發揮大模型抽取樣本背后的規則的能力,這更多是一個歸納而不是創造的過程。段楠認為 AI for science 未來會有更多創新的突破。
緊接著是一個針對性的問題拋給了張家興:為什么 Facebook 一直在開源,而谷歌反而要閉源? 張家興表示,此次大模型迅速發展完全得益于整個開源的社區,但到了今天,包括谷歌在內的一些大公司認識到,開源開放有助于團隊和個人的成長和突破,但對公司本身收益并不大,所以未必是一件好事。在谷歌帶頭之下,張家興認為未來大的科技公司一定會減少開源開放,但我們還是要堅持貢獻更多的開源通用人工智能大模型,希望能夠幫助所有人擁有自己的專業大模型,讓模型優化和場景數據形成閉環,這是 AGI 時代商業成功的關鍵。
AIGC 概念的大火也讓這個賽道擠滿了各路大科技公司和想要抓住技術機遇的初創公司。要在激烈的競爭中找到自己的定位、脫穎而出,梅濤表示,這輪 AIGC 熱潮里的創業門檻其實非常高,首先是人才的門檻很高,頂級技術人才是支撐大模型的基礎;其次是算力,尤其是高精度算力的門檻也很高;最后,訓練模型還需要用到高質量的數據,這也是開發大模型的數據門檻。在這樣的背景下,梅濤認為,創業團隊有高密度的科技人才是成功的基礎,而在賽道選擇上,創業團隊要聚焦自己的優勢賽道,此外,“跑得快”對創業團隊來說也至關重要,要發揮作為創業公司的優勢,聚焦做好小領域,才能在與具備資源優勢的大公司面前有立足之地。
在討論的最后,四位論壇嘉賓分別對明年以及十年以后的 AIGC 的發展給出了各自的展望和預期。
段楠表示,展望 AI 未來一年的發展,首先基礎模型還會繼續發展,同時在多模態方面能夠覆蓋更多感官;另外,模型的推理能力會得到進一步提升,且當它們找到自己的“手和腳”、學會制造和使用工具,將能夠完成更多我們以前不敢想象的創新任務;此外,在模型的可解釋性方面,業界會推動模型往更可控、更可靠的方向發展。
張家興則表示,未來一兩年將是語言大模型繼續成長的階段,在技術上一定程度上替代深度學習技術;而更長期來看,大模型在縱向上可能會繼續深入,并與物理世界產生直接交互,甚至進行一些主動的思考。此外,一些 AI 智能體可能會出現,與人類共享這個社會,形成人+機器的新智能文明。
梅濤則預期,十年后的場景十分令人期待,首先大模型將具備多模態的能力;大模型、AIGC 將對社會上幾乎所有行業進行重構,生產力提高十倍以上;在這樣的背景下,有很多人類崗位會被替代,當然也會誕生很多新崗位,但總的來說人類的生活將變得更加美好。
潘鵬凱在總結時表示,“十年以后人類要么永生了,要么被滅亡了”以這個非常極端的預測作為論壇的結尾,也希望我們終究走向永生。