【ITBEAR】《思想大爆炸——對話科學家》欄目第92期,對話中國科學院院士,北京大學教授梅宏。
嘉賓簡介:
梅宏,中國科學院院士,北京大學教授,計算機軟件專家。主要從事軟件工程和系統軟件領域的研究。
劃重點:
1. 現在的大語言模型技術路徑無法通往AGI,幾年內可能會達到天花板。
2. AI還取代不了人類,它缺乏創造力,只能說是輔助性工具。
3. 從科技倫理的視角來看,智能是人類的專有特征,特別是認知能力,我們為什么要去造出一個替代我們認知的東西?
4. 機器沒有所謂的什么意識,也沒有涌現,它本質上還是把已經存在的內容進行基于概率統計的整理和組織。就這個意義而言,大語言模型可被視為是已有“語料”壓縮而成的“知識庫”。
作者|鄭松毅
編輯|楊錦
近日,第二十一屆中國計算機大會(CNCC2024)在浙江省東陽市橫店舉辦。
大會期間,圍繞AI大模型發展現狀、是否存在“泡沫”現象、以及AI是否將對人類生活構成威脅等話題,與中國科學院院士,北京大學教授梅宏展開了對話。
梅宏直言,“當前的AI技術路徑缺乏創造力,無法通向AGI(通用人工智能),更做不到替代人類。從人文和科技倫理的視角看,追求讓AI去替代人類本身就是個錯誤的想法。”
他提到,“除了技術問題,還有倫理道德、知識產權以及產出質量等諸多問題尚未解決,大模型在應用層面還面臨著不小的挑戰。”
這段時間,大模型戰場的炮聲變小了。外界疑惑,“大模型的路,還走得下去嗎?”
在梅宏看來,“現有大模型主要是靠數據驅動實現,但可見的是,可開放訪問的數據已經被‘吃’得差不多了。不難預測,大模型能力的天花板在未來幾年內或將到頂,當然輸出內容的質量還會不斷改善。”
他還呼吁,中國的科研人員應該培養批判性思維,為人師者也應該抱有共同學習的心態。不怕爭論,思維碰撞的火花應該再多一些,別怕走別人沒有走過的路。
在科技競技場,很多人把美國看作是“排頭兵”,疑惑如何才能找到“從0到1”的創新路徑?
梅宏說,“絕大部分“從0到1”的原始創新都不是規劃出來的,無前路可尋,基本都是來自基于興趣去探索未知。”
他指出,中國當下的要緊任務是形成良性的科研文化。“中國在科研領域全面發力也就是不到30年的事,在短時間內能有今天的成就,我認為很了不起。”
以下為對話實錄(經整理編輯):
:今天是“1024”,聽了您的演講,我想程序員們可以好好過節了。您說AI替代不了程序員,為什么這么肯定?
梅宏:這是現有AI技術路徑的底層邏輯決定的。現在的AI沒有我們人類的智能,自然無法取代。當然,未來是不是會出現別的技術路徑,有可能走向“替代”,還不好說。
但AI確實能幫助程序員提升開發效率和質量,如推薦代碼、代碼補全、避免低級錯誤等。但總的來說它還是輔助性工具,缺乏用軟件實現業務需求所需要的創造力。
另外,AI在應用層面還有很多問題沒有解決,比如倫理道德、知識產權以及產出質量等。
人類智能是地球上的頂端智慧,也沒有那么容易被取代。實際上,在計算機、AI發展早期的主流媒體報道中,“替代”人類的聲音一直都有。只不過,早期報道的主角是計算機,也是涉及兩個方面:“盲目、過度的高估”和“脫離實際的擔憂”。
這些報道放到今天,主角換成AI,仍然可以適用。只是紙質媒體的傳播影響有限,遠趕不上今天互聯網、自媒體時代的喧囂。
:您也不認同機器取代人這件事兒?
梅宏:從人文和科技倫理的視角來看,去追求替代人的認知、替代人的智能,到底有沒有必要?
大家想一想,智能是什么?是人區別于動物的最重要的特征。人為什么能成為地球上生物鏈的主宰,成為地球的主人?就是因為他的智能,他的認知能力,歸納演繹等邏輯能力,還有我們的語言。
我們為什么要去造出一個替代我們智能的東西,進而讓出我們地球主人的地位?
我個人是反對追求AI取代人類認知的。我們應該是把它視為工具,來幫助我們做好各類事情,提升做事效率和質量。
:但是現在產業上已經在做了,機器越來越強大。
梅宏:AI技術確實進步很大,但其中炒作和泡沫也很多。
我還是想從科技倫理的視角來看這個問題,智能是屬于人的。現在滿社會都在炒作“智能”,似乎人類做的事已經不是智能了。
舉一個例子,很多“設計”均屬于人類的智力創造性活動,當然用計算機輔助設計無疑會大大提升效率。但現在很多人只提所謂“智能設計”,實際上它只是“AI設計”。AI設計是“智能”,那人的設計是什么?
:今年聽到很多質疑的聲音,說大模型越來越“吃”算力,訓練的數據也面臨枯竭,您判斷大模型未來的三五年會怎么發展?
梅宏:我們應該看到,目前成功的兩個領域都是因為有了大量的數據:一個是自然語言文本,人類數千年來,通過語言記錄積累了海量的文本資源,在互聯網上能夠公開訪問的文本語料是大語言模型成功的重要因素。大語言模型實際上是壓縮了人類已有的可公開訪問的絕大多數知識。另一個就是文生視頻,互聯網上已經存在了海量的視頻數據。
但是到別的領域就沒有那么多數據了,這是當前大模型應用落地面臨的最大問題。當然,也還有其他障礙,如模型行為的不可解釋性導致缺乏可信性等。
很多人問我行業AI應用怎么推進?我給出的建議是,面對AI技術發展現狀,如果對AI的落地應用有所疑問和彷徨,那么,積累數據——可采盡采、能存盡存。
我非常認可當前AI技術的進步,但我反對過度泡沫化。當前的AI仍處于Hype Cycle的高峰階段,喧囂埋沒理性,對成功個案不顧前提地放大、泛化,以偏概全,甚至神化AI的預期效果。我以為,我們需要一個冷靜期。
我也認為,沿襲當前的技術路徑,AI的能力“天花板”已隱隱可見。
:天花板在哪?
梅宏:很可能就在幾年之內。這里我指的是大模型能力的天花板,模型產出內容的質量還是會有不斷改善。
:您提出理想的AI應該是低熵的,這種理想它存在或者有可能實現嗎?
梅宏:這是個理想。我只是覺得現在的模式熵增太快,過于耗費資源。以當前可以看到的發展路徑,離這個理想還有很長很長的路。
:您認為大模型能否通往AGI?
梅宏:我認為不可能,現在的大模型不可能。這是其技術實現的底層邏輯決定的。
它覆蓋的知識量大面廣,確實是我們人類比不了的,但要想達到所謂的通用人工智能,當前技術路徑應該是做不到的。
當前的大模型嚴重依賴數據和算力,但實際上可開放訪問的數據已經被用得差不多了。當前大模型的競爭已經成為“數據工程”的競爭。
我還想再次表達我在今年9月的《中國計算機學會通訊》發表的文章“對當前人工智能熱潮的幾點冷思考”中提到的一個觀點:大語言模型在未來需要像互聯網一樣,走向開源。全世界共同維護一個開放共享的基礎模型,讓全世界共同受益,共同維護,避免無謂的浪費。
在這個開放共享的基礎模型上,全球范圍內的研究者和開發者可以面向各行各業的需求探討各種應用,構建相應的領域模型。
:您相信機器會產生意識,產生思想嗎?
梅宏:我不認為現在的AI有什么所謂的意識,我也不認為它有知識涌現能力。
從基本原理來看,大模型是基于“概率統計”,將如圖像分類或文本生成等任務建模為概率模型,將數據的分布或生成過程表示為概率分布函數。神經網絡能夠以任意的精度來逼近這些概率分布函數,從而構建這些概率模型。
就這個意義而言,大語言模型可被視為是已有“語料”壓縮而成的“知識庫”。生成結果的“語義”正確性高度依賴于數據的空間廣度、時間深度以及分布密度,更高度依賴于數據的質量。
基于當前的技術路徑,大模型不可能“無中生有”,做出超越人類預期的事情。
不過,大模型可以產生基于內容“基元”的新組合,雖然它本身并不知道該“組合”的含義。這種組合有可能是某種“知識”,也有可能是“幻覺”,這就需要人類專家去驗證審核了。
我還想再強調一下,這也是我前面提到的文章中的觀點。當前主流的AI工作機制,與人類大腦的工作方式仍相去甚遠。我們不應該過度使用類人的術語來描述機器,比如“意識”、“心智”甚至“硅基生命”等,很容易在公眾中造成誤解。
我個人也特別不喜歡“硅基生命”之類的提法,說重一點,這是對生命的不尊重。我們不要忘記,真正的生命是地球上的生物,包括動物和植物,而我們人類則是其中的主導者。