“我們會有新的真實觀,因為ChatGPT是一個雙刃劍,一方面它能夠鑒別真假,但是另一方面它又能夠混淆真和假的界限,倒逼我們對真實有更多的關(guān)注,做一個真的人,做一個求真的人、實事求是的人、有批判性思維的人。”
“有了MOSS之后,底層的重復性工作就不要做了,把整個生態(tài)建起來。如果我們有一個統(tǒng)一的語言、統(tǒng)一的基座,下面對接一下國產(chǎn)的算力,做好一份接口,大家都可以來用,能夠去促進一個生態(tài)鏈的建設(shè),使得整個中國的AI往前進一步發(fā)展。”
復旦大學管理學院信息管理與商業(yè)智能系主任、教授張誠、復旦大學中文系教授嚴鋒、復旦大學計算機科學技術(shù)學院教授、MOSS系統(tǒng)負責人邱錫鵬、上海樂言科技股份有限公司創(chuàng)始人兼CEO、復旦科創(chuàng)企業(yè)家營校友沈李斌(從左至右)。
近日,特斯拉首席執(zhí)行官伊隆·馬斯克等千名科技人士發(fā)公開信,呼吁暫停訓練比GPT-4更強大的AI系統(tǒng),暫停時間為6個月。未來AI對我們安全性的威脅在哪里?是否真的有必要暫停?
復旦大學計算機科學技術(shù)學院教授、MOSS系統(tǒng)負責人邱錫鵬在近日復旦大學管理學院舉辦的復旦科創(chuàng)先鋒論壇上回應(yīng)道,“在圖靈最早提人工智能概念的時候,其實就寫過類似的描述,機器的迭代速度會快于人,在某一天總會超過人的,停止這6個月或者半年沒有意義。并且很多時候也很難停下來,從很多公司的商業(yè)利益出發(fā)肯定會迭代的。”
邱錫鵬持樂觀態(tài)度,“我們目前為止的AI還是可控的,它目前的形式還是在計算機里,沒有接入到社會的方方面面。有一天當它接管了很多東西,成為我們的某種基礎(chǔ)設(shè)施后,這就非常關(guān)鍵了,你要控制它的各種能力。我的理解還是工具層面的,但它有望參與我們社會生活的方方面面,這時產(chǎn)生的危害不光要靠技術(shù),還要靠一些法律法規(guī)去避免。”
復旦大學中文系教授嚴鋒持相同的觀點,“第一是停不下來,開弓沒有回頭箭。第二,也不要停。呼吁大家停下來,誰會聽呢?只有那些有責任感、有節(jié)操的人才會停。可是沒有節(jié)操、沒有責任感的人還會繼續(xù),這樣一來就糟糕了。有人文情懷的人停下來,那些沒有底線的人在瘋狂地訓練他們的模型,那情況會更糟。”
復旦科創(chuàng)先鋒論壇以“Beyond ChatGPT:大型語言模型引發(fā)的時代變革”為主題,由復旦大學計算機科學技術(shù)學院教授、MOSS系統(tǒng)負責人邱錫鵬,復旦大學中文系教授嚴鋒,上海樂言科技股份有限公司創(chuàng)始人兼CEO、復旦科創(chuàng)企業(yè)家營校友沈李斌與復旦大學管理學院信息管理與商業(yè)智能系教授張誠,共同探討ChatGPT及其他大模型技術(shù)涌現(xiàn)所帶來的機遇和挑戰(zhàn)。
以下為圓桌對話和提問環(huán)節(jié)實錄。
ChatGPT暫時不是劉慈欣、莎士比亞、曹雪芹
張誠(復旦大學管理學院信息管理與商業(yè)智能系主任、教授):請3位嘉賓從各自的專業(yè)角度來談,ChatGPT對你所熟悉的行業(yè)和整個社會的未來發(fā)展有什么可能的影響?
嚴鋒(復旦大學中文系教授):去年12月,ChatGPT剛出來的時候我就用了,剛開始用的時候挺失望的。我是中文系的,也是中文系創(chuàng)意寫作專業(yè)的導師,我非常關(guān)注ChatGPT對文學創(chuàng)作、創(chuàng)意寫作包括一般寫作有什么樣的沖擊,以及對我們這個行業(yè)的教育和學術(shù)研究會有什么樣的影響。一開始我給ChatGPT輸入一個《三體》的設(shè)定:假設(shè)地球外的文明有3個太陽,這3個太陽之間根據(jù)物理學原理有不規(guī)則的運動,那它們那個地球上的智慧生命會是什么樣的,以這個為中心寫一個故事。
結(jié)果ChatGPT說沒問題,幾秒鐘一個三體的梗概就出來了。我一看真的很像回事,整個故事很流暢。它就講一個有3個太陽的星系,因為太陽的不規(guī)則運動,那里的行星生活環(huán)境嚴酷,智慧生命很依賴技術(shù),所以技術(shù)非常發(fā)達,發(fā)展出了星際航行,沖出了它們的行星。但是在這個過程當中,它們的文明發(fā)展過于依賴技術(shù),有一天它們的機器壞了,整個世界就毀滅了。但還有一些智慧生命幸存下來,他們意識到不能太依賴技術(shù),于是找到古老的一些記錄,從刀耕火種開始,一個新的文明就又誕生了。
這個故事聽上去好像也行,邏輯是沒有什么問題的。但是從科幻文學的標準來講,這個故事當然不是劉慈欣那種《三體》級別的作品。它缺少創(chuàng)意,缺少藝術(shù)性,更缺少一種打動人的力量。當時的ChatGPT還是比較早的版本,我相信以后它可能會打磨得更好;我們也可以給它更多的提示去誘導它;而且它可以給你各種各樣的點子,用戶可以各取所取。但是我們馬上就可以看到,光靠ChatGPT寫作是不行的。人的判斷力、藝術(shù)品位、所受的傳統(tǒng)人文教育還是很重要,甚至更重要了。另一方面,它可以成為我的寫作助手,可以作為一個很好的頭腦風暴工具,這是沒有問題的。
我與一些同行交流,ChatGPT可不可以寫論文?是可以的,但是讓它直接寫一篇也有問題。可以讓它就某一個局部的問題提供觀點和材料,你再進一步發(fā)展整合起來,這也是一種方式。論文寫作需要寫作者能夠有一個全局、整體的視角和一種問題意識。
張誠:我理解嚴老師說的,您關(guān)心的是涌現(xiàn)出來的是什么能力,當然涌現(xiàn)是物理上的概念。您體驗的時候涌現(xiàn)出來的是總結(jié)或組織的能力,關(guān)心的是能不能涌現(xiàn)出一種新的寫作或思維。
嚴鋒:作為創(chuàng)意寫作或文學性的寫作,需要很多的想象力、創(chuàng)造力、獨創(chuàng)性,甚至需要天賦。在這方面它的表現(xiàn)相當平庸,但是它很流暢,很自信,你也可以說它很理性,整個故事的邏輯是沒有問題的。在可見的時間內(nèi),它能夠?qū)懗鱿衲O駱拥臇|西,但不是那么有創(chuàng)造力。理工科我不熟悉,對人文社會科學而言,它充其量可以擔任一個助手性的工作,如果要我們完全依賴它,顯然目前是不行的。
張誠:起碼在文學領(lǐng)域,ChatGPT更多是承擔一個輔助性的工作,或者能替代一些傳統(tǒng)、常規(guī)的完成作業(yè)式工作,但是在最高端或者最前沿的文學創(chuàng)作上還暫時不足。
嚴鋒:它暫時不是劉慈欣、莎士比亞、曹雪芹。它可能是一個三流的小說家,但是它能夠給你提供各種各樣的信息、材料。寫作當中會涉及到具體的知識,比如說航海、航天、電子技術(shù)等等,這方面它能夠起到很大作用。在傳統(tǒng)的時代作者要鉆進圖書館,在網(wǎng)絡(luò)的時代要會搜索,可是搜索之后的結(jié)果還要人去判斷、整理、提煉。今天ChatGPT可以幫你完成提煉和概括工作,幫你把問題細化,這是過去所沒有的,哪怕過去你會用谷歌和百度,還是要花很長的時間,沙里撿金。ChatGPT大大提高了我們學習和寫作的效率,這是沒有疑問的。
ChatGPT可以替代底層程序員
張誠:這個挺有趣的,尤其是對技科領(lǐng)域的影響會不會更大,我們經(jīng)常說程序猿或者“搬磚狗”有大量的工作是重復的。不知道邱老師怎么看,不管是ChatGPT還是MOSS,未來對您熟悉的領(lǐng)域會產(chǎn)生怎樣的影響?
邱錫鵬(復旦大學計算機科學技術(shù)學院教授、MOSS系統(tǒng)負責人):有一點我是非常同意嚴老師的,目前ChatGPT的表現(xiàn)類似于通才,但是它可能在細分的專業(yè)性上與行業(yè)中比較頂級的專家有很大差距。它之所以讓大家覺得很厲害,就是它的通用性。以前一直做的人工智能模型都是所謂弱人工智能模型,比如AlphaGo只能下圍棋,像ChatGPT這種大型語言模型,個人認為在語言層面它都非常擅長,通用能力非常強。
專業(yè)性上,我覺得它將來會有不同的分支,往不同的專業(yè)方向上發(fā)展。還有一點,它的能力還在不斷進化,文學性上不敢評價,但是通過不斷交互讓它寫一個科幻小說,大概能寫100多頁的科幻小說,所以它這方面的能力還是非常強的。對于計算機編程,它的能力也非常強,研究這塊的軟件工程,怎么把需求變成一個代碼,他們已經(jīng)在這方面做了很多研究,大概的結(jié)論就是ChatGPT是可以替代所謂比較底層的這些程序員的。對于很高級的,或者有些創(chuàng)新性、整合能力非常強的任務(wù),還是離不開人的。
張誠:剛才嚴老師也提到,如果ChatGPT替代一部分簡單的工作,人類可以把自己的能力和精力更多釋放到創(chuàng)造里。假設(shè)在技科領(lǐng)域,我們可以用ChatGPT或者MOSS作為一個輔助,完成軟件工程的一部分基礎(chǔ)工作,您預(yù)計軟件工程專業(yè)的同學們,一旦從這些繁瑣工作釋放之后,他們會迸發(fā)出哪個方面新的活力?
邱錫鵬:人的適應(yīng)能力非常強,有新的工具一定會利用新的工具。像搜索引擎,目前來講我覺得類似于我們的一個外腦;包括現(xiàn)在程序員寫代碼,很多時候也不是從零起步,而是參考一些已有的開源代碼去寫,只不過現(xiàn)在有個更好的工具能夠幫助你,把檢索這一步也省了。嚴老師剛才說到ChatGPT的整合能力,更夠幫你整合一段達到你需求的代碼,把代碼直接寫好了,不像以前要找很多片段再自己拼湊一下。
張誠:我們信息管理專業(yè)也算是相關(guān)學科,以前我們做作業(yè)的時候,是找一個開源程序來參考,在摸索的時候會“踩坑”,起碼這些摸索的工作以后會更有效率地完成。剛才都是從老師的角度出發(fā)探討這個問題,沈總在業(yè)界,請問您有什么看法?
沈李斌(上海樂言科技股份有限公司創(chuàng)始人兼CEO、復旦科創(chuàng)企業(yè)家營校友):我們的一個主營產(chǎn)品是客服機器人,每天線上接待千萬級的人,大家在電商平臺上,不會感知到是機器人在服務(wù)。我們更多是關(guān)注怎么把人工智能技術(shù)產(chǎn)業(yè)化,去替代掉原有工作中簡單重復的部分。
我之前也做過機器翻譯,在機器翻譯上也看到一些規(guī)律性的東西。從我的經(jīng)驗來看,ChatGPT這一技術(shù)是革命性的。原先人工智能的技術(shù)限制,局限在部分領(lǐng)域才能看到人工被替代,慢慢地更多行業(yè)會看到這種替代。比方說在翻譯領(lǐng)域,大概前五年做筆譯時,是一份稿子從頭翻到底,現(xiàn)在這個行業(yè)完全變掉了,機器翻一下,人工再花5%的精力就可以做得更好。在AI賦能的行業(yè)中,翻譯最簡單,由原文再到對標語言,對外界知識依賴比較少。我們也看到客服機器人已經(jīng)替代百分之七八十的人工,人留出來可以做一些更積極主動的工作,不是回答簡單枯燥的問題。ChatGPT的發(fā)展使得AI賦能不光局限在這兩項行業(yè),原先以為需要很多知識積累的,包括教師、金融從業(yè)者、大量腦力工作者,其實很大一部分重復性的工作,機器完全有能力替代,至少這波技術(shù)我們已經(jīng)看到了,應(yīng)該是這個發(fā)展方向。
ChatGPT倒逼我們避免生產(chǎn)學術(shù)垃圾?
張誠:大家或多或少都提到替代人工,人被釋放可以做一些創(chuàng)新工作。但ChatGPT在取代掉一些人的工作后,如果人類沒有找到新的創(chuàng)新點在短期內(nèi)引起技術(shù)變革,GPT取代人類就等于是一個替代關(guān)系,而不是一個促進關(guān)系。
嚴鋒:很多傳統(tǒng)老師的職能會被替代。師者傳道授業(yè)解惑,就“授業(yè)解惑”而言,ChatGPT是能夠做到的,傳道就很難說了。你想問某個人的思想是什么、觀點是什么,老師馬上可以給你一個回答。學生當然也可以問書本,這可能要花很多時間,而且有些答案并不一定靠譜。老師會給一個有可信度的答案,這是非常重要的。現(xiàn)在,如果ChatGPT也能給老師同樣可信度的答案,那老師這部分的職能就被替代了。我甚至可以覺得,隨著整個模型的不斷完善,它的可信度甚至會超過老師。
不是所有的老師都是可信的,老師的知識在信息爆炸的時代會面臨挑戰(zhàn),需要重新學習適應(yīng),這個過程可能導致一些老師失業(yè)。對學生來說,他們更有天然優(yōu)勢,因為他們更會使用ChatGPT這樣的工具。
可以說,ChatGPT把一個之前就有的問題凸顯出來了。就是說我們有太多所謂的知識和學問,其實都是事實性的,而且這個事實還不一定那么可靠,這些東西完全可以放到數(shù)據(jù)庫里,當你需要的時候才去提取。如果用這樣的標準來看,我們很多論文,還有所謂的知識,其實真的是過時了,或者本來就無效。
對于技術(shù),我認為它不僅是面向未來的,也讓我們反思自己,包括我們過去的學術(shù)、知識和教育存在的問題,如各種重復、冗余、謬誤,以及復制粘貼等。過去這些問題因為沒有ChatGPT這樣的工具而不容易暴露出來,但現(xiàn)在因為ChatGPT的出現(xiàn)能夠讓我們看得更清楚。它會不會倒逼我們?nèi)ミM一步避免生產(chǎn)學術(shù)垃圾,我們是不是可以從那種低效的、重復的學術(shù)勞動中解放出來,專注于更有效的學習、更有效的知識、更有效的獨創(chuàng)。
張誠:不知道邱老師怎么看,在教育領(lǐng)域,各個大學采取的回應(yīng)也不太一樣,某些大學是鼓勵學生用ChatGPT,但是老師要看學術(shù)是怎么做的。有些大學禁止學生使用ChatGPT來完成作業(yè)。
邱錫鵬:這是一個很難回答的問題,從某種程度上來講它確實是可以讓學生取巧的,從學知識的角度來講,可以借助這些工具使自己變成一個看起來很厲害的人。可能涉及到我們的培養(yǎng)理念,學生是看起來很厲害就行,還是要讓他懂背后的一些東西,是不是有必要從頭開始學起。
我們?nèi)祟惖膶W習方式和機器學習的方式相比有天然劣勢,人學習的速度很慢,機器迭代起來是非常快的,并且是不知疲憊地在學。每個人從小都要從頭去學,如果我們一直保持這個方式,人類的進化速度其實是比較慢的,而機器會越來越快。如果我們想要快速發(fā)展,就要積極擁抱這些新的技術(shù),要利用它促進我們的學習,讓我們的學習速度,或者說成長速度變得更快。
張誠:這讓我想起另外一個問題,也有哲學老師這么認為,人類進化到現(xiàn)在,從來都不是靠大量的數(shù)據(jù)和復雜的模型計算來實現(xiàn)知識前進,我們是靠對相對小的現(xiàn)實的觀察,加上我們?nèi)祟愐詾楹赖倪壿嫴粩嗤巴啤_@會引起兩個討論,第一個是現(xiàn)在這種人工智能明顯和人進化的智能不一樣,這是一種什么智能?第二個問題,剛才邱老師說的是很本質(zhì)的問題,ChatGPT或者MOSS,已經(jīng)具備了相對大數(shù)據(jù)再加上推理鏈或者思考鏈的模式,我們?nèi)祟惾绾巫飞纤?/p>
邱錫鵬:按照它的邏輯迭代的話,它會越來越強大,最終會超脫我們?nèi)祟惖目刂啤>拖駝偛胖v的,我們?nèi)死斫膺@個世界可能更多是依靠因果關(guān)系,也有很多學者認為它非常重要,因果是對復雜世界非常簡單的理解,比如人類其實沒法想象超過三維的東西,如果上升到四維我們就很難理解了,再高維就更難了。
當一個社會或一個世界變得非常復雜的時候,人的理解能力其實是有限的,這時候機器就可以通過大量數(shù)據(jù)找到一些關(guān)聯(lián)。這曾經(jīng)也引發(fā)第四范式,我們很多時候不需要追尋原有的科學假設(shè),相關(guān)可能就夠了。從我們現(xiàn)在的角度講,以后的人工智能或者開發(fā)人工智能的各種產(chǎn)品,一定要讓它對齊到人類的價值觀,將來才能使人和機器比較和諧地共處。
沈李斌:剛才說的可能潛在的影響是哪方面,我覺得不好回答。像最近有些家長問,小孩要升大學,報什么專業(yè)好,我真的不敢回答什么專業(yè)好,以前可能覺得那些偏創(chuàng)意類的職業(yè)可能受機器學習影響小一些,但是大家沒想到這波生成式AI是從文字生成圖片、開腦洞、做各種創(chuàng)意圖開始的。這個影響很快,很多企業(yè)已經(jīng)用了這種文字生成圖片,并且產(chǎn)出物里都有一定的創(chuàng)意。就像剛才嚴老師舉的例子,它就是漫無邊際開腦洞,然后再做一下生成。
它潛在的影響是非常大的,一些入門的職位可能就消失了,但是我們回頭想一下,我們現(xiàn)在這些資深的專業(yè)人士,都是從入門成長起來的,如果沒有這些入門職位,他們能夠通過何種途徑成長起來,這是我覺得堪憂的一個地方。
從搜索力到MOSS力
張誠:我們說了太多ChatGPT時代的危,還有機,不知道各位對同學們有什么建議和想法。
嚴鋒:這也是一個非常好的問題,面對AI的崛起,我們怎么去適應(yīng)這種變化。肯定會有科研、學習,包括教學、認知的一個巨大轉(zhuǎn)型,首先,很多危我們不知道,但有一個確定的,也是很多人還沒有意識到的:我們怎么去認識我們和AI的關(guān)系,怎么去學習這個技術(shù),怎么跟它相處,怎么向它提問,我覺得這會成為一個新的職業(yè)。我們原來有一些缺失的環(huán)節(jié),比如說我們中國學生比較羞怯、內(nèi)向,不太喜歡提問, AI把我們逼向了要做一個提問者,我覺得我們未來要學會做一個更好的prompter(提詞師),一個提問者,無論是對AI還是對傳統(tǒng)的老師,還有其他的人,這是我們本來就應(yīng)該做的一個事情。
另外創(chuàng)造性真的太重要了,我們以前可能會很崇拜那種學富五車的人,像錢鐘書先生那樣的,他們腦子里簡直有全世界的知識。可是在ChatGPT的時代,這樣的知識者形象可能不會再是我們追求的目標,因為會越來越普遍,每個人只要跟ChatGPT捆綁,API一接,瞬間就變成了錢鐘書先生。
我們以前埋頭苦讀,做題目,這種學習方式是不是也要有所調(diào)整。我們需要新的學習方式,它有點類似于“玩”。我是研究游戲的,很多創(chuàng)造性的東西誕生于游戲性的活動當中。我們把很多繁瑣、重復、簡單的勞動交給了AI,就有更多時間從事藝術(shù)、娛樂、游戲。我們?nèi)祟惖膬?yōu)勢在哪里,我們的特長在哪里,怎么去揚長避短?我們是有情感的動物,AI至少目前還沒有。AI倒逼我們要走上更有情商的道路,包括更能夠處理人與人的關(guān)系,人與機器的關(guān)系,人與自然的關(guān)系。
我們會有新的真實觀,因為ChatGPT是一個雙刃劍,一方面它能夠鑒別真假,但是另一方面它又能夠混淆真和假的界限,倒逼我們對真實有更多的關(guān)注,做一個真的人,做一個求真的人、實事求是的人,有批判性思維的人。我們還是需要人類來判斷真和假,這方面不能完全依賴AI。這是未來的學習中一些需要努力的方向。
邱錫鵬:不光現(xiàn)在,其實更早之前,人們對AI可以替代人的很多工作都有些擔憂。我的一個總體觀點是,AI可以替代一部分工作,但它替代不了那些會用AI的人的工作。人類更擅長的是利用AI的能力把工作做到更好,人有適應(yīng)性、靈活性。你不要和AI比誰可以記非常多的數(shù)字,或者誰算的更快,意義不大。這種知識性的東西,你就可以把ChatGPT當成一個字典來用。此外要有一個綜合的思考、判斷,要變得更擅于利用AI,這會非常重要。
沈李斌:替代你的不是AI,是善用AI的人。對人是這樣,對企業(yè)也是這樣。在我們公司,所有部門都去看怎么用類似生成技術(shù)提高生產(chǎn)效率,在各種流程上怎么去用AI。能夠善用這些創(chuàng)造性能力的企業(yè),肯定在進階優(yōu)勢上比其他公司要強,這是一個比較大的結(jié)構(gòu)性的機會。
第二,由于這樣一種生成式能力產(chǎn)生之后,生產(chǎn)力大大提升,很多企業(yè)與企業(yè)之間的上下游關(guān)系會發(fā)生變化,這也是結(jié)構(gòu)性的機會。在美國差不多半數(shù)風投項目都和AI相關(guān),相信在國內(nèi)很快會進入這個狀態(tài)。之前通常說個人、企業(yè)有個能力,就是搜索力,怎么用搜索引擎做各種各樣的事情,后面還會有MOSS力,用好MOSS系統(tǒng)可能是第一步。
為什么MOSS要開源?
現(xiàn)場提問:3月22日美國的生命未來研究所向全社會發(fā)了一封公開信,這封公開信的內(nèi)容是呼吁所有人工智能實驗室暫停訓練比GPT-4更強大的AI系統(tǒng),暫停的時間是6個月。很多AI界的專家和大佬們都在上面簽了字,包括馬斯克,也包括蘋果的聯(lián)合創(chuàng)始人,等等。各位老師對這個問題持什么樣的態(tài)度,這些人為什么在這個時間點提出這樣的問題?以及未來AI對我們安全性的威脅在哪里?
邱錫鵬:在圖靈最早提人工智能概念的時候,其實就寫過類似的描述,機器的迭代速度會快于人,在某一天總會超過人的,停止這6個月或半年沒有意義。并且很多時候也很難停下來,從很多公司的商業(yè)利益出發(fā)肯定會迭代的。我還是很樂觀,我們目前為止的AI還是可控的,它目前的形式還是在計算機里,沒有接入到社會的方方面面。有一天當它接管了很多東西,成為我們的某種基礎(chǔ)設(shè)施后,這就非常關(guān)鍵了,你要控制它的各種能力。我的理解還是工具層面的,但它有望參與我們社會生活的方方面面,這時產(chǎn)生的危害不光要靠技術(shù),還要靠一些法律法規(guī)去避免。
嚴鋒:我非常同意邱老師的看法。第一是停不下來,開弓沒有回頭箭。第二,也不要停。呼吁大家停下來,只有有責任感、有節(jié)操的人才會停。可是沒有節(jié)操、沒有責任感的人還在繼續(xù),這樣一來就糟糕了。有人文情懷的人停下來,那些沒有底線的人在瘋狂訓練他們的模型,那情況會更糟。
現(xiàn)場提問:隨著ChatGPT的爆火,人工智能技術(shù)被應(yīng)用在了非常多的商業(yè)場景中,我們怎么樣通過一定的機制約束好它,確保這樣的技術(shù)不被濫用。
沈李斌:一個是政府監(jiān)管層面,一個是個人、企業(yè)善用AI來增長自己的本領(lǐng),兩個角度。
從可依賴、可信的AI這個角度,這是政府需要考慮的,怎么讓它變成可信、可依賴的AI——符合社會價值觀,體現(xiàn)社會的公平性。這些都是政府可能考慮的事情。對企業(yè)來說,會鼓勵大家先用起來,做一些邀請,做一些分享。網(wǎng)上各種媒體類似的分享已經(jīng)挺多了,相信肯定能夠找到一些方式的。生成式AI三要素中數(shù)據(jù)是比較關(guān)鍵的一個因素,像MOSS是不是可以考慮做產(chǎn)線結(jié)合,吸引工業(yè)界加入,讓MOSS成長得更快。
邱錫鵬:MOSS還是想以開源的形式去做,為什么美國卡我們脖子,它一卡一個準,就是我們的生態(tài)沒有建好。OpenAI做ChatGPT的時候,它不需要分心做其他東西,只是把模型做好。微軟幫它做算力,還有一家開源公司幫它做部署,它的數(shù)據(jù)也有專門的公司來進行數(shù)據(jù)清洗。它是在整個生態(tài)中去做的,它的生態(tài)促使它的發(fā)展非常快。
而我們國內(nèi)每家公司都要做,這就會產(chǎn)生一個問題,每家都做不大,每個都做自己的,所有的東西都自己來,又不愿意跟別人分享。每家數(shù)據(jù)、算力也有限,也沒有多少錢可以支持研發(fā),并且又在做一些很基礎(chǔ)、重復性的事情。我們希望能促進這個生態(tài),有了MOSS之后,底層的重復性工作就不要做了,把整個生態(tài)建起來。如果我們有一個統(tǒng)一的語言、統(tǒng)一的基座,下面對接一下國產(chǎn)的算力,做好一份接口,大家都可以來用,能夠去促進一個生態(tài)鏈的建設(shè),使得整個中國的AI往前進一步發(fā)展。
現(xiàn)場提問:中文語言的復雜性和現(xiàn)階段中文語庫的管控封閉導致的多樣性發(fā)展缺失,是否會牽制中文AI的學習和發(fā)展?
嚴鋒:我確實遇到過中文內(nèi)容不足的問題。我問過ChatGPT《紅樓夢》相關(guān)的問題,它的回答很離譜。但是問莎士比亞的作品,它的回答就接近真實得多。我搜集過很多跟《紅樓夢》相關(guān)的研究資料,中文的和外文的完全不成比例,在這個領(lǐng)域中文的內(nèi)容是壓倒性的,如果光靠外文訓練肯定是不行的,需要我們有更多經(jīng)過檢驗的語料、文本和學術(shù)性內(nèi)容加入到數(shù)據(jù)庫內(nèi)。
我的思考可能是從另外一個方向。人類對圖像是非常迷戀的,最早就是靠圖像進化,但是進化出語言之后,圖像好像又退位了,到了20世紀又進入到圖像的時代。圖像好像比語言更可靠,因為圖像作偽的技術(shù)難度要遠遠超過語言,可是現(xiàn)在圖像作偽的難度已經(jīng)大大降低,甚至等于語言了,這種情況下圖像的優(yōu)勢地位就會改變,這是一種自然的演化。我作為中文系的教師,這時候有一個小的私心,我覺得語言這些東西還是永恒的,我現(xiàn)在很開心地看到在21世紀語言又回來了,因為AI的核心是語言。
邱錫鵬:現(xiàn)在這些大模型的訓練語料中一個重要的數(shù)據(jù)是科學文獻,但目前更多使用的是英文文獻,就會帶來很大的差別。但是有一個比較好的現(xiàn)象,語言對應(yīng)的背后知識,在某種程度上是可以打通的。這次在MOSS的研發(fā)過程中也有類似的現(xiàn)象,兩個語言背后的知識是相通的,你可以用中文提問,它用英文的知識回答你,反過來也可以。我覺得可能對機器來講,用中文還是用英文,對它來講只是用哪種編碼展示出來而已,背后的知識對它而言都是一樣的。
【來源:澎湃新聞】