作者 | 何苗
出品 | CSDN(ID:CSDNnews)
大模型的火熱引爆了 AI 編程領(lǐng)域的全面革新,人們開始思考如何借助 AI 提高編程效率的同時(shí),也在思考未來需要怎樣的“ 新程序員”。
3 月 25 日下午,CSDN 與《新程序員》合作舉辦“新程序員大會(huì)(NPCon)的“ AIGC 與大模型技術(shù)應(yīng)用峰會(huì) ”——AI 編程技術(shù)論壇在北京環(huán)球貿(mào)易中心成功舉辦。本論壇匯聚了 來自中科院、微軟亞洲研究院、清華大學(xué)實(shí)驗(yàn)室等學(xué)術(shù)機(jī)構(gòu),華為云、aiXcoder 等企業(yè)代表們,從ChatGPT、大模型、開源等多個(gè)角度,圍繞智能代碼生成展開激烈的觀點(diǎn)碰撞, 分享了 AI 編程最新鮮火熱的觀點(diǎn)。
當(dāng)AI可以寫代碼,程序員還能干什么?AI 寫的代碼,誰或者如何來評(píng)定代碼的質(zhì)量?GPT-4 模型將為 AI 編程帶來怎樣的技術(shù)與思維革新?很多問題都在這場(chǎng)論壇中得到了解答,答案或許與你的認(rèn)知相左,也歡迎留言來辯!
- 微軟亞洲研究院高級(jí)研究 工程師盧帥 :未來的AI編程的發(fā)展趨勢(shì)是一方面探討如何利用大模型來完成任務(wù),另一方面思考如何進(jìn)化它,以覆蓋更廣泛的智能代碼場(chǎng)景。
- aiXcoder 聯(lián)合創(chuàng)始人郝逸洋: 如果 AI 作為操作系統(tǒng)可以直接控制硬件,程序員就能解放雙手去編寫驅(qū)動(dòng)、操作系統(tǒng)和軟件或是研發(fā)新的硬件,這就是軟件 3.0 的圖景。
- 華為云 PaaS 技術(shù)創(chuàng)新 LAB 技術(shù)專家申博 :當(dāng)模型越來越大,對(duì)硬件性能要求越來越高,有可能會(huì)遇到“數(shù)據(jù)荒”的問題,我們能否讓 AI 自我演進(jìn),通過自我生成數(shù)據(jù)的方式學(xué)習(xí),以達(dá)到與大數(shù)據(jù)同樣的效果?未來自我創(chuàng)造智能是個(gè)有前途的方向。
- 清華大學(xué)知識(shí)工程實(shí)驗(yàn)室研究助理鄭勤鍇 :在將來,程序員需要具備一些更高級(jí)的技能和思維,比如 Geek (極客)思維,開發(fā)者應(yīng)該更加注重這方面的培養(yǎng)。
- 中國(guó)科學(xué)院軟件研究所研究員、博士生導(dǎo)師王俊杰 : 現(xiàn)在的大模型可能有些時(shí)候?qū)﹂_發(fā)人員來說有點(diǎn)“不太專業(yè)”,但對(duì)測(cè)試人員來說“剛剛好”
一邊用大模型來生成代碼,一邊想辦法讓它進(jìn)化
在上午的主論壇,華為云智能化軟件研發(fā)首席專家王千祥表示 AI 編程肯定會(huì)超越 Coding 編程,因?yàn)楝F(xiàn)有的 ChatGPT、GPT-4 大模型工具的能力覆蓋到了代碼補(bǔ)全、翻譯代碼、解釋代碼、DeBug 等多維度。
在AI 編程分論壇會(huì)議開場(chǎng),為了對(duì)程序員最關(guān)心的編程技術(shù)問題做更深入的交流與探討,他作為論壇出品人,協(xié)助 CSDN 精心邀請(qǐng)了幾位親自動(dòng)手做AI 編程的青年才俊來分享其實(shí)踐經(jīng)驗(yàn)與真知灼見,機(jī)會(huì)難得。
華為云智能化軟件研發(fā)首席專家 王千祥
以下,是該論壇的內(nèi)容精華。
首先, 微軟亞洲研究院高級(jí)研究工程師盧帥分享了《基于預(yù)訓(xùn)練的代碼理解與生成》主題演講,他表示:預(yù)訓(xùn)練模型是目前探索出的代碼智能生成最佳解決方案,但其核心挑戰(zhàn)在于如何讓模型理解和推斷代碼背后的意圖。
微軟亞洲研究院高級(jí)研究工程師 盧帥
“在編寫代碼時(shí),并不是所有的代碼都是程序員自己原創(chuàng)的。”近年來,代碼智能引起了學(xué)術(shù)界和工業(yè)界的廣泛研究,基于人工智能技術(shù)的自動(dòng)化程序理解和生成可以極大地提高程序開發(fā)者的生產(chǎn)力。微軟已經(jīng)在預(yù)訓(xùn)練模型領(lǐng)域做了一些嘗試,并在 2020 年初提出了首個(gè)將文本和代碼結(jié)合起來作為模型訓(xùn)練的模型——CodeBERT。它覆蓋了 6 種編程語言,支持多項(xiàng)代碼理解功能。
會(huì)上,盧帥詳細(xì)地介紹了如何將預(yù)訓(xùn)練的模型應(yīng)用于具體的代碼智能任務(wù)和場(chǎng)景中。“我們的研究并沒有完全關(guān)注如何擴(kuò)大模型規(guī)模,而是從程序員或是軟件工程的角度,去思考將代碼相關(guān)信息和軟件工程知識(shí)融入預(yù)訓(xùn)練模型中,增強(qiáng)模型對(duì)程序的理解。”
除了對(duì)大模型的訓(xùn)練與優(yōu)化以外,盧帥及其團(tuán)隊(duì)還非常關(guān)注代碼補(bǔ)全和代碼審查的具體應(yīng)用場(chǎng)景,在代碼審查場(chǎng)景下,他總結(jié)出可通過人工智能或預(yù)訓(xùn)練模型來優(yōu)化和提高開發(fā)效率的三種任務(wù):
- 評(píng)估代碼更改的質(zhì)量;
- 輔助生成代碼審查意見;
- 代碼優(yōu)化。
目前 GPT-4 還有許多沒有覆蓋到的情況,例如缺少代碼語法樹等信息;由于長(zhǎng)度限制,無法對(duì)項(xiàng)目級(jí)代碼進(jìn)行分析;代碼個(gè)性化模型問題,未來都很值得思考。
在大型模型時(shí)代,GPT-4 影響廣泛,為我們提供了很多便利。相對(duì)于 GPT-3,GPT-4 的優(yōu)化之一在于它引入了人類的反饋,優(yōu)化方向已經(jīng)從增大參數(shù)量轉(zhuǎn)變?yōu)閺臄?shù)據(jù)優(yōu)化和訓(xùn)練方式的角度。但盧帥認(rèn)為結(jié)構(gòu)方面還沒有被充分挖掘。
盧帥及其團(tuán)隊(duì)下一步的研究方向是如何讓神經(jīng)網(wǎng)絡(luò)模型更了解程序,而不是如何使模型變得越來越大。“我認(rèn)為未來的發(fā)展趨勢(shì)是一面探討如何利用大模型來完成任務(wù),另一方面則要思考如何進(jìn)化它,以覆蓋更廣泛的智能代碼場(chǎng)景。”
AI 還需更進(jìn)一步才能滿足程序員的需求
“在 2022 年之前,代碼生成模型主要采用語言模型來訓(xùn)練代碼模型。而在 GPT-4 時(shí)代,一切都改變了。我們可以直接向程序提出需求,就像產(chǎn)品經(jīng)理向程序員描述需求時(shí)一樣。”
aiXcoder 聯(lián)合創(chuàng)始人 郝逸洋
近一年,大型語言模型(LLM)對(duì)序列信息建模的能力有目共睹,創(chuàng)建了像 ChatGPT、GPT-4 這樣驚人的產(chǎn)品。本次演講 aiXcoder 聯(lián)合創(chuàng)始人郝逸洋圍繞如何利用 LLM 技術(shù)輔助代碼開發(fā)為我們帶來精彩分享,并對(duì)交互式多模態(tài)LLM(如 ChatGPT、GPT-4 )如何應(yīng)用于智能化軟件開發(fā)展開暢想。
首先,郝逸洋分享了自己對(duì)于 GPT-4 的認(rèn)識(shí)。“當(dāng) ChatGPT 升級(jí)至 GPT-4 時(shí),它可支持更長(zhǎng)的序列,并在更多領(lǐng)域上進(jìn)行了微調(diào)。相比于 GPT-3,GPT-4 的求解能力有了巨大提升。此外,GPT-4 還有一個(gè)未開放使用的能力,即理解圖片,但目前還未對(duì)外開放使用。”
為了進(jìn)一步對(duì) GPT-4 的能力邊界展開探索,他對(duì)代碼進(jìn)行了錯(cuò)誤檢測(cè)和修復(fù),這個(gè)功能非常強(qiáng)大,也是編程神器 Copilot 還不具備的功能——它只是一個(gè)代碼補(bǔ)全模型。
GPT-4 反映出的第一個(gè)問題就是它速度較慢,因此無法響應(yīng)很多實(shí)時(shí)場(chǎng)景;第二,上下文序列有限(最長(zhǎng) 32,768 ),盡管GPT-4 的序列長(zhǎng)度已經(jīng)非常厲害,但是想要將整個(gè)項(xiàng)目的信息全部放入其中仍然非常困難;第三,代碼項(xiàng)目的上下文和網(wǎng)頁爬取的文本差距巨大。
同時(shí),程序生成模型與 GPT-4 此類語言模型的模式仍有區(qū)別。
在實(shí)際場(chǎng)景中,寫代碼所依賴的信息量非常多。除了當(dāng)前文件的上下文信息,它還依賴整個(gè)項(xiàng)目中其他文件的信息甚至其他項(xiàng)目的信息。因此,這是個(gè)需要獨(dú)立設(shè)計(jì)的問題,普通語言模型很難處理如此復(fù)雜的需求。
第二大區(qū)別則體現(xiàn)交互模式。在創(chuàng)建程序生成模型時(shí),一般有幾種模式可供選擇,包括填空、補(bǔ)全和排序,而對(duì)話語言模型其模式則是“續(xù)寫”與“問答”。“填空、補(bǔ)全和排序”三種場(chǎng)景都對(duì)實(shí)時(shí)性有要求,如果速度過慢,開發(fā)人員是難以接受的。
當(dāng)一個(gè)程序生成模型創(chuàng)建完畢,就需要對(duì)補(bǔ)全率和生成率兩個(gè)指標(biāo)進(jìn)行測(cè)試,評(píng)估它的表現(xiàn)能力,郝逸洋以 HumanEval 為例,為大家展開了細(xì)節(jié)講解,同時(shí)他強(qiáng)調(diào)自動(dòng)化測(cè)試用戶實(shí)際開發(fā)場(chǎng)景非常難,運(yùn)用一些手動(dòng)測(cè)試來配合驗(yàn)證可能會(huì)更精準(zhǔn)。
讓語言模型學(xué)會(huì)自己使用工具
“眾所周知,GPT-4 可以讓編寫簡(jiǎn)單代碼的過程更加輕松,但它在處理復(fù)雜的代碼時(shí)仍然很困難。這意味著它不能降低編程的難度,但可以降低入門門檻,這也是生成式 AI 固有的局限。”
華為云 PaaS 技術(shù)創(chuàng)新 LAB 技術(shù)專家 申博
華為云 PaaS 技術(shù)創(chuàng)新 LAB 技術(shù)專家申博為我們帶來了他《在 GPT-4 時(shí)代,重新思考 AI 編程》的精彩分享。
他認(rèn)為工具的存在旨在提高程序員的開發(fā)效率,然而其質(zhì)量也同樣重要。首先,生成的代碼中可能存在未知的錯(cuò)誤和漏洞。隨著生成的內(nèi)容越多,其質(zhì)量就越成為一個(gè)重要話題。其次,實(shí)際項(xiàng)目中往往涉及很多設(shè)計(jì)模式和框架,需要綜合多個(gè)文件和不同層次的代碼,同時(shí)掌握較強(qiáng)的專業(yè)和領(lǐng)域知識(shí),才能了解程序的具體含義和功能。再者,自監(jiān)督的預(yù)訓(xùn)練方式是基于自然語言序列的順序性,但寫代碼時(shí)并非如此,程序員往往會(huì)在多份代碼中不斷跳轉(zhuǎn)和編輯,甚至進(jìn)行全局的重構(gòu)。如此一來,僅靠大規(guī)模語言模型很難覆蓋以上所有情況,即使強(qiáng)大如 GPT-4。
申博認(rèn)為,交互與協(xié)同才是核心。交互與協(xié)同不僅指人與AI或工具之間的交互,也包括模型與現(xiàn)有工具之間的交互,以及現(xiàn)有工具之間可能存在的交互。
程序員需要大模型來運(yùn)用這些工具,就涉及到類似于“ Toolformer ”(Tool+Transformer)的組合,即語言模型可以教自己使用工具。該思想的核心是讓模型具備人類的能力,讓它自主地學(xué)會(huì)決定應(yīng)該使用哪些工具以及如何調(diào)用這些工具。在經(jīng)過多輪的訓(xùn)練后,模型可以具備此類能力,并在它生成的文本中插入 API 調(diào)用,將 API 返回的結(jié)果融合到預(yù)測(cè)中。
除了讓模型調(diào)用工具,將模型視為主流工具中的一個(gè)環(huán)節(jié)也是一種可行的思路。與 Toolformer 中讓模型調(diào)用工具不同,基于語言模型即服務(wù)(Language Model as a Service)的方式,使現(xiàn)有工具能夠調(diào)用模型,這是未來非常有發(fā)展?jié)摿Φ姆较颉?/p>
來自北京大學(xué)的研究者們認(rèn)為,軟件代碼是程序員對(duì)這個(gè)世界的理解與表達(dá),在這個(gè)過程中,一些個(gè)性化東西也被加入到代碼中,國(guó)外許多開源項(xiàng)目的所有者把代碼寫成了藝術(shù)。隨著AI編程的發(fā)展,現(xiàn)代化編程中機(jī)械化的東西越來越少,所以新程序員們需要更多地關(guān)注編程的藝術(shù)層面,例如設(shè)計(jì)架構(gòu)以及優(yōu)化算法的優(yōu)美性。華為云推出了CodeArts 服務(wù)來幫助開發(fā)者們面向未來轉(zhuǎn)型,CodeArts 提供了一整套軟件開發(fā)流程,其中包括 CodeArts Snap 智能編程助手,Snap 基于代碼生成不局限于代碼生成,其最終目的是同時(shí)提高開發(fā)的效率和質(zhì)量。
演講的尾聲,他總結(jié)道:從前我一直在思考ChatGPT 這種交互方式什么時(shí)候會(huì)被應(yīng)用于 IDE,隨著 GitHub Copilot X 的發(fā)布,現(xiàn)在 GPT-4 已經(jīng)來到 IDE 中。因此我們需要重新思考 AI 編程,未來它一定會(huì)成為像IDE一樣的必備工具。像使用 IDE 一樣適應(yīng) AI 吧,AI 不會(huì)取代人類,但掌握 AI 技術(shù)的人將取代另一些人。
為了產(chǎn)業(yè)生態(tài)發(fā)展, 開源 代碼生成模型
“近兩年有兩個(gè)重要的行業(yè)動(dòng)態(tài),一個(gè)是 AlphaCode 登上《Science》雜志封面,證實(shí)了預(yù)訓(xùn)練的代碼生成模型可以達(dá)到參加編程競(jìng)賽的程序員平均水準(zhǔn)。另一個(gè)是 Copilot 問世,首次證實(shí)了在大量源代碼語料上進(jìn)行訓(xùn)練,能取得遠(yuǎn)超傳統(tǒng)方法的代碼生成效果。但很遺憾,以上提到的技術(shù)全部來自國(guó)外,全部都是閉源的,只能被用于產(chǎn)品使用或調(diào)用 API 。
清華大學(xué)知識(shí)工程實(shí)驗(yàn)室研究助理 鄭勤鍇
從代碼提出之初起,便一直有人在考慮如何實(shí)現(xiàn)自動(dòng)代碼生成。如何實(shí)現(xiàn)大規(guī)模的代碼生成模型? 清華大學(xué)知識(shí)工程實(shí)驗(yàn)室研究助理鄭勤鍇及其團(tuán)隊(duì)去年花了整整一年時(shí)間做了深度實(shí)踐,他們將大規(guī)模預(yù)訓(xùn)練模型應(yīng)用到代碼生成場(chǎng)景,并選擇在國(guó)產(chǎn)的硬件和平臺(tái)上實(shí)現(xiàn)此模型。
CodeGeeX 是一個(gè)具有 130 億參數(shù)的多編程語言代碼生成預(yù)訓(xùn)練模型,采用華為 MindSpore 框架實(shí)現(xiàn),使用鵬城實(shí)驗(yàn)室“鵬城云腦II”平臺(tái)中 1536 個(gè)昇騰 910 AI 處理器,在 20多 種編程語言的代碼語料庫歷時(shí)兩個(gè)月訓(xùn)練而成。開源開放,支持昇騰和英偉達(dá)平臺(tái),具有高精度代碼生成、代碼翻譯等能力。
在此次大會(huì)上,他詳細(xì)從模型的數(shù)據(jù)收集、處理;模型架構(gòu)搭建、模型訓(xùn)練與優(yōu)化、任務(wù)評(píng)估、代碼生成插件等幾大方面分享了實(shí)踐的細(xì)節(jié)。
目前來看,CodeGeeX 是在開源領(lǐng)域表現(xiàn)最佳的多語言代碼生成模型,用戶超過 4 萬名,還在不斷優(yōu)化中文等其他語言的表現(xiàn)。
考慮到每種編程語言被發(fā)明出來時(shí)都有其更適用的特定場(chǎng)景,鄭勤鍇及其團(tuán)隊(duì)分析了 CodeGeeX 的生成結(jié)果。綠色表示答案完全正確的結(jié)果,紅色表示通過編譯但答案錯(cuò)誤的情況,橙色表示運(yùn)行時(shí)錯(cuò)誤,藍(lán)色則表示語法錯(cuò)誤??梢钥吹?,目前代碼生成模型的難點(diǎn)并不在生成語法正確且可以運(yùn)行的代碼,而是需要更強(qiáng)的邏輯推理能力,保證輸出結(jié)果的正確性。
由于 Copilot 等類似技術(shù)都是閉源的,無論對(duì)于研究還是產(chǎn)業(yè)都非理想情況。鄭勤鍇將整個(gè)項(xiàng)目開源,目前已獲得了 3300 多個(gè) Star,也邀請(qǐng)更多開發(fā)者一同參與優(yōu)化。他表示當(dāng)前階段并不著急將某些產(chǎn)品做得太細(xì)致,而是應(yīng)該進(jìn)一步提高基礎(chǔ)模型的能力,之后也會(huì)加入對(duì)話功能,使其具備更強(qiáng)的交互能力,實(shí)現(xiàn)如代碼修復(fù)之類的功能。
偶爾“不太專業(yè)”的大模型,對(duì)找 Bug “剛剛好”
現(xiàn)在的大模型可能有些時(shí)候?qū)﹂_發(fā)人員來說有點(diǎn)“不太專業(yè)”,但對(duì)測(cè)試人員來說“剛剛好”。
中國(guó)科學(xué)院軟件研究所研究員、博士生導(dǎo)師 王俊杰
前面談到了許多如何利用大模型實(shí)現(xiàn)代碼生成的問題,在自動(dòng)化測(cè)試領(lǐng)域,大模型是否同樣有所助益? 中國(guó)科學(xué)院軟件研究所研究員、博士生導(dǎo)師王俊杰為我們帶來了《基于LLM的自動(dòng)化測(cè)試》的思考。
對(duì)開發(fā)人員而言,盡管大模型已非常強(qiáng)大,但其生成的代碼仍然不能完全信任。雖然開發(fā)人員希望代碼生成百分之百正確的,然而對(duì)于測(cè)試而言,這些問題對(duì)結(jié)果影響不大。測(cè)試本就是為了找出 Bug,即使無法找到,也能節(jié)省大量的人工工作量。
王俊杰及其團(tuán)隊(duì)的工作是基于大型模型進(jìn)行自動(dòng)化測(cè)試。
近年來自動(dòng)化圖形用戶界面(GUI)測(cè)試被廣泛用于幫助開發(fā)團(tuán)隊(duì)確保移動(dòng)應(yīng)用程序的質(zhì)量。然而許多 GUI 需要適當(dāng)?shù)奈谋据斎氩拍苓M(jìn)入下一頁,文本輸入的質(zhì)量成為影響測(cè)試覆蓋率的主要障礙。由于有效文本輸入(例如航班的出發(fā)地、電影名稱、用戶血壓信息等)具有多樣性和語義要求的特點(diǎn),實(shí)現(xiàn)文本輸入生成的自動(dòng)化是一項(xiàng)具有挑戰(zhàn)性的任務(wù),其難度主要體現(xiàn)在兩個(gè)方面,一是輸入時(shí)需要生成不同類型的特定值,例如地圖應(yīng)用程序的街道地址;二是在同一 GUI 頁面內(nèi)需要體現(xiàn)文本之間的關(guān)聯(lián)性,例如航班搜索中出發(fā)和到達(dá)地需要是不同位置。如果文本輸入不恰當(dāng),自動(dòng)化測(cè)試工具將無法進(jìn)入下一個(gè) UI 頁面,從而導(dǎo)致測(cè)試的充分性低下。
針對(duì)以上的挑戰(zhàn),團(tuán)隊(duì)提出了一種上下文感知的自動(dòng)文本輸入生成方法 QTypist,即使用預(yù)先訓(xùn)練的大型語言模型(LLM)來智能地生成語義輸入文本,以增強(qiáng)移動(dòng) GUI 測(cè)試。其設(shè)計(jì)邏輯是,先給定一個(gè)帶有文本輸入的 GUI 頁面及其相應(yīng)的視圖層次結(jié)構(gòu)文件,通過提取文本輸入的上下文信息,來設(shè)計(jì)語言模式以生成提示作為 LLM 的輸入。同時(shí),為了提高 LLM 在移動(dòng) GUI 中文本輸入的性能,團(tuán)隊(duì)還開發(fā)了一種基于提示的數(shù)據(jù)構(gòu)建和調(diào)優(yōu)方法,以自動(dòng)提取用于模型調(diào)優(yōu)的提示和答案。
團(tuán)隊(duì)對(duì)來自 google Play 的 106 個(gè)應(yīng)用程序進(jìn)行了評(píng)估,結(jié)果顯示,該方法生成文本的通過率為 87 %,比最佳基線高 93 %。團(tuán)隊(duì)還將文本生成方法與自動(dòng)化 GUI 測(cè)試工具集成,與原始工具相比,集成后的工具可以多覆蓋 42 %的應(yīng)用程序活動(dòng)和 52 %的頁面,同時(shí)多檢測(cè) 82 %的 Bug,從而提升了自動(dòng)化測(cè)試工具的測(cè)試覆蓋率和缺陷檢測(cè)效率。
在演講的結(jié)尾,她提出做大語言模型后續(xù)需要解決的四個(gè)問題,發(fā)人深思:
- 大模型如何與被測(cè)軟件交互?特別是復(fù)雜軟件,例如自動(dòng)駕駛仿真測(cè)試這種;
- Diversity/coverage 問題。對(duì)于代碼生成任務(wù)而言,用戶希望得到最正確的一個(gè)結(jié)果即可,但對(duì)于測(cè)試任務(wù),更希望達(dá)到 diversity and coverage,如何更好實(shí)現(xiàn)?
- 測(cè)試開發(fā)同步或者測(cè)試驅(qū)動(dòng)開發(fā);
- 未來軟件開發(fā)形態(tài)可能是面對(duì)用戶輸入,大模型直接產(chǎn)生可用的軟件,那如何保證大模型產(chǎn)出的軟件是安全可用的、滿足用戶需求的?又應(yīng)該對(duì)大規(guī)模、以及基于大模型的應(yīng)用進(jìn)行測(cè)試和質(zhì)量保障?
以上四個(gè)相對(duì)開放的問題,也非常歡迎大家在評(píng)論區(qū)探討。
圓桌部分:成就大模型時(shí)代的應(yīng)用開發(fā)者
在 AI 編程分論壇最后一個(gè)環(huán)節(jié),由論壇出品人、華為云智能化軟件研發(fā)首席專家王千祥主持,微軟亞洲研究院高級(jí)研究工程師盧帥,aiXcoder聯(lián)合創(chuàng)始人郝逸洋,華為云 PaaS 技術(shù)創(chuàng)新 LAB 技術(shù)專家申博,清華大學(xué)知識(shí)工程實(shí)驗(yàn)室研究助理鄭勤鍇,中國(guó)科學(xué)院軟件研究所研究員、博士生導(dǎo)師王俊杰圍繞“AI編程現(xiàn)狀與未來,成就大模型時(shí)代的應(yīng)用開發(fā)者”,共論新時(shí)代開發(fā)者的新機(jī)遇與成長(zhǎng)。
從左至右:王千祥 盧帥 郝逸洋 申博 鄭勤鍇 王俊杰
大型模型出現(xiàn)后,許多新的開發(fā)項(xiàng)目將隨之誕生,這對(duì)開發(fā)者而言是好是壞?需要在哪方面提升?華為云 PaaS 技術(shù)創(chuàng)新 LAB 技術(shù)專家申博認(rèn)為,此事對(duì)程序員的好處大于壞處。他們需要把自己的思維放在一個(gè)老板的位置上,編程神器Copilot 會(huì)向你推薦出多種實(shí)踐方案,讓你去選擇與思考其中最佳。這不僅讓程序員享受到了使用者的便捷,同時(shí)也在倒逼他們提高編程能力。在這個(gè)過程中,程序員需要將其作為一個(gè)伙伴、一個(gè)老師,而不只是一個(gè)下屬,在于它平等對(duì)話的過程中,也能實(shí)現(xiàn)自身能力的提升。當(dāng)你從“ Copilot ”變成“ Captain ”,你將成為自己的船長(zhǎng)。
這是否意味著軟件開發(fā)人員將會(huì)迎來一次巨大的飛躍?微軟亞洲研究院高級(jí)研究工程師盧帥認(rèn)為,飛躍進(jìn)展應(yīng)該會(huì)很大。但在這個(gè)領(lǐng)域還有一個(gè)待解決的問題,那就是測(cè)試。對(duì)于人類來說,短時(shí)間內(nèi)可能很難完全相信人工智能生成的東西,因此提高測(cè)試的效率對(duì)于人工智能來說是有研究?jī)r(jià)值的。人工智能會(huì)對(duì)整個(gè)軟件開發(fā),特別是編寫代碼這個(gè)環(huán)節(jié)的效率有非常大的提升。
但 aiXcoder 聯(lián)合創(chuàng)始人郝逸洋有不同觀點(diǎn):根據(jù)他的落地實(shí)踐經(jīng)驗(yàn),在短期內(nèi)實(shí)現(xiàn)顯著的生產(chǎn)力提升是相當(dāng)困難的。程序員并非將大部分時(shí)間都花在寫代碼和開發(fā)新功能上,而是在調(diào)試 Bug,可能 90 %的時(shí)間都是如此。但如今卻沒有討論這個(gè)問題,原因在于目前的AI技術(shù)還沒有達(dá)到相應(yīng)水平,無法協(xié)助程序員完成 deBug。如果它可以助你實(shí)現(xiàn)這一目標(biāo),才是真正的震撼,意味著突破來了。
那么,對(duì)于未來的程序員而言,哪些技能的培養(yǎng)更為重要?清華大學(xué)知識(shí)工程實(shí)驗(yàn)室研究助理鄭勤鍇認(rèn)為:在將來,程序員需要具備一些更高級(jí)的技能和思維,比如 Geek (極客)思維,你需要了解問題在哪里?哪些方面可能需要優(yōu)化?如何提出這些問題?一個(gè)初級(jí)程序員很可能不知道問題在哪里以及何處可以優(yōu)化,所以你需要理解整個(gè)編程系統(tǒng)或架構(gòu)的設(shè)計(jì),這將幫助你獲得這種技能。目前 GPT 對(duì)代碼的認(rèn)識(shí)還不夠全面,這就需要開發(fā)者從一個(gè)更全面的角度出發(fā),具體描述每個(gè)模塊,確定哪些環(huán)節(jié)較薄弱,哪些可以進(jìn)行優(yōu)化。這種能力非常重要,開發(fā)者應(yīng)該更加注重學(xué)習(xí)它。
對(duì)于 GPT-4 模型將推動(dòng)哪些領(lǐng)域與技術(shù)革新,大家展開了大膽預(yù)測(cè)。
aiXcoder 聯(lián)合創(chuàng)始人郝逸洋表示:一般來說程序員寫軟件需要編寫代碼,并在編譯后按照指令執(zhí)行程序?,F(xiàn)在我們已經(jīng)可以讓 AI 直接生成代碼,那么為何不讓它直接生成機(jī)器指令并且去執(zhí)行呢?如果 AI 作為操作系統(tǒng)可以直接控制硬件,當(dāng)程序員下達(dá)一個(gè)指令后,AI 便會(huì)立刻執(zhí)行,并不需要程序員的參與。那么程序員是否可以將這些新技術(shù)和指令傳授給 AI,讓其掌握并獨(dú)立操作?如此一來他們就可以解放雙手去編寫驅(qū)動(dòng)、操作系統(tǒng)和軟件或是研發(fā)新的硬件,這就是軟件 3.0 的圖景。
華為云 PaaS 技術(shù)創(chuàng)新 LAB 技術(shù)專家申博考慮到:數(shù)據(jù)是否會(huì)遇到“數(shù)據(jù)荒”的問題。當(dāng)模型越來越大,對(duì)硬件性能要求越來越高,而人類社會(huì)的語言文字、以及多模態(tài)數(shù)據(jù)都是有限的資源。我們現(xiàn)在擁有如此龐大的數(shù)據(jù)量,是多年的積累的成果。不能期望這種緩慢自我發(fā)展來產(chǎn)生數(shù)據(jù),我們能否讓 AI 自我演進(jìn)?這種自我演進(jìn)的過程,正好符合人類自我創(chuàng)造和自我學(xué)習(xí)的機(jī)制。這個(gè)問題值很得研究。如果某些領(lǐng)域的數(shù)據(jù)相對(duì)較少,就可以考慮通過自我生成數(shù)據(jù)的方式學(xué)習(xí),以達(dá)到與大數(shù)據(jù)同樣的效果。“自我創(chuàng)造智能”是個(gè)有前途的方向。
中國(guó)科學(xué)院軟件研究所研究員、博士生導(dǎo)師王俊杰則希望看到大型智能型應(yīng)用能夠幫助更多使用不便的人,如老年人。大多數(shù)人認(rèn)為非常方便易用的手機(jī),可能對(duì)于年長(zhǎng)一些的人并不友好,他們不知道要如何預(yù)訂機(jī)票或如何使用應(yīng)用。有朝一日是否可以省略中間層,讓應(yīng)用變得更加智能、易用,讓老年人或不便者可以通過輸入指令輕松完成日常任務(wù)?此外,若干年后,當(dāng)大型模型能夠達(dá)到自我意識(shí),也會(huì)帶來一些令人擔(dān)心的問題。
除了上述問題,現(xiàn)場(chǎng)觀眾也積極提問,絕不放過向?qū)<覀內(nèi)〗?jīng)的機(jī)會(huì):對(duì)新手來說,如何評(píng)價(jià)AI大模型推薦的代碼的優(yōu)劣?
對(duì)代碼自動(dòng)化測(cè)試頗有研究的王俊杰接過了話筒:在理想情況下,如果有測(cè)試用例就能夠做到,但在現(xiàn)實(shí)情況下,很多時(shí)候并沒有測(cè)試用例,也不太知道自己能得到什么樣的結(jié)果,因此還得在軟件完成之后的系統(tǒng)測(cè)試階段對(duì)它進(jìn)行比較完整的測(cè)試。
這個(gè)場(chǎng)景非常具體,對(duì)于新手要如何評(píng)測(cè)自己是否采納AI推薦的代碼,我們也沒有太豐富的經(jīng)驗(yàn),在這里僅和大家分享一點(diǎn)新的想法。早前人們使用傳統(tǒng)的機(jī)器學(xué)習(xí)算法時(shí),在推薦給出一些結(jié)果的同時(shí)也會(huì)給出其概率,未來大模型是否能參考前者,為生成的結(jié)果附上概率,幫助人們確定AI推薦的代碼是否為自己所需,如果能有這樣的 Guideline,在選擇的時(shí)候就更有針對(duì)性。對(duì)于大模型顯示不太確定的內(nèi)容,就增加人工審查力度,反之則減少人工審查工作量。
探索“新程序員”邊界,擁抱AI新紀(jì)元
至此,AI 編程技術(shù)論壇完滿落幕,但關(guān)于AI與編程的探討與創(chuàng)新不會(huì)停下腳步。
未來,程序員在人工智能產(chǎn)品的協(xié)助下會(huì)明顯提升單兵作戰(zhàn)能力,技術(shù)團(tuán)隊(duì)會(huì)有更多時(shí)間用于創(chuàng)新,很多程序員也會(huì)承擔(dān)起一部分產(chǎn)品經(jīng)理甚至是老板的責(zé)任。CSDN 也將與你一起持續(xù)探索“新程序員”的邊界。
不論你是否主動(dòng)擁抱 AI,屬于AI的時(shí)代已經(jīng)來臨,打不過那就加入吧!
點(diǎn)擊 “閱讀原文”或在CSDN視頻號(hào)可查看精彩直播回放。