在近日的一次訪談中,微軟AI主管Mustafa Suleyman深入探討了人工智能領(lǐng)域的最新趨勢。他認為,未來幾年AI模型將呈現(xiàn)大小模型“齊頭并進”的趨勢。
一方面,大型模型的規(guī)模化競賽仍將持續(xù),并融入更多模態(tài)的數(shù)據(jù),例如視頻、圖像等。另一方面,利用大型模型訓練小型模型的技術(shù)(如蒸餾)興起,高效的小型模型將在特定場景中發(fā)揮巨大作用。Suleyman補充稱,未來,知識將被濃縮到更小、更便宜的模型中,嵌入各種設(shè)備,實現(xiàn)真正的環(huán)境感知革命。
對于創(chuàng)業(yè)者而言,Suleyman認為,理解并利用提示工程至關(guān)重要。通過提供高質(zhì)量的指令集,創(chuàng)業(yè)者可以引導預訓練模型,使其符合自身品牌價值觀,打造獨特產(chǎn)品。小型模型蘊藏著巨大機會,創(chuàng)業(yè)者可以利用其低成本和高效性,開發(fā)針對特定用例的應用。
采訪中,Suleyman還強調(diào)了數(shù)據(jù)整合的重要性。合成數(shù)據(jù)將成為訓練模型的關(guān)鍵,但如何獲取、整合這些數(shù)據(jù)仍需深入探討。
這位微軟AI主管還談到了新模式的加入,例如視頻和圖像的整合,以及跨復雜數(shù)字界面的動作軌跡的理解和數(shù)據(jù)收集。他認為,這將帶來許多令人印象深刻的結(jié)果。對于企業(yè)家來說,如何利用這些新趨勢和技術(shù)進行創(chuàng)新,將是未來成功的關(guān)鍵。
以下為全文內(nèi)容,大家enjoy~ ??(為增加可讀性,我們對原文進行了簡要編輯)
Q:未來幾年,在不斷發(fā)展的模型 (models) 格局中,有哪些事情值得關(guān)注?
A:模型的規(guī)模既在變大,也在變小,這種趨勢幾乎肯定會繼續(xù)下去。
去年開始流行一種新方法,稱為蒸餾。這類方法利用大型、高成本模型來訓練小型模型。這種監(jiān)督效果相當不錯,目前已有充分的證據(jù)支持這一點。
因此,規(guī)模仍然是這場競爭中的關(guān)鍵因素,未來還有很大的發(fā)展空間,數(shù)據(jù)量也將持續(xù)增長。
至少在接下來的兩三年內(nèi),“規(guī)模法則”在提供超預期表現(xiàn)方面的進度不會有任何放緩。
Q: 還有哪些新的模式可以加入?
A:人們也在考慮將視頻、圖像以及跨復雜數(shù)字界面的動作軌跡等新的模態(tài)融入模型中。
但我們真正感興趣的是跨復雜數(shù)字界面的動作軌跡,比如從瀏覽器跳到桌面,再轉(zhuǎn)移到手機,從不同的生態(tài)系統(tǒng)中切換,無論是在封閉的花園還是開放的網(wǎng)絡(luò)中。
我們試圖理解這些軌跡,收集大量數(shù)據(jù),使用監(jiān)督學習和微調(diào)等方法。我認為這將帶來許多令人印象深刻的結(jié)果。
Q: 在數(shù)據(jù)方面,人們在哪些方面思考得不夠多?
A:數(shù)據(jù)的討論角度很多,經(jīng)典的問題是哪些數(shù)據(jù)可以使用及其質(zhì)量。我認為網(wǎng)上已經(jīng)有大量討論。
例如,合成數(shù)據(jù)是一個有趣的領(lǐng)域,如果我們有這樣的數(shù)據(jù),可以訓練出更好的小模型和大模型。如何獲取這些數(shù)據(jù)并確保其整合是一個關(guān)鍵問題。但是如何獲取這些數(shù)據(jù)并確保它們被整合起來,這一點還沒有得到足夠的討論。
Q:在處理模型時,提示 (prompt) 和問題 (question) 之間有什么區(qū)別?
A:提示不僅僅是你問聊天機器人的問題。當你問聊天機器人一個問題,那是一個問題;當你寫一個三頁的風格指南并附上模仿的例子,那是一個提示。
提示是你的高質(zhì)量指令集,指導預訓練模型以特定方式行為。令人驚訝的是,模型只需幾頁指令就能表現(xiàn)得非常不同。
為了讓模型表現(xiàn)出細微、精準和符合品牌價值的行為,你需要展示成千上萬個良好行為的例子,并將這些例子微調(diào)到模型中。這是預訓練過程的延續(xù),使用高質(zhì)量且準確的數(shù)據(jù)。
好消息是,成千上萬個例子對許多細分領(lǐng)域或特定垂直領(lǐng)域來說是非常容易獲得的。這是一個優(yōu)勢,初創(chuàng)公司在高質(zhì)量微調(diào)預訓練模型方面有很大的空間。
Q:小模型會帶來哪些機會?創(chuàng)業(yè)者如何利用它們做一些有趣且獨特的事情?
A:小模型無疑代表著未來。
大型模型在處理查詢時會激活數(shù)十億個不相關(guān)的神經(jīng)表示,盡管它們非常高效地進行搜索和引用數(shù)億個節(jié)點,但并不總是必要的。
我們將把知識濃縮到更小、更便宜的模型中,這些模型可以駐留在各種設(shè)備上,如耳塞、可穿戴設(shè)備、耳環(huán)、植物或傳感器。
這場環(huán)境感知革命長期以來一直被人們所期待,它將帶來功能性設(shè)備,例如一個冰箱磁鐵,冰箱磁鐵是我能想到的最小的數(shù)字設(shè)備。它可以在早上迎接你,告訴你天氣情況,告訴你冰箱里可能有什么或沒有什么,并提醒你查看日歷。
它可以在早上歡迎你,告訴你天氣,告訴你冰箱里可能有什么或沒有什么,并提醒你查看日歷。
這種模型可能只有幾千萬個參數(shù)。雖然目前還沒有人真正推動這一點,但任何兩人團隊都可以探索這一領(lǐng)域。
Q:人們在接下來的兩天里應該思考什么問題?
A:問題是,技術(shù)人員需要為設(shè)計一個更加人性化的未來做些什么。
這包括思考技術(shù)如何進化人類,以及我們的情感、激情和同情心如何通過我們與技術(shù)不斷變化的關(guān)系來表達。
Q:為什么說這是一個轉(zhuǎn)型時刻?
A:我們有足夠的證據(jù)表明,過去五十年的大技術(shù)轉(zhuǎn)型重塑了事物的結(jié)構(gòu)。