7 月 20 日,由北京市委網信辦指導、首都互聯網協會主辦、品玩承辦的首屆“青年思享會”青年先鋒論壇在京成功舉辦。
論壇以“人工智能的機遇和挑戰”為主題,邀請了來自中國科學院的專家學者,以及向量數據庫公司 Zilliz、百度、科大訊飛、奇安信、云測數據、中科聞歌等企業的青年先鋒,共同探討在人工智能的背景下,大語言模型的技術路徑、商業化落地、產業化發展和生態系統建設,力求“全景式”解鎖大模型的真實面貌,“立體式”呈現大模型未來圖景。
北京市委網信辦相關負責人表示,“我們要以《生成式人工智能服務管理暫行辦法》為準繩,明確生成式人工智能服務安全要求,認真做好申報安全評估、加強數據安全和隱私保護等工作,規范操作、劃好底線、守住安全。希望大家在企業的發展過程中強化主體責任,既要把握人工智能等新技術、新應用帶來的機遇,營造創新生態,又要保持正確的大局觀、發展觀、安全觀,重視防范風險。”
向量數據庫領先者 Zilliz 合伙人兼產品總監郭人通受邀參與高端對話環節,本次對話由品玩創始人兼 CEO 駱軼航擔任對話主持人,主題為“打破壁壘,打造中國大模型健康發展的生態系統”。
郭人通認為,做好大模型生態必須要以模型為核心,圍繞周邊系統進行建設,尤其是系統的基礎軟件建設,只有這樣才能真正促成產業落地、為行業創造更多價值。
在被問及大模型和向量數據庫的關系時,郭人通表示:
如果將大模型應用看成一個計算機系統,那么大模型就是 CPU,負責自然語言的對接和分析工作;向量數據庫則是計算機的外部存儲,可以理解為記憶體,承擔著存儲和檢索向量信息的工作。 在二者的相互配合下,可以有效提升大模型應用的效果和效率。
在探討“如何降低大模型的訓練成本及其未來走向”的話題時,郭人通給出了不一樣的解讀:
一方面,現在的模型引入大量參數,但是很大一部分都用來編碼死記硬背的內容。另一方面,人腦比大模型參數多很多,但也不會去嘗試記下世界上所有的內容。所以 LLM 到了現在這個階段,未來可能的方向是嘗試把這些死記硬背的內容從大模型移出來,更多的參數(以及對應的成本)用于提升理解和邏輯推理這樣的高階語義理解能力。
還有一點,Yann LeCun 提出的「世界模型」現在不是特別主流,但個人覺得比較有趣。這里無論是世界模型的表示,還是上面提到的“死記硬背”的知識性內容,有可能會和現代計算機系統計算/存儲可互換很類似,到底是編碼到模型參數,還是放置到外掛的記憶體,應該也是可互換的。
Zilliz 合伙人兼產品總監 郭人通
首屆“青年思享會”青年先鋒論壇的圓滿落幕,也預示著 AI 大模型正朝向健康可持續合規的方向發展。AI 大模型正在成為賦能千行百業、引領產業變革的關鍵力量。未來,隨著人工智能加速發展,Zilliz 將和產業各界一起通過系統創新、堅持開源開放,加速大模型生態繁榮發展。