在近期舉辦的IDEA大會上,美國國家工程院外籍院士、IDEA創院理事長沈向洋以一句幽默而現實的話語引起了廣泛關注:“談卡傷情,無卡更無情。”這句話不僅逗樂了在場觀眾,也深刻反映了沈向洋對未來AI時代的樂觀態度。
隨著AI技術的不斷發展,大模型的熱度已不再像ChatGPT初現時那般迅猛增長。進入人類探索AGI(通用人工智能)的第二階段,大語言模型的迭代速度明顯放緩,而AI應用與落地則成為全球關注的焦點。沈向洋指出,盡管GPT-5尚未面世,但算力的增長仍呈現樂觀態勢。據EPOCH AI數據統計,大模型對算力的需求每年都呈現出四倍以上的增長趨勢。
在大會上,沈向洋詳細闡述了黃仁勛提出的“黃氏定律”,該定律以模型訓練來衡量算力的增長。若按每年算力增長四倍的速度恒定發展,未來十年或將見證100萬倍的算力需求增長。然而,這一預測仍需時間驗證。沈向洋強調,大模型的進步不僅要求參數和模型規模的擴大,對訓練和數據量的需求也在同步增長。算力需求與參數之間呈現出平方關系,這意味著算力需求將急劇增加。
沈向洋進一步指出,AI的發展離不開“算力、算法、數據”這三大要素。在大會上,他圍繞這三個方向,介紹了IDEA的最新進展。IDEA最新發布的通用視覺大模型DINO-X,具備真正的物體級別理解能力,能夠在開放世界中實現目標檢測,無需用戶提示即可檢測所有物體,包括罕見的長尾物體。這一能力將大大拓展模型的落地場景。
DINO-X在自動駕駛、智能安防、工業檢測等領域也將發揮重要作用,能夠應對各種復雜場景,識別出傳統模型難以檢測的物體。IDEA團隊還推出了行業平臺架構,通過一個大模型基座,結合通用識別技術,使模型能夠邊用邊學,滿足多種多樣的B端應用需求。沈向洋表示,“用一個模型解決一百萬個問題”是這次模型發布的關鍵理念。
然而,隨著模型體量的增大,高質量數據已成為制約AI發展的瓶頸。沈向洋指出,當前人工智能的發展已經耗盡了人類社會的大部分高質量數據。為解決這一問題,IDEA團隊發布了自研的語境圖譜技術,該技術通過引入“指導手冊”,以圖譜為綱,指導用于合成的語境采樣,解決了過往文本數據合成方案多樣性匱乏的問題。
實驗結果顯示,IDEA團隊的方案能夠持續為大模型帶來能力提升,表現超過目前的最佳實踐,同時平均節約成本85.7%。IDEA在AI應用落地方面也取得了顯著進展。今年,IDEA公布了多個垂直領域的應用探索,包括化學領域專家大模型、科研數據處理平臺以及AI編程工具等。
其中,IDEA研發的化學領域專家大模型在分子屬性預測和化學反應預測能力上達到了業界領先水平。新發布的化學文獻多模態大模型則與晶泰科技聯合發布了專利數據挖掘平臺PatSight,將藥物領域的專利化合物數據挖掘時間從數周縮短至1小時。同時,IDEA研究院的MoonBit團隊展示了其開發的云原生AI編程工具MoonBit,該工具具備完備的多后端支持和跨平臺能力,將于12月正式開放。
在硬件層面,IDEA也取得了顯著進展。坐落在大灣區的IDEA擁有得天獨厚的硬件產業基礎和優勢,與騰訊、美團和比亞迪等知名企業展開了合作。其中,IDEA與騰訊合作在深圳福田區、河套深港科技創新合作區落地建設福田實驗室,聚焦人居環境具身智能技術;與美團合作探索無人機視覺智能技術;與比亞迪合作拓展工業化機器人智能應用。
IDEA還發布了《低空經濟發展白皮書3.0》,并發起共建OpenSILAS創新聯合體,與17家首批發起單位攜手,共同打造一個開放共享、技術領先、不斷迭代的系統和平臺。沈向洋在大會最后表示,AI的發展不僅要追求經濟增長,更要轉化為人類的最大福祉。這是IDEA研究院及其合作伙伴在人工智能發展道路上必須思考的問題。