4月10日下午,商湯科技舉辦技術交流日活動,分享了以“大模型+大算力”推進AGI(通用人工智能)發展的戰略布局,并公布了商湯在該戰略下的“日日新SenseNova”大模型體系,推出自然語言處理、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力。
活動現場和直播平臺上,有觀眾表示:“超出預期”“程序員要失業了”。
但也有專業人士發表不同看法。對于商湯科技此次發布的新產品,知名科技作家陳根表示:“商湯從人工智能技術研發與理論研究層面來講,是有一定的優勢,因為有比較龐大的人工智能方面的科研人員。對于商湯而言,有建大模型的能力,但能不能訓練出真正的類ChatGPT產品是另外一回事。至少從現實來看,商湯依然面臨訓練數據、參數優化、硬件算力這三大硬傷。”
圖片來源:商湯科技算力需求劇增
商湯科技董事長兼CEO徐立表示:“在AI大模型時代,數據、算法和算力這三要素也在經歷新的演變,大模型參數量將以指數級的速率提升,而數據量隨著多模態的引入也將大規模增長,因此必然會導致算力需求的劇增。”
據介紹,商湯以AI大裝置SenseCore打造AGI時代的基礎設施,并基于此將大模型體系命名為“日日新SenseNova”,希望在模型的迭代速度及處理問題的能力上不斷解鎖AGI的更多可能。
商湯科技表示,大裝置上總共有27000塊的GPU芯片卡,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智能計算平臺之一。基于大裝置的能力,商湯目前已構建了計算機視覺、自然語言處理、AI內容生成、多模態、決策智能等多個領域的大模型,持續演進能力并廣泛支持各種應用。
“AGI催生了新的研究范式,即基于一個強大的多模態基模型,通過強化學習和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務。”商湯科技聯合創始人、首席科學家王曉剛表示,商湯已建立了全棧的大模型研發體系,并已在多個行業場景中落地。
推出語言大模型“商量SenseChat”
“日日新SenseNova”為政企客戶提供了多種靈活的API接口和服務,包括圖片生成、自然語言生成、視覺感知通用任務與標注服務。
“日日新SenseNova”也已為商湯的自身業務帶來了諸多突破。例如在智能駕駛領域,基于視覺大模型,商湯實現了可識別3000類物體的BEV環視通用感知算法的實車量產,也構建了感知決策一體化的自動駕駛多模態模型,帶來更強的環境、行為、動機解碼能力。
“日日新SenseNova”也推出了商湯最新研發的語言大模型“商量SenseChat”。作為千億級參數的自然語言處理模型,“商量SenseChat”使用大量數據訓練,并充分考慮了中文語境,能夠更好地理解和處理中文文本。活動現場,“商量SenseChat”展示了出色的多輪對話和超長文本的理解能力。
商湯也展示了語言大模型支持的幾項創新應用,包括編程助手、健康咨詢助手、PDF文件閱讀助手等。
此外,商湯還展示了“日日新SenseNova”的各種AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用,包括“秒畫SenseMirage”文生圖創作平臺、“如影SenseAvatar”AI數字人視頻生成平臺、“瓊宇SenseSpace”和“格物SenseThings”3D內容生成平臺等。
商湯科技表示,“日日新SenseNova”帶來的這些強大而易用的內容生成能力,將會改變內容生產行業的生產范式,突破內容創意的天花板,將會重塑內容生產行業生態并打開新的增長空間。
基于AI大裝置SenseCore和“日日新SenseNova”大模型體系,商湯或將提供涵蓋自動化數據標注、自定義大模型訓練、模型增量訓練、模型推理部署、開發效率提升等多種大模型即服務(Model-as-a-Service)。例如,模型推理部署服務可將大模型推理效率提高100%以上,降低用模型提供服務的成本。