4月17日,昆侖萬維正式發布千億級大語言模型「天工」并啟動邀請測試,已有媒體記者獲得邀請,實測后發現,「天工」在“文科”方面非常有天分,部分表現甚至超出了ChatGPT3.5。
「天工」由昆侖萬維與國內領先的AI團隊奇點智源聯合研發,是國內首個對標ChatGPT的雙千億級大語言模型,「天工」通過自然語言與用戶進行問答式交互,AI生成能力可滿足文案創作、知識問答、代碼編程、邏輯推演、數理推算等多元化需求。「天工」發布后,財聯社記者實測發現,「天工」在很多方面不遜于ChatGPT3.5。
記者測試了多個問題。其中,關于腦筋急轉彎的提問:小明的爸爸有三個兒子,大兒子叫大毛,二兒子叫二毛,三兒子叫什么名字?
「天工」3.5一次就答對了。
同樣的問題,記者問ChatGPT(3.5版本),雖也回答正確,但多了一句靈魂拷問:所以小明的名字是什么。
一道燈謎題,提問:說它是頭牛,不會拉犁頭,說它力氣小,背著屋子走。(打一個動物)
「天工」3.5又一次答對了。
而ChatGPT(3.5版本)并沒有答對。
面對“蒸包子”問題,「天工」3.5也回答的頭頭是道,頗為“理性”。
ChatGPT(3.5版本)則給出了略微不同的回答。
除了文科生的題目外,「天工」也能完成代碼。
記者嘗試使用「天工」3.5寫代碼,提問:用Scala實現并查集,在得到回答后,又再次提問:用Java再寫一遍。隨后記者拿給程序員朋友檢查,對方稱結果是對的,還表示這一問題相對基礎,寫代碼能力如何還要視具體需求,若能進行多輪對話聯系上下文修改,會是個輔助業務的“好幫手”。
以上足見「天工」3.5在語義理解、邏輯推理上表現優秀。
方漢表示,目前大家比較喜歡考驗大模型的問題,如腦筋急轉彎、段子和網絡梗,大部分都屬于語義問題。腦筋急轉彎是一種語言游戲,用它來考大模型也可以,也是一個很有娛樂性的話題,“但從大模型落地的角度,我們要更多從人類的通用治理上考核大模型,考核一種普適性的能力。”
據悉,「天工」3.5目前最高已能支持1萬字以上文本對話,實現20輪次以上用戶交互,在多類問答場景中都能實現較高的輸出水平及較強記憶能力。如此強大的能力,不禁令人好奇,「天工」是如何鍛造而成?
談及「天工」的誕生,昆侖萬維CEO方漢表示,昆侖萬維業務包括瀏覽器、社交娛樂、新聞、游戲等板塊,和內容的關聯性都非常強,所以對內容生成方面的技術進展一直非常敏感,從2020年起就開始在音樂AI領域投入。而奇點智源早在2020年就意識到AI技術在未來的應用潛力,當時GPT3誕生后,奇點判斷這是內容生成領域一個里程碑,因此果斷投入了大規模的算法和算力資源,聚集了一支高水平的科研團隊,開始構建自己的技術矩陣。
到了2022年,昆侖萬維準備從音樂AI往多模態AI拓展,同時奇點智源也越發強烈地意識到千億級大模型是AGI的一個突破口,并且只有自研千億級大模型,才能建立核心壁壘、掌握主動權。所以雙方一拍即合,因此「天工」是個水到渠成的選擇。
「天工」猶如黑馬出世,其優秀表現令人對昆侖萬維在AIGC方面的布局具有了更大的想象空間。
在4月12日披露的年報中,昆侖萬維表示展望未來十年將堅定的“All in”AGI(通用人工智能)與AIGC,2023年將不斷加強在相關方向的技術積累,以建立昆侖萬維在人工智能領域的領先優勢。人工智能技術一方面將作為新的發展引擎,全面激活內部各業務,助推公司業務發展進入新紀元;另一方面也將為個人及企業用戶定制化輸出AIGC能力,幫助各行業提效轉型,實現高質量發展。
昆侖萬維是中國領先的互聯網平臺出海企業。面對互聯網行業快速的發展變革,公司積極轉型,經過多年發展,現業務已經覆蓋包括信息分發、社交、娛樂、元宇宙、游戲及AIGC 等多個領域,用戶遍及全球一百多個國家和地區,累計月活躍用戶近 4 億,發展潛力巨大。