日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

揭開大模型“混元”的面紗兩個月后,10月26日,騰訊混元迎來第一次“批量上新”,并且對外開放。

首先,通過測試申請的用戶,都能夠在“混元”上畫畫了——從生成圖像的準確度、美觀度而言,如今混元搭載的“靈感”模塊,已經能生成相當合理、逼真的圖像。

文生圖是AIGC領域的核心技術之一,也是體現通用大模型能力的試金石,對模型算法、訓練平臺、算力設施都有較高的要求。在用戶側,這又是一個和廣大用戶聯系緊密的應用入口。

智能涌現嘗試用簡單的指令讓混元畫圖,生成速度基本在10秒左右,效果可以說風格各異,細節比此前更為豐富。

騰訊混元大模型批量上新:10秒生成AI圖像,超過180個騰訊業務接入

來源:混元助手

如果指令更復雜一點呢?

手部細節是可以說是文生圖的一個難點。但在輸入彈奏古箏的指令后,如圖所見,手部細節可以說比較逼真,沒有出現多指、扭曲等問題。

騰訊混元大模型批量上新:10秒生成AI圖像,超過180個騰訊業務接入

來源:混元助手

文生圖能力升級:不僅要美,更重要的是“對”

這兩個月,混元在文生圖領域的技術研發目標,用一句話可以總結:“AI圖像不僅要美,更重要是的是‘對’。”騰訊混元大模型文生圖技術負責人蘆清林表示。

首先要把用戶的指令理解對。在大模型的指令上,混元如今對中文里的意象理解也有所進步,采用了中英文雙語細粒度的模型,同時建模中英文進行雙語理解。比如,輸入“輕舟已過萬重山,水墨畫風格”,就可以得到下面的圖片:

騰訊混元大模型批量上新:10秒生成AI圖像,超過180個騰訊業務接入

來源:混元

能畫得更“對”,也來源于騰訊在訓練過程中的一些算法創新。

“在人像上的生成合理性上,我們把人物區分成肢體和手的數據,以及人體的骨架信息都加入到訓練中,而手指頭生成的局部情況也用了多種形式控制,這樣畸形率會比較低。”騰訊混元大模型文生圖技術負責人蘆清林表示。

而畫面細節的提升,來自多種因素的總和,比如人物衣服褶皺、色彩層粗等等——混元用多模型融合的方式,來對其進行提高。

以前,文生圖產品用的常規擴散模型是基于CNN等技術架構,特點是比較局部,對整體的結構和刻畫能力沒有那么強。但現在,混元是基于擴散模型和Transformer架構相結合,可以刻畫更多細節,而且對空間位置的定位能力也有加強。

“目前在人像的優化上,比如頭發、皺紋,我們的效果提升了30%,在場景模型,比如草木、波紋,效果提升25%。”蘆清林估算。

超過180個騰訊業務接入,為廣告提效顯著

除了千億參數的主模型,騰訊混元此次也釋出了7B、13B等中小模型,主要面向垂直業務。

騰訊機器學習平臺負責人康戰輝表示,目前千億級別的混元模型訓練,涉及了超過了2.5T的數據。而最近一個多月,混元大模型能力提升比較大的在代碼能力以及數據推理,效果較此前有20%的提升。并且,對話上下文窗口,也從原來的4K,中小模型可以長至16K。

而第三季度,可以說是國內大模型領域的關鍵節點——包括百度、訊飛在內的各家廠商都不約而同地匯報對標GPT-3.5的進展。

在這個層面,騰訊表示,如今混元的千億級主模型,中文效果整體超過GPT3.5,而7B/13B中小模型實測效果整體優于國內外開源模型,如LLaMA2等。

康戰輝尤其指出了壓縮比這一參數——同等效果下,混元僅需較少的tokens,訓練效率更高。如今,基于,基于探真技術,混元大模型的幻覺率也下降了30%-50%。

而基于這些模型,大模型接入業務的形式既有API接入,也有基于混元進行精調后再部署。

在9月剛發布時,騰訊只有約60個業務接入,但兩個月之后,這個數字變成了180個。

騰訊內部各種類型的業務,可以看作大模型落地的切面。

騰訊機器學習平臺負責人康戰輝表示,其中60多個業務是基于混元做精調,比如騰訊會議、騰訊文檔、企業微信、騰訊廣告等。

而能落地的功能也越來也多。比如最近,QQ瀏覽器就基于騰訊混元推出了“PDF閱讀助手”,具備智能摘要、智能問答和多輪提問等功能。

可以看出,大模型落地已經到了一個新階段。業內對大模型落地的討論,也已經從參數量,進一步到更具體的模型選型——用大模型還是小模型?如何更切實地降低模型應用成本?

康戰輝介紹,當前騰訊內部業務的應用很多還是以效果為主。但每個業務都會根據自己的實際情況和場景,來選擇合適模型。“比如廣告肯定要兼顧成本,這是很復雜、務實的選擇。”

目前,已有來自零售、教育、金融、醫療、傳媒、交通、政務等多個行業的客戶,通過騰訊云調用騰訊混元大模型API,應用領域涉及智能問答、內容創作、數據分析、代碼助手等多個場景。這些業務里,既有使用千億模型,也有采用小模型,或者混合模型模式。

其中,騰訊廣告既是騰訊的核心業務之一,在大模型應用上也是走在前列的業務。

最早,騰訊就在廣告場景進行AI自動生成圖像的探索,如今騰訊混元的文生圖在人像真實感、場景真實感上有比較明顯的優勢。

“對包括傳統廣告的素材、創意生成、廣告鏈路推薦等等,如今我們也能用混元來進行生成。”康戰輝說。

而通過實測數據不斷迭代,相較Midjourney等文生圖的標桿模型,混元對廣告業務的提升已經有明顯優勢。“經過幾個月的攻堅,我們比MJ在廣告場景的應用明顯好一些,評測的goodcase率要比MJ高10個點左右,廣告主測評采納率混元比MJ高48%。”康戰輝透露。

另外,混元代碼、數學能力大幅提升后,當前也已經能在軟件研發、學習等環節提供更多幫助。當前,騰訊混元代碼處理水平提升超過20%,代碼處理效果在實測中高于ChatGPT 6.34%,在HumanEval公開測試集指標上超過Starcoder、Codellama等業界頭部開源代碼大模型。

只需輸入簡單的指令如“幫我用前端語言實現一個貪吃蛇”,騰訊混元便能自動生成可運行的代碼,快速制作出一個貪吃蛇小游戲。

騰訊混元大模型批量上新:10秒生成AI圖像,超過180個騰訊業務接入

來源:騰訊

此外,騰訊混元還支持Python/ target=_blank class=infotextkey>Python、C++、JAVA、Java等多種語言的指令生成,比如輸入“用Python畫紅色的心形線”,騰訊混元也會提供代碼庫選擇、安裝命令、繪制代碼等具體操作步驟的指引。

目前,騰訊內部已經有多個開發平臺接入了騰訊混元大模型,工程師們可以使用騰訊混元來進行代碼生成、代碼補全、代碼漏洞檢測和修復、表格數據處理、數據庫查詢等工作。

分享到:
標簽:模型 混元大
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定