日韩在线最新一区第一页,九九国产私人影院免费观看视频,一本一道a√无码中文字幕

揭開大模型“混元”的面紗兩個月后，10月26日，騰訊混元迎來第一次“批量上新”，并且對外開放。

首先，通過測試申請的用戶，都能夠在“混元”上畫畫了——從生成圖像的準確度、美觀度而言，如今混元搭載的“靈感”模塊，已經能生成相當合理、逼真的圖像。

文生圖是AIGC領域的核心技術之一，也是體現通用大模型能力的試金石，對模型算法、訓練平臺、算力設施都有較高的要求。在用戶側，這又是一個和廣大用戶聯系緊密的應用入口。

智能涌現嘗試用簡單的指令讓混元畫圖，生成速度基本在10秒左右，效果可以說風格各異，細節比此前更為豐富。

騰訊混元大模型批量上新：10秒生成AI圖像，超過180個騰訊業務接入

來源：混元助手

如果指令更復雜一點呢？

手部細節是可以說是文生圖的一個難點。但在輸入彈奏古箏的指令后，如圖所見，手部細節可以說比較逼真，沒有出現多指、扭曲等問題。

騰訊混元大模型批量上新：10秒生成AI圖像，超過180個騰訊業務接入

來源：混元助手

文生圖能力升級：不僅要美，更重要的是“對”

這兩個月，混元在文生圖領域的技術研發目標，用一句話可以總結：“AI圖像不僅要美，更重要是的是‘對’。”騰訊混元大模型文生圖技術負責人蘆清林表示。

首先要把用戶的指令理解對。在大模型的指令上，混元如今對中文里的意象理解也有所進步，采用了中英文雙語細粒度的模型，同時建模中英文進行雙語理解。比如，輸入“輕舟已過萬重山，水墨畫風格”，就可以得到下面的圖片：

騰訊混元大模型批量上新：10秒生成AI圖像，超過180個騰訊業務接入

來源：混元

能畫得更“對”，也來源于騰訊在訓練過程中的一些算法創新。

“在人像上的生成合理性上，我們把人物區分成肢體和手的數據，以及人體的骨架信息都加入到訓練中，而手指頭生成的局部情況也用了多種形式控制，這樣畸形率會比較低。”騰訊混元大模型文生圖技術負責人蘆清林表示。

而畫面細節的提升，來自多種因素的總和，比如人物衣服褶皺、色彩層粗等等——混元用多模型融合的方式，來對其進行提高。

以前，文生圖產品用的常規擴散模型是基于CNN等技術架構，特點是比較局部，對整體的結構和刻畫能力沒有那么強。但現在，混元是基于擴散模型和Transformer架構相結合，可以刻畫更多細節，而且對空間位置的定位能力也有加強。

“目前在人像的優化上，比如頭發、皺紋，我們的效果提升了30%，在場景模型，比如草木、波紋，效果提升25%。”蘆清林估算。

超過180個騰訊業務接入，為廣告提效顯著

除了千億參數的主模型，騰訊混元此次也釋出了7B、13B等中小模型，主要面向垂直業務。

騰訊機器學習平臺負責人康戰輝表示，目前千億級別的混元模型訓練，涉及了超過了2.5T的數據。而最近一個多月，混元大模型能力提升比較大的在代碼能力以及數據推理，效果較此前有20%的提升。并且，對話上下文窗口，也從原來的4K，中小模型可以長至16K。

而第三季度，可以說是國內大模型領域的關鍵節點——包括百度、訊飛在內的各家廠商都不約而同地匯報對標GPT-3.5的進展。

在這個層面，騰訊表示，如今混元的千億級主模型，中文效果整體超過GPT3.5，而7B/13B中小模型實測效果整體優于國內外開源模型，如LLaMA2等。

康戰輝尤其指出了壓縮比這一參數——同等效果下，混元僅需較少的tokens，訓練效率更高。如今，基于，基于探真技術，混元大模型的幻覺率也下降了30%-50%。

而基于這些模型，大模型接入業務的形式既有API接入，也有基于混元進行精調后再部署。

在9月剛發布時，騰訊只有約60個業務接入，但兩個月之后，這個數字變成了180個。

騰訊內部各種類型的業務，可以看作大模型落地的切面。

騰訊機器學習平臺負責人康戰輝表示，其中60多個業務是基于混元做精調，比如騰訊會議、騰訊文檔、企業微信、騰訊廣告等。

而能落地的功能也越來也多。比如最近，QQ瀏覽器就基于騰訊混元推出了“PDF閱讀助手”，具備智能摘要、智能問答和多輪提問等功能。

可以看出，大模型落地已經到了一個新階段。業內對大模型落地的討論，也已經從參數量，進一步到更具體的模型選型——用大模型還是小模型？如何更切實地降低模型應用成本？

康戰輝介紹，當前騰訊內部業務的應用很多還是以效果為主。但每個業務都會根據自己的實際情況和場景，來選擇合適模型。“比如廣告肯定要兼顧成本，這是很復雜、務實的選擇。”

目前，已有來自零售、教育、金融、醫療、傳媒、交通、政務等多個行業的客戶，通過騰訊云調用騰訊混元大模型API，應用領域涉及智能問答、內容創作、數據分析、代碼助手等多個場景。這些業務里，既有使用千億模型，也有采用小模型，或者混合模型模式。

其中，騰訊廣告既是騰訊的核心業務之一，在大模型應用上也是走在前列的業務。

最早，騰訊就在廣告場景進行AI自動生成圖像的探索，如今騰訊混元的文生圖在人像真實感、場景真實感上有比較明顯的優勢。

“對包括傳統廣告的素材、創意生成、廣告鏈路推薦等等，如今我們也能用混元來進行生成。”康戰輝說。

而通過實測數據不斷迭代，相較Midjourney等文生圖的標桿模型，混元對廣告業務的提升已經有明顯優勢。“經過幾個月的攻堅，我們比MJ在廣告場景的應用明顯好一些，評測的goodcase率要比MJ高10個點左右，廣告主測評采納率混元比MJ高48%。”康戰輝透露。

另外，混元代碼、數學能力大幅提升后，當前也已經能在軟件研發、學習等環節提供更多幫助。當前，騰訊混元代碼處理水平提升超過20%，代碼處理效果在實測中高于ChatGPT 6.34%，在HumanEval公開測試集指標上超過Starcoder、Codellama等業界頭部開源代碼大模型。

只需輸入簡單的指令如“幫我用前端語言實現一個貪吃蛇”，騰訊混元便能自動生成可運行的代碼，快速制作出一個貪吃蛇小游戲。

騰訊混元大模型批量上新：10秒生成AI圖像，超過180個騰訊業務接入

來源：騰訊

此外，騰訊混元還支持Python/ target=_blank class=infotextkey>Python、C++、JAVA、Java等多種語言的指令生成，比如輸入“用Python畫紅色的心形線”，騰訊混元也會提供代碼庫選擇、安裝命令、繪制代碼等具體操作步驟的指引。

目前，騰訊內部已經有多個開發平臺接入了騰訊混元大模型，工程師們可以使用騰訊混元來進行代碼生成、代碼補全、代碼漏洞檢測和修復、表格數據處理、數據庫查詢等工作。

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

騰訊混元大模型批量上新：10秒生成AI圖像，超過180個騰訊業務接入

數獨大挑戰2018-06-03

答題星2018-06-03

全階人生考試2018-06-03

運動步數有氧達人2018-06-03

每日養生app2018-06-03

體育訓練成績評定2018-06-03