字節(jié)跳動近期對其旗下的智能AI助手豆包進行了功能升級,重點強化了其文字生成圖片(文生圖)的能力。現(xiàn)在,用戶只需在生成圖片的提示詞中加入所需的文本要求,例如“制作一張帶有‘新年快樂’字樣的圖片”,豆包就能迅速生成一張包含指定文字的圖片。這一創(chuàng)新功能已經(jīng)在豆包APP內(nèi)啟動測試,并且也在即夢平臺上進行了小范圍的試驗。
在文生圖技術(shù)的領(lǐng)域,如何在圖片中精確無誤地生成文字,尤其是中文文字,一直是一項技術(shù)挑戰(zhàn)。由于漢字的結(jié)構(gòu)比英文字母更為復(fù)雜,且字符數(shù)量遠超后者,因此亂碼問題時有發(fā)生。據(jù)豆包大模型團隊的相關(guān)負責(zé)人介紹,豆包文生圖模型通過整合LLM和DIT架構(gòu),顯著提升了其原生中文數(shù)據(jù)的學(xué)習(xí)能力。在此基礎(chǔ)上,團隊還進一步強化了漢字的生成能力,使得生成的圖片中的文字效果有了質(zhì)的飛躍。
目前,許多用戶已經(jīng)開始利用這一新功能制作表情包、梗圖漫畫,甚至輔助生成海報,并在社交媒體平臺上分享他們的創(chuàng)作。然而,值得注意的是,當(dāng)前該功能僅支持在生成圖片時添加文字,暫不支持在已有的圖片上添加文字。豆包團隊表示,這一功能仍在不斷完善和優(yōu)化中。雖然絕大多數(shù)情況下豆包都能準確生成指定的文字,但在少數(shù)情況下,仍可能出現(xiàn)錯別字、漏字或小字亂碼等問題。
豆包作為字節(jié)跳動推出的AI智能助手,其應(yīng)用場景十分廣泛,支持手機App、PC電腦版、網(wǎng)頁版以及瀏覽器插件。作為一位全能型的AI助手,豆包能夠為用戶提供全方位的生活、學(xué)習(xí)和工作幫助。用戶可以通過豆包搜索信息、解答疑惑、分析總結(jié)、提供靈感,甚至輔助創(chuàng)作,從而提高生活和學(xué)習(xí)效率。
隨著豆包功能的不斷升級和優(yōu)化,用戶將能夠享受到更加便捷和高效的智能助手服務(wù)。無論是制作個性化的圖片,還是解決日常生活中的各種問題,豆包都將是一個不可或缺的得力助手。