3月22日消息,美國當地時間周二,微軟宣布在必應搜索和瀏覽器Edge中增加AI圖像生成功能,只需依據文字描述就能生成相應圖片。
這一新功能名為Image Creator,由OpenAI的生成式圖像生成器DALL-E提供支持。不過,微軟沒有透露其采用的是哪個版本的DALL-E,只是稱其為“最新版DALL-E模型”。
Image Creator現在正在必應預覽版中向用戶推出,并且只能通過必應的“創意模式”(Creative Mode)使用。將來,該功能也將擴展到必應“平衡模式”(Balanced Mode)和“精確模式”(Precise Mode)中。
同時,新的圖像生成器也將出現在Edge側邊欄中,允許用戶利用文本輸入提示創建圖像。微軟表示,隨著時間的推移,Image Creator將增加更多的語言支持。
按照文字提示,Image Creator將生成由四張高分辨率DALL-E圖像組成的正方形。微軟副總裁尤瑟夫·邁赫迪(Yusuf Mehdi)表示: “我們還明確表示,Image Creator的圖像是由AI生成的,并在每張圖像的左下角都包含了經過修飾的必應圖標,以幫助證明該圖像是使用Image Creator創建的。”
微軟迅速將AI文本轉圖像功能引入必應,這可能會導致該搜索引擎產生糟糕的圖像。專家警告說,文本轉圖像系統生成的圖像可能被用于宣傳、騷擾、虛假信息等。
對此,微軟解釋說:“為了防止濫用,我們已經引入了OpenAI的保護措施,并為Image Creator增加了額外的防護。例如,我們已經實施了旨在限制有害或不安全圖像生成的控制措施。當我們的系統檢測到提示可能導致生成潛在有害圖像時,它會阻止提示并警告用戶。”
微軟表示,該公司將繼續對圖像生成器進行迭代更新。具體來說,微軟強調其正在努力優化Image Creator在多輪聊天中的工作方式。該公司發文稱:“我們仍然相信,將這些技術推向市場的最好方法是在公開場合仔細測試它們,這樣每個人都可以提供反饋。”
除了新的圖像生成器,必應還獲得了兩個額外的新搜索功能:視覺故事(Visual Stories)和知識卡2.0。在必應之前的版本中,這些知識卡類似于谷歌的知識面板,但現在它們增加了新的元素,包括AI生成的信息圖表和更具互動性的內容,如圖表和時間線等。
與此同時,視覺故事功能更像是AI生成版的Instagram stories。據悉,微軟最近幾周始終在測試這些功能,因為它們在部分用戶搜索中出現的頻率很高。這些故事配有AI生成的音頻旁白,具體取決于主題。有時,它們會出現在搜索結果的首位,也可能出現在知識卡中。
例如,當搜索“俄勒岡州波特蘭”時,必應會突出顯示諸如“如何在波特蘭市內找到真菌”和“波特蘭:美國最古怪城市”之類的故事。然而令人稍感遺憾的是,目前似乎還沒有一種方法可以直接鏈接到這些故事。
【來源:網易科技】