當人工智能進入千模大戰的白熱化狀態時,有些玩家開始獨辟蹊徑,要做大模型背后的“代理人”。這種智能代理的模式又被稱為大模型調用工具。
阿里云走的就是這條路線,它推出的大模型調用工具——魔搭GPT(ModelScopeGPT),可以完成比單獨的大語言模型更高級和多元化的任務。
比如,用戶在魔搭GPT的對話框輸入任務:“用20字描述一款新的VR眼鏡,并用女聲朗讀,隨后轉成視頻”,魔搭GPT會展示整個任務規劃過程,先由中樞模型生成一段描述VR眼鏡的文案,接著調用語音生成模型,生成語音并用女聲念出,最后調用視頻生成模型,輸出最終的視頻內容。過程中,魔搭GPT先后調用了一大二小三個模型。
那么如何保證魔搭GPT有足夠多的模型可以調用呢?
阿里云為此建立了一個魔搭社區,作為國內最大的AI模型社區,它集聚了180多萬開發者和900多個優質AI模型,這些模型由20多家頂尖人工智能機構貢獻,累計下載量突破3600萬。這其中,有約100個參數規模在10億以上的大模型。在魔搭平臺上,所有模型生產者都可上傳模型,驗證模型的技術能力,探索模型的應用場景和商業化模式。
而上述產品,正是阿里Maas(“模型即服務”)概念的具體體現。
在7月7日的世界人工智能大會上,阿里云CTO周靖人闡釋了Maas的幾層含義:
最底層的含義是要把模型作為重要的生產元素,圍繞模型的生命周期設計我們的產品,設計我們的技術,從模型的開發入手,包括數據處理、特征工程、模型的訓練和調優、模型的服務等等,圍繞這樣模型生命周期提供各種各樣的產品和技術。
模型還有另外一層含義,圍繞模型的生態發展,除了底層的基礎模型,我們還會聚焦行業,有行業的專屬模型,甚至到某一個企業,根據具體的應用場景,還有企業或者具體場景需要的專屬模型??梢钥吹侥P驼赃@樣層次化的結構不斷發展、不斷創新。
另外,模型不光是在云上,在端上、IOT設備里面也發揮了一系列的作用,今后,完整的模型生態不光是今天涉及到的云端,還會有手機端和隨身設備,模型在無形之中也形成了立體的服務機制,服務生活的方方面面。
在發布通義千問大模型之后,阿里云一直在豐富其AI產品形態,6月1日,阿里云發布了通義聽悟,這是一款基于通義千問語言模型、音視頻AI模型能力,能為用戶帶來音頻、視頻內容記錄和閱讀全新體驗的AI助手,幫助隨時隨地高效完成對音視頻內容的轉寫、檢索、摘要和整理,比如用大模型自動做筆記、整理訪談、提取PPT等,可成為用戶工作學習中的得力AI助手。
7月7日,周靖人又推出了通義家族的一個新成員:通義萬相。
通義萬相是繪畫領域的模型。大家通過文字描述的方式,讓萬相生成相關圖片。還可以結合一系列的模式和風格,讓萬相快速生成符合你描述的語義以及相關風格的精美圖片。描述語義可以通過多種語言,有效地精準地去描繪自己要生成圖片的內容。
除此之外,萬相也可以做風格遷移。比如,比較滿意圖片中體現的語義,但是不滿意圖象風格,就能通過通義萬相做風格的遷移。
如果我們比較喜歡某個圖片的風格,希望生成更多樣性的圖片,就可以利用相似圖的生成,讓通義萬相在保持相關風格的情況下,生成更多樣的圖片。
【來源:市界】