3月,隨著OpenAI新一代模型GPT-4以及百度“文心一言”的正式公布,通用人工智能AGI的概念再次點燃全球社交平臺。從最初的文字對話到如今的看圖寫代碼,AGI領域終于迎來了屬于自己的“iPhone 時刻”,而對話式AI這一充滿無限可能的AI類型也再次展現出融合未來趨勢的美妙圖景。
本月初,人工智能聊天機器人公司Character.ai獲得一筆超2億美元融資,由a16z領投,其聯合創始人Mark Andreessen將加入Character.ai董事會。作為一家成立不到一年的公司,Character.ai在0收入的情況下達到10億美元估值,并得到資本巨頭青睞,發展不可謂不快,但其業務卻非常“簡單”——創建人人可用的AI聊天機器人。
在Character.ai,你可以和任何你想到的人物對話,無論是現實中的埃隆·馬斯克還是漫威電影里的托尼·史塔克,任何人都可以創建屬于自己的虛擬人格并與其對話,對方則會代入對應的身份和語言風格,看似簡單的業務背后是真正的千人千面型AI未來。打造這一宏大目標的是谷歌早期員工之一,也是Transformer作者之一的Noam Shazeer,從谷歌離開之后,他的對話式AI如今成為投資領域關注的焦點。
縱觀全球,個性化聊天機器人作為流行趨勢已愈發明顯。從海外的Character.ai到Replika,各自都在探索“人人享有各自專屬AI聊天機器人”的未來,而回望國內,該領域的發展也日益受到投資者關注,無論是自微軟小冰團隊獨立的小冰公司,亦或者是由清華大學黃民烈教授創立的聆心智能,近年來都正逐漸成為新一輪革命的排頭兵。
01
投資潮爆發,對話式AI價值凸顯
近兩年,以OpenAI為代表,對話式AI成為資本領域的香餑餑。今年1月,微軟確認了對ChatGPT母公司OpenAI的新一輪數十億美元投資,而Character.ai在0收入的情況下也于今年3月完成超2億美元融資。根據PitchBook統計數據,2022年投資圈向生成式AI的投資總額達到13.7億美元(折合人民幣約93.69億元),幾乎為過去5年的總和。
這其中,對話式AI以自然語言處理技術(NLP)為核心,使機器可以理解、反饋人類語言并從交互中學習,最終實現人與機器之間的自然對話,成為眾多企業沖擊的技術領域。然而,很長一段時間里,對話式AI作為和人們日常距離最近的AI技術類型,一直被認為“不聰明”“沒有條理”。這是由于對話本身是語言處理中最困難的任務,早期聊天機器人的表現都比較刻板和機械,以“關鍵詞+模板”為主,將輸入語句與預先定義的 FAQ 知識庫進行匹配,但在隨后,對話式AI的發展過程不斷提速,共經歷四個階段:
1. 規則引擎階段:這一階段主要是基于規則的對話系統,即設定一系列規則和模板,用于響應用戶的指令和問題,但是由于規則的限制和模板的創新難度,導致該階段的對話系統具有很大的局限性。
2. 統計學習階段:隨著機器學習和自然語言處理技術的發展,人們開始嘗試使用統計學習方法來構建對話系統,主要是基于概率模型的統計語言模型,如隱馬爾可夫模型和條件隨機場等,但是由于數據和算法的限制,該階段的對話系統仍然存在很多問題。
3. 深度學習階段:隨著深度學習技術的發展,人們開始使用神經網絡模型來構建對話系統,主要是基于序列到序列模型和變形自編碼器模型,如Google的Seq2Seq和Facebook的FastText等。這一階段的對話系統在理解上下文和語義的能力方面取得了很大的進步,但是在生成多樣性和流暢度方面仍然存在一定的問題。
4. GPT模型階段:近年來,以OpenAI的GPT模型為代表的大型預訓練模型的出現,使得對話式AI的生成能力和智能水平得到了飛躍式的提升。目前,GPT-3和GPT-4已經可以實現高度流暢的對話和知識問答,并逐漸應用于多個領域。
對話式AI的發展經歷了從規則引擎到統計學習,再到深度學習和GPT模型的階段,隨著技術的飛躍,其應用場景和智能水平也不斷擴展和提高。根據《AI對話系統分級定義》,過去,只能夠完成單一場景下的對話在L1和L2之間。當問題數量多、語義復雜時,攔截率較低,難以快速實現響應,客戶滿意度低,且維護成本較高。如今,隨著大模型的發展,從數據、算法、算力等方面使對話式 AI 產生巨大變化,ChatGPT 為代表的的L4級別對話式AI無疑是工程、技術、數據等方面的綜合成功,并朝著L5級別進一步邁進。
如今,對話式AI在行業垂直類應用上已展現出其價值。以Character.ai為例,通過搭建端到端的工程棧,覆蓋模型的研發與訓練、數據、應用整條價值鏈。用戶不僅能夠隨意與平臺上訓練好的海量對話式AI角色進行對話互動,還能夠訓練自己需要的任何虛擬角色,并保持角色的屬性一致性。這些產品特性不僅將Character.ai自身的能力無限延伸,也保持了較高的用戶黏性。在外界看來,Character.AI 擁有較大的商業發展空間,不僅能夠面向C端以訂閱式服務打造千人千面的Ai陪伴式應用,也能夠面向B端用戶打造符合其定制特性的個性化AI形象。
無論智能客服、IoT語音助手、醫療診斷還是金融風險評估等領域,其商業價值快速提升,投資潮也隨之爆發。而對千人千面的AI聊天機器人來說,其價值不僅在于簡單的問答,還能夠根據用戶的口吻、情感等進行情感分析和智能回復,提升用戶體驗的同時,進一步融入更多領域。
02
多家概念股持續拉升,國內對話式AI爭先冒頭
放眼國內,對話式 AI 的市場潛力也不可小覷。根據利文聯合頭豹研究院發布的《人工智能系列報告:2021年中國對話式AI市場報告》數據,2021年,中國對話式AI市場規模為82.7億元,到2026年,這一數字有望增長至265.8億元,年復合增長率高達26.3%。
與此同時,國內巨頭“跑步入場”對話式 AI 領域,百度、阿里、字節、京東等大廠接連入局,各大 AI 創企也不甘落后。今年以來,以百度“文心一言”、復旦團隊的“MOSS”為代表的功能型語言大模型路線,和以小冰公司“小冰島”、聆心智能團隊“AI烏托邦”等代表的擬人型語言大模型路線受到了廣泛關注。隨著眾多玩家廣泛深入,創新項目不斷涌現,但無論是大型企業還是創業公司,在人才建設、技術突破、商業模式等方面都處于早期階段,更需要長期堅持、投入和創新。
國內,早在2021年小冰公司發布了全球首個 AI 社交平臺“小冰島”。在該平臺中,人類用戶可以創造各種人工智能個體,并形成一個共同生活的社交網絡。在大模型領域,小冰公司發布了“小冰鏈”。小冰CEO李笛指出,小冰鏈采用自然語言處理技術,能夠理解用戶的問題,并給出相應的答案。此外,小冰公司在檢索模型、生成模型、大模型和X-CoTA等方面也實現突破,于2022年宣布完成了總額10億元人民幣的新融資。
北京彩徹區明科技在2021年推出的“彩云小夢”,基于常識和小說語料訓練的中國本土語言模型在續寫生成方面相比 ChatGPT 也有著不錯的表現。其核心邏輯是用戶輸入一段文本,就可以用 AI 續寫一段文字,用戶還可以任意的增刪改。2022年“彩云小夢”推出了2.0版本,用 NLP 技術驅動對話場景,在情節續寫的基礎上實現用戶與 AI 虛擬人物的對話,提供更多互動性和情感陪伴。
相較于前兩者,2022年11月上線的Glow屬于“新玩家”,但吸引了部分Z時代年輕用戶。該產品和 ChatGPT 百科全書一樣的回答不同,其定位為AI 虛擬聊天社交軟件,主打聊天、陪伴等情感功能。GLOW 背后的公司 MiniMax 成立于2021年12月,以實現AGI為目標,由前商湯副總裁閆俊杰創立。在2022年上半年由明勢資本領投了天使輪融資,此前米哈游參與了對 MiniMax 的兩輪投資,目前正在謀劃與紅杉資本共同發起新一輪投資。
2022年12月上線的“AI烏托邦”則對標Character.AI,由清華大學黃民烈教授創立的聆心智能團隊推出,通過小程序和網頁端向公眾開放,也引發了Z世代用戶群體的廣泛關注。該產品基于聆心智能團隊自研的超擬人大模型,根據大模型可控、可配置、可信的核心技術優勢,優勢在于允許用戶快速定制 AI 角色,提供千人千面的AI形象,不僅能夠滿足用戶聊天、陪伴的情感需求,還能夠提供與 ChatGPT 相似的助理、百科功能。目前,聆心智能已完成Pre-A輪融資。
03
機遇和挑戰,對話式AI成為泡沫還是希望?
2023 年作為經濟全面復蘇和發展的重要一年,數字化轉型成為當前中國經濟發展的“主旋律”, 其中人工智能技術在數字經濟建設中發揮著重要作用。
我國曾提出《新一代人工智能發展規劃》,明確“三步走”戰略:2020年實現我國人工智能總體技術和應用與世界先進水平同步;2025年實現我國人工智能基礎理論重大突破,部分技術與應用達到世界領先水平;2030年實現我國人工智能理論、技術與應用總體達到世界領先水平。2022年,科技部等六部門聯合印發的《關于加快場景創新 以人工智能高水平應用促進經濟高質量發展的指導意見》,圍繞構建全鏈條、全過程的人工智能行業應用生態建設十大示范場景,為加快推動人工智能應用。在這樣的政策背景下,人工智能技術在助力穩定經濟當年發揮積極作用,同時為培育新的經濟增長點保駕護航。
從市場前景來看,據IDC研究預計在未來5年內,對話式人工智能在金融、零售、制造、醫療、政府和教育等六大行業至少會帶來30%-64%的價值提升。隨著技術的不斷發展和普及,對話式AI已經在許多領域展現出了它的巨大潛力,如客戶服務、醫療診斷、教育培訓等。對話式AI不僅可以為用戶提供更加智能化、個性化的服務,還可以幫助企業降低成本、提高效率,對于推動產業升級和經濟發展具有重要的作用。
與任何新興技術的出現一樣,對話式 AI 仍存在一定的挑戰。
從技術方面來看,目前的對話式AI還難以完全替代人類的智能,特別是在情感理解、判斷和創造性方面。其次,對話式AI的普及和應用還存在一些法律和道德問題,如數據隱私、安全性、責任和權益等方面。這些問題需要得到社會和政府的關注和解決。
從應用層面來看,一是語言輸入的問題,目前的對話式AI產品,僅支持正式的文本或語音,這提高了用戶的使用門檻,一些方言、口音等語言會影響 AI 對原始輸入的理解,進而產生錯誤或者無效的回答。二是AI的輸出問題,無論是 ChatGPT 還是其它大語言模型,都可能面臨著胡編亂造、不安全可信的問題,這不僅需要平臺在模型層面做好控制,也需要做好相關政策的治理,避免產生“有害的應用”。
以Character.AI為代表的對話式AI的出現預示著無縫人機交互時代的來臨,也加速了國內外對話式 AI 領域的成長態勢,但要打開市場,需要的不僅僅是模型的技術,還有場景化的應用開發。
如今,海外企業在人工智能方向的投資和熱情已經從技術本身走向了如何應用落地,也為國內行業探索帶來啟示。清華大學計算機科學與技術系長聘副教授、聆心智能創始人黃民烈指出:“行業發展需要推動大模型整個生態的發展,不僅需要底層大模型,也需要業務、垂直場景大模型、工具層,以及直接應用型的公司。”在他看來,教育、金融、數字產業將成為大模型應用生態的重要領域。
隨著高性能大模型的成本正在快速降低,未來對話式 AI 應用層的顛覆式創新或許不在技術,而在于產品設計的絕妙想法。那些更具有創業精神、產品基因的年輕團隊,或許更能抓住這一次浪潮。
目前來看,行業先行者們已經初步形成以數據為核心的飛輪效應,伴隨用戶與平臺上的虛擬角色產生互動,海量的數據成為完善其基礎模型的最佳基石,正如從量變引發質變的GPT-3一樣,在虛擬人格方面的行業進展將大大超過人們想象。
未來,隨著對話服務場景的智能化和線上化,AI 對話引擎與產業深度融合將成為未來社會釋放數字化疊加倍增效應、構筑綜合競爭優勢的必然選擇,并有極大可能改變人類的生活和生產方式。而如何積極擁抱這門新的技術并通過 AI 實現更高的人生目標與價值、實現更廣泛的應用并產出更高的業務價值,是個人與企業共同需要關注的命題。