文 | 適道
本期內容摘要
- 1. 早期找到AI投資的錨點
- 2. 投資向量數據庫Weaviate
- 3. 垂直整合投資
ChatGPT的橫空出世,讓創投界燃起對AI領域的投資熱情。
但不同于互聯網時代的流量模式,作為前沿科技,AI領域投入大、周期長、競爭者眾多。
AI投資難免出現“雷聲大雨點小”的現象。CB Insights數據顯示,今年第二季度,全球AI領域投資總額環比暴減38%。
即便如此,在每個行業都將被AI革命的當下,不可否認,AI一定是未來幾年最大的產業趨勢。創業投資數據庫Carta報告顯示,和其他類別的初創公司相比,AI初創公司的估值和融資規模擁有更好的增長趨勢。
投資人如何在發展早期找到AI投資的錨點,尤為關鍵。或許我們可以學習老牌風投公司的做法。
01 早期找到AI投資的錨點
Index Ventures(簡稱Index)是一家歐洲老牌的風險投資公司,成立于1996年。一直以來,Index都是AI的忠實信仰者和倡導者。
在ChatGPT發布的一年前,Index領投了Cohere的4000萬美元A輪融資,目前Cohere已經是估值20億美金的AI獨角獸。(關于Cohere是誰,可以參考我們的上一篇文章最年少Transformer論文作者如何與非典型華人創業者聯合打造20億美元的AI獨角獸?|獨角獸真探)
此外,在ChatGPT將AI主流化的前幾年,Index已經開始對舊金山的自動駕駛技術公司Aurora;紐約的機器學習平臺Arthur AI等人工智能公司進行投資。
前段時間,Index的合伙人Erin Price-Wright領投了Weaviate,這是一家開源向量數據庫公司。該公司在今年4月份以2億美元的估值籌集了5000萬美元的B輪融資,除了Index,NEA、Cortical Ventures、Zetta Venture Partners和ING Ventures也加入了這一輪融資。
那么,Index為何將眼光投向了向量數據庫?適道(ID:survivalbiz)找到了Index合伙人Erin Price-Wright女士近期的訪談文章《Here’s How Index Ventures Is Investing In An Era Where‘Every Company Will Have AI’》,下面是文章的翻譯簡寫和補充。
02 投資向量數據庫Weaviate
首先,對于ChatGPT,Price-Wright沒有給出高度評價,她認為ChatGPT只是在走捷徑,畢竟這項技術已經存在了幾年,不是什么新鮮事。ChatGPT之所以走紅,是因為“突然之間,它被每個人看到了,每個人能真切地感受到它作為一個消費品”。
那么,真正具備價值的是什么?
從采訪來看,Price-Wright給出的答案包括支撐ChatGPT的向量數據庫。
目前的大語言模型主要基于深度學習技術。深度學習需要輸入文本,圖片,視頻等語料數據。但這些語料數據需要轉化為向量數據,才能被神經網絡使用。而向量數據庫,是用來存儲和查詢向量數據的數據庫。
為解釋向量數據庫的作用,我們假設一個場景。圖書館一般按類型和作者排列書籍,例如文學類、經濟類等等。但如果你想找一本小時候看過的恐怖故事,只記得里面有稻草人變成活人的情節,不記得書名和作者時,你該怎么做?
如果你沒時間翻找書架,最快的方法是問圖書管理員,因為他們讀過很多書,更可能知道哪本書是你要找的。
那么,圖書管理員就是一個向量數據庫,因為向量數據庫旨在存儲關于對象(例如書籍)的復雜信息(例如書籍的情節)。因此,向量數據庫可以幫助你根據特定的查詢(例如,一本關于…的書)而不是一些預定義的屬性(例如,作者)來查找對象,就像圖書管理員一樣。
例如,讓ChatGPT用莎士比亞的語氣生成一段詩句,ChatGPT先會通過向量數據庫的相似搜索功能,才能增強內容輸出的準確性。
因此,訓練大模型時,向量數據庫可以成為一個知識庫,給大模型提供最新數據、每個客戶企業獨有的內部知識庫。
Price-Wright表示,在尋找這個投資機會(投資Weaviate)前,Index花了近兩年的時間研究向量數據庫。“而真正讓我們下定決心的事件是ChatGPT,它讓我們真正理解了向量數據庫在更多生成式AI工作流中的價值,以及真正理解嵌入算法的重要性。”
公司在思考中得出了兩個結果。
1、當你考慮了所有這些不同類型的生成式AI用例,會發現實際市場比單獨的企業搜索市場要大得多。(the market was actually way bigger than the market for enterprise search alone, if you’re thinking about all of these different types of generative AI use cases.)
2、擁有一個專用數據庫的價值,它可以非常接近嵌入算法。讓你成為其產品的一等公民,而不是現有數據庫的附加產品。(the value of having a dedicated database that could get really close to the embedding algorithms as a first-class citizen within its product, versus a bolt-on for an existing database.)
Price-Wright認為:“在接下來的十年中,已擁有大量數據集、大量客戶群和復雜運營的企業會開始將AI融入到他們的產品中,讓運營更高效、流程更精簡、決策更快更靈活。我們將看到AI成為企業新型搜索的一個大的推動者,將數據編碼成向量,并使用AI尋找相似的信息。對于很多用例來說,這比關鍵詞搜索更加強大。”
那么,讓Index青睞有加的Weaviate又有哪些優勢?
Weaviate首席執行官兼聯合創始人Bob van Luijt表示:“作為一個開源產品,Weaviate向量數據庫被用作AI原生生態系統的核心基礎設施。它允許從初創公司到企業的用戶創建新一波應用程序,范圍從定制的搜索和推薦系統到ChatGPT插件。”
另外,Weaviate向量數據庫簡化了AI開發人員的向量數據管理,解決了生成、存儲和搜索嵌入向量及其相應對象的難題,具有如下功能:
1、可擴展的內置機器學習(ML)模塊:只需加載和搜索;Weaviate負責機器學習(ML)的繁重工作——任何數據類型、任何模型、任何用例。
2、更豐富的向量搜索:支持各種ML搜索,還可以搜索向量和生成向量的源對象。
3、高性能:亞秒搜索,可擴展到數十億個對象,不間斷運行。
Price-Wright也曾在另一篇采訪中表示:“企業和人工智能原生初創公司使用Weaviate開發多模式搜索、推薦和生成應用程序的速度令人難以置信。這是開發人員使用人工智能構建的最佳產品,我們很高興能與他們合作,幫助推動下一階段的增長。”
03 垂直整合投資
除了投資向量數據庫,Index還在AI投資領域做了哪些動作?
如同SaaS隨著云計算的興起而出現一樣,基于AI原生的產品也正在帶來新的商業模式。
Index認為:第一,在十年內,AI將成為每一個應用軟件的核心組件;第二,這一波浪潮將由廣泛采用的基礎模型(foundation models)來推動。
“我們并不確切地知道這些新的商業模式將會是什么,但是我們對軟件價值鏈如何變化有一些想法,并且開始看到了新模式出現的早期跡象。”
在應用層,Index認為,隨著時間的推移,商業模式將轉變為通過AI來解鎖更多針對客戶的價值。用戶不再簡單地為使用SaaS付費,而是根據產品內的定制或個性化程度付費,例如針對行業、組織甚至個人進行微調的模型。
基于此,Index投資了Gong、DeepScribe等公司。
2020年,Index投資了Gong,他們的產品可以記錄銷售電話,并允許公司管理者來以此分析業績,發現客戶反饋的趨勢,幫助培訓和指導銷售代表。當一個組織廣泛采用該產品時,Gong就會沉淀他們與客戶對話產生的大量數據集。這反過來幫助Gong更好地定制產品,以高度個性化的方式服務于特定企業,從而改善用戶體驗。
2022年,Index領導了DeepScribe的A輪融資。DeepScribe的產品可以記錄醫患對話,并使用AI為電子健康記錄生成結構化的醫生報告。通過持續使用可以增加產品對特定用戶(例如,具有特定風格的醫生)或一組用戶(例如,特定專業的醫生或遵循一致標準的特定醫院集團內的醫生)的價值。
在這兩種情況下,隨著產品被持續使用,用戶將更多自己的數據放入產品中,AI也能夠以高度定制化的方式進行改進。
Index認為,這是AI原生(AI-native)公司建立護城河并隨著時間推移而持續獲得增長價值的一條途徑。
除此之外,Index投資了Hebbia,該產品可以用AI快速準確地為金融服務行業提供信息。Index還投資了Notion,這是一家擁有強大工作流和用戶體驗的公司,該公司目前致力將AI無縫融入到用戶使用中。
Price-Wright說:“當我談論AI是令人興奮的,因為它是一種新的促成技術(Enabling technology)。AI無處不在,并正成為每一款軟件的心臟起搏器。”