自今年新基建概念從政府文件中被放大并上升至全民關注的高度以來,新基建七大領域中的人工智能再一次成為了業界關注的焦點。只不過,在經歷了資本競逐之后泡沫破滅的蕭條后,經歷了寒冬與疫情洗禮過后的AI賽道變得更加理性且冷靜了。
致力于挖掘務實推進新基建發展的科技創新企業與行業技術領導者,傳播并報道他們對于新基建相關領域的認知以及商業化探索,由InfoQ特別策劃推出的「中國技術力量」之「中國新基建 50 人」欄目特此采訪出門問問創始人兼CEO李志飛。
創立出門問問之前,李志飛的身份是美國約翰霍普金斯大學計算機系博士,前Google總部科學家,主流機器翻譯開源軟件Joshua主要開發者。作為國內最早一批參與人工智能創業的企業領導人,李志飛對于新基建以及下一步人工智能產業的發展有著深入且細致的理解。
打造純中文智能語音助手
2010年前后,伴隨著谷歌、微軟、蘋果等國外科技巨頭先后在智能語音技術領域的動作頻現,國內老牌智能語音技術企業科大訊飛緊隨跟進,一批本土初創型人工智能語音技術企業也開始借助資本市場的助力,涌入智能語音賽道,智能語音技術創業熱開始在國內盛行。
成立于2012年的出門問問,正是這樣一家從創業之初就踩中了智能語音技術發展風口,并一步步發展成為如今的人工智能語音賽道獨角獸。
據李志飛介紹,由于他個人研究的方向是自然語言處理和人工智能,所以從谷歌回國的那一刻起,他的第一動機就是希望憑借全鏈路的語音技術,打造一個中文的虛擬個人助理。在李志飛所描述的技術版圖中,未來所有消費者將能夠通過一個統一的虛擬個人助理,在任何地方、任何設備上調出最理解自己的語音交互系統,進行高效的數字生活操作,真正實現出門問問的使命,定義下一代人機交互。
基于這一創業動機,出門問問自主研發并建立了包括聲音信號處理、熱詞喚醒、語音識別、自然語言理解、對話管理、垂直搜索、智能推薦、語音合成、知識圖譜等在內的全棧式人機交互技術棧,并分別面向消費端以及企業端發力,逐步拓展形成今天的規模布局。
人工智能下半場,單純依靠算法模型驅動企業融資發展的老路已經走不通了,如何讓AI技術更加貼近人們的真實生活場景,解決實際問題,這成為了人工智能企業獲取資本以及市場認可的關鍵。
面向消費級場景,出門問問推出了智能手表、智能耳機、智能后視鏡、智能音箱等一系列人工智能軟硬結合產品,并且實現了公司旗下產品均可通過出門問問中文虛擬個人助理實現聯動。并且還進一步將消費級場景積累的AI能力和經驗向車載、物聯網、金融、電信、健康養老、餐飲等企業級場景延伸。
在智慧出行這一重要的人工智能應用領域,出門問問圍繞未來汽車生態鏈打造了一系列基于人工智能技術的落地產品,包括車載語音交互系統平臺、AIoT聯動(智能家居及可穿戴設備)以及面向開發者的車載語音交互系統開放平臺。
駕駛場景下,通過語音進行車內控制、在線服務搜索等操作能夠大大提高駕駛安全系數,是非常明確的剛需和行業趨勢。出門問問于2017年攜手大眾汽車集團,在兩年時間內研發完成了一整套離在線結合的語音交互系統。目前,出門問問主導研發的前裝車載語音交互系統平臺已用于奧迪、帕薩特、新邁騰等多個全新車型,2020年預計前裝量將達到100萬輛,2023年預計將達到近千萬輛。
盡管囊括了ToC與ToB領域的諸多產品以及商業概念,讓出門問問在外界看來像一家產品型企業,但事實上出門問問的核心能力是語音交互和軟硬結合能力,AI技術一直是低調支撐公司發展的“冰山”底座。
“我們是一家人工智能技術公司,但區別于其他純技術廠商,我們希望將技術應用到具體的產品和場景中去體現技術的價值。”在李志飛眼里,出門問問本質上依然是一家技術驅動企業,“我們的工程師氛圍特別濃厚,研發人員占全公司人數的60%以上。”
AI新基建前進的兩條腿
2020年以來,伴隨著新基建概念的盛行,信息技術領域從底層芯片,到硬件之上的操作系統、核心算法、程序開發框架等一類非常核心的能力,都被囊括進入了數字新基建這一概念之下。新一代的信息高速公路,開始在新基建的產業發展熱潮中迎來各方關注。
但高速公路建好之后,由什么樣的車輛來行駛?這成為了一個值得深思的問題。
從互聯網產業發展的經驗來看,底層的互聯網基礎設施建設好之后,上面還需要非常多的運用支撐。
“對于AI新基建而言,他應該是兩條腿在走路,一方面是底層技術的發展在不斷的形成并深化,另一方面則是上層應用形態的不斷發展成型。”在李志飛看來,底層技術的研發與上層運用的開發,對于接下來即將開展的AI新基建發展都不可或缺。
未來5到10年之內,AI首先會在技術層面形成一些新的范式轉變,開始從更擅長處理單一場景的模式,走向能夠適應更加通用的場景。與此同時,理論層面的符號主義與連接主義的創新突破也將取得進展,人工智能的計算方式也將變得更加的“類人腦化”。
“AI的基礎設施,將會變得更加通用,也更加的像人腦一樣智能;而基礎之上的應用與產品也將會更加智能、體驗感更強、效率更高,并在某種程度下完全代替人。”在李志飛看來,如今的AI技術正相當于2000年左右的互聯網,雖有泡沫,但是假以時日必將走向成熟。
需求牽引下的舊瓶出新酒
邁過新基建因為疫情被放大并推到臺前時帶給大眾的新奇階段,在經過一段時間的媒體炒作與思考沉淀之后,如今大眾對于新基建的概念與認知已變得更加清晰,態度也趨于冷靜和理性,如何避免新基建“新瓶裝舊酒”成為了大家更為關注的話題。
無論新基建是否“雷聲大,雨點小”,有一點不變的是,在政府的主導號召之下,越來越多的人開始思考并關注新基建是什么,這些觀念層面的轉變,會逐步帶動一些新的需求變化的產生,這有望牽引傳統基建向新基建背景下的“新酒”轉型,進而帶來更多的技術與產品創新。
以出門問問所在的語言賽道領域為例,李志飛將未來智能語音領域的發展需求主要概括為對話式語音交互與長文本檢索兩大類型,圍繞著這兩種需求類型,將產生大量的新興業務場景。
在語音交互領域,當人們需要與機器實現對話的時候,更多的會聚焦在三大場景:不安全不方便等極限場景下不得不說;對于不需要組織語言,以高效、簡潔為目的性的快速地說;以及為了形成某種反饋閉環,選擇被動式應答(如貸款授信時采用機器人問答)。
在長文本檢索方面,人們在大多數場景中的交流以及內容輸出其實往往是沒有被記錄下來的,運用智能語音技術,通過將語音轉化成為文字,經過分類、抽象、結構化處理等多重加工后變成可存儲信息,后續便可以通過搜索等方式,實現更多有意思的事情。
此前,在InfoQ與網易副總裁汪源的采訪交流過程中,汪源曾將新基建帶來的發展機會分為信息化、數字化、以及智能化三個層次,并指出國內企業由于行業、所處地區發達程度以及技術采用程度均不同,不同企業分別對應著不同階段的“新基建”機會。新基建的“新酒”,其實只要存在企業借力IT技術轉型升級的需要,便會一直存在。
圍繞著語音交互以及長語音處理這兩大環展開,出門問問正挖掘市場需求,做新的運用,產品的創新。“將AI做成一個新的基石,深入到底層中去,新技術的加持將有效提升服務效率以及質量,增強體驗感。
擁抱全球化與更高層次理想
畢業于美國約翰霍普金斯大學,創立出門問問之前李志飛曾在谷歌美國總部任職科學家。在2015年創業兩年之后,出門問問更是成為了谷歌退出中國5年后再次布局中國市場的首筆直接投資對象,李志飛對于中美兩國之間科技及其產業化的理解,因此也比絕大多數人要更加深刻。
對于最近比較敏感的中美關系問題,李志飛發表了自己的看法。
“中美兩國發展到今天,其實誰脫離了誰都能夠發展,只不過彼此的發展都不會那么好。回顧過去的20年,全球化確實為我們帶來了許多的進步,如果非要強行脫鉤,對雙方都不利。”在李志飛看來,我們還是需要有更高維度的追求與抱負,不能只盯著眼前的得失。
從以一名技術者身份創業之初,李志飛早期帶領著一批實習生去做技術,技術出來之后由于賺不到錢又去做產品,思考企業的商業模式,當完成了從技術到商業的全部閉環之后,李志飛打通了自己創業的“任督二脈”,因此也更容易平衡技術與商業發展之間的關系。
“任何一個商業化的公司,20%-30%左右的精力會花費在底層技術研發之上,另外70-80%的東西更多是需要將這些技術、算法的運用到實際的生活當中,將他變成商品。”李志飛并不太擔心如今業界談論已久的AI技術理論趨于停滯展造成的商業化影響。
“即使前沿技術發展緩慢了,依然會有其他一些新的維度可以創新”,李志飛對下一步AI商業化持樂觀態度。而在新基建的大背景之下,AI技術的運用與發展同樣將大有可為。