國際知名商業技術媒體《計算機世界》5月3日刊登特約專欄作家Mike Elgan文章——《蘋果即將推出的AR眼鏡已經過時了嗎》(Are Apple’s upcoming AR glasses already obsolete)。文章指出越來越多的事實清楚表明,增強現實可能會被人工智能替代,AR的未來將是AI。
我們真的需要眼鏡?
文章開篇拋出問題:“我們真的需要眼鏡嗎”?接著指出:AR眼鏡的未來原來是明確的,至少以前是這樣。然而,當OpenAI出現了,事情發生了變化。
具體地說,AR的重心一直是遵循微軟Hololens/Magic Leap的理念,研發目標是將高清3D數字對象錨定到物理空間上,并已為此花費了數十億美元。其追求的目標——簡單舉例說明:就是一個逼真的猴子化身不僅可以站在真實的桌子上,還可以躲在桌子后面——或是坐在地板上的地形交互式地圖上面。
為了實現這些可視化的壯舉,微軟和Magic Leap需要處理能力巨大的硬件,可這種硬件外形龐大、無法佩戴行走且價格昂貴。前衛的客戶們叫嚷著要更小的東西。許多人長期以來一直認為,蘋果會是第一家將一款引人注目的產品納入主流的公司,該產品適用于看起來幾乎像普通眼鏡的全天候AR眼鏡。該眼鏡基于數百項專利、包括首席執行官蒂姆·庫克在內的蘋果高管的評論以及該公司在移動電子市場占據主導地位的出色記錄。
蘋果的無處不在的日常AR眼鏡問世,還需幾年的時間——至少四年。在此期間,庫克應該在6月5日舉行的今年全球開發者大會(WWDC)上,向公眾推出一款名為Reality Pro的臨時產品,并在很長一段時間之后向公眾開放。該產品預計將是高端虛擬現實(VR)設備,主要起到AR的作用,即不是把虛擬對象和數據疊加在真實世界的自然視圖上,而是疊加在真實世界的實時視頻流上。Reality Pro每套售價2000至3000美元,不會成為大眾的主流產品。
AI如何改變一切
當技術觀察者們對引人注目的AR望穿秋水時,人工智能的革命發生了。
舊金山初創公司OpenAI公開了對其DALL-E AI文本圖像生成器、以及基于GPT架構的ChatGPT聊天機器人的訪問。這些服務提供了API(應用編程接口),這樣開發者就可以在人工智能之上構建應用程序,成千上萬的應用程序借此蓬勃發展。而ChatGPT不過僅僅是在五個月前——即2022年12月才推出的,這一點簡直讓人難以置信。
隨著OpenAI的出現,其他人工智能平臺也出現了,而且還會有更多的平臺出現。谷歌I/O下周將推出數十款新的人工智能產品。現在有太多的應用程序,以至于出現了100多個目錄來鏈接到這些工具。由于目錄太多了,甚至有一個目錄可以鏈接到這些目錄。
2023年的人工智能浪潮已經對文化產生了巨大影響,以至歷史學家、哲學家、《智人》(Sapiens)的作者Yuval Noah Harari教授宣稱:“人工智能入侵了人類文明的操作系統。”如果這種情況是真的,那是因為人工智能重新設定了我們對一切應該如何運作的期望。我們對AR的期望尤其如此。
向AR的轉變——從搜索引擎到“一個真正的答案”,意味著我們尋找信息的方式發生了令人擔憂的改變。使用搜索引擎,我們輸入查詢,得到一長串可能的答案鏈接。而有了AR,我們只想要一個答案,而不是考慮一千個鏈接。
一般來說,新的人工智能服務,特別是基于OpenAI GPT的服務,已經改變了我們對“一個真實答案”概念在實踐中應該如何發揮作用的愿望和期待。具體來說,我們希望它是詳細的、靈活的、可變的,基于像ChatGPT那樣的提示性和互動性,而不像谷歌搜索的“特色代碼段”或“知識面板”,那實際上只是一個靜態的最終答案。
我們更想要AI而非眼鏡
一家由前蘋果高管Imran Chaudhri和Bethany Bongiorno夫妻二人創立的名為Humane的初創公司,最近為AR粉絲留下了深刻印象。他們對AR的工作方式提出了一個聰明的新愿景。在TED演講中,Chaudhri展示了一款隨身攜帶的可連接上網的小巧設備。該設備配有攝像頭、麥克風和投影儀,可以訪問人工智能和個人用戶數據。這是不戴眼鏡的AR。
Humane設想在人工智能、電腦視覺和機器學習改變世界的“智能時代”,這款設備將替代智能手機。
在演示過程中,Chaudhri把一塊巧克力糖放在口袋里的設備面前,問道:“我能吃這個嗎?”原型設備似乎使用電腦視覺識別產品,使用公共在線數據獲取成分,然后將其與用戶的不耐受或過敏列表進行比較,最終建議他不要食用。
設備將Chaudhri的英語單詞翻譯成法語,并用Chaudhri自己的模擬聲音說話。它用命令“追上我”總結了最近電子郵件中的關鍵信息,并完成了其他類似ChatGPT的技能。當他的妻子打來電話時,來電的身份信息被投射到他的手掌上,并用光做成可操作的按鈕。
這是一種新型設備,可以理解為一種基于人工智能、高度個性化的可穿戴的亞馬遜Echo式智能揚聲器。或者你可以把它想象成沒有眼鏡的高級AR眼鏡。它不是通過眼鏡顯示數據,而是根據手勢將信息投射到附近的任何表面。
但最令人信服的描述性比較是,它是人工智能特定的硬件。它的設計目的是使與各種人工智能交互所需的物理機器隱形為身體的一部分。鑒于目前人工智能的興奮和活力,這是一個比我聽到的所有關于蘋果最終AR眼鏡的描述都更有說服力的愿景。
需要明確的是,蘋果未來的所有AR設備都可能訪問AI,包括未來可能訪問類似GPT語言模型的Siri(語音識別接口)。Humane的功能可以內置在眼鏡中。但蘋果的總體計劃似乎越來越過時,即從一個巨大、龐大、強大、昂貴的AR解決方案開始,然后在四五年或更長時間內將其縮減為社會可接受的移動、獨立眼鏡。
硅谷從元宇宙轉向AI
Meta首席執行官馬克·扎克伯格的元宇宙概念并沒有像人們希望的那樣大火起來。事實上,在OpenAI驅動的革命覺醒之中,科技行業似乎普遍解雇了數千名從事AR和VR工作的員工,并加倍投資人工智能。這其中包括微軟,它是OpenAI的大股東。
目前,世界所期待的,以及許多初創公司和老牌企業正在開發的,無疑都是AR可穿戴設備。它可以通過訪問人工智能、電腦視覺和機器學習的類人私人助理來實現增強現實。
雖然增強現實仍然是企業、創意人員和消費者的一個引人注目的愿景,但2023年的AI革命創造了增強我們自己的需求。世界現在想要的是可穿戴的AI硬件。
最后的話
面對橫空出世的AI,一直被人們視為下一代互聯網入口的AR眼鏡,一時處境尷尬,前途未卜。增強現實真會被人工智能替代?AR的未來真的會是AI嗎?
此事重大,關系AR生死存亡、命運前途,應引起所有從業者的高度警覺與密切關注,應及時對這一問題進行認真充分的研究探討,為今后發展提出對策,指明方向。
關注AR發展的讀者朋友,您贊同文章作者Mike Elgan的觀點嗎?歡迎留言討論。
文/維克多