具身智能,這一結合了人工智能與機器人技術的前沿領域,在2024年成為了AI賽道上的璀璨明星。其核心在于“長了身體的智能”,能夠直接與物理世界進行交互,而人形機器人則被普遍認為是具身智能的最佳硬件載體。
隨著具身智能的火爆,機器人公司如雨后春筍般涌現,投融資活動也異常活躍。據統計,2024年上半年,專注于具身智能機器人的公司數量已突破70家大關,其中不乏華為等大廠的加入,初創企業更是頻頻獲得融資,估值飆升。
以Physical Intelligence、World Labs和Skild AI等為代表的企業,在短短幾個月內就宣布了數億美元的融資,估值也隨之水漲船高。Physical Intelligence成立不到一年,就宣布獲得4億美元融資,估值達到24億美元;World Labs在完成1億美元融資后,兩個月內又完成了2.3億美元的融資;Skild AI則宣布完成3億美元A輪融資,估值達到15億美元。
在這場具身智能的盛宴中,創業企業如何脫穎而出,形成差異化競爭優勢?具身智能背后的技術發展路徑又是怎樣的?帶著這些問題,我們與智澄AI的創始人兼CEO胡魯輝進行了深度交流。
“我們是一家通用人工智能公司,對標的是斯坦福李飛飛老師的公司,但我們的產品形態是具身智能機器人。”胡魯輝表示,“我們的核心技術是理解物理世界的世界模型,這與主流的多模態大模型有著本質的區別。”
據胡魯輝介紹,世界模型主要通過傳感器直接感知外部環境信息,輸入數據以實時感知的外部環境為主,而輸出結果則是時間序列數據,可以直接控制機器人。相比之下,多模態大模型則是以圖片、文字、視頻、音頻等信息交互為主,輸出結果仍是以信息為主。
胡魯輝進一步指出,世界模型是邁向通用人工智能(AGI)的必經之路。作為曾在微軟、亞馬遜、華為美國研究院、meta等頂尖科技巨頭擔任高管的行業專家,他早已意識到AI與物理世界結合的潛力,并一直在尋找合適的創業機會。
2024年初,智澄AI應運而生。胡魯輝對公司的整體發展規劃分為兩部分:一是以打造世界模型為核心,持續進行技術創新和研發突破;二是實現產品落地應用。目前,智澄AI的人工智能機器人原型一(TR1)和原型二(TR2)已經相繼完成。
胡魯輝表示,智澄AI的機器人產品命名為TR,即Transforming Robot,寓意著改變機器人。從TR1到TR2,智澄AI的產品迭代速度非常快,基本上每兩個月就能實現一次迭代。
然而,具身智能行業的發展也面臨著諸多挑戰,其中機器人的泛化能力是關鍵之一。胡魯輝認為,智澄AI的泛化能力主要體現在任務泛化、環境泛化和本體泛化三個方面。只有具備這三種泛化能力,才能真正推動機器人時代的到來。
在胡魯輝看來,當前多模態大模型技術很難突破這三種泛化能力的挑戰。因此,智澄AI將打造澄靈世界模型,分階段推進物理世界模型的發展,以實現像人一樣的泛化能力。
面對算法、數據、算力等多方面的挑戰,胡魯輝表示,智澄AI將堅持以物理智能為核心技術,不斷加強自身技術能力的迭代,積極擁抱行業變化。
在與胡魯輝的交流中,我們還了解到智澄AI的產品研發及市場落地策略。胡魯輝表示,智澄AI的戰略方針是兩條腿走路,一方面不斷進行技術創新和研發突破,另一方面進行產品落地。
對于未來機器人的價格區間和普惠于民的問題,胡魯輝認為價格是相對的,不同場景和需求下的機器人價格會有所不同。他強調,智澄AI的目標是推動機器人時代的到來,讓機器人更好地服務于人。
在制造業中,雙臂機器人已經得到了廣泛應用。智澄AI的雙臂機器人與上一代機器人相比,在實際應用上會有哪些明顯感知的區別?胡魯輝表示,智澄AI的機器人是基于AI原生模型,相比傳統機器人控制系統有本質的變化。
傳統機器人控制系統基于規則,雖然可以實現精準控制操作,但泛化能力較差,需要重新開始編程。而智澄AI的模型則類似于人腦,已經具備一定的泛化能力。這種技術和解決方案將真正推動機器人時代的到來。