2020年ChinaJoy周末在上海如期舉行,今年這場備受關注的數字娛樂盛會融合了更多前沿科技的元素。
其中,國內決策AI技術公司啟元世界在會上展出了與人對戰的星際AI——啟元星際指揮官,及與人配合協作的娛樂智能體,引起了業界轟動。
“人機對戰”一直以來都是AI玩家的角逐之地。在AlphaGo征服世界圍棋冠軍后,這一趨勢顯得更加明顯。不過圍棋策略類游戲已不足以展現玩家的全方位AI技術能力,于是,兼具戰術策略博弈+即時對抗的《星際爭霸》成為了下一個目標。
在6月舉辦的《星際爭霸》人機大戰中,啟元AI“星際指揮官”不負眾望,以兩個2:0的成績先后擊敗人類頂尖職業選手——全國冠軍黃慧明(TooDming)以及中國星際最強人族選手李培楠(TIME)。
開發這款“星際指揮官”的公司為啟元世界,成立于2017年8月,是一家AI認知決策技術公司,致力于利用深度學習、強化學習和超大規模并行計算等技術,搭建智能體應用訓練云平臺,為企業客戶提供端到端的智能體開發、訓練、評估和部署工具,幫助其快速構建智能體應用。
公司核心成員大多來自BAT、Netflix、香港科大、伯克利等國內外知名高科技企業和一流院校,具備深度學習、強化學習、云計算等核心技術的自主研發能力,且在產品打造方面擁有豐富的行業應用經驗。
啟元世界CEO袁泉在技術產品領域積淀深厚,曾擔任阿里認知計算實驗室負責人和資深總監,是手機淘寶、手機天貓推薦算法團隊締造者。
“和DeepMind、OpenAI類似,以在線游戲為試驗平臺,以行業賽事作為技術驗證,快速打磨決策智能體訓練云平臺服務相關行業,是啟元世界近期正在做的事。”袁泉告訴創業邦。
據悉,成立至今,啟元世界選擇各類典型游戲打磨新一代決策AI技術,已在2018年底獲NeurIPS 2018多智能體強化學習比賽冠軍,2019年中旬,啟元星際指揮官3:0擊敗人類黃金選手,2020年中旬獲CVPR 2020機器人虛實遷移挑戰賽冠軍。
對于此次在星際爭霸中打敗職業冠軍選手,袁泉表示,相比于圍棋人機對戰,這次比賽中增加了復雜場景感知、分析決策、長期規劃運營和實施操作四個維度的技術難度:
首先,對復雜場景的感知方面,圍棋棋盤環境簡單,只需按照落子順序操作即可,但星際爭霸中需要啟元AI實時感知周圍環境,在毫秒級做出判斷;
其次,在決策方面,啟元AI必須在十幾毫秒時機內快速做出決策,保證決策準確性;
然后,在定位方面,由于圍棋棋盤規格固定為16×16,難度較低,而此次比賽中,決策空間高達10的26次方,還需要從200個作戰單位中選出作戰主體;
同時,在具體操作中,還需要依托、感知、分析、定位能力,精準空投到地圖的指定位置上,技術門檻頗高。
“這四個維度的能力所帶來的乘數效應的疊加,最終實現了看似不可能的‘奇跡’。”袁泉告訴創業邦。
在挑戰賽結束后,部分網友表示,AI的高EPM值似乎在其中起到了天然優勢。對此,啟元世界技術團隊在賽后進行技術分析后解釋:對局過程中,AI的平均APM值為250左右,僅略高于職業選手李培楠237左右的水平,并不會影響此次比賽成績。
當然,此次比賽只是啟元世界AI技術能力的一個縮影,其背后是強大底層技術的有力支撐。
據袁泉透露,啟元世界智能云訓練云可以實現AI自我訓練,通過小樣本學習,再利用自主搭建的智能體COMMANDER神經網絡,同時結合高效率的群體演化訓練方法,不僅可在有限的算力條件下,增強智能體的魯棒性,還實現智能體的快速進化。而此次比賽中,啟元世界僅用了頂尖科技公司1%的算力。
不過,袁泉也深知,AI開發的最終目標是將這一技術應用于現實世界,而不僅僅停留在游戲層面。
因此,啟元世界還基于AI技術基礎搭建了一個私有云部署、軟硬結合智能體訓練云平臺,真正將技術融入行業中,為公共科技、數字娛樂、電力能源、機器人等行業客戶提供AI解決方案,幫助客戶快速構建智能體應用,實現智能化轉型。
目前這款智能體訓練云平臺已深度服務于數十家國內相關行業的知名公司、院校和科研機構。
據悉,啟元世界已于2017年獲得來自高榕資本的數千萬元天使輪融資,并于2018年12月完成知名投資機構Pre A輪融資。