隨著生成式人工智能的爆發(fā),AI大模型持續(xù)升溫成為當(dāng)下最熱的風(fēng)口,這股熱潮也影響到了自動(dòng)駕駛行業(yè)。雖然AI大模型目前發(fā)展尚不成熟,仍存在邏輯錯(cuò)誤,數(shù)據(jù)偏見,算力需求高等問(wèn)題,但在算法、數(shù)據(jù)閉環(huán)、仿真等技術(shù)環(huán)節(jié),AI大模型或?qū)⑷尜x能自動(dòng)駕駛。
近期,由辰韜資本主辦、中信證券協(xié)辦的“未來(lái)以來(lái) 創(chuàng)見未見”第二屆智能駕駛商業(yè)化落地與產(chǎn)業(yè)發(fā)展趨勢(shì)主題研討會(huì)在北京舉行。在主題為“AI大模型如何賦能智能駕駛”的焦點(diǎn)對(duì)話環(huán)節(jié),清華大學(xué)人工智能研究院視覺智能研究中心主任鄧志東教授、北京極佳視界科技有限公司CEO黃冠博士、北京愷望數(shù)據(jù)科技有限公司CEO于旭、蘇州智加科技有限公司首席科學(xué)家崔迪瀟博士參與了討論。
在AI大模型的深度賦能下,未來(lái)整個(gè)智能駕駛行業(yè)將以更高的效率發(fā)展,行業(yè)將迎接更多可能性和更大想象空間。在場(chǎng)的多位專家均表示,大模型之于自動(dòng)駕駛來(lái)說(shuō),核心是解決了整個(gè)研發(fā)過(guò)程中技術(shù)迭代的效率問(wèn)題,而大模型真正發(fā)揮其價(jià)值,還需面對(duì)通用性和泛化能力的問(wèn)題。
擴(kuò)寬自動(dòng)駕駛產(chǎn)業(yè)道路,大模型為行業(yè)帶來(lái)更多可能
盡管AI不能算是新事物,大模型也不是新事物,但AI、大模型跟智能駕駛結(jié)合在一起,它就變成了新鮮事物。隨著AI大模型的快速發(fā)展,其有望完全改變自動(dòng)駕駛的開發(fā)方式。
“自動(dòng)駕駛大模型是必須的。”北京極佳視界科技有限公司CEO黃冠博士表示:整個(gè)自動(dòng)駕駛行業(yè)發(fā)展經(jīng)歷了三個(gè)階段和變革。第一階段是Waymo帶來(lái)的L4 Robotaxi進(jìn)行了一套系統(tǒng)化解決方案;第二個(gè)階段是特斯拉那一套靠視覺和AI帶來(lái)行業(yè)成本的降低和泛化性的提升;而第三次則是這次大模型給行業(yè)帶來(lái)的想象,它會(huì)把這個(gè)行業(yè)的上限無(wú)限撐高,走向L4或者AGI,并且同時(shí)提升數(shù)據(jù)、研發(fā)、測(cè)試等各個(gè)層面的效率。“AI大模型將成為自動(dòng)駕駛發(fā)展的新引擎。”
來(lái)自清華大學(xué)鄧志東教授表示:“大模型賦能自動(dòng)駕駛,需要以人類的自然語(yǔ)言、人類的思維貫穿智能駕駛的感知、預(yù)測(cè)、規(guī)劃、決策、規(guī)控等整個(gè)鏈條和環(huán)節(jié),同時(shí)還需要綜合運(yùn)用多模態(tài)的視覺語(yǔ)義、常識(shí)以及專業(yè)知識(shí),讓它有跨任務(wù)、跨領(lǐng)域、跨場(chǎng)景的泛化能力。它會(huì)帶來(lái)一場(chǎng)大的變化。”
“有大模型,相應(yīng)的就有小模型、普通模型,那說(shuō)明一定有一些問(wèn)題是普通模型解決不了的,需要用大模型去解決。我更多會(huì)站在應(yīng)用的角度去看大模型,比如它是否能做一些普通模型做不了的事情,以及它是否能做得更好、更快、更便宜。”崔迪瀟博士表示,如果要將大模型賦能到自動(dòng)駕駛的研發(fā)中,核心要看的是在整個(gè)技術(shù)研發(fā)迭代過(guò)程中,大模型是否能讓自動(dòng)駕駛研發(fā)效率提高,研發(fā)成本降低,還能讓性能持續(xù)穩(wěn)步地提升。
而在清華大學(xué)人工智能研究院視覺智能研究中心主任鄧志東看來(lái),現(xiàn)在各家車企做的大模型或小模型,可以看成是一只家養(yǎng)的狗,而真正的智駕大模型應(yīng)該是野生的狗。“野狗總比家養(yǎng)的狗生存能力要強(qiáng)很多,它們生存在野外,接觸到的環(huán)境遠(yuǎn)比家狗接觸到的要惡劣、復(fù)雜,即它不能囿于家養(yǎng)的環(huán)境和數(shù)據(jù),而是在真正意義上的開放域海量數(shù)據(jù)之上產(chǎn)生的。”
真正的智駕大模型是在真正意義上的開放域海量數(shù)據(jù)里產(chǎn)生。愷望數(shù)據(jù)CEO于旭表示:“大量參數(shù)的涌現(xiàn)讓我們?cè)谧詣?dòng)駕駛可以用新的思考、新的方式帶來(lái)行業(yè)的規(guī)模化,包括這些新的體驗(yàn)感。大模型是帶來(lái)了曙光,我們認(rèn)為這個(gè)曙光可以分階段地進(jìn)入到自動(dòng)駕駛行業(yè)里,比如可能先從局部進(jìn)入再逐步發(fā)展到全局,這是一個(gè)長(zhǎng)線的過(guò)程。”
盡管,大模型目前在自動(dòng)駕駛領(lǐng)域應(yīng)用還不成熟,但AI大模型能助力自動(dòng)駕駛技術(shù)迭代升級(jí),加速高級(jí)別自動(dòng)駕駛的落地,自動(dòng)駕駛更快迎來(lái)奇點(diǎn)時(shí)刻。
通用性和泛化能力,自動(dòng)駕駛未來(lái)發(fā)展的無(wú)限可能
對(duì)于智駕大模型來(lái)說(shuō),其核心關(guān)鍵是解決通用性和泛化能力。就AI大模型的通用性、泛化性等新開發(fā)范式而言,其能夠大幅提高研發(fā)效率,壓縮設(shè)計(jì)和迭代的過(guò)程,從而帶來(lái)顯著的效率提升。
聊到智駕大模型的核心技術(shù),智駕科技崔迪瀟博士提出:“大模型需要有通用性,本質(zhì)上要解決跨任務(wù)的通用性,意味著它需要能解決不同的任務(wù),有跨知識(shí)領(lǐng)域的通用性。GPT里面就有通用性,能夠把所有不同的任務(wù)統(tǒng)一到自然語(yǔ)言處理的框架中。”
“通用性與泛化性是關(guān)鍵,成熟的自動(dòng)駕駛大模型一定要結(jié)合語(yǔ)言模型和多模態(tài)。而要具備通用性,需要結(jié)合一套自監(jiān)督的范式去實(shí)現(xiàn)壓縮物理世界。”極佳科技CEO黃冠博士也肯定了這兩種能力必為自動(dòng)駕駛發(fā)展的關(guān)鍵。
那么,該如何解決智駕大模型通用性與泛化性這一核心問(wèn)題呢?
對(duì)此,黃冠博士提出:“第一,需要把語(yǔ)言引進(jìn)來(lái),因?yàn)檎Z(yǔ)言有很強(qiáng)的認(rèn)知能力,比如我知道我開車我不能走懸崖。現(xiàn)在這一套自動(dòng)駕駛方案既識(shí)別不了懸崖,也不知道能不能走懸崖,但是語(yǔ)言的大模型是知道不能走下懸崖的。第二,需要針對(duì)物理世界場(chǎng)景,尤其是視覺場(chǎng)景需要有一套方式去進(jìn)行自監(jiān)督地壓縮。多模態(tài)則是認(rèn)識(shí)各種懸崖的,它可以再跟自動(dòng)駕駛結(jié)合起來(lái),加強(qiáng)自駕大模型對(duì)世界的泛化認(rèn)知和感知理解能力。”
智加科技崔迪瀟博士也強(qiáng)調(diào),智駕大模型更多是汽車行業(yè)的垂直模型,它們分布在各個(gè)智駕技術(shù)棧,或者是特定場(chǎng)景的端到端;既要強(qiáng)調(diào)泛化性,也要強(qiáng)調(diào)可控性,同時(shí)它的一致性也是要保證的。“但事實(shí)上系統(tǒng)泛化能力提升會(huì)帶來(lái)一些問(wèn)題,比如它的某些涌現(xiàn)可能對(duì)智駕系統(tǒng)是不可控的、也是不可接受的。所以,我并不認(rèn)為在智駕領(lǐng)域存在真正意義上的大模型。”
針對(duì)智駕大模型在未來(lái)發(fā)展,崔迪瀟博士認(rèn)為:“當(dāng)前自動(dòng)駕駛行業(yè),大模型已經(jīng)在發(fā)揮一些作用,比如感知端、駕駛決策端,我們都看到了大量很好的技術(shù)演示和應(yīng)用。但必須要提醒一個(gè)事實(shí),即大模型依然沒有脫離深度學(xué)習(xí)框架,不可避免地會(huì)存在統(tǒng)計(jì)性和概率性問(wèn)題,大規(guī)模應(yīng)用中一定有它處理不了的場(chǎng)景。對(duì)于所有做L4的同事和同行來(lái)說(shuō),必須要保持警醒,大模型可以加速L4到來(lái),但它不能解決所有L4的問(wèn)題。”
即使大模型現(xiàn)在仍不成熟,但其發(fā)展?jié)摿σ驯恍袠I(yè)緊盯。于旭表示:“大模型讓我們看到算法的門檻變低了,這個(gè)時(shí)候就像過(guò)去的移動(dòng)互聯(lián)網(wǎng)一樣,當(dāng)時(shí)有很多的APP,現(xiàn)在在算法新的時(shí)代里面,又有非常多的AI應(yīng)用。我們?cè)趧?chuàng)造更好的大模型,這個(gè)技術(shù)手段也希望能應(yīng)用到更多的商業(yè)場(chǎng)景中,使得AI應(yīng)用有不斷的提升。它給我們帶來(lái)了很多希望,我還是非常看好這一技術(shù)的。”
在當(dāng)下,AI大模型的強(qiáng)勢(shì)賦能自動(dòng)駕駛領(lǐng)域,為自動(dòng)駕駛領(lǐng)域注入一針“強(qiáng)心劑”,更是給自動(dòng)駕駛未來(lái)帶來(lái)無(wú)限可能。