大模型日新月異，自動(dòng)駕駛企業(yè)“跟得緊才能跑在前”？

來(lái)源：中青網(wǎng) 時(shí)間：2024-03-15 10:07 編輯：葉子琪閱讀量：7067

近期，全新生成式視頻大模型Sora甫一發(fā)布，便迅速引發(fā)全球熱議。有專(zhuān)家甚至斷言，人工智能在2024年將呈現(xiàn)爆發(fā)式增長(zhǎng)。

如今，人工智能的“觸角”正向四面八方探伸，汽車(chē)行業(yè)便在最前沿。從去年言必稱(chēng)“BEV＋Transformer”，到今年將“端到端”掛在嘴邊……隨著人工智能技術(shù)從深度學(xué)習(xí)到多模態(tài)大模型的快速發(fā)展，汽車(chē)行業(yè)始終站在了自動(dòng)駕駛技術(shù)進(jìn)化的第一線。

這些看似陌生又深?yuàn)W的新技術(shù)，對(duì)于自動(dòng)駕駛落地到底意味著什么？它們?cè)谄?chē)上應(yīng)用，對(duì)企業(yè)研發(fā)能力提出哪些更高的要求？厘清上述問(wèn)題，對(duì)于自動(dòng)駕駛行業(yè)如何用好人工智能而言十分必要。

“端到端”或成智駕的未來(lái)

今年年初，小鵬汽車(chē)對(duì)外透露，其高階智駕將采用端到端大模型。小鵬汽車(chē)董事長(zhǎng)何小鵬提到，團(tuán)隊(duì)發(fā)現(xiàn)應(yīng)用大模型后，無(wú)需從前的大量泛化代碼，自動(dòng)駕駛系統(tǒng)便具備時(shí)空理解能力，能讀懂文字信息，有了時(shí)間觀念，理解不同城市特點(diǎn)的交通元素，做出更擬人的決策。

另?yè)?jù)了解，理想汽車(chē)圍繞車(chē)載場(chǎng)景打造的MindGPT大模型已隨OTA5.0正式上車(chē)。蔚來(lái)汽車(chē)則將端到端大模型聚焦于智能汽車(chē)主動(dòng)安全領(lǐng)域。相關(guān)人士表示，蔚來(lái)幾十人的團(tuán)隊(duì)已就此研發(fā)近半年的時(shí)間，如果順利推進(jìn)，蔚來(lái)將是中國(guó)最快量產(chǎn)端到端功能的汽車(chē)企業(yè)。2023年，CVPR最佳論文頒給了端到端自動(dòng)駕駛。在汽車(chē)行業(yè)人士看來(lái)，這幾乎代表著一種共識(shí):端到端自動(dòng)駕駛將是行業(yè)的未來(lái)。

為什么“端到端”這么火？顧名思義，在機(jī)器學(xué)習(xí)中，端到端就是從提出問(wèn)題到解決問(wèn)題，從輸入數(shù)據(jù)到輸出結(jié)果的過(guò)程。通過(guò)端到端的學(xué)習(xí)和訓(xùn)練，人們期望只要輸入數(shù)據(jù)，就可以得到最匹配、最合適、最優(yōu)的結(jié)果。換句話說(shuō)，就是從客戶(hù)需求端出發(fā)，抵達(dá)滿足客戶(hù)需求的“彼岸”。

2023年8月，特斯拉首席執(zhí)行官馬斯克在做FSDBetaV12試駕直播時(shí)，重點(diǎn)介紹說(shuō)“這是世界上第一個(gè)端到端AI自動(dòng)駕駛系統(tǒng)”，首次將端到端大模型的概念引入自動(dòng)駕駛。他表示:“V12系統(tǒng)從頭到尾都是通過(guò)AI實(shí)現(xiàn)。我們沒(méi)有編程，沒(méi)有程序員寫(xiě)一行代碼以識(shí)別道路、行人等，全部交給了神經(jīng)網(wǎng)絡(luò)。”

端到端大模型究竟如何給自動(dòng)駕駛帶來(lái)改變？據(jù)悉，傳統(tǒng)的自動(dòng)駕駛按照感知、決策和控制劃分為不同的模塊，系統(tǒng)先對(duì)周?chē)膭?dòng)靜態(tài)交通參與者和路網(wǎng)結(jié)構(gòu)進(jìn)行準(zhǔn)確感知，再規(guī)劃車(chē)輛的行車(chē)軌跡，最后通過(guò)執(zhí)行機(jī)構(gòu)對(duì)進(jìn)行閉環(huán)控制。而從特斯拉的端到端方案來(lái)看，它將自動(dòng)駕駛系統(tǒng)的感知和定位、決策和規(guī)劃、控制和執(zhí)行之間的斷面整合在了一起，形成一個(gè)大的神經(jīng)網(wǎng)絡(luò)。

端到端模型背后，是對(duì)海量駕駛視頻片段的整合、壓縮和提取。本質(zhì)上，特斯拉的端到端FSD是將上千萬(wàn)個(gè)視頻片段包含的人類(lèi)駕駛知識(shí)壓縮到了端到端神經(jīng)網(wǎng)絡(luò)參數(shù)中。

俗話說(shuō)“書(shū)讀百遍其義自見(jiàn)”，可以想象一下，隨著人工智能技術(shù)突飛猛進(jìn)，當(dāng)被“投喂”大量包含各種駕駛行為的經(jīng)歷素材包后，自動(dòng)駕駛系統(tǒng)培養(yǎng)出類(lèi)似于人類(lèi)的思維和執(zhí)行方式也不足為奇了。換言之，通過(guò)對(duì)人類(lèi)行為的大量學(xué)習(xí)，來(lái)耦合出更接近人類(lèi)自然的駕駛習(xí)慣，比如過(guò)人行道減速，并線要讓行等。這些模型的構(gòu)建方式是基于特斯拉純視覺(jué)方案實(shí)現(xiàn)AI的自訓(xùn)練，因此訓(xùn)練視頻的質(zhì)量非常重要，只能用優(yōu)秀司機(jī)的駕駛視頻來(lái)訓(xùn)練，而非反之。曾有車(chē)企分享案例，端到端自動(dòng)駕駛還模擬出在沒(méi)有車(chē)位的停車(chē)場(chǎng)“自行”劃出車(chē)位的行為。

如今，汽車(chē)自動(dòng)駕駛技術(shù)的滲透率不斷提高，海量真實(shí)數(shù)據(jù)開(kāi)始為車(chē)企訓(xùn)練模型提供充分養(yǎng)料，2024年行業(yè)或?qū)⒂瓉?lái)端到端大模型落地“元年”。這意味著，自動(dòng)駕駛的感知能力和泛化能力有望實(shí)現(xiàn)飛躍式提升。

AI助力傳感器融合難題解決

如果說(shuō)端到端大模型是自動(dòng)駕駛新晉“頂流”，那么BEV＋Transformer可以算得上它的“前輩”。據(jù)了解，BEV和“端到端”都是在視覺(jué)路線上，以Transformer為基礎(chǔ)建設(shè)架構(gòu)。AI大模型的崛起源自ChatGPT，其中“T”指的就是Transformer大模型。

BEV的出現(xiàn)，如“四兩撥千斤”般解決了多傳感器融合難題。清華大學(xué)蘇州汽車(chē)研究院智能網(wǎng)聯(lián)中心技術(shù)總監(jiān)孫輝指出，BEV算法將各種傳感器信息統(tǒng)一映射到世界坐標(biāo)系下，支持不同類(lèi)型傳感器數(shù)據(jù)的互補(bǔ)，不僅將感知融合從后融合推進(jìn)到前融合，還為端到端方案打下了堅(jiān)實(shí)基礎(chǔ)。之后，在BEV基礎(chǔ)上發(fā)展的占據(jù)柵格算法，進(jìn)一步拓展了對(duì)一般障礙物(各類(lèi)動(dòng)靜態(tài)障礙)檢測(cè)的能力，使自動(dòng)駕駛汽車(chē)具備了更好的安全避障功能。

端到端自動(dòng)駕駛方案，是在BEV基礎(chǔ)上將軌跡預(yù)測(cè)、柵格地圖預(yù)測(cè)、行為規(guī)劃等通過(guò)神經(jīng)網(wǎng)絡(luò)的形式疊加，使用大數(shù)據(jù)監(jiān)督學(xué)習(xí)來(lái)替代復(fù)雜人工規(guī)則的設(shè)計(jì)，進(jìn)而簡(jiǎn)化整個(gè)自動(dòng)駕駛開(kāi)發(fā)流程，加快迭代效率。

毫末智行首席執(zhí)行官顧維灝認(rèn)為，自動(dòng)駕駛技術(shù)過(guò)去20年的發(fā)展歷程可劃分為以硬件驅(qū)動(dòng)為特征的“1.0”時(shí)代，以軟件驅(qū)動(dòng)為特征的“2.0”時(shí)代，以數(shù)據(jù)驅(qū)動(dòng)為特征的“3.0”時(shí)代。其中，“1.0”時(shí)代以早期無(wú)人駕駛車(chē)輛為代表，比拼傳感器特別是激光雷達(dá)的數(shù)量和線束精度，數(shù)據(jù)積累在數(shù)百萬(wàn)公里；“2.0”時(shí)代以深度學(xué)習(xí)技術(shù)上車(chē)為標(biāo)志，車(chē)規(guī)級(jí)傳感器大量上車(chē)，但更注意車(chē)端感知算法和人工規(guī)則為主的決策模型優(yōu)化，數(shù)據(jù)積累在千萬(wàn)公里以上；“3.0”時(shí)代以AI大模型在自動(dòng)駕駛領(lǐng)域的應(yīng)用為標(biāo)注，以數(shù)據(jù)驅(qū)動(dòng)方式來(lái)訓(xùn)練感知、認(rèn)知模型使之進(jìn)化。因此，自動(dòng)駕駛企業(yè)將重點(diǎn)投入數(shù)據(jù)通道和智算中心的打通和建設(shè)，以更高效地獲取數(shù)據(jù)，并將它們轉(zhuǎn)化為能力與知識(shí)?！?.0”時(shí)代所對(duì)應(yīng)的數(shù)據(jù)規(guī)模，駕駛里程至少在上億乃至數(shù)十億公里以上。

孫輝告訴記者，從大的方向來(lái)看，自動(dòng)駕駛的發(fā)展路線，除了單車(chē)智能化水平的進(jìn)階，還包括從單車(chē)智能向車(chē)路協(xié)同智能轉(zhuǎn)變。2024版中國(guó)新車(chē)評(píng)價(jià)規(guī)程首次將V2X納入測(cè)評(píng)范圍，為V2X的發(fā)展帶來(lái)更大的利好。車(chē)路協(xié)同通過(guò)路側(cè)單元向車(chē)輛發(fā)送超視距感知結(jié)果，提前規(guī)劃從而避免事故；在固定區(qū)域應(yīng)用時(shí)，由于路側(cè)設(shè)施的補(bǔ)充，還能降低單車(chē)智能化成本，提前完成運(yùn)營(yíng)閉環(huán)。如果在限定區(qū)域內(nèi)，這也不失為高階智駕的一種實(shí)現(xiàn)方式。

大模型正在催生算力工程

雖然“端到端”和BEV都是基于Transformer開(kāi)發(fā)的架構(gòu)，但業(yè)內(nèi)人士普遍認(rèn)為，“端到端”的上限會(huì)更高，通過(guò)數(shù)據(jù)驅(qū)動(dòng)能夠解決復(fù)雜“長(zhǎng)尾”問(wèn)題，消除模塊累計(jì)誤差，還能降低成本。

不過(guò)，“硬幣總是有兩面”，端到端大模型為自動(dòng)駕駛帶來(lái)的不只機(jī)遇，還有更多挑戰(zhàn)。在孫輝看來(lái)，端到端作為數(shù)據(jù)驅(qū)動(dòng)的新型自動(dòng)駕駛方案，數(shù)據(jù)采集和標(biāo)注的體量一定要達(dá)到相當(dāng)?shù)囊?guī)模才能實(shí)施，同時(shí)對(duì)研發(fā)人員及算力也有更高的要求，具有很高的進(jìn)入門(mén)檻。當(dāng)然，從產(chǎn)品落地來(lái)說(shuō)，端到端方案可以更充分地發(fā)揮車(chē)載算力資源的作用，呈現(xiàn)產(chǎn)品層次梯度。

人們不難發(fā)現(xiàn)，大模型正在催化駕駛場(chǎng)景復(fù)雜多樣。去年以來(lái)，城市NOA加速落地。從高速NOA到城市NOA，交通環(huán)境的復(fù)雜度加大，對(duì)物體識(shí)別、感知融合和系統(tǒng)決策算力的需求不斷提高。更重要的是，自動(dòng)駕駛?cè)源嬖诖罅俊伴L(zhǎng)尾”應(yīng)用需求，例如對(duì)匝道、錐形筒、交通事故、坑洼道路進(jìn)行識(shí)別等。各種“長(zhǎng)尾”問(wèn)題不能靠單一技術(shù)路徑解決，需要集中的大規(guī)模算力基礎(chǔ)設(shè)施——AI智算中心。

從2022年開(kāi)始，國(guó)內(nèi)外自動(dòng)駕駛企業(yè)上演算力“追逐戰(zhàn)”。特斯拉自研的超級(jí)計(jì)算機(jī)Dojo，被用來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)，支持自身的自動(dòng)駕駛技術(shù)發(fā)展；國(guó)內(nèi)方面，小鵬、毫末、吉利等企業(yè)也開(kāi)始自建算力中心。其中，小鵬汽車(chē)在內(nèi)蒙古烏蘭察布建成自動(dòng)駕駛智算中心“扶搖”；吉利星睿智算中心在浙江湖州長(zhǎng)興正式揭牌；毫末智行發(fā)布自動(dòng)駕駛智算中心“雪湖·綠洲”，全部用于自動(dòng)駕駛模型訓(xùn)練。

自動(dòng)駕駛走過(guò)“1.0”和“2.0”時(shí)代，如今步入新階段。圍繞大模型訓(xùn)練的云端算力平臺(tái)，以及與車(chē)端多模態(tài)、多數(shù)量、高質(zhì)量傳感器和車(chē)端算法適配的高算力計(jì)算平臺(tái)紛紛落地，不少車(chē)企和自動(dòng)駕駛供應(yīng)商建立自己的算力中心，從理論上可支持完全自動(dòng)駕駛級(jí)別的算力要求。

雖然技術(shù)會(huì)突飛猛進(jìn)，但“神功還需一重一重修煉”。市場(chǎng)端對(duì)于自動(dòng)駕駛落地的理性認(rèn)知，成就了一番行業(yè)新風(fēng)貌。放棄L4自動(dòng)駕駛一步到位的想法，不少企業(yè)將首要目標(biāo)放在L2＋自動(dòng)駕駛的商業(yè)化落地上。今年初，多家車(chē)企啟動(dòng)城市NOA開(kāi)城“競(jìng)速賽”，爭(zhēng)相推廣主打“極致性?xún)r(jià)比”的高階智駕方案。在這個(gè)過(guò)程中，無(wú)論“端到端”，還是BEV＋Transformer都在提供助力；與此同時(shí)，更多的車(chē)輛行駛數(shù)據(jù)，也將反哺自動(dòng)駕駛?cè)斯ぶ悄芗夹g(shù)日臻完善。

自動(dòng)駕駛還需“長(zhǎng)期主義”

在汽車(chē)產(chǎn)業(yè)變革的“下半場(chǎng)”，自動(dòng)駕駛技術(shù)研發(fā)與落地已成為企業(yè)參與競(jìng)爭(zhēng)的關(guān)鍵“參數(shù)”和重要抓手。凱聯(lián)資本研究院院長(zhǎng)由天宇向記者表示，那些跑通端到端大模型的車(chē)企，無(wú)疑搶先站上了“風(fēng)口”。

“自動(dòng)駕駛行業(yè)的競(jìng)爭(zhēng)日趨白熱化，想要在市場(chǎng)上擁有為之一戰(zhàn)的能力，企業(yè)離不開(kāi)AI這個(gè)重要幫手。”孫輝肯定了AI大模型對(duì)于自動(dòng)駕駛技術(shù)的助力。他認(rèn)為，AI滲透下的自動(dòng)駕駛“主戰(zhàn)場(chǎng)”將出現(xiàn)一家或幾家獨(dú)大的局面，企業(yè)不可避免地朝著技術(shù)規(guī)?；慨a(chǎn)前進(jìn)，嘗試“以戰(zhàn)養(yǎng)戰(zhàn)”，從而快速迭代，否則就會(huì)被淘汰。在細(xì)分“賽道”上，隨著具身智能的發(fā)展，自動(dòng)駕駛還將迎來(lái)一輪新的發(fā)展機(jī)遇，出現(xiàn)一批面向垂直應(yīng)用的優(yōu)秀企業(yè)，展現(xiàn)出“百花齊放”的局面。“對(duì)于自動(dòng)駕駛企業(yè)來(lái)說(shuō)，在回歸理性、‘新芽’初生的這段時(shí)期，還需提高產(chǎn)品落地能力，此外增強(qiáng)對(duì)前瞻技術(shù)的敏銳性也非常關(guān)鍵?！彼Q(chēng)。

在由天宇看來(lái)，從更高維度、更長(zhǎng)周期來(lái)看，自動(dòng)駕駛技術(shù)一直在進(jìn)步，并且將繼續(xù)演進(jìn)，無(wú)論BEV還是端到端都只是整個(gè)發(fā)展過(guò)程中所經(jīng)歷的一部分。他直言，在端到端大模型成為“新寵”的當(dāng)下，也只有少數(shù)企業(yè)有實(shí)力跟進(jìn)新技術(shù)，大部分企業(yè)仍處于觀望狀態(tài)，至于后期是否跟隨，一方面要考量端到端落地成果如何，另一方面還要考察是否還有更新的技術(shù)出現(xiàn)。前瞻技術(shù)固然有其優(yōu)勢(shì)和發(fā)展?jié)摿?，但盲目跟風(fēng)并不適合汽車(chē)產(chǎn)業(yè)。自動(dòng)駕駛企業(yè)應(yīng)冷靜看待新技術(shù)的崛起，雖然“端到端”被認(rèn)為具有更多可能性，但如果只進(jìn)行高速NOA以下級(jí)別的自動(dòng)駕駛，沒(méi)有必要投入為此投入過(guò)多人力、物力，BEV＋Transformer足夠支撐目前L2＋自動(dòng)駕駛的需求，尤其是車(chē)企都在追求技術(shù)量產(chǎn)落地的今天，性?xún)r(jià)比是首先要考慮的因素。

自動(dòng)駕駛技術(shù)路線的進(jìn)化仍在路上，未來(lái)還將迎來(lái)何種“奇遇”誰(shuí)也不敢斷言，但有一點(diǎn)可以確定，發(fā)展自動(dòng)駕駛必須堅(jiān)持“長(zhǎng)期主義”。在這一共識(shí)下，車(chē)企之間或許不僅要比拼誰(shuí)走得更快，更要笑看誰(shuí)走得更遠(yuǎn)。

鄭重聲明：此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊，目的在于傳播更多信息，與本站立場(chǎng)無(wú)關(guān)。僅供讀者參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。