得益于特斯拉的標桿引領(lǐng)作用,自動駕駛領(lǐng)域正掀起一股端到端布局熱潮。
縱觀市場,當前以蔚來、小鵬、理想等為代表的整車廠,以及元戎啟行、商湯絕影、小馬智行、鑒智
機器人等在內(nèi)的自動駕駛產(chǎn)業(yè)鏈公司,都在爭相研發(fā)端到端自動駕駛,以實現(xiàn)更出色的智駕體驗,以及功能進階。
據(jù)辰韜資本聯(lián)合南京大學上海校友會自動駕駛分會、九章智駕共同發(fā)布的《端到端自動駕駛行業(yè)研究報告》顯示(以下簡稱《報告》),基于自動駕駛行業(yè)頭部玩家紛紛提出端到端量產(chǎn)規(guī)劃,預計模塊化端到端系統(tǒng)將于2025年開始上車。
而真正的One Model端到端系統(tǒng),作為廣泛認定的端到端終局方案,由于需要更多模型、數(shù)據(jù)、訓練算力和芯片層面的升級,中性預期其落地時間會晚于模塊化端到端1~2年時間,從2026年至2027年開始上車量產(chǎn)。
端到端加速重構(gòu)自動駕駛
作為一種新的技術(shù)路徑,端到端因為可以實現(xiàn)感知、預測、規(guī)劃三個模型的高度一體化,并通過海量數(shù)據(jù)持續(xù)訓練算法,讓機器擁有自主學習、思考和分析的能力,目前普遍認為可以更好地處理復雜的駕駛?cè)蝿?,從而帶來自動駕駛體驗提升。
不過在實際落地過程中,端到端有多種不同的技術(shù)路線,常見的有模塊化端到端和One Model端到端。其中模塊化端到端,即在自動駕駛算法架構(gòu)中,感知和決策規(guī)劃仍然分為多個模塊,但每個模塊都可以模型化,并通過模塊之間的隱式表達特征,可以實現(xiàn)感知信息的無損傳遞,助力自動駕駛?cè)謨?yōu)化。
而One Model端到端,則不再有感知、決策規(guī)劃等功能的明確劃分,從原始信號輸入到最終規(guī)劃軌跡的輸出直接采用同一個深度學習模型,如此一來可以更好地實現(xiàn)感知信息無損傳遞,實現(xiàn)高效的自動駕駛應用和體驗。
比如特斯拉的許多用戶就表示,特斯拉 FSD V12 在施工路段、無保護左轉(zhuǎn)、擁擠的環(huán)島以及為后方車輛挪動空間時表現(xiàn)優(yōu)異。得益于此,自今年3月特斯拉開啟引入了“端到端神經(jīng)網(wǎng)絡”技術(shù)的FSD V12大規(guī)模推送和免費試用后,據(jù)馬斯克透露,其訂閱率有大幅度提升。
5月底,小鵬汽車正式發(fā)布國內(nèi)首個量產(chǎn)上車的端到端大模型:神經(jīng)網(wǎng)絡XNet+規(guī)控大模型XPlanner+大語言模型XBrain。據(jù)了解,基于折算10億+里程的視頻訓練、超646萬累計公里數(shù)的實車測試、超2.16億累計公里數(shù)的仿真測試,小鵬汽車端到端大模型能夠做到“2天迭代一次”,在未來18個月內(nèi)智駕能力提升30倍。
不僅如此,由于該算法架構(gòu)的強泛化性,端到端還被認為有可能驅(qū)動自動駕駛跨車型、跨地理區(qū)域、跨國家、跨場景的應用,在智駕出海中將大有可為,甚至催生新的產(chǎn)業(yè)分工和商業(yè)模式。
當前,智能駕駛公司在出海時遇到的一個普遍的問題是,由于目前不同國家地區(qū)的駕駛場景、交通規(guī)則都有較大差異,因而,場景適配所需的工作量極大。而端到端的強泛化能力,有望大大減少這一差異帶來的資源投入,進而加速智駕公司在不同場景、不同國家或地區(qū)的應用。小鵬汽車董事長兼首席執(zhí)行官何小鵬就透露,小鵬汽車正在全球范圍對XNGP端到端的能力進行測試,推進智駕技術(shù)開始走向全球。
機遇和挑戰(zhàn)并存
毋庸置疑,端到端在自動駕駛領(lǐng)域應用前景廣闊,但這一全新架構(gòu)面臨的落地挑戰(zhàn)亦不容忽略。
《報告》指出,目前端到端自動駕駛在落地方面主要面臨技術(shù)路線分歧、對訓練數(shù)據(jù)需求量空前提升、對訓練算力需求越來越高、測試驗證方法尚不成熟、組織資源重塑等多重挑戰(zhàn)。
在技術(shù)路線方面,現(xiàn)階段無論是“ 模塊化端到端”還是面向終局的“One Model 端到端” ,都有相應的追隨者,并且由于行業(yè)內(nèi)尚未出現(xiàn)可供參考的最佳實踐案例,預計這種路線分歧還將持續(xù)一段時間。未來 1~2 年內(nèi),隨著更多公司和研究機構(gòu)在端到端領(lǐng)域加大投入并推出產(chǎn)品,技術(shù)路線才會逐漸收斂。
數(shù)據(jù)方面,端到端自動駕駛更是在數(shù)據(jù)量、數(shù)據(jù)標注、數(shù)據(jù)質(zhì)量和數(shù)據(jù)分布等多個維度提出了更高的要求。小馬智行 CTO 樓天城就表示,現(xiàn)階 段,訓練出一個一般性能的端到端模型,自動駕駛的數(shù)據(jù)量已經(jīng)不是一個問題; 但是要訓練出一個高性能的端到端模型,對數(shù)據(jù)的質(zhì)量要求可能是幾個量級的提 升,這是自動駕駛行業(yè)都會面臨的挑戰(zhàn)。
而在算力需求方面,特斯拉曾在2024Q1 財報電話會上表示,公司已經(jīng)有35000張 H100 GPU,并計劃在2024年內(nèi)增加到85000張H100以上,但國內(nèi)主機廠和自動駕駛公司的訓練算力,目前鮮有企業(yè)能達到特斯拉的規(guī)模。
作為對比,小鵬汽車目前僅手握7000+張GPU卡。此前,小鵬汽車已經(jīng)明確在“以智駕為核心的AI技術(shù)”方面,2024年將投入35億元用于智能研發(fā),并新招募4000名專業(yè)人才,今后每年還將投入超過7億元用于算力訓練。
國內(nèi)智駕領(lǐng)域算力儲備相對靠前的是商湯,其在上海臨港建立的亞洲最大的智算中心(AIDC),目前總運營算力已經(jīng)達到12,000P,上線GPU數(shù)量達到45,000張,今年底計劃進一步達到16000P。
另外,測試驗證方面,現(xiàn)有測試驗證方法不適用于端到端自動駕駛,行業(yè)亟需新的測試驗證方法論和工具鏈;組織資源投入方面,端到端需要組織架構(gòu)重塑,也需要將資源投入傾斜到數(shù)據(jù)側(cè),對現(xiàn)有模式提出挑戰(zhàn)。
也正因如此,盡管業(yè)界已經(jīng)對端到端重構(gòu)自動駕駛形成普遍共識,目前的量產(chǎn)方案大多仍停留在“決策規(guī)劃模型化” 階段,距離模塊化端到端或 One Model 端到端自動駕駛真正規(guī)?;涞剡€有一段距離。