來源:經(jīng)濟(jì)觀察報(bào)
在2024年北京車展上,端到端模型迅速成為智能駕駛領(lǐng)域的熱門話題,占據(jù)了行業(yè)的焦點(diǎn)。
自特斯拉推出其端到端技術(shù)以來,該技術(shù)方案便在業(yè)界引起了廣泛的討論和爭議,。經(jīng)過一年的發(fā)展和市場驗(yàn)證,特斯拉的FSD V12版本已經(jīng)贏得了行業(yè)專家的普遍認(rèn)可,其在模擬人類駕駛行為方面的精準(zhǔn)度有了顯著提升,。
這一進(jìn)展促使越來越多的廠商開始信任并積極投入到端到端智能駕駛解決方案的研發(fā)中。在本屆車展上,,眾多企業(yè)展示了他們在端到端技術(shù)上取得的突破性進(jìn)展和創(chuàng)新成果,。
端到端技術(shù)的浪潮已經(jīng)到來,標(biāo)志著智能駕駛新時(shí)代的序幕,,為汽車行業(yè)的未來描繪了一幅充滿機(jī)遇的廣闊藍(lán)圖,。隨著端到端技術(shù)的興起,量產(chǎn)能力正面臨前所未有的挑戰(zhàn),。在這一技術(shù)對數(shù)據(jù)需求不斷增長的背景下,,量產(chǎn)的速度和效率正成為行業(yè)競爭的新焦點(diǎn)。
然而,,提出端到端模型并計(jì)劃最先量產(chǎn)的是一家成立僅有5年的創(chuàng)業(yè)公司元戎啟行,。該公司CEO周光宣布已經(jīng)和多家主機(jī)廠合作,計(jì)劃今年將端到端模型推入消費(fèi)市場,。
為什么是端到端,?
端到端智能駕駛技術(shù)致力于使智能駕駛系統(tǒng)具備與人類司機(jī)相似的智能和問題解決能力,這與傳統(tǒng)的模塊化架構(gòu)有本質(zhì)的區(qū)別,。
模塊化架構(gòu)將感知,、決策和規(guī)則作為獨(dú)立的模塊,依賴工程師編寫的固定規(guī)則,,并且模塊間的交互協(xié)議是基于工程師經(jīng)驗(yàn)抽象出來的,。這種設(shè)計(jì)不僅會在信息傳遞時(shí)造成損失,還會使得整個(gè)系統(tǒng)程序復(fù)雜化,,難以維護(hù),,并且過度依賴人工標(biāo)記的高精地圖,這嚴(yán)重限制了智能駕駛技術(shù)在多樣化場景中的應(yīng)用和落地速度。
與此相對,,端到端技術(shù)通過整合智能駕駛系統(tǒng)中的感知,、預(yù)測、規(guī)劃等模塊,,并利用海量數(shù)據(jù)進(jìn)行訓(xùn)練,,實(shí)現(xiàn)了自我學(xué)習(xí)和優(yōu)化,從而在數(shù)據(jù)輸入到?jīng)Q策指令輸出的過程中保持了高效率和準(zhǔn)確性,。這種技術(shù)能夠更好地模擬人類司機(jī)的決策過程,,顯著提升了智能駕駛系統(tǒng)的適應(yīng)性和反應(yīng)速度。
元戎啟行CEO周光透露,,公司早在2020年就開始減少對高精地圖的依賴,,并于2023年深入部署端到端模型上車。元戎啟行與特斯拉對人工智能的理解有著異曲同工之妙,,這一認(rèn)知與周光本人的技術(shù)出身密不可分,。
周光畢業(yè)于美國德州大學(xué)達(dá)拉斯分校人工智能和機(jī)器人方向,曾在德州儀器,、百度美國研究院負(fù)責(zé)自動(dòng)駕駛相關(guān)項(xiàng)目,。用周光的話說,他早在10多年前就已從事AI方面的工作了,,而當(dāng)時(shí)全世界還沒有什么像樣的人工智能應(yīng)用,。
周光的“反共識思維”
引領(lǐng)元戎啟行邁出先行步伐的是周光的“反共識思維”。最初,,當(dāng)周光提出“無圖”(無高精度地圖)方案時(shí),,行業(yè)普遍感到困惑,因?yàn)榇蠖鄶?shù)競爭對手的方案都集中在高精地圖技術(shù)上。
同樣地,,當(dāng)他提出端到端模型時(shí),,行業(yè)也充滿了質(zhì)疑,認(rèn)為沒有足夠的數(shù)據(jù)積累是不可能實(shí)現(xiàn)的,。在周光看來,,人工智能領(lǐng)域的發(fā)展往往真理掌握在少數(shù)人手中。他認(rèn)為,,每次技術(shù)選擇都像是站在一個(gè)分叉路口,,一旦選擇錯(cuò)誤,可能意味著一年甚至幾年的努力和投入都將化為泡影,。
這正如一些企業(yè)在L4級別的自動(dòng)駕駛技術(shù)上選擇錯(cuò)誤路線,,導(dǎo)致之前的投入都白白浪費(fèi)了。
周光觀察到,,一些AI公司,,包括大語言模型公司,很多由互聯(lián)網(wǎng)時(shí)代的人重新創(chuàng)業(yè),,可能缺乏人工智能的學(xué)術(shù)背景,。相比之下,創(chuàng)始人有AI學(xué)術(shù)背景能夠真正理解AI技術(shù)的企業(yè)在技術(shù)決策層面優(yōu)勢更強(qiáng),,因?yàn)槊看渭夹g(shù)的選擇都至關(guān)重要,,錯(cuò)誤的決策可能導(dǎo)致巨大沉沒成本。
同時(shí)周光認(rèn)為,,在人工智能2.0時(shí)代,,豐富的行業(yè)經(jīng)驗(yàn)有時(shí)反而會成為創(chuàng)新的阻礙,智能駕駛本質(zhì)上是人工智能的應(yīng)用,,應(yīng)更多地聽從AI Explorer的指引,。
盡管元戎啟行在技術(shù)路線上并未落后,但周光坦言,,在數(shù)據(jù)量方面與行業(yè)領(lǐng)先者存在差距,。他指出,元戎啟行的“無圖”方案在能力上與特斯拉的FSD V11相近,,但與V12版本相比則存在差距,,V12版本在模擬人類駕駛行為方面更為精準(zhǔn)。周光認(rèn)為,,這一差距將會在量產(chǎn)之后縮小,。
目前,元戎啟行已確定了三家量產(chǎn)客戶,。與傳統(tǒng)依賴高精地圖的方案不同,,端到端模型對數(shù)據(jù)量的需求更為龐大,,這推動(dòng)了元戎啟行向量產(chǎn)邁進(jìn),以便積累足夠的數(shù)據(jù)來訓(xùn)練和優(yōu)化模型,。在高階智能駕駛領(lǐng)域,,元戎啟行的方案以高性價(jià)比和可控性著稱。
打開通用人工智能之門
周光進(jìn)一步分析說,,“端到端的高階智駕市場尚未成為紅海,,真正能提供技術(shù)能力的公司并不多?!彼硎?,元戎啟行既有成本優(yōu)勢,同時(shí)還能確保汽車制造商(OEM)在選擇技術(shù)方案時(shí)的“安全性”,。
對于降本方面,,周光認(rèn)為,盡管激光雷達(dá)在識別異型障礙物方面有其作用,,但在數(shù)據(jù)量充足的條件下,,可以通過優(yōu)化算法減少對激光雷達(dá)的依賴,從而降低成本,。端到端模型的特性使其不僅適用于智能駕駛,,還能遷移到其他機(jī)器人領(lǐng)域,實(shí)現(xiàn)技術(shù)的廣泛適用性,。
元戎啟行的愿景是實(shí)現(xiàn)物理世界通用的人工智能,,而汽車的智能駕駛只是這一宏偉目標(biāo)的起點(diǎn)。周光認(rèn)為,,現(xiàn)階段已經(jīng)擺脫了以簡單規(guī)則為驅(qū)動(dòng)的AI1.0時(shí)代,,正在開啟基于數(shù)據(jù)驅(qū)動(dòng)的AI2.0時(shí)代,而AI的3.0時(shí)代就是通用人工智能時(shí)代,。
人工智能的2.0時(shí)代包括三個(gè)領(lǐng)域:一是自然語言處理領(lǐng)域,代表產(chǎn)品是OpenAI開發(fā)的ChatGPT,;二是生成式人工智能領(lǐng)域,,代表產(chǎn)品可能亦是OpenAI開發(fā)的Sora;三是端到端模型的智能駕駛,,代表企業(yè)包括特斯拉,、元戎啟行等。
周光提出,,為了構(gòu)建通用的人工智能,,必須將大語言模型、端到端模型和生成式人工智能技術(shù)進(jìn)行融合,,以賦予系統(tǒng)全面感知,、還原,、理解和操作世界的能力。在這一愿景中,,端到端模型扮演著至關(guān)重要的角色,。
他指出,盡管以ChatGPT和Sora為代表的大語言模型和生成式人工智能技術(shù)在數(shù)據(jù)收集方面取得了進(jìn)展,,但這些數(shù)據(jù)并不直接來源于物理世界的真實(shí)情況,,特別是在對臨界態(tài)狀態(tài)的捕捉和詮釋上存在不足。
所謂的臨界態(tài)狀態(tài),,指的是物體的物理狀態(tài)在變化發(fā)生的關(guān)鍵瞬間,。如Sora生成的視頻中果汁潑濺的瞬間,雖然能看到潑濺前后的情景,,但關(guān)鍵的臨界過程——果汁從杯中流出的那一刻——卻常常缺失,。在機(jī)器人感知中,這個(gè)短暫而關(guān)鍵的臨界狀態(tài)非常重要,。
智能駕駛領(lǐng)域的端到端模型能夠有效捕捉并展現(xiàn)這種臨界狀態(tài),。因?yàn)樵谲囕v行駛過程中,會產(chǎn)生大量符合現(xiàn)實(shí)物理規(guī)律的真實(shí)臨界狀態(tài)數(shù)據(jù),。因此,,周光認(rèn)為,端到端模型是實(shí)現(xiàn)物理世界中通用人工智能的關(guān)鍵組成部分,,它能夠利用來自現(xiàn)實(shí)世界的真實(shí)數(shù)據(jù),,幫助AI更好地理解和響應(yīng)各種復(fù)雜情境。
目前,,元戎啟行正積極籌備C輪融資,,并與多家整車企業(yè)合作,推動(dòng)端到端智駕方案的規(guī)?;慨a(chǎn),。公司已經(jīng)用數(shù)以百萬計(jì)的視頻、多樣性豐富的數(shù)據(jù)集去訓(xùn)練系統(tǒng),,同時(shí)與多家頭部芯片企業(yè)達(dá)成深度技術(shù)合作,,為性能提供保障。
聞濤/文
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,,觀點(diǎn)僅代表作者本人,,不代表芒果財(cái)經(jīng)贊同其觀點(diǎn)或證實(shí)其描述,版權(quán)歸原作者所有,。轉(zhuǎn)載請注明出處:http://lequren.com/1099894.html
溫馨提示:投資有風(fēng)險(xiǎn),,入市須謹(jǐn)慎。本資訊不作為投資理財(cái)建議,。