侵權(quán)投訴
訂閱
糾錯
加入自媒體

吳新宙到英偉達(dá)后的首秀,說了些什么?

作者 | 黎   瀾

編輯 | 章漣漪

半年時間,英偉達(dá)汽車業(yè)務(wù)無論是商業(yè)化進(jìn)程,還是技術(shù)成熟度,都有了不小進(jìn)步,這是如何實現(xiàn)的?

近日,GTC 2024大會上,英偉達(dá)汽車事業(yè)部副總裁吳新宙發(fā)表了《加速向 AI 定義的汽車的轉(zhuǎn)變》主題演講,用時52分鐘,從技術(shù)角度給予了解答

這也是吳新宙入職英偉達(dá)后的首次正式對外演講。

作為自動駕駛領(lǐng)域大拿,吳新宙曾在高通工作10余年,主導(dǎo)自動駕駛解決方案。2019年,在何小鵬的盛情邀請下,吳新宙加盟小鵬汽車,全面主導(dǎo)小鵬汽車的ADAS業(yè)務(wù),主導(dǎo)實現(xiàn)了NGP、XNGP等項目落地。

同時擁有競爭對手高通,以及自身工程化最好樣本小鵬汽車的高管背景,吳新宙可以說是最適合英偉達(dá)的人。

確實,正如黃仁勛所期待的,在吳新宙加盟后,英偉達(dá)汽車業(yè)務(wù)肉眼可見的更有起色。一方面,團(tuán)隊規(guī)模不斷擴大,特別是自動駕駛中國團(tuán)隊不斷擴充;另一方面,技術(shù)不斷取得突破,截止目前,其已經(jīng)幫助英偉達(dá)搭建了自動駕駛?cè)珬W匝胁块T,并且團(tuán)隊實現(xiàn)將AV1.0(AI Vehicle)升級至AV2.0。

此次大會上,吳新宙對外分享了入職英偉達(dá)220多天以來的故事,講述了英偉達(dá)如何以更少的代碼、更大規(guī)模的模型、更高的算力和更多的數(shù)據(jù),實現(xiàn)以AI為中心的自動駕駛汽車 2.0時代到來。

以下是吳新宙演講的主要內(nèi)容。

01AV2.0的核心技術(shù)優(yōu)勢,在于“雷神”

吳新宙表示,首先,自動駕駛?cè)匀皇怯猩虡I(yè)前景的。

在新能源滲透率穩(wěn)步提升的大前提下,根據(jù)其預(yù)測,2030財年L3級別自動駕駛市場仍將呈現(xiàn)顯著上升趨勢。

同時,隨著生成式AI的發(fā)展,車載AI也有了長足的發(fā)展,經(jīng)歷了從規(guī)則、算法驅(qū)動型軟件棧,到AI增強型軟件棧再到端到端AI軟件棧的過程。

而英偉達(dá)AV2.0的核心技術(shù)優(yōu)勢,在于擁有Drive Thor(雷神)芯片。在智能駕駛方面,Thor發(fā)揮的長處是“低精度運算”,這意味著可以輸入模糊的、多模態(tài)的、不確定的數(shù)據(jù),通過AI自動生成能力還原出有邏輯的遠(yuǎn)算方式。

相比于前代的Orin平臺,Thor在LLAMA-7B的測試環(huán)境中能夠?qū)崿F(xiàn)高達(dá)9倍的性能提升。另外,除了黃仁勛高調(diào)官宣的Blackwell GPU提供卓越性能以外,處理器中的ARM Neoverse V3AE CPU也提供了強大的單線程性能,這對復(fù)雜場景進(jìn)行快速決策尤為關(guān)鍵。在SPECrate®2017_int_base的基準(zhǔn)測試中,Thor比Orin預(yù)計有2.3倍的性能提升。

相較于上一代Xaiver,Orin實現(xiàn)了七倍的算力提升,達(dá)到245TFLOPS ,而Thor則達(dá)到了驚人的2000 TSFLOPS浮點算力。

或許,Orin沒有能夠真正實現(xiàn)L5級別的Robotaxi,Thor能夠完成。

硬件的提升必然需要軟件配套設(shè)施一同進(jìn)步。目前,吳新宙團(tuán)隊研發(fā)的AV2.0還可以解決上一代搭載Orin芯片的AV1.0存在的痛點。

原有的AV1.0需要大量數(shù)據(jù)訓(xùn)練,新一代車載軟件利用仿真技術(shù)模擬各種駕駛場景,降低對真實數(shù)據(jù)的依賴。

根據(jù)吳新宙介紹,傳統(tǒng)的自動駕駛系統(tǒng)只具備幾秒鐘的短期系統(tǒng)記憶,這讓AV1.0的決策可能是缺乏連貫性的。AV2.0利用大語言模型(LLM)邏輯推理的能力,增強了系統(tǒng)決策的連貫性和上下文感知能力。

“英偉達(dá)自動駕駛團(tuán)隊目前還在致力于讓AV系統(tǒng)更具‘可解釋性’,那就是讓自動駕駛不再‘黑箱’,開發(fā)出一套降低信息差,方便對外解釋的算法。”在吳新宙看來,這對于消除大眾對自動駕駛的疑慮至關(guān)重要。

02AV2.0技術(shù)的底層技術(shù)創(chuàng)新

活動上,吳新宙還展示了AV2.0技術(shù)的底層技術(shù)創(chuàng)新:基于VLM的基礎(chǔ)模型(VLM Based Foundation Model,視覺語言模型),由此形成的PARA-Driving,搭建實時自動駕駛的并行化架構(gòu)。

目前,端到端自動駕駛有兩種技術(shù)路線。

一種是UniAD(Unified Autonomous Driving,自動駕駛通用算法框架),這個方案強調(diào)同時操控多個模態(tài),使傳感器搜集到的數(shù)據(jù)在訓(xùn)練過程中朝著“整體最優(yōu)”的方向進(jìn)行。

另一種則是更直接的VLM,實現(xiàn)過程和人類駕駛行為相似:以眼睛作為視覺輸入信號,直接作用在方向盤和剎車油門踏板上。這種直接端到端變相地擴大了模型的搜索空間,需要用更多的數(shù)據(jù)、更大的模型、更強的算力才能防止在特定場景的過擬合,在駕駛體驗中,多半是“莫名其妙的剎車”。

為了降低干擾,吳新宙團(tuán)隊對第二種方案進(jìn)行了優(yōu)化,將Transformer融合進(jìn)自動駕駛的基礎(chǔ)模型,形成PARA-Driving的終極答案。下圖是此模型的功能布局。

吳新宙表示,PARA-drive將信息變成Tokens,再放進(jìn)Transformer模型里分析,化整為零,處理起來更輕松。

據(jù)演示,相比于UniAD6 FPS的夜間運行速度,PARA-drive在夜間駕駛的實際應(yīng)用場景中達(dá)到了26 FPS的高幀率,也就是說,夜視效果能達(dá)到UniAD的四倍

當(dāng)然,這并不意味著要全盤替換原有的系統(tǒng)軟件棧。吳新宙指出,現(xiàn)在的技術(shù)還不足以讓VLM為主的基礎(chǔ)模型全量進(jìn)入使用,初始階段將處于"影子模式"(shadow mode),團(tuán)隊會通過與人類駕駛行為進(jìn)行不斷比較而微調(diào)。

隨著時間的推移,現(xiàn)有的技術(shù)棧將逐漸被淘汰,但出于安全考慮,兩種?赡苄枰泊嬉欢螘r間。

信息搜集處理步驟告一段落,接下來吳新宙開始介紹AV方案中能提供物理模擬引擎的部分。當(dāng)然,這也是英偉達(dá)以游戲顯卡起家的老本行了。仿真模擬(Simulation)的關(guān)鍵作用毋庸置疑,這是取代實車測試所需的巨大成本的關(guān)鍵一步。

良好模擬的關(guān)鍵屬性包括像素保真度(適用于相機、雷達(dá)、超聲波、激光雷達(dá)等),場景保真度和可擴展性,以及行為保真度。無傳感器操作允許在計算上更具可擴展性。英偉達(dá)的AV仿真模擬可以在有或沒有傳感器信息的情況下操作,極大地降低了成本。AV模型模擬的工作流,讓端到端模型與場景庫和功能模塊環(huán)環(huán)相扣。

總體而言,吳新宙團(tuán)隊開發(fā)的基礎(chǔ)模型的功能如下。

通過云端和車端統(tǒng)一的基礎(chǔ)模型,有三個實現(xiàn)場景,首先最直觀的是車內(nèi)助手(In-cabin Assistant),使用基礎(chǔ)模型來提供車內(nèi)助手服務(wù),可能包括語音識別、自然語言處理和用戶交互等功能。

自動標(biāo)注(Auto-labeling),利用基礎(chǔ)模型來自動標(biāo)記訓(xùn)練數(shù)據(jù),對于大量的自動駕駛數(shù)據(jù)來說,可以極大程度地降低成本、提高效率。

最后是安全評估(Safety Evaluation),確保自動駕駛系統(tǒng)的性能和決策符合安全標(biāo)準(zhǔn)。在自動駕駛的安全問題需要得到確認(rèn)的共識下,吳新宙闡述了NVIDIA DRIVE安全平臺在保障自動駕駛汽車的安全方面的全面舉措。

03全球首個端到端AI安全平臺

安全性,幾乎是全球自動駕駛從業(yè)者的共識。英偉達(dá)自動駕駛DRIVE平臺是全球汽車生產(chǎn)領(lǐng)域首個也是唯一一個端到端的智能安全平臺。

目前,英偉達(dá)Drive平臺有四大支柱,分別是開發(fā)過程、硬件、軟件建設(shè)和底層架構(gòu)。

英偉達(dá)在人力部署層面足見對安全的重視。據(jù)吳新宙介紹,有15000名工程師投入到安全部門的研發(fā)工作。

硬件安全機制經(jīng)過21億個晶體管的安全評估,吳新宙也提到了硬件退化效應(yīng)的檢測和ASIL D(Automotive Safety Integrity Level)系統(tǒng)性。

軟件與架構(gòu)是一個全棧功能安全的體系結(jié)構(gòu),共計500萬行代碼經(jīng)過安全評估,還有德國技術(shù)監(jiān)督協(xié)會認(rèn)證的DRIVE OS和安全傳感器以及端到端的認(rèn)證。

底層架構(gòu)層面,Drive平臺提供安全保障的云服務(wù)和工具每日會進(jìn)行200萬次端到端集成測試,確保了安全的開發(fā)和測試以及大規(guī)模的項目周期管理。

04授人以魚,不如授人以漁

另外,英偉達(dá)還專門召開了中文的專家技術(shù)解讀論壇,解釋了吳新宙發(fā)言的核心技術(shù)亮點、應(yīng)用場景,以及自動駕駛方案的商業(yè)落地。

汽車數(shù)據(jù)中心業(yè)務(wù)總監(jiān)陳曄還做了Q&A,針對的問題是英偉達(dá)對國內(nèi)廠商的服務(wù)方式。

陳曄提到,基于中美自動駕駛應(yīng)用場景的差異化,在美國本土英偉達(dá)往往給車企做的是NDAS封裝一站式服務(wù),意味著直接給到完整的自動駕駛解決方案;服務(wù)國內(nèi)的新能源廠商的時候,英偉達(dá)更傾向于提供一套更適配的算法,或者干脆成為算法開發(fā)過程中的指導(dǎo)者。

還有人對算力所需的硬件配置較為好奇。隨著對算力要求的提升,相應(yīng)的“卡”的數(shù)量也會有一定提升。陳曄表示,在AV1.0時代,領(lǐng)先的客戶需求大概是2000臺,在AV2.0時代,就產(chǎn)生了一萬臺GPU的需求,這種量級的變化對有些車企來說是難以承受的。當(dāng)然,這是以H100作為算力計算單位,當(dāng)Blackwell成為主流GPU的時候,企業(yè)所需的硬件成本會有所下降。

以及,陳曄表示,GPU 不僅可以用來自動駕駛研發(fā),還可以有其他的應(yīng)用場景,例如大語言模型、智能座艙等等,未來對“卡”的依賴,只增不減。

陳曄表示,英偉達(dá)會幫客戶去做很多加速工作,從數(shù)據(jù)處理到訓(xùn)練模型優(yōu)化到推理計算、以及到仿真,基于神經(jīng)網(wǎng)絡(luò)重建,由英偉達(dá)自動駕駛最核心的技術(shù)團(tuán)隊來操盤。

這種個性化定制服務(wù),即英偉達(dá)企業(yè)NVRE服務(wù),服務(wù)方式是AI enterprise。這種個性化設(shè)計是基于車企信任英偉達(dá)的前提,即愿意分享數(shù)據(jù)的基礎(chǔ)之上的。

車企給英偉達(dá)場景數(shù)據(jù),訓(xùn)練更好的大模型,英偉達(dá)再用優(yōu)化過的模型給車企自動駕駛方案賦能,收集更多維度的數(shù)據(jù),這正是所有人工智能相關(guān)的產(chǎn)品的終極目標(biāo),打造數(shù)據(jù)飛輪,靠自身商業(yè)化落地即可精進(jìn)。

目前看來,吳新宙來到英偉達(dá)“深造”,實際上是更靠近了技術(shù)研發(fā)所需的算力“水源”,加上從0到1的小鵬智駕經(jīng)驗,無論對于英偉達(dá),還是對整個行業(yè)來說,都有1+1大于2的效果。

       原文標(biāo)題 : 吳新宙到英偉達(dá)后的首秀,說了些什么?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號