對(duì)話騰訊自動(dòng)駕駛總經(jīng)理蘇奎峰:數(shù)字孿生與 AIGC 結(jié)合 如何加速自動(dòng)駕駛落地?17
發(fā)表時(shí)間:2023-10-28 16:18 AI大模型可以從無到有地生產(chǎn)各種數(shù)據(jù)后,創(chuàng)造出的海量數(shù)據(jù)該怎么用成了新問題。 10月26日,在由界面新聞主辦的2023 REAL科技大會(huì)上,騰訊數(shù)字孿生產(chǎn)品部/自動(dòng)駕駛業(yè)務(wù)總經(jīng)理蘇奎峰發(fā)表了《數(shù)字孿生與生成式AI的閉環(huán)迭代進(jìn)化》主題演講。 蘇奎峰認(rèn)為外界對(duì)于數(shù)字孿生價(jià)值的理解存在諸多誤區(qū),數(shù)字孿生的真正價(jià)值在于可視、可算與可用??梢曉谟谔峁┮粋€(gè)交互方式,如果一個(gè)孿生系統(tǒng)沒有做到可視化,那么它將是失敗的;可算即將物理世界模型化和參數(shù)化,以實(shí)時(shí)數(shù)據(jù)驅(qū)動(dòng)和推演,再將虛實(shí)場景疊加在一起,最后獲得更強(qiáng)和更大規(guī)模的計(jì)算模型,且這個(gè)計(jì)算模型可以按照設(shè)計(jì)者的需求隨時(shí)編輯??捎皿w現(xiàn)在提供沉浸式、游戲化的交互體驗(yàn),使得其在現(xiàn)實(shí)世界中可以無障礙使用, 他通過實(shí)際應(yīng)用場景解釋了數(shù)字孿生的價(jià)值。一輛貨車送貨,技術(shù)團(tuán)隊(duì)可以將裝載、卸載、運(yùn)輸這些現(xiàn)實(shí)場景通過數(shù)字孿生建成數(shù)字世界。這個(gè)三維虛擬“世界”不僅要在視覺上做到了對(duì)物流世界的仿真還原,還必須可編輯的,例如改變車流方向、環(huán)境路況。 以他所負(fù)責(zé)的自動(dòng)駕駛業(yè)務(wù)為例,自動(dòng)駕駛行業(yè)當(dāng)前最大的一個(gè)痛點(diǎn)就是缺數(shù)據(jù)。如果將數(shù)字孿生應(yīng)用在自動(dòng)駕駛的仿真系統(tǒng)中,一旦這套系統(tǒng)掌握了編輯能力,就可以按照開發(fā)者的需求進(jìn)行二次開發(fā)設(shè)計(jì)。同時(shí),還能通過這些可編輯數(shù)據(jù)再加上原來的傳感器采集數(shù)據(jù),便可以按照高質(zhì)量的數(shù)據(jù)來訓(xùn)練AI大模型。大模型又可以生成完善自動(dòng)駕駛功能需要的更多測試場景。 演講結(jié)束后,蘇奎峰接受了界面新聞?dòng)浾叩膶TL,談了他思考數(shù)字孿生應(yīng)用于自動(dòng)駕駛的改變,及騰訊對(duì)于自動(dòng)駕駛的投入戰(zhàn)略,以下為專訪內(nèi)容(有刪改): 界面新聞:大模型可以生成提供大量高質(zhì)量、結(jié)構(gòu)化的數(shù)據(jù),這些AI生成數(shù)據(jù)能夠解決自動(dòng)駕駛?cè)睌?shù)據(jù)的現(xiàn)狀嗎,通過這種方式與傳感器捕捉數(shù)據(jù)相比有哪些不同? 蘇奎峰:首先需要強(qiáng)調(diào)的是,現(xiàn)實(shí)數(shù)據(jù)一定是需要的,完全靠虛擬的數(shù)據(jù)肯定不可能。 自動(dòng)駕駛目前在數(shù)據(jù)上主要克服三個(gè)問題。第一個(gè)是數(shù)據(jù)效率;第二個(gè)就是極端狀況數(shù)據(jù)(現(xiàn)實(shí)中無法復(fù)現(xiàn)測試);第三個(gè)是樣本均衡問題,如果某一類樣本數(shù)據(jù)多,某一類樣本數(shù)據(jù)少,也會(huì)影響最后的表現(xiàn)。 我們的解決方案就是通過數(shù)字孿生和 AIGC 結(jié)合。這種方案并不是完全脫離了傳感器,而是通過傳感器采集到了真實(shí)數(shù)據(jù),采集完成數(shù)據(jù),再通過數(shù)字孿生技術(shù)建模,相當(dāng)于將一輛車行駛的現(xiàn)實(shí)場景重建成數(shù)字場景,并且我們還可以按照需求編輯這個(gè)三維的虛擬場景,做到了可視、可算和可用。 這套方案執(zhí)行下來,第一,傳感器的數(shù)據(jù)保障了真實(shí)性;第二,數(shù)字孿生建立的場景又是可以編輯的,可按照自動(dòng)駕駛測試的需求進(jìn)行二次開發(fā)設(shè)計(jì);第三,如果編輯效率低,還能通過這些可編輯數(shù)據(jù)再加上原來的傳感器采集數(shù)據(jù), 訓(xùn)練出一個(gè)大模型。 我們目前在這上面所做的工作,于基本算法上已有了雛形,現(xiàn)在開始驗(yàn)證一致性。 界面新聞:對(duì)于技術(shù)驗(yàn)證一致性后的落地使用,你有怎樣的預(yù)期? 蘇奎峰:很快,或許一年之后我們再見就可以討論落地效果。 界面新聞:騰訊的自動(dòng)駕駛業(yè)務(wù)現(xiàn)在隸屬于數(shù)字孿生產(chǎn)品部,從公司戰(zhàn)略角度,這代表了怎樣的發(fā)展路線? 蘇奎峰:我們思考自動(dòng)駕駛是一項(xiàng)復(fù)合技術(shù),它包含了人工智能的許多底層技術(shù),例如感知、建模、決策規(guī)劃。 自動(dòng)駕駛的核心競爭力在于數(shù)據(jù)要素和計(jì)算資源的低成本獲取和高效利用。對(duì)數(shù)據(jù)進(jìn)行高效收集和利用,是整個(gè)自動(dòng)駕駛技術(shù)迭代的關(guān)鍵點(diǎn)。數(shù)字孿生的虛擬仿真技術(shù)有助于加速自動(dòng)駕駛的落地應(yīng)用,且在服務(wù)于自動(dòng)駕駛的同時(shí),又拓展了自身的應(yīng)用邊界,例如智慧城市、工業(yè)數(shù)字化等等。 其實(shí)無論自動(dòng)駕駛還是數(shù)字孿生,甚至于現(xiàn)在的 AIGC,我們現(xiàn)在的這個(gè)團(tuán)隊(duì)都有儲(chǔ)備,隨時(shí)做遷移,以覆蓋自動(dòng)駕駛的技術(shù)需要。 界面新聞:在自動(dòng)駕駛業(yè)務(wù)領(lǐng)域,騰訊目前的計(jì)劃仍然是給車打造工具嗎? 蘇奎峰:是的,騰訊做自動(dòng)駕駛的定位就是數(shù)字化助手,這也和騰訊在產(chǎn)業(yè)互聯(lián)網(wǎng)中的角色定位一致。 我們內(nèi)部一開始也思考過造車與做Robotaxi類的自動(dòng)駕駛算法提供商兩條路線,但很快就被否決掉了。不造車,是因?yàn)樗婕吧a(chǎn)制造領(lǐng)域的專業(yè)問題,與騰訊的互聯(lián)網(wǎng)公司基因不符。不做算法提供商是因?yàn)樯虡I(yè)模式,自動(dòng)駕駛最終落地后的商業(yè)模型能不能成立,我們對(duì)此表示懷疑。 界面新聞:就BAT三家公司對(duì)自動(dòng)駕駛的投入來說,騰訊怎么看各家近一兩年來在這上面的調(diào)整? 蘇奎峰:自動(dòng)駕駛像所有行業(yè)一樣,當(dāng)它的現(xiàn)實(shí)發(fā)展符合大家的理想預(yù)期時(shí),各家就會(huì)加大投入,市場也會(huì)相應(yīng)放大。目前在這種狀態(tài)下,大家都收縮的時(shí)候,說明行業(yè)現(xiàn)階段對(duì)這件事情的認(rèn)知與判斷都很模糊。 如果把自動(dòng)駕駛看成多項(xiàng)技術(shù)的集大成者,那行業(yè)就可以找到更多的商業(yè)出口和落地場景?,F(xiàn)在的難處在于如何把技術(shù)和現(xiàn)有產(chǎn)業(yè)結(jié)合起來。 騰訊目前的調(diào)整是方向性的調(diào)整,但大戰(zhàn)略沒變。 |