<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      對談清華教授汪玉:為什么數據流架構適用智駕芯片?

      0
      分享至



      “牽頭人能下決心是好事,但得堅持住。”

      文丨趙宇

      編輯丨龔方毅

      特斯拉、蔚小理等都在自研芯片,理想是其中唯一用數據流架構的。這種架構概念已誕生 50 多年,學術界討論已久,但一直缺乏大規模商業化應用。

      理想汽車 CEO 李想上月底在微博說,數據流架構是一種原生計算架構,代表了通用 AI 計算架構未來演進的趨勢。當時,這塊芯片的設計理念得到學界背書 —— 解析馬赫 100 芯片數據流架構的論文,入選計算機體系結構領域頂級會議 ISCA 2026。

      “理想的重要突破在于敢用 VLA (Vision-Language-Action Model,視覺-語言-行動模型),并且多跨一步去做數據流架構。” 清華大學電子工程系長聘教授、無問芯穹發起人汪玉告訴《晚點 Auto》。

      他還認為,數據流架構的優勢是提升了計算效率,但代價是編譯難度更大。不過由于 AI 可以輔助人類編程,對于持續演進的智駕模型應用,數據流架構成為一種不錯的選擇。

      汪玉長期從事智能芯片、高能效電路與系統相關研究,主持多項國家級以及企業聯合項目。2016 年,他將知識成果入股深度學習處理器公司深鑒科技(2018 年被賽靈思收購)。2023 年,他推動成立 AI 基礎設施企業無問芯穹。

      近期,我們與汪玉聊了數據流架構的技術優勢、局限性,以及車企繞開英偉達 CUDA 生態自研芯片是否現實等話題。

      以下是我們的交流實錄,經編輯。

      數據流架構的雙面性:計算效率提升但編譯難度更大

      晚點:理想自研芯片馬赫 100 采用數據流架構,你如何評價這條技術路線的優劣勢?

      汪玉:數據流架構是一個不錯的技術方向。

      簡單來說,芯片處理計算的過程就像做數學題,先把兩個數相乘,然后相加。把每個乘法當作一個節點,結果傳給下一個加法器,這樣就形成了一個巨大的計算圖。數據流架構的好處是,數據在芯片的處理單元間直接流動,不需要反復讀取外部存儲器。

      舉個例子,要把 500 個數加起來,可以用二叉樹方式——兩兩相加得到 250 個結果,再兩兩相加得到 125 個結果,依此類推。這就是數據流圖。如果用普通 CPU,因為它只有一個計算單元,就需要不斷地從存儲器里取數、計算、存回去,再取下一組數。如果采用數據流架構,雖然計算次數省不了,但存儲開銷能省很多。

      去年云棲大會理想 CTO 謝炎也提到過,數據流架構讓數據在處理單元間直接流動,減少了反復訪問內存的開銷。

      然而,數據流架構的應用難點在于,編譯器的代價會比較大。不過,現在 AI 技術很強大,可以用 AI 來幫助完成這些映射工作。甚至在設計算法時,就可以讓算法適配底層的計算架構。對于以 VLA 模型為代表的這類智駕模型應用,數據流架構是一個不錯的選擇。

      晚點:Google 的 TPU 芯片是采用數據流架構嗎?

      汪玉:Google 的 TPU 芯片,你要說它是數據流架構也行,因為很多芯片架構其實都有不同程度的數據流特性。

      你可以把整個巨大的計算流圖做成一顆固定的芯片,也可以提取出通用的子圖模塊,讓這些模塊都能得到支持,再用它們拼接出更大的計算流圖。

      這就像搭積木,你可以做一個巨大的固定模型,也可以做很多通用積木塊,然后用這些積木塊組裝出各種形狀。它有各種設計方法,讓工程師能在效率和通用性之間找到平衡點。

      我從 2012 年開始做 CNN 算法的芯片架構研究時就發現,要完成同樣功能可以用不同的 AI 模型結構。比如當年 VGG、ResNet 等各種不同的網絡結構都能做人臉識別。這說明如果硬件層面提供了某些計算模式,軟件算法可以學會并適應這些模式。關鍵不是說自動駕駛或大模型本身會完全固定,而是算法具有學習和適應硬件的能力。

      晚點:適合 CNN 運算的芯片是否天然不適合做 Transformer 運算?

      汪玉:要看你在哪一級做抽象。如果你專門做卷積運算,但 Transformer 里沒有卷積,就要把矩陣運算拆成卷積來處理,這樣代價就很高了。現在的 VLA 模型基本上包含了視覺、語言、行動三種模式的各種運算規律,而且短期內三五年大概率不會變:

      Vision(視覺)部分主要吃算力,需要在一個較大的輸入特征圖上進行大量計算操作。因此,視覺相關的處理通常需要專門的卷積運算或者視覺編碼器來提取圖像特征。

      Language(語言)部分通常是內存密集型任務,主要瓶頸在于需要大帶寬來支持大量的數據讀寫。數據流架構在這方面比較合適,能夠有效減少內存訪問的開銷。

      Action(行動)部分的計算模式很不規律,需要用到的處理器類型相對多樣。

      晚點:特斯拉 2019 年量產的 FSD 智駕芯片沒采用數據流架構,但說是為自動駕駛推理做了深度定制,這怎么理解?

      汪玉:那時候還是面向 CNN 算法為主。到現在大模型的時代,理想一個比較重要的突破,還是它敢于去用 VLA,這是一個比較大的變化。然后現在所有芯片對 VLA 模型的支持都一般,傳統芯片支持 CNN 算法的較多。所以理想能把這件事情突破,而且多跨一步去做數據流架構,膽量挺大的。

      架構骨架變化進入平穩期,一代芯片能支持多代算法

      晚點:DeepSeek 已經證明,用相對小的算力也能做出性能優秀的算法模型,智駕領域能否通過類似優化降低算力需求?

      汪玉:這就是軟硬件協同優化。你有什么芯片,就在每一層都做修改。芯片受限就改算法或者軟件。通過這種垂直打通的優化方式,才能產生更好的系統級效果。

      晚點:現在摩爾定律放緩,業內嘗試用其他方式提升芯片性能,比如 Chiplet。你看好 Chiplet 技術嗎?

      汪玉:Chiplet 肯定要做,因為它有兩個好處。

      第一,單芯片現在不能做得更大了,主要受應力限制。一顆芯片大概是固定的幾百平方毫米,12 寸晶圓會被切成一個個芯粒,這個大小基本已經固定。如果想做更大芯片,要用多個芯粒拼起來。

      第二,可以把不同工藝的芯粒拼在一起。這種搭樂高的方式可以把不同功能單元組合,比如車載領域會用 CPU、GPU、NPU,還有數據流架構芯片等,如果用樂高的方式拼裝,其實會使得快速迭代變容易。

      晚點:在提高智駕芯片算力利用率方面,你有沒有研究成果可以分享?

      汪玉:我們從 2015 年就開始發論文講這個。一是在完成同樣功能的情況下把模型做小,這樣計算量、存儲量需求就少了,也就是在同樣算力下計算速度就會變快。二是壓縮和量化,就是把模型里每一個操作需要的比特數降下去,這樣底層芯片就可以用更高能效的低比特數單元來做。

      就像在固定面積房間里,能擺 10 張沙發,但能擺 100 張椅子。椅子就是低比特數的計算單元,等效算力變成原來 10 倍。這是為什么大家都用 FP4、FP8 而不用 FP32 的原因。

      還有內存調度機制。最后都是矩陣向量乘法,怎么讓 100 把椅子每時刻都坐滿人,利用率就做起來了。這涉及架構設計和內存優化策略。

      晚點:從學術研究角度看,未來 3-5 年智駕芯片可能有哪些關鍵技術演進?尤其是學術界能看到,但工業界還沒落地的。

      汪玉:內存堆疊可能是必須要做的事。從工藝角度看,Chiplet 解決面積墻問題,算力擴大靠芯粒拼接。下一個是存儲墻,怎么把內存布置好,快速拿到數據。未來大概率還是要把計算和存儲放得更近,不管是用 3D 堆疊還是其他方式。

      晚點:相比端到端、VLA 這些智駕算法的迭代速度,芯片的研發周期顯然更長。這可能造成軟硬件的研發進度不匹配,如何解決這個問題?

      汪玉:我現在的感受是 Backbone,就是模型骨架的變化沒那么大。比如 DeepSeek 模型已經迭代了幾代,每一代里的關鍵算子,也就是計算流圖的差異,并不是很大。

      晚點:所以雖然架構在變,其實用的歸根結底還是 Transformer。

      汪玉:或者說是變種的 Transformer,然后這些變種 Transformer 架構每一代的變化也沒有那么大,因此用編譯器就能解決。所以,一顆芯片支持幾代不同算法應該問題不大,除非發生劇烈變化比如不用 Transformer 了。

      晚點:有業界的人說,有可能會出現一種比 Transformer 更優的架構。

      汪玉:學術界看到的,至少三年后才到工業界應用,但目前學術界還沒看到。2017 年出的 Transformer,2022 年 11 月才被 ChatGPT 真正應用,用了 5 年,這已經很快。Transformer 真正大規模商用是現在,所以沒那么快。

      車企造芯算得過來賬:成本可控,關鍵在持續迭代

      晚點:理想 2022 年啟動自研芯片,當時 VLA 和 Transformer 概念還不火,這對研發影響大嗎?

      汪玉:2022 年開始研發,真正流片要到 2024 年。在這個過程中,理想肯定看到了 Transformer 架構的潛力。數據流是馬赫 100 很重要的組成部分,但這顆芯片肯定還支持 CNN,包括一些支持向量運算的 CPU。

      晚點:國外有廠商把數據流架構用在云端數據中心,但數據中心很少做推理。

      汪玉:現在推理業務已經起來了。Anthropic 三年間收入翻了 1000 倍,證明 Coding 業務爆發。國家數據局局長劉烈宏說,中國日均 Token 調用量已經到 140 萬億。推理業務起來后,極致定制化的 AI 芯片一定要做,否則每個 Token 的成本降不下去。然后對于車載來說,其實不一定是每個 Token 的成本,而是每秒能輸出的 Token 數上不去。

      晚點:如果是每秒的 Token 數,那瓶頸還挺大。

      汪玉:現在的人形機器人其實不能非常快速地移動,一方面是機械能力限制,另一方面其實是指揮控制頻率的問題。每次指揮相當于輸出 0 或 1,這就是一個 Token。假設希望每秒能指揮 1000 次,也就是毫秒級反應速度,對應每秒 1000 個 Token。這應當是端側追求的極致目標。如果是 70 億參數的模型,需要相當大的芯片才能達到每秒 1000 個 Token 的處理能力。

      晚點:每秒 1000 個 Token 是機器人的要求,智駕現在大概是什么情況?

      汪玉:智駕的圖像傳感器幀率一般在 30 幀以上,每一幀圖片一般會轉化數百個 Token 進行處理,在考慮多路攝像頭的情況下,輸入需要處理的 Token 一般在數千到上萬不等。從輸出的角度來看,輸出底盤的頻率一般在 100 Hz,每一次輸出的動作信息一般就十幾個 Token,因此也會對應每秒近 1000 個 Token 的輸出。

      晚點:有業內人士認為,汽車里的空間更大,所以智駕芯片對先進制程的需求不如手機芯片迫切。你怎么看?

      汪玉:那倒不會,因為成本差 1000 塊錢,競爭都很激烈。包括散熱也是個很大問題。為什么手機要用最先進的制程?其實是因為同樣能力下,更先進制程芯片的功耗會更低,供電和散熱可以做得更簡單。汽車是一樣的,現在車里的電子系統占比大約到 30% 了,跟智駕、娛樂相關的系統都靠電來支撐,這塊電量已經上去了,所以能耗也是一個問題。

      但更重要的是反應速度問題、實時性問題、性能問題。智駕要支持最好的模型,實現最快速度、最高能效,至少芯片的性能要足夠好。性能如果想足夠好,提升工藝和內存的對接方式都很重要。只靠芯片本身并不夠。

      這是我比較喜歡理想的原因,它可以跟蘋果一樣,把應用、軟件、芯片和車一起優化。這個維度做最好的就是蘋果。華為也得這么做,因為它被限制,必須做到極致,才能用落后工藝有比較好的表現。我非常贊成這個邏輯。

      晚點:手機廠商自研芯片時,前幾代多少都有性能問題,理想第一代自研芯片的可用性會不會也存在疑問?

      汪玉:如果要做一家偉大的公司,現在虧得起,牽頭人能下決心是好事,但得堅持住。

      晚點:特斯拉自研 FSD 芯片后,蔚小理等廠商陸續開始自研芯片。車企自研智駕芯片的投入產出比能算得過來賬嗎?

      汪玉:肯定能算過來賬,但核心是芯片得能用。如果真做出來能用、能持續迭代,第一自主可控,第二成本也降下去了。

      晚點:大家之所以用英偉達芯片,一方面是它的芯片性能好,另一方面它有 CUDA 生態。國產廠商自研芯片后不用 CUDA 了,這個影響大嗎?

      汪玉:CUDA 本身支持幾千個算子,但智駕的計算維度不需要這么多。以我做大模型的經驗,VLA 模型估計就幾百個算子這個量級,所以其實軟件層面的代價比原來小很多。同時我們現在可以用 AI 寫算子,所以我不覺得 CUDA 會是很大壁壘。

      晚點:“代價比原來小很多”,具體指什么?

      汪玉:當時 CUDA 要支持很多應用,包括顯示、游戲、建筑繪圖,甚至天氣仿真等等。而現在只需要支持大模型,所以會容易很多。

      題圖來源:Gemini

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      深圳女環衛工遭拖拽毆打!堅決拒和解,男子身份曝光,原因太荒唐

      深圳女環衛工遭拖拽毆打!堅決拒和解,男子身份曝光,原因太荒唐

      做一個合格的吃瓜群眾
      2026-05-08 07:03:36
      王毅見戴安斯一行,何為“重要象征意義”?

      王毅見戴安斯一行,何為“重要象征意義”?

      新民周刊
      2026-05-08 09:06:30
      爭議!湖人全隊賽后找裁判理論 雷迪克:老詹是所有球星哨子最少

      爭議!湖人全隊賽后找裁判理論 雷迪克:老詹是所有球星哨子最少

      醉臥浮生
      2026-05-08 12:40:01
      英偉達CEO黃仁勛:若受邀,將隨特朗普一同訪問中國

      英偉達CEO黃仁勛:若受邀,將隨特朗普一同訪問中國

      澎湃新聞
      2026-05-08 12:20:26
      5月1日起紅燈右轉全國統一新規:不是不讓轉,是不要再亂轉了

      5月1日起紅燈右轉全國統一新規:不是不讓轉,是不要再亂轉了

      笑熬漿糊111
      2026-05-08 05:47:49
      中國“退步”最快的城市:曾與南京、上海齊名,如今卻淪為三線

      中國“退步”最快的城市:曾與南京、上海齊名,如今卻淪為三線

      長風文史
      2026-05-08 13:02:57
      多項研究顯示:性生活頻率過低,男女容易早衰且患癌風險增高!

      多項研究顯示:性生活頻率過低,男女容易早衰且患癌風險增高!

      燈錦年
      2026-05-05 21:55:51
      隊長被打進醫院!皇馬更衣室徹底失控,內亂不止顏面盡失!

      隊長被打進醫院!皇馬更衣室徹底失控,內亂不止顏面盡失!

      田先生籃球
      2026-05-08 08:16:44
      因瀏陽煙花廠爆炸事故,湖南衛視多檔節目推遲播出

      因瀏陽煙花廠爆炸事故,湖南衛視多檔節目推遲播出

      新京報
      2026-05-08 13:40:08
      14歲神童手搓發動機被曝造假!漏洞百出吹上天,普通人拿什么比?

      14歲神童手搓發動機被曝造假!漏洞百出吹上天,普通人拿什么比?

      社會日日鮮
      2026-05-08 04:18:01
      突發!美軍發動“定點打擊”,伊朗多地被炸,伊方:攻擊3艘美國軍艦,造成“重大損失”!特朗普:這只是輕輕敲打,停火還在持續

      突發!美軍發動“定點打擊”,伊朗多地被炸,伊方:攻擊3艘美國軍艦,造成“重大損失”!特朗普:這只是輕輕敲打,停火還在持續

      每日經濟新聞
      2026-05-08 07:34:08
      別碰!別吃!別養!一只就攜帶100條蟲,看到趕緊遠離

      別碰!別吃!別養!一只就攜帶100條蟲,看到趕緊遠離

      齊魯壹點
      2026-05-08 06:35:47
      澳大利亞華人家庭慘案:“尖子生”長子殺害父母和弟弟 警方:現場毛骨悚然,非常恐怖

      澳大利亞華人家庭慘案:“尖子生”長子殺害父母和弟弟 警方:現場毛骨悚然,非常恐怖

      紅星新聞
      2026-05-08 11:39:24
      娃哈哈董事長,大婚!

      娃哈哈董事長,大婚!

      家傳編輯部
      2026-05-07 22:11:46
      就在剛剛,伊朗宣布大捷:重創3艘驅逐艦,美軍士兵瘋狂掃射快艇

      就在剛剛,伊朗宣布大捷:重創3艘驅逐艦,美軍士兵瘋狂掃射快艇

      頭條爆料007
      2026-05-08 08:50:45
      大S女兒直播出圈!笑起來酒窩超像媽媽,單眼皮完美復刻汪小菲

      大S女兒直播出圈!笑起來酒窩超像媽媽,單眼皮完美復刻汪小菲

      觀魚聽雨
      2026-05-07 23:24:19
      不能失憶!人民日報平安校園:海參崴的街頭,中國孩子在為誰歡呼

      不能失憶!人民日報平安校園:海參崴的街頭,中國孩子在為誰歡呼

      瑜說還休
      2026-05-07 17:45:15
      江蘇生態環境廳工作組赴徐州調查,多部門連夜轉運黑臭水體

      江蘇生態環境廳工作組赴徐州調查,多部門連夜轉運黑臭水體

      上觀新聞
      2026-05-08 06:34:12
      三星也被“打跑了” 但先別急著慶祝

      三星也被“打跑了” 但先別急著慶祝

      看看新聞Knews
      2026-05-07 23:16:11
      賴清德“跪了”

      賴清德“跪了”

      極目新聞
      2026-05-08 08:26:23
      2026-05-08 14:36:49
      晚點LatePost
      晚點LatePost
      晚一點,好一點。商業的真相總是在晚點。《晚點LatePost》官方賬號
      3192文章數 21929關注度
      往期回顧 全部

      科技要聞

      追趕星艦:中國商業火箭離SpaceX有多遠?

      頭條要聞

      "4只皮皮蝦1035元"店主事發次日病逝 家屬:不再開業

      頭條要聞

      "4只皮皮蝦1035元"店主事發次日病逝 家屬:不再開業

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發生了

      娛樂要聞

      黃子佼獲緩刑4年,無需入獄服刑

      財經要聞

      一覺醒來,美伊又打起來了

      汽車要聞

      雷克薩斯全新純電三排SUV 全新TZ全球首發

      態度原創

      本地
      房產
      親子
      藝術
      軍事航空

      本地新聞

      用蘇繡的方式,打開江西婺源

      房產要聞

      豪擲6.8億拿地!何猷君大手筆投資三亞!

      親子要聞

      大女兒入選學校合唱團獨唱,這次挑了首英文歌,自信的樣子真亮眼

      藝術要聞

      探索施密德的油畫,感受無法抵擋的藝術魅力!

      軍事要聞

      伊朗:最高領袖穆杰塔巴全面掌控局勢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 浮妇高潮喷白浆视频| 九九热在线精品免费视频| 操碰网| 中国孕妇变态孕交xxxx| 天堂在线WWW天堂中文在线| 狠狠色狠狠色综合久久第一次| 亚洲欧美人成电影在线观看| 色偷偷一区二区无码视频| 91网在线| 国产极品美女高潮抽搐免费网站| 中文字幕wwwww| 中文韩国午夜理伦三级好看| 爆乳熟妇一区二区三区霸乳| 无遮无挡爽爽免费视频| 国内精品伊人久久久久777| 非产精品二区| 日韩中文字幕人妻一区| 亚洲国产精品一区二区成人片| 亚洲AV旡码高清在线观看| 国内少妇毛片视频| 国产av日韩av| 一一本无道中文字幕| 国产无码高清| 国产精品美女久久久久久2018| 无码人妻久久一区二区三区免费丨| 视频在线观看一区二区三区| 东北女人毛多水多牲交视频| 亚色网站| 人妻?日韩?欧美?综合?制服| 免费一级欧美在线大片| 午夜激情婷婷| 中文国产日韩欧美二视频| 欧美中文字幕无线码视频| 国产精品一久久香蕉国产线看| 狠狠综合久久综合中文88| 中文文精品字幕一区二区| 中文日韩欧美| 免费A级毛片无码免费视频120软件| 成年午夜无码AV片在线观看| 美女内射无套日韩免费播放| 99热国产在线|