網易首頁 > 網易號 > 正文申請入駐

英偉達，迎來一堆挑戰者

2026-05-04 10:53:53　來源: 半導體行業觀察

上海舉報

分享至

公眾號記得加星標??，第一時間看推送不會錯過。

在人工智能分散化的世界中，英偉達既可以是朋友，也可以是敵人。

人工智能的應用正迎來轉折點，其關注點從訓練新模型轉向服務現有模型。對于那些渴望從英偉達手中分一杯羹的人工智能初創公司來說，現在是千載難逢的機會。

與訓練相比，推理的工作負載更加多樣化，這為芯片初創公司開辟了新的市場空間。大規模批量推理所需的計算能力、內存和帶寬組合與人工智能助手或代碼代理截然不同。

因此，推理變得越來越多樣化，其中某些方面可能更適合 GPU 和其他更專業的硬件。

英偉達去年12月斥資200億美元收購Groq就是一個典型的例子。這家初創公司采用大量SRAM的芯片架構，這意味著只要數量足夠，Groq的LPU就能比任何GPU更快地生成代幣。然而，由于其有限的計算能力和老化的芯片技術，它們的擴展效率并不高。

Nvidia通過將推理管道中計算密集型的預填充部分轉移到其 GPU 來規避這個問題，同時將帶寬受限的解碼操作保留在其嶄新的 LPU 上。

這種組合并非英偉達獨有。GTC大會結束后一周，AWS也發布了自己的解耦計算平臺，該平臺使用其定制的Trainium加速器進行預填充，并使用Cerebras Systems的餐盤大小的晶圓級加速器進行解碼。

就連英特爾也加入了這場狂歡，宣布了一項參考設計，該設計將使用 GPU（大概是他們在去年北半球秋季預告的那款）進行預填充，并使用 AI 芯片初創公司 SambaNova 的新型 RDU進行解碼。

到目前為止，大多數人工智能芯片初創公司的成功都體現在解碼方面。SRAM雖然容量不大，但速度極快。因此，只要芯片數量足夠多，或者至少像Cerebras那樣使用足夠大的芯片，它們就非常適合加速解碼操作，但芯片初創公司的應用范圍并不局限于此。

本周，Lumai詳細介紹了其光學推理加速器，該加速器使用光而不是電子來執行大多數機器學習工作負載核心的矩陣乘法運算，而功耗僅為純數字架構的一小部分。

Lumai 預計其下一代 Iris Tetra 系統到 2029 年將在 10kW 的功率預算內實現 exaOPS 的 AI 性能。

從技術上講，這些芯片采用混合電光架構，但推理過程中大部分計算是由芯片的光張量核心處理的。

該公司最初將這款芯片定位為GPU的獨立替代方案，用于計算密集型推理工作負載，例如批量處理。從長遠來看，該公司還計劃將其光加速器用作預填充處理器。

該架構仍處于起步階段，目前能夠運行像 Llama 3.1 8B 或 70B 這樣的數十億參數模型，但它已經發展到足以讓這家總部位于英國的初創公司向云新用戶和超大規模用戶開放其芯片進行評估的程度。

話雖如此，并非所有人工智能芯片初創公司都熱衷于使用不同的芯片進行預填充和解碼。本周早些時候，Tenstorrent發布了基于 RISC-V 的 Galaxy Blackhole 計算平臺，該公司首席執行官 Jim Keller 對這種分散式推理方法并不感冒。

“業內每家公司都在聯手打造加速器的加速器。CPU 運行代碼，GPU 加速 CPU，TPU 加速 GPU，LPU 加速 TPU，以此類推。這導致了復雜的解決方案，而這些方案不太可能與 AI 模型和應用的變化兼容。在 Tenstorrent，我們認為更通用、更簡單的方案會更有效。”他在一份聲明中說道。

（來源：編譯自theregister）

*免責聲明：本文由作者原創。文章內容系作者個人觀點，半導體行業觀察轉載僅為了傳達一種不同的觀點，不代表半導體行業觀察對該觀點贊同或支持，如果有任何異議，歡迎聯系半導體行業觀察。

今天是《半導體行業觀察》為您分享的第4396內容，歡迎關注。

加星標??第一時間看推送

求推薦

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

為什么是這10個詞，定義了2025年AI敘事

鈦媒體APP 2025-12-31 07:59:09
1 跟貼 1
黃仁勛喊話畢業生：AI不會取代你，但善用AI的人會

量子位 2026-05-11 14:26:58
0 跟貼 0

把服務器送上天：太空算力是破局還是泡沫？

鈦媒體APP 2026-05-12 09:31:13
0 跟貼 0

亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

大神程序員蒸餾自己，用16個skill給AI注入軟件工程之魂

量子位 2026-05-12 03:08:58
0 跟貼 0

對談樓天城：Harness會成為AI時代最關鍵的能力之一

量子位 2026-05-06 15:41:08
0 跟貼 0
安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0

AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
剛剛，Thinking Machines出手！首款交互模型來了，翁荔出鏡實測

機器之心Pro 2026-05-12 12:18:10
0 跟貼 0
地球以外的算力，馬斯克全都要

鈦媒體APP 2026-05-11 18:16:50
0 跟貼 0
北大校友Lilian Weng出鏡，爆出120億估值首個交互模型！

新智元 2026-05-12 12:37:23
1 跟貼 1
自動化替掉的不是低效員工，而是工資最高的那批

DeepTech深科技 2026-05-12 13:15:41
0 跟貼 0
英特爾具身智能機器人，竟解鎖了rap技能

機器之心Pro 2025-11-26 15:20:41
0 跟貼 0
谷歌用上中國“神器”，AI+高質量基因測序數據，讓基因變異無處隱藏

生物世界 2026-05-12 12:24:14
0 跟貼 0
ICML 2026 | 大模型內部也會長出「情緒樹」，規模越大越懂人心

機器之心Pro 2026-05-12 12:53:18
0 跟貼 0
DECS從源頭消除冗余思考，實現推理token減半且性能不降反升

機器之心Pro 2026-05-12 12:58:05
0 跟貼 0
還質疑“AI熱”？美投行：Q1財報季證明一切，下一催化劑將是英偉達！

財聯社 2026-05-12 10:44:06
1 跟貼 1
理想CTO謝炎：AI時代需要新計算架構，我想在汽車上試出來（上）

晚點LatePost 2026-05-12 00:06:13
4 跟貼 4
對話理想汽車CTO謝炎：真正認真對待軟件的人，都應該自己造硬件

雷峰網 2026-05-12 12:01:03
0 跟貼 0
一顆芯片，改寫激光雷達的下一個十年

華商韜略 2026-05-12 11:24:35
1 跟貼 1
63歲黃仁勛又當博士了！陳立武親自披袍，最新演講擊碎AI焦慮

智東西 2026-05-11 19:22:17
2 跟貼 2
敘利亞重新接入全球支付系統刷卡機“吐出”小票現場爆發掌聲

海外網 2026-05-11 13:40:32
1405 跟貼 1405
巫師3十年老游戲幀數翻三倍，民間大神整出DLSS 4.5黑科技

宇宙來信發 2026-05-11 20:04:36
0 跟貼 0
一汽修店主只修特斯拉：其他新能源車三電不修怕被告

第一財經資訊 2026-05-11 16:52:11
67302 跟貼 67302
【AI大模型安全與評測】從DeepSeek-V4拆解真實評估邏輯，90%的人都搞錯了！企業級大模型評

盧菁老師 2026-05-09 09:07:47
0 跟貼 0
美教授看傻眼：以為中國工廠在擰螺絲，沒想到芯片裝配工都用博士

提子嘮生活 2026-05-11 00:38:02
0 跟貼 0
DDR5暴漲627%的背后，AI正在“搶走”你的內存

鈦媒體APP 2026-05-12 10:47:07
2 跟貼 2
聽風的蠶：人工智能時代，美軍AI在戰爭中的應用

深藍的航跡 2026-05-11 00:33:07
0 跟貼 0
李想回應理想汽車自研芯片質疑：真不是“燒錢跟風”

CNMO科技 2026-05-12 12:06:02
2 跟貼 2
這個Harness普通人可用！

機器之心Pro 2026-04-21 15:47:04
0 跟貼 0
5月13日開幕！MDDC 2026提前劇透：全域智能體、50+大廠齊聚

雷科技 2026-05-11 20:29:14
0 跟貼 0
缸中之腦現代版：20萬人腦神經元一周學會打Doom

量子位 2026-03-06 17:34:11
0 跟貼 0
外網討論中國還有什么造不出來？

狗剩小白菜 2026-05-11 12:55:32
0 跟貼 0
澳大利亞網友：這太棒了，沒想到今天會和一首紅歌產生共鳴

俄羅斯安娜 2026-05-09 00:20:58
10 跟貼 10
美國四連出擊，中國強勢鎖喉，最好的防守就是出擊

高小愛生活 2026-05-12 09:31:39
0 跟貼 0
女子快速路上發現1米多大蛇爬行

荔枝新聞 2026-05-12 00:24:18
131 跟貼 131

手機 / 數碼

房產 / 家居

英偉達，迎來一堆挑戰者

納德拉法庭爆料：拒當“AI時代的IBM”

媒體:內塔尼亞胡稱十年擺脫美軍援 揭示中東之亂本質

媒體:內塔尼亞胡稱十年擺脫美軍援 揭示中東之亂本質

梁靖崑：可能是最后一屆了，想讓大家記住這個我

劉濤曬媽祖誕辰活動照 評論區變許愿池

特朗普要來了，我們且淡定

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

態度原創

@所有家長，2026年山東智慧家長學院家庭教育宣傳周精彩主題活動搶先看！

微軟報告引發市場爭議：Windows電腦比MacBook Neo更勝一籌？

紅魔官宣11S Pro系列游戲手機行業唯一搭載風水雙冷散熱

專家：女性生育力“余額”無聲流失，35歲后呈斷崖式下降

特朗普：伊朗的回應“完全不可接受”

媒體:內塔尼亞胡稱十年擺脫美軍援揭示中東之亂本質

媒體:內塔尼亞胡稱十年擺脫美軍援揭示中東之亂本質

劉濤曬媽祖誕辰活動照評論區變許愿池

吉利銀河“TT”申報圖曝光電動尾翼+激光雷達