<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      挑戰(zhàn)英偉達(dá)算力霸權(quán)?多倫多一家創(chuàng)企將大模型“刻進(jìn)”芯片

      0
      分享至

      在硅谷當(dāng)下的宏大敘事中,算力即權(quán)力。

      英偉達(dá)的 GPU 似乎成了通往AGI唯一且昂貴的門票。當(dāng)整個(gè)行業(yè)都在狂熱地堆疊“更大、更貴、更耗電”的 GPU 集群時(shí),一種極具顛覆性的底層技術(shù)叛逆卻在暗處悄然發(fā)生。



      近日,一家成立不到三年、位于多倫多的初創(chuàng)公司 Taalas 拋出了一個(gè)讓半導(dǎo)體與 AI 業(yè)界側(cè)目的方案:他們將 Meta 的 Llama 大模型直接“硬連線”(Hardwired)進(jìn)了 ASIC(專用集成電路)芯片。 這并非一次常規(guī)的硬件制程升級,而是一場物理層面的暴力重構(gòu)。

      由Tenstorrent前聯(lián)合創(chuàng)始人Ljubisa Bajic帶隊(duì)的這群工程師,不再依賴昂貴的HBM顯存,拋棄了液冷:模型不再是以軟件代碼的形式運(yùn)行在通用硬件上,也不再需要頻繁地從高帶寬顯存(HBM)中吞吐成百上千 GB 的權(quán)重?cái)?shù)據(jù)。Llama 龐大的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)十億參數(shù),被直接固化進(jìn)物理電路,成為了芯片本身——芯片即模型,模型即芯片。

      在這塊采用臺積電6納米工藝、面積達(dá)815平方毫米的芯片上,單用戶運(yùn)行Llama 3.1 8B的推理吞吐達(dá)到了令人瞠目的17,000 tokens/秒。作為對比,這個(gè)速度是英偉達(dá)最頂尖GPU的數(shù)十倍,是人類閱讀或思考速度的成百上千倍。生成一部詳盡的二戰(zhàn)逐月編年史,僅需0.138秒。

      這一反常識的技術(shù)路線,究竟是打破算力瓶頸的終極突破,還是無視模型迭代規(guī)律的“刻舟求劍”?

      一、歷史的鐘擺:天下苦“內(nèi)存墻”久矣

      Taalas 之所以做如此激進(jìn)的嘗試,是因?yàn)楫?dāng)前 AI 產(chǎn)業(yè)有一個(gè)隱疾:內(nèi)存墻(Memory Wall)。

      自計(jì)算機(jī)誕生以來,統(tǒng)治整個(gè)行業(yè)的基石是“馮·諾依曼架構(gòu)”,其設(shè)計(jì)中就存在計(jì)算與存儲分離的特點(diǎn):需要計(jì)算時(shí),就從后臺把數(shù)據(jù)搬運(yùn)到舞臺上,算完再搬回去。



      在模型只有幾兆、幾十兆的時(shí)代,這個(gè)架構(gòu)運(yùn)轉(zhuǎn)良好。但是,當(dāng)大語言模型膨脹到幾百億、上千億參數(shù)時(shí),這一經(jīng)典架構(gòu)正在成為最大的絆腳石。GPU 運(yùn)行大模型進(jìn)行推理時(shí),它并沒有把大部分精力花在計(jì)算上,而是被迫變成了一個(gè)疲于奔命的“搬運(yùn)工”——海量的模型權(quán)重?cái)?shù)據(jù)需要在顯存和計(jì)算單元之間來回穿梭,高達(dá) 80% 的功耗和延遲都浪費(fèi)在了這種數(shù)據(jù)的物理搬運(yùn)上。這不僅造就了英偉達(dá)龐大的護(hù)城河,也直接捧紅了價(jià)格極其昂貴的 HBM 存儲芯片。AI行業(yè)苦“內(nèi)存墻”久矣,它讓 AI 推理的成本居高不下,讓數(shù)據(jù)中心變成了吞噬電力的巨獸。

      Taalas 的 ASIC 路線,本質(zhì)上是對這筆“算力稅”的徹底逃避。當(dāng)模型權(quán)重不再是以數(shù)據(jù)的形式存在于內(nèi)存中,而是變成了固化的晶體管開閉狀態(tài),數(shù)據(jù)搬運(yùn)的動作就在物理層面上被抹除了。

      二、絕對速度與“電子牛馬”:商業(yè)落地的場景價(jià)值

      Taalas打破內(nèi)存墻帶來的最直接后果,是成本和能效比的恐怖斷層。



      傳統(tǒng)的GPU數(shù)據(jù)中心是名副其實(shí)的“電老虎”,動輒需要液冷伺候。而Taalas的HC1芯片,單顆功耗僅約250W。即使部署10顆芯片,總功耗不過2.5千瓦,僅靠常規(guī)的空氣冷卻就能穩(wěn)定運(yùn)行。根據(jù)Taalas官方及業(yè)界測算,其百萬Token的推理成本僅為0.0075美元左右,是傳統(tǒng)GPU方案的二十分之一甚至更低。在“唯快不破”和“降本增效”成為行業(yè)鐵律的今天,這組數(shù)據(jù)的沖擊力毋庸多言。

      從工程學(xué)的角度來看,這顯然是一次驚人的效率躍升;而在模型快速迭代的今天,一個(gè)不能更新、不能運(yùn)行其他模型的芯片,聽起來顯然又像個(gè)笑話。但是,如果我們跳出“打造全知全能AGI”的宏大敘事,將目光投向海量的商業(yè)垂直場景,也許會發(fā)現(xiàn),這種“固化”非但不是缺陷,反而可能是某些場景下的最優(yōu)解。

      在真實(shí)的商業(yè)世界里,并非所有場景都需要一個(gè)通曉量子力學(xué)、能寫莎士比亞十四行詩的GPT5甚至更新的模型。大部分場景需要的,是一個(gè)極其穩(wěn)定、便宜、速度極快且不需要休息的“電子牛馬”。



      想象一下工業(yè)流水線上的毫秒級殘次品視覺識別、智能汽車?yán)镄枰^對零延遲響應(yīng)的端側(cè)語音中樞、數(shù)以億計(jì)的家用陪伴機(jī)器人或兒童玩偶……在這些場景中,企業(yè)根本不在乎你能否兼容最新的大模型框架,他們在乎的是:能不能用幾美分的成本,把手頭這件特定的任務(wù)做到光速?

      Taalas的HC1,正好可以解決這種“規(guī)模化單一任務(wù)”。當(dāng)17,000 tokens/秒的速度應(yīng)用在語音助手上,AI的回答將比人類的神經(jīng)反射還要快,“等待LLM思考”的轉(zhuǎn)圈動畫將徹底成為歷史。一個(gè)原本需要幾百瓦功率、必須插在液冷服務(wù)器上的大模型,未來也許只需幾瓦的電量,就能被輕易塞進(jìn)一臺掃地機(jī)器人、一部智能手機(jī),甚至是一副輕薄的AI眼鏡中。真正的“萬物皆 AI”,也只有在算力和功耗被極度壓縮后才可能實(shí)現(xiàn)。

      三、刻舟求劍的隱憂:被“凍結(jié)”在芯片里的智慧

      盡管如此,鑒于當(dāng)前 AI 算法一日千里的演進(jìn)速度,Taalas 的路線極具風(fēng)險(xiǎn)的另一面也是不容忽視的。將流動的軟件代碼固化為冰冷的物理電路,意味著犧牲了靈活性。這里有兩個(gè)極其尖銳的現(xiàn)實(shí)錯(cuò)位。

      首先是迭代周期的錯(cuò)位。如今,開源大模型的進(jìn)化是以“月”甚至“周”為單位的。但一顆先進(jìn)制程的芯片,從架構(gòu)設(shè)計(jì)、流片到最終量產(chǎn),通常需要 18 到 24 個(gè)月。而當(dāng)它走下產(chǎn)線時(shí),它所“凍結(jié)”的 Llama 模型,在日新月異的算法世界里,是否已經(jīng)淪為一個(gè)落后的“古董”?

      再者是容錯(cuò)率的錯(cuò)位。大模型如果出現(xiàn)嚴(yán)重的幻覺或安全漏洞,可以通過微調(diào)或推送 OTA 補(bǔ)丁來迅速修復(fù)。但是,一塊已經(jīng)刻好物理電路的芯片該怎么打補(bǔ)丁呢?一旦芯片內(nèi)固化的模型存在致命缺陷,整批昂貴的芯片大概率只能淪為硅垃圾。



      對于這些致命的商業(yè)風(fēng)險(xiǎn),Taalas也給出了他們的防守策略。首先是微調(diào)的保留, HC1雖然鎖死了基礎(chǔ)權(quán)重,但依然保留了對低秩自適應(yīng)(LoRA)微調(diào)的支持。這意味著企業(yè)可以在物理大模型的外部,外掛小型的“知識補(bǔ)丁”來調(diào)整特定任務(wù)的表現(xiàn)。其次是極速的物理迭代,Taalas CEO 透露,改變模型并不需要重新設(shè)計(jì)整個(gè)底層硅片,而只需更改芯片最上層的兩層金屬層。這種制造工藝的創(chuàng)新,將新模型的硬件化周期壓縮到了驚人的兩個(gè)月,從而幫助模型實(shí)現(xiàn)小幅迭代。

      縱然如此,這依然是一場與時(shí)間賽跑的豪賭。在這場博弈中,Taalas試圖用硬件的極致靜態(tài),去捕捉 AI 算法的極致動態(tài),不可避免地帶有一些“刻舟求劍”的悲壯色彩。

      四、蝴蝶效應(yīng):誰在戰(zhàn)栗,誰在狂歡?

      盡管局限性很明顯,但Taalas這種“模型即芯片”的路線的面世,依然撕開了英偉達(dá)絕對壟斷帝國的一道裂痕。

      英偉達(dá)的地位,很大程度上歸功于其CUDA軟件生態(tài)。全世界的開發(fā)者都在用CUDA寫程序,這使得硬件的壁壘變成了堅(jiān)不可摧的軟件生態(tài)壁壘。但是,如果AI的盡頭不再需要軟件呢?



      Taalas的路線意味著,在推理這個(gè)占據(jù)未來AI算力90%以上份額的市場中,CUDA的護(hù)城河被徹底繞過了。模型訓(xùn)練依然離不開英偉達(dá)的GPU,但在最終落地應(yīng)用的端側(cè)和專業(yè)推理數(shù)據(jù)中心,ASIC專有芯片正在掀起一場“去英偉達(dá)化”的起義。

      另外,隨著生成式AI加速進(jìn)入商業(yè)落地,Taalas之外,Groq、Cerebras、Etched等公司也分別在極速響應(yīng)、海量吞吐、特定算法加速方面進(jìn)行著不同的探索,都有可能一點(diǎn)點(diǎn)蠶食推理市場,撼動曾經(jīng)固若金湯的英偉達(dá)帝國。

      同時(shí),存儲巨頭的狂歡也極可能降溫。目前,HBM芯片是存儲行業(yè)的超級印鈔機(jī)。但如果模型權(quán)重被內(nèi)化于電路,對龐大顯存的依賴將大幅降低。無存算分離架構(gòu)一旦普及,存儲廠商在 AI 時(shí)代的暴利預(yù)期將被大幅擠壓。

      正因如此,Taalas將大模型刻進(jìn)硅片,絕不是AI算力的終點(diǎn),在不遠(yuǎn)的未來,我們也許會看到算力市場的明顯分化:

      云端與訓(xùn)練場依然是英偉達(dá)GPU和通用加速器的天下,用于探索AGI的智力邊界,處理那些最復(fù)雜、最多變的未知任務(wù)。

      端側(cè)與流水線則是Taalas這類“物理硬化”芯片的汪洋大海,它們?nèi)缟匙影惚阋耍绻馑侔忝艚荩瑵B透進(jìn)每一個(gè)路燈、每一臺家電、每一個(gè)工業(yè)機(jī)器人中。

      甚至,當(dāng)我們把目光放得更長遠(yuǎn)一些,當(dāng)量子計(jì)算真正走向?qū)嵱茫蛘哳惸X計(jì)算實(shí)現(xiàn)突破時(shí),今天我們?yōu)榱送黄岂T·諾依曼架構(gòu)所做的所有努力,可能都會成為技術(shù)史上一次次充滿勇氣而又略顯笨拙的嘗試。

      結(jié)語:從“全能大腦”到“硬件本能”

      計(jì)算架構(gòu)的演進(jìn)從來不是單向的直線,而是螺旋上升的復(fù)調(diào)。從早期的專用打孔機(jī),到通用CPU,到專為圖形處理誕生的GPU,再到如今的AI ASIC,計(jì)算的歷史,就是在“通用靈活性”與“專用極致效率”之間不斷搖擺的過程。

      Taalas的探索,或許在今天看來略顯激進(jìn),甚至面臨“出廠即落后”的窘境,但它向我們拋出了一個(gè)極具哲學(xué)意味的產(chǎn)業(yè)命題:

      AI的終極演化形態(tài)究竟是什么?

      它是否必須永遠(yuǎn)保持像水一樣可以隨意重塑的“通用軟件大腦”?

      還是說,就像生物歷經(jīng)億萬年進(jìn)化一樣,AI 也會將其最基礎(chǔ)、最成熟的智能(比如基礎(chǔ)的視覺識別、語言邏輯解析),內(nèi)化為無需思考、極低功耗運(yùn)行的“硅基硬件本能”?



      回望科技史,任何偉大的范式轉(zhuǎn)換,往往都在非議與豪賭中誕生。

      也許,未來的 AI 計(jì)算基座并不是非此即彼。云端依然是算力磅礴的通用 GPU 集群,而在萬物互聯(lián)的終端,則是無數(shù)顆被固化了“本能”的低功耗 AI 芯片。

      當(dāng)大模型不再是云端的高嶺之花,而是變成像電阻、電容一樣廉價(jià)且隨處可見的電子元器件時(shí),AI 真正的大爆發(fā),才算真的拉開大幕。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      三大實(shí)錘!姆巴佩“兒皇夢”徹底破碎,他的心早已不在皇馬!

      三大實(shí)錘!姆巴佩“兒皇夢”徹底破碎,他的心早已不在皇馬!

      田先生籃球
      2026-05-11 09:05:47
      訪華團(tuán)落地不到7天,巴外長便公開質(zhì)問中國:嘴上尊重,骨頭很硬

      訪華團(tuán)落地不到7天,巴外長便公開質(zhì)問中國:嘴上尊重,骨頭很硬

      素衣讀史
      2026-05-11 21:54:32
      歷史不會重演,但會驚人相似:中國房地產(chǎn)很有可能重走日本老路?

      歷史不會重演,但會驚人相似:中國房地產(chǎn)很有可能重走日本老路?

      笑熬漿糊111
      2026-05-11 05:00:12
      他奉命清查康、謝罪行,73歲當(dāng)中紀(jì)委常務(wù)書記,侄女是著名歌唱家

      他奉命清查康、謝罪行,73歲當(dāng)中紀(jì)委常務(wù)書記,侄女是著名歌唱家

      舊書卷里的長安
      2026-05-11 21:04:17
      中央巡視組原副部級巡視專員許傳智,被提起公訴

      中央巡視組原副部級巡視專員許傳智,被提起公訴

      每日經(jīng)濟(jì)新聞
      2026-05-11 20:35:36
      一個(gè)人性鐵律:你和任何人的關(guān)系,不取決于你付出多少,也不取決于你的能力,更不取決于你的價(jià)值,關(guān)鍵在于這兩點(diǎn)

      一個(gè)人性鐵律:你和任何人的關(guān)系,不取決于你付出多少,也不取決于你的能力,更不取決于你的價(jià)值,關(guān)鍵在于這兩點(diǎn)

      心理觀察局
      2026-05-11 09:28:10
      特斯拉:再次突破

      特斯拉:再次突破

      新浪財(cái)經(jīng)
      2026-05-11 10:29:59
      保級懸念仍在!英超還剩最后兩輪,熱刺領(lǐng)先西漢姆聯(lián)2分

      保級懸念仍在!英超還剩最后兩輪,熱刺領(lǐng)先西漢姆聯(lián)2分

      懂球帝
      2026-05-12 05:10:18
      中方一錘定音給特朗普最高禮遇,普京通告全球:中俄關(guān)系獨(dú)一無二

      中方一錘定音給特朗普最高禮遇,普京通告全球:中俄關(guān)系獨(dú)一無二

      傾世璃歌
      2026-05-12 02:02:27
      東盟11國緊急開會,人民日報(bào)丑話說在前,別指望中國拉菲律賓一把

      東盟11國緊急開會,人民日報(bào)丑話說在前,別指望中國拉菲律賓一把

      老赳說歷史
      2026-05-12 03:06:06
      特朗普本周訪華,怎么看“中美共同的兩個(gè)敵人”?

      特朗普本周訪華,怎么看“中美共同的兩個(gè)敵人”?

      新民周刊
      2026-05-11 12:14:57
      日媒:高市借特朗普訪華想緩和中日關(guān)系,并揚(yáng)言“對華絕不妥協(xié)”

      日媒:高市借特朗普訪華想緩和中日關(guān)系,并揚(yáng)言“對華絕不妥協(xié)”

      何揎室內(nèi)設(shè)計(jì)
      2026-05-11 12:32:59
      藏不住了!熟女的運(yùn)動風(fēng)穿搭,把曲線玩明白了

      藏不住了!熟女的運(yùn)動風(fēng)穿搭,把曲線玩明白了

      只要高興就好
      2026-05-12 00:00:34
      從1-3慘敗到3-0復(fù)仇!中國足球這口惡氣,憋了整整4年

      從1-3慘敗到3-0復(fù)仇!中國足球這口惡氣,憋了整整4年

      杰絲聊古今
      2026-05-11 16:21:37
      成本暴降80%!幾百萬網(wǎng)約車司機(jī)要丟飯碗?出行巨頭血拼千億底盤

      成本暴降80%!幾百萬網(wǎng)約車司機(jī)要丟飯碗?出行巨頭血拼千億底盤

      侃故事的阿慶
      2026-05-10 08:38:19
      心理學(xué)有個(gè)殘忍真相:子女長大后不心疼你,從來不是他不懂感恩,也不是他薄情寡義,而是你早年這兩種“隱形傷害”,親手關(guān)閉他心疼人開關(guān)

      心理學(xué)有個(gè)殘忍真相:子女長大后不心疼你,從來不是他不懂感恩,也不是他薄情寡義,而是你早年這兩種“隱形傷害”,親手關(guān)閉他心疼人開關(guān)

      心理觀察局
      2026-05-07 10:05:05
      為了沖10%增長,越南賭場KTV全面松綁

      為了沖10%增長,越南賭場KTV全面松綁

      鳳眼論
      2026-05-10 22:14:23
      香港游泳名將何詩蓓官宣戀情,事業(yè)情場得意,與荷蘭隊(duì)友甜蜜出游

      香港游泳名將何詩蓓官宣戀情,事業(yè)情場得意,與荷蘭隊(duì)友甜蜜出游

      體娛一家親
      2026-05-11 21:33:10
      97年和女同事出差,賓館只剩一間房她白我一眼:你敢亂動我就報(bào)警

      97年和女同事出差,賓館只剩一間房她白我一眼:你敢亂動我就報(bào)警

      千秋文化
      2026-05-08 10:18:54
      四川家長怒了:學(xué)校別再辦成人禮了,太惡心人了

      四川家長怒了:學(xué)校別再辦成人禮了,太惡心人了

      復(fù)轉(zhuǎn)這些年
      2026-05-11 16:28:54
      2026-05-12 05:24:49
      翼言商業(yè)觀察 incentive-icons
      翼言商業(yè)觀察
      新科技,新產(chǎn)業(yè),新消費(fèi)。
      119文章數(shù) 3關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機(jī)會

      頭條要聞

      母女二人一年用水量高達(dá)400多噸 警方發(fā)現(xiàn)背后隱情

      頭條要聞

      母女二人一年用水量高達(dá)400多噸 警方發(fā)現(xiàn)背后隱情

      體育要聞

      梁靖崑:可能是最后一屆了,想讓大家記住這個(gè)我

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協(xié)商解約

      財(cái)經(jīng)要聞

      宗馥莉罷免銷售負(fù)責(zé)人 部分業(yè)務(wù)將外包

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      教育
      親子
      家居
      時(shí)尚
      藝術(shù)

      教育要聞

      課堂亂象觸目驚心,老師氣得血壓飆升,誰在一步步毀掉當(dāng)今教育?

      親子要聞

      你們都喜歡哪些科目啊?

      家居要聞

      多元生活 此處無聲

      今年夏天最流行的5雙涼鞋,配裙子絕美!

      藝術(shù)要聞

      震撼!Nicole Nodland鏡頭下的絕美時(shí)尚女神!

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 美女秘密91| 最新亚洲综合中文字幕在线| 99久久精品看国产一区| 熟女俱乐部五十路六十路AV| 亚洲精品自拍在线视频| 中国老熟妇自拍hd发布| 国产一区二区美女视频| 亚洲av乱码一区二区| 精品人妻潮喷久久久又裸又黄| 中文字幕久久波多野结衣AV| 亚洲中文字幕无码爆乳APP| 影音先锋资源| 成人国产一区二区三区| 露脸自拍啪啪白浆国语对白| 亚洲AV熟妇在线观看| 国产va免费观看| 亚洲成人免费在线| 欧美激情一区二区三区在线播放 | 精品国偷自产在线不卡短视频| 污视频在线免费观看| 日韩高清无码一卡二卡| 国产AV无码专区亚洲A√| 制服 丝袜 人妻 专区一本| 国产美女精品久久| 92成人午夜福利一区二区| 欧美人妻精品一区二区三区| 伊人久久大香线蕉AV网禁呦| 噜噜久久噜噜久久鬼88| 99久久国产综合精品女图图等你| 精品国产中文一级毛片在线看 | 色猫咪av在线网址| 亚洲精品另类有吗中文字幕| 精品少妇无码一区二区三批| 丰满少妇又爽又紧又丰满在线观看| 成人午夜电影福利免费| 亚洲成色AV网站午夜影视| 欧美中文字幕| 日韩av一二区| 97人妻成人免费视频| 熟妇人妻久久中文字幕| 无码一区中文字幕|