<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      成本低20倍速度高10倍,“芯片即模型”打破GPU神話?(附論文原文)

      0
      分享至

      兩天前,AI芯片創業公司 Taalas 發布了一篇頗具宣言意味的文章:《The Path to Ubiquitous AI》(《通往無處不在的 AI 之路》,原文附后)


      核心觀點只有一句話:AI 要真正普及,必須解決兩個問題,延遲和成本。

      該文指出,如今的AI基礎設施正在走向一種“數據中心+電廠”的畸形路徑。

      房間大小的服務器、數百千瓦功耗、液冷系統、HBM堆疊、復雜封裝、成公里長的電纜。

      這被認為不是AI的終局。

      因為真正普及的技術,必須變得更簡單、更快、更便宜。

      為此,Taalas提出一個極端方向,為每一個模型,生產專用芯片。

      也就是說,不搞通用 GPU,而是“模型即芯片”。

      為此, Taalas 開發了一個平臺,可以將任何 AI 模型轉化為定制硅芯片。“從收到一個全新的模型開始,只需兩個月,就能將其硬件化”。

      據介紹,Taalas的核心開發理念有三點,即極致專用化、計算與存儲融合,及激進簡潔。

      他們發布的首款產品,是硬編碼的 Llama 3.1 8B,性能表現十分搶眼。

      據介紹,該產品由 24 人團隊完成,僅花費 3000 萬美元。


      比如,17,000 tokens/秒、接近現有方案 10 倍速度、成本降低約 20 倍、功耗降低約 10 倍……

      Taalas由此還提出“即時 AI”的概念。

      一些資深開發者在 X 上的發帖,“17000 tokens/s…,等待模型思考的時代結束了”。


      Basecamp 創始人 DHH 試用后稱,“感覺像作弊一樣快”。

      半導體行業投資人 Pierre Lamond 稱,團隊做芯片的經驗業內頂級,認為他們的方向能 1000倍成本改善,從而推動AI成為基礎設施級能力。

      Cambrian-AI首席分析師 Karl Freund 在 Forbes 專欄里稱,早期用戶把它的性能形容為“insane(瘋狂)”。


      他指出,如果被大規模數據中心采用,可能會改變行業格局。


      Freund 的擔憂是,每個模型一顆芯片,那么模型升級是否意味著換硬件?數據中心是否愿意承擔這種不靈活?

      因此他認為,模型即芯片方向很有吸引力,但能否成為主流還說不好。

      行業媒體 Financial Express分析指出,這種架構更適合穩定、高規模、單模型場景,在多模型頻繁迭代環境中可能受限。

      而目前大模型的狀態,更顯然是后者。

      但如果未來進入一個“少數基礎模型長期統治”的階段,那GPU是否仍是最優解?

      盡管有所爭議,但Taalas在 AI 基礎設方向與架構的探索值得反思。

      比如,這是否意味著AI算力可能發生第三次的路線分裂?

      第一次分裂,是 CPU → GPU。
      深度學習爆發后,通用CPU迅速被淘汰。并行計算取代串行計算,成為基礎設施底座。

      NVIDIA 憑借GPU完成市值躍遷,成為AI時代最大贏家。

      第二次分裂,是自建GPU → AI 云。

      模型越來越大,企業越來越難自己部署,算力被抽象為API。

      GPU不再只是硬件,而成為云服務的一部分。

      亞馬遜Web Services、微軟 Azure、谷歌 Cloud 、阿里云、字節火山云等,成為 AI 基礎設施代名詞。

      第三次分裂,會不會是 Taalas 提出的,模型即芯片?

      不再依賴HBM、復雜封裝,也不依賴液冷,不是“更強GPU”,而是“推理專用ASIC的極端版本”。

      或者,更本質的,Taalas 路線真正可能改變的,是AI的邊際成本曲線?

      以下為Taalas博文原文

      《通往無處不在的 AI 之路》

      作者:Ljubisa Bajic

      許多人相信,AI 確實已經進入真正可用的階段。在一些狹窄領域,它的表現已經超過人類。如果使用得當,它將成為前所未有的人類創造力與生產力放大器。

      但它的大規模普及仍然受到兩個關鍵障礙的限制:高延遲和天文級成本。

      與語言模型的交互速度遠遠跟不上人類思考的節奏。編程助手可能要思考幾分鐘,這會打斷程序員的心流狀態,限制人與 AI 的高效協作。而自動化的智能體應用需要的是毫秒級響應,而不是按人類節奏慢慢輸出。

      在成本方面,部署現代模型需要巨大的工程投入和資本支出:占據整間房間的超級計算機,耗電數百千瓦,依賴液冷、先進封裝、堆疊內存、復雜 I/O,以及成公里的線纜。這最終擴展為城市規模的數據中心園區和配套網絡,帶來極高的運營成本。

      雖然當下的趨勢似乎指向一個由數據中心和電廠構成的“反烏托邦未來”,但歷史往往走向另一條路。過去的技術革命,往往始于笨重而夸張的原型,隨后被更實用的突破所取代。

      例如 ENIAC——一個充滿真空管和電纜、占據整間房間的龐然大物。它讓人類第一次見識到計算的魔力,但速度慢、成本高、無法擴展。晶體管的出現帶來了快速演進:從工作站、個人電腦到智能手機,最終實現了無處不在的計算,世界并沒有被 ENIAC 式機器所淹沒。

      通用計算之所以進入主流,是因為它變得易于制造、速度更快、成本更低。

      AI 也必須走同樣的道路。

      關于 Taalas

      成立于兩年半前,Taalas 開發了一個平臺,可以將任何 AI 模型轉化為定制硅芯片。從收到一個全新的模型開始,只需兩個月,就能將其硬件化。

      由此生成的“硬核模型”(Hardcore Models),在速度、成本和功耗方面,相比軟件實現提升一個數量級。

      Taalas 的工作基于三大核心原則:


      1. 極致專用化

      在計算發展史上,深度首款產品由 24 人團隊完成專用化始終是關鍵任務實現極致效率的最佳路徑。

      AI 推理是人類面臨過的最重要計算負載之一,也是最適合專用化的領域。

      其計算需求推動一個方向:為每一個模型生產最優的專用芯片。


      2. 存儲與計算融合

      現代推理硬件受到一個人為分割的限制:內存與計算分離,而且運行速度完全不同。

      這種分離源于一個長期矛盾:

      DRAM 密度更高、成本更低,但訪問片外 DRAM 的速度比片上內存慢數千倍;而計算芯片又無法采用 DRAM 工藝制造。

      這種分割帶來了現代推理硬件的大量復雜性:先進封裝、HBM 堆疊、巨大的 I/O 帶寬、不斷上升的功耗,以及液冷系統。

      Taalas 打破了這一邊界。通過在單芯片上統一存儲與計算,并達到 DRAM 級密度,其架構實現了前所未有的性能水平。


      3. 激進簡化

      通過消除存儲與計算的分離,并為每個模型定制芯片,Taalas 從第一性原理重新設計了整個硬件棧。

      結果是一個不依賴復雜或前沿工藝的系統:無需 HBM、先進封裝、3D 堆疊、液冷或高速 I/O。

      工程上的簡潔,帶來了系統總成本數量級的下降。

      首批產品


      基于上述理念,Taalas 打造了全球最快、成本和功耗最低的推理平臺。

      目前發布的首款產品,是一個硬編碼的 Llama 3.1 8B 模型,既提供聊天演示,也提供推理 API 服務。

      這款硅基 Llama 實現:

      • 每用戶 17K tokens/秒

      • 接近當前最先進方案的 10 倍速度

      • 構建成本降低 20 倍

      • 功耗降低 10 倍


      之所以選擇 Llama 3.1 8B,是因為它體積適中且開源,便于快速硬化部署。

      雖然模型為速度進行了大量硬編碼,但仍支持可配置上下文窗口,并通過 LoRA 進行微調。

      第一代芯片采用自定義 3-bit 基礎數據類型,并結合 3-bit 與 6-bit 量化,因此在質量上相較 GPU 基準略有下降。

      第二代硅平臺將采用標準 4-bit 浮點格式,在保持高性能的同時改善質量問題。

      即將推出的模型

      第二個模型將是一個中型推理型 LLM,仍基于第一代 HC1 平臺,預計今年春季進入實驗室并很快上線服務。

      隨后,將基于第二代 HC2 平臺制造一個前沿級模型。HC2 具有更高密度和更快執行速度,計劃于冬季部署。

      即時 AI,觸手可及

      首個模型并非最前沿,但團隊仍以 Beta 形式發布,希望開發者體驗:當 LLM 推理達到亞毫秒級速度、接近零成本時,會帶來什么可能性。

      他們相信,這將使許多此前不可行的應用成為現實,并鼓勵開發者探索新的應用場景。

      關于團隊與方法

      Taalas 的核心團隊規模很小,成員多為合作超過二十年的長期伙伴。團隊增長緩慢,重視專業能力、使命一致性和工程紀律。

      • 實質重于聲勢

      • 工藝重于規模

      • 嚴謹重于冗余


      在許多深科技創業公司依靠龐大團隊、巨額融資和市場聲量“圍城式推進”的環境中,Taalas 選擇的是一次精準打擊。

      首款產品由 24 人團隊完成,僅使用 3000 萬美元(總融資超過 2 億美元)。這證明:明確目標與專注執行,可以勝過蠻力投入。

      未來,團隊將持續開放迭代,盡早發布系統,讓開發者參與驗證與完善。

      結語

      創新始于對既有假設的質疑,以及對被忽視路徑的探索,這正是 Taalas 選擇的方向。

      他們的技術在性能、能效和成本上實現了躍遷式提升,并代表一種不同于主流的架構理念——重新定義 AI 系統的構建與部署方式。

      真正的顛覆性技術,最初往往并不熟悉。團隊將致力于推動行業理解并采用這一新范式。

      從硬編碼的 Llama 開始,并快速擴展到更強模型,Taalas 正在消除 AI 普及的兩大核心障礙:高延遲與高成本。

      他們已經把即時、超低成本的智能交到開發者手中,現在,期待看到人們將用它創造什么。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      36歲英年早逝!長跑名將訓練中離世,曾在上海馬拉松創紀錄奪冠

      36歲英年早逝!長跑名將訓練中離世,曾在上海馬拉松創紀錄奪冠

      全景體育V
      2026-05-12 20:09:31
      退休黨員別再亂交黨費了!2026標準已明確,不少人白交多年冤枉錢

      退休黨員別再亂交黨費了!2026標準已明確,不少人白交多年冤枉錢

      笑熬漿糊111
      2026-05-13 00:05:16
      江特電機:從已探明礦區儲量統計,公司合計持有或控制的鋰礦資源量在1億噸以上

      江特電機:從已探明礦區儲量統計,公司合計持有或控制的鋰礦資源量在1億噸以上

      每日經濟新聞
      2026-05-12 21:02:08
      哈登一夜狂刷7大歷史紀錄!36歲仍封神,騎士真賺翻,奪冠有望

      哈登一夜狂刷7大歷史紀錄!36歲仍封神,騎士真賺翻,奪冠有望

      錢說體育
      2026-05-12 12:54:02
      什么時候讓你意識到這就是命,考公四次落榜,隨便報個東大就中了

      什么時候讓你意識到這就是命,考公四次落榜,隨便報個東大就中了

      夜深愛雜談
      2026-05-11 07:41:40
      切爾西·漢德勒自曝2010年愛潑斯坦晚宴細節:8人小聚,她當面調侃伍迪·艾倫

      切爾西·漢德勒自曝2010年愛潑斯坦晚宴細節:8人小聚,她當面調侃伍迪·艾倫

      影視情報室
      2026-05-12 06:05:35
      麻省理工發現:喚醒孩子自律最快的方法,竟是飛輪效應!

      麻省理工發現:喚醒孩子自律最快的方法,竟是飛輪效應!

      戶外阿毽
      2026-05-10 19:24:43
      太囂張!日本公然發射進攻導彈,中方不再容忍,直接亮劍反擊

      太囂張!日本公然發射進攻導彈,中方不再容忍,直接亮劍反擊

      觀察者小海風
      2026-05-11 11:35:37
      我的天吶!這屋里的味道,隔著屏幕都覺得嗆

      我的天吶!這屋里的味道,隔著屏幕都覺得嗆

      老吳教育課堂
      2026-05-13 03:12:10
      新聞人物|美國總統唐納德·特朗普

      新聞人物|美國總統唐納德·特朗普

      新華社
      2026-05-12 21:05:05
      錢更難掙了!送面條老板哭訴每天送貨量減半,旁邊一大排店面空置

      錢更難掙了!送面條老板哭訴每天送貨量減半,旁邊一大排店面空置

      火山詩話
      2026-05-12 13:45:35
      趙露思曼谷演唱會爆了,清純人設碎了一地,大家到底在氣什么?

      趙露思曼谷演唱會爆了,清純人設碎了一地,大家到底在氣什么?

      情感大頭說說
      2026-05-13 05:06:47
      敗光5千萬后,超市打工、不敢見人!馬蓉澳洲落魄現狀,令人唏噓

      敗光5千萬后,超市打工、不敢見人!馬蓉澳洲落魄現狀,令人唏噓

      牛鍋巴小釩
      2026-05-12 12:54:30
      快速入睡無成癮!又一國產安眠新藥即將落地,3億失眠人有解了?

      快速入睡無成癮!又一國產安眠新藥即將落地,3億失眠人有解了?

      思思夜話
      2026-05-12 16:51:58
      廣東休賽期恐重組:或續約奎因2人,打包焦泊喬,交易追逐2名國手

      廣東休賽期恐重組:或續約奎因2人,打包焦泊喬,交易追逐2名國手

      二哥聊球
      2026-05-12 11:26:52
      女子碩士入學清華后參與智力測驗,僅得25分,回應:無論是學習、工作、創業,我都沒有遇到困難,但我居然智力中下

      女子碩士入學清華后參與智力測驗,僅得25分,回應:無論是學習、工作、創業,我都沒有遇到困難,但我居然智力中下

      揚子晚報
      2026-05-11 07:48:21
      西甲歐冠5席位全出爐!貝蒂斯時隔20年再參賽,26歲安東尼終圓夢

      西甲歐冠5席位全出爐!貝蒂斯時隔20年再參賽,26歲安東尼終圓夢

      我愛英超
      2026-05-13 05:38:11
      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      夜深愛雜談
      2026-02-21 21:37:02
      廣東5人合同到期!杜潤旺+2小將或留隊,王少杰租借到期買斷嗎?

      廣東5人合同到期!杜潤旺+2小將或留隊,王少杰租借到期買斷嗎?

      籃球資訊達人
      2026-05-13 01:31:06
      原來風婆婆這么美,40年前光顧著看猴了,根本沒注意

      原來風婆婆這么美,40年前光顧著看猴了,根本沒注意

      喜文多見01
      2026-04-09 15:31:01
      2026-05-13 08:11:00
      AI先鋒官 incentive-icons
      AI先鋒官
      AIGC大模型及應用精選與評測
      506文章數 74關注度
      往期回顧 全部

      科技要聞

      谷歌劇透安卓重大升級 Gemini深度集成底層

      頭條要聞

      凱文·沃什出任美聯儲主席 其岳父是特朗普總統的老友

      頭條要聞

      凱文·沃什出任美聯儲主席 其岳父是特朗普總統的老友

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      健康
      教育
      游戲
      藝術
      軍事航空

      干細胞能讓人“返老還童”嗎

      教育要聞

      600分以下想要本科就業,如何報志愿

      曝PS6或將被迫縮減內存規格 以應對零部件漲價

      藝術要聞

      這位女攝影師的航拍風景照片,簡直太美了!

      軍事要聞

      知情人士披露:美國或考慮恢復對伊朗軍事行動

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产交换配乱婬视频| 内射毛片内射国产夫妻| 亚洲AV综合色无码国产精品四季| 野外久久久久久无码人妻| 日本成人有码在线视频| 在线高清亚洲精品二区| 亚洲美女高清无水av| 中文有码亚洲制服av片 | 国内精品国产三级国产99| 国产日韩亚洲大尺度高清| 欧美亚洲香蕉| 亚洲性激情| av男人的天堂在线观看国产| 亚洲国产欧美日韩一区二区| 在线精品免费视频无码的| 人人爽人人爽人人爽人人片av| 国产高清在线精品一区| 欧美一级一级做性视频| 国产顶级熟妇高潮xxxxx| www国产精品内射老师| 人人澡超碰碰97碰碰碰| 亚洲欧美日本全免费| 免费人妻无码不卡中文18禁| 欧洲一区二区中文字幕| 粗大大国产欧美| blued视频免费观看片| 国产美女人喷水在线观看| 亚洲精品国产精品制服丝袜| 囗一交一一性一交| 亚洲国产长腿丝袜av天堂| 女同另类激情在线三区| 99久久精品国产第一页| 午夜高清国产拍精品福利| 午夜被窝网| 岛国大片视频在线播放| 福利一区福利二区在线| 中文人妻无码一区二区三区信息| 超碰人人超碰| 亚洲三区在线观看内射后入| 国产成+人综合+亚洲专区| 黑人又粗又大xxx精品|