作者 | 萬(wàn)連山
數(shù)據(jù)支持 | 勾股 大數(shù) 據(jù)(www.gogudata.com)
谷歌正在押下史上規(guī)模最大的賭注之一:計(jì)劃今年投入1750億-1850億美元搞基建。
其中,60%用于剛剛在拉斯維加斯舉辦的Google Cloud Next大會(huì)上亮相的第八代TPU,史無(wú)前例地拆分成了兩款:專攻模型訓(xùn)練的TPU 8t,專攻推理的TPU 8i。
40%用于搭建支持智能體運(yùn)行的數(shù)據(jù)中心和網(wǎng)絡(luò)架構(gòu)。
這一切,都是為了迎接即將到來的“智能體時(shí)代”。
![]()
01
“前智能體時(shí)代”的交互模式是,用戶寫一堆復(fù)雜的提示詞,AI生成內(nèi)容。
然后呢?
具體用這些內(nèi)容做什么、怎么用,都由用戶自己執(zhí)行。
AI只負(fù)責(zé)動(dòng)嘴,真正干活的還是人。
人→AI→人,這是三個(gè)環(huán)節(jié)。
進(jìn)入智能體時(shí)代后,AI就不再是單純的被動(dòng)應(yīng)答聊天工具,而是具備了感知、推理、調(diào)用工具并采取行動(dòng)的實(shí)用工具。
簡(jiǎn)單來說,它擁有執(zhí)行能力,乃至執(zhí)行權(quán)。
環(huán)節(jié)只剩人→AI,極大提升了生產(chǎn)效率。
兩者本質(zhì)上是“被動(dòng)工具”與“主動(dòng)生產(chǎn)力”的區(qū)別。
所以,為什么要斥巨資研發(fā)這玩意?
因?yàn)橹悄荏w是目前唯一能帶來非線性人效提升的方案。
![]()
前沿模型智能體目前能以80%的可靠性自主完成的任務(wù)長(zhǎng)度,來源:METR
僅看本次展示的其中幾個(gè)行業(yè):
1.金融。
高盛CTO分享了基于Gemini Enterprise和TPU 8i算力集群打造的內(nèi)部智能體“GS-Alpha”。
它每天實(shí)時(shí)監(jiān)控全球45000個(gè)新聞源、1200場(chǎng)上市公司的財(cái)報(bào)電話會(huì)議(直接聽音頻,文本轉(zhuǎn)錄有延遲)。
一旦某家公司CEO在電話會(huì)里的語(yǔ)氣出現(xiàn)異常的停頓或猶豫(語(yǔ)音情感分析),GS-Alpha會(huì)在0.2秒內(nèi)完成多步邏輯推理,自動(dòng)生成一份風(fēng)險(xiǎn)預(yù)警報(bào)告,并直接通過API向交易系統(tǒng)下達(dá)對(duì)沖指令。
據(jù)高盛披露的數(shù)據(jù),這套系統(tǒng)上線后,其投研部門的數(shù)據(jù)處理通量提升了1400%,研報(bào)的平均生成時(shí)間從48小時(shí)壓縮到了3分鐘。
2.醫(yī)療。
梅奧診所展示了最新的“Med-Agent”工作流。
當(dāng)一個(gè)疑難雜癥患者入院時(shí),Med-Agent會(huì)自動(dòng)調(diào)取患者過去15年的電子病歷,同時(shí)調(diào)用醫(yī)學(xué)影像分析模型,結(jié)合最新的醫(yī)學(xué)期刊數(shù)據(jù)庫(kù)自動(dòng)拉起一個(gè)“專家智能體會(huì)診”。
內(nèi)科智能體、外科智能體、病理科智能體在系統(tǒng)內(nèi)進(jìn)行相互辯論,最終給提供三個(gè)帶有明確置信度和文獻(xiàn)引用的治療方案。
根據(jù)《柳葉刀》2月針對(duì)40家大型醫(yī)院的研究數(shù)據(jù),采用Med-Agent輔助的科室,誤診率降低了31%,醫(yī)生每天花在“寫病歷和查資料”上的行政時(shí)間減少了65%。
3.跨境電商。
歐美知名家居電商Wayfair通過接入Vertex AI,打造了一個(gè)龐大的數(shù)字孿生供應(yīng)鏈智能體。
它連接了全球3000多個(gè)供應(yīng)商、80個(gè)海運(yùn)港口和150個(gè)倉(cāng)儲(chǔ)中心的實(shí)時(shí)API。
比如在1月底,智能體通過抓取當(dāng)?shù)匦侣労蜕缃幻襟w情感分析,第一時(shí)間檢測(cè)到孟加拉國(guó)即將發(fā)生大規(guī)模罷工。
為了避免全棉床單斷貨,它不需要等待企業(yè)人工審批……直接向越南的備用工廠發(fā)送了緊急加單郵件;并自動(dòng)調(diào)用馬士基的物流API,修改三個(gè)集裝箱的航線;同時(shí)自動(dòng)登錄亞馬遜和自家官網(wǎng)后臺(tái),將現(xiàn)有全棉床單的售價(jià)上調(diào)12%,以平滑庫(kù)存消耗。
根據(jù)Deloitte發(fā)布的《全球供應(yīng)鏈數(shù)字化轉(zhuǎn)型報(bào)告》,全面采用這類自主智能體的零售企業(yè),其庫(kù)存周轉(zhuǎn)率平均提升了45%,因供應(yīng)鏈斷裂導(dǎo)致的缺貨損失降低了73%。。
顯然,對(duì)企業(yè)而言,智能體不止是“降本增效”這么簡(jiǎn)單,更能解決曾經(jīng)無(wú)解的痛點(diǎn)。
它能做到人做不到的事。
根據(jù)Gartner在3月最新發(fā)布的《企業(yè)級(jí)AI智能體落地與ROI追蹤白皮書》:
截至2026年第一季度,全球500強(qiáng)企業(yè)中,已有82%在核心業(yè)務(wù)流程中部署了至少一個(gè)具備“自主執(zhí)行能力”的智能體,而這個(gè)數(shù)字在2024年底僅為11%;部署基于多智能體系統(tǒng)的企業(yè),平均投資回報(bào)期從2025年的14個(gè)月,斷崖式下降到4.5個(gè)月。
截至2025年末,谷歌專門針對(duì)企業(yè)客戶的Gemini Enterprise,僅僅推出幾個(gè)月,就賣出了超過800萬(wàn)個(gè)付費(fèi)席位。
2026年Q1,其Gemini API的日均調(diào)用量達(dá)到了1200億次。其中,包含“工具調(diào)用”和“多步推理”的復(fù)雜智能體請(qǐng)求占比,從去年的不到15%飆升至68%。
這方面的需求,是毋庸置疑的,而且其爆發(fā)期才剛剛開始。
但是,困境也很明顯。
![]()
IDC預(yù)測(cè)2031年中國(guó)將存在3.5億個(gè)活躍智能體,來源:開源證券
02
智能體系統(tǒng)引入了多步推理、外部API工具調(diào)用、記憶機(jī)制。
要支撐大量智能體同時(shí)并發(fā)工作、且不能有明顯的延遲卡頓,企業(yè)內(nèi)部系統(tǒng)的API請(qǐng)求量必然呈指數(shù)級(jí)爆發(fā)。
Gartner的報(bào)告指出,2025年有40%的企業(yè)級(jí)AI項(xiàng)目失敗,并不是因?yàn)槟P筒粔蚵斆鳎且驗(yàn)椤八懔θ嚒睂?dǎo)致智能體超時(shí)崩潰。
如果沒有底層硬件的突破,智能體的大規(guī)模落地根本就是空中樓閣。
谷歌的底層算力架構(gòu)必須要升級(jí)。
首先是硬件方面。
第八代TPU被史無(wú)前例地拆分成了兩款截然不同的芯片:專攻模型訓(xùn)練的TPU 8t,專攻推理的TPU 8i。
前者還是經(jīng)典的大力出奇跡產(chǎn)品,采用了“雙計(jì)算芯粒 + 單I/O芯粒”的設(shè)計(jì),單個(gè)超級(jí)計(jì)算節(jié)點(diǎn)可以集成9600塊芯片,計(jì)算性能達(dá)到121 Exaflops(百億億次浮點(diǎn)運(yùn)算)。相比去年發(fā)布的第七代,同等價(jià)格下的性能提升了2.8倍,每瓦性能提升了124%。
后者的作用,則是應(yīng)付海量智能體并發(fā)時(shí)的極端低延遲要求。
在AI推理中,算力往往不是瓶頸,把數(shù)據(jù)從內(nèi)存搬到處理器的過程才是最耗時(shí)、最耗能源的,俗稱內(nèi)存墻。
為了突破這堵墻,TPU 8i上內(nèi)置了高達(dá)384MB的SRAM,容量是上一代的三倍,同時(shí)還外掛了288GB的HBM顯存。
這意味著模型在運(yùn)行時(shí)的活躍工作集可以完全塞進(jìn)芯片內(nèi)部,幾乎不需要去外部要數(shù)據(jù),處理器空閑等待時(shí)間銳減。
其次是軟件生態(tài)。
這次Next大會(huì)上,谷歌推出了統(tǒng)一的AI技術(shù)堆棧,升級(jí)了Vertex AI平臺(tái),甚至拋出了Google Antigravity平臺(tái)這個(gè)大殺器。
Antigravity是一個(gè)專門為開發(fā)者打造的構(gòu)建自主智能體的全棧工具鏈。
以前開發(fā)一個(gè)Agent,開發(fā)者需要自己寫代碼去接各種API、設(shè)計(jì)長(zhǎng)短期記憶庫(kù)、規(guī)劃執(zhí)行邏輯。
現(xiàn)在,谷歌把這些全打包成了基礎(chǔ)設(shè)施,開發(fā)者可以像搭樂高一樣,輕松構(gòu)建具備任務(wù)規(guī)劃、工具調(diào)用能力的AI應(yīng)用。
不過,這也引發(fā)了一個(gè)問題。
還是對(duì)SaaS行業(yè)的擔(dān)憂。
![]()
SaaS基本面惡化,來源:浙商證券
如果AI Agent能自己拉數(shù)據(jù)、寫報(bào)表、發(fā)郵件,那企業(yè)干嘛還要給員工買Salesforce、Workday或者Excel的訂閱席位?
沒有了這些,SaaS公司還有什么存在的必要?
皮查伊拋出了一個(gè)數(shù)據(jù)安撫市場(chǎng):“頭部95%的SaaS公司,已經(jīng)在采用Gemini來重構(gòu)業(yè)務(wù)。”
未來的SaaS公司將不再單純出售軟件系統(tǒng),而是將其轉(zhuǎn)化為底層的數(shù)據(jù)API,直接賣給谷歌或客戶的AI智能體。
這就催生了一個(gè)龐大的新興業(yè)務(wù):數(shù)據(jù)現(xiàn)代化改造。
智能體再怎么聰明,首先它得有數(shù)據(jù)。
企業(yè)買單的前提是,智能體能讀取企業(yè)內(nèi)部的私有數(shù)據(jù)。但很多大型企業(yè)的ERP、CRM系統(tǒng)老舊不堪,根本就沒有標(biāo)準(zhǔn)的API接口。
也就是說,谷歌不僅在賣智能體服務(wù),還在利用這波機(jī)會(huì),強(qiáng)迫企業(yè)把所有底層數(shù)據(jù)全部搬到Google Cloud的BigQuery數(shù)據(jù)庫(kù)里。
據(jù)預(yù)測(cè),每在AI上花費(fèi)1美元,將帶動(dòng)至少3美元的底層數(shù)據(jù)清洗和云存儲(chǔ)需求。
這是真正的“連環(huán)收割”盈利路線。
03
當(dāng)TPU 8t在日以繼夜地訓(xùn)練更聰明的大腦,當(dāng)TPU 8i在數(shù)據(jù)中心里以光速處理海量的推理請(qǐng)求時(shí),世界的規(guī)則已經(jīng)被悄然改寫。
隨著智能體大量投入應(yīng)用,AI再也不是為人賦能的工具,而是真正成為可以替代人的執(zhí)行者。
在這種情況下,絕大部分企業(yè)其實(shí)沒有選擇。
你不用,你的對(duì)手用怎么辦?
最原始的生存法則一定會(huì)使得智能體在企業(yè)端的需求得到完全釋放。
最終,必然會(huì)造成兩個(gè)顯而易見的后果。
首先,市場(chǎng)格局進(jìn)一步兩極分化。
智能體的研發(fā)和部署,都需要海量的資金、技術(shù)和人才,少數(shù)巨頭通過加大投入掌控智能體的核心技術(shù)和基礎(chǔ)設(shè)施,將進(jìn)一步擴(kuò)大自己的優(yōu)勢(shì);而中小企業(yè),只能在前者構(gòu)建的生態(tài)中,從事一些細(xì)分領(lǐng)域的工作,很難再形成競(jìng)爭(zhēng)力。
其次,誰(shuí)來買單?
不難想象,隨著智能體深度應(yīng)用,每一個(gè)消費(fèi)者都能得到極致的專屬智能服務(wù),享受更舒適便捷的生活。
但是,為這些服務(wù)買單的財(cái)富,從哪里來?(全文完)
格隆匯聲明:文中觀點(diǎn)均來自原作者,不代表格隆匯觀點(diǎn)及立場(chǎng)。特別提醒,投資決策需建立在獨(dú)立思考之上,本文內(nèi)容僅供參考,不作為任何實(shí)際操作建議,交易風(fēng)險(xiǎn)自擔(dān)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.