出品 | 網易智能
作者 | 小小
編輯 | 王鳳枝
Google I/O今日凌晨開幕,谷歌打了兩槍。
第一槍,先打向自己。
谷歌把存在了25年的搜索框重寫了。過去,搜索的核心是把用戶帶到網頁;現在,AI直接住進搜索框里,替用戶比價、追蹤降價、生成儀表板,甚至跨商店統一結賬。搜索不再只是給鏈接,而是直接辦事。
![]()
這等于主動動搖自己的現金牛。搜索廣告長期貢獻Alphabet過半營收,但如果搜索從"給鏈接"變成"直接辦事",廣告競價和流量分發的邏輯都會被重新改寫。可谷歌沒得選。它不動手,Perplexity們會替它動。
第二槍,再打向對手。
Gemini 3.5 Flash的能力接近四個月前旗艦模型3.1 Pro的九成,速度快4倍,成本降到三分之一到一半。皮查伊在臺上算了一筆賬:一家每天跑1萬億token的企業,如果把八成工作負載切到這個模型上,一年能省10億美元。
![]()
這話不是說給極客聽的,而是說給企業CFO們聽的。
回頭看,這場I/O的核心不是"谷歌有沒有發布最強模型",而是它正在換戰場:不再只拼誰更聰明,而是拼誰更便宜、誰更能干活、誰能無處不在地嵌進用戶
今年的Google I/O,谷歌從模型到應用全面出擊。發布清單很長:Gemini 3.5 Flash模型、個人AI智能體Gemini Spark、Antigravity 2.0平臺、翻新的Gemini應用、Flow創意工具升級、視頻模型Gemini Omni(多模態輸入輸出+實時修改)、CodeMender安全智能體、智能體支付協議、第八代TPU芯片(TPU 8o/8i雙架構),以及1800億至1900億美元的年度資本支出計劃。
在所有這些發布中,最激進的一刀砍向了自己:搜索業務迎來25年來最大改版。
新的搜索框被拉長了,以適應人們向聊天機器人提問時那種更復雜、更口語化的習慣。但形態變化是表層的。真正的變化在于:AI智能體直接住進了搜索框。
搜索不僅能找到信息,還能動手做事。你搜索一個概念,它能直接生成一段解釋視頻或動態圖表,嵌入搜索結果中。谷歌在臺上演示了一個關于黑洞的搜索,智能體實時生成了解釋視頻,直接放進結果頁面。
皮查伊的說法是:新的信息智能體將全天候在后臺工作,在正確時刻找到用戶確切需要的東西,并幫助采取行動。借助Antigravity平臺的編碼能力,搜索能為用戶的個性化問題構建自定義交互體驗,視覺模擬、儀表板、跟蹤器,都能按需生成。
一個名為"生成式UI"的功能將在今年夏天上線。它根據不同回復類型(視頻、圖片、新聞)在瀏覽器中實時創建自定義布局,讓最相關的內容自動獲得最合適的呈現方式。
谷歌高級副總裁尼克·福克斯(Nick Fox)說,搜索的目標是讓你把腦海中任何問題直接扔進去,不用管格式對不對。"我們應該能夠在人們對搜索能做什么的理解上拓寬他們的視野。"今年夏天信息智能體上線后,它們會7×24在后臺監控網絡,某款產品降價了、某個你感興趣的新研究發布了,智能體會主動推送,甚至幫你預訂。
購物體驗的改變更為直觀。谷歌將推出跨商家的"通用購物車":瀏覽網頁時把不同網站的心儀商品添加進去,智能體幫你跟蹤價格變化、提示新品或新顏色。決定下單時,可以一次性結清分散在不同商店里的所有商品,使用谷歌的安全支付系統完成。當然,也可以選擇回到原始零售商網站支付。
福克斯強調:"我們非常致力于讓搜索能夠服務于全球數十億用戶。"付費訂閱用戶還能在搜索中開啟自定義儀表板,用于管理婚禮策劃或健身計劃等長期任務。
幾個數字:谷歌搜索中的AI模式月活已超10億,自推出以來每季度查詢量翻倍。AI概覽功能擁有超過25億月活。谷歌的五項核心服務(搜索、Gmail、Android、Chrome和YouTube)各自擁有超過30億用戶。
02新模型不拼參數,拼的是性價比
另一個硬核更新:Gemini 3.5 Flash。谷歌的目標很明確,打破模型越聰明就越慢、越貴的鐵律。
根據谷歌內部測試及獨立分析機構Artificial Analysis的數據,在編碼和智能體等多項基準測試中,這款模型的性能已超過四個月前的旗艦模型Gemini 3.1 Pro。具體來看:編碼和智能體任務測試Terminal-Bench 2.1得分76.2%;多模態理解測試CharXiv Reasoning達到84.2%;多模態評估MMU-Pro拿到84%的最高分,讓谷歌模型包攬該榜單前兩名。
![]()
智能體能力是Gemini系列歷史上的短板。這次,3.5 Flash的GDPval-AA分數從Gemini 3 Flash的1204和3.1 Pro的1314躍升至1656,僅略低于GPT-5.4在最高設置下的1674分。幻覺率降至61%,比Gemini 3 Flash改善了31個百分點。
![]()
AI與軟件工程師馬克·克雷奇曼(Mark Kretschmann)在體驗后指出,谷歌基本上是在說,Flash現在已經足夠強大,可以用于真正的智能體編碼工作,而不僅僅是廉價和快速的替代品。"Flash曾經意味著妥協。現在它開始看起來像是默認選擇。"
![]()
但最大的賣點不是跑分。谷歌DeepMind首席技術官兼首席AI架構師科雷·卡武克庫奧盧(Koray Kavukcuoglu)透露,團隊開發了一個更極端的優化版本,在相同質量下比競爭對手的前沿模型快12倍。這個版本從周二起在Antigravity平臺內提供。
幾個硬指標:輸出速度超過每秒280個token,比Gemini 3 Flash及多個競品快約70%;智能指數得分55,與3.1 Pro并駕齊驅,強化了谷歌在平衡速度與智能方面的一貫優勢。
規模方面:谷歌云上模型API每分鐘處理約190億個token;所有自有平臺(搜索、Gemini應用、Workspace等)每月處理超過3200萬億個token,過去一年增長七倍。皮查伊透露,超過375家Google Cloud客戶在過去12個月中每家使用了超過1萬億個token。
世界頂尖免疫學專家、AI研究者德里亞·烏努特馬茲(Derya Unutmaz)看到3.5 Flash的跑分后評論:它在編碼和代理基準中比3.1 Pro好得多,成本僅為一小部分。他迫不及待想看到3.5 Pro,認為這些升級"是一次變革性的進步"。
![]()
這個期待不無道理。谷歌確認3.5 Pro正在內部使用,下個月向公眾推出。按照每六個月一次大更新的節奏,屆時市場將看到又一次躍升。
但并非所有開發者買賬。軟件開發者艾哈邁德·阿爾內米(Ahmed AlNeaimy)在實際項目中測試后,用"BenchMaxed"來形容,認為模型被過度優化以在基準測試上刷高分,真實工作中卻頻繁出現幻覺、卡住或無限循環。
他說模型"甚至連一個任務都完不成",完全不遵循指令。在他看來,"Flash"系列就是在用較低的智能換取速度,基準成績與真實體驗之間存在落差。他建議同行不要輕信跑分,直接用實際工作去檢驗。
![]()
03 Antigravity上的實戰:從雜亂代碼庫到自制游戲
基準測試是實驗室里的體檢報告。Antigravity平臺上發生的事情更像真實的運動表現。
一個例子來自代碼維護:有開發者把一個雜亂的遺留代碼庫丟給3.5 Flash,要求遷移到Next.js框架。3.5 Flash在Antigravity中自主完成了整個過程,一堆技術債變成了結構清晰的現代項目。
![]()
內容管理場景中,3.5 Flash能根據動態標準自動重命名和分類非結構化的資產文件。一個外表失控的文件庫交給模型,它按內容類型、日期、關聯項目自動歸類,把雜亂的共享盤變成可檢索的資產庫。
![]()
谷歌還在AI Studio上展示了創意和設計場景的能力:把一篇研究論文交給3.5 Flash,它直接生成交互式動畫來闡釋核心概念,而不是返回文字摘要。把一段純文本描述變成可交互的硬件模型,能旋轉、能拆解的三維展示。
![]()
在一所學校的籌款活動策劃中,3.5 Flash并行執行多個創意方案:Logo、海報、邀請函、社交媒體文案,一次性產出完整品牌方案。在產品設計環節,60秒為一個結賬流程生成多種不同的用戶體驗方案,讓設計師快速比較和篩選方向。
![]()
這種能力溢出到了消費者端。谷歌搜索利用3.5 Flash構建了一個解釋Gyroid圖案的交互式可視化頁面。過去搜索這種抽象數學概念,結果是維基百科鏈接加幾張靜態示意圖。現在智能體實時搭建三維模型,讓用戶在瀏覽器里旋轉、縮放,直觀理解這個復雜結構。
04企業賬單一年省10億?皮查伊算了一筆token賬
速度優勢最終體現在賬單上。
皮查伊在發布會上算了一筆很具體的賬:"在谷歌云上,一家每天處理大約1萬億個token的企業,如果能將80%的工作負載從其他前沿模型遷移到Gemini 3.5 Flash上,一年可以節省超過10億美元。"他還補了一刀:"你們可能從CIO那里聽過,有些公司才到五月份就已經用完了全年的AI token預算。"
這個數字背后是殘酷的現實:AI智能體在執行多步驟任務時不斷推理、調用工具、修改代碼,消耗的token是簡單問答的幾十上百倍。3.5 Flash單價看起來比前代貴,但推理更強、處理復雜任務更高效,整體擁有成本反而顯著下降。
卡武克庫奧盧強調,谷歌主要模型更新的節奏大約是每六個月一次。一個每六個月就能以更低綜合成本超越之前旗艦的模型,從根本上改變了企業AI投資的規劃周期。
這一邏輯已在早期測試中得到驗證。
Box CEO亞倫·列維(Aaron Levie)分享了測試結果,向Box AI Agent提供各行業的常見任務,給定一組相關文檔。結果:金融服務準確率從73%升至81%,公共部門從59%升至76%,醫療保健從51%升至73%,生命科學從47%升至67%。列維的評價:"持續的性能提升真是令人難以置信。"
![]()
沃頓商學院教授伊桑·莫里克(Ethan Mollick)提前體驗后的感受:速度非常快,能力很強。他用它生成了一次性的程序化城鎮,模型在過程中犯了一個錯誤,然后自己發現并糾正了它,這種自我糾錯能力在復雜任務中尤為關鍵。
![]()
05智能體指揮中心 + AI私人管家
為了讓企業更容易部署多智能體工作流,谷歌同步發布了Antigravity 2.0,一個獨立的桌面應用,充當協調多個智能體的指揮中心。可以同時運行一個智能體編寫網站、第二個生成品牌資產、第三個規劃產品架構,所有智能體并行工作,單一界面管理。
Antigravity 2.0將谷歌內部工程師的token消耗量推到了每天3萬億個。皮查伊說,十周前這個數字還是0.5萬億,使用量"實際上每隔幾周"就翻一番。這種規模創造了強大的反饋回路,模型團隊能收集到大量真實世界信號,不斷改進模型。
支撐這一切的是巨額基礎設施。谷歌預計2026年資本支出約1800億至1900億美元,是四年前310億美元的六倍。關鍵部分是第八代TPU芯片,首次采用訓練和推理分離的雙芯片架構(TPU 8o和TPU 8i)。配合Pathways系統,模型訓練可以分布在多個數據中心,擴展到全球超過100萬個TPU,目前世界上最大的訓練集群。皮查伊說:"這意味著在幾周內訓練更大、更有能力的模型,而不用幾個月。"
基于這套既快又省的基礎設施,谷歌正式推出了Gemini Spark,一個真正意義上的個人AI智能體。
它完全在谷歌云端運行。你關掉筆記本電腦、鎖上手機,它也能在后臺繼續工作。負責該項目的谷歌副總裁喬什·伍德沃德(Josh Woodward)的形容一如既往:"就像你把事情往身后一拋,Spark就會接住并完成工作。"
![]()
獲得授權后,Spark可以連接Gmail、文檔、幻燈片等工具。你可以設定重復任務:每月自動解析信用卡賬單,標出新出現的訂閱扣款。或者創建復雜工作流:去收件箱找出孩子學校發來的所有郵件,提取重要截止日期,整合成一份摘要,發送給你和你的伴侶。
它還能學習新技能。你正在計劃一場活動,讓它綜合散落在郵件和聊天記錄里的會議筆記,整理成一份谷歌文檔,甚至起草后續溝通郵件。
安全方面,谷歌為它設定了嚴格邊界:在執行花錢、發郵件等高影響操作前,Spark會先征求明確許可。伍德沃德將這種設計比作"給青少年他們的第一張借記卡"。谷歌還宣布了智能體支付協議:用戶可設置品牌白名單、消費上限、指定商家等防護欄,智能體只能在框定范圍內代表用戶花錢。
06剩下的事:讓AI變得好玩
除了處理事務的智能體,谷歌也沒忘讓AI變得好玩。
全新的視頻生成模型Gemini Omni,能將文本、圖片、視頻等多種輸入融合,輸出電影級質量的視頻。你給它一段走過金屬雕塑的視頻,說"把雕塑變成看起來像泡泡做的",它就能直接修改視頻中的現實。谷歌強調,Omni改進了物理效果的處理,重力、動能、流體動力學,這些正是區分"看起來像AI視頻"和"看起來像真實鏡頭"的細節。每個Omni生成的視頻都帶有SynthID數字水印。
![]()
去年的Flow工具集也獲得了新能力:一張舊照片,上傳后根據人物、環境和氣氛,一次性生成16個不同的視頻片段。用鋼琴彈一小段旋律,錄下來交給Flow,它把草稿擴展成一首制作精良的歌曲。
Gemini應用做了一次徹底翻新。新的設計語言叫Neural Expressive:流暢動畫、鮮艷色彩、新字體。麥克風重新設計,允許用戶按自己的節奏講述復雜想法,不會因為"嗯""那個"等自然停頓被打斷。數據:Gemini應用月活突破9億,覆蓋230多個國家和地區,支持超過70種語言。一年前是4億。
但并非所有企業用戶都買賬。健康營銷公司Klick Health的執行副總裁西蒙·史密斯(Simon Smith)大會后表示,他的腦袋被谷歌的工具矩陣搞得"天旋地轉"。他列出一串名字(Spark、Antigravity、AI Studio、Flow、Pomelli、Pics)正是谷歌在此次I/O上展示的不同產品入口。
他向OpenAI和Anthropic喊話,請求"避免過度擴散",只給他一個能完成所有事情的強大智能體工具。但在他看來,真正的AGI不應該需要這么多界面。
![]()
結語:兩槍打完,效果還沒出來
但也有人持保留態度。X用戶TheQuantLord在大會后評論:整場I/O證實了一個判斷,谷歌并沒有引領AI,而是在迎頭追趕。3.5 Flash、智能體間通信協議A2A、模型降價、搜索中嵌入智能體,每一條公告都能在其他廠商的動作中找到先例。"真正的故事不是谷歌宣布了什么,而是他們只是在跟隨,而不是設定節奏。"
![]()
這場持續一個多小時的主題演講,落點不在任何單一產品上,而在于谷歌正在構建的一套完整敘事:AI不再比拼單純的參數,而是要成為在你背后持續運行的引擎。從搜索框到文檔編輯器再到購物車,谷歌試圖讓AI智能體成為所有服務的默認層。
但兩槍都是盲狙。
第一槍打向搜索廣告,拆了舊的,新的能不能補上,沒人知道。通用購物車和智能體訂閱的營收,能不能填上廣告流失的窟窿,要看接下來幾個季度的財報。
第二槍打向對手,便宜到讓你不換別家。但阿爾內米的實測提醒了一件事:跑分高不等于干活行。如果Flash在真實項目里頻繁翻車,企業CFO省下的10億美元可能是紙面上的。
谷歌這次沒有在"誰最強"的擂臺上繼續打。它把競爭拖進了自己選的戰場。至于這個戰場是不是它以為的樣子,過幾個月才知道。
