網易首頁 > 網易號 > 正文申請入駐

Gemini 3.5深夜登場，谷歌CEO劈柴親自算賬：速度快4倍、一年還省超10億美元，曝內部已被顛覆

2026-05-20 05:32:05　來源: AI前線

北京舉報

分享至

作者 | 華衛

北京時間5月20日凌晨1點，谷歌一年一度的I/O開發者大會準時開幕。

在發布新品前，谷歌 CEO Sundar Pichai 展示了一個驚人的數據：每月處理3.2千萬億個token。“兩年前，我們在各個平臺每月處理約 9.7 萬億個token。去年的 I/O 大會上，這一數字增長到了大約 480 萬億個token。快進到今天，這個數字又跳升了 7 倍，每月超過 3.2 千萬億個token。”

短短一年增幅達7倍。而這些token，代表著谷歌用戶、開發者與客戶正在解決的各類問題。據透露，去年I/O大會時擁有4億月活躍用戶的Gemini應用，如今已突破9億，一年內翻了一番多。截至目前，Nano Banana 圖像生成模型已生成超過500億張圖像。

“還有大量潛在的生產力等待被釋放。“Pichai 稱。而這次的I/O發布，“智能體”可謂是重頭戲。幾乎所有的重磅新品，都是圍繞智能體去迭代和更新的。

Gemini 3.5登場，

徹底改變谷歌內部工作方式

Gemini 3.5 Flash 是此次 I/O 最值得開發者關注的發布，被稱為谷歌“迄今為止最強大的智能體和編碼模型”。在多項智能體和編碼基準測試中得分均高于Gemini 3.1 Pro，運行速度比其他前沿型號快 4 倍。

對于這款模型，Pichai特意強調了兩點。

第一，與 3.1 Pro相比，3.5 Flash 在幾乎所有基準測試中表現更佳。它在編碼能力上取得了巨大進步，尤其是 GDPVal 的飛躍非常顯著，反映了許多現實世界中具有經濟價值的任務。在Terminal-Bench 2.1（76.2%）、GDPval-AA（1656 Elo）和MCP Atlas（83.6%）等具有挑戰性編碼和代理基準測試上的表現優于Gemini 3.1 Pro，并在多模態理解方面領先（CharXiv Reasoning為84.2%）。

第二，Gemini 3.5 Flash 在多個維度上提供可媲美大型旗艦機型的智能性能，但速度仍然非常快。以每秒輸出token數計算，它比其他前沿模型快4倍。

此外，Gemini 3.5 Flash的另一個驚人之處在于，它以不到可比前沿模型一半的成本提供前沿級能力。“我們聽說許多公司在五月就已經超出了年度token預算。如果公司能夠將 Flash 與其他前沿模型混合使用，就可以節省大量成本。舉個例子，頂尖公司每天處理約 1 萬億個token。如果他們將 80% 的工作負載從其他前沿模型切換到 3.5 Flash，每年可節省超過 10 億美元。這是真實的節省，可以再投入到公司的發展中。”Pichai表示。

過去一年，AI編程工具的市場是Cursor、Claude Code、GitHub Copilot三家在爭。Google在這個賽道幾乎缺席。有消息說，Gemini團隊在編程方面掙扎了一段時間。這次的Gemini 3.5 系列，就像是谷歌最新的正面回應。

今天起，Gemini 3.5 Flash 在谷歌的所有產品和 API 上向所有人開放。

“新模型在谷歌內部徹底改變了我們的工作方式。”Pichai 表示，他們一直在將 3.5 Flash 與重新構想的以智能體為核心的開發平臺 Antigravity 一起使用，顯著加快了開發速度。“3月，我們在內部 AI 開發工具中每天處理約 5000 億個token，之后每隔幾周就翻一倍。現在，我們每天處理的token數量已經超過 3 萬億。如此規模創造了強大的反饋循環，幫助我們不斷改進 3.5。”

下個月，谷歌預計推出Gemini 3.5 Pro。據悉，谷歌在內部已經在使用它，其顯示出很大的改進。

Gemini Omni：

將你的想法轉化成電影視頻

大會上，谷歌隆重推出新模型Gemini Omni，能夠從任意輸入生成任意輸出模態的樣本。這一新模型將 Gemini 的智能與生成式媒體模型結合在一起，在現實世界理解上實現了巨大的飛躍。通過Omni，用戶可以將圖片、音頻、視頻和文本作為輸入結合，生成基于Gemini真實世界知識的高質量視頻，也可以通過對話輕松編輯視頻。

“借助世界模型，人工智能正從預測文本轉向模擬現實。我們一直在努力突破這些模型的邊界。”Pichai 表示，Gemini Omni將從視頻輸出開始，隨后會支持圖像和文本。

今日起，谷歌將正式上線Omni系列的Flash版本，可以在Gemini應用、Google Flow和YouTube Shorts上試用，未來幾周通過API向開發者和企業客戶推廣。

據介紹，Gemini Omni 的特別之處是讓視頻編輯變得更簡單，只需自然語言，可以修改特定事物或者改動整個場景，還可以修改環境、角度、風格，甚至具體細節，同時始終保持原始場景的連貫性。并且，每條指令都可以在前一條的基礎上繼續操作，角色保持一致，物理規律得以維持，場景也記得之前發生的事情。

除了構建逼真的場景，Gemini Omni 還能推理接下來應該發生什么。它可以將對物理規律的直覺理解與 Gemini 對歷史、科學和文化背景的知識結合起來，實現從照片級真實到有意義故事講述的跨越。Omni 還能利用 Gemini 的知識，將語言、圖像和意義聯系起來，其能力遠超簡單的模式匹配。

不過，所有用Omni制作的視頻都包含肉眼幾乎察覺不到的SynthID數字水印，用戶可以通過Gemini應用、Chrome中的Gemini和Google搜索輕松驗證視頻是否是用Gemini Omni生成的。

兩款智能體加持

Gemini應用更“實用”了

對于Gemini應用來說，這一年是豐收的一年。去年在谷歌I/O大會上，Gemini服務了4億用戶。如今，每月有超過9億人在230個國家、70多種語言中向Gemini尋求幫助。

據介紹，Gemini應用來新增了兩個智能體功能。首先是晨間摘要智能體Daily Brief ，它基于近期 Google Labs 實驗 CC 的成功經驗，讓用戶可以無縫、直觀地進入 AI 智能體的世界。一旦你選擇加入，Gemini 會在后臺跨你已連接的應用運行。它會從 Gmail 收件箱收集緊急更新，從日歷跟蹤即將發生的事件，并將相關的后續信息整理成一份易于瀏覽的簡報。

而且，Daily Brief 的功能遠超簡單的摘要。它會根據你的具體目標主動組織和優先排序內容，甚至會建議你立即可采取的下一步行動。你還可以通過簡單的“點贊”或“點踩”反饋來引導它的行為，使其越用越懂你。今天起，Daily Brief 開始向美國的 Google AI Plus、Pro 和 Ultra 用戶推出。

谷歌還推出了 Gemini Spark，這是一款全天候 24/7 個人 AI 智能體，標志著 Gemini 的一次重大轉變：從一個可以回答問題的助手，升級為一個可以在用戶的指示下實際完成工作、成為主動合作伙伴的智能體。

“我對 Gemini Spark 特別興奮。它是 Gemini 應用中的個人 AI 智能體，可以幫助你管理數字生活，根據你的指令代你執行操作。”Pichai 表示。

據介紹，Gemini Spark 基于 Gemini 3.5 并使用 Antigravity 框架，與你日常依賴的 Workspace 工具（如 Gmail、Docs、Slides 等）深度集成。更棒的是，因為它是基于云的智能體，即便你關閉筆記本或鎖屏手機，Spark 也會在后臺持續工作。這意味著 Spark 可以承擔復雜任務，讓你騰出時間專注于最重要的事情。

使用 Gemini Spark，你可以設置重復任務或觸發器，自動解析每月信用卡賬單，標記新增或隱藏的訂閱費用；教它新技能，讓它定期檢查孩子學校的郵件更新，提取關鍵截止日期，并將每日匯總簡報發送給你和你的伴侶。創建完整工作流，讓它整合郵件和聊天中的會議原始記錄，生成整理好的 Google Docs 文檔，甚至起草啟動項目的配套郵件。

這僅僅是開始， Gemini Spark有豐富的功能路線圖。今天，谷歌擴展了 Gemini 連接應用列表，通過 MCP 新增了 Canva、OpenTable 和 Instacart 的連接。未來幾周，Spark 將可以利用這些 MCP 連接完成更多任務。之后，谷歌還將增加新能力，包括通過短信和郵件與 Spark 互動、創建自定義子智能體以及操作本地瀏覽器。

據悉，Spark 會完全在用戶的指揮下運行。用戶可以選擇是否啟用它，以及連接哪些應用；在執行高風險操作（如花費資金或發送郵件）前，它會先征求確認。Gemini Spark 本周將向受信任測試者推出，計劃下周向美國 Google AI Ultra 用戶推出 Beta 版本。

25年來搜索最大升級

AI帶來新紀元

同時，谷歌帶來了 25 年來 Search 框的最大升級：全面 AI 化。

“隨著我們進入這個智能體時代，搜索將比以往任何時候都更有幫助和強大。”Pichai 說道。據介紹，谷歌在 Search 中引入了信息智能體。這些是用戶可以設置的個性化 AI 智能體，它們可以在后臺全天候工作，在你最需要的時候找到信息，并幫助你執行操作。據介紹，信息智能體將在今年夏天逐步推出，首先面向 Google AI Pro 和 Ultra 用戶。

“我們構建真正智能體化 Search 的另一種方式是賦予其智能體編程能力。”現在，Gemini 3.5 Flash已經成為全球用戶在 Google 搜索 AI 模式下的全新默認模型。“憑借 Gemini 3.5 Flash 和 Google Antigravity 的強大能力，Search 可以為用戶的每個問題創建個性化體驗，例如動態布局和交互式可視化。這些生成式 UI 功能將在今年夏天向所有用戶免費開放。”

對于需要長期持續處理的任務，Search 還能更進一步創建持久化、定制化的儀表盤或追蹤器，用戶可以隨時返回并繼續操作，可以把它們看作是為特定任務定制的迷你應用。未來幾個月，用戶將能夠在 Search 中使用 Antigravity 構建個性化體驗，首批面向美國的 Google AI Pro 和 Ultra 用戶。

另外，谷歌還致力于讓用戶與 Search 的對話更簡單順暢。用戶可以直接在 AI 概覽界面提出后續問題，并通過 AI 模式進行連續的對話交流。上下文信息會隨你保留，隨著深入探索，相關鏈接和參考文章也會變得更加精準，這個無縫體驗已在全球桌面和移動端上線。

從今天起，新的智能 Search 框開始在所有支持 AI 模式的國家和語言中逐步推出。

聲明：本文為 AI 前線整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

Agent 從 Demo 到工程化還差什么？安全與可信這道坎怎么過？研發體系不重構，還能撐多久？

AICon 上海站 2026，13 大重磅專題已上線，誠摯邀請你登臺分享實戰經驗。AICon 2026，期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.