![]()
作者 | 華衛
北京時間5月20日凌晨1點,谷歌一年一度的I/O開發者大會準時開幕。
在發布新品前,谷歌 CEO Sundar Pichai 展示了一個驚人的數據:每月處理3.2千萬億個token。“兩年前,我們在各個平臺每月處理約 9.7 萬億個token。去年的 I/O 大會上,這一數字增長到了大約 480 萬億個token。快進到今天,這個數字又跳升了 7 倍,每月超過 3.2 千萬億個token。”
短短一年增幅達7倍。而這些token,代表著谷歌用戶、開發者與客戶正在解決的各類問題。據透露,去年I/O大會時擁有4億月活躍用戶的Gemini應用,如今已突破9億,一年內翻了一番多。截至目前,Nano Banana 圖像生成模型已生成超過500億張圖像。
“還有大量潛在的生產力等待被釋放。“Pichai 稱。而這次的I/O發布,“智能體”可謂是重頭戲。幾乎所有的重磅新品,都是圍繞智能體去迭代和更新的。
Gemini 3.5登場,
徹底改變谷歌內部工作方式
Gemini 3.5 Flash 是此次 I/O 最值得開發者關注的發布,被稱為谷歌“迄今為止最強大的智能體和編碼模型”。在多項智能體和編碼基準測試中得分均高于Gemini 3.1 Pro,運行速度比其他前沿型號快 4 倍。
對于這款模型,Pichai特意強調了兩點。
第一,與 3.1 Pro相比,3.5 Flash 在幾乎所有基準測試中表現更佳。它在編碼能力上取得了巨大進步,尤其是 GDPVal 的飛躍非常顯著,反映了許多現實世界中具有經濟價值的任務。在Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和MCP Atlas(83.6%)等具有挑戰性編碼和代理基準測試上的表現優于Gemini 3.1 Pro,并在多模態理解方面領先(CharXiv Reasoning為84.2%)。
第二,Gemini 3.5 Flash 在多個維度上提供可媲美大型旗艦機型的智能性能,但速度仍然非常快。以每秒輸出token數計算,它比其他前沿模型快4倍。
![]()
此外,Gemini 3.5 Flash的另一個驚人之處在于,它以不到可比前沿模型一半的成本提供前沿級能力。“我們聽說許多公司在五月就已經超出了年度token預算。如果公司能夠將 Flash 與其他前沿模型混合使用,就可以節省大量成本。舉個例子,頂尖公司每天處理約 1 萬億個token。如果他們將 80% 的工作負載從其他前沿模型切換到 3.5 Flash,每年可節省超過 10 億美元。這是真實的節省,可以再投入到公司的發展中。”Pichai表示。
過去一年,AI編程工具的市場是Cursor、Claude Code、GitHub Copilot三家在爭。Google在這個賽道幾乎缺席。有消息說,Gemini團隊在編程方面掙扎了一段時間。這次的Gemini 3.5 系列,就像是谷歌最新的正面回應。
今天起,Gemini 3.5 Flash 在谷歌的所有產品和 API 上向所有人開放。
“新模型在谷歌內部徹底改變了我們的工作方式。”Pichai 表示,他們一直在將 3.5 Flash 與重新構想的以智能體為核心的開發平臺 Antigravity 一起使用,顯著加快了開發速度。“3月,我們在內部 AI 開發工具中每天處理約 5000 億個token,之后每隔幾周就翻一倍。現在,我們每天處理的token數量已經超過 3 萬億。如此規模創造了強大的反饋循環,幫助我們不斷改進 3.5。”
下個月,谷歌預計推出Gemini 3.5 Pro。據悉,谷歌在內部已經在使用它,其顯示出很大的改進。
Gemini Omni:
將你的想法轉化成電影視頻
大會上,谷歌隆重推出新模型Gemini Omni,能夠從任意輸入生成任意輸出模態的樣本。這一新模型將 Gemini 的智能與生成式媒體模型結合在一起,在現實世界理解上實現了巨大的飛躍。通過Omni,用戶可以將圖片、音頻、視頻和文本作為輸入結合,生成基于Gemini真實世界知識的高質量視頻,也可以通過對話輕松編輯視頻。
“借助世界模型,人工智能正從預測文本轉向模擬現實。我們一直在努力突破這些模型的邊界。”Pichai 表示,Gemini Omni將從視頻輸出開始,隨后會支持圖像和文本。
今日起,谷歌將正式上線Omni系列的Flash版本,可以在Gemini應用、Google Flow和YouTube Shorts上試用,未來幾周通過API向開發者和企業客戶推廣。
據介紹,Gemini Omni 的特別之處是讓視頻編輯變得更簡單,只需自然語言,可以修改特定事物或者改動整個場景,還可以修改環境、角度、風格,甚至具體細節,同時始終保持原始場景的連貫性。并且,每條指令都可以在前一條的基礎上繼續操作,角色保持一致,物理規律得以維持,場景也記得之前發生的事情。
除了構建逼真的場景,Gemini Omni 還能推理接下來應該發生什么。它可以將對物理規律的直覺理解與 Gemini 對歷史、科學和文化背景的知識結合起來,實現從照片級真實到有意義故事講述的跨越。Omni 還能利用 Gemini 的知識,將語言、圖像和意義聯系起來,其能力遠超簡單的模式匹配。
不過,所有用Omni制作的視頻都包含肉眼幾乎察覺不到的SynthID數字水印,用戶可以通過Gemini應用、Chrome中的Gemini和Google搜索輕松驗證視頻是否是用Gemini Omni生成的。
兩款智能體加持
Gemini應用更“實用”了
對于Gemini應用來說,這一年是豐收的一年。去年在谷歌I/O大會上,Gemini服務了4億用戶。如今,每月有超過9億人在230個國家、70多種語言中向Gemini尋求幫助。
據介紹,Gemini應用來新增了兩個智能體功能。首先是晨間摘要智能體Daily Brief ,它基于近期 Google Labs 實驗 CC 的成功經驗,讓用戶可以無縫、直觀地進入 AI 智能體的世界。一旦你選擇加入,Gemini 會在后臺跨你已連接的應用運行。它會從 Gmail 收件箱收集緊急更新,從日歷跟蹤即將發生的事件,并將相關的后續信息整理成一份易于瀏覽的簡報。
而且,Daily Brief 的功能遠超簡單的摘要。它會根據你的具體目標主動組織和優先排序內容,甚至會建議你立即可采取的下一步行動。你還可以通過簡單的“點贊”或“點踩”反饋來引導它的行為,使其越用越懂你。今天起,Daily Brief 開始向美國的 Google AI Plus、Pro 和 Ultra 用戶推出。
谷歌還推出了 Gemini Spark,這是一款全天候 24/7 個人 AI 智能體,標志著 Gemini 的一次重大轉變:從一個可以回答問題的助手,升級為一個可以在用戶的指示下實際完成工作、成為主動合作伙伴的智能體。
“我對 Gemini Spark 特別興奮。它是 Gemini 應用中的個人 AI 智能體,可以幫助你管理數字生活,根據你的指令代你執行操作。”Pichai 表示。
據介紹,Gemini Spark 基于 Gemini 3.5 并使用 Antigravity 框架,與你日常依賴的 Workspace 工具(如 Gmail、Docs、Slides 等)深度集成。更棒的是,因為它是基于云的智能體,即便你關閉筆記本或鎖屏手機,Spark 也會在后臺持續工作。這意味著 Spark 可以承擔復雜任務,讓你騰出時間專注于最重要的事情。
使用 Gemini Spark,你可以設置重復任務或觸發器,自動解析每月信用卡賬單,標記新增或隱藏的訂閱費用;教它新技能,讓它定期檢查孩子學校的郵件更新,提取關鍵截止日期,并將每日匯總簡報發送給你和你的伴侶。創建完整工作流,讓它整合郵件和聊天中的會議原始記錄,生成整理好的 Google Docs 文檔,甚至起草啟動項目的配套郵件。
這僅僅是開始, Gemini Spark有豐富的功能路線圖。今天,谷歌擴展了 Gemini 連接應用列表,通過 MCP 新增了 Canva、OpenTable 和 Instacart 的連接。未來幾周,Spark 將可以利用這些 MCP 連接完成更多任務。之后,谷歌還將增加新能力,包括通過短信和郵件與 Spark 互動、創建自定義子智能體以及操作本地瀏覽器。
據悉,Spark 會完全在用戶的指揮下運行。用戶可以選擇是否啟用它,以及連接哪些應用;在執行高風險操作(如花費資金或發送郵件)前,它會先征求確認。Gemini Spark 本周將向受信任測試者推出,計劃下周向美國 Google AI Ultra 用戶推出 Beta 版本。
25年來搜索最大升級
AI帶來新紀元
同時, 谷歌帶來了 25 年來 Search 框的最大升級:全面 AI 化。
“隨著我們進入這個智能體時代,搜索將比以往任何時候都更有幫助和強大。”Pichai 說道。據介紹,谷歌在 Search 中引入了信息智能體。這些是用戶可以設置的個性化 AI 智能體,它們可以在后臺全天候工作,在你最需要的時候找到信息,并幫助你執行操作。據介紹,信息智能體將在今年夏天逐步推出,首先面向 Google AI Pro 和 Ultra 用戶。
“我們構建真正智能體化 Search 的另一種方式是賦予其智能體編程能力。”現在,Gemini 3.5 Flash已經成為全球用戶在 Google 搜索 AI 模式下的全新默認模型。“憑借 Gemini 3.5 Flash 和 Google Antigravity 的強大能力,Search 可以為用戶的每個問題創建個性化體驗,例如動態布局和交互式可視化。這些生成式 UI 功能將在今年夏天向所有用戶免費開放。”
對于需要長期持續處理的任務,Search 還能更進一步創建持久化、定制化的儀表盤或追蹤器,用戶可以隨時返回并繼續操作,可以把它們看作是為特定任務定制的迷你應用。未來幾個月,用戶將能夠在 Search 中使用 Antigravity 構建個性化體驗,首批面向美國的 Google AI Pro 和 Ultra 用戶。
另外,谷歌還致力于讓用戶與 Search 的對話更簡單順暢。用戶可以直接在 AI 概覽界面提出后續問題,并通過 AI 模式進行連續的對話交流。上下文信息會隨你保留,隨著深入探索,相關鏈接和參考文章也會變得更加精準,這個無縫體驗已在全球桌面和移動端上線。
從今天起,新的智能 Search 框開始在所有支持 AI 模式的國家和語言中逐步推出。
聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。
會議推薦
Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?
AICon 上海站 2026,13 大重磅專題已上線,誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.