5月20日凌晨,一年一度的谷歌I/O 大會開幕,依托谷歌復雜的生態系統,這又是一次讓人眼花繚亂的發布會。在兩小時的演講里,谷歌管理層輪番出場,一次性發布了數十個產品更新,官網對于主要產品的博客介紹就更新了14篇。
這次大會的核心主題是“智能體Gemini時代”,重要的發布也基本上圍繞于此——包括基座大語言模型Gemini 3.5 Flash、全模態世界模型Gemini Omni、對標OpenClaw(龍蝦)的智能體產品Gemini Spark、AI搜索引入智能體、智能體管理平臺Antigravity 2.0、智能眼鏡等等。
這次發布會的反饋呈現兩級分化,有機構算了一筆賬,這次輕量基座模型升級伴隨著運行成本的5倍上升,新模型的“性價比”可能沒那么美好。資本市場也給出了反饋,5月20日凌晨美股收盤,谷歌(GOOGL.US)跌超2%,股價收于387.66美元/股,當前總市值為4.7萬億美元。
![]()
兩大模型撐場,月活翻倍
“自上一屆 I/O 大會以來,我們見證了技術的不斷突破與飛速進展。”在開幕演講中,谷歌CEO桑達爾·皮查伊(Sundar Pichai)先拋出了一些新的數據。在去年I/O大會時,Gemini app的月活躍用戶數為4億,今天這一數字已突破9億,一年內翻倍。
兩年前,谷歌每月處理的token(詞元)量為9.7 萬億個,去年的 I/O 大會這一數字約480萬億個,到今年這一規模實現7倍增長,谷歌每月處理的token量已突破3200萬億個。
目前,谷歌旗下已有13款產品各擁有超10億的用戶規模,其中有5款產品的用戶數量超過了30 億。皮查伊稱,Gemini模型是吸引更多用戶使用的核心驅動力。
這次I/O 大會,最核心的更新仍然是Gemini模型系列。
谷歌正式發布了新一代的Gemini 3.5 Flash,官方稱這是專為快速高效的任務設計的模型——從每秒token的輸出量來看,其速度是同類模型的4倍,價格卻不到同類前沿模型的一半。
根據谷歌的數據,與Gemini 3.1 Pro相比,3.5 Flash在幾乎所有基準測試中都表現更優,尤其是編程和GDPVal 這類更接近真實經濟任務的評測。
“目前頭部的科技企業每天大約需要處理1萬億個token。如果他們選擇將其中 80% 的日常工作負載從其他前沿模型遷移到 Gemini 3.5 Flash上,每年將節省超過10億美元。”皮查伊稱。
不過,根據開發者測試,3.5 Flash能力或許處于3.0 Pro和3.1 Pro之間,且穩定性更差,重要的是API價格比上一代貴了3倍,疊加token使用量,成本也會更高。
海外評測機構Artificial Analysis發文提到,Gemini 3.5 Flash在智能指數上得分55,比3 Flash提高了 9 分,主要是智能體性能的提升和幻覺減少。3.5 Flash的token速度確實更快,但更高的token使用量和token定價,使其運行成本比3 Flash高出5倍多,比3.1 Pro高出75%。
![]()
目前3.5 Flash已經成為Gemini網頁和App的默認模型,全球同步上線,所有用戶都可以免費體驗。皮查伊同時提到,谷歌內部正在研發Gemini 3.5 Pro,該模型目前已在谷歌內部投入使用,會在下個月正式推出。
另一個備受關注的模型是Gemini Omni系列,在發布前社交媒體就已經有不少討論,谷歌對其的定義是“能夠基于任意輸入生成任意輸出模態的內容”。這一模型基于Gemini模型的推理能力,融合了Veo的視頻能力和Nano Banana的圖片能力,接近理想中的世界模型,因此“在現實世界的理解能力上實現飛躍”。
![]()
今天推出的首個系列模型Gemini Omni Flash僅支持視頻輸出能力,谷歌稱在未來會逐步擴展至圖片和文本。
從會后的信息來看,各方對Omni Flash的評價不一。有的業界人士認為表現不如預期,比不上當前行業內的頂尖視頻模型,甚至有人稱“什么也沒有修復,是資源的浪費”。也有人認為這是未來,因為當模型能夠處理任何一種模態時,智能體之間的通信方式會徹底改變。
生成能力升級后,內容來源識別也變得更重要了。針對深度偽造 (Deepfake),三年前,谷歌就推出了數字水印SynthID,現在還進一步加入了內容憑證驗證功能,幫助用戶識別內容是否AI生成,以及是否經過AI工具編輯。
谷歌表示,所有Gemini Omni生成的內容都帶有谷歌SynthID數字水印,可以被追溯到是AI生成。這些核驗功能也被直接嵌入谷歌搜索和Chrome瀏覽器中。
同時,谷歌宣布,繼去年英偉達加入之后,現在OpenAI、Kakao和ElevenLabs也將采用SynthID。只有當更多公司選擇為其AI生成的內容添加水印,這項技術才能真正起效。
一系列智能體來了
模型之下,谷歌真正想講的是智能體的故事,并上新了一系列圍繞產品的智能體。
首先是內置在Gemini app中的AI智能體Gemini Spark,這被認為是一個對標“龍蝦”的個人智能體產品,與日常使用的Workspace工具(例如 Gmail、Docs等)深度集成。它運行在谷歌Cloud的專用虛擬機上,可以全天候執行任務,即便用戶關掉電腦,Spark仍能繼續工作。
谷歌展示了幾個典型場景,比如讓Spark自動解析每月信用卡賬單,標記新增或隱藏的訂閱費用。以及指示它檢查收件箱,查看孩子學校的最新動態,提取重要截止日期,并發送每日匯總摘要。
有網友評價,以谷歌的生態系統和影響力,會讓這一產品很快就能成為每個人都能使用的“龍蝦”。谷歌是“沉睡的巨人”,一旦模型達到實用性的臨界點,Gemini與Gmail、文檔和谷歌生態系統的結合,將改變游戲。
谷歌同時宣布在搜索中也加入信息智能體 (Information Agents),用戶今年夏天將可以在搜索中創建這類智能體,讓它持續跟蹤某類信息。例如,用戶可以讓它監控股票、長期跟蹤租房信息、球鞋聯名和商品上新等等。
面向開發者,谷歌升級了開發和管理 AI 智能體集群的綜合平臺,推出了Antigravity 2.0。這是一款能作為智能體交互核心樞紐的獨立桌面應用,谷歌在該平臺內置了進一步優化的Flash版本,稱其響應速度達到了其他前沿模型的12倍。
谷歌在最后分享了智能眼鏡的進展。谷歌的AI眼鏡將分成兩類:一類是帶小型鏡片的顯示眼鏡,另一類是音頻眼鏡。這兩款設備都能讓用戶解放雙手,用戶向Gemini提問即可隨時獲取支持。
![]()
谷歌表示音頻眼鏡將首先上市,計劃于今年秋季推出。眼鏡由三星參與硬件和體驗構建,Warby Parker與Gentle Monster負責眼鏡設計。
發布會上,演示者展示了一些典型場景:比如可以通過眼鏡讓Gemini導航到上周和朋友見面的地方,中途加入咖啡店;也可以讓 Gemini打開DoorDash自動下單咖啡。
在以上發布之后,谷歌隨之調整了Gemini的訂閱價。谷歌AI Ultra此前的訂閱價格是250美元/月,這次谷歌將Ultra拆分成兩個價位段——首先推出每月100美元的新Ultra計劃,適配開發人員、技術主管、知識工作者和高級創作者,同時把最高檔Ultra訂閱降至200美元。谷歌的Pro訂閱則維持在19.99美元/月。
回看這些發布,面向智能體時代,谷歌的更新覆蓋了模型、智能體、硬件、平臺等等,幾乎亮出了所有的牌。然而,與去年Gemini 3帶來的顛覆性沖擊相比,今年這場發布會更像是穩步迭代而非“變革”。
性價比存疑、業界反饋分化……或許谷歌應該聽聽用戶的聲音,畢竟AI競賽已經是一場關于成本、生態與商業模式的綜合較量。但生態協同優勢會是谷歌未來的看點,擁有全球最大的搜索引擎,也有郵箱、文檔、云服務等等,這張生態之網,是其他對手難以復制的護城河。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.