![]()
谷歌正在準備讓由Gemini驅動的智能體控制用戶的Mac電腦,并實現"文件整理"功能,此舉旨在與Claude Cowork展開競爭。
目前,Gemini的macOS應用主要包含兩項核心功能:一是與網頁版相似的原生聊天界面,二是可在任意界面喚出Gemini的快捷鍵。后者支持用戶將當前窗口共享給Gemini,使AI能夠獲取當前任務的視覺上下文信息。
經過團隊對應用安裝包的深入解析,谷歌似乎計劃通過引入智能體驅動的計算機操控功能,進一步擴展Gemini在Mac上的使用范圍。近期體驗過Claude Cowork的用戶對這類功能應該不陌生——該工具能夠直接接管用戶電腦,以完成特定任務。
讓我們一起高效完成工作
你正在處理什么任務?
從谷歌向Gemini智能體預設的四個示例指令中,可以較為清晰地看出其產品規劃:
將我的文件轉換為表格
掃描本地文件夾(如發票或報告),提取數據并整理至Google表格。
整理我的文件夾
找出桌面或下載文件夾中雜亂的文件,按類型或內容分類歸檔。
規范化我的文件命名
讀取文件元數據,將數百個命名混亂的文件批量重命名并整理至清晰易讀的子文件夾中。
跟進上次會議事項
獲取最近一次會議的Meet錄音文字稿或文檔筆記,并起草一封包含要點和行動項的跟進郵件。
前三個示例指令著重體現了Gemini在Mac上整理本地文件并將其導入Google Workspace應用的能力,這些都是后Claude Cowork時代的基礎生產力功能。在底層實現上,這些功能將調用屏幕訪問權限及無障礙功能,使Gemini能夠查看屏幕內容并控制鼠標和鍵盤。第四個示例指令則將重心轉向Google自有應用生態,涵蓋Meet、Docs和Gmail等服務。
綜合來看,這些示例指令表明谷歌正致力于讓Gemini代替用戶完成更多工作。值得關注的是,此次面向macOS的Gemini智能體所具備的能力范圍,似乎將超越目前在Android端已開放的功能。目前僅有少數Android設備(如Galaxy S26系列)支持用戶指揮Gemini自動執行應用內的簡單任務,例如點餐。
相比之下,谷歌顯然正準備將macOS版Gemini打造成Claude Cowork的有力競爭者。考慮到谷歌自去年Gemini 2.5 Computer Use預覽版起便已著手探索此類智能體功能,此次進展可謂姍姍來遲。對于深度依賴Google Workspace的企業用戶而言,Gemini新增的智能體功能無疑是一個令人期待的好消息。
Q&A
Q1:Gemini macOS智能體具體能做哪些文件管理操作?
A:根據谷歌預設的示例指令,Gemini macOS智能體可以掃描本地文件夾并將數據整理至Google表格、對桌面和下載文件夾中的雜亂文件進行分類歸檔、批量讀取文件元數據并重命名為規范格式,以及自動獲取會議記錄并生成跟進郵件。這些功能依托屏幕訪問權限和無障礙功能實現,使Gemini能夠直接查看屏幕內容并操控鼠標和鍵盤。
Q2:Gemini macOS智能體和Claude Cowork有什么區別?
A:兩者的核心定位相似,都具備直接接管用戶電腦、完成特定任務的能力。目前Claude Cowork已在這一領域建立了先發優勢,而谷歌則憑借與Google Workspace深度整合的優勢,將Gemini macOS智能體打造為有力的競爭產品。對于已在使用Google Workspace的企業用戶來說,Gemini智能體在會議紀要、郵件跟進等場景中的協同體驗可能更為流暢。
Q3:Gemini智能體功能在Android端和Mac端有什么差異?
A:目前Android端的Gemini智能體功能較為有限,僅支持部分設備(如Galaxy S26系列)執行應用內的簡單自動化任務,例如點餐。相比之下,谷歌為macOS版Gemini規劃的智能體能力更為全面,涵蓋本地文件管理、數據整理和Google應用聯動等多個維度,整體功能范圍明顯超越當前的Android版本。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.