![]()
智東西
作者 陳駿達
編輯 心緣
智東西5月15日報道,近日,騰訊開始內測一款名為Marvis(馬維斯)的操作系統層個人AI助手。這一AI助手通過多個Agent的協作完成App操作、EXE操作、電腦操作、文件管理、文檔生成以及各種復雜任務,24小時持續在線,并支持跨端操作。
Marvis目前僅支持Windows PC和安卓手機,iOS/macOS即將上線。
具體到日常使用場景,Marvis能干不少活。工作場景中,它能做文件格式轉換、合同信息審查、運營數據分析,甚至幫忙整理參考文獻。這些功能超越了單純的文字、代碼生成,能真正去操作系統、文件和應用等更為底層的元素。
![]()
在生活娛樂場景中,它能幫你監控游戲限時福利和明星動態,自動完成微博簽到、整理高清物料,也可以定時執行每天早上的新聞匯總。
Marvis這一名字致敬了知名智能助手“Jarvis”,取自“馬(Ma)”與“Jarvis”的結合。比較有趣的是,它把每個Agent的形象設計成一只長著牛角的黑色小馬,簡稱“小牛馬”,“小牛馬”還繼承了騰訊企鵝標志性的圍脖。
你可以在虛擬辦公室里隨時查看每只Agent在干什么,被安排任務的Agent會坐在工位上認真搬磚,其他閑著的Agent可能會打盹、閑逛、健身、喝咖啡或上廁所。
當你指定任務后,會有一只Agent主管出來主持大局,分配任務給相應的Agent,Agent在完成工作后會向主管匯報。
目前Marvis里的專家Agent具備App操作、電腦系統運維、網頁交互、數字資產管理和搜索任務等能力。
![]()
Marvis目前提供了兩種運行模式:云端效率模式采用混元和DeepSeek V4等最新模型,本地隱私模式則采用Qwen端側模型,做到一句話都不出電腦。 這一產品還支持本地知識庫的功能,可以自動識別本地文檔、圖片并進行索引。當用戶需要搜索特定內容時,Marvis可以基于標題匹配或基于內容匹配。
![]()
與同樣能操控電腦的其他“龍蝦類”產品相比,Marvis有什么優勢?
智東西獲知,Marvis背后是騰訊應用寶團隊,繼承了十幾年與英特爾、微軟等軟硬件廠商的合作關系和跨端引擎技術。
因此,Marvis不僅能操作電腦EXE軟件,還能通過應用寶,直接在電腦上操控手機App(同花順、開盤啦、飛常準、汽車之家、唯品會等App已授權)。
該團隊通過對端側模型做芯片級優化,實現了跑端側模型速度提升20%,并能通過提示詞直接對電腦文件進行查詢、變更等操作。而當前大多數AI應用都做不到這種深入操作系統層的能力。
智東西第一時間拿到Marvis的內測資格。根據我們的實際體驗,Marvis展現了“AI打工人”的雛形,它能實實在在地幫你干活,完成任務的質量不錯,但在速度、token消耗量、靈活性等方面仍有提升空間。
指路:marvis.qq.com
一、找文件、調設置,Marvis全動手試了一遍
電腦操作是Marvis的一大長板。Marvis擁有系統級的能力,可直接完成對電腦的全流程操作。我們的首批案例就圍繞這類任務展開。
進入主頁后,用戶可以直接與Marvis對話并指派任務,也可通過自動任務頁面讓Marvis定時執行既定任務。
![]()
案例1:圖像搜索、文件定位都能勝任,就是有點燒token
對許多用戶來說,在本地設備上尋找指定的文件或圖像,是件費時費力的事情。我試著讓Marvis幫我在本地的下載文件夾中,找到一張包含納斯達克元素的圖片。
拿到這一任務后,Marvis的團隊負責人Agent把任務分配給了文件處理Agent,后者先是嘗試了文件名搜索,未獲得命中。在這一過程中,它判斷我的圖片命名大多無意義,決定換個思路,用圖像分析來找到相關圖像。
![]()
切換思路后,Marvis終于步入了正軌,它成功地找到了包含納斯達克相關元素的圖片。然而,調用圖像分析工具,Marvis的token消耗量呈現指數級的增長。在搜索了一百多張圖片后,總消耗量來到了200萬token。
![]()
Marvis可以完成跨端的文件查找和傳遞。我在手機上向Marvis發送了一條命令,搜索與字節跳動估值有關的文件并發送到我的手機上。
它很快找到了文件,并發送到我的手機上。可能是因為這次文件名本身就包含了需要查找的關鍵詞,任務的token消耗量明顯降低了。
![]()
案例2:精準抓取電腦配置,還給我提了優化建議
Marvis可以直接在Windows系統層進行一些操作。當我要求它幫我把電腦的主題調為綠色時,Marvis的電腦操作Agent接手了工作,并直接找到了系統主題色的設置入口。這一操作并未通過模擬點擊實現,應該是深入了系統底層。
不過,它沒有100%完成這一任務,停在了找到入口這一步,后續的具體設置需要我手動操作。
![]()
Marvis可以精準地獲取各種系統信息。當我向它咨詢我的設備是否支持《黑神話·悟空》這樣的大型游戲時,它快速整理出了我的系統配置,看樣子是直接在設置中找到了相關內容。
![]()
緊接著,我讓Marvis分析了我這套配置中的短板,并提出升級建議。它判斷我的顯卡配置充裕,但是CPU、內存和硬盤都稍顯落后。Marvis建議我對內存進行升級,并說這是性能提升最直接、成本最低的方式。
不過,它似乎不了解當內存漲價的情況,告訴我32GB的DDR4 3200MHz內存只要四五百塊。實際情況是,同類內存的價格至少也得1000元出頭。
![]()
在我們的實際體驗中,Marvis在遇到批量刪除文件、核心配置修改時一定會詢問用戶,用戶點擊確認后才會執行。 二、寫代碼、出報告,多Agent協作有亮點
多Agent的協作,理論上可以完成更復雜的任務,或是提高任務執行的質量。我們拿幾個復雜任務試了試Marvis的能力邊界。
案例1:開發本地知識庫,全程無需碰代碼
我們的首個復雜任務要求Marvis設計一個本地知識管理系統,支持自定義大模型接入,實現簡單的RAG。
在這種更復雜的任務中,Marvis反而沒有調用多Agent,而是由主Agent完成所有的開發工作。Marvis陸續創建了目錄結構,并且并行寫入了配置文件和核心模塊,之后打造了Web界面。Marvis默認使用了ollama本地跑模型,我要求它切換為接入外部API的模式。
Marvis提供的API設置界面較為人性化,它向我發送了選項卡,只要逐步選擇并填寫信息就行。
![]()
最終,Marvis按照我的要求打造出了這一知識管理系統,支持導入文件、導入目錄、導入文本等選項,可提供參考來源。我們試著上傳了幾份文件并詢問相關信息,該系統輸出的內容準確,也沒有編造不在知識庫內的信息。
![]()
案例2:盤點硅谷裁員潮,直接輸出PDF文件
下一個實測任務要求Marvis梳理一下今年硅谷大廠的裁員情況,做成一個PDF網頁,包含裁員數據和分析,每條數據背后附上單獨的消息來源。
在這一任務中,Marvis使用了多Agent協作的模式,文件Agent被喚起,并主動調用了文檔寫作Skill。這一Skill要求模型先做復雜度判斷,然后加載寫作模板、寫作規范,再開始正式的執行。
![]()
Marvis判斷這屬于一個復雜文檔,預計產出超過3500字。它進行了多輪的網頁搜索,收集到足夠數據后開始逐頁撰寫PDF內容,最終輸出了一份完整的調研報告。
![]()
執行過程中,Marvis的多Agent協作讓任務劃分更加合理,兩個Agent的并行工作一定程度上提高了效率。不過,這一任務中Agent出現了自主切換到英文的問題,Skill的內容和背后模型的特性可能導致了這一現象。
![]()
Marvis生成的文檔可以直接在側邊欄中進行預覽,從結果來看,這一文檔的內容明顯要比AI單次生成的內容來得詳實,文中的數據基本準確。
![]()
排版方面,這一文檔的風格比較樸素,通過表格、加粗、章節劃分等方式,讓內容的可讀性更強。這種輸出方式應該與Marvis內置的Skill有關。
三、靠應用寶操作安卓應用,效率仍有提升空間
Marvis可以通過騰訊應用寶在Windows PC上完成對安卓App的操作,并且相關操作不會干擾PC的正常使用。安裝應用寶后,我們對這部分功能進行了體驗。
案例1:自動到微博打卡簽到,任務耗時3分多鐘
Marvis官方在首頁展示了微博超話簽到這一任務。我們也實測了一下,要求Marvis打開微博去陳奕迅超話簽到。
App操作Agent是這一任務的主要執行者。我們提前在應用寶中下好了微博并登錄,以免Marvis在登錄這一步卡住。
Marvis的執行速度不太理想。此前我們已經跑過類似任務,但它還是較為機械地按照規范來,檢查微博安裝包,試圖搜索微博操作Skill,未果后直接開始任務執行。
開始操作后,Marvis只能截圖一步,操作一步,每張截圖都要分析個幾秒鐘,整個任務的執行時長被拉到3分多鐘。下圖是它的完整執行過程,畫面經過20倍速的處理。
![]()
▲動圖經過20倍速處理
借助Marvis的定時任務功能,用戶可以把上述App操作設置為每天自動執行的任務。不過,前提是電腦必須保持24小時開機。
案例2:拒絕小紅書、微信操作請求
除了微博之外,我們也嘗試了Marvis操作其他App的能力。當我們要求它操作微信并發送消息時,Marvis拒絕了這一請求,稱由于系統限制無法在微信內執行點擊和輸入操作。我們嘗試了小紅書,也同樣無法操作。
![]()
這可能是因為微信這類App的聊天和支付界面,本身可能就有防模擬點擊、防注入輸入的特殊安全機制,如果AI助手能隨意替用戶在微信上發消息、轉錢,一旦被惡意利用,造成的風險和平臺責任是平臺無法承受的。因此,Marvis從源頭上拒絕了任何涉及資金劃轉的自動交易等操作。 我們也嘗試詢問Marvis它到底可以直接操作哪些應用,不過Marvis一直答非所問。 結語:AI打工人雛形已現,但離“放手”還有距離
對于愿意嘗鮮的極客用戶來說,Marvis已經能帶來實打實的效率提升。然而,現在普通用戶仍無法完全放手讓Marvis執行一個任務,復雜的軟件生態、文件系統等影響因素,都有可能讓Marvis的任務執行中斷或偏離預期。
不過,Marvis的設計思路確實代表了一種明確的趨勢。目前,國內已有不少AI廠商在多Agent產品上展開探索,跨端協同也逐漸成為行業共識。盡管體驗還需要進一步打磨,但騰訊至少已經邁出了第一步。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.