![]()
D神又開播了?真的假的?
Deepseek憋了這么久大的,最近終于開始盡情釋放了。上周他們剛悄咪咪把 V4 給端了上來,緊接著就是連著兩波大降價。。梁神,你又來普度眾生了?
結果今天,它又突然來了給我推送了一波灰測:DeepSeek,有多模態能力了,準確來說是識圖。
驗過了牌,是真的。
![]()
想嘗鮮的差友現在就可以打開你的 DeepSeek 瞅一眼。
要是界面里多出了個“識圖模式”,恭喜你,你就是被內測到的幸運兒,直接白嫖真正的多模態版 V4。
DeepSeek自家的研究員陳小康,也按耐不住發了個貼,我們鯨魚終于長眼睛了,再也不是國服盲僧了!
![]()
為啥大伙兒反應這么激動?實在是DeepSeek因為沒多模態,已經被詬病很久了,像國外三巨頭ChatGPT、Gemini、Claude早就有多模態能力了,國內像豆包、千問等模型也做得非常好。
而你這個被寄予厚望的國產之光,這么多年了連個圖都識別不了,只能靠 OCR,也就是識別圖片里的文字,使用體驗這塊確實拉了一截。
而現在,這塊短板終于被補齊了。
話不多說,我們直接上測試吧。
首先,它確實是擺脫了傳統的OCR,真能看到圖片全貌了,這點大伙可以放心。
比如我們給它了一張用藍色寫出來的“這是一行紅字”,如果只用傳統OCR,它只能識別出文字是“這是一行紅字”,絕對識別不出是藍色的。(甚至可能無法識別)
![]()
而開啟視覺模式后,它可以精準識別出,這是一行藍色的紅字,甚至感覺到了我的幽默。
![]()
不光如此,它還有了視覺上的推理能力。
這張梗圖大家都見過吧?相信以差友的智商,絕對看得懂圖里在寫啥。
![]()
于是我發給DeepSeek,讓它幫我進行笑點解析。
它一番思考過后,不光看出來了,還順便做了個本土化翻譯“金大利亞”“銀大利亞”“銅大利亞”,有點忍俊不禁了。
![]()
接著我又發它了一張同事開車時,隨手拍的圖片,其實挺糊的,只有些外觀、光效上的信息可以分析。
![]()
結果它還是猜出來了,這輛車確實是斯巴魯,而且思考13秒就給出了結論。
![]()
考慮到D老師是數學高手,我們又給它傳了一張數學相關的梗圖,說實話世超差點都沒看懂,是哥們丈育了。
![]()
D老師的解釋,依舊非常完美。
不光整明白了簡單運算,它甚至看出了里面的幾個諧音梗:取實部也就是去掉虛數“i”,也就是去掉“Eye”,也就是把眼睛去掉了。而倒三角是梯度也就是“Grad”,剛好和“Graduate”差不多,所以給小臉帶上了學士帽。
已經忘記數學知識的差友們可以逐字復盤一下。
![]()
順便呢,我也測了幾個生活中的問題,比如這個3.5mm插頭該插哪里。
![]()
這個方頭USB口又該插哪里。
![]()
雖然很簡單,但它能理解我沒對上焦的隨手拍,也算能勝任日常任務了。
但其實,根據世超的實測,D老師目前這個版本,也沒有到天下無敵的地步。
比如咱給它丟了一張圖,非常美麗的地球夜景。
![]()
DeepSeek也看得蠻清楚的,說這張照片來自國際空間站。
![]()
但其實,你們把照片翻過來看看,就會發現這張照片是一張晚霞下面的城市,這是倒懸過來的視角。。。
然后我丟給了公認的多模態高手Gemini。。。它還真看出來了。不是,降智了都這么強嗎?
![]()
還是沒能讓多模態之王用盡全力嗎,哈吉鯨。
包括對一些人臉的識別,也是偶爾抽風,比如我把豆包的圖片扔給了它,它給我識別的是啥,嗯,B站UP主羅翔。
![]()
還有這個經典的視錯覺問題,這倆球明顯不一樣大吧?結果D老師一番思考跟我說倆球一樣大。
![]()
不過我也去扒了一下它的思考過程,其實它早就看出來右邊的球大了,但因為仔細讀題,覺得這是給它的錯覺,所以選擇欺騙自己,說它們一樣大了。。可能是強化學習強化太猛了吧。
![]()
綜合評價,可以給到一個神鬼二象性,夯的時候夯,拉的時候拉完了。。
但話又說回來了,DeepSeek剛長出眼睛,咱還是得給它一些適應這個世界的時間吧。
最后,現在的 AI 巨頭大亂斗,早已經過了那個只看跑分、只看文本輸出能力的新手村階段了。
Coding 水平、多模態能力、調用工具的絲滑程度等等等等,基本上缺一不可。
但之前大 D 老師在多模態能力上的缺席,總讓覺得可惜。有種大伙們都在哼哧哼哧做事干活了, DeepSeeK 卻因為缺胳膊少眼,Agent 能力大打折扣。
畢竟,目前絕大部分的模型,API 都是帶多模態,或者至少是帶圖片輸入能力的。
![]()
也期待 DeepSeek 能把識圖的多模態能力,盡快更新到 V4 新模型的 API 上面吧。
要知道,之前蒙著眼睛,已經和不少對手已經打得有來有回了。。 現在揭下眼罩,到時候用在 Claude Code、龍蝦、Cowork 等等工具上的表現,估計還會有一大波的提升。
另外,按照 DeepSeek 這段時間吐泡泡刷存在感的頻率,估計還有一堆連招等著出手呢。
不多說了,看 D 老師表演吧。
撰文:不咕&江江
編輯:江江&面線
美編:萱萱
圖片、資料來源:
DeepSeek,微博,部分圖源自互聯網
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.