PChome 4月29日消息,據多方消息證實,DeepSeek正在進行灰度測試“識圖模式”,該模式和“快速模式”“專家模式”并列,并非簡單的OCR文字,而是終于具備了多模態識別能力。
![]()
據悉,部分用戶已實測上傳食品包裝、概念手機圖等,DeepSeek能準確識別品牌、成分、設計特征,并給出實用建議。同時,DeepSeek多模態團隊研究員陳小康在X平臺發布“Now, we see you”并配圖鯨魚摘下眼罩,被廣泛視為官方確認多模態上線的信號。
![]()
據網友今日曬出的圖片了解到,灰度到的用戶可以上傳一張圖片,讓DeepSeek描述這張圖。有網友稱“速度上感覺和flash比較類似,很快”。還有網友顯示可觸發識圖模式界面,但無法使用,提示“識圖模式暫不可用,請稍后再試”。
部分測試結果顯示,模型會分步驟輸出:分析用戶需求—檢查圖像—生成解讀的思考過程。
![]()
此次功能并非簡單文字掃描,而是基于多模態技術,即視覺+語言融合,能理解圖片的語義和邏輯關系。據技術爆料,其底層可能沿用DeepSeek—OCR2的視覺因果流機制,可實現AI像人類一樣按重要性重排圖像內容,提升復雜圖表、文檔的理解準確率。
目前功能處于小范圍灰度階段,尚未全量開放,未被灰度到的用戶暫時無法使用,API是否同步開放官方尚無消息。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.