<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek V4 發布后遇冷,開發者只聊Codex:便宜不是萬能藥

      0
      分享至

      去年 DeepSeek V3 發布時,整個 AI 圈的氣氛,和今年完全不一樣。

      那時候的討論非常熱烈,甚至有點像 ChatGPT 剛火爆全球,社交媒體上到處都是實測、跑分、成本分析,很多海外開發者第一次認真討論一家中國大模型公司。國內和硅谷公司都意識到,原來除了 OpenAI、Anthropic、Google 之外,還有團隊能把模型做到這個水平。

      更關鍵的是,它還便宜。DeepSeek 帶來的沖擊不只是技術層面,更低的訓練成本、更激進的工程優化、更高的推理性價比,都讓整個行業重新思考大模型的競爭邏輯,很多人都將其視為真正的「Open AI」。

      兩周前,DeepSeek V4 發布,行業當然非常關注,很多開發者第一時間跑測試、做對比,但整個市場的情緒明顯冷靜了很多。過去兩周,對普通用戶來說,該用豆包、ChatGPT 的繼續用,而對開發者群體來說,很多使用 Codex、Claude Code 的人,也并沒有因為 DeepSeek V4 更便宜就替換掉 GPT-5.5 或者 Claude 4.6/4.7。



      圖片來源:YouTube

      甚至很多開發者現在討論 AI 時,已經不太提 GPT-5.5、Claude 4.6 或 DeepSeek V4 這些模型名字了,更多人張口閉口聊的是 Codex、Claude Code、OpenClaw、OpenCode、Hermes 等 Agent 框架。

      事實上在過去一年,AI 行業的競爭重點,已經從模型本身的能力逐漸轉向 AI 實際的產出價值。在這件事上,DeepSeek V4 還缺少一個屬于自己的 Codex。

      DeepSeek V4 很好,但大家都不太看模型了

      「我在 opencode 上試了同樣的操作,deepseek v4 pro high 模式下速度慢得驚人,同樣的任務在 codex 5.5 med 模式下只需 20 分鐘,而在 v4 pro 上卻要花 2 小時。」X 用戶 Ayush Jaipuriar 最近談到。



      圖片來源:X

      需要先說明,DeepSeek V4 當然是一個強模型。包括代碼能力、推理能力、長上下文、多輪理解,V4 相比去年 V3 都有明顯提升,尤其是在中文場景、復雜邏輯推理以及長上下文等方面。與此同時,在國內外一眾大模型的漲價潮中,V4 也是少數降價的大模型。

      但問題在于,2026 年的大模型行業,各種基準測試的成績越來越不能說明實際工作中 AI 的表現。去年每次新模型發布,社交媒體第一時間討論的還是在 MMLU 上超過誰、在 SWE-Bench 上刷新紀錄、在人類評測里又提升了多少等等。

      不是說基準測試完全沒價值,但開發者顯然沒那么在意了。原因并不復雜,大家已經見過太多「測試很強,但實際不好用」的模型,很多 benchmark 更像考試,而真實工作環境遠比考試復雜,實際的干活表現很多時候也比價格優勢更重要。

      半導體和 AI 分析機構 SemiAnalysis 最近還做了一次橫向測試,覆蓋 GPT-5.5、Opus 4.7 和 DeepSeek V4,指出 DeepSeek V4 是目前成本最低的頂尖閉源模型替代方案,但其能力尚未達到領先水平。

      更何況,Token 成本的計算方式也不合理,更合理的其實是做好一個任務的成本。開發者、前媒體人王博源在 X 上就提到,用次頂級國產模型搞了半天都沒搞定的一個問題,用 Codex 一次就解決了。開發者、墨問西東創始人池建強也遇到 Claude Code 兩次解決不了,Codex 卻能一次搞定。



      圖片來源:X

      顯而易見的是,實際的模型成本就不能簡單對比「官方 Token 定價」,先不說結果,實際使用的 Token 量就不一致。而且 GPT-5.5 這次很重要的一點升級就是「效率」,能用更少的 Token 完成同樣的任務。

      所以即便有一些方法可以在 Claude Code、Codex 上使用如 DeepSeek V4 等第三方模型,考慮到穩定性、效果、時間等因素,絕大部分人都還是采用官方的默認模型,Claude Code 是 Claude 4.x,Codex 是 GPT-5.x。

      尤其是在 Coding 場景,開發者真正每天面對的問題,是 AI 到底能不能參與完整的軟件工程流程。比如能不能理解整個項目結構,能不能持續修改十幾個文件,能不能自己調用 terminal,能不能自動修 bug,能不能在報錯后繼續嘗試,能不能長時間保持上下文穩定。

      這些東西,考驗的不只是「模型能力」,更需要一套完整的 AI 工作系統。開發者 Vladimir 在使用了 1443 萬 Token 的 DeepSeek V4 后表示,V4 的智能程度接近于 GPT-5.2/GPT-5.3,但最大的問題是經常忽略 agents 文件,實際使用中必須強制執行工具和 Harness 框架。



      圖片來源:X

      Claude Code、Codex 是真正完整的產品,但 DeepSeek V4 只是模型。SemiAnalysis 在測試報告中還強調:「真正完整的產品是運行框架 + 模型。缺了其中任一個,你就有所欠缺。」

      過去一年,OpenClaw(龍蝦)、Claude Code 和 Codex 這類 Agent 框架的存在感越來越強。很多開發者現在已經不會說「我在用 Claude 4.6」,而是直接說「我在用 Claude Code」。同樣,很多人在討論 Codex 而非 GPT-5.5。

      DeepSeek 還差一個自己的 Codex

      很多人現在回頭看 ChatGPT 剛火的時候,會發現當時整個行業其實都在圍繞「對話」做產品。無論是 OpenAI、Anthropic 還是國內廠商,本質上都是讓模型更像人類聊天,重點是模型更聰明、更自然、更像真人。

      但現在 AI 的重點,正在從「聊天」變成「工作」。這個變化看起來好像只是用途的變化,但背后連帶整個行業競爭邏輯也變了。以前模型公司最重要的任務,是把模型訓練得更聰明;現在越來越重要的問題,則是怎么讓 AI 真正完成任務。

      這也是為什么最近一年,行業里開始大量出現 Agent、Workflow、Context Engineering、Harness Engineering 這些詞。本質上,它們都在解決同一個問題:怎么讓 AI 真正進入生產流程。

      所以現在很多開發者評價 AI Coding 或者 Agent 產品時,模型作為系統「引擎」當然重要,但直接決定 AI 實際價值的關鍵,更在于一套系統工程。比如上下文管理,比如工具調用,比如長期記憶,比如任務拆解,比如錯誤恢復,比如多 Agent 協同。實際工作中,這些能力很多時候甚至比模型本身的優勢更重要。



      圖片來源:X

      這也是為什么越來越多人開始說,AI Coding 的競爭已經不只是 LLM 競爭,而是 AgentOS 競爭。

      反過來看,也能在一定程度上理解 Claude Code、Codex 的成功。一方面是自家模型在能力上的領先,另一方面則是從底層模型到 Agent 框架的垂直整合,在真實工作環境中可以帶來更穩定、高效的表現。尤其是長任務場景下,Claude Code 更像一個能持續自主代理工作的 AI 助手。

      而 GPT-5.5 真正重要的地方,也不只是模型更強,還有背后 Codex 工作流越來越成熟。包括文件管理、工具調用、Agent 協同、任務拆解、上下文管理,這些能力的疊加,也讓實際 AI 表現出的能力和價值有了質的變化。

      OpenAI 前幾天也官宣表示,GPT-5.5 發布一周的 API 收入增長速度超過以往任何版本的兩倍多,而 Codex 在不到七天內收入翻倍。而且現在來看,這種優勢已經從 AI Coding 溢出到了更多的 Agent 場景上。

      關注 Anthropic、OpenAI 的朋友應該都能發現,這段時間兩家公司都在將 Claude Code、Codex 擴展到更多場景下,包括連接更多第三方應用和平臺。



      圖片來源:X

      不僅如此,Claude Code 更多承接了 Claude Cowork 的辦公定位,最新推出了專為銀行和其他金融服務企業量身定制的 AI Agent,Codex 也在強調更多研究、文書、會計等工作,而不僅限于 Coding。

      回頭再看 DeepSeek V4,雖然已經在模型層面追上了行業的前沿變化和領先陣營,但還差一個自己的 Codex。事實上,這種呼聲已經不小了,還有人在 Github 上開源了基于 DeepSeek V4 開發的終端 Coding Agent——DeepSeek TUI,支持 Skill 以及大量 Agent 框架上的常見功能。

      但這畢竟還是第三方開發者的作品,對于 DeepSeek V4 的理解很難比擬官方團隊,不太可能充分發揮 V4 的垂直整合優勢。最好的期待是,借由 DeepSeek TUI 的反饋和呼聲,DeepSeek 官方能夠下場打造自己的開源 Agent 框架,自己的 Codex。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      上海樓市驚現“靜默大撤退”:3月爆賣3萬套背后,67%房東為何突然不賣了?

      上海樓市驚現“靜默大撤退”:3月爆賣3萬套背后,67%房東為何突然不賣了?

      墜入二次元的海洋
      2026-05-09 01:34:16
      70歲之后,來日并不方長,身體再好,也要牢記8句話

      70歲之后,來日并不方長,身體再好,也要牢記8句話

      小談食刻美食
      2026-05-07 07:34:54
      二野四縱,為何能成為四大野戰軍頭號王牌,有四大理由?

      二野四縱,為何能成為四大野戰軍頭號王牌,有四大理由?

      祁州校尉
      2026-05-09 09:00:19
      55比0全票圍剿!菲律賓副總統彈劾案閃擊過關,莎拉真要被拿下?

      55比0全票圍剿!菲律賓副總統彈劾案閃擊過關,莎拉真要被拿下?

      小影的娛樂
      2026-05-09 15:12:46
      把瑜伽褲穿成日常的松弛感美女

      把瑜伽褲穿成日常的松弛感美女

      只要高興就好
      2026-04-13 14:30:30
      火箭報價凱爾特人布朗!烏度卡有合作基礎,史蒂文斯啟動交易評估

      火箭報價凱爾特人布朗!烏度卡有合作基礎,史蒂文斯啟動交易評估

      格斗社
      2026-05-09 13:53:43
      最爽的人,都在縣城400塊的希爾頓里躺著

      最爽的人,都在縣城400塊的希爾頓里躺著

      一刻talks丨硬科技趣思想
      2026-05-07 20:35:15
      租下 22 萬顆英偉達 GPU 的同一天,Anthropic 向谷歌 TPU 承諾了 2000 億美元

      租下 22 萬顆英偉達 GPU 的同一天,Anthropic 向谷歌 TPU 承諾了 2000 億美元

      鈦媒體APP
      2026-05-07 10:00:21
      47歲韓國女演員河智苑在西湖夜跑,全程沒戴口罩帽子,曾出演《黃真伊》《秘密花園》

      47歲韓國女演員河智苑在西湖夜跑,全程沒戴口罩帽子,曾出演《黃真伊》《秘密花園》

      都市快報橙柿互動
      2026-05-09 15:13:16
      5月9日央視乒乓直播調整,世乒賽決賽王楚欽迎終極考驗

      5月9日央視乒乓直播調整,世乒賽決賽王楚欽迎終極考驗

      老牛體育解說
      2026-05-09 11:48:37
      臺灣地區最新民調出爐,鄭麗文支持率倒數,這下讓蔣萬安撿了漏?

      臺灣地區最新民調出爐,鄭麗文支持率倒數,這下讓蔣萬安撿了漏?

      一網打盡全球焦點
      2026-05-08 08:34:58
      日本高層訪華無果

      日本高層訪華無果

      萬物知識圈
      2026-05-09 14:40:09
      華為空調來了,鴻蒙智選全套復刻賽力斯打法:扶持嫡系、結盟龍頭

      華為空調來了,鴻蒙智選全套復刻賽力斯打法:扶持嫡系、結盟龍頭

      電科技網
      2026-05-09 15:36:29
      稀土戰爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

      稀土戰爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

      六子吃涼粉
      2026-05-06 18:14:18
      外交部:英方為反中亂港分子站臺 中方強烈譴責、堅決反對

      外交部:英方為反中亂港分子站臺 中方強烈譴責、堅決反對

      新京報
      2026-05-08 15:57:15
      廣東3消息!胡明軒尿檢結果出爐,陳老板鼓舞球隊,主場嚴陣以待

      廣東3消息!胡明軒尿檢結果出爐,陳老板鼓舞球隊,主場嚴陣以待

      多特體育說
      2026-05-09 10:32:59
      每天一把保健品?專家:盲目服用當心中毒 這三類人尤其小心

      每天一把保健品?專家:盲目服用當心中毒 這三類人尤其小心

      大象新聞
      2026-01-30 21:13:03
      剛剛,比亞迪官宣:新車15.08萬起!

      剛剛,比亞迪官宣:新車15.08萬起!

      手機評測室
      2026-05-09 11:50:48
      特朗普心腹訪華,開口就要中國采購波音,王毅把話挑明

      特朗普心腹訪華,開口就要中國采購波音,王毅把話挑明

      萬物知識圈
      2026-05-09 14:53:02
      6歲男孩為躲母親毆打,離家出走22年,長大后才得知母親悲慘人生

      6歲男孩為躲母親毆打,離家出走22年,長大后才得知母親悲慘人生

      哄動一時啊
      2026-04-19 14:38:19
      2026-05-09 16:27:00
      雷科技 incentive-icons
      雷科技
      專注AI硬科技
      36845文章數 812087關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      香港富豪孫女被綁架 綁匪拿到2800萬后逃跑8人花11萬

      頭條要聞

      香港富豪孫女被綁架 綁匪拿到2800萬后逃跑8人花11萬

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      Meta瘋狂擁抱人工智能:員工苦不堪言

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      健康
      藝術
      本地
      數碼
      公開課

      干細胞能讓人“返老還童”嗎

      藝術要聞

      齊白石 紫藤蜜蜂

      本地新聞

      用蘇繡的方式,打開江西婺源

      數碼要聞

      想玩新007?你的顯卡準備好了嗎

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产va免费观看| 男女午夜性爽快免费视频不卡 | 鱼台县| 欧洲美熟女乱又伦免费视频| 一级欧美一级日韩片| 一区二区精品| 中文av字幕在线观看| 日日躁狠狠躁狠狠爱| 久久国产精99精产国高潮| 天堂在线最新版在线天堂| 国产一区二区三区色噜噜| 丰满人妻一区二区三区无码AV| 午夜寂寞视频无码专区 | 免费的特黄特色大片| 成人激情文学| 麻豆果冻传媒精品一区| 九九热精彩视频在线免费| 亚洲成人在线网站| 亚洲一区二区三区在线| 成人日屄视频| 亚洲色大成网站WWW尤物| 亚洲精品影院| 日本野外强奷在线播放va| 亚洲欧美在线综合一区二区三区| 国产亚洲精品在天天在线麻豆 | av中文字幕一区二区三区| 香港三级韩国三级日本三级| 男女啪啪激烈无遮挡动态图| 男人一边吃奶一边做爰免费视频| 制服丝袜美腿一区二区| 日本体内she精高潮| 亚洲色无码专区在线观看精品| 九九热在线视频精品店| 久久高清内射无套| 亚洲欧美综合| 成人精品午夜无码福利区| 东京热中文字幕a∨无码| 国产午夜A理论毛片| 国产女人精品视频| 亚洲一区二区不卡av| 亚洲AV香蕉一区区二区三区|