<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      DeepSeek V4 發(fā)布后遇冷,開發(fā)者只聊Codex:便宜不是萬能藥

      0
      分享至

      去年 DeepSeek V3 發(fā)布時,整個 AI 圈的氣氛,和今年完全不一樣。

      那時候的討論非常熱烈,甚至有點像 ChatGPT 剛火爆全球,社交媒體上到處都是實測、跑分、成本分析,很多海外開發(fā)者第一次認真討論一家中國大模型公司。國內(nèi)和硅谷公司都意識到,原來除了 OpenAI、Anthropic、Google 之外,還有團隊能把模型做到這個水平。

      更關(guān)鍵的是,它還便宜。DeepSeek 帶來的沖擊不只是技術(shù)層面,更低的訓(xùn)練成本、更激進的工程優(yōu)化、更高的推理性價比,都讓整個行業(yè)重新思考大模型的競爭邏輯,很多人都將其視為真正的「Open AI」。

      兩周前,DeepSeek V4 發(fā)布,行業(yè)當然非常關(guān)注,很多開發(fā)者第一時間跑測試、做對比,但整個市場的情緒明顯冷靜了很多。過去兩周,對普通用戶來說,該用豆包、ChatGPT 的繼續(xù)用,而對開發(fā)者群體來說,很多使用 Codex、Claude Code 的人,也并沒有因為 DeepSeek V4 更便宜就替換掉 GPT-5.5 或者 Claude 4.6/4.7。



      圖片來源:YouTube

      甚至很多開發(fā)者現(xiàn)在討論 AI 時,已經(jīng)不太提 GPT-5.5、Claude 4.6 或 DeepSeek V4 這些模型名字了,更多人張口閉口聊的是 Codex、Claude Code、OpenClaw、OpenCode、Hermes 等 Agent 框架。

      事實上在過去一年,AI 行業(yè)的競爭重點,已經(jīng)從模型本身的能力逐漸轉(zhuǎn)向 AI 實際的產(chǎn)出價值。在這件事上,DeepSeek V4 還缺少一個屬于自己的 Codex。

      DeepSeek V4 很好,但大家都不太看模型了

      「我在 opencode 上試了同樣的操作,deepseek v4 pro high 模式下速度慢得驚人,同樣的任務(wù)在 codex 5.5 med 模式下只需 20 分鐘,而在 v4 pro 上卻要花 2 小時。」X 用戶 Ayush Jaipuriar 最近談到。



      圖片來源:X

      需要先說明,DeepSeek V4 當然是一個強模型。包括代碼能力、推理能力、長上下文、多輪理解,V4 相比去年 V3 都有明顯提升,尤其是在中文場景、復(fù)雜邏輯推理以及長上下文等方面。與此同時,在國內(nèi)外一眾大模型的漲價潮中,V4 也是少數(shù)降價的大模型。

      但問題在于,2026 年的大模型行業(yè),各種基準測試的成績越來越不能說明實際工作中 AI 的表現(xiàn)。去年每次新模型發(fā)布,社交媒體第一時間討論的還是在 MMLU 上超過誰、在 SWE-Bench 上刷新紀錄、在人類評測里又提升了多少等等。

      不是說基準測試完全沒價值,但開發(fā)者顯然沒那么在意了。原因并不復(fù)雜,大家已經(jīng)見過太多「測試很強,但實際不好用」的模型,很多 benchmark 更像考試,而真實工作環(huán)境遠比考試復(fù)雜,實際的干活表現(xiàn)很多時候也比價格優(yōu)勢更重要。

      半導(dǎo)體和 AI 分析機構(gòu) SemiAnalysis 最近還做了一次橫向測試,覆蓋 GPT-5.5、Opus 4.7 和 DeepSeek V4,指出 DeepSeek V4 是目前成本最低的頂尖閉源模型替代方案,但其能力尚未達到領(lǐng)先水平。

      更何況,Token 成本的計算方式也不合理,更合理的其實是做好一個任務(wù)的成本。開發(fā)者、前媒體人王博源在 X 上就提到,用次頂級國產(chǎn)模型搞了半天都沒搞定的一個問題,用 Codex 一次就解決了。開發(fā)者、墨問西東創(chuàng)始人池建強也遇到 Claude Code 兩次解決不了,Codex 卻能一次搞定。



      圖片來源:X

      顯而易見的是,實際的模型成本就不能簡單對比「官方 Token 定價」,先不說結(jié)果,實際使用的 Token 量就不一致。而且 GPT-5.5 這次很重要的一點升級就是「效率」,能用更少的 Token 完成同樣的任務(wù)。

      所以即便有一些方法可以在 Claude Code、Codex 上使用如 DeepSeek V4 等第三方模型,考慮到穩(wěn)定性、效果、時間等因素,絕大部分人都還是采用官方的默認模型,Claude Code 是 Claude 4.x,Codex 是 GPT-5.x。

      尤其是在 Coding 場景,開發(fā)者真正每天面對的問題,是 AI 到底能不能參與完整的軟件工程流程。比如能不能理解整個項目結(jié)構(gòu),能不能持續(xù)修改十幾個文件,能不能自己調(diào)用 terminal,能不能自動修 bug,能不能在報錯后繼續(xù)嘗試,能不能長時間保持上下文穩(wěn)定。

      這些東西,考驗的不只是「模型能力」,更需要一套完整的 AI 工作系統(tǒng)。開發(fā)者 Vladimir 在使用了 1443 萬 Token 的 DeepSeek V4 后表示,V4 的智能程度接近于 GPT-5.2/GPT-5.3,但最大的問題是經(jīng)常忽略 agents 文件,實際使用中必須強制執(zhí)行工具和 Harness 框架。



      圖片來源:X

      Claude Code、Codex 是真正完整的產(chǎn)品,但 DeepSeek V4 只是模型。SemiAnalysis 在測試報告中還強調(diào):「真正完整的產(chǎn)品是運行框架 + 模型。缺了其中任一個,你就有所欠缺。」

      過去一年,OpenClaw(龍蝦)、Claude Code 和 Codex 這類 Agent 框架的存在感越來越強。很多開發(fā)者現(xiàn)在已經(jīng)不會說「我在用 Claude 4.6」,而是直接說「我在用 Claude Code」。同樣,很多人在討論 Codex 而非 GPT-5.5。

      DeepSeek 還差一個自己的 Codex

      很多人現(xiàn)在回頭看 ChatGPT 剛火的時候,會發(fā)現(xiàn)當時整個行業(yè)其實都在圍繞「對話」做產(chǎn)品。無論是 OpenAI、Anthropic 還是國內(nèi)廠商,本質(zhì)上都是讓模型更像人類聊天,重點是模型更聰明、更自然、更像真人。

      但現(xiàn)在 AI 的重點,正在從「聊天」變成「工作」。這個變化看起來好像只是用途的變化,但背后連帶整個行業(yè)競爭邏輯也變了。以前模型公司最重要的任務(wù),是把模型訓(xùn)練得更聰明;現(xiàn)在越來越重要的問題,則是怎么讓 AI 真正完成任務(wù)。

      這也是為什么最近一年,行業(yè)里開始大量出現(xiàn) Agent、Workflow、Context Engineering、Harness Engineering 這些詞。本質(zhì)上,它們都在解決同一個問題:怎么讓 AI 真正進入生產(chǎn)流程。

      所以現(xiàn)在很多開發(fā)者評價 AI Coding 或者 Agent 產(chǎn)品時,模型作為系統(tǒng)「引擎」當然重要,但直接決定 AI 實際價值的關(guān)鍵,更在于一套系統(tǒng)工程。比如上下文管理,比如工具調(diào)用,比如長期記憶,比如任務(wù)拆解,比如錯誤恢復(fù),比如多 Agent 協(xié)同。實際工作中,這些能力很多時候甚至比模型本身的優(yōu)勢更重要。



      圖片來源:X

      這也是為什么越來越多人開始說,AI Coding 的競爭已經(jīng)不只是 LLM 競爭,而是 AgentOS 競爭。

      反過來看,也能在一定程度上理解 Claude Code、Codex 的成功。一方面是自家模型在能力上的領(lǐng)先,另一方面則是從底層模型到 Agent 框架的垂直整合,在真實工作環(huán)境中可以帶來更穩(wěn)定、高效的表現(xiàn)。尤其是長任務(wù)場景下,Claude Code 更像一個能持續(xù)自主代理工作的 AI 助手。

      而 GPT-5.5 真正重要的地方,也不只是模型更強,還有背后 Codex 工作流越來越成熟。包括文件管理、工具調(diào)用、Agent 協(xié)同、任務(wù)拆解、上下文管理,這些能力的疊加,也讓實際 AI 表現(xiàn)出的能力和價值有了質(zhì)的變化。

      OpenAI 前幾天也官宣表示,GPT-5.5 發(fā)布一周的 API 收入增長速度超過以往任何版本的兩倍多,而 Codex 在不到七天內(nèi)收入翻倍。而且現(xiàn)在來看,這種優(yōu)勢已經(jīng)從 AI Coding 溢出到了更多的 Agent 場景上。

      關(guān)注 Anthropic、OpenAI 的朋友應(yīng)該都能發(fā)現(xiàn),這段時間兩家公司都在將 Claude Code、Codex 擴展到更多場景下,包括連接更多第三方應(yīng)用和平臺。



      圖片來源:X

      不僅如此,Claude Code 更多承接了 Claude Cowork 的辦公定位,最新推出了專為銀行和其他金融服務(wù)企業(yè)量身定制的 AI Agent,Codex 也在強調(diào)更多研究、文書、會計等工作,而不僅限于 Coding。

      回頭再看 DeepSeek V4,雖然已經(jīng)在模型層面追上了行業(yè)的前沿變化和領(lǐng)先陣營,但還差一個自己的 Codex。事實上,這種呼聲已經(jīng)不小了,還有人在 Github 上開源了基于 DeepSeek V4 開發(fā)的終端 Coding Agent——DeepSeek TUI,支持 Skill 以及大量 Agent 框架上的常見功能。

      但這畢竟還是第三方開發(fā)者的作品,對于 DeepSeek V4 的理解很難比擬官方團隊,不太可能充分發(fā)揮 V4 的垂直整合優(yōu)勢。最好的期待是,借由 DeepSeek TUI 的反饋和呼聲,DeepSeek 官方能夠下場打造自己的開源 Agent 框架,自己的 Codex。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      出乎所有人預(yù)料,特朗普修改訪華計劃,中方官宣,他必須多來一天

      出乎所有人預(yù)料,特朗普修改訪華計劃,中方官宣,他必須多來一天

      牛鍋巴小釩
      2026-05-11 11:23:22
      中國式領(lǐng)導(dǎo)的通病:領(lǐng)導(dǎo)不是神,常得5種“病”!

      中國式領(lǐng)導(dǎo)的通病:領(lǐng)導(dǎo)不是神,常得5種“病”!

      侃故事的阿慶
      2026-05-11 05:56:46
      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      辣媒專欄記錄
      2026-05-11 08:21:59
      沒有外援就拔刀相向?神權(quán)杖硬剛槍桿子,塔利班進入內(nèi)斗階段!

      沒有外援就拔刀相向?神權(quán)杖硬剛槍桿子,塔利班進入內(nèi)斗階段!

      寰球經(jīng)緯所
      2026-05-10 10:55:10
      塞爾主持:姆巴佩可能以為皇馬是主隊2-0領(lǐng)先,才發(fā)了Hala Madrid

      塞爾主持:姆巴佩可能以為皇馬是主隊2-0領(lǐng)先,才發(fā)了Hala Madrid

      懂球帝
      2026-05-11 12:09:08
      損失難以估量!世界杯若失去中國觀眾,國際足聯(lián)將直面3大壓力

      損失難以估量!世界杯若失去中國觀眾,國際足聯(lián)將直面3大壓力

      云舟史策
      2026-05-11 07:10:07
      這一次,被韓媒憤怒批評的張本智和,終究是為父母的荒唐買了單

      這一次,被韓媒憤怒批評的張本智和,終究是為父母的荒唐買了單

      圓夢的小老頭
      2026-04-23 12:00:21
      馬光遠:AI泡沫一定會破滅,而且一定會以非常慘烈的方式破滅!

      馬光遠:AI泡沫一定會破滅,而且一定會以非常慘烈的方式破滅!

      混沌錄
      2026-05-10 19:32:20
      2死6傷!奔馳逆行橫沖直撞:死者系母女,肇事司機:三甲醫(yī)院醫(yī)生

      2死6傷!奔馳逆行橫沖直撞:死者系母女,肇事司機:三甲醫(yī)院醫(yī)生

      溫柔看世界
      2026-05-11 11:51:17
      疑似大量特朗普訪華物資抵京,美特勤局專車現(xiàn)身,專家解讀

      疑似大量特朗普訪華物資抵京,美特勤局專車現(xiàn)身,專家解讀

      鳳凰衛(wèi)視
      2026-05-11 11:26:06
      人大代表建議機關(guān)事業(yè)單位雙休制調(diào)整為“大周休3天,小周休2天”

      人大代表建議機關(guān)事業(yè)單位雙休制調(diào)整為“大周休3天,小周休2天”

      細說職場
      2026-05-10 10:34:41
      王曼昱負蒯曼,孫穎莎挽顏面,日本教練評價更顯分量

      王曼昱負蒯曼,孫穎莎挽顏面,日本教練評價更顯分量

      七七自駕游
      2026-05-10 22:01:08
      女子碩士入學(xué)清華后參與智力測驗,僅得25分,回應(yīng):無論是學(xué)習(xí)、工作、創(chuàng)業(yè),我都沒有遇到困難,但我居然智力中下

      女子碩士入學(xué)清華后參與智力測驗,僅得25分,回應(yīng):無論是學(xué)習(xí)、工作、創(chuàng)業(yè),我都沒有遇到困難,但我居然智力中下

      揚子晚報
      2026-05-11 07:48:21
      8-3領(lǐng)先連丟8分,張本智和輸?shù)侥樧冃危≠惡缶趩拾l(fā)聲,日媒也慫了

      8-3領(lǐng)先連丟8分,張本智和輸?shù)侥樧冃危≠惡缶趩拾l(fā)聲,日媒也慫了

      萌蘭聊個球
      2026-05-11 09:08:17
      河南37歲單親媽媽與男子網(wǎng)戀遭遇“殺豬盤”,誘惑投資“倫敦金”被騙53萬元傾家蕩產(chǎn)

      河南37歲單親媽媽與男子網(wǎng)戀遭遇“殺豬盤”,誘惑投資“倫敦金”被騙53萬元傾家蕩產(chǎn)

      大風(fēng)新聞
      2026-05-11 12:16:07
      在不確定的時代,嵐圖給出的確定性答案

      在不確定的時代,嵐圖給出的確定性答案

      汽車觀察AUTO
      2026-04-30 15:41:19
      摩洛哥姑娘嫁江蘇農(nóng)村小伙,婚禮全程開心大笑,攝影師感慨:拍了七年婚禮沒見過這樣的

      摩洛哥姑娘嫁江蘇農(nóng)村小伙,婚禮全程開心大笑,攝影師感慨:拍了七年婚禮沒見過這樣的

      可達鴨面面觀
      2026-05-10 13:46:52
      拉什福德任意球破門,費蘭建功定乾坤,巴薩2-0復(fù)仇皇馬勇奪29冠

      拉什福德任意球破門,費蘭建功定乾坤,巴薩2-0復(fù)仇皇馬勇奪29冠

      釘釘陌上花開
      2026-05-11 05:10:06
      特斯拉FSD入華倒計時:中國智駕的鯰魚,已經(jīng)游進池塘了

      特斯拉FSD入華倒計時:中國智駕的鯰魚,已經(jīng)游進池塘了

      新浪財經(jīng)
      2026-05-10 23:49:22
      7部委發(fā)文:嚴禁醫(yī)生參加此類活動!違規(guī)者將移送至公檢機關(guān)

      7部委發(fā)文:嚴禁醫(yī)生參加此類活動!違規(guī)者將移送至公檢機關(guān)

      醫(yī)脈圈
      2026-05-11 12:04:57
      2026-05-11 13:40:49
      雷科技 incentive-icons
      雷科技
      專注AI硬科技
      36771文章數(shù) 812089關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機會

      頭條要聞

      媒體:特朗普確定本周訪華 中美在東亞有個共同的敵人

      頭條要聞

      媒體:特朗普確定本周訪華 中美在東亞有個共同的敵人

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學(xué)畢業(yè)了

      娛樂要聞

      謝霆鋒沒想到,王菲靠張藝謀重返巔峰

      財經(jīng)要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      全球化成國內(nèi)車企未來勝負手,誰是出海最強"水手"?

      態(tài)度原創(chuàng)

      藝術(shù)
      房產(chǎn)
      時尚
      本地
      手機

      藝術(shù)要聞

      2026中央美術(shù)學(xué)院博士生畢業(yè)作品選

      房產(chǎn)要聞

      低價甩賣!海口這個地標商業(yè),無人接盤!

      輕松拿捏又甜又酷的造型,試試這些輕熟穿搭,溫柔有女人味兒

      本地新聞

      用蘇繡的方式,打開江西婺源

      手機要聞

      榮耀600系列手機開啟新品預(yù)約

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 日韩精品a片一区二区三区妖精| 成人看的污污超级黄网站免费 | 女同在线观看亚洲国产精品| free性开放小少妇| 久久久久88色偷偷| 夜夜躁狠狠躁日日躁| 四虎成人精品永久免费av| 国产制服丝袜在线观看| 一个人www| 久久久不卡国产精品一区二区| 樱花草视频www日本韩国| av二区在线| 欧美高清大屁股xxxxx| 国产精品 亚洲一区二区三区| 欧美成人精品一区二区三区色欲| 国产精品亚洲А∨天堂免| 亚洲黄色短视频| 神马视频| 91产精品无码无套在线| 人妻丰满熟妇岳av无码区hd| 人人妻人人玩人人澡人人爽| 裸体丰满白嫩大尺度尤物| a级国产精品片在线观看| 四会市| 网友自拍视频精品区| 中文国产成人精品久久一| 91精品人人妻人人澡人人爽人人精东影业| 91香蕉国产亚洲一二三区| 中文字幕久久亚洲一区| 免费99精品久久七七桃花| av中文字幕无码免费看| 国产一级无码不卡视频| 国产成人av一区二区三| 精品人妻少妇嫩草AV无码专区| 最大胆裸体人体牲交| 婷婷97狠狠做五月深爱婷婷| av无码久久久久不卡蜜桃| 久久亚洲国产精品久久| 欧美在线观看a| 又黄又爽又色的少妇毛片| 国产午夜无码片在线观看影院|