<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      實測DeepSeek V4:Agent能力領先開源,3D小票翻車,但經典洗車問題終于對了

      0
      分享至


      作者 | 博雯

      編輯 | Kino

      這個4月大模型領域真是神仙打架。

      先是4月16日發布的Claude Opus 4.7,然后是今天前后腳發布的GPT 5.5和DeepSeek V4。

      在頂級閉源模型的夾擊下,萬眾矚目的DeepSeek V4還是保持了一貫的底色:開源和極致性價比。

      開源模型鏈接,58頁的技術報告,全都一次性放了出來。現在登錄DeepSeek官網或App,就能用最新的DeepSeek V4。

      技術報告顯示,在Agent能力,世界知識測評,還有數學、STEM、競賽型代碼等多項能力測評中,DeepSeek-V4-Pro領先一眾開源模型,性能直逼Claude Opus 4.6、GPT-5.4、Gemini-Pro-3.1等頂級閉源模型,但其輸入輸出的成本,卻比這些模型低了好幾個數量級。


      那么,DeepSeek V4的實際表現究竟如何呢?我們從代碼能力、邏輯推理、長文本處理和風格化寫作這幾個核心維度,簡單進行了一番實測。


      代碼能力

      DeepSeek官方宣稱,目前DeepSeek-V4已成為公司內部員工使用的Agentic Coding模型,而且據評測反饋,DeepSeek-V4的使用體驗優于Claude Sonnet 4.5,交付質量接近Claude Opus 4.6的非思考模式,但仍與Opus 4.6思考模式存在一定差距。

      在實測中,我先讓DeepSeek V4生成一個暗黑、賽博朋克風格的介紹《GTA 6》的交互式網頁,它只思考了7秒,就寫出了一個融合了霓虹燈效果和粒子故障藝術的交互頁面,可以直接在瀏覽器中運行。

      網頁的模塊化布局非常清晰,不僅視覺審美在線,而且包含了很多細膩的交互細節,比如鼠標懸停在功能卡片上時,會觸發邊框發光和上浮效果,頁面背景還有動態粒子和連線特效。

      不過,在另一個更復雜的測試任務中,DeepSeek V4的表現就不那么理想了。

      我讓它在一個HTML文件中構建一個高度逼真的交互式3D紙質小票,模擬紙張受到拖拽的物理效果。

      首次耗時近10分鐘,卻生成了一張無法交互的空白小票。第二次雖然生成了完整小票,但視覺渲染有問題,小票不僅呈暗黑色、缺乏紙張的質感,而且是倒置的。最核心的拉扯交互效果也不正確,紙張呈現類似高彈史萊姆一樣的夸張形變,還有撕裂和穿模。


      推理能力

      除了寫代碼,我們也測試了幾道經典的邏輯陷阱題。比如9.9-9.11的計算題,可以看到V4雖然在思考過程中雖然幾次走入岔路,但最終還是給到了準確答案。


      再來一個曾經讓無數知名AI都翻車的“洗車難題”:我家附近50米就有洗車店,請問我應該怎么去?

      對于人來說,這是一個簡單到有點好笑的問題,但對于AI來說,它看到“50米”和“出行方式”,就會直接調用統計概率,然后直接輸出——短距離出行,步行是最高頻的答案。它處理的是信息,而不是現實。

      但對于更新后的D老師來說,不僅瞬間就明白了問題背后的深層含義:即這是在檢測它是否理解語境,測試邏輯能力,還認為自己要給出一個幽默又合理的回答。

      不知道是不是被偷偷調高了幽默值。


      還有值得注意的一點是, 2026年的AI競爭已經不只是模型跑分的事了,而是看誰能更好地嵌入開發者的工作流,誰能更好用。

      所以,DeepSeek-V4也專門針對Claude Code、OpenClaw、OpenCode、CodeBuddy這些主流Agent產品做了適配優化,在代碼任務、文檔生成任務等方面表現都有提升。


      長文本處理與風格化寫作能力

      就在一年前,百萬上下文還是只有頂尖閉源模型才玩得起的量級,普通模型要么是128k,要么也就200k。但現在,DeepSeek官方直接宣布,百萬上下文從此將成為DeepSeek所有官方服務的標配。

      也就是說,現在你跟DeepSeek-V4聊一次,就算把整個《三體》三部曲都丟進去,它也能記得上下文。

      我們簡單測了下,找了一本百萬字的《平凡的世界》,往里面隨機貼了一段《三體》的片段,很快,DeepSeek V4就找到了異常之處和具體內容。


      再丟給它今年新榜內容節的速記,合計超過10萬字,要求它整理其中的參賽嘉賓,并從中選出一條它認為有價值的演講,最終給出一份“AI新榜”風格的稿件。


      幾秒鐘之后,DeepSeek就給出了兩天全場內容節的嘉賓極其title,我們一一核對之后,發現都是正確的,而最終,DeepSeek選擇了第二天視頻號知名博主蕭大業的分享作為選題,并認為“在這樣一個技術氛圍濃厚的行業大會上,蕭老師回歸內容創作最本質的人文性和情感性,挺有反思價值的。”

      說實話,文筆不錯,網上常說的那種矯揉造作的“AI味兒”,或者鑒AI時常用的“破折號、奇怪的比喻、無限糾結于細節”的情況,基本沒有出現。


      不過,畢竟“AI新榜”還是以AI領域的選題為主的,于是我們指出了其選題上的問題,而且值得說道的是,在對話中,DeepSeek展現出了一種較為鮮明的立場和情緒,在我們指出后,它在思考中也展現出了相當具有辯證性的思考。


      最終,DeepSeek更換了選題,選擇了傅盛的演講,并表示“對于讀者來說,這種帶著具體操作細節、成本賬目和試錯過程的案例,比行業報告上的趨勢研判更有參考意義,也更有說服力。”

      這是最后的成品,同時也在這里放一篇我們在同一選題下的,大家可以自行對比:






      通篇閱讀之后的感覺是,因為上下文增加,所以在輸出長文檔上的效果好了一些,在其中也展現出了一些不錯的操作思路,比如會以比較有噱頭的“受傷拄拐”開頭,也知道先說案例,再講技術。

      但問題也有,比如比起自己構思一條貫通全文的主線,更傾向于以演講內容的時間線來排布內容,再比如,D老師經典的“不是……(而)是”的句式仍然很多。


      為什么還不做文生圖?

      因為DeepSeek屬于另一個賽道



      為什么DeepSeek還是沒有文生圖功能?

      這確實道出了最普通用戶的疑惑,那就是在這個AI產品加速迭代,各路文生圖、文生視頻、文生音頻的功能全都不要錢似得往上堆的情況下,為什么曾經打響了國產AI大模型熱戰第一槍的DeepSeek,卻依舊是簡簡單單,老老實實,只有一個純文字生成?

      一方面確實是因為,文生圖是完全不同的架構,另一方面也是因為,DeepSeek的主賽道確實不在這里。

      開源+極致性價比,這才是DeepSeek的核心競爭力。

      在這次公布出來的價格上,DeepSeek延續了它當年550萬美元的極致性價比神話。兩個版本,更專業的V4-Pro百萬Token輸入12元,輸出24元,更小更便捷的V4-Flash輸入0.2元,輸出2元。

      對比一下性能相似的其他頂級模型們:Claude Sonnet 4.6輸入3美元,輸出15美元;Claude Opus 4.7輸入5美元(約36元),輸出25美元(約180元);GPT-5.5 Pro輸入30美元(約216元),輸出180美元(約1296元)……

      可以說,完全不是一個數量級。


      而且還沒完,DeepSeek官方發布里提到,受限于高端算力,目前Pro的服務吞吐十分有限,下半年華為昇騰950超節點批量上市后,Pro的價格還會大幅下調。

      在性能已經逼近頂級閉源模型的情況下,用只有零頭的價格,就能用到“接近Opus 4.6非思考模式”的性能,這對于大量中小團隊和獨立開發者的意義不言而喻。

      所以,DeepSeek賣的不是“最強”,也不是“全能”,而是“開源、便宜、且仍在快速進步”。

      回頭看這半年,DeepSeek的傳言不斷。從年初開始,V4的發布傳聞幾經“跳票”,到2月Anthropic指控它蒸餾Claude的技術,鬧得沸沸揚揚,再到最近融資消息傳了一個版本又一個版本,金額從100億炒到200億。

      外界的劇本寫得跌宕起伏,直到今天,主角才接戲。

      發布最后,DeepSeek引用了《荀子·非十二子》的一句話:"不誘于譽,不恐于誹,率道而行,端然正己。"

      翻譯成人話大概是:別夸我,也別罵我,我有自己的路要走。

      當然,定力值不值得鼓掌,最終還是要看產品。V4已經來了,市場會用腳投票。

      歡迎分享、點贊、推薦

      一起研究AI

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國男足3-1淘汰沙特,何思凡炸裂:人球分過+無敵擺脫后飆世界波

      中國男足3-1淘汰沙特,何思凡炸裂:人球分過+無敵擺脫后飆世界波

      側身凌空斬
      2026-05-16 03:17:34
      500米林帶停了百余輛車?公益訴訟檢察官這樣“破局”

      500米林帶停了百余輛車?公益訴訟檢察官這樣“破局”

      上觀新聞
      2026-05-15 21:06:12
      泰國警方:芭提雅中國軍火嫌犯目的為了應對柬埔寨詐騙集團之間的內部沖突,而不是針對泰國展開行動

      泰國警方:芭提雅中國軍火嫌犯目的為了應對柬埔寨詐騙集團之間的內部沖突,而不是針對泰國展開行動

      曼谷陳大叔
      2026-05-13 15:39:16
      拉夫羅夫在金磚記者會突然發火:“再不關手機,安保會掏槍”

      拉夫羅夫在金磚記者會突然發火:“再不關手機,安保會掏槍”

      桂系007
      2026-05-16 04:35:32
      幣安宣布下架5種代幣,最高跌幅超33%

      幣安宣布下架5種代幣,最高跌幅超33%

      灰度測試中
      2026-05-15 03:55:28
      買下之后迅速賣出!33歲老射手無人信任,雙逆足難題仍存在

      買下之后迅速賣出!33歲老射手無人信任,雙逆足難題仍存在

      里芃芃體育
      2026-05-16 00:15:06
      穆帥:我已經收到本菲卡續約報價;目前和皇馬沒有任何接觸

      穆帥:我已經收到本菲卡續約報價;目前和皇馬沒有任何接觸

      懂球帝
      2026-05-15 17:50:14
      俄羅斯超大艦隊進入東海

      俄羅斯超大艦隊進入東海

      烽火觀天下
      2026-05-14 10:58:42
      昨天還是“帝國主義走狗”,今天就在克里姆林宮喝酒

      昨天還是“帝國主義走狗”,今天就在克里姆林宮喝酒

      小院之觀
      2026-05-14 12:58:05
      和中國女友同居后,俄羅斯男生發現26℃空調成了戰場

      和中國女友同居后,俄羅斯男生發現26℃空調成了戰場

      晚風也遺憾
      2026-05-15 01:54:10
      14歲男生被蛇咬后淡定上課,看黑板模糊以為是近視,下午就醫才發現是銀環蛇咬的,醫生:再晚一兩個小時,后果不堪設想

      14歲男生被蛇咬后淡定上課,看黑板模糊以為是近視,下午就醫才發現是銀環蛇咬的,醫生:再晚一兩個小時,后果不堪設想

      揚子晚報
      2026-05-15 10:20:33
      你發現沒有,凡是結婚時不主動提彩禮的,女方家庭通常就是以下兩種情況

      你發現沒有,凡是結婚時不主動提彩禮的,女方家庭通常就是以下兩種情況

      心理觀察局
      2026-05-08 09:32:04
      國宴的頂級國風,盡顯東方之美!卻被外國元首的兒媳旗袍裝驚艷

      國宴的頂級國風,盡顯東方之美!卻被外國元首的兒媳旗袍裝驚艷

      白宸侃片
      2026-05-16 01:34:42
      一夜降價2000元!庫克來中國后深夜送上大禮,國產機真慌了?

      一夜降價2000元!庫克來中國后深夜送上大禮,國產機真慌了?

      科技專家
      2026-05-15 14:28:20
      張藝謀也沒想到,養了27年的陳婷,竟會親手摘掉張藝謀妻子的認證

      張藝謀也沒想到,養了27年的陳婷,竟會親手摘掉張藝謀妻子的認證

      混沌錄
      2026-05-14 15:58:14
      一手術人就廢了?醫生:這6疾病保守治療更好,動刀反而過度醫療

      一手術人就廢了?醫生:這6疾病保守治療更好,動刀反而過度醫療

      岐黃傳人孫大夫
      2026-05-13 10:00:10
      王楚欽風波升級!官媒發文批評,言辭犀利,難怪國家體育總局出手

      王楚欽風波升級!官媒發文批評,言辭犀利,難怪國家體育總局出手

      阿鳧愛吐槽
      2026-05-14 21:26:37
      成人片女星許諾薩福諾夫奪歐冠將共度良宵,球員妻子爆粗回應

      成人片女星許諾薩福諾夫奪歐冠將共度良宵,球員妻子爆粗回應

      懂球帝
      2026-05-14 15:58:14
      中國股市唯一賺錢最快思路:持有一只股,保留30%倉位,長期做T!

      中國股市唯一賺錢最快思路:持有一只股,保留30%倉位,長期做T!

      股經縱橫談
      2026-05-15 19:18:34
      多名院士調查發現:吃一口隔夜剩米飯,等于進一次毒?

      多名院士調查發現:吃一口隔夜剩米飯,等于進一次毒?

      鬼菜生活
      2026-05-14 18:27:08
      2026-05-16 05:20:49
      頭號AI玩家 incentive-icons
      頭號AI玩家
      做內容從業者關心的AI研究
      438文章數 23關注度
      往期回顧 全部

      科技要聞

      直降千元起步!蘋果華為率先開啟618讓利

      頭條要聞

      黃仁勛在北京喝豆汁痛苦皺眉 問“這是什么東西”

      頭條要聞

      黃仁勛在北京喝豆汁痛苦皺眉 問“這是什么東西”

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經要聞

      騰訊掉隊,馬化騰戳破真相

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態度原創

      健康
      本地
      游戲
      數碼
      公開課

      專家揭秘干細胞回輸的安全風險

      本地新聞

      用蘇繡的方式,打開江西婺源

      《街霸6》春麗新品來了!招牌肉腿完美還原

      數碼要聞

      聯想發布ThinkPad T14 Gen 7 支持LPCAMM2可更換內存

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 女人被爽到高潮视频免费国产| 午夜精品无码| 26uuu在线亚洲欧美| 亚洲综合黄色的在线观看| 蜜臀久久99精品久久久久久酒店| 国产男女无遮挡猛进猛出| 久草smc| 婷婷综合久久中文字幕蜜桃三电影| 日韩免费无码一区二区视频| 国产欧美日韩精品丝袜高跟鞋| 亚洲国产精品乱码一区二区三区| 久久人人97超碰精品| 欧美亚洲国产日韩一区二区三区| 亚洲系列国产精品制服丝袜第| 黄平县| 欧美在线综合视频| 国产天美传媒性色av高清| 中文字幕亚洲有码| 亚洲成人动漫在线| 91人妻熟妇在线视频| 鲁丝无码一区二区三区| 中文字幕成人精品久久不卡| 中文字幕在线一区二区在线| 亚洲区小说区激情区图片区| 精品1卡二卡三卡四卡老狼| 日韩亚洲欧美中文在线| 日韩中文三级| 国产又黄又湿又色又刺激| 国产成人精品久久一区二区| 曰韩精品无码一区二区三区| 青青草视频在线观看| 深夜福利视频在线观看| 77777亚洲午夜久久多人| 97在线一区二区三区| 亚洲精品久久久一区| 精品无码av一区二区三区不卡 | 免费A级毛片免费观看视频| 性欧美老人牲交XXXXX视频| 超碰人人超碰人人| 影音先锋2020色资源网| 91美女网站|