瑣碎整理 DeepSeek V4 的有價值、有趣信息,明天我會有詳細(xì)點的文章出來
順序沒有規(guī)律,看到哪隨手貼的
1、神速上線的 Ollama
Ollama 提供了一鍵啟動 deepseek-v4-flash,還有一鍵接入 claude、codex、opencode、openclaw
![]()
,它啟用的 launch 命令,更是神之一筆
2、價格還會更低 ![]()
這個大家應(yīng)該都看過了
看來 DeepSeek 計劃大量使用華為進行推理
V4 到底用什么訓(xùn)練的?99% 可能性還是 N 卡
還有更離譜的猜測,不太正確,就不說了
3、量化團隊們可能會集體啞火
本次放出的模型是FP4 + FP8 混合精度
MoE 的專家參數(shù)采用了 FP4 精度
模型的大部分其他參數(shù)采用 FP8 精度
一是權(quán)重壓縮空間不大,二是這種架構(gòu)量化難度更大
![]()
這么火熱的模型,還不如和開源之時的盛況,幾個小時內(nèi)就有一堆不同實現(xiàn)路徑的量化版了
V4 Flash 實現(xiàn)尺寸壓縮的只有 Q2 的 105GB、Q3 的 135GB,都是 MLX 架構(gòu)
![]()
4、本地部署成本比想象中高
即便是 Flash 版本,我看 vlln/ascend 的教程也要 Atlas 800 A2 (64G × 8)
成本應(yīng)該是 110 萬往上吧?
![]()
對應(yīng)模型,權(quán)重300GB
![]()
5、股價波動——大家漲才是真的漲
國內(nèi)大漲,核心標(biāo)的,概念股都在漲
![]()
美國那邊,英偉達(dá),英特爾也在漲
![]()
![]()
大家猜猜什么邏輯?
6、不誘于譽,不恐于誹,率道而行,端然正己 ![]()
這段文字出自《荀子·非十二子》,是荀子對于君子修身與處世原則的極高概括。
感覺,做到太難了。。。
1. 心境的獨立(“不誘于譽,不恐于誹”)
這八個字探討的是如何應(yīng)對外部評價:
不誘于譽:面對名譽、贊美、鮮花與掌聲,內(nèi)心保持清醒,不被它們所誘惑、所裹挾。過度的贊美往往是認(rèn)知的陷阱,容易讓人迷失自我。
不恐于誹:面對誹謗、攻擊、質(zhì)疑與詆毀,內(nèi)心保持定力,不因此而恐懼、動搖或急于辯解。這是對內(nèi)心強大程度的極致考驗。
2. 行為的準(zhǔn)則(“率道而行,端然正己”)
這八個字探討的是應(yīng)當(dāng)如何自我約束與行動:
率道而行:遵循客觀的“道”(即事物的客觀規(guī)律、社會的正義原則),以此作為行動的唯一依據(jù),而不是為了迎合世俗或博取虛名。
端然正己:儀態(tài)端正,自我修養(yǎng)嚴(yán)謹(jǐn),從內(nèi)心到外在都保持正大光明的狀態(tài)。這是一種“內(nèi)圣外王”的修養(yǎng)境界。
![]()
我隨手測了閱讀理解+svg代碼生成+審美,結(jié)果是一言難盡,尤其是flash,更差
和上面的排名比較吻合
![]()
但是也有基準(zhǔn)(vibe coding)把它排開源第一
![]()
Artificial Analysis在 GDPval-AA 基準(zhǔn)中也給了V4 開源第一
![]()
PS:GDPval-AA是面向 “真實經(jīng)濟價值任務(wù)” 的大模型實用性評測基準(zhǔn),側(cè)重智能體(agentic)能力與職場生產(chǎn)力的綜合評估。
8、官方API測速
這是比較快的結(jié)果
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.