<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      1/10成本、Opus 4.7級表現(xiàn),Cursor甩出了性價比之王Composer 2.5

      0
      分享至



      機器之心編輯部

      「以 1/10 的成本,性能幾乎追平 Claude Opus 4.7 這個級別的模型。」

      它就是 Cursor 今天凌晨亮出的迄今為止最強大的模型 ——Composer 2.5

      官方表示,Composer 2.5更加智能,更擅長處理耗時較長的持續(xù)任務(wù),并且在遵循復(fù)雜指令方面也更為可靠

      未來一周內(nèi),Cursor 將會把該模型原本附贈 / 包含的使用額度翻倍。



      相比 Composer 2,Composer 2.5 在智能水平和行為表現(xiàn)上都有顯著提升。



      通過擴大訓(xùn)練規(guī)模、構(gòu)建更復(fù)雜的強化學(xué)習(xí)環(huán)境,并引入新的學(xué)習(xí)方法,Cursor 全面改進了 Composer。

      除了在更困難的任務(wù)上訓(xùn)練 Composer 2.5 外,Cursor 還優(yōu)化了模型的溝通風(fēng)格、努力程度校準等行為層面的表現(xiàn)。這些維度現(xiàn)有基準測試無法很好地衡量,但它們對實際使用體驗至關(guān)重要。

      可以看到,Composer 2.5 在同等能力的模型中,它的成本效率最高可高出 10 倍



      值得關(guān)注的是,Composer 2.5 基于與 Composer 2 相同的開源檢查點構(gòu)建,即月之暗面的 Kimi K2.5



      Cursor 還宣布了與 SpaceXAI 的合作:雙方將從零開始訓(xùn)練一個規(guī)模大得多的模型,總算力投入是此前的 10 倍。借助 Colossus 2 的百萬塊 H100 等效算力,以及雙方積累的數(shù)據(jù)和訓(xùn)練技術(shù),預(yù)計這將是模型能力的一次重大飛躍。

      馬斯克發(fā)推呼吁大家伙使用 Composer 2.5,并表示該模型的訓(xùn)練有一部分是在 Colossus 2 上進行的。



      Cursor 創(chuàng)始人稱,「我們在強化學(xué)習(xí)方面已經(jīng)做得極其出色了。Composer 2.5 完成了越級挑戰(zhàn),其表現(xiàn)遠遠超出了它這個參數(shù)規(guī)模應(yīng)有的水平。對于下一個版本,我們無比興奮。我們將與 SpaceXAI 一起,大幅擴展模型規(guī)模和算力投入。」



      Composer 2.5 訓(xùn)練體系

      Composer 2.5 的訓(xùn)練體系引入了多項新改進,這些改進同時針對模型智能和可用性。

      一是,基于文本反饋的精準強化學(xué)習(xí)

      隨著單次推理過程可能長達數(shù)十萬 token,強化學(xué)習(xí)中的功勞分配正成為一個日益嚴峻的挑戰(zhàn)。當獎勵是基于整個推理過程計算時,模型很難分辨到底是哪一個具體決策幫助或損害了最終結(jié)果。當我們想要抑制某個局部行為,比如一次錯誤的工具調(diào)用、一處令人困惑的解釋,或是一種風(fēng)格違規(guī),這種局限性尤其明顯。最終獎勵能告訴我們出了某種問題,但對于問題出在哪里,它只是一個充滿噪聲的信號。

      為解決這一問題,Cursor 用精準文本反饋來訓(xùn)練 Composer 2.5。思路是:在模型推理軌跡中本可以表現(xiàn)更好的那個具體節(jié)點,直接給出反饋。針對目標模型消息,Cursor 構(gòu)造一個簡短的提示,描述期望的改進方向,將其插入局部上下文,并將得到的模型概率分布作為「教師」。同時,以原始上下文中的策略作為「學(xué)生」,加入一個同策略蒸餾 KL 損失,將學(xué)生的 token 概率向教師的概率拉近。這樣一來,既能獲得對目標行為的局部化訓(xùn)練信號,又保留了基于完整軌跡的整體強化學(xué)習(xí)目標。

      以文本反饋過程為例:設(shè)想一個漫長的推理過程,其中包含一次工具調(diào)用錯誤:模型試圖調(diào)用一個并不存在的工具。過程中,模型會收到「未找到工具」的錯誤提示,并繼續(xù)做出其他有效的工具調(diào)用。在數(shù)百次工具調(diào)用中出現(xiàn)一次錯誤,對其最終獎勵的影響微乎其微。

      借助文本反饋,可以精準定位這一具體錯誤:在出錯的那一輪上下文中插入一條提示,如「提醒:可用工具有……」并附上可用工具列表。這條提示改變了教師模型的概率分布,降低了錯誤工具的調(diào)用概率,提高了有效替代方案的概率。然后,僅針對那一輪,將學(xué)生權(quán)重向新的概率分布更新。

      在 Composer 2.5 的訓(xùn)練過程中,Cursor 將這一方法應(yīng)用于多種模型行為,從代碼風(fēng)格到模型溝通方式。



      二是,合成數(shù)據(jù)

      在強化學(xué)習(xí)訓(xùn)練期間,Composer 的編程能力會顯著提升,直到能正確完成大部分訓(xùn)練任務(wù)。為了持續(xù)提升智能水平,Cursor 在整個訓(xùn)練過程中動態(tài)篩選并創(chuàng)建更困難的任務(wù)。Composer 2.5 使用的合成任務(wù)數(shù)量是 Composer 2 的 25 倍

      Cursor 采用了多種方法來創(chuàng)建基于真實代碼庫的合成任務(wù)。例如,其中一種方法是「功能刪除」:給智能體一個包含大量測試用例的代碼庫,要求它以某種方式刪除代碼和文件,使得代碼庫在移除某些可測試功能后仍能保持運行。合成任務(wù)就是重新實現(xiàn)被刪除的功能,而測試用例則用作可驗證的獎勵。

      大規(guī)模創(chuàng)建合成任務(wù)帶來的一個附帶后果是,它可能引發(fā)意想不到的獎勵破解行為。

      隨著模型能力越來越強,Composer 2.5 找到越來越精巧的變通方法來完成任務(wù)。有一個例子是,模型找到了一個遺留的 Python 類型檢查緩存,并逆向工程其格式,從而找到了一個被刪除的函數(shù)簽名。另一個例子中,它找到并反編譯了 Java 字節(jié)碼,重建了一個第三方 API。Cursor 通過智能體監(jiān)控工具發(fā)現(xiàn)并診斷了這些問題,但它們也說明,大規(guī)模強化學(xué)習(xí)需要越來越謹慎。



      三是,分片 Muon 與雙網(wǎng)格 HSDP

      在持續(xù)預(yù)訓(xùn)練中,Cursor 采用分布式正交化的 Muon 優(yōu)化器。生成動量更新后,以模型的自然粒度運行 Newton-Schulz 迭代:對注意力投影按每個注意力頭處理,對堆疊的 MoE 權(quán)重按每個專家處理。

      主要開銷來自專家權(quán)重的正交化。對于分片參數(shù),將同形狀的張量分批處理,通過全量交換(all-to-all)將分片匯聚為完整矩陣,運行 Newton-Schulz,再通過全量交換將結(jié)果傳回原始分片布局。這些傳輸是異步的:當一個任務(wù)在等待通信時,優(yōu)化器運行時會推進其他 Muon 任務(wù),使網(wǎng)絡(luò)傳輸與計算重疊。這等效于全矩陣 Muon,但能保持分片組持續(xù)忙碌;在 1T 參數(shù)模型上,優(yōu)化器單步耗時僅 0.2 秒。

      這與 Cursor 為 MoE 模型使用 HSDP 的方式密切相關(guān)。HSDP 構(gòu)成多個 FSDP 副本,并在對應(yīng)的分片之間進行梯度的全歸約操作。Cursor 對非專家權(quán)重和專家權(quán)重使用各自獨立的 HSDP 布局:非專家權(quán)重相對較小,其 FSDP 組可以保持較窄的范圍,通常在一個節(jié)點或機架內(nèi);而專家權(quán)重承載了絕大部分參數(shù)和大部分 Muon 計算量,因此使用更寬的專家分片網(wǎng)格。

      保持這些布局獨立還能讓獨立的并行維度得以重疊:例如 CP=2 和 EP=8 可以在 8 塊 GPU 上運行,而不需要在單一共享網(wǎng)格中占用 16 塊。這樣既避免了小型非專家狀態(tài)的大范圍通信,又將專家優(yōu)化器的計算工作分攤到更多 GPU 上。

      Composer 2.5 定價

      Composer 2.5 定價為每百萬輸入 token 0.50 美元每百萬輸出 token 2.50 美元

      另有一個速度更快、智能水平相同的變體,定價為每百萬輸入 token 3.00 美元,每百萬輸出 token 15.00 美元,比其他前沿模型的快速版更便宜。

      博客地址:https://cursor.com/blog/composer-2-5

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      科技大佬也躲不過!黃仁勛的指甲被網(wǎng)友云診斷成灰指甲 醫(yī)生回應(yīng)

      科技大佬也躲不過!黃仁勛的指甲被網(wǎng)友云診斷成灰指甲 醫(yī)生回應(yīng)

      快科技
      2026-05-19 11:47:11
      潔麗雅風(fēng)波意外帶火同行,山東“毛巾老板”遭誤認后亮結(jié)婚證自證“無三原配”,錯位流量兩天漲粉8萬銷售額破百萬

      潔麗雅風(fēng)波意外帶火同行,山東“毛巾老板”遭誤認后亮結(jié)婚證自證“無三原配”,錯位流量兩天漲粉8萬銷售額破百萬

      大風(fēng)新聞
      2026-05-19 10:08:05
      馬斯克怒噴達美航空棄用星鏈服務(wù) 高管反擊:亞馬遜競品更便宜、功能更多

      馬斯克怒噴達美航空棄用星鏈服務(wù) 高管反擊:亞馬遜競品更便宜、功能更多

      財聯(lián)社
      2026-05-19 04:02:12
      小寶與王某雷,誰探訪花的數(shù)量更多?

      小寶與王某雷,誰探訪花的數(shù)量更多?

      挪威森林
      2026-01-31 12:15:26
      日本媒體震驚:中國拋棄日式暴利,“去日本化”,江蘇宜興立功了

      日本媒體震驚:中國拋棄日式暴利,“去日本化”,江蘇宜興立功了

      掉了顆大白兔糖
      2026-05-18 19:25:51
      接手爛攤子!阿隆索官宣執(zhí)教切爾西,將面臨三大絕境難題!

      接手爛攤子!阿隆索官宣執(zhí)教切爾西,將面臨三大絕境難題!

      田先生籃球
      2026-05-18 11:11:43
      山東103歲醫(yī)生免費給人看病,臨終前告訴妻子:其實我是一名日軍

      山東103歲醫(yī)生免費給人看病,臨終前告訴妻子:其實我是一名日軍

      興趣知識
      2026-05-18 00:49:57
      為什么“地下停車位”突然沒人買了?內(nèi)行人說出實情,恍然大悟

      為什么“地下停車位”突然沒人買了?內(nèi)行人說出實情,恍然大悟

      笑熬漿糊111
      2026-05-19 00:05:12
      歷史上最炸裂的3個MVP:喬丹奧尼爾榜上有名,現(xiàn)役僅庫里入選!

      歷史上最炸裂的3個MVP:喬丹奧尼爾榜上有名,現(xiàn)役僅庫里入選!

      錢說體育
      2026-05-19 12:51:40
      澤連斯基怎么都沒料到,下令攻打俄羅斯核電站,反而遭殃是烏克蘭

      澤連斯基怎么都沒料到,下令攻打俄羅斯核電站,反而遭殃是烏克蘭

      一盅情懷
      2026-05-19 13:10:40
      瞞天過海!日本深夜爆出驚天丑聞!

      瞞天過海!日本深夜爆出驚天丑聞!

      回京歷史夢
      2026-05-18 17:35:22
      地產(chǎn)公司副總10年受賄1.6億元!上海檢察機關(guān)兩次補充起訴,20余名關(guān)聯(lián)人員被連根拔起

      地產(chǎn)公司副總10年受賄1.6億元!上海檢察機關(guān)兩次補充起訴,20余名關(guān)聯(lián)人員被連根拔起

      極目新聞
      2026-05-19 12:31:19
      新生兒腰斬、房價下跌?別怪政策了,這才是中國經(jīng)濟的殘酷真相!

      新生兒腰斬、房價下跌?別怪政策了,這才是中國經(jīng)濟的殘酷真相!

      冷夜說
      2026-05-11 20:31:08
      人老了,只剩一個人的時候,千萬要記住:1、不要再找老伴兒…

      人老了,只剩一個人的時候,千萬要記住:1、不要再找老伴兒…

      富書
      2026-04-30 23:20:06
      700項物資直接斷供,中方重拳出擊,大難臨頭,日本竟全員鴕鳥化

      700項物資直接斷供,中方重拳出擊,大難臨頭,日本竟全員鴕鳥化

      西北漢子
      2026-05-19 09:07:39
      多爾袞十世孫向國家索要故宮,稱是自家祖產(chǎn),老朱家:有問過我嗎

      多爾袞十世孫向國家索要故宮,稱是自家祖產(chǎn),老朱家:有問過我嗎

      銘記歷史呀
      2026-05-18 18:15:59
      斯洛伐克總理菲佐回懟德國總理默茨:我去不去莫斯科,關(guān)他什么事?還有幾個國家拒絕開放領(lǐng)空,令人震驚!

      斯洛伐克總理菲佐回懟德國總理默茨:我去不去莫斯科,關(guān)他什么事?還有幾個國家拒絕開放領(lǐng)空,令人震驚!

      極目新聞
      2026-05-18 09:49:50
      西媒:穆帥這次仍會邀請一名皇馬舊將入教練組,最想要勞爾

      西媒:穆帥這次仍會邀請一名皇馬舊將入教練組,最想要勞爾

      懂球帝
      2026-05-19 06:32:14
      “慰安椅”根本不是椅子,是把十七歲姑娘活生生碾碎的吃人機器!

      “慰安椅”根本不是椅子,是把十七歲姑娘活生生碾碎的吃人機器!

      非虛構(gòu)人間
      2026-05-16 15:47:00
      一村62人先后罹患癌癥和白血病,村民懷疑與村里工廠有關(guān),連續(xù)舉報四年無果,區(qū)生態(tài)環(huán)境分局拒絕信息公開

      一村62人先后罹患癌癥和白血病,村民懷疑與村里工廠有關(guān),連續(xù)舉報四年無果,區(qū)生態(tài)環(huán)境分局拒絕信息公開

      蓬勃新聞
      2026-05-19 12:42:05
      2026-05-19 13:56:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      13031文章數(shù) 142651關(guān)注度
      往期回顧 全部

      科技要聞

      蘋果WWDC26定檔6月9日凌晨:iOS27將亮相

      頭條要聞

      賴清德彈劾案未通過:同意票56張未達門檻 但仍創(chuàng)紀錄

      頭條要聞

      賴清德彈劾案未通過:同意票56張未達門檻 但仍創(chuàng)紀錄

      體育要聞

      58順位的保羅,最強第三中鋒

      娛樂要聞

      張雪峰42歲冥誕,學(xué)生家長自發(fā)緬懷

      財經(jīng)要聞

      從賣流量到賣Token,運營商算力生意破局

      汽車要聞

      試駕與眾07:首搭CEA架構(gòu) 德味操控+聰明大腦

      態(tài)度原創(chuàng)

      家居
      時尚
      數(shù)碼
      教育
      房產(chǎn)

      家居要聞

      觀山隱秀 心靈沉淀

      休閑闊腿褲怎么穿才美?看看這些穿搭公式,解鎖不重樣的造型

      數(shù)碼要聞

      蘋果或在今年秋季推出大改款 Apple Watch Ultra 4

      教育要聞

      爸爸1米75,媽媽1米65,兒子12歲長到1米77

      房產(chǎn)要聞

      7516元/㎡,161套一次全甩!海口住宅最低價出現(xiàn)了!

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲无码在线观看视频| 国产午夜手机精彩视频| 一二三四视频社区在线| 午夜欧美精品久久久久久久| 久久精品成人无码观看56| 我国产码在线观看av哈哈哈网站 | 无码国内精品久久人妻蜜桃| 亚洲欧洲自拍| 性史性农村dvd毛片| 免费高清a毛片| 高潮在线欧美一区| 国产三级片网站| 亚洲精品久久久久久婷婷| 中文字幕乱码亚洲中文在线| 国产精品护士在线播放| 中文字幕无线乱码人妻| 日韩一区二区av| 久久riAV1| 99久久国产福利自产拍| 深夜免费av在线观看| 色优久久久久综合网鬼色| 99久久久无码国产精品秋霞网| 青青草AV一区二区三区| 97夜夜澡人人双人人人喊 | 无套内谢孕妇毛片免费看看| 18禁无遮挡国产免费观看| 欧美日韩午夜| 国产精品自拍视频网站| 免费观看又色又爽又黄的崩锅| 亚洲国产精品一区二区成人片| 都匀市| 在线观看免费人成视频播放| a毛看片免费观看视频| 极品熟妇大蝴蝶20p| 特黄aaaaaaa片免费视频| 自慰无码一区二区三区| 色欲色香天天天综合网站免费| 成人性爱在线观看| 国产精品盗摄!偷窥盗摄| 精品乱码一区二区| 国内少妇人妻偷人精品视频|