<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      無需訓練、即插即用,這個解碼方法讓模型學會謹慎思考

      0
      分享至

      你有沒有發現這樣一種現象:面對同一個問題,大模型可能在每次回答時都給出不同答案。一個不容忽視的問題是,這種不確定性,是否意味著推理仍不穩定?

      隨著技術的發展,大模型在自然語言處理和多模態任務中已經表現出越來越強的性能。傳統解碼策略主要包括隨機采樣(random sample)和貪婪解碼(greedy decoding)。例如,ChatGPT、Claude、Gemini 等大模型默認的是隨機采樣(random sample),即便是回答相同的問題,它們可能每次都會給出不同的答案。

      而貪婪解碼(greedy decoding)在一般的基準測試(benchmark)上表現會有所提升,特別是在推理性任務上。但是,模型在不確定情況下的表現仍不理想。

      為解決上述問題,美國東北大學與 Adobe、美國凱斯西儲大學聯合團隊提出了一種無需訓練的新型解碼策略,名為“謹慎下一步預測(CNTP,Cautious Next Token Prediction)”。

      該策略旨在通過在模型不確定性高的步驟采樣多個候選路徑,并選擇困惑度最低的路徑。相較于隨機采樣和貪婪解碼等傳統策略,CNTP 顯著提升了大模型在多種任務上的推理準確度,可應用場景包括語音助手、視覺助手、聊天機器人等。


      圖丨相關論文(來源:arXiv)

      “我們的研究證明了 Transformer 模型下一個詞元預測(next token prediction)的范式,有可能實現真正的智能。”該論文第一作者王亦周對 DeepTech 表示。他目前正在東北大學攻讀博士學位,主要研究方向包括大模型、多模態模型和計算機視覺,即將加入 Adobe 擔任研究科學家/工程師。


      圖丨王亦周(來源:王亦周)

      Safe Superintelligence 公司創始人、前 OpenAI 首席科學家伊爾亞·蘇茨克維(Ilya Sutskever)曾公開表示,如果模型足夠強大,對下一個 token 的預測能力可能反映對世界的某種理解,這可能是實現更深層智能的關鍵路徑。

      也就是說,next token prediction 是智能的核心。要實現這一點,需要在模型內部進行強推理,再通過一系列計算預測下一個 token。

      受此啟發,研究團隊從人類認知行為中尋找靈感:人在思考時,往往越謹慎回答,結果的準確率越高,那么大模型會不會也和人腦有類似的機制?

      王亦周解釋道:“這種過程類似于我們在參加考試時的解題過程,我們可能會先想下有哪些解法,然后從中挑選一種認為最有把握的方法,確認無誤后再進行下一步,直到得到完整的證明。”


      圖丨 CNTP 方法概述(來源:arXiv)

      這里的謹慎指的是,當面對不確定性的情況,需要多嘗試幾條不同的路徑,然后選擇一條最穩妥、最可信的路徑。

      研究團隊用熵作為模型不確定性的衡量標準:熵越高越不可信。在自然語言處理(NLP)中,困惑度(perplexity)越低代表對答案越可信。因此在 CNTP 策略下,一旦熵值較高,模型會采樣多個候選路徑,并選擇其中困惑度最低的一條,再一步步迭代。

      研究人員通過消融研究證明,由于思維鏈推理的回答往往較長,每條路徑長度也不同,如果算完整評估的困惑度無法很好地衡量答案的可靠性。基于此,他們采取了每到一句話的標點符號截止的方式來計算困惑度。相當于每句話、每個小的推理單元,即每個局部自洽能夠實現較理想的效果。

      為控制采樣次數,研究團隊通過設置最小熵 Hmin 和最大熵 Hmax 兩個閾值和最大試驗次數 Nmax。該方法在提高解碼準確性的同時,還有效地限制了計算成本,避免了在每個步驟大量采樣而帶來的高計算開銷。


      (來源:arXiv)

      在實驗驗證方面,該團隊在數學推理(GSM8K、MATH)、常識推理(StrategyQA)和開放問答(TruthfulQA)等任務中證明,與包括貪婪解碼、隨機解碼和束搜索在內的傳統方法相比,CNTP 策略的結果更具優勢。

      例如,在 TruthfulQA 任務中,Llama-2-7B 在使用 CNTP 方法后,真實性準確率提升到了 84.8%,相較于隨機解碼提升 6.8%。

      值得關注的是,CNTP 策略無需訓練,僅解碼即可直接實現提升性能。王亦周解釋道:這種方法在某種程度上像“免費午餐”,盡管可能會帶來更多的 token 消耗,但在實際應用中有很多優化的方法可解決該問題。


      (來源:arXiv)

      此外,該方法搭配自一致性(self-consistency)后,可進一步提升性能(注:自一致性是取多個樣本,然后選一個出現頻率最高的答案),且計算成本遠低于后者。原因在于,利用多樣性和隨機性集思廣益后,選取多數投票。

      研究團隊證明,每個樣本也是越謹慎越好。“我們的方法會在一定程度上限制它的多樣性,但通過調高溫度可以解決這一點,所以它能進一步提升。”王亦周說。

      此外,CNTP 策略具有較好的普適性,可用于廣泛的對話任務。除了有固定答案的數學題或代碼題,它也可以用于開放式問題,研究團隊未來將嘗試將該策略用于圖像或視頻生成。

      該研究為大模型的推理優化提供了一種新思路,有望成為下一代解碼策略的重要候選方案。

      參考資料:

      1.相關論文:https://arxiv.org/abs/2507.03038v2

      2.code link:https://github.com/wyzjack/CNTP

      排版:劉雅坤

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      門店給顧客發有償陪睡信息?滬上阿姨:已報警,賬號疑被盜用

      門店給顧客發有償陪睡信息?滬上阿姨:已報警,賬號疑被盜用

      南方都市報
      2026-05-12 17:39:36
      不再妥協!法國準總統明確立場,膽敢介入臺海,直接核反擊

      不再妥協!法國準總統明確立場,膽敢介入臺海,直接核反擊

      完善法
      2026-05-12 01:35:01
      知情人士:阿聯酋秘密打擊伊朗,正式成為參戰方,4月初曾襲擊伊朗拉旺島一座煉油廠

      知情人士:阿聯酋秘密打擊伊朗,正式成為參戰方,4月初曾襲擊伊朗拉旺島一座煉油廠

      每日經濟新聞
      2026-05-12 21:45:10
      下降6%!一季度結婚數再創新低,同比減少11萬對,離婚數也少了

      下降6%!一季度結婚數再創新低,同比減少11萬對,離婚數也少了

      網易新聞出品
      2026-05-12 15:45:59
      起底 Token 中轉黑色產業鏈:日賺 200 萬美金!大佬扎堆入局,灰色套利套路碾壓現金貸

      起底 Token 中轉黑色產業鏈:日賺 200 萬美金!大佬扎堆入局,灰色套利套路碾壓現金貸

      新浪財經
      2026-05-12 00:15:49
      特朗普訪華隨行團名單里,藏著一份重要轉向密碼

      特朗普訪華隨行團名單里,藏著一份重要轉向密碼

      識局Insight
      2026-05-12 19:33:20
      網友屏蔽“愛國流量”名人企業,司馬南、華為上榜,評論區太認同

      網友屏蔽“愛國流量”名人企業,司馬南、華為上榜,評論區太認同

      譚談社會
      2026-05-12 16:50:17
      吃他汀一顆南瓜子不能碰?提醒:不止南瓜子,這4樣食物也要小心

      吃他汀一顆南瓜子不能碰?提醒:不止南瓜子,這4樣食物也要小心

      芹姐說生活
      2026-05-12 16:25:54
      3分鐘傾家蕩產?年入千億“精神鴉片”,正精準掏空中國人的錢包

      3分鐘傾家蕩產?年入千億“精神鴉片”,正精準掏空中國人的錢包

      趣文說娛
      2026-05-12 19:53:22
      女子推搡哨兵后續:官媒發聲,知情人爆料,恐不止坐牢這么簡單

      女子推搡哨兵后續:官媒發聲,知情人爆料,恐不止坐牢這么簡單

      千言娛樂記
      2026-05-12 15:10:56
      貪官末日來了!中央反腐新規5月重磅落地,在職退休一律終身追責

      貪官末日來了!中央反腐新規5月重磅落地,在職退休一律終身追責

      宏哥談商道
      2026-05-12 19:00:03
      暴跌65%,中年人最愛的豪車也崩了!

      暴跌65%,中年人最愛的豪車也崩了!

      蔣東文
      2026-05-12 21:16:35
      復旦解剖326名糖尿病逝者,意外發現:得糖尿病的人,大多有5共性

      復旦解剖326名糖尿病逝者,意外發現:得糖尿病的人,大多有5共性

      芹姐說生活
      2026-05-12 15:38:02
      曝東契奇要求湖人留下里夫斯!詹姆斯去留棘手:騎勇很可能招攬他

      曝東契奇要求湖人留下里夫斯!詹姆斯去留棘手:騎勇很可能招攬他

      羅說NBA
      2026-05-12 21:43:19
      這和不穿有啥區別?內衣外穿,趙露思演唱會“辣眼”穿搭,被眾嘲

      這和不穿有啥區別?內衣外穿,趙露思演唱會“辣眼”穿搭,被眾嘲

      以茶帶書
      2026-05-11 23:15:37
      12歲男孩確診癌癥晚期!研究證實:這5種添加劑正在升高癌癥風險……

      12歲男孩確診癌癥晚期!研究證實:這5種添加劑正在升高癌癥風險……

      環球網資訊
      2026-05-11 14:21:45
      蘋果AI眼鏡官宣:40克超輕,戴上自動調度數

      蘋果AI眼鏡官宣:40克超輕,戴上自動調度數

      呼呼歷史論
      2026-05-11 00:22:15
      浙大鄭強教授:我不承認中國大學生就業難,是舒服的工作難找,建議少點抱怨少點索取

      浙大鄭強教授:我不承認中國大學生就業難,是舒服的工作難找,建議少點抱怨少點索取

      TOP大學來了
      2026-05-11 16:39:00
      央視不買版權,國際足聯刪除中文模式?這不是商業博弈,是不尊重

      央視不買版權,國際足聯刪除中文模式?這不是商業博弈,是不尊重

      開成運動會
      2026-05-12 21:23:05
      外交部通告全世界:強烈譴責巴方有關行徑,引全球高度關注

      外交部通告全世界:強烈譴責巴方有關行徑,引全球高度關注

      科技處長
      2026-05-12 22:43:25
      2026-05-13 04:31:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16691文章數 514946關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      教育
      本地
      健康
      游戲
      藝術

      教育要聞

      求求你試試「5+1+1」學習法!!!

      本地新聞

      用蘇繡的方式,打開江西婺源

      干細胞能讓人“返老還童”嗎

      活久見!電棍與香鍋怒噴被擼圈開除后和解,祝Mlxg母親節日快樂

      藝術要聞

      震驚!他竟用鏡頭看透了所有女人的秘密!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产AV影院| 办公室强奷漂亮少妇视频| 亚洲欧美综合精品成| 五月丁香大香蕉| 久久精品人人做人人| 99精品国产99久久久久久97| 欧美另类人妻制服丝袜| 国产美女无遮挡裸色视频| 中文字幕无码免费久久99 | 99福利一区二区视频| www黄色com| 人妻洗澡被强公日日澡电影| jjzz亚洲| 欧美日韩亚洲中文字幕二区 | 亚洲欧洲精品一区二区| 日韩视频a| 少妇人妻邻居| 91人妻一区二区三区蜜桃精品| 合肥市| 久久婷婷综合色丁香五月| 欧美日本高清在线不卡区| 日日cao| 甜蜜视频中文字幕不卡无码| 狠狠躁夜夜躁人人爽天天30人| 午夜福利免费区在线观看| 3atv精品不卡视频| 婷婷五月天小说| 无码中文av有码中文a| 国产在线欧美日韩精品一区| 久碰人澡人澡人澡人澡人91| 久久99精品麻豆国产| 国产欧美日韩精品丝袜高跟鞋| 黄色影院91| 色欲综合网| 国产精品美女久久久久av爽李琼 | 熟妇与黑人一区二区三区乱码| 国产精品免费福利久久播放| 国产女人综合久久精品视| 插我舔内射18免费视频| 国产亚洲欧美日韩亚洲中文色| 邻居少妇张开腿让我爽了在线观看|