<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Nat Mach Intell | 隨機初始化為何讓模型“自信過頭”?

      0
      分享至


      認知神經(jīng)科學前沿文獻分享


      基本信息

      Title:Brain-inspired warm-up training with random noise for uncertainty calibration

      發(fā)表時間:2026-04-09

      發(fā)表期刊:Nature Machine Intelligence

      獲取原文:

      1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本



      引言

      對很多實際部署中的人工智能系統(tǒng)來說,真正決定能否被信任的,往往不只是“答得對不對”,還包括“它是否知道自己有多確定”。一輛自動駕駛汽車是否該減速,一套醫(yī)學影像模型給出的結(jié)論是否值得醫(yī)生進一步采納,乃至大語言模型生成的回答能否被直接引用,背后都牽涉同一個問題:模型給出的置信度,能不能真實反映它答對的概率。若二者不匹配,系統(tǒng)就可能在最不該自信的時候顯得異常篤定。

      這正是不確定性校準(uncertainty calibration)要解決的核心問題。理想情況下,模型說自己有 80% 把握時,長期統(tǒng)計上就應當接近 80% 正確;但現(xiàn)實中的深度神經(jīng)網(wǎng)絡經(jīng)常不是這樣。它們在分布內(nèi)數(shù)據(jù)上可能已經(jīng)表現(xiàn)出“置信度高于正確率”的過度自信,面對分布外(out-of-distribution, OOD)輸入時也常把“沒見過”誤判成“很確定”。過去已有不少方法嘗試修正這一問題,但許多做法集中在預處理或后處理環(huán)節(jié),往往依賴額外計算、輔助模型,或把分布內(nèi)與分布外樣本分開處理。換句話說,這些方法更像是在輸出端補救,而不是追問失準究竟從哪里開始。


      實驗設計與方法邏輯

      文章的主分析對象是一個用于 CIFAR-10 十分類的多層前饋神經(jīng)網(wǎng)絡,采用 He 初始化、ReLU 和 batch normalization,并系統(tǒng)改變網(wǎng)絡深度與訓練數(shù)據(jù)規(guī)模,以觀察校準誤差如何隨模型復雜度和樣本量變化。核心干預是在真實數(shù)據(jù)訓練前增加一段“隨機噪聲熱身”:輸入為與圖像同尺寸的高斯噪聲,標簽從均勻分布隨機采樣,輸入與標簽不配對。


      核心發(fā)現(xiàn)


      發(fā)現(xiàn)一:常規(guī)隨機初始化并非中性起點,而是過度自信的重要來源,且在“模型更復雜、數(shù)據(jù)更少”時更嚴重

      論文先用 Figure 1c 和 Figure 1d 立住了問題本身。Figure 1c 的可靠性圖顯示,理想校準應貼近對角線,但實際網(wǎng)絡的 accuracy 普遍低于 confidence,說明模型在常見訓練設置下存在系統(tǒng)性過度自信。Figure 1d 更關鍵,它把這種偏差放到“網(wǎng)絡深度 × 訓練數(shù)據(jù)規(guī)模”的條件網(wǎng)格中考察,顯示 ECE 會隨著訓練樣本減少、模型復雜度提高而加重。也就是說,失準并不是零散現(xiàn)象,而與現(xiàn)代深度學習常見的“大模型配有限數(shù)據(jù)”條件密切相關。


      Figure 1. Confidence miscalibration in artificial neural networks

      發(fā)現(xiàn)二:隨機噪聲熱身能顯著改善校準,并在不同架構(gòu)與訓練場景中保持效果

      Figure 2 系統(tǒng)回答了這套方法是否真正有效。Figure 2d 顯示,在熱身階段,網(wǎng)絡損失下降但準確率停留在機會水平;而切換到真實數(shù)據(jù)后,熱身組的測試損失進一步降得更充分。更直接的證據(jù)來自 Figure 2e:加入熱身后,可靠性圖明顯更靠近理想對角線,插圖中的 ECE 也顯著下降。Figure 2f 則說明這種改善并非只在單一設定成立,而是在不同深度、不同數(shù)據(jù)規(guī)模下都能觀察到,且在“小數(shù)據(jù)、深網(wǎng)絡”這些本來更容易失準的條件下尤其明顯。


      Figure 2. Warm-up training with random noise enables confidence calibration in neural networks

      發(fā)現(xiàn)三:熱身之所以有效,是因為它先把初始化階段的高置信度與類別偏置壓回機會水平

      論文最有價值的部分之一,是它沒有停在“方法有效”,而繼續(xù)追問“為什么有效”。Figure 3b 在二維 toy model 中可視化輸入空間后發(fā)現(xiàn):未經(jīng)訓練、只做常規(guī)隨機初始化的網(wǎng)絡,并不是均勻中性的,它已經(jīng)在大片區(qū)域上表現(xiàn)出明顯高置信度;而熱身之后,這種分布變得更均勻,更接近機會水平。Figure 3c 和 Figure 3d 進一步表明,熱身不僅降低了整體 confidence bias,也減輕了對特定輸出類別的初始偏向。


      Figure 3. Random noise pre-calibrates neural network uncertainty over input space

      發(fā)現(xiàn)四:預校準會重塑后續(xù)學習軌跡,并提升對分布外輸入的識別能力

      Figure 4 和 Figure 5 把方法的意義從“初始狀態(tài)改變”延伸到了“后續(xù)行為改變”。Figure 4a–c 顯示,無論是在相同準確率下比較,還是在相同訓練輪次下比較,熱身組都擁有更好的可靠性圖和更低的 ECE,說明這不是一次性修補,而是改變了學習動力學。Figure 4d–f 更進一步表明,熱身組在訓練過程中能讓 confidence 與 accuracy 持續(xù)貼近理想對角線,而未熱身組則長期存在“置信度跑在正確率前面”的偏差。


      Figure 4. Pre-calibration enables learning with matching confidence and accuracy


      Figure 5. OOD detection using calibrated network confidence


      歸納總結(jié)和點評

      這篇工作最強的貢獻,是把“不確定性校準”從常見的輸出修正問題,前移為一個初始化與學習動力學問題:作者認為,深度網(wǎng)絡的過度自信并非只在訓練后形成,常規(guī)隨機初始化本身就可能讓模型在尚未理解數(shù)據(jù)前先顯得“太確定”;而一次簡短的隨機噪聲熱身,則能把這種初始置信度預先拉回機會水平,使后續(xù)真實任務訓練中的 confidence–accuracy 對齊更穩(wěn)定,并在分布外樣本識別上帶來收益。論文的優(yōu)點在于證據(jù)鏈完整,從失準現(xiàn)象、方法效果,到 toy model 機制解釋,再到訓練軌跡與 OOD 檢測,形成了較清晰的閉環(huán),也把發(fā)育神經(jīng)科學中的自發(fā)活動與機器學習中的模型可靠性建立了有啟發(fā)性的聯(lián)系。與此同時,它的邊界也應被認真看待:文中雖已擴展到多類視覺架構(gòu),并補充展示了語言生成等任務線索,但關于更大規(guī)模系統(tǒng)、尤其是復雜現(xiàn)實部署和大語言模型場景的系統(tǒng)驗證,仍有待后續(xù)研究補足,因此目前更適合把它理解為一種有機制支撐的訓練起點策略,而非已經(jīng)對所有 AI 系統(tǒng)普遍成立的最終答案。


      請打分

      這篇剛剛登上 Nature Machine Intelligence 的研究,是否實至名歸?我們邀請您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評論區(qū)分享您的深度見解。

      分享人:BQ

      審核:PsyBrain 腦心前沿編輯部

      你好,這里是「PsyBrain 腦心前沿

      專注追蹤全球認知神經(jīng)科學的最尖端突破

      視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級大刊

      每日速遞「深度解讀」與「前沿快訊

      科研是一場探索未知的長跑,但你無需獨行。歡迎加入PsyBrain 學術(shù)社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。

      點擊卡片進群,歡迎你的到來

      一鍵關注,點亮星標 ? 前沿不走丟!


      一鍵分享,讓更多人了解前沿

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      不管有錢沒錢,盡快扔掉家里的這7樣東西!不是瞎說,有科學依據(jù)

      不管有錢沒錢,盡快扔掉家里的這7樣東西!不是瞎說,有科學依據(jù)

      家居設計師宅哥
      2026-05-04 12:45:59
      CPO/光模塊:龍頭十五強,誰還在低位?

      CPO/光模塊:龍頭十五強,誰還在低位?

      普陀動物世界
      2026-05-08 09:15:08
      雷迪克:雷霆幾乎每回合都在犯規(guī),裁判至少得把該吹的給吹了

      雷迪克:雷霆幾乎每回合都在犯規(guī),裁判至少得把該吹的給吹了

      懂球帝
      2026-05-08 13:08:05
      抗戰(zhàn)時期最牛雜牌軍:兵力僅1.3萬人,機槍卻有660挺,哪里來的?

      抗戰(zhàn)時期最牛雜牌軍:兵力僅1.3萬人,機槍卻有660挺,哪里來的?

      飯小妹說歷史
      2026-03-24 09:31:22
      何潔近況令人詫異!暴瘦20斤,換了發(fā)色,面相大變,刁磊有福了

      何潔近況令人詫異!暴瘦20斤,換了發(fā)色,面相大變,刁磊有福了

      時間巡查
      2026-05-07 19:34:40
      皇馬“火藥桶”巴爾韋德:是鐵血圖騰,還是更衣室的毀滅者?

      皇馬“火藥桶”巴爾韋德:是鐵血圖騰,還是更衣室的毀滅者?

      星耀國際足壇
      2026-05-08 22:01:14
      5-0碾壓澳大利亞,日本女足豪取亞洲杯3連勝,以頭名晉級8強

      5-0碾壓澳大利亞,日本女足豪取亞洲杯3連勝,以頭名晉級8強

      側(cè)身凌空斬
      2026-05-08 17:22:23
      王楚欽、林詩棟、梁靖崑3-0戰(zhàn)勝韓國隊,國乒男團順利晉級四強

      王楚欽、林詩棟、梁靖崑3-0戰(zhàn)勝韓國隊,國乒男團順利晉級四強

      瀟湘晨報
      2026-05-08 21:57:12
      理想設計副總裁回應MEGA爭議:外觀是技術(shù)最優(yōu)解,內(nèi)飾承認“判斷失誤”

      理想設計副總裁回應MEGA爭議:外觀是技術(shù)最優(yōu)解,內(nèi)飾承認“判斷失誤”

      驅(qū)動中國
      2026-05-08 10:58:21
      中國最大二手車平臺沖刺IPO,騰訊、京東坐鎮(zhèn)

      中國最大二手車平臺沖刺IPO,騰訊、京東坐鎮(zhèn)

      華爾街見聞官方
      2026-05-07 21:59:05
      中國第四艘航母官宣亮相,舷號19或命名江蘇號

      中國第四艘航母官宣亮相,舷號19或命名江蘇號

      小蔣愛嘮嗑
      2026-05-08 07:35:11
      于文紅宣揚“換血”抗衰,兩周內(nèi)年輕十幾歲,曬術(shù)后照引網(wǎng)友熱議

      于文紅宣揚“換血”抗衰,兩周內(nèi)年輕十幾歲,曬術(shù)后照引網(wǎng)友熱議

      阿傖說事
      2026-05-08 19:33:51
      吳晨已任中國醫(yī)學科學院北京協(xié)和醫(yī)學院副院校長

      吳晨已任中國醫(yī)學科學院北京協(xié)和醫(yī)學院副院校長

      澎湃新聞
      2026-05-08 16:02:26
      北京局新任總經(jīng)理已到位

      北京局新任總經(jīng)理已到位

      軌道世界
      2026-05-07 23:53:47
      局勢突變,美伊再起沖突,為何挨揍的卻是阿聯(lián)酋?

      局勢突變,美伊再起沖突,為何挨揍的卻是阿聯(lián)酋?

      孤酒老巷QA
      2026-05-08 20:09:02
      全紅嬋近照顛覆往日形象,少女蛻變引發(fā)好奇,背后堅持值得深思

      全紅嬋近照顛覆往日形象,少女蛻變引發(fā)好奇,背后堅持值得深思

      川川八卦說
      2026-05-07 17:09:04
      休想再回國!中國體壇兩大叛徒,奪冠后不承認是國人,報應終到來

      休想再回國!中國體壇兩大叛徒,奪冠后不承認是國人,報應終到來

      南書房
      2026-05-04 15:50:05
      老人財產(chǎn)轉(zhuǎn)給獨生子女:3個最佳時間,早知道少走彎路

      老人財產(chǎn)轉(zhuǎn)給獨生子女:3個最佳時間,早知道少走彎路

      小鹿姐姐情感說
      2026-05-05 10:43:52
      倫敦世乒賽爆大冷!瑞典男團無緣四強!林昀儒領銜中國臺北戰(zhàn)日本張本、松島!

      倫敦世乒賽爆大冷!瑞典男團無緣四強!林昀儒領銜中國臺北戰(zhàn)日本張本、松島!

      好乒乓
      2026-05-08 11:12:07
      國運來了,貴州發(fā)現(xiàn)萬億級寶藏,能用幾百年,美日也想分杯羹?

      國運來了,貴州發(fā)現(xiàn)萬億級寶藏,能用幾百年,美日也想分杯羹?

      瘋狂的小歷史
      2026-05-07 10:36:33
      2026-05-08 22:35:00
      PsyBrain腦心前沿
      PsyBrain腦心前沿
      追蹤腦科學新動態(tài),聚焦認知與神經(jīng)新研究
      394文章數(shù) 19關注度
      往期回顧 全部

      科技要聞

      SK海力士平均獎金600萬 工服成相親神器

      頭條要聞

      "大衣哥"再度翻紅:五一假期3天跑5場 累到"要保命"

      頭條要聞

      "大衣哥"再度翻紅:五一假期3天跑5場 累到"要保命"

      體育要聞

      他把首勝讓給隊友,然后用一年時間還清賬單

      娛樂要聞

      古天樂被曝隱婚生子,新娘竟是她

      財經(jīng)要聞

      特朗普全球關稅又受阻,也能退款?

      汽車要聞

      MG 4X實車亮相 將于5月11日開啟盲訂

      態(tài)度原創(chuàng)

      教育
      旅游
      時尚
      數(shù)碼
      家居

      教育要聞

      關于舉辦“圖畫書里的中國”2026年山東省原創(chuàng)兒童圖畫書素材創(chuàng)意大賽、原創(chuàng)兒童圖畫書講讀大賽的通知

      旅游要聞

      519中國旅游日 | 去追一場星光,愛上一座城!

      海魂衫搭配白色,更解暑!

      數(shù)碼要聞

      華碩天選7系列發(fā)布 天選7 Pro/Pro Max已開啟預約

      家居要聞

      流動的尺度 打破家的形式主義

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕一二三区波多野结衣| 亚洲欧美日韩一区在线观看| 国产精品无码无需播放器| 午夜福利国产精品视频| 亚洲v欧美| 久久这里都是精品一区| 久久亚洲欧美日本精品| 免费a级毛片18以上观看精品| 欧洲熟妇色xxxx欧美老妇性| 第一区免费在线观看| 99热在线精品国产观看| 亚洲精品久久久久久久蜜桃臀| 国产精品毛片大码女人| 无码专区人妻丝袜| 偷拍久久精品视频| 性欧美丰满熟妇xxxx性| 开心一区二区三区激情| 无码精品人妻 中文字幕| 中文乱字幕视频一区| 亚洲一道一本快点视频| 亚洲国产成人精品激情资源9| 五月婷婷激情| 久久9966精品国产免费| 精品香蕉在线视频| 亚洲乱码中字幕综合| 97丨九色丨国产人妻熟女| 国产美女精品久久| 好男人在在线社区www在线影院| 国产成品精品午夜视频| 人妻无码精品久久亚瑟影视| 国产精品 视频一区 二区三区| 老司机亚洲精品| 日本网站不卡一区二区| 国产精品最新免费视频| 伊人久久影院| 亚洲精品1| 亚洲欧美在线一区中文字幕| 中国孕妇变态孕交xxxx| 国产无遮挡又爽又黄的视频| 国产免费一区二区不卡| 69xxx少妇按摩视频|