<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      情感識別不再是分類題:EmotionThinker讓SpeechLLM 學會解釋情緒

      0
      分享至



      語音情感識別(Speech Emotion Recognition, SER)在過去基本遵循同一種范式:輸入語音,輸出情緒標簽。這種設定在工程上有效,但在認知層面卻過于簡化。

      在人類交流中,情緒判斷從來不是一個 “標簽選擇” 的過程,而是一種基于證據整合的推理行為。我們會綜合語調變化、音高起伏、語速快慢、重音位置、語義內容,以及說話人的身份特征,去解釋 “為什么” 這是憤怒、“為什么” 這是失落。

      因此,一個更根本的問題浮現出來:

      SpeechLLM 是否具備像人類一樣解釋 “為什么” 做出情緒判斷的能力?

      為此,研究團隊提出了EmotionThinker—— 首個面向可解釋情感推理(Explainable Emotion Reasoning)的強化學習框架,嘗試將 SER 從 “分類任務” 提升為 “多模態證據驅動的推理任務”。



      • 論文標題:EmotionThinker: Prosody-Aware Reinforcement Learning for Explainable Speech Emotion Reasoning

      一、從 “情緒分類” 到 “情感推理”

      EmotionThinker 首先對語音情感識別任務本身進行了重定義,將其擴展為情感推理任務(Emotion Reasoning)。在新的設定下,模型不僅需要預測情緒標簽,還需要生成一段解釋,明確指出:

      • 哪些聲學線索支持這一判斷
      • 哪些語義線索起到關鍵作用
      • 這些線索如何共同構成最終結論

      這種范式轉變意味著,模型輸出從 “標簽” 升級為 “標簽 + 基于證據的推理”。

      它的意義并非簡單延長輸出,而是對優化目標的重寫。模型不再只需 “預測正確”,而必須學習如何整合韻律、語義與說話人屬性等多模態信號,并在解釋中體現證據對齊過程。情緒識別由此從判別問題轉變為結構化推理問題。




      二、EmotionThinker:

      面向可解釋情感推理的框架

      EmotionThinker 的目標并不局限于提升最終準確率,而是同時提升三方面能力:

      (1)更高的情緒識別準確率

      (2)更強的情緒線索整合與推理能力

      (3)更細粒度的音頻描述能力,覆蓋說話人特征、韻律線索與語義信息

      為了支撐這一目標,研究團隊首先構建了EmotionCoT-35K。這是一個包含 35,000+ 條樣本的 Chain-of-Thought 風格數據集。與傳統 SER 數據不同,它不僅提供情緒標簽,還提供細粒度韻律描述與結構化推理解釋。

      這些樣本明確標注了音高、能量、語速、重音、語調輪廓等線索如何支持情緒判斷,使模型能夠學習到 “證據 — 推理 — 結論” 之間的對應關系。

      與此同時,研究團隊觀察到:若模型的韻律感知能力不足,其情感推理能力將受到系統性限制。因此,研究團隊進一步構建了一個 EmotionThinker-Base。EmotionThinker-Base 通過監督微調增強模型對音高變化、能量波動、語速模式與重音等結構的感知能力,從而為后續的推理優化提供穩定基礎。



      三、GRPO-PTR:

      讓強化學習真正優化 “解釋能力”

      在將語音情感識別重定義為情感推理之后,一個新的優化難題隨之出現:如何在開放式生成場景中,對 “推理質量” 進行穩定強化學習?直接將推理獎勵與情緒預測獎勵簡單疊加,會帶來明顯的噪聲問題。一方面,模型可能生成語言上看似合理但與最終情緒判斷不一致的解釋;另一方面,在訓練初期,模型尚未形成穩定的聲學 — 語義對齊能力,過強的推理獎勵容易放大早期隨機偏差,導致策略梯度震蕩。為此,研究團隊提出了 GRPO-PTR(Progressive Trust-aware Reasoning)。

      首先,研究團隊采用了漸進式推理獎勵調度。在訓練初期,優化重點放在情緒預測的穩定性上;隨著模型策略逐步收斂,逐步提高推理獎勵權重,使模型從 “預測正確” 過渡到 “解釋合理”。這種 reward scheduling 降低了早期高方差信號對訓練穩定性的影響。

      其次,研究團隊引入基于一致性的可信度加權機制。當模型生成的推理與最終情緒預測保持一致時,推理獎勵按完整權重計入;當二者存在沖突時,推理獎勵自動衰減。該機制有效緩解了開放式生成任務中常見的 reward misalignment 問題,使解釋優化始終服務于情緒判斷本身。

      從優化角度看,GRPO-PTR 解決的是一個更一般的問題:如何在 “預測 + 解釋” 的多目標生成任務中,使結構化推理與最終決策保持對齊,并在強化學習框架下穩定收斂。



      四、實驗結果與研究啟示

      在多個標準語音情感識別基準上,EmotionThinker 同時實現了:

      • 更高的情緒識別準確率
      • 更優的解釋質量
      • 更穩定的韻律線索整合能力

      更重要的是,我們觀察到一個關鍵現象:當模型被顯式訓練去對齊聲學線索與情緒判斷時,其在復雜情緒場景下的魯棒性顯著增強。這說明,情感理解的瓶頸并不僅僅在語義層面,而在于聲學與語義信號的協同建模能力。換句話說:如果模型不能準確理解 “怎么說”,它就無法穩定理解 “是什么情緒”。






      結語


      EmotionThinker 并不僅僅是在情感識別任務上提升準確率,而是在任務定義層面完成了一次轉變。

      情緒識別不應只是標簽預測,而應是基于多模態證據的結構化推理過程。從 “分類” 到 “解釋”,從 “標簽” 到 “證據 — 推理 — 結論” 的一致性對齊,情感理解正在進入一個強調可解釋性與結構協同的階段。

      當模型學會解釋情緒時,它不僅在給出判斷,也在展示其如何整合聲學與語義線索。

      這或許是多模態大模型邁向真正情感理解能力的重要一步。

      作者簡介

      本文第一作者為王丁冬,香港中文大學博士生,研究方向為語音大模型的口語理解,對話與推理 (Reasoning),導師為 Helen Meng 教授。本文在微軟劉樹杰博士與Jinyu Li博士的共同指導下完成。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      《GTA6》首發無PC引眾怒!玩家怒批R星與時代脫節!硬盤瑟瑟發抖!游戲容量近200GB!

      《GTA6》首發無PC引眾怒!玩家怒批R星與時代脫節!硬盤瑟瑟發抖!游戲容量近200GB!

      Steam社區
      2026-05-10 11:51:37
      尼克斯129.1進攻效率恐怖,仍不及25年騎士隊

      尼克斯129.1進攻效率恐怖,仍不及25年騎士隊

      章民解說體育
      2026-05-12 18:07:08
      俄羅斯是真眼饞!中國大量東風導彈將要退役,可以出口換外匯嗎?

      俄羅斯是真眼饞!中國大量東風導彈將要退役,可以出口換外匯嗎?

      潮鹿逐夢
      2026-05-06 16:44:26
      字節砍掉30%的AI項目?背后的真假與焦慮

      字節砍掉30%的AI項目?背后的真假與焦慮

      鈦媒體APP
      2026-05-11 18:15:28
      結婚才2年,蕭敬騰就嘗到老妻少夫的殘酷,其實舒淇早就把話說透

      結婚才2年,蕭敬騰就嘗到老妻少夫的殘酷,其實舒淇早就把話說透

      枯蝶
      2026-05-11 09:20:17
      中央定調:事業單位這三類人員不允許彈性延遲退休,到齡就得退休

      中央定調:事業單位這三類人員不允許彈性延遲退休,到齡就得退休

      細說職場
      2026-05-10 11:14:50
      國乒奪冠夜!王勵勤點名兩大功臣,梁靖崑發文看哭無數人

      國乒奪冠夜!王勵勤點名兩大功臣,梁靖崑發文看哭無數人

      kio魚
      2026-05-12 18:12:28
      “逆襲之王”梁靖崑奪冠后回復妻子打錯字,網友:冠軍手速快拼音不過關

      “逆襲之王”梁靖崑奪冠后回復妻子打錯字,網友:冠軍手速快拼音不過關

      現代快報
      2026-05-11 17:15:03
      2026年4月26日中央紀委重磅發文,物業領域嚴查全面升級

      2026年4月26日中央紀委重磅發文,物業領域嚴查全面升級

      職場資深秘書
      2026-05-11 22:29:43
      韓國千面影帝李秉憲:演技有多頂,人品就有多渣

      韓國千面影帝李秉憲:演技有多頂,人品就有多渣

      上官晚安
      2026-05-05 17:03:06
      特朗普:美伊停火正處于“生命維持”狀態

      特朗普:美伊停火正處于“生命維持”狀態

      界面新聞
      2026-05-12 12:31:34
      國際足聯被曝愿作出“重大讓步”:官員正飛往中國,爭取讓央視購買今年世界杯的電視轉播權,并提出將報價降低50%以上

      國際足聯被曝愿作出“重大讓步”:官員正飛往中國,爭取讓央視購買今年世界杯的電視轉播權,并提出將報價降低50%以上

      大風新聞
      2026-05-11 15:12:02
      樊振東沒想到,國乒倫敦奪冠不到24小時,他“處境”變得如此唏噓

      樊振東沒想到,國乒倫敦奪冠不到24小時,他“處境”變得如此唏噓

      好賢觀史記
      2026-05-12 11:03:43
      家用SUV煥新!2026款本田CRV亮相,軸距2米71.5T9AT

      家用SUV煥新!2026款本田CRV亮相,軸距2米71.5T9AT

      音樂時光的娛樂
      2026-05-11 09:17:46
      麻省理工發現:喚醒孩子自律最快的方法,竟是飛輪效應!

      麻省理工發現:喚醒孩子自律最快的方法,竟是飛輪效應!

      戶外阿毽
      2026-05-10 19:24:43
      查扣電動車停了,工信部一錘定音:老百姓需要什么就造什么

      查扣電動車停了,工信部一錘定音:老百姓需要什么就造什么

      一口娛樂
      2026-05-12 12:42:56
      伊朗官員:若再次遭襲 伊方或選擇將濃縮鈾豐度提升至90%

      伊朗官員:若再次遭襲 伊方或選擇將濃縮鈾豐度提升至90%

      新京報
      2026-05-12 15:11:26
      神仙同框!楊麗萍教小酒窩孔雀舞,董璇穿黃衣白裙,也格外吸睛!

      神仙同框!楊麗萍教小酒窩孔雀舞,董璇穿黃衣白裙,也格外吸睛!

      明星私服穿搭daily
      2026-05-11 13:59:13
      “農村父母就是這樣被騙的”,中職女孩穿廉價警服,畢業就傻眼了

      “農村父母就是這樣被騙的”,中職女孩穿廉價警服,畢業就傻眼了

      妍妍教育日記
      2026-05-11 18:59:23
      太意外,一聲招呼不打,國際奧委直接官宣上海辦賽,背后全是算計

      太意外,一聲招呼不打,國際奧委直接官宣上海辦賽,背后全是算計

      有范又有料
      2026-05-11 11:29:37
      2026-05-12 18:59:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12976文章數 142648關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      為見女兒最后一面老人第一次坐高鐵 買不到票求助特警

      頭條要聞

      為見女兒最后一面老人第一次坐高鐵 買不到票求助特警

      體育要聞

      總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

      娛樂要聞

      劉濤曬媽祖誕辰活動照 評論區變許愿池

      財經要聞

      黃仁勛真是被白宮徹底封殺了

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      游戲
      手機
      本地
      時尚
      公開課

      小島秀夫新動態:票選DS2最愛角色!反派竟是第一

      手機要聞

      華為暢享90 Pro Max率先開更鴻蒙HarmonyOS 6.1.0.120 SP8

      本地新聞

      用蘇繡的方式,打開江西婺源

      征集|| 她們也太會買裙子了!邊看邊種草

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 蜜臀av无码一区二区三区| 熟女综合| 亚洲色无码| 精品一区二区三区在线成人| 99精品国产在热久久无毒| 一本一道av无码中文字幕| 亚洲无av码一区二区三区| 人妻激情偷乱视频一区二区三区| 国内亚洲精彩视频在线| 五月天激情影院| 中文乱码人妻系列一区二区| 热久久国产| 国产综合av一区二区三区| 成**人毛片www免费版| 国产美女一区二区三区| 伊人精品久久久久7777| 亚洲国产精品久久一线不卡| 亚洲美女高清aⅴ视频免费| 99在线观看| 狠狠爱五月丁香亚洲综| 久久夜色噜噜噜亚洲av| 九九国产视频| 亚洲精品美女久久久久久久| 亚洲无码久久久久| 国产婷婷成人久久av免费高清| 日韩成人网站| 欧洲-级毛片内射| 日韩在线视频线观看一区| 好大好硬好湿好爽再深一点视频| 影音先锋中文字幕人妻| 欧美乱大交aaaa片if| 国产一区二区激情对白在线 | 精品人妻系列无码一区二区三区| 欧洲熟妇性色黄| AV不卡在线观看| 亚洲色在线无码国产精品不卡| 亚欧洲乱码视频在线专区| 国产在线精品视频| 国产av一区二区久久蜜臀| 免费一级特黄a大片| 午夜在线观看免费线无码视频|