<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      別再把長(zhǎng)文切碎了,HiLight讓AI直接在原文里劃重點(diǎn)

      0
      分享至



      在實(shí)際應(yīng)用中,模型常常會(huì)忽略關(guān)鍵線索,這就是 “Lost in the Middle” 現(xiàn)象,即模型對(duì)出現(xiàn)在輸入中間位置的信息關(guān)注度明顯下降?,F(xiàn)有的優(yōu)化思路大致分為兩類:

      • 硬選擇:先檢索或裁剪出相關(guān)片段,再送入模型,但可能會(huì)丟失對(duì)推理至關(guān)重要的上下文。
      • 軟選擇:通過摘要或壓縮來縮短輸入,但有損壓縮難免引入失真。

      兩類方法都在 “動(dòng)” 原始輸入或原始權(quán)重。那么,能不能既保留完整的上下文,又能準(zhǔn)確地告訴模型 “重點(diǎn)看哪里”?HiLight 提出一條 “輸入側(cè)干預(yù)” 的新路徑:在原文中插入少量高亮標(biāo)簽,引導(dǎo)模型的注意力。

      方法概述

      在實(shí)際部署當(dāng)中,大模型往往是API 付費(fèi)調(diào)用、規(guī)模巨大,甚至權(quán)重不開放的黑盒服務(wù),直接對(duì)它做 SFT 或 RL 微調(diào)往往不現(xiàn)實(shí)。因此,HiLight 選擇了一條更實(shí)用的路徑:凍結(jié)推理模型,訓(xùn)練一個(gè)輕量的 “助手模型” 來幫助它劃重點(diǎn)。



      • 論文標(biāo)題:Learning Evidence Highlighting for Frozen LLMs
      • 論文地址:https://arxiv.org/abs/2604.22565
      • 作者:Shaoang Li1,?, Yanhang Shi1,?, Yufei Li2, Mingfu Liang2, Xiaohan Wei2, Yunchen Pu2, Fei Tian2, Chonglin Sun2, Frank Shyu2, Luke Simon2, Sandeep Pandey2, Xi Liu2,?, Jian Li1,?
      • 機(jī)構(gòu):1 石溪大學(xué)(Stony Brook University),2 Meta AI
      • 說明:? 共同第一作者;? 共同通訊作者

      流程如下:

      1. 輕量模型(Emphasis Actor)閱讀完整的上下文,為每個(gè) token 打出重要性分?jǐn)?shù)。

      2. 輕量模型在得分最高的片段兩邊插入高亮標(biāo)簽,如 < start_important > 和 < end_important>。

      3. 凍結(jié)的推理模型(Solver LLM)接收帶標(biāo)簽的文本,完成推理并輸出結(jié)果。



      該訓(xùn)練過程只用 Solver 的任務(wù)獎(jiǎng)勵(lì)作為反饋信號(hào),不需要任何人工標(biāo)注的證據(jù)。在訓(xùn)練方式上,因?yàn)闆]有 token 級(jí)別的證據(jù)標(biāo)注,研究者將高亮選擇建模為強(qiáng)化學(xué)習(xí)問題,用下游任務(wù)指標(biāo)(如 HR@10、EM、F1)作為獎(jiǎng)勵(lì)信號(hào),通過分組策略梯度來更新 Actor。

      為了防止 Actor “全部高亮” 的偷懶行為,該框架還引入了高亮預(yù)算機(jī)制:輕量語言模型最多只能標(biāo)注一定比例的 token,并通過 span 合并策略將零散的 token 級(jí)選擇合并為語義連貫的片段。



      實(shí)驗(yàn)表明,HiLight 對(duì)預(yù)算取值并不敏感。這意味著,在實(shí)際部署時(shí)無需精細(xì)調(diào)參,選取一個(gè)合理的中間值即可。

      實(shí)驗(yàn)結(jié)果

      研究者在四個(gè)任務(wù)上進(jìn)行了評(píng)測(cè):Amazon-Beauty(序列推薦)、HotpotQA(多跳問答)、SQuAD 2.0(閱讀理解)和 PubMedQA(生物醫(yī)學(xué)分類)。對(duì)比方法涵蓋了當(dāng)前主流的 prompt optimization 方法,包括 PRL、BFRS、OPRO、DSPy(MIPROv2)和 APE。



      提升幅度最大的是序列推薦(Amazon-Beauty),在其它任務(wù)上,雖然提升相對(duì)溫和,但依然一致正向。

      高亮>裁剪,保留上下文的優(yōu)勢(shì)

      消融實(shí)驗(yàn)做了一個(gè)有趣的對(duì)比:把 Actor 選擇的高亮片段單獨(dú)裁剪出來喂給 Solver,會(huì)怎么樣?



      結(jié)果顯示,在 Amazon-Beauty 上,裁剪也能取得不錯(cuò)的效果。但在 HotpotQA 上出現(xiàn)了相反的情況。因?yàn)槎嗵鴨柎鹜评硇枰A暨B接性的上下文,裁剪雖然能選出關(guān)鍵證據(jù),卻破壞了語義的完整性。而HiLight 在標(biāo)注重點(diǎn)的同時(shí)保留了完整語境。

      一個(gè)高亮模型,服務(wù)多個(gè)大模型

      Actor 學(xué)習(xí)到的高亮策略具有很強(qiáng)的遷移能力。研究者用 Qwen3-14B 作為 Solver 訓(xùn)練 Actor,直接將其應(yīng)用到五個(gè)從未見過的 Solver 上。與之相對(duì)比的做法是讓目標(biāo) Solver 自己先高亮證據(jù)再作答。



      結(jié)果顯示,HiLight 的 Actor 高亮在五個(gè) Solver 上的效果都明顯優(yōu)于自我高亮。原因也很簡(jiǎn)單,專門訓(xùn)練的輕量模型,比大模型自己猜 “哪里重要” 更靠譜。HiLight 的 Actor 是通過任務(wù)獎(jiǎng)勵(lì)顯式訓(xùn)練出來的,知道什么樣的證據(jù)能真正提升下游指標(biāo)。

      沒有人工標(biāo)注,卻與人工高度重合

      盡管訓(xùn)練過程中沒有任何 token 級(jí)別的證據(jù)標(biāo)注,但Actor 的高亮區(qū)域與 HotpotQA 數(shù)據(jù)集中人工標(biāo)注的支持事實(shí)高度重合,最高達(dá)到 0.78 F1。隨著 Actor 規(guī)模從 0.6B 增大到 8B,F(xiàn)1 從 0.68 單調(diào)上升到 0.78。



      如圖所示,Precision、Recall、F1 三項(xiàng)指標(biāo)都隨 Actor 規(guī)模單調(diào)提升,Precision 甚至達(dá)到 0.84,說明Actor 高亮的 token 中,絕大多數(shù)都是人工判定的關(guān)鍵證據(jù)。



      上圖展示了一個(gè) HotpotQA 樣本上的 token 級(jí)分?jǐn)?shù)分布:藍(lán)色曲線是 Actor 打出的重要性分?jǐn)?shù),紅色陰影區(qū)是人工標(biāo)注的支持事實(shí)所在區(qū)間。在一個(gè)包含 1200 多個(gè) token 的長(zhǎng)上下文中,Actor 只在兩個(gè)狹窄的區(qū)域打出高分,而這兩個(gè)區(qū)域正是數(shù)據(jù)集標(biāo)注的 ground-truth 證據(jù)所在。

      低部署成本

      • Solver 端 token 開銷:< 1.01 倍(僅插入少量標(biāo)簽 token)。
      • Actor 推理延遲:0.6B 模型約 0.05 秒,4B 模型約 0.23 秒(p50),相比 Solver 的 8 至 18 秒可忽略不計(jì)。
      • 訓(xùn)練成本:僅需約 12K 次 Solver 調(diào)用,而 PRL 需要 120K 次,APE 需要 60K 次。

      一個(gè)直觀案例:序列推薦優(yōu)化

      在 Amazon-Beauty 的一個(gè)典型案例中,模型需要通過給定的用戶歷史購(gòu)買摘要和一批候選商品,依據(jù)用戶下一個(gè)可能感興趣的商品,對(duì)候選商品進(jìn)行重排序。Actor 精準(zhǔn)地高亮標(biāo)記了兩個(gè)關(guān)鍵內(nèi)容。這兩個(gè)信號(hào)幫助 Solver 將真實(shí)目標(biāo)商品(一款主打 “Grips Makeup To Last” 的底妝產(chǎn)品)的推薦排序從第 14 名提升到第 5 名,是一個(gè)顯著的排序改進(jìn)。



      與黑盒注意力機(jī)制不同,HiLight 直接告訴用戶:模型之所以提升該商品的排名,是因?yàn)榭吹搅诉@兩段高亮文本。這大大提升了模型推薦結(jié)果的可信度。

      結(jié)語

      HiLight 的思路非常簡(jiǎn)單,用一個(gè)輕量模型劃重點(diǎn),讓大模型集中精力推理。這種方式帶來了幾個(gè)好處:

      • 性能提升:推薦任務(wù)性能提升可達(dá) 27%,問答任務(wù)也正向提升。
      • 不用改模型:Solver 凍結(jié),API 友好。
      • 可解釋:高亮標(biāo)簽?zāi)軌蛑苯痈嬖V人類 “模型在看哪里”,以及模型決策的依據(jù)。
      • 可遷移:一個(gè) Actor 可以服務(wù)于多個(gè)不同的大模型。
      • 低成本:訓(xùn)練成本低,額外延遲和推理成本小。

      隨著越來越多系統(tǒng)通過 API 調(diào)用大模型,HiLight 提供了一種不必改動(dòng) Solver 也能實(shí)現(xiàn)性能提升的辦法。

      值得一提的是,本文作者名單與 Meta 的 GR2(Generative Reasoning Re-ranker,arXiv:2602.07774)團(tuán)隊(duì)有相當(dāng)程度的重疊,HiLight 這套做法很可能在不遠(yuǎn)的將來被用進(jìn) GR2 這樣的生產(chǎn)級(jí) re-ranking 系統(tǒng)里。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      回顧:緬北女魔頭魏榕嗜好!經(jīng)常“活剝驢耳”,3個(gè)閨蜜喜歡觀刑

      回顧:緬北女魔頭魏榕嗜好!經(jīng)?!盎顒凅H耳”,3個(gè)閨蜜喜歡觀刑

      飛云如水
      2024-11-13 06:54:13
      歐爾班剛下臺(tái),匈牙利立刻驅(qū)逐俄間諜,16年親俄路線開始清算

      歐爾班剛下臺(tái),匈牙利立刻驅(qū)逐俄間諜,16年親俄路線開始清算

      桂系007
      2026-05-08 22:26:27
      保守估計(jì)虧損60億+,高瓴資本疑已“清倉(cāng)”隆基綠能

      保守估計(jì)虧損60億+,高瓴資本疑已“清倉(cāng)”隆基綠能

      草根光伏
      2026-05-11 13:56:43
      美國(guó)著名智囊學(xué)者曾提醒美軍:殲-36是中國(guó)式"圈套"

      美國(guó)著名智囊學(xué)者曾提醒美軍:殲-36是中國(guó)式"圈套"

      別吵吵
      2026-05-09 08:39:10
      終于回過味來了?美媒:中國(guó)正全國(guó)動(dòng)員,殲36殲50生產(chǎn)超美國(guó)兩倍

      終于回過味來了?美媒:中國(guó)正全國(guó)動(dòng)員,殲36殲50生產(chǎn)超美國(guó)兩倍

      說歷史的老牢
      2026-05-10 18:47:47
      西班牙一名涉疫郵輪乘客漢坦病毒檢測(cè)呈陽性

      西班牙一名涉疫郵輪乘客漢坦病毒檢測(cè)呈陽性

      財(cái)聯(lián)社
      2026-05-12 03:37:40
      全球十大毒王級(jí)垃圾食品曝光, 很多華人天天都在吃! 泡面, 漢堡竟都沒上榜

      全球十大毒王級(jí)垃圾食品曝光, 很多華人天天都在吃! 泡面, 漢堡竟都沒上榜

      澳微Daily
      2026-05-10 15:59:51
      伊朗議長(zhǎng):伊武裝部隊(duì)已做好準(zhǔn)備應(yīng)對(duì)任何侵略行為

      伊朗議長(zhǎng):伊武裝部隊(duì)已做好準(zhǔn)備應(yīng)對(duì)任何侵略行為

      財(cái)聯(lián)社
      2026-05-12 03:07:07
      盲人網(wǎng)紅盲道被電動(dòng)車撞受傷,對(duì)方還出口辱罵,相關(guān)部門正式回應(yīng)

      盲人網(wǎng)紅盲道被電動(dòng)車撞受傷,對(duì)方還出口辱罵,相關(guān)部門正式回應(yīng)

      新游戲大妹子
      2026-05-11 11:47:11
      這有意思嗎?奧迪高管炮轟友商:用特調(diào)車刷圈速、輪胎/懸掛改過;大裁員、關(guān)閉電池等業(yè)務(wù)!保時(shí)捷啟動(dòng)斷臂求生;哈啰再回應(yīng)腳踩青桔美團(tuán)

      這有意思嗎?奧迪高管炮轟友商:用特調(diào)車刷圈速、輪胎/懸掛改過;大裁員、關(guān)閉電池等業(yè)務(wù)!保時(shí)捷啟動(dòng)斷臂求生;哈啰再回應(yīng)腳踩青桔美團(tuán)

      雷峰網(wǎng)
      2026-05-11 10:21:16
      我50歲才悟出一個(gè)道理:凡是從不參加同學(xué)聚會(huì)、不愛發(fā)動(dòng)態(tài)、不混圈子的人,十有八九在這兩個(gè)方面遠(yuǎn)超常人,觀察了身邊上百人屢試不爽

      我50歲才悟出一個(gè)道理:凡是從不參加同學(xué)聚會(huì)、不愛發(fā)動(dòng)態(tài)、不混圈子的人,十有八九在這兩個(gè)方面遠(yuǎn)超常人,觀察了身邊上百人屢試不爽

      心理觀察局
      2026-05-08 10:35:21
      CBA官方:浙江因觀眾辱罵裁判、投擲雜物、投資人違規(guī)進(jìn)場(chǎng),罰款16萬

      CBA官方:浙江因觀眾辱罵裁判、投擲雜物、投資人違規(guī)進(jìn)場(chǎng),罰款16萬

      懂球帝
      2026-05-11 19:33:05
      離婚后住浙江娘家,親媽和繼父給帶孩子,她卻在娛樂圈闖出一片天

      離婚后住浙江娘家,親媽和繼父給帶孩子,她卻在娛樂圈闖出一片天

      阿鳧愛吐槽
      2026-05-11 22:13:02
      領(lǐng)導(dǎo)有這3個(gè)特征,必是小人!

      領(lǐng)導(dǎo)有這3個(gè)特征,必是小人!

      細(xì)說職場(chǎng)
      2026-04-29 16:27:10
      難怪日本女乒敢沖金牌,原來主教練是他,是馬琳師兄卻落選國(guó)家隊(duì)

      難怪日本女乒敢沖金牌,原來主教練是他,是馬琳師兄卻落選國(guó)家隊(duì)

      瑛派兒老黃
      2026-05-11 22:41:33
      柯志恩這回?cái)偵鲜铝?,王金平協(xié)助也無濟(jì)于事!鄭麗文早已有言在先

      柯志恩這回?cái)偵鲜铝耍踅鹌絽f(xié)助也無濟(jì)于事!鄭麗文早已有言在先

      風(fēng)干迷茫人
      2026-05-12 00:39:39
      結(jié)婚才2年,蕭敬騰就嘗到老妻少夫的殘酷,其實(shí)舒淇早就把話說透

      結(jié)婚才2年,蕭敬騰就嘗到老妻少夫的殘酷,其實(shí)舒淇早就把話說透

      枯蝶
      2026-05-11 09:20:17
      妻子出軌后,對(duì)方妻子主動(dòng)聯(lián)系我,提議搭伙過日子每月給我五萬塊

      妻子出軌后,對(duì)方妻子主動(dòng)聯(lián)系我,提議搭伙過日子每月給我五萬塊

      千秋文化
      2026-05-05 20:25:29
      湯洛雯停更四個(gè)月,生日照不露腰腹,網(wǎng)友追問孩子在哪

      湯洛雯停更四個(gè)月,生日照不露腰腹,網(wǎng)友追問孩子在哪

      動(dòng)物奇奇怪怪
      2026-05-10 19:33:24
      官僚主義最陰狠的套路:把所有風(fēng)險(xiǎn),砸向最底層

      官僚主義最陰狠的套路:把所有風(fēng)險(xiǎn),砸向最底層

      職場(chǎng)資深秘書
      2026-05-08 20:44:41
      2026-05-12 04:56:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12970文章數(shù) 142648關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機(jī)會(huì)

      頭條要聞

      母女二人一年用水量高達(dá)400多噸 警方發(fā)現(xiàn)背后隱情

      頭條要聞

      母女二人一年用水量高達(dá)400多噸 警方發(fā)現(xiàn)背后隱情

      體育要聞

      梁靖崑:可能是最后一屆了,想讓大家記住這個(gè)我

      娛樂要聞

      “孕婦墜崖案”王暖暖稱被霸凌協(xié)商解約

      財(cái)經(jīng)要聞

      宗馥莉罷免銷售負(fù)責(zé)人 部分業(yè)務(wù)將外包

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      藝術(shù)
      時(shí)尚
      旅游
      教育
      房產(chǎn)

      藝術(shù)要聞

      震撼!Nicole Nodland鏡頭下的絕美時(shí)尚女神!

      今年夏天最流行的5雙涼鞋,配裙子絕美!

      旅游要聞

      打卡同色系風(fēng)景 帶火城市微旅行

      教育要聞

      課堂亂象觸目驚心,老師氣得血壓飆升,誰在一步步毀掉當(dāng)今教育?

      房產(chǎn)要聞

      產(chǎn)業(yè)賦能教育!翰林府與北師大的這場(chǎng)簽約,絕不那么簡(jiǎn)單!

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产精品普通话国语对白露脸| 巨茎爆乳无码性色福利| 亚洲国产av一区二区三区| 韩国三级Hb久久精品完美| 2018亚洲а∨天堂| 午夜一区二区三区| 国产精品一区自拍视频| 国产91福利在线精品剧情尤物| 亚洲国产一区二区精品专| 国产精品一区二区AV| 伊人久久综合亚洲亚洲| 国产乱xxⅹxx国语对白| 自拍口爆| 一区二区偷拍美女撒尿视频| www.com黄色| 亚洲中文日韩天天嗨| 欧美激情性xxxxx高清真| 91乱码一区二区三区| 午夜福利在线永久视频| 国产精品久久久久久熟妇吹潮软件| 亚洲色鬼| 欧美成妇人吹潮在线播放| 久久精品不卡一区二区| 国产无码一区二区| 亚洲精品人妻天堂av| 日本高清一区二区久久| 2020年最新国产精品正在播放| 国产国拍精品av在线观看| 久久久视频2019午夜福利| 色婷婷亚洲一区二区三区| 亚洲第一无码专区天堂| 另类亚洲小说图片综合区| 欧美精品一区二区性色a+v| 18禁黄久久久aaa片| 成人av午夜在线观看| 亚洲第一页色| 亚洲?日韩?丝袜?熟女| 中文字幕一区二区三区精彩视频| 亚洲国产成人va在线观看天堂| 99国产精品自在自在久久| 97人人干|