網易首頁 > 網易號 > 正文申請入駐

智能體架構困在"模型忠誠"里

2026-05-08 10:21:56　來源: 碼上閑敘

北京舉報

分享至

生產環境的AI智能體正在做一件奇怪的事：所有任務都塞給同一個大模型。分類意圖、搜索信息、總結文檔、生成代碼、選擇工具、檢查結果、撰寫回復、判斷是否需要人工審批、等待外部事件、重試失敗任務、錯誤恢復——這些完全不同的工作負載，被強行塞進同一個調用入口。

這種"模型忠誠"有其現實根源。單一模型讓演示更簡單，評估更統一，采購更省事，調試也不至于太混亂。團隊出了問題只需找一個供應商算賬，而不是四處扯皮。但問題在于：生產級智能體本就不是單一工作負載。

Harrison Chase指出，大語言模型正在變貴，開源模型因此變得重要。LangChain的產品方向也印證這一點：Fleet智能體不再受限于單一模型，轉而支持多模型架構。兩種路徑，指向同一個生產現實。

智能體架構必須回答一個問題：什么工作該用什么模型？

令人意外的是，許多現有智能體棧把模型選擇當成環境配置參數，跟批大小、權衡參數并列。設好MODEL=claude-whatever或MODEL=gpt-whatever就部署。聊天機器人這么干沒問題，智能體這么干就是偷懶。

智能體內部天然引入方差。用戶眼中的簡單請求，在系統內部被拆解為檢索、規劃、轉換、檢查、執行、生成、調度等環節。有些步驟需要深度推理，有些追求速度，有些必須便宜。有些需要擅長代碼生成的模型，有些必須用開源權重模型——因為數據不能出境，或者單純因為搬運成本太高。

全鏈路使用同一個前沿模型確實讓人安心，但也掩蓋了浪費。沒有明顯的失敗點，只有緩慢、昂貴、官僚化的生產現狀。團隊盯著儀表盤：成本在漲，延遲在漲，然后抱怨模型太貴、提示詞太長。架構是線性的，所有步驟涌向同一個出口。

真正的問題在于計算單體化。其他領域早就學會了正確分離計算類別：隊列不是數據庫，Lambda不是批處理 worker，CDN不是源站。結果某個"聰明"的智能體一來，所有認知功能都得經過賬戶里最大的那個模型。

模型路由通常以可靠性議題進入討論：OpenAI掛了換Anthropic，部署過載換另一個，觸發限流就換個地方重試。這很重要。LiteLLM的路由文檔詳細說明了負載均衡、冷卻期、降級策略、超時機制——但這些都只是起點。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

專家：警惕美國"偷師"中國用中國的方式與中國競爭

澎湃新聞 2026-05-10 07:17:35
28447 跟貼 28447
劍指冠軍！國乒男團3-1戰勝法國隊晉級世乒賽決賽

央視新聞客戶端 2026-05-10 05:50:37
4957 跟貼 4957

美貿易代表:中國在很大程度上限制大量美商品對華出口

澎湃新聞 2026-05-10 08:46:56
635 跟貼 635

中國造"麒麟"級潛艇首艇交付巴方專家：不針對第三方

環球網資訊 2026-05-10 13:18:11
1069 跟貼 1069
為190元"僅退款"榴蓮千里討公道賣家:暫未收到道歉

極目新聞 2026-05-09 19:27:51
7923 跟貼 7923

“蘇超”第五周比賽結束，最新戰報出爐：無錫隊3:1泰州隊、徐州隊1:2宿遷隊、南通隊0:0南京隊

江蘇新聞 2026-05-09 21:46:44
262 跟貼 262

茶顏悅色，裝不下去了

中國新聞周刊 2026-05-07 22:15:57
299 跟貼 299
上海迪士尼能通話錄音游客不能錄，否則無法提供服務！游客：憑什么迪士尼能錄我不能

瀟湘晨報 2026-05-07 16:14:22
632 跟貼 632

廣西壯族自治區計劃生育協會常務副會長蘇英權接受審查調查

上觀新聞 2026-05-09 18:03:27
119 跟貼 119
4只皮皮蝦1035元，官方回應是否“帶客吃回扣”

中國新聞周刊 2026-05-09 19:38:06
9412 跟貼 9412
iOS 26.5下周正式推送，一口氣上線五大新功能

環球網資訊 2026-05-08 10:49:06
533 跟貼 533
海港今晚客戰國安“魔鬼主場”面臨“無人可用” 會帶來新驚喜嗎？

上觀新聞 2026-05-10 13:48:12
38 跟貼 38
國家體育總局呼吁不組織不參與運動員慶生

央視新聞客戶端 2026-05-10 15:38:30
68 跟貼 68
原研藥，回社區（二）：那些年，原研藥去哪兒了

看看新聞Knews 2026-05-10 08:56:09
56 跟貼 56
系統升級后續航從500公里變300公里？揭秘新能源車“鎖電”真相

齊魯壹點 2026-05-10 12:45:09
84 跟貼 84
一季度全國結婚登記169.7萬對

第一財經資訊 2026-05-10 10:17:17
4 跟貼 4
城市為什么都在搶山姆？

每日經濟新聞 2026-05-09 23:00:30
96 跟貼 96
北京辟謠│東靈山景區5月將開放？北京2026年4月辟謠榜發布

今日辟謠 2026-05-10 14:11:59
0 跟貼 0
英媒：英國將派遣艦艇參加霍爾木茲海峽護航行動

新華社 2026-05-09 20:43:43
845 跟貼 845
雷霆隊史首人！阿杰-米切爾季后賽轟24+10且全場0失誤

北青網-北京青年報 2026-05-10 15:18:02
6 跟貼 6
曝抽簽結果將影響勇士是否積極追求球星球隊已列出一份潛在名單

北青網-北京青年報 2026-05-10 14:54:08
1 跟貼 1
張文宏：此次疫情核心在于傳播路徑異常；“洪迪厄斯”號郵輪8人發病3死，“室內房間不能隨意開窗”；西班牙稱接收工作“一切準備就緒”

大象新聞 2026-05-10 08:46:41
0 跟貼 0
湖南靖州縣地鐵1號線正在施工？當地警方已辟謠

網易號社區管理員 2026-05-10 17:17:20
0 跟貼 0
小伙周末"擼鐵"差點把小命擼沒了：腦子像被炸開一樣

環球網資訊 2026-05-10 16:34:09
0 跟貼 0

手機 / 數碼

房產 / 家居

智能體架構困在"模型忠誠"里

DeepSeek融資，改寫所有人的估值

縣交警隊長被舉報工作日KTV飲酒 當地：其事先已請假

縣交警隊長被舉報工作日KTV飲酒 當地：其事先已請假

那個曾讓詹姆斯抱頭的兄弟，40歲從大學畢業了

大S女兒玥兒開通賬號，用煙花緬懷母親

白酒大逃殺

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態度原創

預售 | 丁一林風景寫生線上課程（最新）

菁英人居 全能豪宅

今年最好看的襯衫竟然是它？太減齡了！

搶瘋了！NS2漲價 日本店鋪狂設門檻也擋不住熱潮

我有的是辦法

縣交警隊長被舉報工作日KTV飲酒當地：其事先已請假

縣交警隊長被舉報工作日KTV飲酒當地：其事先已請假

軸距加長/智駕拉滿阿維塔07L定位大五座SUV

菁英人居全能豪宅

搶瘋了！NS2漲價日本店鋪狂設門檻也擋不住熱潮