網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

人工智能代理（AI Agents）與具能動(dòng)性的人工智能（Agentic AI）：概念分類、應(yīng)用與挑戰(zhàn)

2025-11-20 11:55:59　來(lái)源: CreateAMind

上海舉報(bào)

分享至

AI Agents vs. Agentic AI: A Conceptual taxonomy, applications andchallenges

人工智能代理（AI Agents）與具能動(dòng)性的人工智能（Agentic AI）：概念分類、應(yīng)用與挑戰(zhàn)

https://arxiv.org/pdf/2505.10468

摘要
在生成式人工智能（Generative AI）時(shí)代背景下，信息融合必須明確區(qū)分“人工智能代理”（AI Agents）與“具能動(dòng)性的人工智能”（Agentic AI）。本綜述對(duì)二者進(jìn)行了批判性區(qū)分，提出了一個(gè)結(jié)構(gòu)化的概念分類體系、應(yīng)用映射分析，并探討了各自所面臨的機(jī)會(huì)與挑戰(zhàn)，以厘清二者在設(shè)計(jì)理念與能力上的根本差異。我們首先概述了文獻(xiàn)檢索策略與基礎(chǔ)定義，將AI Agents界定為由大語(yǔ)言模型（LLMs）與大推理模型（LIMs）驅(qū)動(dòng)并賦能的模塊化系統(tǒng)，旨在實(shí)現(xiàn)任務(wù)特定的自動(dòng)化；生成式AI則被視為其前身，為AI Agents提供基礎(chǔ)支撐，而AI Agents則通過(guò)工具集成、提示工程（prompt engineering）與推理能力增強(qiáng)得以進(jìn)一步發(fā)展。隨后，我們刻畫了Agentic AI系統(tǒng)：與AI Agents不同，Agentic AI代表了一種范式轉(zhuǎn)變，其特征包括多智能體協(xié)作、動(dòng)態(tài)任務(wù)分解、持久記憶以及協(xié)調(diào)性自主能力。我們通過(guò)對(duì)其架構(gòu)演進(jìn)、運(yùn)行機(jī)制、交互方式與自主性水平的時(shí)序性評(píng)估，對(duì)AI Agents與Agentic AI兩類范式展開(kāi)了系統(tǒng)性對(duì)比分析。在應(yīng)用層面，AI Agents所支撐的領(lǐng)域（如客戶服務(wù)、日程安排、數(shù)據(jù)摘要）被與Agentic AI的應(yīng)用場(chǎng)景（如科研自動(dòng)化、機(jī)器人協(xié)同控制、醫(yī)療決策支持）進(jìn)行對(duì)照。我們進(jìn)一步剖析了兩類范式各自特有的挑戰(zhàn)——例如幻覺(jué)（hallucination）、脆弱性（brittleness）、涌現(xiàn)行為（emergent behavior）與協(xié)作失效（coordination failure），并提出了針對(duì)性解決方案，包括ReAct推理循環(huán)、檢索增強(qiáng)生成（RAG）、自動(dòng)化協(xié)調(diào)層以及因果建模等。本工作旨在為構(gòu)建魯棒、可擴(kuò)展且可解釋的AI驅(qū)動(dòng)系統(tǒng)提供發(fā)展路線圖。

關(guān)鍵詞：人工智能代理（AI Agents）、具能動(dòng)性的人工智能（Agentic AI）、上下文感知（Context awareness）、多智能體系統(tǒng)（Multi-agent systems）、概念分類（Conceptual taxonomy）

引言

在人工智能代理（AI Agents）與具能動(dòng)性的人工智能（Agentic AI）（見(jiàn)圖1）于2022年前后（即ChatGPT發(fā)布之前）被廣泛采用之前，自主與智能體的發(fā)展深深植根于人工智能的基礎(chǔ)范式之中，尤其是多智能體系統(tǒng)（Multi-Agent Systems, MAS）與專家系統(tǒng)——這些范式強(qiáng)調(diào)社會(huì)性行動(dòng)與分布式智能［1, 2］。值得注意的是，Castelfranchi［3］通過(guò)引入關(guān)于社會(huì)行動(dòng)、社會(huì)結(jié)構(gòu)與心智的本體論范疇，為該領(lǐng)域奠定了關(guān)鍵性基礎(chǔ)；他主張，社會(huì)性產(chǎn)生于個(gè)體智能體在共享環(huán)境中所采取的行動(dòng)及其認(rèn)知過(guò)程，并指出“目標(biāo)委派”（goal delegation）與“目標(biāo)采納”（goal adoption）等概念構(gòu)成了合作行為與組織行為的基礎(chǔ)。類似地，F(xiàn)erber［4］提出了一個(gè)面向多智能體系統(tǒng)的綜合性框架，將智能體定義為具備自主性、感知能力與通信能力的實(shí)體，并強(qiáng)調(diào)其在分布式問(wèn)題求解、協(xié)作機(jī)器人以及合成世界仿真等領(lǐng)域的應(yīng)用。

這些早期研究確立了個(gè)體社會(huì)行動(dòng)與認(rèn)知架構(gòu)對(duì)于建模集體現(xiàn)象的根本性作用，為現(xiàn)代AI Agents的發(fā)展奠定了基礎(chǔ)。本文在上述基礎(chǔ)性概念之上進(jìn)一步展開(kāi)探討，旨在考察［3, 4］中提出的社會(huì)行動(dòng)建模范式如何指導(dǎo)AI Agents的設(shè)計(jì)，使其能夠在動(dòng)態(tài)環(huán)境中執(zhí)行復(fù)雜且具備社會(huì)智能的交互行為。

傳統(tǒng)類代理系統(tǒng)（Classical Agent-like systems）被設(shè)計(jì)用于執(zhí)行具有預(yù)定義規(guī)則的特定任務(wù)，其自主性極為有限，且對(duì)動(dòng)態(tài)環(huán)境的適應(yīng)能力薄弱。此類系統(tǒng)主要表現(xiàn)為反應(yīng)式（reactive）或慎思式（deliberative）架構(gòu)，依賴符號(hào)推理、基于規(guī)則的邏輯或腳本化行為，而非現(xiàn)代AI Agents所具備的學(xué)習(xí)驅(qū)動(dòng)與上下文感知能力［5, 6］。例如，專家系統(tǒng)通過(guò)知識(shí)庫(kù)與推理引擎模擬人類在特定領(lǐng)域的決策過(guò)程（如醫(yī)療診斷系統(tǒng)MYCIN［7］）。其他著名實(shí)例還包括用于分子結(jié)構(gòu)預(yù)測(cè)的專家系統(tǒng)DENDRAL［8］、用于計(jì)算機(jī)系統(tǒng)配置的XCON［9］，以及基于規(guī)則的產(chǎn)生式系統(tǒng)框架CLIPS［10］。SOAR［11］與次級(jí)架構(gòu)（subsumption architecture）［12］進(jìn)一步將符號(hào)邏輯與反應(yīng)式邏輯拓展至認(rèn)知建模與機(jī)器人領(lǐng)域。

除任務(wù)特定推理之外，這些早期智能體還支持有限形式的社會(huì)性交互。例如，早期對(duì)話系統(tǒng)ELIZA［13］與PARRY［14］通過(guò)模式匹配與腳本式響應(yīng)模擬基礎(chǔ)對(duì)話，但缺乏真實(shí)理解能力或上下文適應(yīng)性；機(jī)器人中的反應(yīng)式智能體則基于固定控制規(guī)則執(zhí)行“感知—行動(dòng)”循環(huán)，如早期自主平臺(tái)Stanford Cart［15］所示。

多智能體系統(tǒng)則實(shí)現(xiàn)了分布式實(shí)體之間的協(xié)調(diào)協(xié)作，其典型應(yīng)用包括供應(yīng)鏈管理中的基于拍賣的資源分配機(jī)制［16–18］。電子游戲中的腳本化AI（如早期角色扮演游戲中的非玩家角色NPC行為）則采用預(yù)定義的決策樹(shù)實(shí)現(xiàn)行為控制［19］。此外，BDI（信念—愿望—意圖，Belief-Desire-Intention）架構(gòu)使軟件智能體具備目標(biāo)導(dǎo)向行為能力，如應(yīng)用于空管模擬系統(tǒng)中的智能體［20, 21］。

然而，跨越上述各類系統(tǒng)，早期AI智能體普遍存在若干共性局限：缺乏自學(xué)習(xí)能力、生成式推理能力，以及對(duì)非結(jié)構(gòu)化或演化環(huán)境的適應(yīng)能力。這些缺陷使其顯著區(qū)別于“具能動(dòng)性人工智能”（Agentic AI）——后者是一種新興范式，依托深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)與基礎(chǔ)模型（foundation models），賦能智能體實(shí)現(xiàn)上下文感知、持續(xù)學(xué)習(xí)與涌現(xiàn)式自主性［22］。

近期學(xué)術(shù)界、工業(yè)界及公眾對(duì)AI Agents與Agentic AI的高度關(guān)注，正反映了系統(tǒng)能力層面的這一重大躍遷。如圖1所示，Google Trends數(shù)據(jù)顯示，在2022年末大規(guī)模生成式模型興起之后，全球?qū)@兩個(gè)術(shù)語(yǔ)的搜索量均顯著上升。這一轉(zhuǎn)變與智能體設(shè)計(jì)范式的演進(jìn)密切相關(guān)：從2022年之前智能體運(yùn)行于受限、規(guī)則化環(huán)境的階段，過(guò)渡到大語(yǔ)言模型（LLM）時(shí)代之后以學(xué)習(xí)驅(qū)動(dòng)、靈活適應(yīng)為特征的架構(gòu)［23–25］。新一代系統(tǒng)使智能體能夠隨時(shí)間持續(xù)優(yōu)化性能，并與非結(jié)構(gòu)化、動(dòng)態(tài)的輸入實(shí)現(xiàn)自主交互［26–28］。例如，傳統(tǒng)專家系統(tǒng)需人工更新靜態(tài)知識(shí)庫(kù)，而現(xiàn)代智能體則借助涌現(xiàn)式神經(jīng)架構(gòu)實(shí)現(xiàn)跨任務(wù)泛化［25］。搜索熱度的激增反映了人們對(duì)這一技術(shù)飛躍日益增長(zhǎng)的認(rèn)知——研究者與從業(yè)者正積極尋求超越自動(dòng)化、邁向自主性與通用推理能力的工具。此外，其應(yīng)用范疇亦不再局限于仿真或物流等狹窄領(lǐng)域，而擴(kuò)展至需實(shí)時(shí)推理與自適應(yīng)控制的廣泛現(xiàn)實(shí)場(chǎng)景。如圖1所示，這一發(fā)展勢(shì)頭凸顯了近期架構(gòu)創(chuàng)新在推動(dòng)自主智能體規(guī)模化落地現(xiàn)實(shí)世界中的重要意義。

2022年11月ChatGPT的發(fā)布標(biāo)志著人工智能發(fā)展與公眾認(rèn)知的關(guān)鍵拐點(diǎn)，引發(fā)了全球范圍內(nèi)技術(shù)采納、投資與研究活動(dòng)的井噴式增長(zhǎng)［29］。在此突破之后，AI格局迅速轉(zhuǎn)型——從獨(dú)立使用的LLM逐步轉(zhuǎn)向更具自主性與任務(wù)導(dǎo)向性的框架［30］。這一演進(jìn)經(jīng)歷了兩大后生成式階段：AI Agents 與 Agentic AI。

最初，ChatGPT的巨大成功推動(dòng)了“生成式智能體”（Generative Agents）的普及——這類基于LLM的系統(tǒng)旨在根據(jù)用戶提示生成新穎輸出（如文本、圖像與代碼）［31, 32］。此類智能體被迅速應(yīng)用于各類場(chǎng)景：從對(duì)話助手（如GitHub Copilot［33］）、內(nèi)容生成平臺(tái)（如Jasper［34］）到創(chuàng)意工具（如Midjourney［35］），于2023年及以后徹底革新了數(shù)字設(shè)計(jì)、市場(chǎng)營(yíng)銷與軟件原型開(kāi)發(fā)等領(lǐng)域。

盡管“AI Agent”一詞最早于1998年提出［3］，但其內(nèi)涵隨著生成式AI的興起已發(fā)生顯著演進(jìn)。在此生成式基礎(chǔ)之上，一類新型系統(tǒng)——現(xiàn)今通稱的AI Agents——應(yīng)運(yùn)而生。此類智能體通過(guò)集成外部工具調(diào)用（如基于API的工具）、函數(shù)調(diào)用與序列化推理等能力，對(duì)LLM進(jìn)行增強(qiáng)，使其可自主獲取實(shí)時(shí)信息并執(zhí)行多步驟工作流［36, 37］。代表性框架如AutoGPT［38］與BabyAGI（https://github.com/yoheinakajima/babyagi）凸顯了這一轉(zhuǎn)變：它們展示了如何將LLM嵌入反饋循環(huán)中，以在目標(biāo)驅(qū)動(dòng)環(huán)境中動(dòng)態(tài)規(guī)劃、行動(dòng)與適應(yīng)［39 , 40］。

至2023年末，該領(lǐng)域進(jìn)一步邁向Agentic AI新階段——即由多個(gè)專業(yè)化智能體組成的復(fù)雜多智能體系統(tǒng)，這些智能體通過(guò)協(xié)作分解目標(biāo)、相互通信并在更大工作流中協(xié)調(diào)行動(dòng)，以達(dá)成共同目標(biāo)。順應(yīng)此趨勢(shì)，谷歌于2025年推出智能體間協(xié)議（Agent-to-Agent, A2A）［41］，一項(xiàng)旨在實(shí)現(xiàn)跨框架與跨廠商智能體間無(wú)縫互操作的標(biāo)準(zhǔn)化提案。該協(xié)議圍繞五大核心原則構(gòu)建：擁抱能動(dòng)性能力、基于既有標(biāo)準(zhǔn)擴(kuò)展、默認(rèn)保障交互安全、支持長(zhǎng)時(shí)運(yùn)行任務(wù)，以及確保模態(tài)無(wú)關(guān)性（modality agnosticism）。這些準(zhǔn)則旨在為構(gòu)建響應(yīng)迅速、可擴(kuò)展的能動(dòng)性基礎(chǔ)設(shè)施奠定基礎(chǔ)。

CrewAI等架構(gòu)展示了此類能動(dòng)性框架如何在分布式角色間實(shí)現(xiàn)決策協(xié)同，從而在機(jī)器人、物流管理與自適應(yīng)決策支持等高風(fēng)險(xiǎn)應(yīng)用中促成高階智能行為［42］。

隨著領(lǐng)域從生成式智能體向日益自主的Agentic AI系統(tǒng)演進(jìn)，厘清AI Agents與Agentic AI之間的技術(shù)與概念邊界變得至關(guān)重要。盡管兩類范式均以LLM為基礎(chǔ)并拓展了生成式系統(tǒng)的能力，但其底層架構(gòu)、交互模型與自主性層級(jí)存在根本差異：

AI Agents
通常被設(shè)計(jì)為 單實(shí)體系統(tǒng) ，通過(guò)調(diào)用外部工具、實(shí)施序列化推理并整合實(shí)時(shí)信息，以完成明確定義的目標(biāo)導(dǎo)向任務(wù)［25, 43］；
Agentic AI系統(tǒng)
則由 多個(gè)專業(yè)化智能體 構(gòu)成，它們?cè)诟蠊ぷ髁髦袆?dòng)態(tài)分配子任務(wù)、相互協(xié)調(diào)與通信，以共同實(shí)現(xiàn)目標(biāo)［22, 44］。

這一架構(gòu)差異凸顯了二者在可擴(kuò)展性、適應(yīng)性及應(yīng)用廣度上的顯著區(qū)別。

對(duì)AI Agents與Agentic AI之間分類體系的界定與形式化，在科學(xué)層面具有多重重要意義：

首先，它有助于實(shí)現(xiàn)更精準(zhǔn)的系統(tǒng)設(shè)計(jì)——將計(jì)算框架與問(wèn)題復(fù)雜度相匹配：即對(duì)模塊化、工具輔助型任務(wù)部署AI Agents，而對(duì)需協(xié)同執(zhí)行的多智能體操作采用Agentic AI；其次，它支持恰當(dāng)?shù)幕鶞?zhǔn)測(cè)試與評(píng)估：面向單任務(wù)執(zhí)行的智能體與面向復(fù)雜協(xié)同任務(wù)的分布式智能體系統(tǒng)，在性能指標(biāo)、安全協(xié)議與資源需求等方面存在顯著差異；再者，清晰的分類體系可減少開(kāi)發(fā)低效問(wèn)題，例如避免將適用于多智能體協(xié)作的設(shè)計(jì)原則誤用于單智能體架構(gòu)的系統(tǒng)中。缺乏此等明晰性，開(kāi)發(fā)者與實(shí)踐者既可能低估需能動(dòng)性協(xié)作的復(fù)雜場(chǎng)景，導(dǎo)致系統(tǒng)能力不足；亦可能高估簡(jiǎn)單應(yīng)用場(chǎng)景的需求，造成過(guò)度工程化。

本文旨在厘清AI Agents與Agentic AI之間的差異，為研究者提供對(duì)這些技術(shù)的基礎(chǔ)性理解。本研究的目標(biāo)是：

明確二者的形式化區(qū)別；
建立共享術(shù)語(yǔ)體系；
構(gòu)建一個(gè)結(jié)構(gòu)化的概念分類框架（如圖2所示），以指導(dǎo)學(xué)術(shù)界與工業(yè)界下一代智能體系統(tǒng)的設(shè)計(jì)。

本綜述亦對(duì)從傳統(tǒng)AI Agents到新興Agentic AI系統(tǒng)的演進(jìn)歷程進(jìn)行了全面的概念與架構(gòu)分析。區(qū)別于常規(guī)綜述文章圍繞形式化研究問(wèn)題組織內(nèi)容的方式，本文采用一種時(shí)序性、分層遞進(jìn)的結(jié)構(gòu)，清晰呈現(xiàn)兩類范式的歷史脈絡(luò)與技術(shù)演進(jìn)路徑。

我們首先詳述文獻(xiàn)檢索策略與篩選標(biāo)準(zhǔn)，繼而通過(guò)剖析其核心屬性（如自主性、反應(yīng)性與工具調(diào)用執(zhí)行能力），確立對(duì)AI Agents的基礎(chǔ)認(rèn)識(shí)；隨后探討基礎(chǔ)模型——特別是大語(yǔ)言模型（LLMs）與大圖像模型（LIMs）——的關(guān)鍵作用：它們作為核心推理與感知引擎，驅(qū)動(dòng)智能體行為的生成；后續(xù)章節(jié)考察生成式AI系統(tǒng)如何作為先驅(qū)，推動(dòng)更具動(dòng)態(tài)性與交互性的智能體發(fā)展，從而為Agentic AI的出現(xiàn)鋪平道路。

基于此視角，我們呈現(xiàn)并分析了從孤立單智能體系統(tǒng)向協(xié)同多智能體架構(gòu)的概念跨越，重點(diǎn)突出其結(jié)構(gòu)差異、協(xié)調(diào)策略與協(xié)作機(jī)制；我們進(jìn)一步通過(guò)解析AI Agents與Agentic AI的核心系統(tǒng)組件，映射其架構(gòu)演進(jìn)歷程，并對(duì)二者的規(guī)劃層、記憶層、編排層與執(zhí)行層進(jìn)行對(duì)比性描述；

在此基礎(chǔ)之上，我們綜述了涵蓋客戶服務(wù)、醫(yī)療健康、科研自動(dòng)化與機(jī)器人等領(lǐng)域的應(yīng)用場(chǎng)景，并依據(jù)系統(tǒng)能力與協(xié)作復(fù)雜度對(duì)現(xiàn)實(shí)部署案例進(jìn)行分類；隨后評(píng)估兩類范式所面臨的關(guān)鍵挑戰(zhàn)——包括幻覺(jué)、推理深度不足、因果建模缺失、可擴(kuò)展性瓶頸與治理風(fēng)險(xiǎn)；針對(duì)上述局限，我們概述了新興解決方案的發(fā)展機(jī)遇，例如檢索增強(qiáng)生成（RAG）、工具輔助推理、記憶架構(gòu)設(shè)計(jì)以及基于仿真的規(guī)劃方法。

最后，本綜述提出一項(xiàng)前瞻性路線圖，展望模塊化AI Agents與協(xié)同式Agentic AI在自動(dòng)駕駛、金融、醫(yī)療等關(guān)鍵任務(wù)領(lǐng)域乃至更廣泛場(chǎng)景中的融合前景。我們旨在為研究者提供一套結(jié)構(gòu)化的分類體系與可操作的洞見(jiàn)，以指導(dǎo)下一代能動(dòng)性AI系統(tǒng)的設(shè)計(jì)、部署與評(píng)估。

盡管學(xué)界對(duì)AI Agents與Agentic AI的興趣日益增長(zhǎng)，現(xiàn)有綜述工作往往將二者籠統(tǒng)歸入“智能體”這一寬泛范疇之下，導(dǎo)致概念模糊與系統(tǒng)設(shè)計(jì)錯(cuò)位。近期文獻(xiàn)要么狹隘聚焦于工具增強(qiáng)型LLM在任務(wù)自動(dòng)化中的應(yīng)用，要么泛泛討論多智能體系統(tǒng)，卻未能充分認(rèn)知Agentic AI所帶來(lái)的架構(gòu)與功能層面的范式轉(zhuǎn)變。

本綜述首次提出一套結(jié)構(gòu)化的分類體系，從自主性（autonomy）、協(xié)調(diào)性（coordination）、交互方式（interaction）與推理范圍（reasoning scope）等維度，對(duì)這兩類范式進(jìn)行形式化區(qū)分。通過(guò)將AI Agents界定為模塊化、單實(shí)體系統(tǒng)，而將Agentic AI界定為具備涌現(xiàn)行為的協(xié)同式生態(tài)系統(tǒng)，本研究有效填補(bǔ)了當(dāng)前在設(shè)計(jì)原則、部署策略與評(píng)估標(biāo)準(zhǔn)等方面的區(qū)分空白。

這一區(qū)分在當(dāng)下尤顯關(guān)鍵：現(xiàn)實(shí)世界應(yīng)用（如機(jī)器人、醫(yī)療健康與科學(xué)發(fā)現(xiàn)）正日益要求具備可擴(kuò)展性的多智能體智能，然而開(kāi)發(fā)者往往缺乏清晰的框架來(lái)抉擇——究竟應(yīng)采用孤立式智能體，抑或協(xié)作式能動(dòng)架構(gòu)。本綜述正旨在彌合此一鴻溝，促使系統(tǒng)能力與任務(wù)復(fù)雜度實(shí)現(xiàn)更精準(zhǔn)的對(duì)齊，并為后LLM時(shí)代的科研議程設(shè)定與實(shí)際系統(tǒng)部署提供理論指導(dǎo)與實(shí)踐依據(jù)。

1.1 方法論概述

本綜述采用一種結(jié)構(gòu)化、多階段的研究方法，旨在系統(tǒng)把握AI Agents與Agentic AI的演進(jìn)歷程、架構(gòu)特征、應(yīng)用場(chǎng)景及現(xiàn)存局限。該方法流程如圖3所示，清晰勾勒出本研究中各主題與概念的遞進(jìn)邏輯關(guān)系。分析框架的設(shè)計(jì)聚焦于呈現(xiàn)從以LLM為基礎(chǔ)的基本能動(dòng)結(jié)構(gòu)，到高級(jí)多智能體協(xié)同系統(tǒng)的演進(jìn)路徑。綜述各環(huán)節(jié)均基于對(duì)學(xué)術(shù)文獻(xiàn)及AI賦能平臺(tái)所發(fā)布成果的嚴(yán)謹(jǐn)綜合與提煉，從而實(shí)現(xiàn)對(duì)當(dāng)前研究格局及其新興趨勢(shì)的全面把握。

綜述首先確立對(duì)AI Agents的基礎(chǔ)性理解，考察文獻(xiàn)中對(duì)其核心定義、設(shè)計(jì)原則與架構(gòu)模塊的描述，包括感知（perception）、推理（reasoning）與行動(dòng)選擇（action selection）等組件，以及早期應(yīng)用實(shí)例（如客戶服務(wù)機(jī)器人與檢索助手）。該基礎(chǔ)層構(gòu)成進(jìn)入更廣義能動(dòng)范式的概念入口點(diǎn)。

其次，我們探討大語(yǔ)言模型（LLMs）作為核心推理組件的關(guān)鍵作用，著重闡明預(yù)訓(xùn)練語(yǔ)言模型如何賦能現(xiàn)代AI Agents。本節(jié)詳述：通過(guò)指令微調(diào)（instruction fine-tuning）與基于人類反饋的強(qiáng)化學(xué)習(xí)（RLHF），LLMs得以支撐自然語(yǔ)言交互、任務(wù)規(guī)劃與有限決策能力；同時(shí)，亦指出其局限性，例如幻覺(jué)（hallucination）、靜態(tài)知識(shí)庫(kù)、以及因果推理能力的缺失。

在此基礎(chǔ)之上，綜述進(jìn)一步探討Agentic AI的興起——這一階段代表著重要的概念躍升。我們著重強(qiáng)調(diào)其從“工具增強(qiáng)型單智能體系統(tǒng)”向“協(xié)作式、分布式智能體生態(tài)系統(tǒng)”的根本性轉(zhuǎn)變。這一轉(zhuǎn)變?cè)从诂F(xiàn)實(shí)需求：系統(tǒng)需具備目標(biāo)分解、子任務(wù)分配、輸出協(xié)調(diào)及對(duì)動(dòng)態(tài)變化環(huán)境的自適應(yīng)能力——這些能力已遠(yuǎn)超孤立AI Agents所能實(shí)現(xiàn)的范疇。

隨后一節(jié)考察從AI Agents到Agentic AI系統(tǒng)的架構(gòu)演進(jìn)，對(duì)比簡(jiǎn)單模塊化智能體設(shè)計(jì)與復(fù)雜協(xié)同框架之間的差異。我們描述了多項(xiàng)關(guān)鍵增強(qiáng)機(jī)制，例如持久記憶（persistent memory）、元智能體協(xié)調(diào)（meta-agent coordination）、多智能體規(guī)劃循環(huán)（如ReAct與思維鏈（Chain-of-Thought）提示）、以及語(yǔ)義通信協(xié)議（semantic communication protocols）。該架構(gòu)對(duì)比分析輔以AutoGPT、CrewAI與LangGraph等平臺(tái)的具體案例予以支撐。

在完成架構(gòu)探索之后，綜述深入剖析AI Agents與Agentic AI當(dāng)前落地的應(yīng)用領(lǐng)域。本文分別選取兩類范式各四個(gè)代表性應(yīng)用場(chǎng)景進(jìn)行討論：

對(duì)于 AI Agents ，包括：客戶服務(wù)自動(dòng)化、企業(yè)內(nèi)部搜索增強(qiáng)、郵件過(guò)濾與優(yōu)先級(jí)排序，以及個(gè)性化內(nèi)容推薦；
對(duì)于 Agentic AI ，則涵蓋：多智能體科研助手、智能機(jī)器人協(xié)同控制、協(xié)作式醫(yī)療決策支持，以及自適應(yīng)工作流自動(dòng)化。

上述用例均從系統(tǒng)復(fù)雜度、實(shí)時(shí)決策能力及協(xié)作任務(wù)執(zhí)行等方面展開(kāi)分析。

繼而，我們探討兩類范式固有的挑戰(zhàn)與局限：

針對(duì) AI Agents ，聚焦于幻覺(jué)、提示脆弱性（prompt brittleness）、規(guī)劃能力有限，以及缺乏因果理解等問(wèn)題；
針對(duì) Agentic AI ，則識(shí)別出更高階的挑戰(zhàn)，如智能體間目標(biāo)錯(cuò)位（inter-agent misalignment）、錯(cuò)誤傳播、涌現(xiàn)行為的不可預(yù)測(cè)性、可解釋性缺陷，以及對(duì)抗性脆弱性（adversarial vulnerabilities）。這些問(wèn)題均結(jié)合近期實(shí)驗(yàn)研究與技術(shù)報(bào)告予以批判性剖析。

最后，綜述概述了應(yīng)對(duì)上述挑戰(zhàn)的潛在解決方案，援引因果建模、檢索增強(qiáng)生成（RAG）、多智能體記憶框架，以及魯棒評(píng)估流程等最新進(jìn)展。這些策略不僅被視作技術(shù)修補(bǔ)手段，更被視為將能動(dòng)系統(tǒng)規(guī)模化部署至高風(fēng)險(xiǎn)領(lǐng)域（如醫(yī)療、金融與自動(dòng)駕駛機(jī)器人）所必需的基礎(chǔ)性保障。

綜上所述，本方法論結(jié)構(gòu)使我們得以對(duì)AI Agents與Agentic AI的研究現(xiàn)狀進(jìn)行系統(tǒng)、全面的評(píng)估。通過(guò)將分析依次安排為：基礎(chǔ)認(rèn)知 → 模型集成 → 架構(gòu)演進(jìn) → 應(yīng)用場(chǎng)景 → 局限與挑戰(zhàn) → 潛在解決方案，本研究旨在為身處這一快速演變領(lǐng)域中的研究者與實(shí)踐者提供兼具理論明晰性與實(shí)踐指導(dǎo)價(jià)值的參考框架。

1.1.1 檢索策略

為完成本綜述，我們采用了一種混合式文獻(xiàn)檢索方法，結(jié)合傳統(tǒng)學(xué)術(shù)數(shù)據(jù)庫(kù)與AI增強(qiáng)型文獻(xiàn)發(fā)現(xiàn)工具。具體而言，共檢索了12個(gè)平臺(tái)：

學(xué)術(shù)數(shù)據(jù)庫(kù)包括：Google Scholar、IEEE Xplore、ACM數(shù)字圖書館（ACM Digital Library）、Scopus、Web of Science、ScienceDirect 和 arXiv；
AI驅(qū)動(dòng)的檢索接口包括：ChatGPT、Perplexity.ai、DeepSeek、Hugging Face Search 以及 Grok。

檢索查詢采用布爾邏輯組合關(guān)鍵詞，如“AI Agents”（人工智能代理）、“Agentic AI”（具能動(dòng)性人工智能）、“LLM Agents”（大語(yǔ)言模型代理）、“Tool-augmented LLMs”（工具增強(qiáng)型大語(yǔ)言模型）以及“Multi-Agent AI Systems”（多智能體人工智能系統(tǒng)）。此外，還使用了針對(duì)性更強(qiáng)的組合查詢，例如“Agentic AI + Coordination + Planning”（具能動(dòng)性人工智能 + 協(xié)調(diào) + 規(guī)劃）和“AI Agents + Tool Usage + Reasoning”（人工智能代理 + 工具使用 + 推理），以篩選出同時(shí)涵蓋概念基礎(chǔ)與系統(tǒng)級(jí)實(shí)現(xiàn)的研究文獻(xiàn)。

文獻(xiàn)納入標(biāo)準(zhǔn)基于其在新穎性、實(shí)證評(píng)估、架構(gòu)貢獻(xiàn)與引用影響力等方面的顯著價(jià)值。如圖1所示，Google Trends數(shù)據(jù)顯示全球?qū)@些技術(shù)的關(guān)注度持續(xù)攀升，進(jìn)一步凸顯了對(duì)這一新興知識(shí)領(lǐng)域進(jìn)行系統(tǒng)整合的緊迫性。

AI Agents的基礎(chǔ)性理解

AI Agents可被定義為：在限定的數(shù)字環(huán)境中、為實(shí)現(xiàn)目標(biāo)導(dǎo)向型任務(wù)執(zhí)行而設(shè)計(jì)的自主性軟件實(shí)體［22, 45］。其核心特征在于能夠：

感知結(jié)構(gòu)化或非結(jié)構(gòu)化輸入［46］；
基于上下文信息進(jìn)行推理［47, 48］；
為達(dá)成特定目標(biāo)而發(fā)起行動(dòng)，常作為人類用戶或子系統(tǒng)的代理［49］。

與遵循確定性流程的傳統(tǒng)自動(dòng)化腳本不同，AI Agents展現(xiàn)出反應(yīng)式智能與一定程度的適應(yīng)性，使其能夠解讀動(dòng)態(tài)輸入并相應(yīng)調(diào)整輸出［50］。其應(yīng)用已廣泛見(jiàn)諸諸多領(lǐng)域，包括客戶服務(wù)自動(dòng)化［51, 52］、個(gè)人生產(chǎn)力輔助［53］、組織級(jí)信息檢索［54, 55］以及決策支持系統(tǒng)［56, 57］。

AI Agents實(shí)現(xiàn)自主性的一個(gè)突出實(shí)例是Anthropic的“Computer Use”（計(jì)算機(jī)操作）項(xiàng)目。該項(xiàng)目展示了其Claude模型如何以近似人類的方式與計(jì)算機(jī)交互：Claude經(jīng)訓(xùn)練可視覺(jué)識(shí)別屏幕內(nèi)容、操控鼠標(biāo)與鍵盤，并在各類軟件應(yīng)用間導(dǎo)航。借此，Claude不僅能自動(dòng)化重復(fù)性任務(wù)（如填寫表格、復(fù)制數(shù)據(jù)），還可執(zhí)行更復(fù)雜的活動(dòng)——例如通過(guò)打開(kāi)代碼編輯器、運(yùn)行命令、調(diào)試問(wèn)題等方式構(gòu)建并測(cè)試軟件。除上述結(jié)構(gòu)化任務(wù)外，Claude還能處理開(kāi)放式任務(wù)，如開(kāi)展在線調(diào)研、從多源整合信息，乃至根據(jù)調(diào)研結(jié)果自主創(chuàng)建日歷事件。

其關(guān)鍵創(chuàng)新在于Claude運(yùn)行于一個(gè)“代理循環(huán)”（agent loop）之中：它接收目標(biāo)→決定下一步行動(dòng)→執(zhí)行該行動(dòng)→觀察結(jié)果→重復(fù)該過(guò)程，直至任務(wù)完成。這一機(jī)制使Claude得以獨(dú)立調(diào)用現(xiàn)有計(jì)算機(jī)工具與界面，實(shí)現(xiàn)廣泛目標(biāo)的自動(dòng)化——既涵蓋常規(guī)流程，亦包括復(fù)雜工作流，堪稱自主AI Agents賦能現(xiàn)實(shí)任務(wù)自動(dòng)化的典范。

2.0.1 AI Agents的核心特征

學(xué)界普遍將AI Agents概念化為：一種被實(shí)例化部署的人工智能操作單元，旨在與用戶、軟件生態(tài)系統(tǒng)或數(shù)字基礎(chǔ)設(shè)施交互，以生成目標(biāo)導(dǎo)向行為［58–60］。與通用大語(yǔ)言模型（LLMs）相比，AI Agents展現(xiàn)出結(jié)構(gòu)性初始化、有限自主性與持續(xù)任務(wù)導(dǎo)向性等特質(zhì)。LLMs本質(zhì)上主要是對(duì)提示作出反應(yīng)的“被動(dòng)跟隨者”［61］，而AI Agents則能在明確定義的范圍內(nèi)自動(dòng)運(yùn)行，動(dòng)態(tài)響應(yīng)輸入，并在實(shí)時(shí)環(huán)境中產(chǎn)出可執(zhí)行輸出［62］。

如圖4所示，當(dāng)前主流架構(gòu)分類體系及實(shí)際部署中的AI Agents普遍包含以下三項(xiàng)基礎(chǔ)性特征：自主性（autonomy）、任務(wù)特異性（task-specificity）以及具備適應(yīng)能力的反應(yīng)性（reactivity with adaptation）。

這三項(xiàng)特征共同構(gòu)成了理解與評(píng)估不同應(yīng)用場(chǎng)景中AI Agents的基礎(chǔ)框架。本節(jié)余下部分將逐一詳述各特征，并輔以理論背景與實(shí)例說(shuō)明。

自主性（Autonomy）：AI Agents的一個(gè)核心特征是，部署后可在極小或無(wú)需人工干預(yù)的情況下運(yùn)行［63］。一旦初始化完成，這些智能體便能夠感知環(huán)境輸入、基于上下文數(shù)據(jù)進(jìn)行推理，并實(shí)時(shí)執(zhí)行預(yù)設(shè)或自適應(yīng)的動(dòng)作［25］。在需要持續(xù)人工監(jiān)督（human-in-the-loop）不切實(shí)際的應(yīng)用場(chǎng)景中——如客戶服務(wù)機(jī)器人或日程助理——自主性使得規(guī)模化部署成為可能［52, 64］。
任務(wù)特異性（Task-Specificity）：AI Agents是為狹窄且定義明確的任務(wù)而專門構(gòu)建的［65, 66］。它們被優(yōu)化用于在固定領(lǐng)域內(nèi)執(zhí)行可重復(fù)的操作，例如郵件過(guò)濾［67, 68］、數(shù)據(jù)庫(kù)查詢［69］或日歷協(xié)調(diào)［44, 70］。這種任務(wù)專業(yè)化使它們?cè)谧詣?dòng)化那些無(wú)需或不適合通用推理的任務(wù)時(shí)，具備高效率、高可解釋性與高精確度。
反應(yīng)性與適應(yīng)性（Reactivity and Adaptation）：AI Agents通常包含與動(dòng)態(tài)輸入交互的基本機(jī)制，使其能夠響應(yīng)實(shí)時(shí)刺激，例如用戶請(qǐng)求、外部API調(diào)用或軟件環(huán)境中狀態(tài)的變化［25, 71］。部分系統(tǒng)通過(guò)反饋循環(huán)［73, 74］、啟發(fā)式方法［75］或更新后的上下文緩存區(qū)，整合基礎(chǔ)學(xué)習(xí)能力［72］，以隨時(shí)間推移不斷優(yōu)化行為表現(xiàn)，尤其適用于個(gè)性化推薦或?qū)υ捔鞒坦芾淼葓?chǎng)景［76–78］。

上述核心特征共同使AI Agents能夠作為模塊化、輕量級(jí)接口，連接預(yù)訓(xùn)練AI模型與特定領(lǐng)域的實(shí)用流水線。其架構(gòu)簡(jiǎn)潔性與操作高效性，使其成為企業(yè)、消費(fèi)及工業(yè)場(chǎng)景下可擴(kuò)展自動(dòng)化的核心推動(dòng)者。盡管目前尚無(wú)明確研究涉及將AI Agents與專用推理型大語(yǔ)言模型集成，但它們?cè)谑芟奕蝿?wù)邊界內(nèi)展現(xiàn)出的高度可用性與性能，已使其成為當(dāng)代智能系統(tǒng)設(shè)計(jì)中的基礎(chǔ)組成要素。

2.0.2 基礎(chǔ)模型：LLMs與LIMs的作用

人工智能代理（AI Agents）的發(fā)展在很大程度上得益于大語(yǔ)言模型（LLMs）與大圖像模型（LIMs）的基礎(chǔ)性進(jìn)展與實(shí)際部署——二者共同構(gòu)成當(dāng)代智能體系統(tǒng)的核心推理引擎與感知引擎。這些模型使AI Agents得以智能地與其環(huán)境交互，理解多模態(tài)輸入，并執(zhí)行超越硬編碼自動(dòng)化的復(fù)雜推理任務(wù)。

諸如GPT-4［79］和PaLM［80］等大語(yǔ)言模型（LLMs），是在海量文本數(shù)據(jù)（包括書籍、網(wǎng)頁(yè)內(nèi)容及對(duì)話語(yǔ)料庫(kù)）上訓(xùn)練而成的。這些模型展現(xiàn)出諸如自然語(yǔ)言理解、問(wèn)答、文本摘要、對(duì)話連貫性，乃至符號(hào)推理等涌現(xiàn)能力［81–83］。在AI Agent架構(gòu)中，LLMs充當(dāng)核心決策引擎，使智能體能夠解析用戶查詢、規(guī)劃多步驟解決方案，并生成類人響應(yīng)。例如，一個(gè)基于GPT-4驅(qū)動(dòng)的AI客戶服務(wù)代理，可理解客戶投訴內(nèi)容，通過(guò)工具集成查詢后端系統(tǒng)，并以符合上下文且具備情感感知的方式作出回應(yīng)［84, 85］。

大圖像模型（Large Image Models, LIMs），如CLIP［86］與BLIP-2［87］，則將智能體的能力拓展至視覺(jué)領(lǐng)域。LIMs基于圖文配對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練，支持圖像分類、目標(biāo)檢測(cè)及視覺(jué)—語(yǔ)言對(duì)齊等感知型任務(wù)。這些能力對(duì)運(yùn)行于機(jī)器人［88］、自動(dòng)駕駛車輛［89, 90］及視覺(jué)內(nèi)容審核［91, 92］等領(lǐng)域的智能體日益關(guān)鍵。

例如，如圖5所示：當(dāng)一個(gè)自主無(wú)人機(jī)智能體被指派執(zhí)行果園監(jiān)測(cè)任務(wù)時(shí)，LIM可通過(guò)解析實(shí)時(shí)航拍影像，識(shí)別出患病果實(shí)［93］或受損枝條；一經(jīng)檢測(cè)，系統(tǒng)即可自動(dòng)觸發(fā)預(yù)設(shè)干預(yù)協(xié)議——如通知園藝人員，或標(biāo)記位置以供定向處理——全程無(wú)需人工介入［25, 63］。該工作流典型體現(xiàn)了AI Agents在農(nóng)業(yè)環(huán)境中的自主性與反應(yīng)性，而近期文獻(xiàn)亦指出：此類基于無(wú)人機(jī)的AI Agents正日趨成熟與復(fù)雜。

Chitra等人［94］對(duì)具身智能體所依賴的基礎(chǔ)AI算法進(jìn)行了全面綜述，著重探討了計(jì)算機(jī)視覺(jué)、同步定位與建圖（SLAM）、強(qiáng)化學(xué)習(xí)及多傳感器融合的集成應(yīng)用；上述組件共同支撐智能體在動(dòng)態(tài)環(huán)境中實(shí)現(xiàn)實(shí)時(shí)感知與自適應(yīng)導(dǎo)航。Kourav等人［95］進(jìn)一步強(qiáng)調(diào)了自然語(yǔ)言處理與LLMs在根據(jù)人類指令生成無(wú)人機(jī)行動(dòng)方案中的作用，展示了LLMs如何支持自然化交互與任務(wù)規(guī)劃。類似地，Natarajan等人［96］研究了深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)在空中機(jī)器人場(chǎng)景理解、空間建圖及多智能體協(xié)調(diào)中的應(yīng)用。這些研究共同指向一個(gè)核心結(jié)論：AI驅(qū)動(dòng)的自主性、感知能力和決策能力，是推動(dòng)無(wú)人機(jī)智能體發(fā)展的關(guān)鍵所在。

尤為重要的是，LLMs與LIMs通常通過(guò)云平臺(tái)（如OpenAI、Hugging Face及Google Gemini）所提供的推理API進(jìn)行調(diào)用。此類服務(wù)將模型訓(xùn)練與微調(diào)的復(fù)雜性封裝隱藏，使開(kāi)發(fā)者得以快速構(gòu)建并部署具備前沿推理與感知能力的智能體。這種可集成性極大加速了原型開(kāi)發(fā)進(jìn)程，并使LangChain［97］與AutoGen［98］等智能體框架得以在任務(wù)工作流中協(xié)同調(diào)度LLM與LIM的輸出。

簡(jiǎn)言之，基礎(chǔ)AI模型賦予現(xiàn)代AI Agents對(duì)語(yǔ)言與場(chǎng)景的基本理解能力：語(yǔ)言模型助其以文字進(jìn)行推理，圖像模型助其解讀圖像；二者協(xié)同工作，使AI Agents得以在復(fù)雜情境中作出智能決策。

2.0.3 生成式AI作為先驅(qū)

文獻(xiàn)中持續(xù)出現(xiàn)的一個(gè)主題是：將生成式AI定位為能動(dòng)性智能（agentic intelligence）的基礎(chǔ)性先驅(qū)。此類系統(tǒng)主要基于預(yù)訓(xùn)練的大語(yǔ)言模型（LLMs）與大圖像模型（LIMs）構(gòu)建，其優(yōu)化目標(biāo)在于根據(jù)輸入提示合成多模態(tài)內(nèi)容，包括文本、圖像、音頻或代碼。盡管生成式模型具有高度的交互性，但其本質(zhì)仍表現(xiàn)為反應(yīng)性行為：它們僅在被明確提示時(shí)才生成輸出，既不自主追求目標(biāo)，也不進(jìn)行自發(fā)性推理［99, 100］。

生成式AI的關(guān)鍵特征如下：

反應(yīng)性（Reactivity）：
作為非自主系統(tǒng)，生成式模型完全由輸入驅(qū)動(dòng)［101, 102］。其運(yùn)行僅由用戶指定的提示觸發(fā)，缺乏內(nèi)部狀態(tài)、持久記憶或目標(biāo)追蹤機(jī)制［103–105］。
多模態(tài)能力（Multi-modal Capability）：
現(xiàn)代生成式系統(tǒng)可產(chǎn)出豐富多樣的輸出，包括連貫的敘事文本、可執(zhí)行代碼、逼真圖像乃至語(yǔ)音轉(zhuǎn)錄文本。例如，GPT-4［79］、PaLM-E［106］與BLIP-2［87］等模型已展現(xiàn)出此類能力，可支持文本→圖像、圖像→文本以及跨模態(tài)合成等任務(wù)。
依賴提示與無(wú)狀態(tài)性（Prompt Dependency and Statelessness）：
盡管生成式系統(tǒng)本質(zhì)上是無(wú)狀態(tài)的——即除非通過(guò)提示顯式提供上下文，否則無(wú)法在交互間保留記憶［107, 108］——但近期進(jìn)展（如GPT-4.1）已支持高達(dá)百萬(wàn)token的上下文窗口長(zhǎng)度，并憑借更強(qiáng)的長(zhǎng)文本理解能力，更有效地利用該擴(kuò)展上下文［109］。
然而，其架構(gòu)仍缺乏內(nèi)在反饋循環(huán)［110］、狀態(tài)管理機(jī)制［111, 112］，以及多步規(guī)劃能力——而后者正是實(shí)現(xiàn)自主決策與迭代式目標(biāo)優(yōu)化所必需的［113, 114］。

盡管生成式系統(tǒng)在內(nèi)容生成的保真度上表現(xiàn)卓越，但其根本局限在于無(wú)法主動(dòng)作用于環(huán)境，或獨(dú)立操控?cái)?shù)字工具。例如，若無(wú)人工設(shè)計(jì)的封裝層（wrappers）或支撐架構(gòu)（scaffolding layers），它們無(wú)法自主執(zhí)行網(wǎng)頁(yè)搜索、解析實(shí)時(shí)數(shù)據(jù)或與API進(jìn)行交互。因此，這類系統(tǒng)尚不足以被歸類為真正的AI Agents——后者需在其架構(gòu)中整合感知、決策與外部工具調(diào)用能力，并形成閉環(huán)反饋機(jī)制。

生成式AI在處理動(dòng)態(tài)任務(wù)、維持狀態(tài)連續(xù)性或執(zhí)行多步驟規(guī)劃等方面的不足，催生了工具增強(qiáng)型系統(tǒng)，即現(xiàn)今通稱的AI Agents［115］。此類系統(tǒng)以LLM的語(yǔ)言處理能力為骨干，同時(shí)引入額外基礎(chǔ)設(shè)施——如記憶緩沖區(qū)、工具調(diào)用API、推理鏈（reasoning chains）與規(guī)劃例程（planning routines）——從而彌合“被動(dòng)響應(yīng)生成”與“主動(dòng)任務(wù)完成”之間的鴻溝。

這一架構(gòu)演進(jìn)標(biāo)志著AI系統(tǒng)設(shè)計(jì)的關(guān)鍵性轉(zhuǎn)向：從內(nèi)容生成邁向自主任務(wù)執(zhí)行［116, 117］。從生成式系統(tǒng)到AI Agents的發(fā)展趨勢(shì)，體現(xiàn)出功能層級(jí)的漸進(jìn)式疊加，最終為能動(dòng)性行為（agentic behaviors）的涌現(xiàn)奠定了基礎(chǔ)。

2.1 語(yǔ)言模型作為AI Agent演進(jìn)的核心引擎

AI Agent作為一種變革性范式在人工智能領(lǐng)域的興起，與大規(guī)模語(yǔ)言模型（如GPT-3［118］、Llama［119］、T5［120］、Baichuan 2［121］以及GPT3mix［122］）的演進(jìn)及其功能再定位密切相關(guān)。大量且持續(xù)增長(zhǎng)的研究表明，從被動(dòng)響應(yīng)的生成式模型邁向自主、目標(biāo)導(dǎo)向型智能體的這一進(jìn)步，正是通過(guò)將LLMs作為核心推理引擎嵌入動(dòng)態(tài)能動(dòng)系統(tǒng)而實(shí)現(xiàn)的。這些模型最初為自然語(yǔ)言處理任務(wù)而訓(xùn)練，如今正被越來(lái)越多地集成于需具備自適應(yīng)規(guī)劃［123, 124］、實(shí)時(shí)決策［125, 126］及環(huán)境感知行為［127］能力的框架之中。

2.1.1 LLMs作為核心推理組件

諸如GPT-4［79］、PaLM［80］、Claude 3.5 Sonnet以及LLaMA［119］等大語(yǔ)言模型，均在海量文本語(yǔ)料上通過(guò)自監(jiān)督目標(biāo)進(jìn)行預(yù)訓(xùn)練，并進(jìn)一步采用監(jiān)督微調(diào)（Supervised Fine-Tuning, SFT）與基于人類反饋的強(qiáng)化學(xué)習(xí)（Reinforcement Learning from Human Feedback, RLHF）［128, 129］等技術(shù)進(jìn)行優(yōu)化。這些模型編碼了豐富的統(tǒng)計(jì)與語(yǔ)義知識(shí)，使其能夠執(zhí)行推理、摘要生成、代碼生成及對(duì)話管理等任務(wù)。然而，在能動(dòng)性應(yīng)用場(chǎng)景中，其能力遠(yuǎn)不止于生成響應(yīng)——它們作為認(rèn)知引擎，可：

解讀用戶目標(biāo)；
構(gòu)思并評(píng)估可能的行動(dòng)方案；
選擇最優(yōu)策略；
調(diào)用外部工具；
管理復(fù)雜、多步驟的工作流。

近期研究已明確指出，此類模型構(gòu)成了當(dāng)代能動(dòng)系統(tǒng)架構(gòu)的核心。例如，AutoGPT［38］與BabyAGI均以GPT-4同時(shí)作為規(guī)劃器與執(zhí)行器：該模型分析高層目標(biāo)，將其分解為可執(zhí)行的子任務(wù)，按需調(diào)用外部API，并持續(xù)監(jiān)控進(jìn)展以決定后續(xù)行動(dòng)。在此類系統(tǒng)中，LLM運(yùn)行于一個(gè)由“提示處理→狀態(tài)更新→反饋修正”構(gòu)成的循環(huán)之中，高度模擬了自主決策過(guò)程。

2.1.2 工具增強(qiáng)型AI Agents：功能拓展

為克服純生成式系統(tǒng)固有的局限——如幻覺(jué)（hallucination）、知識(shí)截止（static knowledge cutoff）、交互范圍受限等——研究者提出了工具增強(qiáng)型AI Agents的概念［130］，代表性系統(tǒng)包括Easytool［131］、Gentopia［132］與ToolFive［133］。此類系統(tǒng)將外部工具、API及計(jì)算平臺(tái)整合進(jìn)智能體的推理流程，使其得以：

實(shí)時(shí)訪問(wèn)信息；
執(zhí)行代碼；
與動(dòng)態(tài)數(shù)據(jù)環(huán)境進(jìn)行交互。

2.1.3 典型實(shí)例與新興能力

基于工具增強(qiáng)的LLM驅(qū)動(dòng)型AI Agents已在多種應(yīng)用場(chǎng)景中展現(xiàn)出顯著潛力：

在 AutoGPT ［38］中，智能體可依次執(zhí)行網(wǎng)頁(yè)查詢、匯總競(jìng)品數(shù)據(jù)、提煉洞察并生成報(bào)告，從而完成產(chǎn)品市場(chǎng)分析的全流程規(guī)劃；
在編程領(lǐng)域，如 GPT-Engineer 等工具將LLM驅(qū)動(dòng)的設(shè)計(jì)能力與本地代碼執(zhí)行環(huán)境相結(jié)合，通過(guò)迭代開(kāi)發(fā)生成軟件制品——包括源代碼、可執(zhí)行文件（.exe）、文檔及配置文件等［138, 139］；
在科研領(lǐng)域， Paper-QA ［140］等系統(tǒng)利用LLM查詢向量化構(gòu)建的學(xué)術(shù)數(shù)據(jù)庫(kù)，并將答案錨定于檢索到的科學(xué)文獻(xiàn)之上，以確保事實(shí)準(zhǔn)確性與可追溯性。

上述能力為AI Agents更穩(wěn)健的行為表現(xiàn)開(kāi)辟了路徑，例如：長(zhǎng)時(shí)程規(guī)劃（long-horizon planning）、跨工具協(xié)同（cross-tool coordination）以及自適應(yīng)學(xué)習(xí)循環(huán)（adaptive learning loops）。

然而，工具的引入亦帶來(lái)新的挑戰(zhàn)，包括：協(xié)調(diào)復(fù)雜性增加、錯(cuò)誤傳播風(fēng)險(xiǎn)上升，以及上下文窗口容量限制等問(wèn)題——這些均是當(dāng)前活躍的研究方向。

AI Agents的發(fā)展進(jìn)程與以下兩點(diǎn)密不可分：

將LLMs戰(zhàn)略性地集成作為推理引擎；
通過(guò)結(jié)構(gòu)化方式調(diào)用外部工具（如搜索引擎與API）對(duì)其進(jìn)行增強(qiáng)。

這種協(xié)同作用將靜態(tài)的語(yǔ)言模型轉(zhuǎn)化為具備感知—規(guī)劃—行動(dòng)—適應(yīng)能力的動(dòng)態(tài)認(rèn)知智能體，從而為多智能體協(xié)作、持久記憶及可擴(kuò)展自主性等Agentic AI系統(tǒng)的核心特征奠定基礎(chǔ)。

例如，圖6展示了一個(gè)典型用例：一個(gè)新聞查詢智能體，可執(zhí)行實(shí)時(shí)網(wǎng)絡(luò)搜索、摘要檢索到的文檔，并生成條理清晰、上下文敏感的回答。此類工作流已在基于LangChain、AutoGPT及OpenAI函數(shù)調(diào)用架構(gòu)的實(shí)際實(shí)現(xiàn)中得到驗(yàn)證。

具能動(dòng)性人工智能（Agentic AI）從AI Agent基礎(chǔ)中的興起

盡管AI Agents在人工智能能力方面已實(shí)現(xiàn)顯著躍升——尤其在通過(guò)工具增強(qiáng)型推理實(shí)現(xiàn)狹義任務(wù)自動(dòng)化方面——近期文獻(xiàn)指出其存在明顯局限，制約了其在復(fù)雜、動(dòng)態(tài)、多步驟及/或協(xié)作性場(chǎng)景中的可擴(kuò)展性［141–143］。這些局限催生了一種更先進(jìn)的范式：具能動(dòng)性人工智能（Agentic AI）。

這一新興系統(tǒng)類別通過(guò)結(jié)構(gòu)化通信［144–146］、共享記憶［147, 148］與動(dòng)態(tài)角色分配［22］等機(jī)制，使多個(gè)智能實(shí)體能夠協(xié)同追求共同目標(biāo)，從而顯著拓展了傳統(tǒng)AI Agents的能力邊界。

3.0.1 概念躍遷：從孤立智能體到協(xié)同系統(tǒng)

如前文所述，AI Agents通過(guò)將大語(yǔ)言模型（LLMs）與外部工具及API集成，可執(zhí)行范圍狹窄的操作，例如響應(yīng)客戶咨詢、執(zhí)行文檔檢索或管理日程安排。然而，隨著應(yīng)用場(chǎng)景日益要求具備上下文保持能力、任務(wù)間依賴性處理能力，以及在動(dòng)態(tài)環(huán)境中的適應(yīng)性，單智能體模型已顯不足［149, 150］。

Agentic AI系統(tǒng)代表了一類新興的智能架構(gòu)：其中多個(gè)專業(yè)化智能體通過(guò)協(xié)同推理與多步驟規(guī)劃，共同實(shí)現(xiàn)復(fù)雜、高階目標(biāo)［41］。依據(jù)近期提出的框架定義，此類系統(tǒng)由若干模塊化智能體組成——每個(gè)智能體負(fù)責(zé)整體目標(biāo)中的某一特定子任務(wù)，并通過(guò)集中式協(xié)調(diào)器或去中心化協(xié)議進(jìn)行協(xié)同［24, 145］。該結(jié)構(gòu)標(biāo)志著一種概念性轉(zhuǎn)變：從單智能體架構(gòu)中常見(jiàn)的個(gè)體化、反應(yīng)式行為，轉(zhuǎn)向一種以智能體間動(dòng)態(tài)協(xié)作為特征的系統(tǒng)級(jí)智能。

推動(dòng)這一范式的關(guān)鍵機(jī)制之一是目標(biāo)分解（goal decomposition）：由規(guī)劃型智能體自動(dòng)解析用戶指定的目標(biāo)，并將其拆分為若干更小、可管理的子任務(wù)［44］；隨后，這些子任務(wù)被分發(fā)至整個(gè)智能體網(wǎng)絡(luò)中。多步驟推理與規(guī)劃?rùn)C(jī)制進(jìn)一步促成子任務(wù)的動(dòng)態(tài)排序，使系統(tǒng)能在環(huán)境變化或部分任務(wù)失敗時(shí)實(shí)時(shí)調(diào)整策略。此類能動(dòng)架構(gòu)確保了即便在不確定性條件下，任務(wù)執(zhí)行仍具備穩(wěn)健性［22］。

智能體間的通信通過(guò)分布式通信渠道實(shí)現(xiàn)，例如異步消息隊(duì)列、共享記憶緩沖區(qū)或中間輸出交換等，從而實(shí)現(xiàn)在無(wú)需持續(xù)中央監(jiān)管的前提下完成協(xié)調(diào)［22, 151］。此外，反思式推理（reflective reasoning）與記憶系統(tǒng)使智能體得以跨多次交互存儲(chǔ)上下文、評(píng)估過(guò)往決策，并迭代優(yōu)化其策略［152］。綜合而言，這些能力使Agentic AI系統(tǒng)展現(xiàn)出靈活、自適應(yīng)、合作性與協(xié)同性的智能，遠(yuǎn)超單個(gè)智能體的運(yùn)作極限。

文獻(xiàn)中廣泛采用的一個(gè)被普遍接受的概念性示意圖，借由智能家居系統(tǒng)的類比清晰界定了AI Agents與Agentic AI之間的區(qū)別。如圖7所示：

左側(cè)代表以智能恒溫器形式存在的傳統(tǒng)AI Agent：該獨(dú)立智能體接收用戶設(shè)定的目標(biāo)溫度后，自主控制供暖或制冷系統(tǒng)以維持設(shè)定值。盡管它具備有限自主性（例如學(xué)習(xí)用戶作息規(guī)律，或在住戶離開(kāi)時(shí)降低能耗），但其運(yùn)作完全孤立——僅執(zhí)行單一、明確定義的任務(wù)，不參與更廣泛的環(huán)境協(xié)調(diào)或目標(biāo)推斷［25, 63］。
右側(cè)則展示了嵌入于綜合性智能家居生態(tài)中的Agentic AI系統(tǒng)：在此系統(tǒng)中，多個(gè)專業(yè)化智能體協(xié)同工作，共同管理天氣預(yù)報(bào)、日程安排、電價(jià)優(yōu)化、安防監(jiān)控及備用電源激活等多樣化功能。這些智能體不僅是被動(dòng)響應(yīng)模塊，更能動(dòng)態(tài)通信、共享記憶狀態(tài)，并協(xié)同調(diào)控行動(dòng)，以達(dá)成高層系統(tǒng)目標(biāo)（例如實(shí)時(shí)優(yōu)化舒適性、安全性與能效）。
例如，天氣預(yù)報(bào)智能體可預(yù)警即將到來(lái)的熱浪，促使能源管理智能體提前協(xié)調(diào)，在電價(jià)高峰前利用太陽(yáng)能進(jìn)行預(yù)制冷；與此同時(shí)，系統(tǒng)還可根據(jù)住戶是否在場(chǎng)，動(dòng)態(tài)推遲高能耗任務(wù)或激活安防監(jiān)控——實(shí)現(xiàn)跨領(lǐng)域決策融合。

該圖例生動(dòng)體現(xiàn)了從“任務(wù)特定型自動(dòng)化”到“自適應(yīng)、協(xié)同式智能”的架構(gòu)與功能性飛躍：

AI Agent僅作為確定性、功能受限的單一組件；
Agentic AI則體現(xiàn)為分布式智能，其核心特征包括 目標(biāo)分解 、 智能體間通信 與 上下文自適應(yīng)能力 ，代表了現(xiàn)代能動(dòng)性AI框架的關(guān)鍵特質(zhì)。

3.0.2 AI Agents 與 Agentic AI 的關(guān)鍵區(qū)別

為系統(tǒng)性地刻畫從生成式 AI 到 AI Agents，再進(jìn)一步演進(jìn)至 Agentic AI 的發(fā)展脈絡(luò)，我們圍繞一個(gè)基礎(chǔ)性分類體系構(gòu)建了比較分析框架——其中，生成式 AI 作為基準(zhǔn)參照點(diǎn)。盡管 AI Agents 與 Agentic AI 系統(tǒng)代表著日益自主化與交互化的系統(tǒng)形態(tài)，二者均以生成式架構(gòu)（尤其是 LLMs 與 LIMs）為根基。因此，本小節(jié)中每一張對(duì)比表格均將生成式 AI設(shè)為參考列，以凸顯能動(dòng)行為如何既建立于又超越生成式 AI 的基礎(chǔ)能力。

AI Agents 與 Agentic AI 系統(tǒng)之間的一組基本區(qū)別——尤其在作用范圍（scope）、自主性（autonomy）、架構(gòu)組成（architectural composition）、協(xié)調(diào)策略（coordination strategy）與操作復(fù)雜性（operational complexity）等方面——已綜合提煉于表 1 與表 10中（后者源于對(duì) AutoGen［98］與 ChatDev［153］等主流框架的深入分析）。該對(duì)比提供了多維度視角，揭示單智能體系統(tǒng)如何逐步過(guò)渡為協(xié)同式多智能體生態(tài)系統(tǒng)。借助生成能力這一視角，我們得以追蹤規(guī)劃、通信與適應(yīng)性等維度上日益提升的復(fù)雜性，這些正是向 Agentic AI 系統(tǒng)演進(jìn)的核心特征。

盡管表 1 勾勒出 AI Agents 與 Agentic AI 系統(tǒng)在基礎(chǔ)與操作層面的差異，要深入理解這些范式如何從更廣泛的生成式 AI 框架中衍生并相互關(guān)聯(lián)，仍需一個(gè)更精細(xì)的分類體系。具體而言，從靜態(tài)生成式 AI 系統(tǒng) → 工具增強(qiáng)型 AI Agents → 協(xié)同式 Agentic AI 生態(tài)系統(tǒng)的概念性與認(rèn)知性演進(jìn)路徑，亟需一個(gè)整合性比較框架。這一轉(zhuǎn)變不僅體現(xiàn)在結(jié)構(gòu)層面，更反映在功能層面——涵蓋啟動(dòng)機(jī)制、記憶使用方式、學(xué)習(xí)能力與編排策略如何在整個(gè)能動(dòng)譜系中逐步演化。此外，近期研究指出“生成式智能體（Generative Agents）”等混合范式的出現(xiàn)——此類系統(tǒng)融合生成建模與模塊化任務(wù)專業(yè)化——進(jìn)一步復(fù)雜化了 Agentic AI 的格局。為捕捉這些精細(xì)關(guān)聯(lián)，表 2 綜合了四大原型在關(guān)鍵概念與認(rèn)知維度上的對(duì)比：

生成式 AI
AI Agents
Agentic AI 系統(tǒng)
推斷所得的“生成式智能體”

通過(guò)將生成式 AI 設(shè)為基線技術(shù)，該分類凸顯了一條從被動(dòng)內(nèi)容生成 → 交互式任務(wù)執(zhí)行 → 自主多智能體協(xié)同的科學(xué)、結(jié)構(gòu)與應(yīng)用連續(xù)譜。這一多層次視角，對(duì)理解能動(dòng)性智能在理論與應(yīng)用領(lǐng)域的當(dāng)前能力與未來(lái)趨勢(shì)至關(guān)重要。

為使表 1 中所述區(qū)別更具可操作性，表 2 與 表 3 進(jìn)一步拓展了對(duì)各類智能體范式的比較，涵蓋更廣泛的譜系（包括 AI Agents 與 Agentic AI）。

表 3
呈現(xiàn)了各范式在 核心能力 、 規(guī)劃范圍 、 交互風(fēng)格 、 學(xué)習(xí)動(dòng)態(tài) 與 評(píng)估標(biāo)準(zhǔn) 等方面的關(guān)鍵架構(gòu)與行為屬性差異。
如表所示：
- AI Agents 針對(duì) 離散任務(wù)執(zhí)行 優(yōu)化，規(guī)劃視野有限，依賴監(jiān)督式或基于規(guī)則的學(xué)習(xí)機(jī)制；
- Agentic AI 系統(tǒng)則通過(guò) 多步驟規(guī)劃 、 元學(xué)習(xí) （meta-learning）與 智能體間通信 擴(kuò)展了這一能力，使其適用于需 自主目標(biāo)設(shè)定 與 協(xié)同 的復(fù)雜環(huán)境；
- “生成式智能體”作為較新概念，繼承以 LLM 為中心的預(yù)訓(xùn)練能力，在多模態(tài)內(nèi)容生成方面表現(xiàn)卓越，但尚缺乏 Agentic AI 系統(tǒng)所具備的 主動(dòng)編排能力 與 狀態(tài)持久性行為 。

第二張表（表 3） 從過(guò)程驅(qū)動(dòng)視角，對(duì)三類智能體（生成式 AI、AI Agents、Agentic AI）進(jìn)行比較。該框架強(qiáng)調(diào)：功能流水線如何從生成式 AI 中的提示驅(qū)動(dòng)單模型推理，演進(jìn)為 AI Agents 的工具增強(qiáng)型執(zhí)行，最終發(fā)展為 Agentic AI 中的協(xié)同智能體網(wǎng)絡(luò)。

“結(jié)構(gòu)”一欄清晰呈現(xiàn)此演進(jìn)：從單一 LLM → 集成化工具鏈 → 分布式多智能體系統(tǒng)；
對(duì) 外部數(shù)據(jù)的訪問(wèn)能力 （現(xiàn)實(shí)應(yīng)用的關(guān)鍵操作需求）亦隨層級(jí)提升而日趨成熟：生成式 AI 中缺失或可選 → AI Agents 中模塊化支持 → Agentic AI 中實(shí)現(xiàn)協(xié)調(diào)化整合。

綜上，這些對(duì)比視角共同印證：從生成式到能動(dòng)性范式的演進(jìn)，不僅體現(xiàn)為系統(tǒng)復(fù)雜性的增加，更在于自主性、記憶與決策能力在多重抽象層級(jí)上的深度融合（參見(jiàn)表 4）。

為進(jìn)一步深化對(duì)演進(jìn)中能動(dòng)格局的多維理解，表 5 至表 9 圍繞五個(gè)關(guān)鍵維度展開(kāi)拓展性比較：

核心功能與目標(biāo)對(duì)齊性
架構(gòu)組成
運(yùn)作機(jī)制
作用范圍與復(fù)雜性
交互–自主性動(dòng)態(tài)關(guān)系

這些維度不僅強(qiáng)化了生成式 AI、AI Agents 與 Agentic AI 之間的結(jié)構(gòu)性差異（如表 4 所述），還引入了一類新興范疇——“生成式智能體”，即專為在更廣泛工作流中嵌入子任務(wù)層級(jí)生成而設(shè)計(jì)的模塊化智能體［154］。此類智能體通過(guò)緊密集成語(yǔ)言模型、記憶系統(tǒng)與行為規(guī)劃模塊，模擬類人行為，從而在典型的封閉世界環(huán)境中實(shí)現(xiàn)可信且自主的運(yùn)作。

表 5 從總體目標(biāo)與功能意圖層面定位三類范式：
- 生成式 AI 聚焦于 提示驅(qū)動(dòng)的內(nèi)容生成 ；
- AI Agents 強(qiáng)調(diào) 基于工具的任務(wù)執(zhí)行 ；
- Agentic AI 系統(tǒng)則負(fù)責(zé) 完整工作流的協(xié)同編排 ——標(biāo)志著 AI 自主性的一次關(guān)鍵躍升。
表 6 從架構(gòu)層面映射該功能擴(kuò)展：系統(tǒng)設(shè)計(jì)從生成式 AI 的單模型依賴，逐步演進(jìn)至 Agentic AI 的多智能體協(xié)同與共享記憶利用。
表 7 則梳理各范式在工作流執(zhí)行路徑上的差異，突出智能體間協(xié)調(diào)與層級(jí)化通信作為能動(dòng)行為的核心驅(qū)動(dòng)因素。
表 8 進(jìn)一步考察各系統(tǒng)所能處理的任務(wù)多樣性、時(shí)間尺度與運(yùn)行魯棒性——范圍從孤立內(nèi)容生成，延伸至動(dòng)態(tài)環(huán)境中的自適應(yīng)多智能體協(xié)作。在此維度上，Agentic AI 顯現(xiàn)出獨(dú)特能力，可支撐需自適應(yīng)、多階段推理與執(zhí)行策略的高復(fù)雜度目標(biāo)。
表 9 綜合各范式在自主性程度、交互風(fēng)格與決策粒度上的差異。這些表格共同構(gòu)建了一套嚴(yán)謹(jǐn)框架，用于分類與分析基于智能體的 AI 系統(tǒng)，為理論驅(qū)動(dòng)的評(píng)估及未來(lái)面向大規(guī)模應(yīng)用的自主、智能、協(xié)作型智能體的設(shè)計(jì)奠定基礎(chǔ)。

表 5 至表 9 提供了對(duì)生成式 AI、AI Agents 與 Agentic AI 的分層比較分析，以操作性與架構(gòu)性特征為錨點(diǎn)確立該分類體系。

表 5 突出核心區(qū)別：生成式 AI 生成反應(yīng)式內(nèi)容；AI Agents 執(zhí)行工具輔助型任務(wù)；Agentic AI 則協(xié)調(diào)子智能體完成高層工作流執(zhí)行——標(biāo)志 AI 自主性的關(guān)鍵轉(zhuǎn)折。
表 6 明確架構(gòu)差異，尤重系統(tǒng)組成與控制邏輯：
- 生成式 AI 依賴單一模型，無(wú)內(nèi)置工具調(diào)用或任務(wù)委派能力；
- AI Agents 將語(yǔ)言模型與輔助 API 及接口機(jī)制結(jié)合，以增強(qiáng)功能；
- Agentic AI 更進(jìn)一步引入多智能體系統(tǒng)，將 協(xié)作 、 記憶持久化 與 編排協(xié)議 置于系統(tǒng)運(yùn)作核心——此一拓展對(duì)實(shí)現(xiàn) 智能任務(wù)委派 、 上下文保持 及 動(dòng)態(tài)角色分配 能力至關(guān)重要，而這些能力在生成式系統(tǒng)與單智能體系統(tǒng)中均告缺失。
表 7 呈現(xiàn)系統(tǒng)功能與運(yùn)作差異，強(qiáng)調(diào)執(zhí)行邏輯與信息流的區(qū)別：
- 生成式 AI 采用線性流水線（提示 → 輸出）；
- AI Agents 引入過(guò)程內(nèi)工具響應(yīng)整合的程序化機(jī)制；
- Agentic AI 則引入 遞歸式任務(wù)重分配 與 跨智能體消息傳遞 ，從而促成僅靠靜態(tài) LLM 輸出無(wú)法實(shí)現(xiàn)的 涌現(xiàn)式?jīng)Q策 。
表 8 通過(guò)映射各系統(tǒng)在任務(wù)多樣性、時(shí)間尺度與運(yùn)行魯棒性方面的承載能力，進(jìn)一步強(qiáng)化上述區(qū)別——Agentic AI 在需自適應(yīng)、多階段推理與執(zhí)行的高復(fù)雜度目標(biāo)支持上獨(dú)樹(shù)一幟。

最后，表 9 聚焦生成式 AI、AI Agents 與 Agentic AI 在操作與行為層面的區(qū)別，尤其關(guān)注自主性層級(jí)、交互風(fēng)格及智能體間協(xié)調(diào)：

生成式 AI 模型（如 GPT-3［118］、DALL·E 3）仍屬 反應(yīng)式 ：僅依提示生成內(nèi)容，無(wú)持久狀態(tài)維持或迭代推理能力；
AI Agents（如基于 LangChain［97］或 MetaGPT［155］構(gòu)建者）展現(xiàn)出更高自主性：可在限定任務(wù)內(nèi)主動(dòng)發(fā)起外部工具調(diào)用并調(diào)整行為；
然而，其自主性通常局限于 孤立任務(wù)執(zhí)行 ，缺乏 長(zhǎng)期狀態(tài)連續(xù)性 或 協(xié)作式交互 能力。

Agentic AI 系統(tǒng)通過(guò)引入內(nèi)部編排機(jī)制與多智能體協(xié)作框架，顯著區(qū)別于前述范式。例如，AutoGen［98］與 ChatDev［153］等平臺(tái)便通過(guò)任務(wù)分解、角色分配與遞歸式反饋循環(huán)，典型地體現(xiàn)了能動(dòng)性協(xié)同機(jī)制。在 AutoGen 中，一個(gè)智能體可擔(dān)任規(guī)劃者，另一智能體負(fù)責(zé)信息檢索，第三個(gè)智能體則進(jìn)行報(bào)告綜合；各智能體通過(guò)共享記憶緩沖區(qū)相互通信，并由一個(gè)協(xié)調(diào)者智能體（orchestrator agent）統(tǒng)一監(jiān)管任務(wù)依賴關(guān)系與整體進(jìn)展。此類結(jié)構(gòu)化協(xié)同機(jī)制，使得系統(tǒng)能夠在動(dòng)態(tài)環(huán)境中實(shí)現(xiàn)更復(fù)雜的目標(biāo)追求與更靈活的行為響應(yīng)。

此類架構(gòu)從根本上將智能的焦點(diǎn)，從基于單一模型的輸出，轉(zhuǎn)向系統(tǒng)層級(jí)的行為——在該層級(jí)中，智能體可根據(jù)不斷演化的任務(wù)狀態(tài)進(jìn)行學(xué)習(xí)、適應(yīng)與決策更新。因此，本比較性分類體系不僅凸顯了操作獨(dú)立性層級(jí)的持續(xù)提升，更闡明了 Agentic AI 如何引入新型通信范式、記憶整合機(jī)制與去中心化控制模式，從而為下一代具備可擴(kuò)展性與自適應(yīng)性智能的自主系統(tǒng)鋪平道路。

3.1 架構(gòu)演進(jìn)：從 AI Agents 到 Agentic AI 系統(tǒng)

盡管 AI Agents 與 Agentic AI 系統(tǒng)均采用模塊化設(shè)計(jì)原則，Agentic AI 顯著拓展了基礎(chǔ)架構(gòu)，以支持更復(fù)雜、分布式與自適應(yīng)的行為。如圖 8 所示，該演進(jìn)始于構(gòu)成傳統(tǒng) AI Agents 的核心子系統(tǒng)——感知（Perception）、推理（Reasoning）與行動(dòng)（Action）；而 Agentic AI 在此基礎(chǔ)上進(jìn)一步集成了若干高級(jí)組件，包括：專業(yè)化智能體（Specialized Agents）、高級(jí)推理與規(guī)劃（Advanced Reasoning & Planning）、持久記憶（Persistent Memory）以及編排機(jī)制（Orchestration）。圖中還以虛線框突出強(qiáng)調(diào)了若干涌現(xiàn)能力——多智能體協(xié)作（Multi-Agent Collaboration）、系統(tǒng)級(jí)協(xié)調(diào)（System Coordination）、共享上下文（Shared Context）與任務(wù)分解（Task Decomposition）——該虛線框表征了系統(tǒng)架構(gòu)向主動(dòng)性、去中心化與目標(biāo)驅(qū)動(dòng)范式的根本性轉(zhuǎn)變。如前所述，這一演進(jìn)標(biāo)志著智能體設(shè)計(jì)的關(guān)鍵拐點(diǎn)。本節(jié)綜合了 LangChain［97］、AutoGPT［98］與 TaskMatrix［156］等實(shí)證框架的研究成果，系統(tǒng)梳理了架構(gòu)復(fù)雜性的進(jìn)階歷程。

3.1.1 AI Agents 的核心架構(gòu)組件

基礎(chǔ)型 AI Agents 通常由四個(gè)主要子系統(tǒng)構(gòu)成：感知、推理、行動(dòng)與學(xué)習(xí)。這些子系統(tǒng)形成一個(gè)閉環(huán)操作周期：

從用戶界面視角，常被稱為“理解—思考—行動(dòng)—學(xué)習(xí)”（Understand, Think, Act, Learn）；
在系統(tǒng)設(shè)計(jì)文獻(xiàn)中，則表述為“輸入—處理—行動(dòng)—學(xué)習(xí)”（Input, Processing, Action, Learning）［22, 157］。
感知模塊（Perception Module）：
該子系統(tǒng)接收來(lái)自用戶（如自然語(yǔ)言提示）或外部系統(tǒng)（如 API、文件上傳、傳感器數(shù)據(jù)流）的輸入信號(hào)，并執(zhí)行數(shù)據(jù)預(yù)處理，將其轉(zhuǎn)換為推理模塊可解析的格式。
例如，在基于 LangChain 的智能體中［97, 158］，感知層負(fù)責(zé)提示模板構(gòu)建、上下文封裝，以及通過(guò)文檔分塊與嵌入式檢索實(shí)現(xiàn)的檢索增強(qiáng)。
知識(shí)表示與推理模塊（Knowledge Representation and Reasoning, KRR Module）：
作為智能體智能的核心，KRR 模塊對(duì)輸入數(shù)據(jù)施加符號(hào)化、統(tǒng)計(jì)性或混合式邏輯。其技術(shù)包括：
- 基于規(guī)則的邏輯（如 if-then 決策樹(shù)）；
- 確定性工作流引擎；
- 簡(jiǎn)易規(guī)劃圖（planning graphs）。
  在 AutoGPT［38］等智能體中，推理能力通過(guò) 函數(shù)調(diào)用 與 提示鏈 （prompt chaining）得以增強(qiáng)，從而模擬思維過(guò)程——例如采用“逐步推理”（step-by-step）型提示，或插入中間工具調(diào)用環(huán)節(jié)。

行動(dòng)選擇與執(zhí)行模塊（Action Selection and Execution Module）：
該模塊將推斷出的知識(shí)與決策轉(zhuǎn)化為外部行動(dòng)，借助一個(gè)“行動(dòng)庫(kù)”（action library）實(shí)現(xiàn)。這些行動(dòng)可能包括：發(fā)送消息、更新數(shù)據(jù)庫(kù)、調(diào)用 API，或生成結(jié)構(gòu)化輸出。執(zhí)行過(guò)程通常由中間件管理——例如 LangChain 的“代理執(zhí)行器”（agent executor），它將大語(yǔ)言模型（LLM）的輸出鏈接至工具調(diào)用，并觀察響應(yīng)以指導(dǎo)后續(xù)步驟［97］。
基礎(chǔ)學(xué)習(xí)與適應(yīng)機(jī)制（Basic Learning and Adaptation）：
傳統(tǒng) AI Agents 具備有限的學(xué)習(xí)機(jī)制，例如啟發(fā)式參數(shù)調(diào)整［159, 160］或基于歷史記錄的上下文保留。舉例而言，智能體可利用簡(jiǎn)單的記憶緩沖區(qū)回溯先前的用戶輸入，或應(yīng)用評(píng)分機(jī)制以在未來(lái)迭代中優(yōu)化工具選擇。

對(duì)這些智能體的定制化通常涉及領(lǐng)域特定的提示工程、規(guī)則注入或工作流模板，使其區(qū)別于硬編碼自動(dòng)化腳本——關(guān)鍵在于它們具備做出上下文感知型決策的能力。ReAct 等系統(tǒng)［136］正是此類架構(gòu)的典范：它在一個(gè)迭代框架中融合推理與行動(dòng)，使智能體在選擇外部行動(dòng)前先模擬內(nèi)部對(duì)話。

3.1.2 Agentic AI 中的架構(gòu)增強(qiáng)

如前所述，Agentic AI 系統(tǒng)繼承了 AI Agents 的模塊化特性，但進(jìn)一步拓展其架構(gòu)，以支持分布式智能、智能體間通信與迭代式規(guī)劃。文獻(xiàn)中記載了若干關(guān)鍵性架構(gòu)增強(qiáng)，它們使 Agentic AI 顯著區(qū)別于其前身，并賦予其高度的靈活性與適應(yīng)性［161, 162］：

專業(yè)化智能體集群（Ensemble of Specialized Agents）：與作為單一整體單元運(yùn)作不同，Agentic AI 系統(tǒng)由多個(gè)智能體組成，每個(gè)智能體被賦予特定職能或任務(wù)（例如：摘要生成者、信息檢索者或規(guī)劃者）。這些智能體通過(guò)通信渠道（如消息隊(duì)列、黑板系統(tǒng)或共享內(nèi)存）相互交互。例如，MetaGPT［155］便突出體現(xiàn)了這一方法——它將智能體建模為公司各部門（如 CEO、CTO、工程師），其角色具有模塊化、可復(fù)用性與角色綁定性（role-bound）。此處“角色綁定”意指：每個(gè)智能體的行為與職責(zé)嚴(yán)格由其被分配的角色定義，其行動(dòng)范圍被限制于該特定功能領(lǐng)域之內(nèi)。
高級(jí)推理與規(guī)劃能力（Advanced Reasoning and Planning）：Agentic 系統(tǒng)通過(guò) ReAct［136］、思維鏈（Chain-of-Thought, CoT）提示［163］與“思維樹(shù)”（Tree of Thoughts）［164］等框架，嵌入迭代式推理能力。這些機(jī)制使智能體能夠?qū)?fù)雜任務(wù)分解為多個(gè)推理階段，評(píng)估中間結(jié)果，并動(dòng)態(tài)重規(guī)劃行動(dòng)——從而實(shí)現(xiàn)對(duì)不確定性或部分失敗的自適應(yīng)響應(yīng)。
持久記憶架構(gòu)（Persistent Memory Architectures）：與傳統(tǒng)智能體不同，Agentic AI 集成了記憶子系統(tǒng)，可在任務(wù)周期或智能體會(huì)話之間保存并持久化知識(shí)［165, 166］。記憶類型包括：
- 情景記憶

（episodic memory）：任務(wù)特定的歷史記錄［167, 168］；

語(yǔ)義記憶
（semantic memory）：長(zhǎng)期事實(shí)或結(jié)構(gòu)化數(shù)據(jù)［169, 170］；
基于向量的記憶
：服務(wù)于檢索增強(qiáng)生成（RAG）［171, 172］。例如，AutoGen［98］中的智能體維護(hù)“草稿板”（scratchpads）用于存儲(chǔ)中間計(jì)算結(jié)果，從而支持分步式任務(wù)推進(jìn)。

編排層／元智能體（Orchestration Layers / Meta-Agents）：Agentic AI 的一項(xiàng)關(guān)鍵創(chuàng)新是引入編排器——即元智能體（meta-agents），用于協(xié)調(diào)下屬智能體的生命周期、管理依賴關(guān)系、分配角色并解決沖突。編排器常包括任務(wù)管理者、評(píng)估者或協(xié)調(diào)員（moderators）。例如，在 ChatDev［153］中，一個(gè)虛擬的 CEO 元智能體將子任務(wù)分派給各部門智能體，并將其輸出整合為統(tǒng)一的戰(zhàn)略性響應(yīng)。

這些增強(qiáng)共同使 Agentic AI 能夠支持需持續(xù)上下文保持、分布式任務(wù)分工、多模態(tài)協(xié)同與策略性自適應(yīng)的場(chǎng)景。應(yīng)用案例涵蓋：

協(xié)同完成文獻(xiàn)檢索、摘要與文稿撰寫的科研助手（如 AutoGen 工作流［98］）；
并行監(jiān)控物流、供應(yīng)商績(jī)效與動(dòng)態(tài)定價(jià)模型的智能供應(yīng)鏈智能體。

從孤立的“感知—推理—行動(dòng)”閉環(huán)，向協(xié)作式、自評(píng)估的多智能體工作流的轉(zhuǎn)變，標(biāo)志著智能系統(tǒng)架構(gòu)設(shè)計(jì)的關(guān)鍵轉(zhuǎn)折點(diǎn)——它使智能體不僅能“行動(dòng)”，更能“反思”、“學(xué)習(xí)”與“持續(xù)改進(jìn)”［173］。這一演進(jìn)將 Agentic AI 定位為下一代 AI 基礎(chǔ)設(shè)施：其能力不僅限于執(zhí)行預(yù)定義工作流，更可自主構(gòu)建、修訂與管理跨智能體的復(fù)雜目標(biāo)，且?guī)缀鯚o(wú)需人工干預(yù)。

AI Agents 與 Agentic AI 的應(yīng)用

為闡明 AI Agents 與 Agentic AI 系統(tǒng)在現(xiàn)實(shí)世界中的實(shí)用價(jià)值及其操作層面的差異，本研究綜合了近期文獻(xiàn)中的一系列應(yīng)用案例（如圖9所示）。我們系統(tǒng)性地將這些應(yīng)用領(lǐng)域劃分為兩條平行路徑：傳統(tǒng)AI Agent系統(tǒng)及其更先進(jìn)的Agentic AI對(duì)應(yīng)系統(tǒng)。對(duì)于AI Agents，本文回顧了四個(gè)主要用例：

(1) 客戶服務(wù)自動(dòng)化與企業(yè)內(nèi)部搜索——單智能體模型處理結(jié)構(gòu)化查詢并生成響應(yīng)；
(2) 郵件過(guò)濾與優(yōu)先級(jí)排序——智能體通過(guò)分類啟發(fā)式方法協(xié)助用戶管理高流量通信；
(3) 個(gè)性化內(nèi)容推薦與基礎(chǔ)數(shù)據(jù)報(bào)告——分析用戶行為以生成自動(dòng)化洞察；
(4) 自主日程助手——解析日歷信息并在極小用戶輸入下安排任務(wù)。

相比之下，Agentic AI 的應(yīng)用場(chǎng)景涵蓋更廣泛、更具動(dòng)態(tài)性的能力，同樣被歸納為四類進(jìn)行評(píng)述與討論：
(1) 多智能體科研助手——協(xié)同檢索、綜合并起草科學(xué)內(nèi)容；
(2) 智能機(jī)器人協(xié)調(diào)——包括農(nóng)業(yè)與物流領(lǐng)域的無(wú)人機(jī)及多機(jī)器人系統(tǒng)；
(3) 協(xié)作式醫(yī)療決策支持——涉及診斷、治療與監(jiān)測(cè)子系統(tǒng)；
(4) 多智能體游戲AI與自適應(yīng)工作流自動(dòng)化——去中心化智能體進(jìn)行策略性互動(dòng)或處理復(fù)雜任務(wù)流水線。

4.0.1 AI Agents 的應(yīng)用

客戶服務(wù)自動(dòng)化與企業(yè)內(nèi)部搜索：AI Agents 在企業(yè)環(huán)境中被廣泛用于自動(dòng)化客戶服務(wù)及促進(jìn)內(nèi)部知識(shí)檢索。在客戶服務(wù)場(chǎng)景中，這些智能體利用檢索增強(qiáng)型大語(yǔ)言模型，對(duì)接API與組織知識(shí)庫(kù)，以回答用戶查詢、分類工單，并執(zhí)行諸如訂單追蹤或退貨發(fā)起等操作［52］。在企業(yè)內(nèi)部搜索方面，基于向量存儲(chǔ)（如 Pinecone、Elasticsearch）構(gòu)建的智能體可針對(duì)自然語(yǔ)言查詢返回語(yǔ)義相關(guān)的文檔。Salesforce Einstein、Intercom Fin 及 Notion AI 等工具展示了結(jié)構(gòu)化輸入處理與摘要生成能力如何降低工作負(fù)載并提升企業(yè)決策效率。

一個(gè)實(shí)際示例（圖10a）展現(xiàn)了這一雙重功能：某跨國(guó)電商公司部署了一套基于AI Agent的客戶服務(wù)與內(nèi)部搜索助手。在客戶服務(wù)方面，該AI Agent集成公司的客戶關(guān)系管理系統(tǒng)（CRM，如 Salesforce）與履約API，可解決諸如“我的訂單在哪？”或“我該如何退貨？”等問(wèn)題。在毫秒級(jí)內(nèi)，智能體從運(yùn)輸數(shù)據(jù)庫(kù)與政策庫(kù)中提取上下文數(shù)據(jù)，并借助檢索增強(qiáng)生成技術(shù)輸出個(gè)性化回復(fù)。在內(nèi)部企業(yè)搜索方面，員工可通過(guò)同一系統(tǒng)查詢過(guò)往會(huì)議紀(jì)要、銷售演示文稿或法律文件。當(dāng)HR經(jīng)理輸入“總結(jié)去年政策變更的關(guān)鍵福利”時(shí)，智能體查詢嵌入企業(yè)文檔的Pinecone向量庫(kù)，按語(yǔ)義相似度對(duì)結(jié)果排序，并返回簡(jiǎn)潔摘要及來(lái)源鏈接。這些能力不僅減少了工單量與支持成本，也最大限度縮短了查找制度性知識(shí)（如政策、流程或手冊(cè)）所耗費(fèi)的時(shí)間。最終形成一套統(tǒng)一、響應(yīng)迅速的系統(tǒng)，借助模塊化AI Agent架構(gòu)同時(shí)提升對(duì)外服務(wù)交付效率與對(duì)內(nèi)運(yùn)營(yíng)效能。

郵件過(guò)濾與優(yōu)先級(jí)排序：作為重要的生產(chǎn)力工具之一，AI Agents 通過(guò)內(nèi)容分類與優(yōu)先級(jí)劃分實(shí)現(xiàn)郵件分揀自動(dòng)化。它們與 Microsoft Outlook 和 Superhuman 等系統(tǒng)集成，分析元數(shù)據(jù)與郵件語(yǔ)義，檢測(cè)緊急程度、提取待辦事項(xiàng)并推薦回復(fù)。智能體應(yīng)用用戶定制的過(guò)濾規(guī)則、行為信號(hào)與意圖分類，減輕認(rèn)知負(fù)擔(dān)。自動(dòng)標(biāo)簽標(biāo)注或?qū)υ捑€程摘要等自主行為提升效率，而內(nèi)置反饋循環(huán)則通過(guò)漸進(jìn)學(xué)習(xí)實(shí)現(xiàn)個(gè)性化［64］。

圖10b 展示了AI Agent在郵件過(guò)濾與優(yōu)先級(jí)排序領(lǐng)域的實(shí)際應(yīng)用。在現(xiàn)代職場(chǎng)環(huán)境中，用戶常被海量郵件淹沒(méi)，導(dǎo)致認(rèn)知過(guò)載與關(guān)鍵通訊遺漏。嵌入于 Microsoft Outlook 或 Superhuman 等平臺(tái)的AI Agent扮演智能中介角色，對(duì)傳入郵件進(jìn)行分類、聚類與分揀。這些智能體評(píng)估發(fā)件人、主題行等元數(shù)據(jù)及語(yǔ)義內(nèi)容，識(shí)別緊急程度、提取可執(zhí)行項(xiàng)并建議智能回復(fù)。如圖所示，AI Agent 自動(dòng)將郵件歸類為“緊急”、“需跟進(jìn)”或“低優(yōu)先級(jí)”等標(biāo)簽，同時(shí)提供情境感知摘要與回復(fù)草稿。通過(guò)持續(xù)反饋循環(huán)與使用模式學(xué)習(xí)，系統(tǒng)逐步適應(yīng)用戶偏好，優(yōu)化分類閾值并提升優(yōu)先級(jí)判斷準(zhǔn)確率。這種自動(dòng)化機(jī)制卸載了決策疲勞，使用戶能專注于高價(jià)值任務(wù)，同時(shí)在快節(jié)奏、信息密集的環(huán)境中維持高效溝通管理。

個(gè)性化內(nèi)容推薦與基礎(chǔ)數(shù)據(jù)報(bào)告：AI Agents 通過(guò)分析行為模式支持新聞、產(chǎn)品或媒體的自適應(yīng)個(gè)性化推薦。Amazon、YouTube 和 Spotify 等平臺(tái)部署此類智能體，借助協(xié)同過(guò)濾、意圖檢測(cè)與內(nèi)容排序推斷用戶偏好。同時(shí)，分析系統(tǒng)中的AI Agents（如 Tableau Pulse、Power BI Copilot）支持自然語(yǔ)言數(shù)據(jù)查詢與自動(dòng)化報(bào)告生成，將提示轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)庫(kù)查詢與可視化摘要，從而普及商業(yè)智能訪問(wèn)權(quán)限。

一個(gè)實(shí)際示例（圖10c）展示了AI Agent在個(gè)性化內(nèi)容推薦與基礎(chǔ)數(shù)據(jù)報(bào)告中的應(yīng)用，可見(jiàn)于電商與企業(yè)分析系統(tǒng)。考慮部署于 Amazon 等零售平臺(tái)上的AI Agent：隨著用戶瀏覽、點(diǎn)擊與購(gòu)買商品，智能體持續(xù)監(jiān)控交互模式（如停留時(shí)間、搜索詞與購(gòu)買序列），借助協(xié)同過(guò)濾與內(nèi)容排序算法推斷用戶意圖，并動(dòng)態(tài)生成隨時(shí)間演化的個(gè)性化商品推薦。例如，用戶購(gòu)買園藝工具后，可能被推薦兼容的土壤傳感器或相關(guān)書籍。此層級(jí)的個(gè)性化顯著提升用戶參與度、轉(zhuǎn)化率與長(zhǎng)期留存率。與此同時(shí)，在企業(yè)場(chǎng)景中，集成于 Power BI Copilot 的AI Agent允許非技術(shù)人員通過(guò)自然語(yǔ)言請(qǐng)求洞察，例如“比較東北地區(qū)第三季度與第四季度的銷售額”。智能體將提示翻譯為結(jié)構(gòu)化SQL查詢，從數(shù)據(jù)庫(kù)提取模式，并輸出簡(jiǎn)潔的可視化摘要或敘述性報(bào)告。此應(yīng)用降低了對(duì)數(shù)據(jù)分析師的依賴，通過(guò)直觀、語(yǔ)言驅(qū)動(dòng)的界面賦能更廣泛的業(yè)務(wù)決策。

自主日程助手：集成于日歷系統(tǒng)的AI Agent可自主管理會(huì)議協(xié)調(diào)、重新安排與沖突解決。x.ai 與 Reclaim AI 等工具可解析模糊的日程指令，訪問(wèn)日歷API，并根據(jù)學(xué)習(xí)到的用戶偏好識(shí)別最優(yōu)時(shí)間段。它們最小化人工輸入，同時(shí)適應(yīng)動(dòng)態(tài)可用性約束。其對(duì)接企業(yè)系統(tǒng)并響應(yīng)模糊指令的能力，凸顯了當(dāng)代日程智能體的模塊化自主性。

一個(gè)自主日程助手的實(shí)際應(yīng)用見(jiàn)于企業(yè)環(huán)境（如圖10d所示），員工需在全球不同時(shí)區(qū)管理多重重疊職責(zé)。設(shè)想一位集成 Google Calendar 與 Slack 的行政助理AI Agent，它可解析指令如“下周找一個(gè)45分鐘時(shí)段與產(chǎn)品團(tuán)隊(duì)進(jìn)行后續(xù)會(huì)議”。智能體解析請(qǐng)求，檢查所有參與者的空閑時(shí)間，兼顧時(shí)區(qū)差異，并避免會(huì)議沖突或違反工作時(shí)間規(guī)定。若發(fā)現(xiàn)與已排定任務(wù)沖突，它可自主提議替代時(shí)段并通過(guò)Slack通知受影響參會(huì)者。此外，智能體從歷史用戶偏好中學(xué)習(xí)（如避免周五早間會(huì)議），并隨時(shí)間不斷優(yōu)化建議。Reclaim AI 與 Clockwise 等工具進(jìn)一步體現(xiàn)了此能力，提供具備日歷感知能力的自動(dòng)化方案，適應(yīng)不斷變化的工作負(fù)荷。此類助手降低協(xié)調(diào)成本，提升日程安排效率，并通過(guò)主動(dòng)化解歧義與優(yōu)化日歷利用率，實(shí)現(xiàn)更順暢的團(tuán)隊(duì)協(xié)作流程。

4.0.2 Agentic AI 的應(yīng)用

多智能體科研助手：Agentic AI 系統(tǒng)正越來(lái)越多地部署于學(xué)術(shù)與工業(yè)研究流程中，以自動(dòng)化多階段知識(shí)整合。AutoGen 與 CrewAI 等平臺(tái)在中央?yún)f(xié)調(diào)器（orchestrator）的管理下，為多個(gè)智能體分配專業(yè)化角色——如檢索者、摘要生成者、綜合者與引文格式化器。協(xié)調(diào)器負(fù)責(zé)分發(fā)任務(wù)、管理角色依賴關(guān)系，并將各智能體輸出整合為連貫的草稿或綜述摘要。持久記憶機(jī)制支持跨智能體的上下文共享與持續(xù)優(yōu)化。這些系統(tǒng)被用于文獻(xiàn)綜述、基金申請(qǐng)準(zhǔn)備及專利檢索流程，其性能優(yōu)于單智能體系統(tǒng)（如 ChatGPT），原因在于其支持并發(fā)子任務(wù)執(zhí)行與長(zhǎng)上下文管理［98］。

例如，圖11a所示的一個(gè)真實(shí)應(yīng)用場(chǎng)景是基金提案的自動(dòng)化起草。設(shè)想一個(gè)大學(xué)研究團(tuán)隊(duì)正在準(zhǔn)備國(guó)家科學(xué)基金會(huì)（NSF）的申報(bào)材料。采用基于 AutoGen 的架構(gòu)，不同智能體被分配專門職責(zé)：一個(gè)智能體檢索過(guò)往資助提案并提取結(jié)構(gòu)模式；另一個(gè)智能體掃描最新文獻(xiàn)以總結(jié)相關(guān)工作；第三個(gè)智能體將提案目標(biāo)與NSF招標(biāo)語(yǔ)言對(duì)齊；還有一個(gè)格式化智能體根據(jù)合規(guī)指南組織文檔結(jié)構(gòu)。協(xié)調(diào)器統(tǒng)籌這些智能體，解決依賴關(guān)系（例如使方法論與目標(biāo)保持一致），并確保各部分風(fēng)格統(tǒng)一。持久記憶模塊存儲(chǔ)不斷演進(jìn)的草案、合作者反饋與資助機(jī)構(gòu)模板，從而實(shí)現(xiàn)多次會(huì)話中的迭代改進(jìn)。相比傳統(tǒng)人工流程，該多智能體系統(tǒng)顯著加速了起草時(shí)間，提升了敘事連貫性，并確保符合監(jiān)管要求，為學(xué)術(shù)界與研發(fā)密集型產(chǎn)業(yè)提供了一種可擴(kuò)展、自適應(yīng)的協(xié)作式科研寫作方案。

智能機(jī)器人協(xié)同：在機(jī)器人與自動(dòng)化領(lǐng)域，Agentic AI 賦能多機(jī)器人系統(tǒng)中的協(xié)作行為。每個(gè)機(jī)器人作為特定任務(wù)的智能體運(yùn)行（如采摘器、運(yùn)輸器或測(cè)繪器），而協(xié)調(diào)器則監(jiān)督并調(diào)整工作流。此類架構(gòu)依賴共享空間記憶、實(shí)時(shí)傳感器融合與智能體間同步，以實(shí)現(xiàn)協(xié)調(diào)的物理行動(dòng)。應(yīng)用場(chǎng)景包括倉(cāng)庫(kù)自動(dòng)化、基于無(wú)人機(jī)的果園巡檢以及機(jī)器人采收［155］。

例如，在商業(yè)蘋果園中（圖11b），Agentic AI 支持一套協(xié)調(diào)的多機(jī)器人系統(tǒng)以優(yōu)化水果采收。在此場(chǎng)景中，任務(wù)專精型機(jī)器人——如自主采摘機(jī)器人、水果分類機(jī)器人、運(yùn)輸機(jī)器人與無(wú)人機(jī)測(cè)繪機(jī)器人——均作為智能單元在中央?yún)f(xié)調(diào)器下運(yùn)作。測(cè)繪無(wú)人機(jī)首先巡視果園，利用視覺(jué)-語(yǔ)言模型（VLMs）生成高分辨率產(chǎn)量地圖并識(shí)別成熟果簇。該空間數(shù)據(jù)通過(guò)所有智能體均可訪問(wèn)的集中式記憶層共享。隨后，采摘機(jī)器人被指派至高密度區(qū)域，由路徑規(guī)劃智能體引導(dǎo)其繞開(kāi)障礙物與勞動(dòng)區(qū)域。同時(shí)，運(yùn)輸機(jī)器人動(dòng)態(tài)搬運(yùn)水果容器或箱體，往返于采摘機(jī)器人與儲(chǔ)存區(qū)之間，根據(jù)采摘負(fù)載水平與地形變化動(dòng)態(tài)調(diào)整任務(wù)。所有智能體通過(guò)共享協(xié)議異步通信，協(xié)調(diào)器則持續(xù)根據(jù)天氣預(yù)報(bào)或機(jī)械故障調(diào)整任務(wù)優(yōu)先級(jí)。若某一采摘機(jī)器人失效，鄰近單元可自動(dòng)重新分配工作負(fù)載。這種自適應(yīng)、記憶驅(qū)動(dòng)的協(xié)調(diào)機(jī)制彰顯了 Agentic AI 在降低人力成本、提高采收效率、應(yīng)對(duì)復(fù)雜農(nóng)業(yè)環(huán)境不確定性方面的潛力，遠(yuǎn)超傳統(tǒng)剛性編程農(nóng)業(yè)機(jī)器人的能力［98, 155］。

協(xié)作式醫(yī)療決策支持：在高風(fēng)險(xiǎn)臨床環(huán)境中，Agentic AI 通過(guò)將診斷、生命體征監(jiān)測(cè)與治療規(guī)劃等任務(wù)分配給專業(yè)智能體，實(shí)現(xiàn)分布式醫(yī)學(xué)推理。例如，一個(gè)智能體可檢索患者病史，另一個(gè)智能體依據(jù)診療指南驗(yàn)證檢查結(jié)果，第三個(gè)智能體則提出治療方案（如中國(guó)首家Agentic AI醫(yī)院所展示的案例［174］）。這些智能體通過(guò)共享記憶與推理鏈實(shí)現(xiàn)同步，確保建議的一致性與安全性。應(yīng)用場(chǎng)景包括ICU管理、放射科分診與疫情響應(yīng)（參見(jiàn)表10）。盡管因該領(lǐng)域尚處發(fā)展初期，現(xiàn)實(shí)部署仍顯不足，但已有研究支持Agentic AI變革醫(yī)療保健領(lǐng)域的巨大潛力［175］。

例如，在醫(yī)院重癥監(jiān)護(hù)室（ICU）（圖11c）中，一個(gè)Agentic AI系統(tǒng)輔助臨床醫(yī)生管理復(fù)雜患者病例。診斷智能體持續(xù)分析生命體征與實(shí)驗(yàn)室數(shù)據(jù)，以早期發(fā)現(xiàn)膿毒癥風(fēng)險(xiǎn)。同時(shí)，歷史數(shù)據(jù)檢索智能體訪問(wèn)電子健康記錄（EHRs），總結(jié)合并癥與近期治療情況。治療規(guī)劃智能體則交叉比對(duì)當(dāng)前癥狀與臨床指南（如“拯救膿毒癥運(yùn)動(dòng)”），提出抗生素方案或液體治療策略。協(xié)調(diào)器整合這些洞察，確保一致性并呈現(xiàn)沖突點(diǎn)供人工復(fù)核。醫(yī)生反饋被存儲(chǔ)于持久記憶模塊，使智能體能夠基于先前干預(yù)措施與結(jié)果優(yōu)化自身推理。該協(xié)同系統(tǒng)通過(guò)減輕認(rèn)知負(fù)荷、縮短決策時(shí)間與最小化疏漏風(fēng)險(xiǎn)，提升臨床工作流效率。在重癥監(jiān)護(hù)與腫瘤科室的早期部署已證明其可增強(qiáng)診斷精準(zhǔn)度并提高循證協(xié)議依從性，為更安全、實(shí)時(shí)的協(xié)作式醫(yī)療支持提供了可擴(kuò)展解決方案。

多智能體游戲AI與自適應(yīng)工作流自動(dòng)化：在模擬環(huán)境與企業(yè)系統(tǒng)中，Agentic AI 系統(tǒng)促進(jìn)去中心化的任務(wù)執(zhí)行與高效協(xié)調(diào)。游戲平臺(tái)如 AI Dungeon 部署具備目標(biāo)、記憶與動(dòng)態(tài)互動(dòng)能力的獨(dú)立NPC智能體，以創(chuàng)造涌現(xiàn)式敘事與社會(huì)行為。在企業(yè)工作流中，MultiOn 與 Cognosys 等系統(tǒng)使用智能體管理法律審查或事件升級(jí)等流程，其中每一步均由專用模塊控制。此類架構(gòu)展現(xiàn)出超越規(guī)則驅(qū)動(dòng)流水線的韌性、異常處理能力與反饋驅(qū)動(dòng)適應(yīng)性［176］。

例如，在現(xiàn)代企業(yè)IT環(huán)境中（如圖11d所示），Agentic AI 系統(tǒng)正越來(lái)越多地被用于自主管理網(wǎng)絡(luò)安全事件響應(yīng)工作流。當(dāng)檢測(cè)到潛在威脅（如異常訪問(wèn)模式或未經(jīng)授權(quán)的數(shù)據(jù)外泄）時(shí)，多個(gè)專業(yè)智能體并行激活。一個(gè)智能體利用歷史違規(guī)數(shù)據(jù)與異常檢測(cè)模型進(jìn)行實(shí)時(shí)威脅分類；第二個(gè)智能體查詢網(wǎng)絡(luò)節(jié)點(diǎn)的相關(guān)日志數(shù)據(jù)，并關(guān)聯(lián)跨系統(tǒng)模式；第三個(gè)智能體解讀合規(guī)框架（如GDPR或HIPAA），評(píng)估事件的監(jiān)管嚴(yán)重性；第四個(gè)智能體模擬緩解策略并預(yù)測(cè)運(yùn)營(yíng)風(fēng)險(xiǎn)。這些智能體在中央?yún)f(xié)調(diào)器下協(xié)同工作，協(xié)調(diào)器評(píng)估集體輸出、整合時(shí)序推理，并向人類分析師發(fā)出推薦行動(dòng)。通過(guò)共享記憶結(jié)構(gòu)與迭代反饋，系統(tǒng)從以往事件中學(xué)習(xí)，使未來(lái)響應(yīng)更快、更準(zhǔn)確。相比傳統(tǒng)基于規(guī)則的安全系統(tǒng)，該智能體模型降低了決策延遲、減少了誤報(bào)率，并支持在大規(guī)模組織基礎(chǔ)設(shè)施中實(shí)施主動(dòng)式威脅遏制［98］（參見(jiàn)表10與表11）。

5 AI智能體與代理式AI的挑戰(zhàn)與局限性

為了系統(tǒng)性地理解當(dāng)前智能系統(tǒng)在理論和操作層面的局限性（如表11所述），我們?cè)趫D12中提供了一個(gè)比較性的視覺(jué)綜合分析，該圖將AI智能體與代理式AI范式下的挑戰(zhàn)及潛在解決方案進(jìn)行了分類。圖12a概述了AI智能體特有的四大最緊迫限制：缺乏因果推理能力、繼承自大語(yǔ)言模型（LLM）的約束（例如幻覺(jué)、淺層推理）、代理屬性不完整（如自主性、主動(dòng)性），以及在長(zhǎng)時(shí)程規(guī)劃與恢復(fù)能力上的失敗。這些挑戰(zhàn)通常源于它們對(duì)無(wú)狀態(tài)LLM提示的依賴、有限的記憶能力以及啟發(fā)式推理循環(huán)。

同樣地，圖12b識(shí)別出代理式AI系統(tǒng)特有的八大關(guān)鍵瓶頸，例如多智能體間的錯(cuò)誤級(jí)聯(lián)、協(xié)調(diào)崩潰、涌現(xiàn)性不穩(wěn)定、可擴(kuò)展性限制以及可解釋性問(wèn)題。這些問(wèn)題源于在沒(méi)有標(biāo)準(zhǔn)化架構(gòu)、穩(wěn)健通信協(xié)議或因果對(duì)齊框架的情況下，協(xié)調(diào)多個(gè)智能體執(zhí)行分布式任務(wù)所面臨的復(fù)雜性。

圖13通過(guò)綜合十項(xiàng)前瞻性設(shè)計(jì)策略，補(bǔ)充了這一診斷框架，旨在緩解上述局限性。這些策略包括檢索增強(qiáng)生成（RAG）、基于工具的推理[130,131,133]、代理式反饋循環(huán)（ReAct[136]）、基于角色的多智能體編排、記憶架構(gòu)、因果建模以及具備治理意識(shí)的設(shè)計(jì)。這些機(jī)制共同構(gòu)成了一條整合路線圖，用以解決當(dāng)前缺陷，并加速安全、可擴(kuò)展且情境感知的自主系統(tǒng)的開(kāi)發(fā)。

5.0.1 AI智能體的挑戰(zhàn)與局限性

盡管AI智能體因其利用LLM和特定工具接口自動(dòng)化結(jié)構(gòu)化任務(wù)的能力而備受關(guān)注，但文獻(xiàn)指出其存在顯著的理論與實(shí)踐局限性，阻礙了其可靠性、泛化能力和長(zhǎng)期自主性[136,162]。這些挑戰(zhàn)既源于其架構(gòu)上對(duì)靜態(tài)預(yù)訓(xùn)練模型的依賴，也源于難以賦予其因果推理、規(guī)劃和穩(wěn)健適應(yīng)等代理特性。AI智能體的關(guān)鍵挑戰(zhàn)與局限性（見(jiàn)圖12a）總結(jié)如下：

缺乏因果理解：最基礎(chǔ)的挑戰(zhàn)之一在于智能體無(wú)法進(jìn)行因果推理[180,181]。雖然構(gòu)成大多數(shù)AI智能體認(rèn)知核心的LLM在檢測(cè)訓(xùn)練數(shù)據(jù)中的統(tǒng)計(jì)相關(guān)性方面非常有效，但它們并不能真正理解因果關(guān)系。正如DeepMin...

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.