<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      人工智能代理(AI Agents)與具能動(dòng)性的人工智能(Agentic AI):概念分類、應(yīng)用與挑戰(zhàn)

      0
      分享至

      AI Agents vs. Agentic AI: A Conceptual taxonomy, applications andchallenges

      人工智能代理(AI Agents)與具能動(dòng)性的人工智能(Agentic AI):概念分類、應(yīng)用與挑戰(zhàn)

      https://arxiv.org/pdf/2505.10468


      摘 要
      在生成式人工智能(Generative AI)時(shí)代背景下,信息融合必須明確區(qū)分“人工智能代理”(AI Agents)與“具能動(dòng)性的人工智能”(Agentic AI)。本綜述對(duì)二者進(jìn)行了批判性區(qū)分,提出了一個(gè)結(jié)構(gòu)化的概念分類體系、應(yīng)用映射分析,并探討了各自所面臨的機(jī)會(huì)與挑戰(zhàn),以厘清二者在設(shè)計(jì)理念與能力上的根本差異。我們首先概述了文獻(xiàn)檢索策略與基礎(chǔ)定義,將AI Agents界定為由大語(yǔ)言模型(LLMs)與大推理模型(LIMs)驅(qū)動(dòng)并賦能的模塊化系統(tǒng),旨在實(shí)現(xiàn)任務(wù)特定的自動(dòng)化;生成式AI則被視為其前身,為AI Agents提供基礎(chǔ)支撐,而AI Agents則通過(guò)工具集成、提示工程(prompt engineering)與推理能力增強(qiáng)得以進(jìn)一步發(fā)展。隨后,我們刻畫了Agentic AI系統(tǒng):與AI Agents不同,Agentic AI代表了一種范式轉(zhuǎn)變,其特征包括多智能體協(xié)作、動(dòng)態(tài)任務(wù)分解、持久記憶以及協(xié)調(diào)性自主能力。我們通過(guò)對(duì)其架構(gòu)演進(jìn)、運(yùn)行機(jī)制、交互方式與自主性水平的時(shí)序性評(píng)估,對(duì)AI Agents與Agentic AI兩類范式展開(kāi)了系統(tǒng)性對(duì)比分析。在應(yīng)用層面,AI Agents所支撐的領(lǐng)域(如客戶服務(wù)、日程安排、數(shù)據(jù)摘要)被與Agentic AI的應(yīng)用場(chǎng)景(如科研自動(dòng)化、機(jī)器人協(xié)同控制、醫(yī)療決策支持)進(jìn)行對(duì)照。我們進(jìn)一步剖析了兩類范式各自特有的挑戰(zhàn)——例如幻覺(jué)(hallucination)、脆弱性(brittleness)、涌現(xiàn)行為(emergent behavior)與協(xié)作失效(coordination failure),并提出了針對(duì)性解決方案,包括ReAct推理循環(huán)、檢索增強(qiáng)生成(RAG)、自動(dòng)化協(xié)調(diào)層以及因果建模等。本工作旨在為構(gòu)建魯棒、可擴(kuò)展且可解釋的AI驅(qū)動(dòng)系統(tǒng)提供發(fā)展路線圖。

      關(guān)鍵詞:人工智能代理(AI Agents)、具能動(dòng)性的人工智能(Agentic AI)、上下文感知(Context awareness)、多智能體系統(tǒng)(Multi-agent systems)、概念分類(Conceptual taxonomy)

      1. 引言

      在人工智能代理(AI Agents)與具能動(dòng)性的人工智能(Agentic AI)(見(jiàn)圖1)于2022年前后(即ChatGPT發(fā)布之前)被廣泛采用之前,自主與智能體的發(fā)展深深植根于人工智能的基礎(chǔ)范式之中,尤其是多智能體系統(tǒng)(Multi-Agent Systems, MAS)與專家系統(tǒng)——這些范式強(qiáng)調(diào)社會(huì)性行動(dòng)與分布式智能[1, 2]。值得注意的是,Castelfranchi[3]通過(guò)引入關(guān)于社會(huì)行動(dòng)、社會(huì)結(jié)構(gòu)與心智的本體論范疇,為該領(lǐng)域奠定了關(guān)鍵性基礎(chǔ);他主張,社會(huì)性產(chǎn)生于個(gè)體智能體在共享環(huán)境中所采取的行動(dòng)及其認(rèn)知過(guò)程,并指出“目標(biāo)委派”(goal delegation)與“目標(biāo)采納”(goal adoption)等概念構(gòu)成了合作行為與組織行為的基礎(chǔ)。類似地,F(xiàn)erber[4]提出了一個(gè)面向多智能體系統(tǒng)的綜合性框架,將智能體定義為具備自主性、感知能力與通信能力的實(shí)體,并強(qiáng)調(diào)其在分布式問(wèn)題求解、協(xié)作機(jī)器人以及合成世界仿真等領(lǐng)域的應(yīng)用。


      這些早期研究確立了個(gè)體社會(huì)行動(dòng)與認(rèn)知架構(gòu)對(duì)于建模集體現(xiàn)象的根本性作用,為現(xiàn)代AI Agents的發(fā)展奠定了基礎(chǔ)。本文在上述基礎(chǔ)性概念之上進(jìn)一步展開(kāi)探討,旨在考察[3, 4]中提出的社會(huì)行動(dòng)建模范式如何指導(dǎo)AI Agents的設(shè)計(jì),使其能夠在動(dòng)態(tài)環(huán)境中執(zhí)行復(fù)雜且具備社會(huì)智能的交互行為。

      傳統(tǒng)類代理系統(tǒng)(Classical Agent-like systems)被設(shè)計(jì)用于執(zhí)行具有預(yù)定義規(guī)則的特定任務(wù),其自主性極為有限,且對(duì)動(dòng)態(tài)環(huán)境的適應(yīng)能力薄弱。此類系統(tǒng)主要表現(xiàn)為反應(yīng)式(reactive)或慎思式(deliberative)架構(gòu),依賴符號(hào)推理、基于規(guī)則的邏輯或腳本化行為,而非現(xiàn)代AI Agents所具備的學(xué)習(xí)驅(qū)動(dòng)與上下文感知能力[5, 6]。例如,專家系統(tǒng)通過(guò)知識(shí)庫(kù)與推理引擎模擬人類在特定領(lǐng)域的決策過(guò)程(如醫(yī)療診斷系統(tǒng)MYCIN[7])。其他著名實(shí)例還包括用于分子結(jié)構(gòu)預(yù)測(cè)的專家系統(tǒng)DENDRAL[8]、用于計(jì)算機(jī)系統(tǒng)配置的XCON[9],以及基于規(guī)則的產(chǎn)生式系統(tǒng)框架CLIPS[10]。SOAR[11]與次級(jí)架構(gòu)(subsumption architecture)[12]進(jìn)一步將符號(hào)邏輯與反應(yīng)式邏輯拓展至認(rèn)知建模與機(jī)器人領(lǐng)域。

      除任務(wù)特定推理之外,這些早期智能體還支持有限形式的社會(huì)性交互。例如,早期對(duì)話系統(tǒng)ELIZA[13]與PARRY[14]通過(guò)模式匹配與腳本式響應(yīng)模擬基礎(chǔ)對(duì)話,但缺乏真實(shí)理解能力或上下文適應(yīng)性;機(jī)器人中的反應(yīng)式智能體則基于固定控制規(guī)則執(zhí)行“感知—行動(dòng)”循環(huán),如早期自主平臺(tái)Stanford Cart[15]所示。

      多智能體系統(tǒng)則實(shí)現(xiàn)了分布式實(shí)體之間的協(xié)調(diào)協(xié)作,其典型應(yīng)用包括供應(yīng)鏈管理中的基于拍賣的資源分配機(jī)制[16–18]。電子游戲中的腳本化AI(如早期角色扮演游戲中的非玩家角色NPC行為)則采用預(yù)定義的決策樹(shù)實(shí)現(xiàn)行為控制[19]。此外,BDI(信念—愿望—意圖,Belief-Desire-Intention)架構(gòu)使軟件智能體具備目標(biāo)導(dǎo)向行為能力,如應(yīng)用于空管模擬系統(tǒng)中的智能體[20, 21]。

      然而,跨越上述各類系統(tǒng),早期AI智能體普遍存在若干共性局限:缺乏自學(xué)習(xí)能力、生成式推理能力,以及對(duì)非結(jié)構(gòu)化或演化環(huán)境的適應(yīng)能力。這些缺陷使其顯著區(qū)別于“具能動(dòng)性人工智能”(Agentic AI)——后者是一種新興范式,依托深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)與基礎(chǔ)模型(foundation models),賦能智能體實(shí)現(xiàn)上下文感知、持續(xù)學(xué)習(xí)與涌現(xiàn)式自主性[22]。

      近期學(xué)術(shù)界、工業(yè)界及公眾對(duì)AI Agents與Agentic AI的高度關(guān)注,正反映了系統(tǒng)能力層面的這一重大躍遷。如圖1所示,Google Trends數(shù)據(jù)顯示,在2022年末大規(guī)模生成式模型興起之后,全球?qū)@兩個(gè)術(shù)語(yǔ)的搜索量均顯著上升。這一轉(zhuǎn)變與智能體設(shè)計(jì)范式的演進(jìn)密切相關(guān):從2022年之前智能體運(yùn)行于受限、規(guī)則化環(huán)境的階段,過(guò)渡到大語(yǔ)言模型(LLM)時(shí)代之后以學(xué)習(xí)驅(qū)動(dòng)、靈活適應(yīng)為特征的架構(gòu)[23–25]。新一代系統(tǒng)使智能體能夠隨時(shí)間持續(xù)優(yōu)化性能,并與非結(jié)構(gòu)化、動(dòng)態(tài)的輸入實(shí)現(xiàn)自主交互[26–28]。例如,傳統(tǒng)專家系統(tǒng)需人工更新靜態(tài)知識(shí)庫(kù),而現(xiàn)代智能體則借助涌現(xiàn)式神經(jīng)架構(gòu)實(shí)現(xiàn)跨任務(wù)泛化[25]。搜索熱度的激增反映了人們對(duì)這一技術(shù)飛躍日益增長(zhǎng)的認(rèn)知——研究者與從業(yè)者正積極尋求超越自動(dòng)化、邁向自主性與通用推理能力的工具。此外,其應(yīng)用范疇亦不再局限于仿真或物流等狹窄領(lǐng)域,而擴(kuò)展至需實(shí)時(shí)推理與自適應(yīng)控制的廣泛現(xiàn)實(shí)場(chǎng)景。如圖1所示,這一發(fā)展勢(shì)頭凸顯了近期架構(gòu)創(chuàng)新在推動(dòng)自主智能體規(guī)模化落地現(xiàn)實(shí)世界中的重要意義。

      2022年11月ChatGPT的發(fā)布標(biāo)志著人工智能發(fā)展與公眾認(rèn)知的關(guān)鍵拐點(diǎn),引發(fā)了全球范圍內(nèi)技術(shù)采納、投資與研究活動(dòng)的井噴式增長(zhǎng)[29]。在此突破之后,AI格局迅速轉(zhuǎn)型——從獨(dú)立使用的LLM逐步轉(zhuǎn)向更具自主性與任務(wù)導(dǎo)向性的框架[30]。這一演進(jìn)經(jīng)歷了兩大后生成式階段:AI AgentsAgentic AI

      最初,ChatGPT的巨大成功推動(dòng)了“生成式智能體”(Generative Agents)的普及——這類基于LLM的系統(tǒng)旨在根據(jù)用戶提示生成新穎輸出(如文本、圖像與代碼)[31, 32]。此類智能體被迅速應(yīng)用于各類場(chǎng)景:從對(duì)話助手(如GitHub Copilot[33])、內(nèi)容生成平臺(tái)(如Jasper[34])到創(chuàng)意工具(如Midjourney[35]),于2023年及以后徹底革新了數(shù)字設(shè)計(jì)、市場(chǎng)營(yíng)銷與軟件原型開(kāi)發(fā)等領(lǐng)域。

      盡管“AI Agent”一詞最早于1998年提出[3],但其內(nèi)涵隨著生成式AI的興起已發(fā)生顯著演進(jìn)。在此生成式基礎(chǔ)之上,一類新型系統(tǒng)——現(xiàn)今通稱的AI Agents——應(yīng)運(yùn)而生。此類智能體通過(guò)集成外部工具調(diào)用(如基于API的工具)、函數(shù)調(diào)用與序列化推理等能力,對(duì)LLM進(jìn)行增強(qiáng),使其可自主獲取實(shí)時(shí)信息并執(zhí)行多步驟工作流[36, 37]。代表性框架如AutoGPT[38]與BabyAGI(https://github.com/yoheinakajima/babyagi)凸顯了這一轉(zhuǎn)變:它們展示了如何將LLM嵌入反饋循環(huán)中,以在目標(biāo)驅(qū)動(dòng)環(huán)境中動(dòng)態(tài)規(guī)劃、行動(dòng)與適應(yīng)[39 , 40]。

      至2023年末,該領(lǐng)域進(jìn)一步邁向Agentic AI新階段——即由多個(gè)專業(yè)化智能體組成的復(fù)雜多智能體系統(tǒng),這些智能體通過(guò)協(xié)作分解目標(biāo)、相互通信并在更大工作流中協(xié)調(diào)行動(dòng),以達(dá)成共同目標(biāo)。順應(yīng)此趨勢(shì),谷歌于2025年推出智能體間協(xié)議(Agent-to-Agent, A2A)[41],一項(xiàng)旨在實(shí)現(xiàn)跨框架與跨廠商智能體間無(wú)縫互操作的標(biāo)準(zhǔn)化提案。該協(xié)議圍繞五大核心原則構(gòu)建:擁抱能動(dòng)性能力、基于既有標(biāo)準(zhǔn)擴(kuò)展、默認(rèn)保障交互安全、支持長(zhǎng)時(shí)運(yùn)行任務(wù),以及確保模態(tài)無(wú)關(guān)性(modality agnosticism)。這些準(zhǔn)則旨在為構(gòu)建響應(yīng)迅速、可擴(kuò)展的能動(dòng)性基礎(chǔ)設(shè)施奠定基礎(chǔ)。

      CrewAI等架構(gòu)展示了此類能動(dòng)性框架如何在分布式角色間實(shí)現(xiàn)決策協(xié)同,從而在機(jī)器人、物流管理與自適應(yīng)決策支持等高風(fēng)險(xiǎn)應(yīng)用中促成高階智能行為[42]。

      隨著領(lǐng)域從生成式智能體向日益自主的Agentic AI系統(tǒng)演進(jìn),厘清AI Agents與Agentic AI之間的技術(shù)與概念邊界變得至關(guān)重要。盡管兩類范式均以LLM為基礎(chǔ)并拓展了生成式系統(tǒng)的能力,但其底層架構(gòu)、交互模型與自主性層級(jí)存在根本差異:

      • AI Agents

        通常被設(shè)計(jì)為 單實(shí)體系統(tǒng) ,通過(guò)調(diào)用外部工具、實(shí)施序列化推理并整合實(shí)時(shí)信息,以完成明確定義的目標(biāo)導(dǎo)向任務(wù)[25, 43];

      • Agentic AI系統(tǒng)

        則由 多個(gè)專業(yè)化智能體 構(gòu)成,它們?cè)诟蠊ぷ髁髦袆?dòng)態(tài)分配子任務(wù)、相互協(xié)調(diào)與通信,以共同實(shí)現(xiàn)目標(biāo)[22, 44]。

      這一架構(gòu)差異凸顯了二者在可擴(kuò)展性、適應(yīng)性及應(yīng)用廣度上的顯著區(qū)別。

      對(duì)AI Agents與Agentic AI之間分類體系的界定與形式化,在科學(xué)層面具有多重重要意義:

      首先,它有助于實(shí)現(xiàn)更精準(zhǔn)的系統(tǒng)設(shè)計(jì)——將計(jì)算框架與問(wèn)題復(fù)雜度相匹配:即對(duì)模塊化、工具輔助型任務(wù)部署AI Agents,而對(duì)需協(xié)同執(zhí)行的多智能體操作采用Agentic AI;其次,它支持恰當(dāng)?shù)幕鶞?zhǔn)測(cè)試與評(píng)估:面向單任務(wù)執(zhí)行的智能體與面向復(fù)雜協(xié)同任務(wù)的分布式智能體系統(tǒng),在性能指標(biāo)、安全協(xié)議與資源需求等方面存在顯著差異;再者,清晰的分類體系可減少開(kāi)發(fā)低效問(wèn)題,例如避免將適用于多智能體協(xié)作的設(shè)計(jì)原則誤用于單智能體架構(gòu)的系統(tǒng)中。缺乏此等明晰性,開(kāi)發(fā)者與實(shí)踐者既可能低估需能動(dòng)性協(xié)作的復(fù)雜場(chǎng)景,導(dǎo)致系統(tǒng)能力不足;亦可能高估簡(jiǎn)單應(yīng)用場(chǎng)景的需求,造成過(guò)度工程化。

      本文旨在厘清AI Agents與Agentic AI之間的差異,為研究者提供對(duì)這些技術(shù)的基礎(chǔ)性理解。本研究的目標(biāo)是:

      • 明確二者的形式化區(qū)別;

      • 建立共享術(shù)語(yǔ)體系;

      • 構(gòu)建一個(gè)結(jié)構(gòu)化的概念分類框架(如圖2所示),以指導(dǎo)學(xué)術(shù)界與工業(yè)界下一代智能體系統(tǒng)的設(shè)計(jì)。


      本綜述亦對(duì)從傳統(tǒng)AI Agents到新興Agentic AI系統(tǒng)的演進(jìn)歷程進(jìn)行了全面的概念與架構(gòu)分析。區(qū)別于常規(guī)綜述文章圍繞形式化研究問(wèn)題組織內(nèi)容的方式,本文采用一種時(shí)序性、分層遞進(jìn)的結(jié)構(gòu),清晰呈現(xiàn)兩類范式的歷史脈絡(luò)與技術(shù)演進(jìn)路徑。

      我們首先詳述文獻(xiàn)檢索策略與篩選標(biāo)準(zhǔn),繼而通過(guò)剖析其核心屬性(如自主性、反應(yīng)性與工具調(diào)用執(zhí)行能力),確立對(duì)AI Agents的基礎(chǔ)認(rèn)識(shí);隨后探討基礎(chǔ)模型——特別是大語(yǔ)言模型(LLMs)與大圖像模型(LIMs)——的關(guān)鍵作用:它們作為核心推理與感知引擎,驅(qū)動(dòng)智能體行為的生成;后續(xù)章節(jié)考察生成式AI系統(tǒng)如何作為先驅(qū),推動(dòng)更具動(dòng)態(tài)性與交互性的智能體發(fā)展,從而為Agentic AI的出現(xiàn)鋪平道路。

      基于此視角,我們呈現(xiàn)并分析了從孤立單智能體系統(tǒng)向協(xié)同多智能體架構(gòu)的概念跨越,重點(diǎn)突出其結(jié)構(gòu)差異、協(xié)調(diào)策略與協(xié)作機(jī)制;我們進(jìn)一步通過(guò)解析AI Agents與Agentic AI的核心系統(tǒng)組件,映射其架構(gòu)演進(jìn)歷程,并對(duì)二者的規(guī)劃層、記憶層、編排層與執(zhí)行層進(jìn)行對(duì)比性描述;

      在此基礎(chǔ)之上,我們綜述了涵蓋客戶服務(wù)、醫(yī)療健康、科研自動(dòng)化與機(jī)器人等領(lǐng)域的應(yīng)用場(chǎng)景,并依據(jù)系統(tǒng)能力與協(xié)作復(fù)雜度對(duì)現(xiàn)實(shí)部署案例進(jìn)行分類;隨后評(píng)估兩類范式所面臨的關(guān)鍵挑戰(zhàn)——包括幻覺(jué)、推理深度不足、因果建模缺失、可擴(kuò)展性瓶頸與治理風(fēng)險(xiǎn);針對(duì)上述局限,我們概述了新興解決方案的發(fā)展機(jī)遇,例如檢索增強(qiáng)生成(RAG)、工具輔助推理、記憶架構(gòu)設(shè)計(jì)以及基于仿真的規(guī)劃方法。

      最后,本綜述提出一項(xiàng)前瞻性路線圖,展望模塊化AI Agents與協(xié)同式Agentic AI在自動(dòng)駕駛、金融、醫(yī)療等關(guān)鍵任務(wù)領(lǐng)域乃至更廣泛場(chǎng)景中的融合前景。我們旨在為研究者提供一套結(jié)構(gòu)化的分類體系與可操作的洞見(jiàn),以指導(dǎo)下一代能動(dòng)性AI系統(tǒng)的設(shè)計(jì)、部署與評(píng)估。

      盡管學(xué)界對(duì)AI Agents與Agentic AI的興趣日益增長(zhǎng),現(xiàn)有綜述工作往往將二者籠統(tǒng)歸入“智能體”這一寬泛范疇之下,導(dǎo)致概念模糊與系統(tǒng)設(shè)計(jì)錯(cuò)位。近期文獻(xiàn)要么狹隘聚焦于工具增強(qiáng)型LLM在任務(wù)自動(dòng)化中的應(yīng)用,要么泛泛討論多智能體系統(tǒng),卻未能充分認(rèn)知Agentic AI所帶來(lái)的架構(gòu)與功能層面的范式轉(zhuǎn)變。

      本綜述首次提出一套結(jié)構(gòu)化的分類體系,從自主性(autonomy)、協(xié)調(diào)性(coordination)、交互方式(interaction)與推理范圍(reasoning scope)等維度,對(duì)這兩類范式進(jìn)行形式化區(qū)分。通過(guò)將AI Agents界定為模塊化、單實(shí)體系統(tǒng),而將Agentic AI界定為具備涌現(xiàn)行為的協(xié)同式生態(tài)系統(tǒng),本研究有效填補(bǔ)了當(dāng)前在設(shè)計(jì)原則、部署策略與評(píng)估標(biāo)準(zhǔn)等方面的區(qū)分空白。

      這一區(qū)分在當(dāng)下尤顯關(guān)鍵:現(xiàn)實(shí)世界應(yīng)用(如機(jī)器人、醫(yī)療健康與科學(xué)發(fā)現(xiàn))正日益要求具備可擴(kuò)展性的多智能體智能,然而開(kāi)發(fā)者往往缺乏清晰的框架來(lái)抉擇——究竟應(yīng)采用孤立式智能體,抑或協(xié)作式能動(dòng)架構(gòu)。本綜述正旨在彌合此一鴻溝,促使系統(tǒng)能力與任務(wù)復(fù)雜度實(shí)現(xiàn)更精準(zhǔn)的對(duì)齊,并為后LLM時(shí)代的科研議程設(shè)定與實(shí)際系統(tǒng)部署提供理論指導(dǎo)與實(shí)踐依據(jù)。

      1.1 方法論概述

      本綜述采用一種結(jié)構(gòu)化、多階段的研究方法,旨在系統(tǒng)把握AI Agents與Agentic AI的演進(jìn)歷程、架構(gòu)特征、應(yīng)用場(chǎng)景及現(xiàn)存局限。該方法流程如圖3所示,清晰勾勒出本研究中各主題與概念的遞進(jìn)邏輯關(guān)系。分析框架的設(shè)計(jì)聚焦于呈現(xiàn)從以LLM為基礎(chǔ)的基本能動(dòng)結(jié)構(gòu),到高級(jí)多智能體協(xié)同系統(tǒng)的演進(jìn)路徑。綜述各環(huán)節(jié)均基于對(duì)學(xué)術(shù)文獻(xiàn)及AI賦能平臺(tái)所發(fā)布成果的嚴(yán)謹(jǐn)綜合與提煉,從而實(shí)現(xiàn)對(duì)當(dāng)前研究格局及其新興趨勢(shì)的全面把握。


      綜述首先確立對(duì)AI Agents的基礎(chǔ)性理解,考察文獻(xiàn)中對(duì)其核心定義、設(shè)計(jì)原則與架構(gòu)模塊的描述,包括感知(perception)、推理(reasoning)與行動(dòng)選擇(action selection)等組件,以及早期應(yīng)用實(shí)例(如客戶服務(wù)機(jī)器人與檢索助手)。該基礎(chǔ)層構(gòu)成進(jìn)入更廣義能動(dòng)范式的概念入口點(diǎn)。

      其次,我們探討大語(yǔ)言模型(LLMs)作為核心推理組件的關(guān)鍵作用,著重闡明預(yù)訓(xùn)練語(yǔ)言模型如何賦能現(xiàn)代AI Agents。本節(jié)詳述:通過(guò)指令微調(diào)(instruction fine-tuning)與基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF),LLMs得以支撐自然語(yǔ)言交互、任務(wù)規(guī)劃與有限決策能力;同時(shí),亦指出其局限性,例如幻覺(jué)(hallucination)、靜態(tài)知識(shí)庫(kù)、以及因果推理能力的缺失。

      在此基礎(chǔ)之上,綜述進(jìn)一步探討Agentic AI的興起——這一階段代表著重要的概念躍升。我們著重強(qiáng)調(diào)其從“工具增強(qiáng)型單智能體系統(tǒng)”向“協(xié)作式、分布式智能體生態(tài)系統(tǒng)”的根本性轉(zhuǎn)變。這一轉(zhuǎn)變?cè)从诂F(xiàn)實(shí)需求:系統(tǒng)需具備目標(biāo)分解、子任務(wù)分配、輸出協(xié)調(diào)及對(duì)動(dòng)態(tài)變化環(huán)境的自適應(yīng)能力——這些能力已遠(yuǎn)超孤立AI Agents所能實(shí)現(xiàn)的范疇。

      隨后一節(jié)考察從AI Agents到Agentic AI系統(tǒng)的架構(gòu)演進(jìn),對(duì)比簡(jiǎn)單模塊化智能體設(shè)計(jì)與復(fù)雜協(xié)同框架之間的差異。我們描述了多項(xiàng)關(guān)鍵增強(qiáng)機(jī)制,例如持久記憶(persistent memory)、元智能體協(xié)調(diào)(meta-agent coordination)、多智能體規(guī)劃循環(huán)(如ReAct與思維鏈(Chain-of-Thought)提示)、以及語(yǔ)義通信協(xié)議(semantic communication protocols)。該架構(gòu)對(duì)比分析輔以AutoGPT、CrewAI與LangGraph等平臺(tái)的具體案例予以支撐。

      在完成架構(gòu)探索之后,綜述深入剖析AI Agents與Agentic AI當(dāng)前落地的應(yīng)用領(lǐng)域。本文分別選取兩類范式各四個(gè)代表性應(yīng)用場(chǎng)景進(jìn)行討論:

      • 對(duì)于 AI Agents ,包括:客戶服務(wù)自動(dòng)化、企業(yè)內(nèi)部搜索增強(qiáng)、郵件過(guò)濾與優(yōu)先級(jí)排序,以及個(gè)性化內(nèi)容推薦;

      • 對(duì)于 Agentic AI ,則涵蓋:多智能體科研助手、智能機(jī)器人協(xié)同控制、協(xié)作式醫(yī)療決策支持,以及自適應(yīng)工作流自動(dòng)化。

      上述用例均從系統(tǒng)復(fù)雜度、實(shí)時(shí)決策能力及協(xié)作任務(wù)執(zhí)行等方面展開(kāi)分析。

      繼而,我們探討兩類范式固有的挑戰(zhàn)與局限:

      • 針對(duì) AI Agents ,聚焦于幻覺(jué)、提示脆弱性(prompt brittleness)、規(guī)劃能力有限,以及缺乏因果理解等問(wèn)題;

      • 針對(duì) Agentic AI ,則識(shí)別出更高階的挑戰(zhàn),如智能體間目標(biāo)錯(cuò)位(inter-agent misalignment)、錯(cuò)誤傳播、涌現(xiàn)行為的不可預(yù)測(cè)性、可解釋性缺陷,以及對(duì)抗性脆弱性(adversarial vulnerabilities)。這些問(wèn)題均結(jié)合近期實(shí)驗(yàn)研究與技術(shù)報(bào)告予以批判性剖析。

      最后,綜述概述了應(yīng)對(duì)上述挑戰(zhàn)的潛在解決方案,援引因果建模、檢索增強(qiáng)生成(RAG)、多智能體記憶框架,以及魯棒評(píng)估流程等最新進(jìn)展。這些策略不僅被視作技術(shù)修補(bǔ)手段,更被視為將能動(dòng)系統(tǒng)規(guī)模化部署至高風(fēng)險(xiǎn)領(lǐng)域(如醫(yī)療、金融與自動(dòng)駕駛機(jī)器人)所必需的基礎(chǔ)性保障。

      綜上所述,本方法論結(jié)構(gòu)使我們得以對(duì)AI Agents與Agentic AI的研究現(xiàn)狀進(jìn)行系統(tǒng)、全面的評(píng)估。通過(guò)將分析依次安排為:基礎(chǔ)認(rèn)知 → 模型集成 → 架構(gòu)演進(jìn) → 應(yīng)用場(chǎng)景 → 局限與挑戰(zhàn) → 潛在解決方案,本研究旨在為身處這一快速演變領(lǐng)域中的研究者與實(shí)踐者提供兼具理論明晰性與實(shí)踐指導(dǎo)價(jià)值的參考框架。

      1.1.1 檢索策略

      為完成本綜述,我們采用了一種混合式文獻(xiàn)檢索方法,結(jié)合傳統(tǒng)學(xué)術(shù)數(shù)據(jù)庫(kù)與AI增強(qiáng)型文獻(xiàn)發(fā)現(xiàn)工具。具體而言,共檢索了12個(gè)平臺(tái):

      • 學(xué)術(shù)數(shù)據(jù)庫(kù)包括:Google Scholar、IEEE Xplore、ACM數(shù)字圖書館(ACM Digital Library)、Scopus、Web of Science、ScienceDirect 和 arXiv;

      • AI驅(qū)動(dòng)的檢索接口包括:ChatGPT、Perplexity.ai、DeepSeek、Hugging Face Search 以及 Grok。

      檢索查詢采用布爾邏輯組合關(guān)鍵詞,如“AI Agents”(人工智能代理)、“Agentic AI”(具能動(dòng)性人工智能)、“LLM Agents”(大語(yǔ)言模型代理)、“Tool-augmented LLMs”(工具增強(qiáng)型大語(yǔ)言模型)以及“Multi-Agent AI Systems”(多智能體人工智能系統(tǒng))。此外,還使用了針對(duì)性更強(qiáng)的組合查詢,例如“Agentic AI + Coordination + Planning”(具能動(dòng)性人工智能 + 協(xié)調(diào) + 規(guī)劃)和“AI Agents + Tool Usage + Reasoning”(人工智能代理 + 工具使用 + 推理),以篩選出同時(shí)涵蓋概念基礎(chǔ)與系統(tǒng)級(jí)實(shí)現(xiàn)的研究文獻(xiàn)。

      文獻(xiàn)納入標(biāo)準(zhǔn)基于其在新穎性、實(shí)證評(píng)估、架構(gòu)貢獻(xiàn)與引用影響力等方面的顯著價(jià)值。如圖1所示,Google Trends數(shù)據(jù)顯示全球?qū)@些技術(shù)的關(guān)注度持續(xù)攀升,進(jìn)一步凸顯了對(duì)這一新興知識(shí)領(lǐng)域進(jìn)行系統(tǒng)整合的緊迫性。

      1. AI Agents的基礎(chǔ)性理解

      AI Agents可被定義為:在限定的數(shù)字環(huán)境中、為實(shí)現(xiàn)目標(biāo)導(dǎo)向型任務(wù)執(zhí)行而設(shè)計(jì)的自主性軟件實(shí)體[22, 45]。其核心特征在于能夠:

      • 感知結(jié)構(gòu)化或非結(jié)構(gòu)化輸入[46];

      • 基于上下文信息進(jìn)行推理[47, 48];

      • 為達(dá)成特定目標(biāo)而發(fā)起行動(dòng),常作為人類用戶或子系統(tǒng)的代理[49]。

      與遵循確定性流程的傳統(tǒng)自動(dòng)化腳本不同,AI Agents展現(xiàn)出反應(yīng)式智能與一定程度的適應(yīng)性,使其能夠解讀動(dòng)態(tài)輸入并相應(yīng)調(diào)整輸出[50]。其應(yīng)用已廣泛見(jiàn)諸諸多領(lǐng)域,包括客戶服務(wù)自動(dòng)化[51, 52]、個(gè)人生產(chǎn)力輔助[53]、組織級(jí)信息檢索[54, 55]以及決策支持系統(tǒng)[56, 57]。

      AI Agents實(shí)現(xiàn)自主性的一個(gè)突出實(shí)例是Anthropic的“Computer Use”(計(jì)算機(jī)操作)項(xiàng)目。該項(xiàng)目展示了其Claude模型如何以近似人類的方式與計(jì)算機(jī)交互:Claude經(jīng)訓(xùn)練可視覺(jué)識(shí)別屏幕內(nèi)容、操控鼠標(biāo)與鍵盤,并在各類軟件應(yīng)用間導(dǎo)航。借此,Claude不僅能自動(dòng)化重復(fù)性任務(wù)(如填寫表格、復(fù)制數(shù)據(jù)),還可執(zhí)行更復(fù)雜的活動(dòng)——例如通過(guò)打開(kāi)代碼編輯器、運(yùn)行命令、調(diào)試問(wèn)題等方式構(gòu)建并測(cè)試軟件。除上述結(jié)構(gòu)化任務(wù)外,Claude還能處理開(kāi)放式任務(wù),如開(kāi)展在線調(diào)研、從多源整合信息,乃至根據(jù)調(diào)研結(jié)果自主創(chuàng)建日歷事件。

      其關(guān)鍵創(chuàng)新在于Claude運(yùn)行于一個(gè)“代理循環(huán)”(agent loop)之中:它接收目標(biāo)→決定下一步行動(dòng)→執(zhí)行該行動(dòng)→觀察結(jié)果→重復(fù)該過(guò)程,直至任務(wù)完成。這一機(jī)制使Claude得以獨(dú)立調(diào)用現(xiàn)有計(jì)算機(jī)工具與界面,實(shí)現(xiàn)廣泛目標(biāo)的自動(dòng)化——既涵蓋常規(guī)流程,亦包括復(fù)雜工作流,堪稱自主AI Agents賦能現(xiàn)實(shí)任務(wù)自動(dòng)化的典范。

      2.0.1 AI Agents的核心特征

      學(xué)界普遍將AI Agents概念化為:一種被實(shí)例化部署的人工智能操作單元,旨在與用戶、軟件生態(tài)系統(tǒng)或數(shù)字基礎(chǔ)設(shè)施交互,以生成目標(biāo)導(dǎo)向行為[58–60]。與通用大語(yǔ)言模型(LLMs)相比,AI Agents展現(xiàn)出結(jié)構(gòu)性初始化、有限自主性與持續(xù)任務(wù)導(dǎo)向性等特質(zhì)。LLMs本質(zhì)上主要是對(duì)提示作出反應(yīng)的“被動(dòng)跟隨者”[61],而AI Agents則能在明確定義的范圍內(nèi)自動(dòng)運(yùn)行,動(dòng)態(tài)響應(yīng)輸入,并在實(shí)時(shí)環(huán)境中產(chǎn)出可執(zhí)行輸出[62]。

      如圖4所示,當(dāng)前主流架構(gòu)分類體系及實(shí)際部署中的AI Agents普遍包含以下三項(xiàng)基礎(chǔ)性特征:自主性(autonomy)、任務(wù)特異性(task-specificity)以及具備適應(yīng)能力的反應(yīng)性(reactivity with adaptation)。


      這三項(xiàng)特征共同構(gòu)成了理解與評(píng)估不同應(yīng)用場(chǎng)景中AI Agents的基礎(chǔ)框架。本節(jié)余下部分將逐一詳述各特征,并輔以理論背景與實(shí)例說(shuō)明。

      • 自主性(Autonomy):AI Agents的一個(gè)核心特征是,部署后可在極小或無(wú)需人工干預(yù)的情況下運(yùn)行[63]。一旦初始化完成,這些智能體便能夠感知環(huán)境輸入、基于上下文數(shù)據(jù)進(jìn)行推理,并實(shí)時(shí)執(zhí)行預(yù)設(shè)或自適應(yīng)的動(dòng)作[25]。在需要持續(xù)人工監(jiān)督(human-in-the-loop)不切實(shí)際的應(yīng)用場(chǎng)景中——如客戶服務(wù)機(jī)器人或日程助理——自主性使得規(guī)模化部署成為可能[52, 64]。

      • 任務(wù)特異性(Task-Specificity):AI Agents是為狹窄且定義明確的任務(wù)而專門構(gòu)建的[65, 66]。它們被優(yōu)化用于在固定領(lǐng)域內(nèi)執(zhí)行可重復(fù)的操作,例如郵件過(guò)濾[67, 68]、數(shù)據(jù)庫(kù)查詢[69]或日歷協(xié)調(diào)[44, 70]。這種任務(wù)專業(yè)化使它們?cè)谧詣?dòng)化那些無(wú)需或不適合通用推理的任務(wù)時(shí),具備高效率、高可解釋性與高精確度。

      • 反應(yīng)性與適應(yīng)性(Reactivity and Adaptation):AI Agents通常包含與動(dòng)態(tài)輸入交互的基本機(jī)制,使其能夠響應(yīng)實(shí)時(shí)刺激,例如用戶請(qǐng)求、外部API調(diào)用或軟件環(huán)境中狀態(tài)的變化[25, 71]。部分系統(tǒng)通過(guò)反饋循環(huán)[73, 74]、啟發(fā)式方法[75]或更新后的上下文緩存區(qū),整合基礎(chǔ)學(xué)習(xí)能力[72],以隨時(shí)間推移不斷優(yōu)化行為表現(xiàn),尤其適用于個(gè)性化推薦或?qū)υ捔鞒坦芾淼葓?chǎng)景[76–78]。

      上述核心特征共同使AI Agents能夠作為模塊化、輕量級(jí)接口,連接預(yù)訓(xùn)練AI模型與特定領(lǐng)域的實(shí)用流水線。其架構(gòu)簡(jiǎn)潔性與操作高效性,使其成為企業(yè)、消費(fèi)及工業(yè)場(chǎng)景下可擴(kuò)展自動(dòng)化的核心推動(dòng)者。盡管目前尚無(wú)明確研究涉及將AI Agents與專用推理型大語(yǔ)言模型集成,但它們?cè)谑芟奕蝿?wù)邊界內(nèi)展現(xiàn)出的高度可用性與性能,已使其成為當(dāng)代智能系統(tǒng)設(shè)計(jì)中的基礎(chǔ)組成要素。

      2.0.2 基礎(chǔ)模型:LLMs與LIMs的作用

      人工智能代理(AI Agents)的發(fā)展在很大程度上得益于大語(yǔ)言模型(LLMs)與大圖像模型(LIMs)的基礎(chǔ)性進(jìn)展與實(shí)際部署——二者共同構(gòu)成當(dāng)代智能體系統(tǒng)的核心推理引擎與感知引擎。這些模型使AI Agents得以智能地與其環(huán)境交互,理解多模態(tài)輸入,并執(zhí)行超越硬編碼自動(dòng)化的復(fù)雜推理任務(wù)。

      諸如GPT-4[79]和PaLM[80]等大語(yǔ)言模型(LLMs),是在海量文本數(shù)據(jù)(包括書籍、網(wǎng)頁(yè)內(nèi)容及對(duì)話語(yǔ)料庫(kù))上訓(xùn)練而成的。這些模型展現(xiàn)出諸如自然語(yǔ)言理解、問(wèn)答、文本摘要、對(duì)話連貫性,乃至符號(hào)推理等涌現(xiàn)能力[81–83]。在AI Agent架構(gòu)中,LLMs充當(dāng)核心決策引擎,使智能體能夠解析用戶查詢、規(guī)劃多步驟解決方案,并生成類人響應(yīng)。例如,一個(gè)基于GPT-4驅(qū)動(dòng)的AI客戶服務(wù)代理,可理解客戶投訴內(nèi)容,通過(guò)工具集成查詢后端系統(tǒng),并以符合上下文且具備情感感知的方式作出回應(yīng)[84, 85]。

      大圖像模型(Large Image Models, LIMs),如CLIP[86]與BLIP-2[87],則將智能體的能力拓展至視覺(jué)領(lǐng)域。LIMs基于圖文配對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,支持圖像分類、目標(biāo)檢測(cè)及視覺(jué)—語(yǔ)言對(duì)齊等感知型任務(wù)。這些能力對(duì)運(yùn)行于機(jī)器人[88]、自動(dòng)駕駛車輛[89, 90]及視覺(jué)內(nèi)容審核[91, 92]等領(lǐng)域的智能體日益關(guān)鍵。

      例如,如圖5所示:當(dāng)一個(gè)自主無(wú)人機(jī)智能體被指派執(zhí)行果園監(jiān)測(cè)任務(wù)時(shí),LIM可通過(guò)解析實(shí)時(shí)航拍影像,識(shí)別出患病果實(shí)[93]或受損枝條;一經(jīng)檢測(cè),系統(tǒng)即可自動(dòng)觸發(fā)預(yù)設(shè)干預(yù)協(xié)議——如通知園藝人員,或標(biāo)記位置以供定向處理——全程無(wú)需人工介入[25, 63]。該工作流典型體現(xiàn)了AI Agents在農(nóng)業(yè)環(huán)境中的自主性與反應(yīng)性,而近期文獻(xiàn)亦指出:此類基于無(wú)人機(jī)的AI Agents正日趨成熟與復(fù)雜。


      Chitra等人[94]對(duì)具身智能體所依賴的基礎(chǔ)AI算法進(jìn)行了全面綜述,著重探討了計(jì)算機(jī)視覺(jué)、同步定位與建圖(SLAM)、強(qiáng)化學(xué)習(xí)及多傳感器融合的集成應(yīng)用;上述組件共同支撐智能體在動(dòng)態(tài)環(huán)境中實(shí)現(xiàn)實(shí)時(shí)感知與自適應(yīng)導(dǎo)航。Kourav等人[95]進(jìn)一步強(qiáng)調(diào)了自然語(yǔ)言處理與LLMs在根據(jù)人類指令生成無(wú)人機(jī)行動(dòng)方案中的作用,展示了LLMs如何支持自然化交互與任務(wù)規(guī)劃。類似地,Natarajan等人[96]研究了深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)在空中機(jī)器人場(chǎng)景理解、空間建圖及多智能體協(xié)調(diào)中的應(yīng)用。這些研究共同指向一個(gè)核心結(jié)論:AI驅(qū)動(dòng)的自主性、感知能力和決策能力,是推動(dòng)無(wú)人機(jī)智能體發(fā)展的關(guān)鍵所在。

      尤為重要的是,LLMs與LIMs通常通過(guò)云平臺(tái)(如OpenAI、Hugging Face及Google Gemini)所提供的推理API進(jìn)行調(diào)用。此類服務(wù)將模型訓(xùn)練與微調(diào)的復(fù)雜性封裝隱藏,使開(kāi)發(fā)者得以快速構(gòu)建并部署具備前沿推理與感知能力的智能體。這種可集成性極大加速了原型開(kāi)發(fā)進(jìn)程,并使LangChain[97]與AutoGen[98]等智能體框架得以在任務(wù)工作流中協(xié)同調(diào)度LLM與LIM的輸出。

      簡(jiǎn)言之,基礎(chǔ)AI模型賦予現(xiàn)代AI Agents對(duì)語(yǔ)言與場(chǎng)景的基本理解能力:語(yǔ)言模型助其以文字進(jìn)行推理,圖像模型助其解讀圖像;二者協(xié)同工作,使AI Agents得以在復(fù)雜情境中作出智能決策。

      2.0.3 生成式AI作為先驅(qū)

      文獻(xiàn)中持續(xù)出現(xiàn)的一個(gè)主題是:將生成式AI定位為能動(dòng)性智能(agentic intelligence)的基礎(chǔ)性先驅(qū)。此類系統(tǒng)主要基于預(yù)訓(xùn)練的大語(yǔ)言模型(LLMs)與大圖像模型(LIMs)構(gòu)建,其優(yōu)化目標(biāo)在于根據(jù)輸入提示合成多模態(tài)內(nèi)容,包括文本、圖像、音頻或代碼。盡管生成式模型具有高度的交互性,但其本質(zhì)仍表現(xiàn)為反應(yīng)性行為:它們僅在被明確提示時(shí)才生成輸出,既不自主追求目標(biāo),也不進(jìn)行自發(fā)性推理[99, 100]。

      生成式AI的關(guān)鍵特征如下:

      • 反應(yīng)性(Reactivity):
        作為非自主系統(tǒng),生成式模型完全由輸入驅(qū)動(dòng)[101, 102]。其運(yùn)行僅由用戶指定的提示觸發(fā),缺乏內(nèi)部狀態(tài)、持久記憶或目標(biāo)追蹤機(jī)制[103–105]。

      • 多模態(tài)能力(Multi-modal Capability):
        現(xiàn)代生成式系統(tǒng)可產(chǎn)出豐富多樣的輸出,包括連貫的敘事文本、可執(zhí)行代碼、逼真圖像乃至語(yǔ)音轉(zhuǎn)錄文本。例如,GPT-4[79]、PaLM-E[106]與BLIP-2[87]等模型已展現(xiàn)出此類能力,可支持文本→圖像、圖像→文本以及跨模態(tài)合成等任務(wù)。

      • 依賴提示與無(wú)狀態(tài)性(Prompt Dependency and Statelessness):
        盡管生成式系統(tǒng)本質(zhì)上是無(wú)狀態(tài)的——即除非通過(guò)提示顯式提供上下文,否則無(wú)法在交互間保留記憶[107, 108]——但近期進(jìn)展(如GPT-4.1)已支持高達(dá)百萬(wàn)token的上下文窗口長(zhǎng)度,并憑借更強(qiáng)的長(zhǎng)文本理解能力,更有效地利用該擴(kuò)展上下文[109]。
        然而,其架構(gòu)仍缺乏內(nèi)在反饋循環(huán)[110]、狀態(tài)管理機(jī)制[111, 112],以及多步規(guī)劃能力——而后者正是實(shí)現(xiàn)自主決策與迭代式目標(biāo)優(yōu)化所必需的[113, 114]。

      盡管生成式系統(tǒng)在內(nèi)容生成的保真度上表現(xiàn)卓越,但其根本局限在于無(wú)法主動(dòng)作用于環(huán)境,或獨(dú)立操控?cái)?shù)字工具。例如,若無(wú)人工設(shè)計(jì)的封裝層(wrappers)或支撐架構(gòu)(scaffolding layers),它們無(wú)法自主執(zhí)行網(wǎng)頁(yè)搜索、解析實(shí)時(shí)數(shù)據(jù)或與API進(jìn)行交互。因此,這類系統(tǒng)尚不足以被歸類為真正的AI Agents——后者需在其架構(gòu)中整合感知、決策與外部工具調(diào)用能力,并形成閉環(huán)反饋機(jī)制。

      生成式AI在處理動(dòng)態(tài)任務(wù)、維持狀態(tài)連續(xù)性或執(zhí)行多步驟規(guī)劃等方面的不足,催生了工具增強(qiáng)型系統(tǒng),即現(xiàn)今通稱的AI Agents[115]。此類系統(tǒng)以LLM的語(yǔ)言處理能力為骨干,同時(shí)引入額外基礎(chǔ)設(shè)施——如記憶緩沖區(qū)、工具調(diào)用API、推理鏈(reasoning chains)與規(guī)劃例程(planning routines)——從而彌合“被動(dòng)響應(yīng)生成”與“主動(dòng)任務(wù)完成”之間的鴻溝。

      這一架構(gòu)演進(jìn)標(biāo)志著AI系統(tǒng)設(shè)計(jì)的關(guān)鍵性轉(zhuǎn)向:從內(nèi)容生成邁向自主任務(wù)執(zhí)行[116, 117]。從生成式系統(tǒng)到AI Agents的發(fā)展趨勢(shì),體現(xiàn)出功能層級(jí)的漸進(jìn)式疊加,最終為能動(dòng)性行為(agentic behaviors)的涌現(xiàn)奠定了基礎(chǔ)。

      2.1 語(yǔ)言模型作為AI Agent演進(jìn)的核心引擎

      AI Agent作為一種變革性范式在人工智能領(lǐng)域的興起,與大規(guī)模語(yǔ)言模型(如GPT-3[118]、Llama[119]、T5[120]、Baichuan 2[121]以及GPT3mix[122])的演進(jìn)及其功能再定位密切相關(guān)。大量且持續(xù)增長(zhǎng)的研究表明,從被動(dòng)響應(yīng)的生成式模型邁向自主、目標(biāo)導(dǎo)向型智能體的這一進(jìn)步,正是通過(guò)將LLMs作為核心推理引擎嵌入動(dòng)態(tài)能動(dòng)系統(tǒng)而實(shí)現(xiàn)的。這些模型最初為自然語(yǔ)言處理任務(wù)而訓(xùn)練,如今正被越來(lái)越多地集成于需具備自適應(yīng)規(guī)劃[123, 124]、實(shí)時(shí)決策[125, 126]及環(huán)境感知行為[127]能力的框架之中。

      2.1.1 LLMs作為核心推理組件

      諸如GPT-4[79]、PaLM[80]、Claude 3.5 Sonnet以及LLaMA[119]等大語(yǔ)言模型,均在海量文本語(yǔ)料上通過(guò)自監(jiān)督目標(biāo)進(jìn)行預(yù)訓(xùn)練,并進(jìn)一步采用監(jiān)督微調(diào)(Supervised Fine-Tuning, SFT)與基于人類反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback, RLHF)[128, 129]等技術(shù)進(jìn)行優(yōu)化。這些模型編碼了豐富的統(tǒng)計(jì)與語(yǔ)義知識(shí),使其能夠執(zhí)行推理、摘要生成、代碼生成及對(duì)話管理等任務(wù)。然而,在能動(dòng)性應(yīng)用場(chǎng)景中,其能力遠(yuǎn)不止于生成響應(yīng)——它們作為認(rèn)知引擎,可:

      • 解讀用戶目標(biāo);

      • 構(gòu)思并評(píng)估可能的行動(dòng)方案;

      • 選擇最優(yōu)策略;

      • 調(diào)用外部工具;

      • 管理復(fù)雜、多步驟的工作流。

      近期研究已明確指出,此類模型構(gòu)成了當(dāng)代能動(dòng)系統(tǒng)架構(gòu)的核心。例如,AutoGPT[38]與BabyAGI均以GPT-4同時(shí)作為規(guī)劃器與執(zhí)行器:該模型分析高層目標(biāo),將其分解為可執(zhí)行的子任務(wù),按需調(diào)用外部API,并持續(xù)監(jiān)控進(jìn)展以決定后續(xù)行動(dòng)。在此類系統(tǒng)中,LLM運(yùn)行于一個(gè)由“提示處理→狀態(tài)更新→反饋修正”構(gòu)成的循環(huán)之中,高度模擬了自主決策過(guò)程。

      2.1.2 工具增強(qiáng)型AI Agents:功能拓展

      為克服純生成式系統(tǒng)固有的局限——如幻覺(jué)(hallucination)、知識(shí)截止(static knowledge cutoff)、交互范圍受限等——研究者提出了工具增強(qiáng)型AI Agents的概念[130],代表性系統(tǒng)包括Easytool[131]、Gentopia[132]與ToolFive[133]。此類系統(tǒng)將外部工具、API及計(jì)算平臺(tái)整合進(jìn)智能體的推理流程,使其得以:

      • 實(shí)時(shí)訪問(wèn)信息;

      • 執(zhí)行代碼;

      • 與動(dòng)態(tài)數(shù)據(jù)環(huán)境進(jìn)行交互。

      2.1.3 典型實(shí)例與新興能力

      基于工具增強(qiáng)的LLM驅(qū)動(dòng)型AI Agents已在多種應(yīng)用場(chǎng)景中展現(xiàn)出顯著潛力:

      • AutoGPT [38]中,智能體可依次執(zhí)行網(wǎng)頁(yè)查詢、匯總競(jìng)品數(shù)據(jù)、提煉洞察并生成報(bào)告,從而完成產(chǎn)品市場(chǎng)分析的全流程規(guī)劃;

      • 在編程領(lǐng)域,如 GPT-Engineer 等工具將LLM驅(qū)動(dòng)的設(shè)計(jì)能力與本地代碼執(zhí)行環(huán)境相結(jié)合,通過(guò)迭代開(kāi)發(fā)生成軟件制品——包括源代碼、可執(zhí)行文件(.exe)、文檔及配置文件等[138, 139];

      • 在科研領(lǐng)域, Paper-QA [140]等系統(tǒng)利用LLM查詢向量化構(gòu)建的學(xué)術(shù)數(shù)據(jù)庫(kù),并將答案錨定于檢索到的科學(xué)文獻(xiàn)之上,以確保事實(shí)準(zhǔn)確性與可追溯性。

      上述能力為AI Agents更穩(wěn)健的行為表現(xiàn)開(kāi)辟了路徑,例如:長(zhǎng)時(shí)程規(guī)劃(long-horizon planning)、跨工具協(xié)同(cross-tool coordination)以及自適應(yīng)學(xué)習(xí)循環(huán)(adaptive learning loops)。

      然而,工具的引入亦帶來(lái)新的挑戰(zhàn),包括:協(xié)調(diào)復(fù)雜性增加、錯(cuò)誤傳播風(fēng)險(xiǎn)上升,以及上下文窗口容量限制等問(wèn)題——這些均是當(dāng)前活躍的研究方向。

      AI Agents的發(fā)展進(jìn)程與以下兩點(diǎn)密不可分:

      1. 將LLMs戰(zhàn)略性地集成作為推理引擎;

      2. 通過(guò)結(jié)構(gòu)化方式調(diào)用外部工具(如搜索引擎與API)對(duì)其進(jìn)行增強(qiáng)。

      這種協(xié)同作用將靜態(tài)的語(yǔ)言模型轉(zhuǎn)化為具備感知—規(guī)劃—行動(dòng)—適應(yīng)能力的動(dòng)態(tài)認(rèn)知智能體,從而為多智能體協(xié)作、持久記憶及可擴(kuò)展自主性等Agentic AI系統(tǒng)的核心特征奠定基礎(chǔ)。

      例如,圖6展示了一個(gè)典型用例:一個(gè)新聞查詢智能體,可執(zhí)行實(shí)時(shí)網(wǎng)絡(luò)搜索、摘要檢索到的文檔,并生成條理清晰、上下文敏感的回答。此類工作流已在基于LangChain、AutoGPT及OpenAI函數(shù)調(diào)用架構(gòu)的實(shí)際實(shí)現(xiàn)中得到驗(yàn)證。


      1. 具能動(dòng)性人工智能(Agentic AI)從AI Agent基礎(chǔ)中的興起

      盡管AI Agents在人工智能能力方面已實(shí)現(xiàn)顯著躍升——尤其在通過(guò)工具增強(qiáng)型推理實(shí)現(xiàn)狹義任務(wù)自動(dòng)化方面——近期文獻(xiàn)指出其存在明顯局限,制約了其在復(fù)雜、動(dòng)態(tài)、多步驟及/或協(xié)作性場(chǎng)景中的可擴(kuò)展性[141–143]。這些局限催生了一種更先進(jìn)的范式:具能動(dòng)性人工智能(Agentic AI)。

      這一新興系統(tǒng)類別通過(guò)結(jié)構(gòu)化通信[144–146]、共享記憶[147, 148]與動(dòng)態(tài)角色分配[22]等機(jī)制,使多個(gè)智能實(shí)體能夠協(xié)同追求共同目標(biāo),從而顯著拓展了傳統(tǒng)AI Agents的能力邊界。

      3.0.1 概念躍遷:從孤立智能體到協(xié)同系統(tǒng)

      如前文所述,AI Agents通過(guò)將大語(yǔ)言模型(LLMs)與外部工具及API集成,可執(zhí)行范圍狹窄的操作,例如響應(yīng)客戶咨詢、執(zhí)行文檔檢索或管理日程安排。然而,隨著應(yīng)用場(chǎng)景日益要求具備上下文保持能力、任務(wù)間依賴性處理能力,以及在動(dòng)態(tài)環(huán)境中的適應(yīng)性,單智能體模型已顯不足[149, 150]。

      Agentic AI系統(tǒng)代表了一類新興的智能架構(gòu):其中多個(gè)專業(yè)化智能體通過(guò)協(xié)同推理多步驟規(guī)劃,共同實(shí)現(xiàn)復(fù)雜、高階目標(biāo)[41]。依據(jù)近期提出的框架定義,此類系統(tǒng)由若干模塊化智能體組成——每個(gè)智能體負(fù)責(zé)整體目標(biāo)中的某一特定子任務(wù),并通過(guò)集中式協(xié)調(diào)器去中心化協(xié)議進(jìn)行協(xié)同[24, 145]。該結(jié)構(gòu)標(biāo)志著一種概念性轉(zhuǎn)變:從單智能體架構(gòu)中常見(jiàn)的個(gè)體化、反應(yīng)式行為,轉(zhuǎn)向一種以智能體間動(dòng)態(tài)協(xié)作為特征的系統(tǒng)級(jí)智能。

      推動(dòng)這一范式的關(guān)鍵機(jī)制之一是目標(biāo)分解(goal decomposition):由規(guī)劃型智能體自動(dòng)解析用戶指定的目標(biāo),并將其拆分為若干更小、可管理的子任務(wù)[44];隨后,這些子任務(wù)被分發(fā)至整個(gè)智能體網(wǎng)絡(luò)中。多步驟推理與規(guī)劃?rùn)C(jī)制進(jìn)一步促成子任務(wù)的動(dòng)態(tài)排序,使系統(tǒng)能在環(huán)境變化或部分任務(wù)失敗時(shí)實(shí)時(shí)調(diào)整策略。此類能動(dòng)架構(gòu)確保了即便在不確定性條件下,任務(wù)執(zhí)行仍具備穩(wěn)健性[22]。

      智能體間的通信通過(guò)分布式通信渠道實(shí)現(xiàn),例如異步消息隊(duì)列、共享記憶緩沖區(qū)或中間輸出交換等,從而實(shí)現(xiàn)在無(wú)需持續(xù)中央監(jiān)管的前提下完成協(xié)調(diào)[22, 151]。此外,反思式推理(reflective reasoning)與記憶系統(tǒng)使智能體得以跨多次交互存儲(chǔ)上下文、評(píng)估過(guò)往決策,并迭代優(yōu)化其策略[152]。綜合而言,這些能力使Agentic AI系統(tǒng)展現(xiàn)出靈活、自適應(yīng)、合作性與協(xié)同性的智能,遠(yuǎn)超單個(gè)智能體的運(yùn)作極限。

      文獻(xiàn)中廣泛采用的一個(gè)被普遍接受的概念性示意圖,借由智能家居系統(tǒng)的類比清晰界定了AI Agents與Agentic AI之間的區(qū)別。如圖7所示:


      • 左側(cè)代表以智能恒溫器形式存在的傳統(tǒng)AI Agent:該獨(dú)立智能體接收用戶設(shè)定的目標(biāo)溫度后,自主控制供暖或制冷系統(tǒng)以維持設(shè)定值。盡管它具備有限自主性(例如學(xué)習(xí)用戶作息規(guī)律,或在住戶離開(kāi)時(shí)降低能耗),但其運(yùn)作完全孤立——僅執(zhí)行單一、明確定義的任務(wù),不參與更廣泛的環(huán)境協(xié)調(diào)或目標(biāo)推斷[25, 63]。

      • 右側(cè)則展示了嵌入于綜合性智能家居生態(tài)中的Agentic AI系統(tǒng):在此系統(tǒng)中,多個(gè)專業(yè)化智能體協(xié)同工作,共同管理天氣預(yù)報(bào)、日程安排、電價(jià)優(yōu)化、安防監(jiān)控及備用電源激活等多樣化功能。這些智能體不僅是被動(dòng)響應(yīng)模塊,更能動(dòng)態(tài)通信、共享記憶狀態(tài),并協(xié)同調(diào)控行動(dòng),以達(dá)成高層系統(tǒng)目標(biāo)(例如實(shí)時(shí)優(yōu)化舒適性、安全性與能效)。
        例如,天氣預(yù)報(bào)智能體可預(yù)警即將到來(lái)的熱浪,促使能源管理智能體提前協(xié)調(diào),在電價(jià)高峰前利用太陽(yáng)能進(jìn)行預(yù)制冷;與此同時(shí),系統(tǒng)還可根據(jù)住戶是否在場(chǎng),動(dòng)態(tài)推遲高能耗任務(wù)或激活安防監(jiān)控——實(shí)現(xiàn)跨領(lǐng)域決策融合。

      該圖例生動(dòng)體現(xiàn)了從“任務(wù)特定型自動(dòng)化”到“自適應(yīng)、協(xié)同式智能”的架構(gòu)與功能性飛躍:

      • AI Agent僅作為確定性、功能受限的單一組件;

      • Agentic AI則體現(xiàn)為分布式智能,其核心特征包括 目標(biāo)分解智能體間通信上下文自適應(yīng)能力 ,代表了現(xiàn)代能動(dòng)性AI框架的關(guān)鍵特質(zhì)。

      3.0.2 AI Agents 與 Agentic AI 的關(guān)鍵區(qū)別

      為系統(tǒng)性地刻畫從生成式 AIAI Agents,再進(jìn)一步演進(jìn)至 Agentic AI 的發(fā)展脈絡(luò),我們圍繞一個(gè)基礎(chǔ)性分類體系構(gòu)建了比較分析框架——其中,生成式 AI 作為基準(zhǔn)參照點(diǎn)。盡管 AI Agents 與 Agentic AI 系統(tǒng)代表著日益自主化與交互化的系統(tǒng)形態(tài),二者均以生成式架構(gòu)(尤其是 LLMs 與 LIMs)為根基。因此,本小節(jié)中每一張對(duì)比表格均將生成式 AI設(shè)為參考列,以凸顯能動(dòng)行為如何既建立于超越生成式 AI 的基礎(chǔ)能力。

      AI Agents 與 Agentic AI 系統(tǒng)之間的一組基本區(qū)別——尤其在作用范圍(scope)、自主性(autonomy)、架構(gòu)組成(architectural composition)、協(xié)調(diào)策略(coordination strategy)與操作復(fù)雜性(operational complexity)等方面——已綜合提煉于表 1表 10中(后者源于對(duì) AutoGen[98]與 ChatDev[153]等主流框架的深入分析)。該對(duì)比提供了多維度視角,揭示單智能體系統(tǒng)如何逐步過(guò)渡為協(xié)同式多智能體生態(tài)系統(tǒng)。借助生成能力這一視角,我們得以追蹤規(guī)劃通信適應(yīng)性等維度上日益提升的復(fù)雜性,這些正是向 Agentic AI 系統(tǒng)演進(jìn)的核心特征。


      盡管表 1 勾勒出 AI Agents 與 Agentic AI 系統(tǒng)在基礎(chǔ)與操作層面的差異,要深入理解這些范式如何從更廣泛的生成式 AI 框架中衍生并相互關(guān)聯(lián),仍需一個(gè)更精細(xì)的分類體系。具體而言,從靜態(tài)生成式 AI 系統(tǒng) → 工具增強(qiáng)型 AI Agents → 協(xié)同式 Agentic AI 生態(tài)系統(tǒng)的概念性與認(rèn)知性演進(jìn)路徑,亟需一個(gè)整合性比較框架。這一轉(zhuǎn)變不僅體現(xiàn)在結(jié)構(gòu)層面,更反映在功能層面——涵蓋啟動(dòng)機(jī)制記憶使用方式學(xué)習(xí)能力編排策略如何在整個(gè)能動(dòng)譜系中逐步演化。此外,近期研究指出“生成式智能體(Generative Agents)”等混合范式的出現(xiàn)——此類系統(tǒng)融合生成建模與模塊化任務(wù)專業(yè)化——進(jìn)一步復(fù)雜化了 Agentic AI 的格局。為捕捉這些精細(xì)關(guān)聯(lián),表 2 綜合了四大原型在關(guān)鍵概念與認(rèn)知維度上的對(duì)比:


      • 生成式 AI

      • AI Agents

      • Agentic AI 系統(tǒng)

      • 推斷所得的“生成式智能體”

      通過(guò)將生成式 AI 設(shè)為基線技術(shù),該分類凸顯了一條從被動(dòng)內(nèi)容生成交互式任務(wù)執(zhí)行自主多智能體協(xié)同的科學(xué)、結(jié)構(gòu)與應(yīng)用連續(xù)譜。這一多層次視角,對(duì)理解能動(dòng)性智能在理論與應(yīng)用領(lǐng)域的當(dāng)前能力與未來(lái)趨勢(shì)至關(guān)重要。

      為使表 1 中所述區(qū)別更具可操作性,表 2表 3 進(jìn)一步拓展了對(duì)各類智能體范式的比較,涵蓋更廣泛的譜系(包括 AI Agents 與 Agentic AI)。


      • 表 3

        呈現(xiàn)了各范式在 核心能力規(guī)劃范圍交互風(fēng)格學(xué)習(xí)動(dòng)態(tài)評(píng)估標(biāo)準(zhǔn) 等方面的關(guān)鍵架構(gòu)與行為屬性差異。
        如表所示:

        • AI Agents 針對(duì) 離散任務(wù)執(zhí)行 優(yōu)化,規(guī)劃視野有限,依賴監(jiān)督式或基于規(guī)則的學(xué)習(xí)機(jī)制;

        • Agentic AI 系統(tǒng)則通過(guò) 多步驟規(guī)劃元學(xué)習(xí) (meta-learning)與 智能體間通信 擴(kuò)展了這一能力,使其適用于需 自主目標(biāo)設(shè)定協(xié)同 的復(fù)雜環(huán)境;

        • “生成式智能體”作為較新概念,繼承以 LLM 為中心的預(yù)訓(xùn)練能力,在多模態(tài)內(nèi)容生成方面表現(xiàn)卓越,但尚缺乏 Agentic AI 系統(tǒng)所具備的 主動(dòng)編排能力狀態(tài)持久性行為

      第二張表(表 3) 從過(guò)程驅(qū)動(dòng)視角,對(duì)三類智能體(生成式 AI、AI Agents、Agentic AI)進(jìn)行比較。該框架強(qiáng)調(diào):功能流水線如何從生成式 AI 中的提示驅(qū)動(dòng)單模型推理,演進(jìn)為 AI Agents 的工具增強(qiáng)型執(zhí)行,最終發(fā)展為 Agentic AI 中的協(xié)同智能體網(wǎng)絡(luò)

      • “結(jié)構(gòu)”一欄清晰呈現(xiàn)此演進(jìn):從單一 LLM → 集成化工具鏈 → 分布式多智能體系統(tǒng);

      • 對(duì) 外部數(shù)據(jù)的訪問(wèn)能力 (現(xiàn)實(shí)應(yīng)用的關(guān)鍵操作需求)亦隨層級(jí)提升而日趨成熟:生成式 AI 中缺失或可選 → AI Agents 中模塊化支持 → Agentic AI 中實(shí)現(xiàn)協(xié)調(diào)化整合。

      綜上,這些對(duì)比視角共同印證:從生成式到能動(dòng)性范式的演進(jìn),不僅體現(xiàn)為系統(tǒng)復(fù)雜性的增加,更在于自主性記憶決策能力在多重抽象層級(jí)上的深度融合(參見(jiàn)表 4)。




      為進(jìn)一步深化對(duì)演進(jìn)中能動(dòng)格局的多維理解,表 5 至表 9 圍繞五個(gè)關(guān)鍵維度展開(kāi)拓展性比較:

      1. 核心功能與目標(biāo)對(duì)齊性

      2. 架構(gòu)組成

      3. 運(yùn)作機(jī)制

      4. 作用范圍與復(fù)雜性

      5. 交互–自主性動(dòng)態(tài)關(guān)系

      這些維度不僅強(qiáng)化了生成式 AI、AI Agents 與 Agentic AI 之間的結(jié)構(gòu)性差異(如表 4 所述),還引入了一類新興范疇——“生成式智能體”,即專為在更廣泛工作流中嵌入子任務(wù)層級(jí)生成而設(shè)計(jì)的模塊化智能體[154]。此類智能體通過(guò)緊密集成語(yǔ)言模型、記憶系統(tǒng)與行為規(guī)劃模塊,模擬類人行為,從而在典型的封閉世界環(huán)境中實(shí)現(xiàn)可信且自主的運(yùn)作。

      • 表 5 從總體目標(biāo)與功能意圖層面定位三類范式:

        • 生成式 AI 聚焦于 提示驅(qū)動(dòng)的內(nèi)容生成

        • AI Agents 強(qiáng)調(diào) 基于工具的任務(wù)執(zhí)行

        • Agentic AI 系統(tǒng)則負(fù)責(zé) 完整工作流的協(xié)同編排 ——標(biāo)志著 AI 自主性的一次關(guān)鍵躍升。

      • 表 6 從架構(gòu)層面映射該功能擴(kuò)展:系統(tǒng)設(shè)計(jì)從生成式 AI 的單模型依賴,逐步演進(jìn)至 Agentic AI 的多智能體協(xié)同共享記憶利用

      • 表 7 則梳理各范式在工作流執(zhí)行路徑上的差異,突出智能體間協(xié)調(diào)層級(jí)化通信作為能動(dòng)行為的核心驅(qū)動(dòng)因素。

      • 表 8 進(jìn)一步考察各系統(tǒng)所能處理的任務(wù)多樣性、時(shí)間尺度與運(yùn)行魯棒性——范圍從孤立內(nèi)容生成,延伸至動(dòng)態(tài)環(huán)境中的自適應(yīng)多智能體協(xié)作。在此維度上,Agentic AI 顯現(xiàn)出獨(dú)特能力,可支撐需自適應(yīng)、多階段推理與執(zhí)行策略的高復(fù)雜度目標(biāo)。

      • 表 9 綜合各范式在自主性程度交互風(fēng)格決策粒度上的差異。這些表格共同構(gòu)建了一套嚴(yán)謹(jǐn)框架,用于分類與分析基于智能體的 AI 系統(tǒng),為理論驅(qū)動(dòng)的評(píng)估及未來(lái)面向大規(guī)模應(yīng)用的自主、智能、協(xié)作型智能體的設(shè)計(jì)奠定基礎(chǔ)。

      表 5 至表 9 提供了對(duì)生成式 AI、AI Agents 與 Agentic AI 的分層比較分析,以操作性與架構(gòu)性特征為錨點(diǎn)確立該分類體系。

      • 表 5 突出核心區(qū)別:生成式 AI 生成反應(yīng)式內(nèi)容;AI Agents 執(zhí)行工具輔助型任務(wù);Agentic AI 則協(xié)調(diào)子智能體完成高層工作流執(zhí)行——標(biāo)志 AI 自主性的關(guān)鍵轉(zhuǎn)折。

      • 表 6 明確架構(gòu)差異,尤重系統(tǒng)組成與控制邏輯:

        • 生成式 AI 依賴單一模型,無(wú)內(nèi)置工具調(diào)用或任務(wù)委派能力;

        • AI Agents 將語(yǔ)言模型與輔助 API 及接口機(jī)制結(jié)合,以增強(qiáng)功能;

        • Agentic AI 更進(jìn)一步引入多智能體系統(tǒng),將 協(xié)作記憶持久化編排協(xié)議 置于系統(tǒng)運(yùn)作核心——此一拓展對(duì)實(shí)現(xiàn) 智能任務(wù)委派上下文保持動(dòng)態(tài)角色分配 能力至關(guān)重要,而這些能力在生成式系統(tǒng)與單智能體系統(tǒng)中均告缺失。

      • 表 7 呈現(xiàn)系統(tǒng)功能與運(yùn)作差異,強(qiáng)調(diào)執(zhí)行邏輯與信息流的區(qū)別:

        • 生成式 AI 采用線性流水線(提示 → 輸出);

        • AI Agents 引入過(guò)程內(nèi)工具響應(yīng)整合的程序化機(jī)制;

        • Agentic AI 則引入 遞歸式任務(wù)重分配跨智能體消息傳遞 ,從而促成僅靠靜態(tài) LLM 輸出無(wú)法實(shí)現(xiàn)的 涌現(xiàn)式?jīng)Q策

      • 表 8 通過(guò)映射各系統(tǒng)在任務(wù)多樣性、時(shí)間尺度與運(yùn)行魯棒性方面的承載能力,進(jìn)一步強(qiáng)化上述區(qū)別——Agentic AI 在需自適應(yīng)、多階段推理與執(zhí)行的高復(fù)雜度目標(biāo)支持上獨(dú)樹(shù)一幟。

      最后,表 9 聚焦生成式 AI、AI Agents 與 Agentic AI 在操作與行為層面的區(qū)別,尤其關(guān)注自主性層級(jí)交互風(fēng)格智能體間協(xié)調(diào)

      • 生成式 AI 模型(如 GPT-3[118]、DALL·E 3)仍屬 反應(yīng)式 :僅依提示生成內(nèi)容,無(wú)持久狀態(tài)維持或迭代推理能力;

      • AI Agents(如基于 LangChain[97]或 MetaGPT[155]構(gòu)建者)展現(xiàn)出更高自主性:可在限定任務(wù)內(nèi)主動(dòng)發(fā)起外部工具調(diào)用并調(diào)整行為;

      • 然而,其自主性通常局限于 孤立任務(wù)執(zhí)行 ,缺乏 長(zhǎng)期狀態(tài)連續(xù)性協(xié)作式交互 能力。

      Agentic AI 系統(tǒng)通過(guò)引入內(nèi)部編排機(jī)制多智能體協(xié)作框架,顯著區(qū)別于前述范式。例如,AutoGen[98]與 ChatDev[153]等平臺(tái)便通過(guò)任務(wù)分解角色分配遞歸式反饋循環(huán),典型地體現(xiàn)了能動(dòng)性協(xié)同機(jī)制。在 AutoGen 中,一個(gè)智能體可擔(dān)任規(guī)劃者,另一智能體負(fù)責(zé)信息檢索,第三個(gè)智能體則進(jìn)行報(bào)告綜合;各智能體通過(guò)共享記憶緩沖區(qū)相互通信,并由一個(gè)協(xié)調(diào)者智能體(orchestrator agent)統(tǒng)一監(jiān)管任務(wù)依賴關(guān)系與整體進(jìn)展。此類結(jié)構(gòu)化協(xié)同機(jī)制,使得系統(tǒng)能夠在動(dòng)態(tài)環(huán)境中實(shí)現(xiàn)更復(fù)雜的目標(biāo)追求與更靈活的行為響應(yīng)。

      此類架構(gòu)從根本上將智能的焦點(diǎn),從基于單一模型的輸出,轉(zhuǎn)向系統(tǒng)層級(jí)的行為——在該層級(jí)中,智能體可根據(jù)不斷演化的任務(wù)狀態(tài)進(jìn)行學(xué)習(xí)、適應(yīng)與決策更新。因此,本比較性分類體系不僅凸顯了操作獨(dú)立性層級(jí)的持續(xù)提升,更闡明了 Agentic AI 如何引入新型通信范式記憶整合機(jī)制去中心化控制模式,從而為下一代具備可擴(kuò)展性自適應(yīng)性智能的自主系統(tǒng)鋪平道路。

      3.1 架構(gòu)演進(jìn):從 AI Agents 到 Agentic AI 系統(tǒng)

      盡管 AI Agents 與 Agentic AI 系統(tǒng)均采用模塊化設(shè)計(jì)原則,Agentic AI 顯著拓展了基礎(chǔ)架構(gòu),以支持更復(fù)雜、分布式與自適應(yīng)的行為。如圖 8 所示,該演進(jìn)始于構(gòu)成傳統(tǒng) AI Agents 的核心子系統(tǒng)——感知(Perception)、推理(Reasoning)與行動(dòng)(Action);而 Agentic AI 在此基礎(chǔ)上進(jìn)一步集成了若干高級(jí)組件,包括:專業(yè)化智能體(Specialized Agents)、高級(jí)推理與規(guī)劃(Advanced Reasoning & Planning)、持久記憶(Persistent Memory)以及編排機(jī)制(Orchestration)。圖中還以虛線框突出強(qiáng)調(diào)了若干涌現(xiàn)能力——多智能體協(xié)作(Multi-Agent Collaboration)、系統(tǒng)級(jí)協(xié)調(diào)(System Coordination)、共享上下文(Shared Context)與任務(wù)分解(Task Decomposition)——該虛線框表征了系統(tǒng)架構(gòu)向主動(dòng)性去中心化目標(biāo)驅(qū)動(dòng)范式的根本性轉(zhuǎn)變。如前所述,這一演進(jìn)標(biāo)志著智能體設(shè)計(jì)的關(guān)鍵拐點(diǎn)。本節(jié)綜合了 LangChain[97]、AutoGPT[98]與 TaskMatrix[156]等實(shí)證框架的研究成果,系統(tǒng)梳理了架構(gòu)復(fù)雜性的進(jìn)階歷程。


      3.1.1 AI Agents 的核心架構(gòu)組件

      基礎(chǔ)型 AI Agents 通常由四個(gè)主要子系統(tǒng)構(gòu)成:感知推理行動(dòng)學(xué)習(xí)。這些子系統(tǒng)形成一個(gè)閉環(huán)操作周期:

      • 從用戶界面視角,常被稱為“理解—思考—行動(dòng)—學(xué)習(xí)”(Understand, Think, Act, Learn);

      • 在系統(tǒng)設(shè)計(jì)文獻(xiàn)中,則表述為“輸入—處理—行動(dòng)—學(xué)習(xí)”(Input, Processing, Action, Learning)[22, 157]。

      • 感知模塊(Perception Module):
        該子系統(tǒng)接收來(lái)自用戶(如自然語(yǔ)言提示)或外部系統(tǒng)(如 API、文件上傳、傳感器數(shù)據(jù)流)的輸入信號(hào),并執(zhí)行數(shù)據(jù)預(yù)處理,將其轉(zhuǎn)換為推理模塊可解析的格式。
        例如,在基于 LangChain 的智能體中[97, 158],感知層負(fù)責(zé)提示模板構(gòu)建、上下文封裝,以及通過(guò)文檔分塊與嵌入式檢索實(shí)現(xiàn)的檢索增強(qiáng)。

      • 知識(shí)表示與推理模塊(Knowledge Representation and Reasoning, KRR Module):
        作為智能體智能的核心,KRR 模塊對(duì)輸入數(shù)據(jù)施加符號(hào)化、統(tǒng)計(jì)性或混合式邏輯。其技術(shù)包括:

        • 基于規(guī)則的邏輯(如 if-then 決策樹(shù));

        • 確定性工作流引擎;

        • 簡(jiǎn)易規(guī)劃圖(planning graphs)。
          在 AutoGPT[38]等智能體中,推理能力通過(guò) 函數(shù)調(diào)用提示鏈 (prompt chaining)得以增強(qiáng),從而模擬思維過(guò)程——例如采用“逐步推理”(step-by-step)型提示,或插入中間工具調(diào)用環(huán)節(jié)。

      • 行動(dòng)選擇與執(zhí)行模塊(Action Selection and Execution Module):
        該模塊將推斷出的知識(shí)與決策轉(zhuǎn)化為外部行動(dòng),借助一個(gè)“行動(dòng)庫(kù)”(action library)實(shí)現(xiàn)。這些行動(dòng)可能包括:發(fā)送消息、更新數(shù)據(jù)庫(kù)、調(diào)用 API,或生成結(jié)構(gòu)化輸出。執(zhí)行過(guò)程通常由中間件管理——例如 LangChain 的“代理執(zhí)行器”(agent executor),它將大語(yǔ)言模型(LLM)的輸出鏈接至工具調(diào)用,并觀察響應(yīng)以指導(dǎo)后續(xù)步驟[97]。

      • 基礎(chǔ)學(xué)習(xí)與適應(yīng)機(jī)制(Basic Learning and Adaptation):
        傳統(tǒng) AI Agents 具備有限的學(xué)習(xí)機(jī)制,例如啟發(fā)式參數(shù)調(diào)整[159, 160]或基于歷史記錄的上下文保留。舉例而言,智能體可利用簡(jiǎn)單的記憶緩沖區(qū)回溯先前的用戶輸入,或應(yīng)用評(píng)分機(jī)制以在未來(lái)迭代中優(yōu)化工具選擇。

      對(duì)這些智能體的定制化通常涉及領(lǐng)域特定的提示工程、規(guī)則注入或工作流模板,使其區(qū)別于硬編碼自動(dòng)化腳本——關(guān)鍵在于它們具備做出上下文感知型決策的能力。ReAct 等系統(tǒng)[136]正是此類架構(gòu)的典范:它在一個(gè)迭代框架中融合推理與行動(dòng),使智能體在選擇外部行動(dòng)前先模擬內(nèi)部對(duì)話。

      3.1.2 Agentic AI 中的架構(gòu)增強(qiáng)

      如前所述,Agentic AI 系統(tǒng)繼承了 AI Agents 的模塊化特性,但進(jìn)一步拓展其架構(gòu),以支持分布式智能智能體間通信迭代式規(guī)劃。文獻(xiàn)中記載了若干關(guān)鍵性架構(gòu)增強(qiáng),它們使 Agentic AI 顯著區(qū)別于其前身,并賦予其高度的靈活性與適應(yīng)性[161, 162]:

      • 專業(yè)化智能體集群(Ensemble of Specialized Agents):與作為單一整體單元運(yùn)作不同,Agentic AI 系統(tǒng)由多個(gè)智能體組成,每個(gè)智能體被賦予特定職能或任務(wù)(例如:摘要生成者、信息檢索者或規(guī)劃者)。這些智能體通過(guò)通信渠道(如消息隊(duì)列、黑板系統(tǒng)或共享內(nèi)存)相互交互。例如,MetaGPT[155]便突出體現(xiàn)了這一方法——它將智能體建模為公司各部門(如 CEO、CTO、工程師),其角色具有模塊化可復(fù)用性角色綁定性(role-bound)。此處“角色綁定”意指:每個(gè)智能體的行為與職責(zé)嚴(yán)格由其被分配的角色定義,其行動(dòng)范圍被限制于該特定功能領(lǐng)域之內(nèi)。

      • 高級(jí)推理與規(guī)劃能力(Advanced Reasoning and Planning):Agentic 系統(tǒng)通過(guò) ReAct[136]、思維鏈(Chain-of-Thought, CoT)提示[163]與“思維樹(shù)”(Tree of Thoughts)[164]等框架,嵌入迭代式推理能力。這些機(jī)制使智能體能夠?qū)?fù)雜任務(wù)分解為多個(gè)推理階段,評(píng)估中間結(jié)果,并動(dòng)態(tài)重規(guī)劃行動(dòng)——從而實(shí)現(xiàn)對(duì)不確定性或部分失敗的自適應(yīng)響應(yīng)

      • 持久記憶架構(gòu)(Persistent Memory Architectures):與傳統(tǒng)智能體不同,Agentic AI 集成了記憶子系統(tǒng),可在任務(wù)周期或智能體會(huì)話之間保存并持久化知識(shí)[165, 166]。記憶類型包括:

        • 情景記憶

      (episodic memory):任務(wù)特定的歷史記錄[167, 168];

      • 語(yǔ)義記憶

        (semantic memory):長(zhǎng)期事實(shí)或結(jié)構(gòu)化數(shù)據(jù)[169, 170];

      • 基于向量的記憶

        :服務(wù)于檢索增強(qiáng)生成(RAG)[171, 172]。例如,AutoGen[98]中的智能體維護(hù)“草稿板”(scratchpads)用于存儲(chǔ)中間計(jì)算結(jié)果,從而支持分步式任務(wù)推進(jìn)。

      • 編排層/元智能體(Orchestration Layers / Meta-Agents):Agentic AI 的一項(xiàng)關(guān)鍵創(chuàng)新是引入編排器——即元智能體(meta-agents),用于協(xié)調(diào)下屬智能體的生命周期、管理依賴關(guān)系、分配角色并解決沖突。編排器常包括任務(wù)管理者、評(píng)估者或協(xié)調(diào)員(moderators)。例如,在 ChatDev[153]中,一個(gè)虛擬的 CEO 元智能體將子任務(wù)分派給各部門智能體,并將其輸出整合為統(tǒng)一的戰(zhàn)略性響應(yīng)。

      這些增強(qiáng)共同使 Agentic AI 能夠支持需持續(xù)上下文保持分布式任務(wù)分工多模態(tài)協(xié)同策略性自適應(yīng)的場(chǎng)景。應(yīng)用案例涵蓋:

      • 協(xié)同完成文獻(xiàn)檢索、摘要與文稿撰寫的科研助手(如 AutoGen 工作流[98]);

      • 并行監(jiān)控物流、供應(yīng)商績(jī)效與動(dòng)態(tài)定價(jià)模型的智能供應(yīng)鏈智能體。

      從孤立的“感知—推理—行動(dòng)”閉環(huán),向協(xié)作式、自評(píng)估的多智能體工作流的轉(zhuǎn)變,標(biāo)志著智能系統(tǒng)架構(gòu)設(shè)計(jì)的關(guān)鍵轉(zhuǎn)折點(diǎn)——它使智能體不僅能“行動(dòng)”,更能“反思”、“學(xué)習(xí)”與“持續(xù)改進(jìn)”[173]。這一演進(jìn)將 Agentic AI 定位為下一代 AI 基礎(chǔ)設(shè)施:其能力不僅限于執(zhí)行預(yù)定義工作流,更可自主構(gòu)建、修訂與管理跨智能體的復(fù)雜目標(biāo),且?guī)缀鯚o(wú)需人工干預(yù)。

      1. AI Agents 與 Agentic AI 的應(yīng)用

      為闡明 AI Agents 與 Agentic AI 系統(tǒng)在現(xiàn)實(shí)世界中的實(shí)用價(jià)值及其操作層面的差異,本研究綜合了近期文獻(xiàn)中的一系列應(yīng)用案例(如圖9所示)。我們系統(tǒng)性地將這些應(yīng)用領(lǐng)域劃分為兩條平行路徑:傳統(tǒng)AI Agent系統(tǒng)及其更先進(jìn)的Agentic AI對(duì)應(yīng)系統(tǒng)。對(duì)于AI Agents,本文回顧了四個(gè)主要用例:


      (1) 客戶服務(wù)自動(dòng)化與企業(yè)內(nèi)部搜索——單智能體模型處理結(jié)構(gòu)化查詢并生成響應(yīng);
      (2) 郵件過(guò)濾與優(yōu)先級(jí)排序——智能體通過(guò)分類啟發(fā)式方法協(xié)助用戶管理高流量通信;
      (3) 個(gè)性化內(nèi)容推薦與基礎(chǔ)數(shù)據(jù)報(bào)告——分析用戶行為以生成自動(dòng)化洞察;
      (4) 自主日程助手——解析日歷信息并在極小用戶輸入下安排任務(wù)。

      相比之下,Agentic AI 的應(yīng)用場(chǎng)景涵蓋更廣泛、更具動(dòng)態(tài)性的能力,同樣被歸納為四類進(jìn)行評(píng)述與討論:
      (1) 多智能體科研助手——協(xié)同檢索、綜合并起草科學(xué)內(nèi)容;
      (2) 智能機(jī)器人協(xié)調(diào)——包括農(nóng)業(yè)與物流領(lǐng)域的無(wú)人機(jī)及多機(jī)器人系統(tǒng);
      (3) 協(xié)作式醫(yī)療決策支持——涉及診斷、治療與監(jiān)測(cè)子系統(tǒng);
      (4) 多智能體游戲AI與自適應(yīng)工作流自動(dòng)化——去中心化智能體進(jìn)行策略性互動(dòng)或處理復(fù)雜任務(wù)流水線。

      4.0.1 AI Agents 的應(yīng)用

      1. 客戶服務(wù)自動(dòng)化與企業(yè)內(nèi)部搜索:AI Agents 在企業(yè)環(huán)境中被廣泛用于自動(dòng)化客戶服務(wù)及促進(jìn)內(nèi)部知識(shí)檢索。在客戶服務(wù)場(chǎng)景中,這些智能體利用檢索增強(qiáng)型大語(yǔ)言模型,對(duì)接API與組織知識(shí)庫(kù),以回答用戶查詢、分類工單,并執(zhí)行諸如訂單追蹤或退貨發(fā)起等操作[52]。在企業(yè)內(nèi)部搜索方面,基于向量存儲(chǔ)(如 Pinecone、Elasticsearch)構(gòu)建的智能體可針對(duì)自然語(yǔ)言查詢返回語(yǔ)義相關(guān)的文檔。Salesforce Einstein、Intercom Fin 及 Notion AI 等工具展示了結(jié)構(gòu)化輸入處理與摘要生成能力如何降低工作負(fù)載并提升企業(yè)決策效率。

      一個(gè)實(shí)際示例(圖10a)展現(xiàn)了這一雙重功能:某跨國(guó)電商公司部署了一套基于AI Agent的客戶服務(wù)與內(nèi)部搜索助手。在客戶服務(wù)方面,該AI Agent集成公司的客戶關(guān)系管理系統(tǒng)(CRM,如 Salesforce)與履約API,可解決諸如“我的訂單在哪?”或“我該如何退貨?”等問(wèn)題。在毫秒級(jí)內(nèi),智能體從運(yùn)輸數(shù)據(jù)庫(kù)與政策庫(kù)中提取上下文數(shù)據(jù),并借助檢索增強(qiáng)生成技術(shù)輸出個(gè)性化回復(fù)。在內(nèi)部企業(yè)搜索方面,員工可通過(guò)同一系統(tǒng)查詢過(guò)往會(huì)議紀(jì)要、銷售演示文稿或法律文件。當(dāng)HR經(jīng)理輸入“總結(jié)去年政策變更的關(guān)鍵福利”時(shí),智能體查詢嵌入企業(yè)文檔的Pinecone向量庫(kù),按語(yǔ)義相似度對(duì)結(jié)果排序,并返回簡(jiǎn)潔摘要及來(lái)源鏈接。這些能力不僅減少了工單量與支持成本,也最大限度縮短了查找制度性知識(shí)(如政策、流程或手冊(cè))所耗費(fèi)的時(shí)間。最終形成一套統(tǒng)一、響應(yīng)迅速的系統(tǒng),借助模塊化AI Agent架構(gòu)同時(shí)提升對(duì)外服務(wù)交付效率與對(duì)內(nèi)運(yùn)營(yíng)效能。


      1. 郵件過(guò)濾與優(yōu)先級(jí)排序:作為重要的生產(chǎn)力工具之一,AI Agents 通過(guò)內(nèi)容分類與優(yōu)先級(jí)劃分實(shí)現(xiàn)郵件分揀自動(dòng)化。它們與 Microsoft Outlook 和 Superhuman 等系統(tǒng)集成,分析元數(shù)據(jù)與郵件語(yǔ)義,檢測(cè)緊急程度、提取待辦事項(xiàng)并推薦回復(fù)。智能體應(yīng)用用戶定制的過(guò)濾規(guī)則、行為信號(hào)與意圖分類,減輕認(rèn)知負(fù)擔(dān)。自動(dòng)標(biāo)簽標(biāo)注或?qū)υ捑€程摘要等自主行為提升效率,而內(nèi)置反饋循環(huán)則通過(guò)漸進(jìn)學(xué)習(xí)實(shí)現(xiàn)個(gè)性化[64]。

      圖10b 展示了AI Agent在郵件過(guò)濾與優(yōu)先級(jí)排序領(lǐng)域的實(shí)際應(yīng)用。在現(xiàn)代職場(chǎng)環(huán)境中,用戶常被海量郵件淹沒(méi),導(dǎo)致認(rèn)知過(guò)載與關(guān)鍵通訊遺漏。嵌入于 Microsoft Outlook 或 Superhuman 等平臺(tái)的AI Agent扮演智能中介角色,對(duì)傳入郵件進(jìn)行分類、聚類與分揀。這些智能體評(píng)估發(fā)件人、主題行等元數(shù)據(jù)及語(yǔ)義內(nèi)容,識(shí)別緊急程度、提取可執(zhí)行項(xiàng)并建議智能回復(fù)。如圖所示,AI Agent 自動(dòng)將郵件歸類為“緊急”、“需跟進(jìn)”或“低優(yōu)先級(jí)”等標(biāo)簽,同時(shí)提供情境感知摘要與回復(fù)草稿。通過(guò)持續(xù)反饋循環(huán)與使用模式學(xué)習(xí),系統(tǒng)逐步適應(yīng)用戶偏好,優(yōu)化分類閾值并提升優(yōu)先級(jí)判斷準(zhǔn)確率。這種自動(dòng)化機(jī)制卸載了決策疲勞,使用戶能專注于高價(jià)值任務(wù),同時(shí)在快節(jié)奏、信息密集的環(huán)境中維持高效溝通管理。

      1. 個(gè)性化內(nèi)容推薦與基礎(chǔ)數(shù)據(jù)報(bào)告:AI Agents 通過(guò)分析行為模式支持新聞、產(chǎn)品或媒體的自適應(yīng)個(gè)性化推薦。Amazon、YouTube 和 Spotify 等平臺(tái)部署此類智能體,借助協(xié)同過(guò)濾、意圖檢測(cè)與內(nèi)容排序推斷用戶偏好。同時(shí),分析系統(tǒng)中的AI Agents(如 Tableau Pulse、Power BI Copilot)支持自然語(yǔ)言數(shù)據(jù)查詢與自動(dòng)化報(bào)告生成,將提示轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)庫(kù)查詢與可視化摘要,從而普及商業(yè)智能訪問(wèn)權(quán)限。

      一個(gè)實(shí)際示例(圖10c)展示了AI Agent在個(gè)性化內(nèi)容推薦與基礎(chǔ)數(shù)據(jù)報(bào)告中的應(yīng)用,可見(jiàn)于電商與企業(yè)分析系統(tǒng)。考慮部署于 Amazon 等零售平臺(tái)上的AI Agent:隨著用戶瀏覽、點(diǎn)擊與購(gòu)買商品,智能體持續(xù)監(jiān)控交互模式(如停留時(shí)間、搜索詞與購(gòu)買序列),借助協(xié)同過(guò)濾與內(nèi)容排序算法推斷用戶意圖,并動(dòng)態(tài)生成隨時(shí)間演化的個(gè)性化商品推薦。例如,用戶購(gòu)買園藝工具后,可能被推薦兼容的土壤傳感器或相關(guān)書籍。此層級(jí)的個(gè)性化顯著提升用戶參與度、轉(zhuǎn)化率與長(zhǎng)期留存率。與此同時(shí),在企業(yè)場(chǎng)景中,集成于 Power BI Copilot 的AI Agent允許非技術(shù)人員通過(guò)自然語(yǔ)言請(qǐng)求洞察,例如“比較東北地區(qū)第三季度與第四季度的銷售額”。智能體將提示翻譯為結(jié)構(gòu)化SQL查詢,從數(shù)據(jù)庫(kù)提取模式,并輸出簡(jiǎn)潔的可視化摘要或敘述性報(bào)告。此應(yīng)用降低了對(duì)數(shù)據(jù)分析師的依賴,通過(guò)直觀、語(yǔ)言驅(qū)動(dòng)的界面賦能更廣泛的業(yè)務(wù)決策。

      1. 自主日程助手:集成于日歷系統(tǒng)的AI Agent可自主管理會(huì)議協(xié)調(diào)、重新安排與沖突解決。x.ai 與 Reclaim AI 等工具可解析模糊的日程指令,訪問(wèn)日歷API,并根據(jù)學(xué)習(xí)到的用戶偏好識(shí)別最優(yōu)時(shí)間段。它們最小化人工輸入,同時(shí)適應(yīng)動(dòng)態(tài)可用性約束。其對(duì)接企業(yè)系統(tǒng)并響應(yīng)模糊指令的能力,凸顯了當(dāng)代日程智能體的模塊化自主性。

      一個(gè)自主日程助手的實(shí)際應(yīng)用見(jiàn)于企業(yè)環(huán)境(如圖10d所示),員工需在全球不同時(shí)區(qū)管理多重重疊職責(zé)。設(shè)想一位集成 Google Calendar 與 Slack 的行政助理AI Agent,它可解析指令如“下周找一個(gè)45分鐘時(shí)段與產(chǎn)品團(tuán)隊(duì)進(jìn)行后續(xù)會(huì)議”。智能體解析請(qǐng)求,檢查所有參與者的空閑時(shí)間,兼顧時(shí)區(qū)差異,并避免會(huì)議沖突或違反工作時(shí)間規(guī)定。若發(fā)現(xiàn)與已排定任務(wù)沖突,它可自主提議替代時(shí)段并通過(guò)Slack通知受影響參會(huì)者。此外,智能體從歷史用戶偏好中學(xué)習(xí)(如避免周五早間會(huì)議),并隨時(shí)間不斷優(yōu)化建議。Reclaim AI 與 Clockwise 等工具進(jìn)一步體現(xiàn)了此能力,提供具備日歷感知能力的自動(dòng)化方案,適應(yīng)不斷變化的工作負(fù)荷。此類助手降低協(xié)調(diào)成本,提升日程安排效率,并通過(guò)主動(dòng)化解歧義與優(yōu)化日歷利用率,實(shí)現(xiàn)更順暢的團(tuán)隊(duì)協(xié)作流程。

      4.0.2 Agentic AI 的應(yīng)用

      1. 多智能體科研助手:Agentic AI 系統(tǒng)正越來(lái)越多地部署于學(xué)術(shù)與工業(yè)研究流程中,以自動(dòng)化多階段知識(shí)整合。AutoGen 與 CrewAI 等平臺(tái)在中央?yún)f(xié)調(diào)器(orchestrator)的管理下,為多個(gè)智能體分配專業(yè)化角色——如檢索者、摘要生成者、綜合者與引文格式化器。協(xié)調(diào)器負(fù)責(zé)分發(fā)任務(wù)、管理角色依賴關(guān)系,并將各智能體輸出整合為連貫的草稿或綜述摘要。持久記憶機(jī)制支持跨智能體的上下文共享與持續(xù)優(yōu)化。這些系統(tǒng)被用于文獻(xiàn)綜述、基金申請(qǐng)準(zhǔn)備及專利檢索流程,其性能優(yōu)于單智能體系統(tǒng)(如 ChatGPT),原因在于其支持并發(fā)子任務(wù)執(zhí)行與長(zhǎng)上下文管理[98]。

      例如,圖11a所示的一個(gè)真實(shí)應(yīng)用場(chǎng)景是基金提案的自動(dòng)化起草。設(shè)想一個(gè)大學(xué)研究團(tuán)隊(duì)正在準(zhǔn)備國(guó)家科學(xué)基金會(huì)(NSF)的申報(bào)材料。采用基于 AutoGen 的架構(gòu),不同智能體被分配專門職責(zé):一個(gè)智能體檢索過(guò)往資助提案并提取結(jié)構(gòu)模式;另一個(gè)智能體掃描最新文獻(xiàn)以總結(jié)相關(guān)工作;第三個(gè)智能體將提案目標(biāo)與NSF招標(biāo)語(yǔ)言對(duì)齊;還有一個(gè)格式化智能體根據(jù)合規(guī)指南組織文檔結(jié)構(gòu)。協(xié)調(diào)器統(tǒng)籌這些智能體,解決依賴關(guān)系(例如使方法論與目標(biāo)保持一致),并確保各部分風(fēng)格統(tǒng)一。持久記憶模塊存儲(chǔ)不斷演進(jìn)的草案、合作者反饋與資助機(jī)構(gòu)模板,從而實(shí)現(xiàn)多次會(huì)話中的迭代改進(jìn)。相比傳統(tǒng)人工流程,該多智能體系統(tǒng)顯著加速了起草時(shí)間,提升了敘事連貫性,并確保符合監(jiān)管要求,為學(xué)術(shù)界與研發(fā)密集型產(chǎn)業(yè)提供了一種可擴(kuò)展、自適應(yīng)的協(xié)作式科研寫作方案。


      1. 智能機(jī)器人協(xié)同:在機(jī)器人與自動(dòng)化領(lǐng)域,Agentic AI 賦能多機(jī)器人系統(tǒng)中的協(xié)作行為。每個(gè)機(jī)器人作為特定任務(wù)的智能體運(yùn)行(如采摘器、運(yùn)輸器或測(cè)繪器),而協(xié)調(diào)器則監(jiān)督并調(diào)整工作流。此類架構(gòu)依賴共享空間記憶、實(shí)時(shí)傳感器融合與智能體間同步,以實(shí)現(xiàn)協(xié)調(diào)的物理行動(dòng)。應(yīng)用場(chǎng)景包括倉(cāng)庫(kù)自動(dòng)化、基于無(wú)人機(jī)的果園巡檢以及機(jī)器人采收[155]。

      例如,在商業(yè)蘋果園中(圖11b),Agentic AI 支持一套協(xié)調(diào)的多機(jī)器人系統(tǒng)以優(yōu)化水果采收。在此場(chǎng)景中,任務(wù)專精型機(jī)器人——如自主采摘機(jī)器人、水果分類機(jī)器人、運(yùn)輸機(jī)器人與無(wú)人機(jī)測(cè)繪機(jī)器人——均作為智能單元在中央?yún)f(xié)調(diào)器下運(yùn)作。測(cè)繪無(wú)人機(jī)首先巡視果園,利用視覺(jué)-語(yǔ)言模型(VLMs)生成高分辨率產(chǎn)量地圖并識(shí)別成熟果簇。該空間數(shù)據(jù)通過(guò)所有智能體均可訪問(wèn)的集中式記憶層共享。隨后,采摘機(jī)器人被指派至高密度區(qū)域,由路徑規(guī)劃智能體引導(dǎo)其繞開(kāi)障礙物與勞動(dòng)區(qū)域。同時(shí),運(yùn)輸機(jī)器人動(dòng)態(tài)搬運(yùn)水果容器或箱體,往返于采摘機(jī)器人與儲(chǔ)存區(qū)之間,根據(jù)采摘負(fù)載水平與地形變化動(dòng)態(tài)調(diào)整任務(wù)。所有智能體通過(guò)共享協(xié)議異步通信,協(xié)調(diào)器則持續(xù)根據(jù)天氣預(yù)報(bào)或機(jī)械故障調(diào)整任務(wù)優(yōu)先級(jí)。若某一采摘機(jī)器人失效,鄰近單元可自動(dòng)重新分配工作負(fù)載。這種自適應(yīng)、記憶驅(qū)動(dòng)的協(xié)調(diào)機(jī)制彰顯了 Agentic AI 在降低人力成本、提高采收效率、應(yīng)對(duì)復(fù)雜農(nóng)業(yè)環(huán)境不確定性方面的潛力,遠(yuǎn)超傳統(tǒng)剛性編程農(nóng)業(yè)機(jī)器人的能力[98, 155]。

      1. 協(xié)作式醫(yī)療決策支持:在高風(fēng)險(xiǎn)臨床環(huán)境中,Agentic AI 通過(guò)將診斷、生命體征監(jiān)測(cè)與治療規(guī)劃等任務(wù)分配給專業(yè)智能體,實(shí)現(xiàn)分布式醫(yī)學(xué)推理。例如,一個(gè)智能體可檢索患者病史,另一個(gè)智能體依據(jù)診療指南驗(yàn)證檢查結(jié)果,第三個(gè)智能體則提出治療方案(如中國(guó)首家Agentic AI醫(yī)院所展示的案例[174])。這些智能體通過(guò)共享記憶與推理鏈實(shí)現(xiàn)同步,確保建議的一致性與安全性。應(yīng)用場(chǎng)景包括ICU管理、放射科分診與疫情響應(yīng)(參見(jiàn)表10)。盡管因該領(lǐng)域尚處發(fā)展初期,現(xiàn)實(shí)部署仍顯不足,但已有研究支持Agentic AI變革醫(yī)療保健領(lǐng)域的巨大潛力[175]。

      例如,在醫(yī)院重癥監(jiān)護(hù)室(ICU)(圖11c)中,一個(gè)Agentic AI系統(tǒng)輔助臨床醫(yī)生管理復(fù)雜患者病例。診斷智能體持續(xù)分析生命體征與實(shí)驗(yàn)室數(shù)據(jù),以早期發(fā)現(xiàn)膿毒癥風(fēng)險(xiǎn)。同時(shí),歷史數(shù)據(jù)檢索智能體訪問(wèn)電子健康記錄(EHRs),總結(jié)合并癥與近期治療情況。治療規(guī)劃智能體則交叉比對(duì)當(dāng)前癥狀與臨床指南(如“拯救膿毒癥運(yùn)動(dòng)”),提出抗生素方案或液體治療策略。協(xié)調(diào)器整合這些洞察,確保一致性并呈現(xiàn)沖突點(diǎn)供人工復(fù)核。醫(yī)生反饋被存儲(chǔ)于持久記憶模塊,使智能體能夠基于先前干預(yù)措施與結(jié)果優(yōu)化自身推理。該協(xié)同系統(tǒng)通過(guò)減輕認(rèn)知負(fù)荷、縮短決策時(shí)間與最小化疏漏風(fēng)險(xiǎn),提升臨床工作流效率。在重癥監(jiān)護(hù)與腫瘤科室的早期部署已證明其可增強(qiáng)診斷精準(zhǔn)度并提高循證協(xié)議依從性,為更安全、實(shí)時(shí)的協(xié)作式醫(yī)療支持提供了可擴(kuò)展解決方案。

      1. 多智能體游戲AI與自適應(yīng)工作流自動(dòng)化:在模擬環(huán)境與企業(yè)系統(tǒng)中,Agentic AI 系統(tǒng)促進(jìn)去中心化的任務(wù)執(zhí)行與高效協(xié)調(diào)。游戲平臺(tái)如 AI Dungeon 部署具備目標(biāo)、記憶與動(dòng)態(tài)互動(dòng)能力的獨(dú)立NPC智能體,以創(chuàng)造涌現(xiàn)式敘事與社會(huì)行為。在企業(yè)工作流中,MultiOn 與 Cognosys 等系統(tǒng)使用智能體管理法律審查或事件升級(jí)等流程,其中每一步均由專用模塊控制。此類架構(gòu)展現(xiàn)出超越規(guī)則驅(qū)動(dòng)流水線的韌性、異常處理能力與反饋驅(qū)動(dòng)適應(yīng)性[176]。

      例如,在現(xiàn)代企業(yè)IT環(huán)境中(如圖11d所示),Agentic AI 系統(tǒng)正越來(lái)越多地被用于自主管理網(wǎng)絡(luò)安全事件響應(yīng)工作流。當(dāng)檢測(cè)到潛在威脅(如異常訪問(wèn)模式或未經(jīng)授權(quán)的數(shù)據(jù)外泄)時(shí),多個(gè)專業(yè)智能體并行激活。一個(gè)智能體利用歷史違規(guī)數(shù)據(jù)與異常檢測(cè)模型進(jìn)行實(shí)時(shí)威脅分類;第二個(gè)智能體查詢網(wǎng)絡(luò)節(jié)點(diǎn)的相關(guān)日志數(shù)據(jù),并關(guān)聯(lián)跨系統(tǒng)模式;第三個(gè)智能體解讀合規(guī)框架(如GDPR或HIPAA),評(píng)估事件的監(jiān)管嚴(yán)重性;第四個(gè)智能體模擬緩解策略并預(yù)測(cè)運(yùn)營(yíng)風(fēng)險(xiǎn)。這些智能體在中央?yún)f(xié)調(diào)器下協(xié)同工作,協(xié)調(diào)器評(píng)估集體輸出、整合時(shí)序推理,并向人類分析師發(fā)出推薦行動(dòng)。通過(guò)共享記憶結(jié)構(gòu)與迭代反饋,系統(tǒng)從以往事件中學(xué)習(xí),使未來(lái)響應(yīng)更快、更準(zhǔn)確。相比傳統(tǒng)基于規(guī)則的安全系統(tǒng),該智能體模型降低了決策延遲、減少了誤報(bào)率,并支持在大規(guī)模組織基礎(chǔ)設(shè)施中實(shí)施主動(dòng)式威脅遏制[98](參見(jiàn)表10與表11)。



      5 AI智能體與代理式AI的挑戰(zhàn)與局限性

      為了系統(tǒng)性地理解當(dāng)前智能系統(tǒng)在理論和操作層面的局限性(如表11所述),我們?cè)趫D12中提供了一個(gè)比較性的視覺(jué)綜合分析,該圖將AI智能體與代理式AI范式下的挑戰(zhàn)及潛在解決方案進(jìn)行了分類。圖12a概述了AI智能體特有的四大最緊迫限制:缺乏因果推理能力、繼承自大語(yǔ)言模型(LLM)的約束(例如幻覺(jué)、淺層推理)、代理屬性不完整(如自主性、主動(dòng)性),以及在長(zhǎng)時(shí)程規(guī)劃與恢復(fù)能力上的失敗。這些挑戰(zhàn)通常源于它們對(duì)無(wú)狀態(tài)LLM提示的依賴、有限的記憶能力以及啟發(fā)式推理循環(huán)。


      同樣地,圖12b識(shí)別出代理式AI系統(tǒng)特有的八大關(guān)鍵瓶頸,例如多智能體間的錯(cuò)誤級(jí)聯(lián)、協(xié)調(diào)崩潰、涌現(xiàn)性不穩(wěn)定、可擴(kuò)展性限制以及可解釋性問(wèn)題。這些問(wèn)題源于在沒(méi)有標(biāo)準(zhǔn)化架構(gòu)、穩(wěn)健通信協(xié)議或因果對(duì)齊框架的情況下,協(xié)調(diào)多個(gè)智能體執(zhí)行分布式任務(wù)所面臨的復(fù)雜性。

      圖13通過(guò)綜合十項(xiàng)前瞻性設(shè)計(jì)策略,補(bǔ)充了這一診斷框架,旨在緩解上述局限性。這些策略包括檢索增強(qiáng)生成(RAG)、基于工具的推理[130,131,133]、代理式反饋循環(huán)(ReAct[136])、基于角色的多智能體編排、記憶架構(gòu)、因果建模以及具備治理意識(shí)的設(shè)計(jì)。這些機(jī)制共同構(gòu)成了一條整合路線圖,用以解決當(dāng)前缺陷,并加速安全、可擴(kuò)展且情境感知的自主系統(tǒng)的開(kāi)發(fā)。


      5.0.1 AI智能體的挑戰(zhàn)與局限性

      盡管AI智能體因其利用LLM和特定工具接口自動(dòng)化結(jié)構(gòu)化任務(wù)的能力而備受關(guān)注,但文獻(xiàn)指出其存在顯著的理論與實(shí)踐局限性,阻礙了其可靠性、泛化能力和長(zhǎng)期自主性[136,162]。這些挑戰(zhàn)既源于其架構(gòu)上對(duì)靜態(tài)預(yù)訓(xùn)練模型的依賴,也源于難以賦予其因果推理、規(guī)劃和穩(wěn)健適應(yīng)等代理特性。AI智能體的關(guān)鍵挑戰(zhàn)與局限性(見(jiàn)圖12a)總結(jié)如下:

      1. 缺乏因果理解:最基礎(chǔ)的挑戰(zhàn)之一在于智能體無(wú)法進(jìn)行因果推理[180,181]。雖然構(gòu)成大多數(shù)AI智能體認(rèn)知核心的LLM在檢測(cè)訓(xùn)練數(shù)據(jù)中的統(tǒng)計(jì)相關(guān)性方面非常有效,但它們并不能真正理解因果關(guān)系。正如DeepMin...

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      布魯斯·威利斯30年前爛片逆襲,Netflix前十

      布魯斯·威利斯30年前爛片逆襲,Netflix前十

      時(shí)光慢旅人
      2026-05-18 01:38:00
      安理會(huì)重磅發(fā)聲!中方強(qiáng)硬亮劍:以色列必須無(wú)條件撤出

      安理會(huì)重磅發(fā)聲!中方強(qiáng)硬亮劍:以色列必須無(wú)條件撤出

      低調(diào)看天下
      2026-05-17 16:59:30
      全網(wǎng)都猜錯(cuò)了!張?zhí)m突然停更阿姨被臨時(shí)調(diào)休,真相是汪小菲的用心

      全網(wǎng)都猜錯(cuò)了!張?zhí)m突然停更阿姨被臨時(shí)調(diào)休,真相是汪小菲的用心

      阿廢冷眼觀察所
      2026-05-16 16:21:06
      林徽因落選的國(guó)徽方案,網(wǎng)友看后感嘆:審美確實(shí)厲害,但真不合適

      林徽因落選的國(guó)徽方案,網(wǎng)友看后感嘆:審美確實(shí)厲害,但真不合適

      浩渺青史
      2026-04-17 13:55:15
      賭王孫女不幸離世終年58歲!追思會(huì)內(nèi)部曝光,親友送別最后一程

      賭王孫女不幸離世終年58歲!追思會(huì)內(nèi)部曝光,親友送別最后一程

      喜歡歷史的阿繁
      2026-05-17 22:27:50
      耿同學(xué)扳倒多個(gè)學(xué)術(shù)大拿,本人背景曝光,他這么干的原因找到了

      耿同學(xué)扳倒多個(gè)學(xué)術(shù)大拿,本人背景曝光,他這么干的原因找到了

      平老師666
      2026-05-15 21:35:30
      中國(guó)為啥能迅速崛起,德國(guó)專家給出看法:中國(guó)沒(méi)覆蓋全民族的宗教

      中國(guó)為啥能迅速崛起,德國(guó)專家給出看法:中國(guó)沒(méi)覆蓋全民族的宗教

      抽象派大師
      2026-05-16 15:17:29
      為什么男人每次偷情要開(kāi)房,女人每次偷情都在車?yán)锬兀?>
    </a>
        <h3>
      <a href=思絮
      2026-04-28 10:25:11
      玩嗨了!黃仁勛在大爺煙斗上簽名,庫(kù)克買咖啡,特朗普兒子游長(zhǎng)城

      玩嗨了!黃仁勛在大爺煙斗上簽名,庫(kù)克買咖啡,特朗普兒子游長(zhǎng)城

      青杉依舊啊啊
      2026-05-17 07:47:44
      多名院士調(diào)查發(fā)現(xiàn):吃一口久放至黑斑的香蕉,或等于進(jìn)一次毒?

      多名院士調(diào)查發(fā)現(xiàn):吃一口久放至黑斑的香蕉,或等于進(jìn)一次毒?

      路醫(yī)生健康科普
      2026-05-17 19:35:03
      慌了!知名化工平臺(tái)暴雷!十億元無(wú)法履約!1600家企業(yè)錢貨兩空!

      慌了!知名化工平臺(tái)暴雷!十億元無(wú)法履約!1600家企業(yè)錢貨兩空!

      新浪財(cái)經(jīng)
      2026-05-17 12:12:48
      網(wǎng)友說(shuō)未來(lái)盡量別去夜場(chǎng),小仙女們要化債了!

      網(wǎng)友說(shuō)未來(lái)盡量別去夜場(chǎng),小仙女們要化債了!

      燈錦年
      2026-05-16 14:42:03
      臺(tái)灣回歸終極方案:土地回歸中國(guó),人員自由往來(lái),兩岸統(tǒng)一新路徑

      臺(tái)灣回歸終極方案:土地回歸中國(guó),人員自由往來(lái),兩岸統(tǒng)一新路徑

      陳腕特色體育解說(shuō)
      2026-05-17 21:12:19
      一個(gè)人認(rèn)知在不在你之上,看這4個(gè)細(xì)節(jié)就夠了

      一個(gè)人認(rèn)知在不在你之上,看這4個(gè)細(xì)節(jié)就夠了

      洞見(jiàn)
      2026-04-16 11:35:51
      炸了!溫州砸 23 億干大事,214 萬(wàn)畝荒山變綠

      炸了!溫州砸 23 億干大事,214 萬(wàn)畝荒山變綠

      奇葩游戲醬
      2026-05-18 03:26:37
      圖片報(bào):1860球迷惡搞拜仁奪冠慶典,被眼尖的諾伊爾先發(fā)現(xiàn)

      圖片報(bào):1860球迷惡搞拜仁奪冠慶典,被眼尖的諾伊爾先發(fā)現(xiàn)

      懂球帝
      2026-05-17 21:39:36
      35美元小配件,讓有線CarPlay變無(wú)線

      35美元小配件,讓有線CarPlay變無(wú)線

      賽博蘭博
      2026-05-17 03:15:05
      99%的女人出軌完男人后,都會(huì)默契地做出這3種行為,不信你看看

      99%的女人出軌完男人后,都會(huì)默契地做出這3種行為,不信你看看

      加油丁小文
      2026-05-03 08:30:16
      朱珠與老公上海南京西路街邊喝咖啡被偶遇,美的像拍偶像劇!

      朱珠與老公上海南京西路街邊喝咖啡被偶遇,美的像拍偶像劇!

      動(dòng)物奇奇怪怪
      2026-05-16 12:41:37
      俄烏打完后,俄國(guó)際地位會(huì)下降到何種地步?看俄羅斯周邊就知道!

      俄烏打完后,俄國(guó)際地位會(huì)下降到何種地步?看俄羅斯周邊就知道!

      忠于法紀(jì)
      2026-05-16 17:49:52
      2026-05-18 04:20:49
      CreateAMind incentive-icons
      CreateAMind
      CreateAMind.agi.top
      1407文章數(shù) 19關(guān)注度
      往期回顧 全部

      科技要聞

      三大運(yùn)營(yíng)商即將免月租?多方回應(yīng)

      頭條要聞

      內(nèi)塔尼亞胡與特朗普通話 討論重啟對(duì)伊朗軍事打擊

      頭條要聞

      內(nèi)塔尼亞胡與特朗普通話 討論重啟對(duì)伊朗軍事打擊

      體育要聞

      生死戰(zhàn)只拿3分的核心,還有留的必要嗎?

      娛樂(lè)要聞

      盧昱曉道歉:認(rèn)識(shí)到問(wèn)題嚴(yán)重性!

      財(cái)經(jīng)要聞

      長(zhǎng)鑫科技 預(yù)計(jì)上半年凈利至少500億元

      汽車要聞

      車長(zhǎng)超5米/雙動(dòng)力可選 昊鉑S600預(yù)售權(quán)益價(jià)18.89萬(wàn)起

      態(tài)度原創(chuàng)

      房產(chǎn)
      游戲
      本地
      教育
      公開(kāi)課

      房產(chǎn)要聞

      老黃埔熱銷之下,珠江春,為何去化僅3成?

      直到世界的盡頭!《文明7》即將免費(fèi)更新傳奇征服者

      本地新聞

      用蘇繡的方式,打開(kāi)江西婺源

      教育要聞

      南京大學(xué):熱門專業(yè),就業(yè)現(xiàn)狀及報(bào)考分析#搜索千校視頻計(jì)劃

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 依安县| 一本色道久久88综合无码| 亚洲AV片揉捏奶头| 综合久久夜夜中文字幕| 午夜一区二区亚洲福利vr| 久久精品国产丝袜人妻| 中文字幕精品人妻| 精品四十色区在线视频| 久久精品黄aa片一区二区三区| 国产精品免费一区二区三区四区| 久章草在线精品视频免费观看| 婷婷色爱区综合五月激情| 深夜在线观看免费av| 国产精品人成视频免| 夜夜躁狠狠躁日日躁2022| 乱人伦中文无码视频| av不卡一区二区| 亚洲国产精品无码一区二区三区| 污网站在线看| 久久男人av资源网站无码| 国产高清色高清在线观看| 日本无码中文| 亚洲AV无码码潮喷在线观看| 美日韩一区二区综合在线视频 | 中文字幕无码Av在线看| 91在线观看| 国产精品玖玖玖在线| 成人国产精品日本在线观看| 少妇性荡欲午夜性开放视频剧场| 综合色一色综合久久网| 日韩在线观看a| 久久成人国产精品免费软件| 国产一级片在线播放| 国产成人亚洲精品青草| 女人与牲口性恔配视频免费| 亚洲天堂精品一区二区| 国产粗大| 免费人成视频在线| 亚洲高清一区二区三区久久| 肏屄欧美| 熟妇人妻无码中文字幕老熟妇 |