網易首頁 > 網易號 > 正文申請入駐

71.4K Star的AI交易團隊：多智能體架構如何“炒”出一個華爾街

2026-05-10 10:49:28　來源: 鈦媒體APP

北京舉報

分享至

低調上線卻突然爆火出圈，一個無人造勢的開源AI項目，為何能橫掃GitHub、引爆金融圈？背后多Agent復刻華爾街投研體系的玩法，藏著AI金融落地的全新邏輯。

2024年12月28日，一個叫TradingAgents的項目悄悄上線了GitHub。

沒有發布會，沒有融資通稿，沒有大V站臺。只有一篇掛在arXiv上的學術論文（編號 2412.20138），和一個剛建好的代碼倉庫。背后的團隊叫Tauric Research，總共只有三個公開倉庫，社交賬號粉絲剛過一千，怎么看都不像會搞出大事的樣子。

但到了2026年5月初，這個項目拿下了超過71,400顆Star，13,800多次Fork，直接沖上GitHub Python趨勢榜第一。其中2026年2月發布的v0.2.0版本引入多提供商支持后增速明顯加快，4月底到5月初的一周之內暴漲超過11,000顆Star，24小時內漲了3,315顆——這個增速在開源社區的歷史上都不多見。

TradingAgents GitHub Star 增長曲線（2024.12 – 2026.5）

它做的事情聽起來有點“出格”：用多個AI Agent模擬一整個華爾街的投研交易團隊，讓它們分工協作、多空辯論、風控把關，最后集體拍板做出交易決策。

而且，完全開源，一行代碼就能跑起來。

（項目地址：https://github.com/TauricResearch/TradingAgents）

一個投研團隊的數字化分身

要理解TradingAgents在做什么，先得理解它模仿的對象——真實的對沖基金是怎么運作的。

在華爾街，一家像樣的對沖基金通常有這么一套運轉機制：研究部門負責出報告，投決會上多空分析師互相“抬杠”，交易臺根據討論結果執行策略，風控團隊在最后一步把關。一筆交易從立項到執行，中間要經過好幾道關卡，環環相扣，沒有哪個環節是拍腦袋做出來的。這種流程不是為了折騰人，而是因為金融決策的容錯率實在太低了——一次失誤可能就是幾百萬甚至上千萬的損失。

TradingAgents做的事情，就是把這套運轉了幾十年的人類組織流程翻譯成AI Agent能執行的代碼。它把整個交易決策鏈路拆成了四層，每層對應一個職能團隊。

第一層是分析師團隊，四個人各管一攤。基本面分析師負責評估公司財務表現——利潤率、資產回報率、現金流這些硬指標，找內在價值和潛在雷區。輿情分析師盯著社交媒體和論壇，用量化情緒評分算法判斷市場短期風向。新聞分析師追蹤全球宏觀經濟事件和政策變動，評估對目標資產的沖擊。技術分析師則用MACD、RSI等經典指標識別價格形態和趨勢信號。

這四個角色各干各的，信息源也完全不同。市場行情數據來自雅虎財經，社交媒體數據來自X和Reddit，新聞數據來自彭博和路透，基本面數據則來自公司財報和內幕交易披露。四根信息管道并行運轉，互不干擾，最后各自輸出一份結構化的分析報告。

從項目展示的分析界面來看，四個分析師的輸出不是簡單的一段話，而是有明確論點、論據和量化指標的完整分析文檔。比如輿情分析師會給出具體的情緒峰值時間和分數，技術分析師會列出關鍵指標的數值和含義，基本面分析師會按盈利能力、流動性、估值等維度逐項打分。

四維分析師團隊輸出示例（以Apple Inc.為例）

第二層是研究員團隊，兩個角色，一個唱多一個唱空。分析師團隊給出的是“證據”，研究員團隊負責“判斷”。多頭研究員拿著分析師的報告找買入的理由，空頭研究員拿著同一份報告找賣出的理由，然后兩人展開結構化辯論——類似投行里多空分析師的經典對抗。

這不是隨便吵一架完事。辯論過程有明確的輪次控制，默認兩輪，可以自行調整。每一輪辯論都要給出論據和推理邏輯，輸出的是經過對抗驗證的多空證據鏈，而不是含糊的“我覺得該買”或者“可能要跌”。

多空研究員結構化辯論（左側Bullish / 右側Bearish）

第三層是交易員Agent。交易員不負責原創分析，它負責匯總和提案。把分析師的證據和研究員的辯論結論壓縮成一份交易提案，明確交易方向、時機和倉位大小。

這個設計很關鍵——決策的可追溯性因此有了保障。每一筆交易為什么做、依據是什么、辯論過程中有什么分歧、風控怎么評估的，全鏈條清晰可查。

交易員最終決策輸出（BUY Apple Shares）

第四層是風控與投資組合經理。風控團隊從激進、中性、保守三個維度評估提案的風險敞口，把評估報告交給投資組合經理做最終裁決。經理有權批準、拒絕或者調整方案。只有經過審批的交易指令，才會被發送到模擬交易所執行。

風控三角色（Risky / Neutral / Safe）與投資組合經理最終裁決

有意思的是，整個系統的推理引擎嵌入了深度推理能力。TradingAgents把深度推理嵌入到了研究員和交易員的決策鏈路中，讓Agent在辯論和提案階段能進行更深層次的邏輯推演，而不是淺層的信息拼接。

TradingAgents 四層架構全景圖

為什么不是一個Agent搞定所有事

看到這里，有人可能會想：為什么不直接找一個最強的模型，給它足夠的上下文，讓它一口氣分析完所有維度然后給個結論？這個想法很直覺，但在金融場景里有幾個繞不過去的問題。

第一個是信息過載。一個專業的量化分析師每天要處理財報數據、宏觀新聞、社交輿情、技術指標、資金流向——多維度信息同時涌入，單一模型的上下文窗口再大，也很難在保證質量的前提下同時處理所有信息。

第二個是角色沖突。讓同一個模型“同時分析一只股票的多空兩面”，聽起來合理，實際上模型很難在同一輪推理中既唱多又唱空，還能保持論證的獨立性。這就像讓一個人自己跟自己辯論，怎么都覺得差點意思。

第三個是決策黑箱。單Agent模式下，模型給出“買入”建議時，你很難追溯這個結論是怎么來的。而多Agent架構天然提供了決策審計鏈——每一層誰說了什么、依據是什么、辯論了幾個回合、風控怎么評估的，全都有據可查。

TradingAgents的解法很直接：把一個大問題拆成多個小問題，每個小問題由一個“專家”負責，專家之間通過結構化的對抗機制來校準偏差，最終由決策層做綜合判斷。

這不是什么新鮮發明。華爾街的頂級基金一直都是這么運轉的——部門分工、專業對抗、層層復核。TradingAgents做的，只是把這個人類流程翻譯成了機器能執行的代碼。真正聰明的不是架構本身，而是它選對了模仿對象：不是模擬一個交易員的思維，而是模擬一套交易組織的運作機制。

上手體驗：一行命令跑起來

TradingAgents的上手門檻，說一句“幾乎為零”不過分。

安裝就三步：克隆倉庫，建Python虛擬環境，運行安裝命令。完了。配好任意一個主流大模型的API Key之后，啟動交互式命令行，就能看到一個配置界面——選擇股票代碼、分析日期、模型提供商、辯論輪數這些參數。選好之后回車，各個Agent就開始按流程跑起來了：

模型支持方面相當大方。OpenAI的GPT系列、Google的Gemini、Anthropic的Claude、xAI的Grok、DeepSeek、阿里通義千問、智譜GLM，甚至用Ollama在本地跑開源模型都行。企業級用戶還能接入Azure OpenAI和AWS Bedrock。一套工廠模式的Provider架構讓切換模型變得很簡單，每個Provider的原生結構化輸出方式被自動適配——比如OpenAI走JSON Schema，Anthropic走工具調用，其他兼容Provider走函數調用。這也意味著，你可以根據成本和性能靈活選擇模型，便宜的任務用小模型，復雜的推理用大模型。

簡單說，只要有任意一個主流大模型的API Key就能跑。不需要GPU，不需要訓練模型，不需要標注數據。

想用Python直接調用也很方便。核心就是初始化一個圖對象，傳入股票代碼和分析日期，系統自動跑完四層流程返回交易決策。你還可以自定義各種參數——比如用大模型做深度推理、小模型做快速任務，控制辯論輪數，調整風險偏好等等。

v0.2.4版本加了一個很有意思的功能：決策記憶。每次分析完成后，決策結果會自動記錄到本地日志文件中。下次分析同一只股票時，系統會自動調取歷史決策，對比實際收益——包括相對標普500的Alpha收益——然后生成一段反思：“上次為什么對了”“上次為什么錯了”。這些經驗會被注入到投資組合經理的決策prompt中，讓每次分析都站在上一次的肩膀上。

這意味著TradingAgents不再是每次從零開始的“無腦機器人”。它具備了某種形式的經驗積累能力，分析得越多，沉淀的經驗越豐富。

新版還支持斷點續跑。LangGraph在每個節點保存狀態，哪怕跑一半程序崩了或者網絡斷了，下次啟動也能從上次的斷點自動恢復，不用重頭再來。對于一套跑下來可能消耗不少Token的分析流程來說，這個功能相當實用。

另外還有一個容易被忽略的價值：整個分析框架是白盒的。從分析師的數據輸入，到研究員的多空辯論，再到交易員的提案和風控的評估，全過程有完整日志輸出。你可以清楚地看到每個Agent的推理過程和決策依據，這比大多數黑箱量化系統透明得多。對于做量化研究的人來說，這種透明度本身就很有價值。

更大的圖景：垂直智能體正在吃掉通用框架

TradingAgents能在GitHub上炸出這樣的熱度，不只是一個項目火了這么簡單，背后是行業趨勢的共振。

2026年3月，英偉達發布了一份《金融服務業的人工智能現狀：2026年趨勢》（State of AI in Financial Services: 2026 Trends）報告，調研了全球800多位金融從業者。報告里有幾個數據挺能說明問題：65%的金融機構已經在積極使用AI，比去年的45%大幅跳升；89%的機構表示AI同時帶來了收入增長和成本下降；64%的受訪者表示AI幫助年收入增長超過5%，其中29%的人表示增長超過10%。更重要的是，42%的機構正在使用或評估Agentic AI，其中21%已經實際部署了AI智能體。

報告指出，金融行業正在經歷它的“深度學習時刻”——過去算法交易依賴量化分析師做大量人工特征工程，現在AI系統可以自動研究海量數據、發現規律、輸出交易信號。這種轉變正在重塑量化團隊的人才結構和研究流程。英偉達CEO黃仁勛在同期的GTC大會上也提到，AI產業正在從模型訓練轉向推理應用，Token經濟開始成熟，AI能力正在變成一種可量化、可交易的生產要素。金融機構的采購部門已經開始像對待云計算資源一樣，對AI算力進行成本核算和供應商比價。

再看開源社區的趨勢。2024年GitHub趨勢榜的常客是LangChain、CrewAI這類通用編排框架。但到了2026年4月底5月初，TradingAgents一個金融垂直項目就把它們擠出了前20。同期上榜的還有專注自主金融研究的Dexter、做網絡調查的Maigret等垂直領域項目，整個榜單前20找不到一個通用編排框架的位置。

這背后的邏輯并不復雜：當大模型的工具調用能力足夠可靠、推理成本斷崖式下降的時候，用戶要的不再是“幫我搭一個智能體框架”，而是“直接給我一個能跑通的工作流”。通用框架承諾的“靈活編排”，在垂直領域用戶眼里變成了配置負擔——他們要的是經過驗證的策略邏輯和端到端的解決方案，不是可配置的工作流圖表。

TradingAgents的真正價值，不是它的多智能體架構有多精妙，而是它提供了一個經過驗證的、可以直接投入研究使用的金融分析系統。結構化的多空辯論機制、帶記憶的決策系統、透明的分析日志——這些才是真正構成壁壘的東西，也是通用框架開箱即用提供不了的能力。

當然，有必要潑一盆冷水。TradingAgents在項目首頁就寫得很明確：本框架僅供研究目的，不構成任何金融、投資或交易建議。

這不是例行公事的免責聲明，而是對項目當前狀態的事實描述。它的分析基于歷史數據和LLM推理，交易表現在真實市場中會因模型選擇、參數設置、數據質量和大量非確定性因素而產生偏差。在金融這個容錯率極低的領域，距離真正的生產級部署，中間還有不短的路要走。

但它確實證明了一件事：多Agent系統在金融分析場景中的可行性，已經從學術概念走向了工程實踐。從“能不能做”進入了“怎么做更好”的階段。

對于關注AI在垂直領域落地的開發者來說，TradingAgents提供了一個值得研究的范本——不是因為它能幫你賺錢，而是因為它展示了如何把一個真實世界的復雜業務流程，系統地分解為AI Agent可以協作執行的架構。這種“把行業know-how翻譯成Agent協作流程”的思路，遠比項目本身的交易功能更有參考價值。（本文首發鈦媒體APP，作者 | 硅谷Tech_news，編輯 | 焦燕）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.