今天聊一個對在讀研究生、想發(fā)論文的兄弟特別友好的開源工具:
Academic Research Skills(ARS),整個套件圍著 Claude Code 轉(zhuǎn),配套還有 Codex CLI 版本
![]()
github.com/Imbad0202/academic-research-skills 簡介
ARS 是一套 Claude Code Skills 集合,從研究 → 寫作 → 評審 → 修訂 → 定稿全流程都有,作者把自己用 AI 協(xié)作寫論文的工作流完整開源出來:
? AI is your copilot, not the pilot這工具不會替你寫論文,它專門處理那些累活臟活 —— 翻參考文獻、整引用格式、核數(shù)據(jù)、查邏輯一致性,讓你把腦子留給真正需要思考的部分:定問題、選方法、解讀數(shù)據(jù)、寫出「我認(rèn)為……」后面那句話
更狠的是,ARS 不是「降A(chǔ)I味」工具,它不幫你藏「我用了 AI」這個事實,它幫你寫得更好:Style Calibration 學(xué)你過去文章的語氣,Writing Quality Check 抓那些一看就是機器味兒的句式
為什么堅持 human-in-the-loop
作者引了一篇 Nature 651: 914-919 的文章 —— Lu et al. (2026) 的 The AI Scientist,第一個全自動 AI 研究系統(tǒng)通過頂會盲審(ICLR 2025 workshop,6.33/10 分,workshop 平均才 4.87)
聽起來牛逼,但他們的 Limitations 里列出了一堆全自動 AI 科研流水線躲不掉的坑:
實現(xiàn) bug
幻覺結(jié)果
走捷徑
把 bug 當(dāng) insight
編造方法論
框架鎖死
引用幻覺(這條最致命)
ARS 的核心信念是:人類研究員 + AI 增強,比單獨哪一邊都更能躲過這些雷。它在 Stage 2.5 和 Stage 4.5 設(shè)置了完整性閘門,跑一個 7 模式的強制檢查清單
![]()
v3.3 還吸收了 Google 的 PaperOrchestra(arxiv 2604.05018)的方法:Semantic Scholar API 驗證、防數(shù)據(jù)泄漏協(xié)議、VLM 圖表驗證、得分軌跡追蹤
核心能力一覽
ARS 不是一個 Skill,是四套 agent team 組合:
模塊
智能體數(shù)
主要解決的問題
Deep Research
13 個
蘇格拉底式引導(dǎo)、PRISMA 系統(tǒng)綜述、意圖識別、對話健康度監(jiān)測、Semantic Scholar 驗證
Academic Paper
12 個
Style Calibration、Writing Quality Check、LaTeX 加固、可視化、修訂輔導(dǎo)、引用轉(zhuǎn)換
Academic Paper Reviewer
7 個
EIC + 3 動態(tài)評審 + Devil's Advocate,0–100 打分、攻擊強度保留、R&R 追溯矩陣
Academic Pipeline
10 階段
全流程編排,自適應(yīng)檢查點、Material Passport、可選 repro_lock 、跨模型完整性驗證
一句話總結(jié) ARS 的設(shè)計哲學(xué):全流程分階段,每個階段都強制做完整性檢查,不讓 AI 一口氣把活干到底
安裝
要求:
Claude Code(最新版)
導(dǎo)出
ANTHROPIC_API_KEY可選:Pandoc(DOCX 導(dǎo)出)、tectonic + 思源宋體 TC(APA 7.0 PDF 導(dǎo)出)
30 秒裝好:
/plugin marketplace add Imbad0202/academic-research-skills
/plugin install academic-research-skills
Codex CLI 用戶用同名插件:
# Codex 版本,同樣的工作流,打包成單個 skill
gh repo clone Imbad0202/academic-research-skills-codex
使用裝完直接跑:
# 蘇格拉底式對話,幫你梳理論文章節(jié)結(jié)構(gòu)
/ars-plan# 或者跑文獻綜述
/ars-lit-review "你的研究主題"
全流程命令:
/ars-plan:選題與章節(jié)結(jié)構(gòu)規(guī)劃/ars-lit-review:文獻綜述數(shù)據(jù)/方法核查(Stage 2.5 閘門)
寫作 + 風(fēng)格對齊(Style Calibration 會拿你過往論文當(dāng)語料)
評審模式:可開啟 calibration,讓你拿自己手工標(biāo)注的金標(biāo)準(zhǔn)來測它的 FNR/FPR
定稿與格式化(APA 7.0 PDF / DOCX)
按官方 docs/PERFORMANCE.md 給的口徑:
? 一篇 15k 詞的論文,跑完整 10 階段流水線,token 成本大約 $4–6
這個數(shù)字我覺得挺合理。日常拿 Claude Code Pro 訂閱,配合官方推薦的「Skip Permissions + Agent Team」設(shè)置,跑一篇碩士小論文的成本完全可控
最讓我震驚的一個數(shù)據(jù)
我在 README 的 showcase 部分看到一行字,差點沒坐穩(wěn):
? Post-Publication Audit Report:獨立全引用審計,在 3 輪完整性檢查之外又找出 21/68 條問題
也就是說,就算你跑了 3 遍 ARS 內(nèi)置的引用檢查,仍然有 1/3 的引用問題會漏檢
這數(shù)據(jù)放在這里,反而讓我更相信作者「human-in-the-loop」的堅持是對的。AI 永遠(yuǎn)會漏,但是把漏檢率從 100% 壓到 30%,再交給人收尾,這才是真正能用的工作流
總結(jié)
適合兩類人:
在讀研究生 :選題、文獻綜述、寫作風(fēng)格對齊這三塊直接受益
想發(fā)英文論文的中國研究者 :Style Calibration 能學(xué)你(或你導(dǎo)師)的英文寫作風(fēng)格,減少「AI 味」
整套架構(gòu)最值得抄的設(shè)計是「質(zhì)量閘門」—— 不是寫完一次性輸出,而是分階段卡住,每個階段都強制做完整性檢查。這套思路放到其他長鏈路 Agent 上也通用,搞 Agent 工程的兄弟可以單看 ai_research_failure_modes.md 那份清單,幾乎能直接搬到自己的產(chǎn)品里
許可證 CC BY-NC 4.0(非商用),學(xué)術(shù)使用沒問題
制作不易,如果這篇文章覺得對你有用,可否點個關(guān)注。給我個三連擊:點贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.