目录

awesome-ai4research-skills

搜集、试用、筛选开源 AI4Research agent / skill 仓库,按规范整理成可迁移的 skill 集合(catalog)。 迁移本身由 Phase 3 自动化完成、直接落到 OpenAIR——迁移产物不回流本仓库

工作模式:屏源 → 试用 → 整理(catalog)→ 筛选 → 迁移(Phase 3 自动化到 OpenAIR)

这个仓库是做什么的

OpenAIR 是通用智能科研平台,通过三层级机制(一级阶段 → 二级节点 → 三级原子技能)动态编排科研流程。OpenAIR 的能力由 skills/ 下的 SKILL.md + skill.yaml 承载,社区已有大量高质量开源 AI4Research 仓库可以直接吸纳。

本仓库的工作(只到搜集 + 整理为止):

  1. 屏源:从 awesome 列表 / 社区推荐中找候选开源仓库
  2. 试用:分工跑标准化 benchmark,按四维评估产出报告(trials/
  3. 整理(catalog):把试过的 skill 按规范收入 catalog/——skill 库原样复制、单体 agent 用 skill-creator 拆解。每条 = 一个自包含 skill 文件夹(entry.md + SKILL.md + 可选 assets//references//scripts/
  4. 筛选:评审会决定哪些进迁移队列

不做的事:本仓库不产出 OpenAIR 注册 skill(不写 skill.yaml / 不注册 registry / 不挂 pack)。迁移是真实工作,但由 Phase 3 设计自动化流程,把 catalog 里的 skill 直接迁进 OpenAIR skills/,产物归 OpenAIR 仓库。

OpenAIR 四阶段:

阶段 key 中文名 典型 substage
problem_modeling 问题建模 intent_understanding / literature_search / hypothesis_construction / gap_identification
solution_design 解法设计 new_task_planning / method_selection / experiment_design / variable_definition
execution_validation 解法验证 code_implementation / experiment_execution / data_analysis / result_validation
insight_generation 报告撰写 paper_writing / report_generation / claims_drafting / paper_slides

候选清单

按阶段归类(核心候选)

Stars 数据抓取于 2026-06-15。⭐ = Phase 1 试点。

阶段 1:问题建模(problem_modeling)

仓库 Stars 形态 说明
karpathy/autoresearch 87k 单体 agent 单 GPU 跑 ML 研究循环,autoresearch 范式标杆
stanford-oval/storm 28k ⭐ 单体 agent 多视角 LLM 生成 Wikipedia 式带引用报告,文献综述标杆
assafelovic/gpt-researcher 28k 单体 agent 端到端 deep research agent,可插 LLM
EvoScientist/EvoScientist 3.6k 单体 agent 自演化 AI Scientist(vibe research)
jataware/open-coscientist 44 多 agent Google AI Co-Scientist 开源实现,假说生成-评审-演化

阶段 2:解法设计(solution_design)

仓库 Stars 形态 说明
SakanaAI/AI-Scientist 14k ⭐ 单体 agent 端到端 idea→exp→paper 鼻祖,编排范式参考
SakanaAI/AI-Scientist-v2 6.6k 单体 agent Agentic tree search 编排
aiming-lab/AutoResearchClaw 13k 单体 agent Idea→Paper,支持 Co-Pilot 模式(人机协同契合 OpenAIR)
HKUDS/AI-Researcher 5.5k 单体 agent NeurIPS’25,含 Writer Agent

阶段 3:解法验证(execution_validation)

仓库 Stars 形态 说明
wanshuiyin/Auto-claude-code-research-in-sleep (ARIS) 12k ⭐ skill 库 纯 Markdown skills,跨 Claude Code/Codex/OpenClaw,形态最贴近 OpenAIR
mattmcdermott/novel-materials-screening - 工具 Ceder A-lab 自主材料筛选

阶段 4:报告撰写(insight_generation)

仓库 Stars 形态 说明
Orchestra-Research/AI-Research-SKILLs 9.7k ⭐ skill 库 22 个 ML 主题 skill 包,形态贴近 OpenAIR,cs_research pack 候选
teddynote-lab/STORM-Research-Assistant - 单体 agent STORM 中文社区版

跨阶段 skill 库(重点吸纳源)

仓库 Stars Skill 数 说明
ARIS(见上) 12k ~90 覆盖 OpenAIR sdr / cs_research 大半 substage,迁移 ROI 最高
AI-Research-SKILLs(见上) 9.7k 22 topic ML 领域特化,适合 cs_research pack

横向参考(awesome 类,不直接迁移)


工作流(4 阶段路线图)

Phase 周期 主要产出 计划文档
Phase 0 准备 已完成 仓库骨架 + benchmark 任务集 + 试用模板 + kickoff 文档 (见 benchmarks/templates/
Phase 1 试点 2 周 4 个高优仓库 × 4 阶段预选 skill 的标准化试用报告 + catalog 条目 docs/phase1-pilot-plan.md + docs/phase1-kickoff.md(致试用同学)
Phase 1 全量铺开 3-4 周 剩余候选仓库 + 试点仓库未覆盖 skill 的试用报告 docs/phase1-full-rollout-plan.md
Phase 2 筛选评审 1 周 推荐队列、迁移 Top 5-10 列表 docs/phase2-screening-plan.md
Phase 3 自动化迁移到 OpenAIR 2-3 周 自动化迁移流水线(读 catalog/ → 写 OpenAIR skills/<pack>/<migrated>/)+ 本仓库迁移回执 docs/phase3-migration-plan.md

Phase 1 试点(4 个仓库)

试点 阶段 形态 选它的理由
stanford-oval/storm problem_modeling 单体 agent 文献综述标杆,对照 sdr/literature_search
SakanaAI/AI-Scientist solution_design 单体 agent 全流程范式参考,编排逻辑
ARIS(Auto-Research-In-Sleep) execution_validation skill 库 形态最贴近 OpenAIR L3,迁移成本最低
Orchestra-Research/AI-Research-SKILLs insight_generation skill 库 直接是 skill 包,可逐条吸纳

每个试点仓库的 四阶段 skill 预选表docs/phase1-pilot-plan.md


仓库结构

awesome-ai4research-skills/
├── README.md                          # 本文件(候选清单 + 工作流概览)
├── LICENSE                            # MIT
├── CONTRIBUTING.md                    # 如何提交试用报告 / 提名候选
├── docs/
│   ├── phase1-pilot-plan.md           # 试点计划(含四阶段预选表)
│   ├── phase1-full-rollout-plan.md    # 全量铺开计划
│   ├── phase2-screening-plan.md       # 筛选评审方法
│   └── phase3-migration-plan.md       # 自动化迁移到 OpenAIR 流程
├── templates/
│   ├── trial-report.md                # 试用报告模板(四维评估)
│   └── catalog-entry.md               # catalog 条目记录模板(entry.md)
├── trials/                            # 试用报告产出(Phase 1 填充)
├── scratch/                           # 试用实际产出(<owner>-<repo>-<scope>/,随报告入库;单文件 >1MB 走外链)
├── catalog/                           # 搜集整理后的 skill(每条 = 一个文件夹)
│   ├── README.md                      # 结构 + 命名 + 边界 + 拆解规则
│   ├── problem_modeling/
│   ├── solution_design/
│   ├── execution_validation/
│   └── insight_generation/
│       └── <owner>-<repo>-<skill>/    # entry.md + SKILL.md + assets/references/scripts
├── benchmarks/                        # 阶段 benchmark 任务(Phase 0 填充)
└── recommendations.md                 # 推荐队列(Phase 2 填充)

评分公式

总分 = 产出质量 × 0.40 + OpenAIR 契合度 × 0.25
     + 工程可维护性 × 0.20 + 运行成本(反向) × 0.15
  • ≥ 4.0 进 OpenAIR skill 迁移队列
  • 3.0 - 3.9 进 awesome 仓库作参考条目
  • < 3.0 不收录

详见 docs/phase2-screening-plan.md


如何参与

  1. docs/phase1-pilot-plan.md 找一个未认领的仓库 / skill
  2. CONTRIBUTING.md 流程提交试用报告
  3. 评审会收录高分报告至 recommendations.md
关于
25.3 MB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

版权所有:中国计算机学会技术支持:开源发展技术委员会
京ICP备13000930号-9 京公网安备 11010802047560号