目录

awesome-ai4research-skills

搜集、试用、筛选开源 AI4Research agent / skill 仓库,把高价值的迁移为 OpenAIR skill。

工作模式:屏源 → 试用 → 筛选 → 迁移,所有试用产出沉淀为本仓库的标准化报告。

这个仓库是做什么的

OpenAIR 是通用智能科研平台,通过三层级机制(一级阶段 → 二级节点 → 三级原子技能)动态编排科研流程。OpenAIR 的能力由 skills/ 下的 SKILL.md + skill.yaml 承载,社区已有大量高质量开源 AI4Research 仓库可以直接吸纳。

本仓库的工作:

  1. 屏源:从 awesome 列表 / 社区推荐中找候选开源仓库
  2. 试用:分工跑标准化 benchmark,按四维评估产出报告
  3. 筛选:评审会决定哪些进迁移队列
  4. 迁移:按 openair-skill-guider 流程把精选 skill 迁移为 OpenAIR 格式

OpenAIR 四阶段:

阶段 key 中文名 典型 substage
problem_modeling 问题建模 intent_understanding / literature_search / hypothesis_construction / gap_identification
solution_design 解法设计 new_task_planning / method_selection / experiment_design / variable_definition
execution_validation 解法验证 code_implementation / experiment_execution / data_analysis / result_validation
insight_generation 报告撰写 paper_writing / report_generation / claims_drafting / paper_slides

候选清单

按阶段归类(核心候选)

Stars 数据抓取于 2026-06-15。⭐ = Phase 1 试点。

阶段 1:问题建模(problem_modeling)

仓库 Stars 形态 说明
karpathy/autoresearch 87k 单体 agent 单 GPU 跑 ML 研究循环,autoresearch 范式标杆
stanford-oval/storm 28k ⭐ 单体 agent 多视角 LLM 生成 Wikipedia 式带引用报告,文献综述标杆
assafelovic/gpt-researcher 28k 单体 agent 端到端 deep research agent,可插 LLM
EvoScientist/EvoScientist 3.6k 单体 agent 自演化 AI Scientist(vibe research)
jataware/open-coscientist 44 多 agent Google AI Co-Scientist 开源实现,假说生成-评审-演化

阶段 2:解法设计(solution_design)

仓库 Stars 形态 说明
SakanaAI/AI-Scientist 14k ⭐ 单体 agent 端到端 idea→exp→paper 鼻祖,编排范式参考
SakanaAI/AI-Scientist-v2 6.6k 单体 agent Agentic tree search 编排
aiming-lab/AutoResearchClaw 13k 单体 agent Idea→Paper,支持 Co-Pilot 模式(人机协同契合 OpenAIR)
HKUDS/AI-Researcher 5.5k 单体 agent NeurIPS’25,含 Writer Agent

阶段 3:解法验证(execution_validation)

仓库 Stars 形态 说明
wanshuiyin/Auto-claude-code-research-in-sleep (ARIS) 12k ⭐ skill 库 纯 Markdown skills,跨 Claude Code/Codex/OpenClaw,形态最贴近 OpenAIR
mattmcdermott/novel-materials-screening - 工具 Ceder A-lab 自主材料筛选

阶段 4:报告撰写(insight_generation)

仓库 Stars 形态 说明
Orchestra-Research/AI-Research-SKILLs 9.7k ⭐ skill 库 22 个 ML 主题 skill 包,形态贴近 OpenAIR,cs_research pack 候选
teddynote-lab/STORM-Research-Assistant - 单体 agent STORM 中文社区版

跨阶段 skill 库(重点吸纳源)

仓库 Stars Skill 数 说明
ARIS(见上) 12k ~90 覆盖 OpenAIR sdr / cs_research 大半 substage,迁移 ROI 最高
AI-Research-SKILLs(见上) 9.7k 22 topic ML 领域特化,适合 cs_research pack

横向参考(awesome 类,不直接迁移)


工作流(4 阶段路线图)

Phase 周期 主要产出 计划文档
Phase 0 准备 已完成 仓库骨架 + benchmark 任务集 + 试用模板 + kickoff 文档 (见 benchmarks/templates/
Phase 1 试点 2 周 4 个高优仓库 × 4 阶段预选 skill 的标准化试用报告 + catalog 条目 docs/phase1-pilot-plan.md + docs/phase1-kickoff.md(致试用同学)
Phase 1 全量铺开 3-4 周 剩余候选仓库 + 试点仓库未覆盖 skill 的试用报告 docs/phase1-full-rollout-plan.md
Phase 2 筛选评审 1 周 推荐队列、迁移 Top 5-10 列表 docs/phase2-screening-plan.md
Phase 3 迁移为 OpenAIR skill 2-3 周 skills/<pack>/<migrated>/ 迁移产物 + fixture docs/phase3-migration-plan.md

Phase 1 试点(4 个仓库)

试点 阶段 形态 选它的理由
stanford-oval/storm problem_modeling 单体 agent 文献综述标杆,对照 sdr/literature_search
SakanaAI/AI-Scientist solution_design 单体 agent 全流程范式参考,编排逻辑
ARIS(Auto-Research-In-Sleep) execution_validation skill 库 形态最贴近 OpenAIR L3,迁移成本最低
Orchestra-Research/AI-Research-SKILLs insight_generation skill 库 直接是 skill 包,可逐条吸纳

每个试点仓库的 四阶段 skill 预选表docs/phase1-pilot-plan.md


仓库结构

awesome-ai4research-skills/
├── README.md                          # 本文件(候选清单 + 工作流概览)
├── LICENSE                            # MIT
├── CONTRIBUTING.md                    # 如何提交试用报告 / 提名候选
├── docs/
│   ├── phase1-pilot-plan.md           # 试点计划(含四阶段预选表)
│   ├── phase1-full-rollout-plan.md    # 全量铺开计划
│   ├── phase2-screening-plan.md       # 筛选评审方法
│   └── phase3-migration-plan.md       # 迁移为 OpenAIR skill 流程
├── templates/
│   ├── trial-report.md                # 试用报告模板(四维评估)
│   └── catalog-entry.md               # catalog 条目模板(标准化 SKILL)
├── trials/                            # 试用报告产出(Phase 1 填充)
├── catalog/                           # 标准化 skill 条目(按阶段归类)
│   ├── README.md                      # 索引 + 命名规则
│   ├── problem_modeling/
│   ├── solution_design/
│   ├── execution_validation/
│   └── insight_generation/
├── benchmarks/                        # 阶段 benchmark 任务(Phase 0 填充)
└── recommendations.md                 # 推荐队列(Phase 2 填充)

评分公式

总分 = 产出质量 × 0.40 + OpenAIR 契合度 × 0.25
     + 工程可维护性 × 0.20 + 运行成本(反向) × 0.15
  • ≥ 4.0 进 OpenAIR skill 迁移队列
  • 3.0 - 3.9 进 awesome 仓库作参考条目
  • < 3.0 不收录

详见 docs/phase2-screening-plan.md


如何参与

  1. docs/phase1-pilot-plan.md 找一个未认领的仓库 / skill
  2. CONTRIBUTING.md 流程提交试用报告
  3. 评审会收录高分报告至 recommendations.md
关于
161.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

版权所有:中国计算机学会技术支持:开源发展技术委员会
京ICP备13000930号-9 京公网安备 11010802047560号