awesome-ai4research-skills

搜集、试用、筛选开源 AI4Research agent / skill 仓库，按规范整理成可迁移的 skill 集合（catalog）。迁移本身由 Phase 3 自动化完成、直接落到 OpenAIR——迁移产物不回流本仓库。

工作模式：屏源 → 试用 → 整理（catalog）→ 筛选 → 迁移（Phase 3 自动化到 OpenAIR）。

这个仓库是做什么的

OpenAIR 是通用智能科研平台，通过三层级机制（一级阶段 → 二级节点 → 三级原子技能）动态编排科研流程。OpenAIR 的能力由 skills/ 下的 SKILL.md + skill.yaml 承载，社区已有大量高质量开源 AI4Research 仓库可以直接吸纳。

本仓库的工作（只到搜集 + 整理为止）：

屏源：从 awesome 列表 / 社区推荐中找候选开源仓库
试用：分工跑标准化 benchmark，按四维评估产出报告（trials/）
整理（catalog）：把试过的 skill 按规范收入 catalog/——skill 库原样复制、单体 agent 用 skill-creator 拆解。每条 = 一个自包含 skill 文件夹（entry.md + SKILL.md + 可选 assets//references//scripts/）
筛选：评审会决定哪些进迁移队列

不做的事：本仓库不产出 OpenAIR 注册 skill（不写 skill.yaml / 不注册 registry / 不挂 pack）。迁移是真实工作，但由 Phase 3 设计自动化流程，把 catalog 里的 skill 直接迁进 OpenAIR skills/，产物归 OpenAIR 仓库。

OpenAIR 四阶段：

阶段 key	中文名	典型 substage
`problem_modeling`	问题建模	`intent_understanding` / `literature_search` / `hypothesis_construction` / `gap_identification`
`solution_design`	解法设计	`new_task_planning` / `method_selection` / `experiment_design` / `variable_definition`
`execution_validation`	解法验证	`code_implementation` / `experiment_execution` / `data_analysis` / `result_validation`
`insight_generation`	报告撰写	`paper_writing` / `report_generation` / `claims_drafting` / `paper_slides`

候选清单

按阶段归类（核心候选）

Stars 数据抓取于 2026-06-15。⭐ = Phase 1 试点。

阶段 1：问题建模（problem_modeling）

仓库	Stars	形态	说明
karpathy/autoresearch	87k	单体 agent	单 GPU 跑 ML 研究循环，autoresearch 范式标杆
stanford-oval/storm	28k ⭐	单体 agent	多视角 LLM 生成 Wikipedia 式带引用报告，文献综述标杆
assafelovic/gpt-researcher	28k	单体 agent	端到端 deep research agent，可插 LLM
EvoScientist/EvoScientist	3.6k	单体 agent	自演化 AI Scientist（vibe research）
jataware/open-coscientist	44	多 agent	Google AI Co-Scientist 开源实现，假说生成-评审-演化

阶段 2：解法设计（solution_design）

仓库	Stars	形态	说明
SakanaAI/AI-Scientist	14k ⭐	单体 agent	端到端 idea→exp→paper 鼻祖，编排范式参考
SakanaAI/AI-Scientist-v2	6.6k	单体 agent	Agentic tree search 编排
aiming-lab/AutoResearchClaw	13k	单体 agent	Idea→Paper，支持 Co-Pilot 模式（人机协同契合 OpenAIR）
HKUDS/AI-Researcher	5.5k	单体 agent	NeurIPS’25，含 Writer Agent

阶段 3：解法验证（execution_validation）

仓库	Stars	形态	说明
wanshuiyin/Auto-claude-code-research-in-sleep (ARIS)	12k ⭐	skill 库	纯 Markdown skills，跨 Claude Code/Codex/OpenClaw，形态最贴近 OpenAIR
mattmcdermott/novel-materials-screening	-	工具	Ceder A-lab 自主材料筛选

阶段 4：报告撰写（insight_generation）

仓库	Stars	形态	说明
Orchestra-Research/AI-Research-SKILLs	9.7k ⭐	skill 库	22 个 ML 主题 skill 包，形态贴近 OpenAIR，cs_research pack 候选
teddynote-lab/STORM-Research-Assistant	-	单体 agent	STORM 中文社区版

跨阶段 skill 库（重点吸纳源）

仓库	Stars	Skill 数	说明
ARIS（见上）	12k	~90	覆盖 OpenAIR sdr / cs_research 大半 substage，迁移 ROI 最高
AI-Research-SKILLs（见上）	9.7k	22 topic	ML 领域特化，适合 cs_research pack

横向参考（awesome 类，不直接迁移）

ai-boost/awesome-ai-for-science — 1.6k stars，按学科分类
OSU-NLP-Group/awesome-agents4science — 论文索引
harrytju/Awesome-AI4Research-Scientific-Discovery — 与本倡议最接近
ResearAI/Awesome-AI-Scientist — AI Scientist 研究综述
alvinreal/awesome-autoresearch — autoresearch 系生态

工作流（4 阶段路线图）

Phase	周期	主要产出	计划文档
Phase 0 准备	已完成	仓库骨架 + benchmark 任务集 + 试用模板 + kickoff 文档	（见 benchmarks/ 和 templates/）
Phase 1 试点	2 周	4 个高优仓库 × 4 阶段预选 skill 的标准化试用报告 + catalog 条目	docs/phase1-pilot-plan.md + docs/phase1-kickoff.md（致试用同学）
Phase 1 全量铺开	3-4 周	剩余候选仓库 + 试点仓库未覆盖 skill 的试用报告	docs/phase1-full-rollout-plan.md
Phase 2 筛选评审	1 周	推荐队列、迁移 Top 5-10 列表	docs/phase2-screening-plan.md
Phase 3 自动化迁移到 OpenAIR	2-3 周	自动化迁移流水线（读 catalog/ → 写 OpenAIR `skills/<pack>/<migrated>/`）+ 本仓库迁移回执	docs/phase3-migration-plan.md

Phase 1 试点（4 个仓库）

试点	阶段	形态	选它的理由
`stanford-oval/storm`	problem_modeling	单体 agent	文献综述标杆，对照 sdr/`literature_search`
`SakanaAI/AI-Scientist`	solution_design	单体 agent	全流程范式参考，编排逻辑
ARIS（Auto-Research-In-Sleep）	execution_validation	skill 库	形态最贴近 OpenAIR L3，迁移成本最低
`Orchestra-Research/AI-Research-SKILLs`	insight_generation	skill 库	直接是 skill 包，可逐条吸纳

每个试点仓库的 四阶段 skill 预选表 见 docs/phase1-pilot-plan.md。

仓库结构

awesome-ai4research-skills/
├── README.md                          # 本文件（候选清单 + 工作流概览）
├── LICENSE                            # MIT
├── CONTRIBUTING.md                    # 如何提交试用报告 / 提名候选
├── docs/
│   ├── phase1-pilot-plan.md           # 试点计划（含四阶段预选表）
│   ├── phase1-full-rollout-plan.md    # 全量铺开计划
│   ├── phase2-screening-plan.md       # 筛选评审方法
│   └── phase3-migration-plan.md       # 自动化迁移到 OpenAIR 流程
├── templates/
│   ├── trial-report.md                # 试用报告模板（四维评估）
│   └── catalog-entry.md               # catalog 条目记录模板（entry.md）
├── trials/                            # 试用报告产出（Phase 1 填充）
├── scratch/                           # 试用实际产出（<owner>-<repo>-<scope>/，随报告入库；单文件 >1MB 走外链）
├── catalog/                           # 搜集整理后的 skill（每条 = 一个文件夹）
│   ├── README.md                      # 结构 + 命名 + 边界 + 拆解规则
│   ├── problem_modeling/
│   ├── solution_design/
│   ├── execution_validation/
│   └── insight_generation/
│       └── <owner>-<repo>-<skill>/    # entry.md + SKILL.md + assets/references/scripts
├── benchmarks/                        # 阶段 benchmark 任务（Phase 0 填充）
└── recommendations.md                 # 推荐队列（Phase 2 填充）

评分公式

总分 = 产出质量 × 0.40 + OpenAIR 契合度 × 0.25
     + 工程可维护性 × 0.20 + 运行成本(反向) × 0.15

≥ 4.0 进 OpenAIR skill 迁移队列
3.0 - 3.9 进 awesome 仓库作参考条目
< 3.0 不收录

详见 docs/phase2-screening-plan.md。

如何参与

看 docs/phase1-pilot-plan.md 找一个未认领的仓库 / skill
按 CONTRIBUTING.md 流程提交试用报告
评审会收录高分报告至 recommendations.md