Lab4AI Skills — 全自动论文/项目复现工具集

源码仓库（Codeup）： lab4ai-skills

一套面向 AI Agent 的自动化技能包，覆盖 项目审计 → 论文解析 → 算力调度 → 环境构建 → 推理/训练 → 报告生成 的端到端论文复现全流程。

✨ 核心特性

🔍 智能项目审计 — 自动扫描 GitHub 仓库，评估复现可行性（依赖、环境、风险项）
📄 论文深度解析 — 提取 Baseline 指标、超参数、创新点，生成结构化报告
🖥️ 算力自动调度 — 一键创建/释放 Lab4AI CPU/GPU 实例，杜绝算力空转
🐘 大象库智能检测 — VTK、OpenCV、Boost 等大型 C++ 库自动走 apt 预编译，避免源码编译耗时爆炸
🔧 CUDA 特性智能剥离/恢复 — CPU 阶段自动剥离 CUDA 特性加速构建，GPU 阶段自动恢复
📊 工业级报告生成 — 自动排版 Word 文档，含指标对比表、排坑记录、超参数档案

📦 技能清单

Skill	说明	对应流水线阶段
lab4ai-project-analysis	项目复现可行性分析，输出评分和风险项	Step 1
lab4ai-paper-analysis	论文 PDF 解析，提取指标和超参数	Step 1
lab4ai-instance-manage	Lab4AI 实例创建与释放（CPU/GPU）	Step 3/5/6/9
lab4ai-project-prep	远程环境准备（系统库预装/大象库替代/Conda/依赖/数据/权重）	Step 4
lab4ai-auto-reproduct	复现流水线主控，编排所有 skill 的 9 步工作流	全流程
lab4ai-repro-report	生成 Word 格式复现报告	Step 8
lab4ai-auto-research	自动化训练实验技能包：`pipeline.yml` 驱动，分阶段 Markdown + Gate 管线	独立实验管线

lab4ai-auto-research：自动化训练实验

面向「训练实验」的另一条管线：按阶段拆分的 Markdown 技能文档 + pipeline.yml 机器可读索引（与上文 论文/项目复现 的 9 步流水线相互独立，可按任务选用）。

用管线驱动全流程（推荐智能体入口）

**lab4ai-auto-research/SKILL.md：说明如何读取 pipeline.yml**、按 stages 打开对应 skill_file、满足 gates、填写 placeholders 并执行 command_templates（含 Lab 分支与完成条件）。

技能流程（文件名 skill_01→skill_08）

skill_01lab_instance.md、skill_02policies.md、skill_03setup.md、skill_04environment.md、skill_05experiment_logging.md、skill_06loop.md、skill_07report.md、skill_08stop_instance.md（均位于 lab4ai-auto-research/scripts/）。

管线执行顺序（Gate / `pipeline.yml` 的 `stages`）

与上节文件名序一致。各 scripts/skill_0N….md 第一行标题为 Step N（N 与文件名 skill_0N 一致，1…8）；Gate log 中的 Step 1 / Step 2 / Step 2.5 / … 仍以 skill_02policies.md 为准，二者编号不完全相同。执行顺序：**skill_01lab_instance.md（文档 Step 1；Lab=yes 时对应 Gate Step 2）** → skill_02policies.md（Step 2） → skill_03setup.md（文档 Step 3；Gate Step 1） → skill_04environment.md（文档 Step 4；Gate Step 2.5） → …（余下见 pipeline.yml）。须在执行各段前通读 Gate 与 skill_02policies.md；Gate log 中 Step 1 / Step 2 可与管线非严格时间序达标，但进入 Step 2.5 前在适用时须均为 yes。

文件名序	文件	文档首行 Step	内容（Gate 阶段见上）
驱动	`SKILL.md`	—	如何调用 `pipeline.yml` 实现自动化实验
01	`scripts/skill_01lab_instance.md`	Step 1	实验室实例（仅 Lab=yes；`stages` 首段；先于 policies/setup；Gate Step 2）
02	`scripts/skill_02policies.md`	Step 2	Gate log、执行顺序、执行规则、命令展示、确认策略
03	`scripts/skill_03setup.md`	Step 3	项目路径、分支、`results.tsv`、入口与配置检测（Gate Step 1）
04	`scripts/skill_04environment.md`	Step 4	新建仅 conda；`scripts/create_env.md`（Lab=yes 时在 SSH 后的实例上执行；Gate Step 2.5）
05	`scripts/skill_05experiment_logging.md`	Step 5	实验范围、日志、`results.tsv` 行（Gate Step 3–4）
06	`scripts/skill_06loop.md`	Step 6	预循环确认 + `LOOP FOREVER`（Gate Step 5）
07	`scripts/skill_07report.md`	Step 7	`autoresearch_report.md`（Gate Step 6）
08	`scripts/skill_08stop_instance.md`	Step 8	`instance_stop`（Gate Step 7；仅 Gate Step 2 实验室曾执行）

实验室算力（Lab4AI）： Step 2（建实例）与 Step 7（关实例）均使用本仓库 **lab4ai-instance-manage**（相对 lab4ai-auto-research/ 为 **../lab4ai-instance-manage/SKILL.md**），对应 SKILL 第一节「创建实例」、第二节「关闭实例」及 scripts/create.py、scripts/stop.py。

Pipeline 集成

机器可读索引： lab4ai-auto-research/pipeline.yml
- skill_documents：每个 stages[].id 对应 skill_file 路径（相对 bundle 根目录 lab4ai-auto-research/，一般为 scripts/*.md）。
- global_policies 中的 document_section 指向 scripts/skill_02policies.md 中的章节标题。
冲突处理： 以 各 Step Markdown 正文 为准；更新流程时同步改 pipeline.yml 中的 skill_file / 描述。

仓库根目录的 `program.md`

项目根目录的 program.md（若提供）仅作入口跳转；完整说明在 lab4ai-auto-research/。

🚀 快速开始

前置条件

OpenClaw Agent 环境
Lab4AI 平台账号（用于算力调度）
认证凭证配置在 /root/.openclaw/.env

环境变量配置

在 /root/.openclaw/.env 中配置 Lab4AI 平台登录凭证（必填）：

# /root/.openclaw/.env

# Lab4AI 平台注册手机号（必填）
LAB4AI_PHONE=138xxxxxxxx

# Lab4AI 平台登录密码（必填）
LAB4AI_PASSWORD=your_password_here

⚠️ 安全提示：.env 文件包含敏感凭证，请勿提交到 Git 仓库。流水线中的实例创建和释放（Step 3/5/6/9）均依赖此配置自动登录平台获取 Token。

安装

# 克隆仓库
git clone https://codeup.aliyun.com/6864d2567151135f7b9b3601/LLaMaFactory-online/LLMclass/lab4ai-skills.git

# 将 skill 目录复制到 OpenClaw skills 目录
cp -r lab4ai-skills/lab4ai-* ~/.openclaw/skills/

# 安装 vendor 依赖（将 claw-shell、file-system、ssh-essentials 软链接到 skills 目录）
bash ~/.openclaw/skills/lab4ai-auto-reproduct/install.sh

使用方式

对 Agent 说：

复现这个项目 https://github.com/

或附带论文链接：

复现这个项目 https://github.com/
论文地址：https://arxiv.org/pdf/xxxx.xxxxx

Agent 会自动启动 9 步复现流水线。

📋 复现流水线全流程

┌─────────────────────────────────────────────────────┐
│  Step 1  项目审计 + 论文解析                          │
│          → 可行性评分、Baseline 指标、超参数提取        │
├─────────────────────────────────────────────────────┤
│  Step 2  复现可行性熔断判断                            │
│          → score < 60 自动终止，≥ 60 继续              │
├─────────────────────────────────────────────────────┤
│  Step 3  创建 CPU 实例（廉价算力做脏活）                │
├─────────────────────────────────────────────────────┤
│  Step 4  CPU 环境准备                                 │
│          → SSH 探活 + git clone                       │
│          → 系统基础库预装（GL/X11/编译工具）             │
│          → CMake 版本检测升级                          │
│          → 大象库检测（VTK/OpenCV 等走 apt 秒装）       │
│          → CUDA 特性剥离（CPU 无 GPU，记录供恢复）       │
│          → Conda 环境 + 依赖安装 + 数据/权重下载         │
├─────────────────────────────────────────────────────┤
│  Step 5  释放 CPU 实例                                │
├─────────────────────────────────────────────────────┤
│  Step 6  创建 GPU 实例（H100/H800A）                   │
├─────────────────────────────────────────────────────┤
│  Step 7  GPU 执行                                     │
│          → CUDA 特性恢复 + 系统库预装                   │
│          → CUDA 扩展编译（自愈排障）                     │
│          → Smoke Test 推理/训练                        │
│          → 指标抓取 + Baseline 对比                     │
│          → 环境补丁记录（env_patches.md）               │
├─────────────────────────────────────────────────────┤
│  Step 8  生成 Word 复现报告                            │
├─────────────────────────────────────────────────────┤
│  Step 9  释放 GPU 实例                                │
└─────────────────────────────────────────────────────┘

📁 项目代码、数据与模型目录规范

复现流水线在 Lab4AI 实例上严格遵循以下目录结构，代码、数据、模型权重三者分离：

/workspace/user-data/codelab/{repo_name}/
│
├── code/                          ← GitHub 代码（git clone 到此）
│   ├── requirements.txt
│   ├── CMakeLists.txt             ← C++ 项目构建文件（如有）
│   ├── vcpkg.json                 ← vcpkg 依赖声明（如有）
│   ├── cuda_features.json         ← [自动生成] CUDA 特性剥离记录
│   ├── data -> ../data            ← 软链接，项目代码可直接引用 ./data/
│   └── model -> ../model          ← 软链接，项目代码可直接引用 ./model/
│
├── data/                          ← 数据集存放（Step 4 下载）
│   ├── train/
│   ├── val/
│   └── ...
│
├── model/                         ← 模型权重存放（Step 4 下载）
│   ├── pretrained_models/
│   └── ...
│
├── env_patches.md                 ← [自动生成] 环境补丁记录（Step 7）
└── repro_run.log                  ← [自动生成] 推理/训练运行日志（Step 7）

Conda 环境路径：

/workspace/envs/{repo_name}/       ← 隔离的 Conda 虚拟环境（CPU/GPU 实例共享存储，无需重建）

路径设计说明

目录/文件	路径	说明
项目代码	`/workspace/user-data/codelab/{repo_name}/code/`	git clone 目标目录
数据集	`/workspace/user-data/codelab/{repo_name}/data/`	所有数据下载到此
模型权重	`/workspace/user-data/codelab/{repo_name}/model/`	所有权重下载到此
软链接 data	`code/data -> ../data`	项目代码中 `./data/` 路径无需修改
软链接 model	`code/model -> ../model`	项目代码中 `./model/` 路径无需修改
Conda 环境	`/workspace/envs/{repo_name}/`	CPU/GPU 实例共享，创建一次复用
CUDA 特性记录	`code/cuda_features.json`	CPU 阶段自动生成，GPU 阶段读取恢复
环境补丁记录	`env_patches.md`	Step 7 自动生成，记录构建系统修改
运行日志	`repro_run.log`	Step 7 推理/训练的完整终端日志

📤 输出文档

流水线执行完毕后，自动产出以下文档：

输出文件	路径	生成阶段	说明
综合审计报告	`/root/.openclaw/workspace/{repo_name}/{repo_name}_Audit_Report.md`	Step 1	项目可行性分析 + 论文 Baseline 指标 + 超参数，Markdown 格式
论文解析产物	`/root/.openclaw/workspace/paper_analysis/paper_analysis/{repo_name}/`	Step 1	论文 PDF 原文、提取文本、结构化报告（中间参考文件）
CUDA 特性记录	`/workspace/user-data/codelab/{repo_name}/code/cuda_features.json`	Step 4	CPU 阶段剥离的 CUDA 特性，JSON 格式，供 GPU 阶段恢复
环境补丁记录	`/workspace/user-data/codelab/{repo_name}/env_patches.md`	Step 7	对构建系统的所有修改（CMakeLists.txt、vcpkg.json、系统库等）
运行日志	`/workspace/user-data/codelab/{repo_name}/code/repro_run.log`	Step 7	推理/训练完整终端日志
复现报告（终极交付物）	`/root/.openclaw/workspace/{repo_name}/{repo_name}_Final_Repro_Report.docx`	Step 8	工业级 Word 文档，含项目档案、指标对比、排坑记录、超参数、优化建议

📊 复现案例

以下是已经通过本工具集完成端到端复现的真实项目：

#	项目名	GitHub	论文	项目类型	评分	复现结果
1	nanoGPT	karpathy/nanoGPT	—	LLM 训练	80/100	✅ 复现成功，全流程跑通
2	UP2You	zcai0612/UP2You	arXiv:2509.24817	3D 人像重建，纯推理	68/100	✅ 复现成功，H100 推理 5 分钟，输出 3D 模型
3	HypModalAlign	MCISLAB/HypModalAlign	arXiv:2510.27391	跨模态层次化对齐，训练类	75/100	✅ 复现成功，Smoke Test 训练方向正确
4	A2MADA-YOLO	HaoxingZhou/A2MADA-YOLO	—	域适应目标检测，训练类	60/100	✅ 复现成功，标准 YOLOv7 训练跑通
5	FreeFlow	changyu-hu/FreeFlow	NeurIPS 2025	流固耦合仿真，C++/CUDA	72/100	✅ 编译成功（催生了大象库检测等优化）
6	VLM-RMD-release	VLM-RMD/VLM-RMD-release	arXiv:2503.18349	人-物交互策略，ICLR 2026	8/100	❌ 熔断终止（仓库无可执行代码）

💡 案例 6 展示了熔断机制的实际效果：论文质量 78 分但代码仅 8 分，流水线在 Step 2 自动终止，避免浪费算力。

🐘 大象库智能检测

当项目依赖 VTK、OpenCV、Boost 等大型 C++ 库时，vcpkg 源码编译可能耗时数十分钟甚至数小时。本工具集会自动：

扫描 vcpkg.json 中的依赖
识别大象库（VTK → libvtk9-dev、OpenCV → libopencv-dev 等）
替换为 apt 预编译包（10 秒搞定）
移除 vcpkg.json 中对应条目，避免重复编译

当前支持的大象库：

库名	apt 替代包
VTK	`libvtk9-dev`
OpenCV	`libopencv-dev`
Boost	`libboost-all-dev`
CGAL	`libcgal-dev`
PCL	`libpcl-dev`
ITK	`libinsighttoolkit5-dev`

🔧 CUDA 特性智能剥离/恢复

针对 CPU 与 GPU 分阶段执行的场景：

CPU 阶段（Step 4）：自动检测 vcpkg 依赖中的 cuda 特性并剥离，生成 cuda_features.json 记录
GPU 阶段（Step 7）：读取记录文件，恢复 CUDA 特性，重新编译 CUDA 相关包

同时自动设置 vcpkg 优化参数：

VCPKG_MAX_CONCURRENCY=$(nproc) — 匹配实际 CPU 核数
VCPKG_BUILD_TYPE=release — 跳过 Debug 编译，节省一半时间

🛡️ 安全机制

资源保底释放：任何步骤失败时，自动释放已申请的算力实例，杜绝空转烧钱
熔断机制：可行性评分低于 60 分自动终止，不浪费算力
重试机制：依赖安装和权重下载自动重试 2 次
超时保护：环境准备阶段 2 小时超时自动终止

📁 Skill 源码目录结构

lab4ai-skills/
├── README.md
├── program.md                       # （可选）入口跳转，完整内容见 lab4ai-auto-research/
├── lab4ai-auto-research/            # 自动化训练实验管线（pipeline.yml + skill_01…08）
│   ├── SKILL.md
│   ├── pipeline.yml
│   └── scripts/
│       ├── skill_01lab_instance.md … skill_08stop_instance.md
│       └── create_env.md
├── lab4ai-auto-reproduct/           # 复现流水线主控
│   ├── SKILL.md                     # 技能说明与执行纪律
│   ├── project_reproduce.yaml       # 9 步工作流定义（核心编排文件）
│   ├── install.sh                   # 依赖安装脚本
│   └── vendor/                      # 内置依赖 skill
│       ├── claw-shell/              # Shell 命令执行
│       ├── file-system/             # 文件读写
│       └── ssh-essentials/          # SSH 连接
├── lab4ai-project-analysis/         # 项目可行性分析
│   ├── SKILL.md
│   └── scripts/main.py
├── lab4ai-paper-analysis/           # 论文解析
│   ├── SKILL.md
│   ├── skill.json
│   ├── scripts/analyze_paper.py
│   └── references/notes.md
├── lab4ai-instance-manage/          # 实例生命周期管理
│   ├── SKILL.md
│   └── scripts/
│       ├── create.py                # 创建实例
│       └── stop.py                  # 关闭实例
├── lab4ai-project-prep/             # 远程环境准备
│   ├── SKILL.md
│   ├── manifest.yaml
│   └── prep_runner.py               # 核心执行逻辑（含大象库检测/CUDA剥离）
└── lab4ai-repro-report/             # 报告生成
    ├── SKILL.md
    ├── manifest.yaml
    └── report_generator.py           # Word 文档生成引擎

🔄 更新日志

v1.1.0 (2026-04-11)

lab4ai-project-prep：新增系统基础库预装、大象库智能检测、CUDA 特性剥离、CMake 版本升级
lab4ai-auto-reproduct：Step 4 新增构建类型识别与 vcpkg_json_path 传参；Step 7 新增 CUDA 特性恢复和环境补丁记录
新增 README 项目文档

v1.0.0 (2026-04-08)

初始版本，完成 UP2You 项目端到端复现验证

📄 License

MIT