lab4ai-auto-research: block stage skip before Lab choice Require an explicit yes/no answer for Lab instance creation before allowing skill_01 to be skipped, and block all downstream stages while the choice is unresolved. Made-with: Cursor
lab4ai-auto-research: block stage skip before Lab choice
Require an explicit yes/no answer for Lab instance creation before allowing skill_01 to be skipped, and block all downstream stages while the choice is unresolved.
Made-with: Cursor
源码仓库(Codeup): lab4ai-skills
一套面向 AI Agent 的自动化技能包,覆盖 项目审计 → 论文解析 → 算力调度 → 环境构建 → 推理/训练 → 报告生成 的端到端论文复现全流程。
pipeline.yml
面向「训练实验」的另一条管线:按阶段拆分的 Markdown 技能文档 + pipeline.yml 机器可读索引(与上文 论文/项目复现 的 9 步流水线相互独立,可按任务选用)。
lab4ai-auto-research/SKILL.md
stages
skill_file
gates
placeholders
command_templates
skill_01lab_instance.md、skill_02policies.md、skill_03setup.md、skill_04environment.md、skill_05experiment_logging.md、skill_06loop.md、skill_07report.md、skill_08stop_instance.md(均位于 lab4ai-auto-research/scripts/)。
skill_01lab_instance.md
skill_02policies.md
skill_03setup.md
skill_04environment.md
skill_05experiment_logging.md
skill_06loop.md
skill_07report.md
skill_08stop_instance.md
lab4ai-auto-research/scripts/
与上节文件名序一致。各 scripts/skill_0N….md 第一行标题为 Step N(N 与文件名 skill_0N 一致,1…8);Gate log 中的 Step 1 / Step 2 / Step 2.5 / … 仍以 skill_02policies.md 为准,二者编号不完全相同。执行顺序:**skill_01lab_instance.md(文档 Step 1;Lab=yes 时对应 Gate Step 2)** → skill_02policies.md(Step 2) → skill_03setup.md(文档 Step 3;Gate Step 1) → skill_04environment.md(文档 Step 4;Gate Step 2.5) → …(余下见 pipeline.yml)。须在执行各段前通读 Gate 与 skill_02policies.md;Gate log 中 Step 1 / Step 2 可与管线非严格时间序达标,但进入 Step 2.5 前在适用时须均为 yes。
scripts/skill_0N….md
skill_0N
SKILL.md
scripts/skill_01lab_instance.md
scripts/skill_02policies.md
scripts/skill_03setup.md
results.tsv
scripts/skill_04environment.md
scripts/create_env.md
scripts/skill_05experiment_logging.md
scripts/skill_06loop.md
LOOP FOREVER
scripts/skill_07report.md
autoresearch_report.md
scripts/skill_08stop_instance.md
instance_stop
实验室算力(Lab4AI): Step 2(建实例)与 Step 7(关实例)均使用本仓库 **lab4ai-instance-manage**(相对 lab4ai-auto-research/ 为 **../lab4ai-instance-manage/SKILL.md**),对应 SKILL 第一节「创建实例」、第二节「关闭实例」及 scripts/create.py、scripts/stop.py。
lab4ai-instance-manage
lab4ai-auto-research/
../lab4ai-instance-manage/SKILL.md
scripts/create.py
scripts/stop.py
lab4ai-auto-research/pipeline.yml
skill_documents
stages[].id
scripts/*.md
global_policies
document_section
program.md
项目根目录的 program.md(若提供)仅作入口跳转;完整说明在 lab4ai-auto-research/。
/root/.openclaw/.env
在 /root/.openclaw/.env 中配置 Lab4AI 平台登录凭证(必填):
# /root/.openclaw/.env # Lab4AI 平台注册手机号(必填) LAB4AI_PHONE=138xxxxxxxx # Lab4AI 平台登录密码(必填) LAB4AI_PASSWORD=your_password_here
⚠️ 安全提示:.env 文件包含敏感凭证,请勿提交到 Git 仓库。流水线中的实例创建和释放(Step 3/5/6/9)均依赖此配置自动登录平台获取 Token。
.env
# 克隆仓库 git clone https://codeup.aliyun.com/6864d2567151135f7b9b3601/LLaMaFactory-online/LLMclass/lab4ai-skills.git # 将 skill 目录复制到 OpenClaw skills 目录 cp -r lab4ai-skills/lab4ai-* ~/.openclaw/skills/ # 安装 vendor 依赖(将 claw-shell、file-system、ssh-essentials 软链接到 skills 目录) bash ~/.openclaw/skills/lab4ai-auto-reproduct/install.sh
对 Agent 说:
复现这个项目 https://github.com/
或附带论文链接:
复现这个项目 https://github.com/ 论文地址:https://arxiv.org/pdf/xxxx.xxxxx
Agent 会自动启动 9 步复现流水线。
┌─────────────────────────────────────────────────────┐ │ Step 1 项目审计 + 论文解析 │ │ → 可行性评分、Baseline 指标、超参数提取 │ ├─────────────────────────────────────────────────────┤ │ Step 2 复现可行性熔断判断 │ │ → score < 60 自动终止,≥ 60 继续 │ ├─────────────────────────────────────────────────────┤ │ Step 3 创建 CPU 实例(廉价算力做脏活) │ ├─────────────────────────────────────────────────────┤ │ Step 4 CPU 环境准备 │ │ → SSH 探活 + git clone │ │ → 系统基础库预装(GL/X11/编译工具) │ │ → CMake 版本检测升级 │ │ → 大象库检测(VTK/OpenCV 等走 apt 秒装) │ │ → CUDA 特性剥离(CPU 无 GPU,记录供恢复) │ │ → Conda 环境 + 依赖安装 + 数据/权重下载 │ ├─────────────────────────────────────────────────────┤ │ Step 5 释放 CPU 实例 │ ├─────────────────────────────────────────────────────┤ │ Step 6 创建 GPU 实例(H100/H800A) │ ├─────────────────────────────────────────────────────┤ │ Step 7 GPU 执行 │ │ → CUDA 特性恢复 + 系统库预装 │ │ → CUDA 扩展编译(自愈排障) │ │ → Smoke Test 推理/训练 │ │ → 指标抓取 + Baseline 对比 │ │ → 环境补丁记录(env_patches.md) │ ├─────────────────────────────────────────────────────┤ │ Step 8 生成 Word 复现报告 │ ├─────────────────────────────────────────────────────┤ │ Step 9 释放 GPU 实例 │ └─────────────────────────────────────────────────────┘
复现流水线在 Lab4AI 实例上严格遵循以下目录结构,代码、数据、模型权重三者分离:
/workspace/user-data/codelab/{repo_name}/ │ ├── code/ ← GitHub 代码(git clone 到此) │ ├── requirements.txt │ ├── CMakeLists.txt ← C++ 项目构建文件(如有) │ ├── vcpkg.json ← vcpkg 依赖声明(如有) │ ├── cuda_features.json ← [自动生成] CUDA 特性剥离记录 │ ├── data -> ../data ← 软链接,项目代码可直接引用 ./data/ │ └── model -> ../model ← 软链接,项目代码可直接引用 ./model/ │ ├── data/ ← 数据集存放(Step 4 下载) │ ├── train/ │ ├── val/ │ └── ... │ ├── model/ ← 模型权重存放(Step 4 下载) │ ├── pretrained_models/ │ └── ... │ ├── env_patches.md ← [自动生成] 环境补丁记录(Step 7) └── repro_run.log ← [自动生成] 推理/训练运行日志(Step 7)
Conda 环境路径:
/workspace/envs/{repo_name}/ ← 隔离的 Conda 虚拟环境(CPU/GPU 实例共享存储,无需重建)
/workspace/user-data/codelab/{repo_name}/code/
/workspace/user-data/codelab/{repo_name}/data/
/workspace/user-data/codelab/{repo_name}/model/
code/data -> ../data
./data/
code/model -> ../model
./model/
/workspace/envs/{repo_name}/
code/cuda_features.json
env_patches.md
repro_run.log
流水线执行完毕后,自动产出以下文档:
/root/.openclaw/workspace/{repo_name}/{repo_name}_Audit_Report.md
/root/.openclaw/workspace/paper_analysis/paper_analysis/{repo_name}/
/workspace/user-data/codelab/{repo_name}/code/cuda_features.json
/workspace/user-data/codelab/{repo_name}/env_patches.md
/workspace/user-data/codelab/{repo_name}/code/repro_run.log
/root/.openclaw/workspace/{repo_name}/{repo_name}_Final_Repro_Report.docx
以下是已经通过本工具集完成端到端复现的真实项目:
💡 案例 6 展示了熔断机制的实际效果:论文质量 78 分但代码仅 8 分,流水线在 Step 2 自动终止,避免浪费算力。
当项目依赖 VTK、OpenCV、Boost 等大型 C++ 库时,vcpkg 源码编译可能耗时数十分钟甚至数小时。本工具集会自动:
vcpkg.json
libvtk9-dev
libopencv-dev
当前支持的大象库:
libboost-all-dev
libcgal-dev
libpcl-dev
libinsighttoolkit5-dev
针对 CPU 与 GPU 分阶段执行的场景:
cuda
cuda_features.json
同时自动设置 vcpkg 优化参数:
VCPKG_MAX_CONCURRENCY=$(nproc)
VCPKG_BUILD_TYPE=release
lab4ai-skills/ ├── README.md ├── program.md # (可选)入口跳转,完整内容见 lab4ai-auto-research/ ├── lab4ai-auto-research/ # 自动化训练实验管线(pipeline.yml + skill_01…08) │ ├── SKILL.md │ ├── pipeline.yml │ └── scripts/ │ ├── skill_01lab_instance.md … skill_08stop_instance.md │ └── create_env.md ├── lab4ai-auto-reproduct/ # 复现流水线主控 │ ├── SKILL.md # 技能说明与执行纪律 │ ├── project_reproduce.yaml # 9 步工作流定义(核心编排文件) │ ├── install.sh # 依赖安装脚本 │ └── vendor/ # 内置依赖 skill │ ├── claw-shell/ # Shell 命令执行 │ ├── file-system/ # 文件读写 │ └── ssh-essentials/ # SSH 连接 ├── lab4ai-project-analysis/ # 项目可行性分析 │ ├── SKILL.md │ └── scripts/main.py ├── lab4ai-paper-analysis/ # 论文解析 │ ├── SKILL.md │ ├── skill.json │ ├── scripts/analyze_paper.py │ └── references/notes.md ├── lab4ai-instance-manage/ # 实例生命周期管理 │ ├── SKILL.md │ └── scripts/ │ ├── create.py # 创建实例 │ └── stop.py # 关闭实例 ├── lab4ai-project-prep/ # 远程环境准备 │ ├── SKILL.md │ ├── manifest.yaml │ └── prep_runner.py # 核心执行逻辑(含大象库检测/CUDA剥离) └── lab4ai-repro-report/ # 报告生成 ├── SKILL.md ├── manifest.yaml └── report_generator.py # Word 文档生成引擎
vcpkg_json_path
MIT
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802032778号
Lab4AI Skills — 全自动论文/项目复现工具集
源码仓库(Codeup): lab4ai-skills
✨ 核心特性
📦 技能清单
pipeline.yml驱动,分阶段 Markdown + Gate 管线lab4ai-auto-research:自动化训练实验
面向「训练实验」的另一条管线:按阶段拆分的 Markdown 技能文档 +
pipeline.yml机器可读索引(与上文 论文/项目复现 的 9 步流水线相互独立,可按任务选用)。用管线驱动全流程(推荐智能体入口)
lab4ai-auto-research/SKILL.md:说明如何读取pipeline.yml**、按stages打开对应skill_file、满足gates、填写placeholders并执行command_templates(含 Lab 分支与完成条件)。技能流程(文件名 skill_01→skill_08)
skill_01lab_instance.md、skill_02policies.md、skill_03setup.md、skill_04environment.md、skill_05experiment_logging.md、skill_06loop.md、skill_07report.md、skill_08stop_instance.md(均位于lab4ai-auto-research/scripts/)。管线执行顺序(Gate /
pipeline.yml的stages)与上节文件名序一致。各
scripts/skill_0N….md第一行标题为 Step N(N 与文件名skill_0N一致,1…8);Gate log 中的 Step 1 / Step 2 / Step 2.5 / … 仍以skill_02policies.md为准,二者编号不完全相同。执行顺序:**skill_01lab_instance.md(文档 Step 1;Lab=yes 时对应 Gate Step 2)** →skill_02policies.md(Step 2) →skill_03setup.md(文档 Step 3;Gate Step 1) →skill_04environment.md(文档 Step 4;Gate Step 2.5) → …(余下见pipeline.yml)。须在执行各段前通读 Gate 与skill_02policies.md;Gate log 中 Step 1 / Step 2 可与管线非严格时间序达标,但进入 Step 2.5 前在适用时须均为 yes。SKILL.mdpipeline.yml实现自动化实验scripts/skill_01lab_instance.mdstages首段;先于 policies/setup;Gate Step 2)scripts/skill_02policies.mdscripts/skill_03setup.mdresults.tsv、入口与配置检测(Gate Step 1)scripts/skill_04environment.mdscripts/create_env.md(Lab=yes 时在 SSH 后的实例上执行;Gate Step 2.5)scripts/skill_05experiment_logging.mdresults.tsv行(Gate Step 3–4)scripts/skill_06loop.mdLOOP FOREVER(Gate Step 5)scripts/skill_07report.mdautoresearch_report.md(Gate Step 6)scripts/skill_08stop_instance.mdinstance_stop(Gate Step 7;仅 Gate Step 2 实验室曾执行)实验室算力(Lab4AI): Step 2(建实例)与 Step 7(关实例)均使用本仓库 **
lab4ai-instance-manage**(相对lab4ai-auto-research/为 **../lab4ai-instance-manage/SKILL.md**),对应 SKILL 第一节「创建实例」、第二节「关闭实例」及scripts/create.py、scripts/stop.py。Pipeline 集成
lab4ai-auto-research/pipeline.ymlskill_documents:每个stages[].id对应skill_file路径(相对 bundle 根目录lab4ai-auto-research/,一般为scripts/*.md)。global_policies中的document_section指向scripts/skill_02policies.md中的章节标题。pipeline.yml中的skill_file/ 描述。仓库根目录的
program.md项目根目录的
program.md(若提供)仅作入口跳转;完整说明在lab4ai-auto-research/。🚀 快速开始
前置条件
/root/.openclaw/.env环境变量配置
在
/root/.openclaw/.env中配置 Lab4AI 平台登录凭证(必填):安装
使用方式
对 Agent 说:
或附带论文链接:
Agent 会自动启动 9 步复现流水线。
📋 复现流水线全流程
📁 项目代码、数据与模型目录规范
复现流水线在 Lab4AI 实例上严格遵循以下目录结构,代码、数据、模型权重三者分离:
Conda 环境路径:
路径设计说明
/workspace/user-data/codelab/{repo_name}/code//workspace/user-data/codelab/{repo_name}/data//workspace/user-data/codelab/{repo_name}/model/code/data -> ../data./data/路径无需修改code/model -> ../model./model/路径无需修改/workspace/envs/{repo_name}/code/cuda_features.jsonenv_patches.mdrepro_run.log📤 输出文档
流水线执行完毕后,自动产出以下文档:
/root/.openclaw/workspace/{repo_name}/{repo_name}_Audit_Report.md/root/.openclaw/workspace/paper_analysis/paper_analysis/{repo_name}//workspace/user-data/codelab/{repo_name}/code/cuda_features.json/workspace/user-data/codelab/{repo_name}/env_patches.md/workspace/user-data/codelab/{repo_name}/code/repro_run.log/root/.openclaw/workspace/{repo_name}/{repo_name}_Final_Repro_Report.docx📊 复现案例
以下是已经通过本工具集完成端到端复现的真实项目:
🐘 大象库智能检测
当项目依赖 VTK、OpenCV、Boost 等大型 C++ 库时,vcpkg 源码编译可能耗时数十分钟甚至数小时。本工具集会自动:
vcpkg.json中的依赖libvtk9-dev、OpenCV →libopencv-dev等)当前支持的大象库:
libvtk9-devlibopencv-devlibboost-all-devlibcgal-devlibpcl-devlibinsighttoolkit5-dev🔧 CUDA 特性智能剥离/恢复
针对 CPU 与 GPU 分阶段执行的场景:
cuda特性并剥离,生成cuda_features.json记录同时自动设置 vcpkg 优化参数:
VCPKG_MAX_CONCURRENCY=$(nproc)— 匹配实际 CPU 核数VCPKG_BUILD_TYPE=release— 跳过 Debug 编译,节省一半时间🛡️ 安全机制
📁 Skill 源码目录结构
🔄 更新日志
v1.1.0 (2026-04-11)
vcpkg_json_path传参;Step 7 新增 CUDA 特性恢复和环境补丁记录v1.0.0 (2026-04-08)
📄 License
MIT