目录

GitLink Research Trust Workbench

科研开源可信度工作台。面向 GitLink 上的科研代码仓库,自动采集仓库元数据、README、许可证、依赖声明、论文/数据/实验信号和协作指标,生成可复现的科研项目可信度报告、CSV 摘要、Mermaid 知识图谱和脱敏证据日志。

本作品主攻 CCF GitLink 智能化服务开源项目贡献赛的子赛题四,同时交付一个可复用 Agent Skill 和一个端到端自动化工作流,覆盖子赛题二和子赛题三。

核心能力

  • 科研仓库可信度评估:复现性、论文/数据/代码可追踪性、协作健康、合规与敏感信息、文档与可用性,总分 100。
  • GitLink 原生集成:通过 gitlink-cli 的搜索、仓库信息、目录树和 README 读取能力获取数据,不使用 GitHub/GitLab CLI 代替 GitLink 操作。
  • 自定义 Agent Skill:skills/gitlink-research-trust/SKILL.md 可被主流 Agent 读取并执行。
  • 可复现工作流:scripts/run_research_trust_workflow.sh 一条命令生成完整交付文件。
  • 安全默认值:Token 不写入仓库,证据日志自动脱敏,默认不向第三方仓库写评论或创建 Issue。

目录结构

.
├── skills/gitlink-research-trust/      # 自定义 GitLink Agent Skill
├── scripts/                            # WSL 隔离工具链与工作流入口
├── src/gitlink_research_trust/         # Python 标准库实现
├── tests/                              # 单元测试和离线 fixture
├── reports/                            # 自动生成的报告输出
└── docs/                               # 架构、评分、验证、科研应用报告

环境原则

推荐在 WSL2 Ubuntu-26.04 中运行,不污染 Windows 主系统。

cd /root/ccf-gitlink-research-trust-workbench

# 可选:安装项目内便携 Node.js 和 gitlink-cli,不写入系统 PATH
bash scripts/bootstrap_gitlink_cli.sh

# 在当前 shell 中启用项目内 gitlink-cli
export PATH="$PWD/.tools/node-v22.16.0-linux-x64/bin:$PWD/.npm/node_modules/.bin:$PATH"
export GITLINK_CONFIG_DIR="$PWD/.config/gitlink-cli"

离线演示

不需要 GitLink Token,使用同构 fixture 验证端到端输出。

bash scripts/run_research_trust_workflow.sh \
  --fixture tests/fixtures/sample_gitlink.json \
  --run-id demo-fixture \
  --topic "科研开源可信度工作台" \
  --keywords "AI,research,科研,dataset"

输出文件:

reports/demo-fixture/
├── index.md
├── research_trust_report.md
├── summary.csv
├── graph.mmd
├── analysis.json
└── evidence.jsonl

本仓库已完成一次真实公开仓库只读验证,输出位于 reports/live-gitlink-20260625/。 认证凭据只放在当前 shell 或项目级 .config/gitlink-cli,不提交到仓库。

export GITLINK_CONFIG_DIR="$PWD/.config/gitlink-cli"
gitlink-cli auth status

bash scripts/run_research_trust_workflow.sh \
  --run-id live-gitlink-20260625 \
  --topic "GitLink 公开科研仓库可信度验证" \
  --keywords "AI,research,科研,machine learning,dataset" \
  --max-repos 5

如需先登录:

gitlink-cli auth login
# 或:gitlink-cli auth login --token

评分模型

维度 分值 核心信号
复现性 25 README、依赖声明、测试/CI、Release、近期活跃、复现命令
论文/数据/代码可追踪性 20 DOI/arXiv/BibTeX、数据集说明、实验脚本、引用文件、示例
协作健康 20 贡献者、Issue/PR、关注/Fork、维护活跃度
合规与敏感信息 20 许可证、敏感信息扫描、依赖声明、安全/贡献文档、镜像风险
文档与可用性 15 README 完整度、安装说明、运行命令、示例、社区文档

详细规则见 docs/scoring-model.md

测试

PYTHONPATH=src python3 -m unittest discover -s tests -v
bash scripts/check_no_secrets.sh

当前离线测试覆盖:

  • GitLink JSON envelope 和 fixture 解析
  • 仓库去重与排序
  • 许可证识别
  • 敏感信息脱敏
  • 100 分评分边界
  • 完整输出 schema

参赛交付物

  • 自定义 Skill:skills/gitlink-research-trust/SKILL.md
  • 工作流脚本:scripts/run_research_trust_workflow.sh
  • 科研辅助工具代码:src/gitlink_research_trust/
  • 中文使用文档:本 README 和 docs/
  • 场景输出成果:reports/demo-fixture/reports/live-gitlink-20260625/
  • 架构图:docs/architecture.mdreports/*/graph.mmd
  • Agent 验证记录:docs/agent-validation.md
  • 科研场景应用报告:docs/research-application-report.md
  • 最终提交索引:docs/final-submission.md
  • 答辩 PPT 与演示视频:docs/final-materials/

安全说明

  • 不在仓库中保存真实 Token、密码或 CLI credentials。
  • evidence.jsonl 只保存命令、摘要和脱敏后的结构化证据。
  • 默认只读分析第三方公开仓库,不创建评论、Issue、PR 或 Release。
  • 写入 GitLink 参赛仓库前应再次运行 scripts/check_no_secrets.sh
关于

科研开源可信度工作台:GitLink Skill、工作流、真实验证报告与科研可信度评分

37.4 MB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

版权所有:中国计算机学会技术支持:开源发展技术委员会
京ICP备13000930号-9 京公网安备 11010802047560号