目录

litscout

多库文献检索助手(离线)GitLink AI Agent Skill。把研究主题构造成可直接粘贴到 PubMed/arXiv/Web of Science/Google Scholar 的布尔检索式,并把多份 .bib/.ris 题录按 DOI/标题去重合并成统一参考列表。

GitLink 智能化服务开源项目贡献赛 子赛题二(编写和丰富 GitLink Skills) 参赛作品。作者:Ct201314

它解决什么

跨库查文献最烦的是两头:构造检索式(每个库语法不同)、清洗结果(多库题录大量重复)。litscout 把这两头自动化:

  • 检索式构造:主题拆成概念组,同义词扩展(组内 OR),概念间 AND,适配各库字段语法
  • 去重合并:解析 BibTeX/RIS,优先按 DOI、其次按标题指纹去重,合并字段,输出统一参考列表

设计特点

完全离线,不调用任何检索 API 或 MCP——区别于依赖在线抓取的同类技能。它生成「拿去搜」的检索式、整理「搜回来」的题录,检索本身在各库网页完成,零配额限制、可在受限环境运行。纯 Python 标准库实现。

安装与使用

# 构造多库检索式
python scripts/scout.py query --topic "对比学习 小样本 图像分割"

# 去重合并题录
python scripts/scout.py merge --inputs scholar.bib pubmed.ris --output refs.md

目录结构

litscout/
├── SKILL.md
├── scripts/scout.py
├── references/  search-syntax.md + formats.md
├── examples/  真实检索式与去重产物
├── tests/test_scout.py(12 用例)
├── requirements.txt
└── LICENSE

真实验证

主题「对比学习 小样本 图像分割」生成 5 个库的检索式;合并一份 .bib + 一份 .ris(含一条跨格式重复 DOI),4 条输入正确去重为 3 条,并把 bib 的 journal 字段补全到 ris 版本。产物见 examples/

python -m pytest tests/ -q   # 12 passed

许可证

Mulan PSL v2

关于

多库文献检索助手:多库检索式构造+题录去重合并,离线 GitLink Skill

40.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

版权所有:中国计算机学会技术支持:开源发展技术委员会
京ICP备13000930号-9 京公网安备 11010802047560号