目录

bilingua

英文论文中英对照阅读骨架生成器 GitLink AI Agent Skill。把英文文本智能断句,生成原文/译文逐句对照的 Markdown 表格,并提取高频术语生成术语表以统一译名。

GitLink 智能化服务开源项目贡献赛 子赛题二(编写和丰富 GitLink Skills) 参赛作品。作者:Ct201314

它解决什么

英文论文读得慢,是因为没人给你逐句配中文。bilingua 帮你:

  • 智能断句:正确处理学术文本里高频的缩写(Dr./et al./e.g./i.e.)和小数点(0.92、p<0.05),不在这些地方误切
  • 中英对照骨架:每句一行,左原文右译文,逐句对照、稳定回填
  • 术语提取:识别高频缩略语与名词短语,生成术语表,先统一译名再翻译

设计特点

只搭骨架、不臆造翻译——纯本地、纯标准库,译文列留空由你或翻译工具回填。核心竞争力是断句质量:一句包含 Dr.et al.0.92p < 0.05 四个陷阱的句子能被正确识别为一整句。

安装与使用

python scripts/bilingua.py --input paper.txt --output reading.md
python scripts/bilingua.py --text "Your English paragraph." --format json

目录结构

bilingua/
├── SKILL.md
├── scripts/bilingua.py
├── references/  sentence-splitting.md + usage.md
├── examples/  真实对照产物
├── tests/test_bilingua.py(15 用例)
├── requirements.txt
└── LICENSE

真实验证

输入含 Contrastive learning (e.g., SimCLR)... Dr. Wang et al. reported a Dice score of 0.92 on the MRI dataset (p < 0.05)... 的段落,正确切成 4 句(4 个断句陷阱无一误切),术语表识别出 MRI/CNN/GAN。产物见 examples/

python -m pytest tests/ -q   # 15 passed

许可证

Mulan PSL v2

关于

中英对照阅读骨架生成器:智能断句+术语表,GitLink Skill

38.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

版权所有:中国计算机学会技术支持:开源发展技术委员会
京ICP备13000930号-9 京公网安备 11010802047560号