目录
目录README.md

赛题题目:操作系统源代码的组件许可证识别与合规管理工具开发

赛题说明:

开源许可证的合规性管理是保障操作系统生态健康发展的重要环节。国产开源操作系统一般基于多个上游开源项目进行二次开发,涉及大量跨许可证的代码整合。这些组件分布在不同目录层级中,涵盖许可证类型复杂多样,传统的检测方法效率较低且易遗漏潜在风险。此外,现有工具多针对单个软件项目或软件包,缺乏对操作系统特有场景的专项支持。因此,开发一款能够自动、高效、准确识别操作系统源代码中组件许可证的专用工具,并生成完整的合规报告,对提升国产操作系统的开源合规管理能力具有重要意义。

赛题要求:

本赛题要求参赛者开发一个操作系统源代码的组件许可证识别与合规管理工具,完成以下核心任务:

  1. 许可证标准数据集构建: (1)由于目前缺乏专门针对操作系统源代码组件的开源许可证标准数据集,参赛者需构建一个包含至少100个典型操作系统组件的许可证标注数据集。 (2)数据集应涵盖主流许可证类型及其变体,并标注许可证文本、类型等信息。 (3)该数据集将作为评测基准,并在比赛后开源共享给社区。
  2. 许可证提取与识别: (1)支持对操作系统中常见的组件进行解析,提取许可证相关信息。 (2)实现对主流开源许可证(GPL、LGPL、MIT、Apache等)及其变体和非标准化许可证声明的准确识别(文本级或条款级),能够处理多许可证混合声明的复杂场景(如”GPL-2.0 OR MIT”)。
  3. 许可证兼容性分析:支持对不同开源许可证的兼容性进行评估(文本级或条款级),检测潜在的许可证冲突,并提供合规建议。
  4. 界面设计与可视化:参赛者可根据需要设计图形化用户界面,展示许可证分析结果和兼容性评估报告,便于用户理解。

评分标准:

许可证数据集构建(15%):

  • 数据集规模(包含至少100个操作系统典型组件)(5%);
  • 数据集多样性(覆盖至少20种主流许可证及其变体)(5%);
  • 标注质量与一致性(5%)。

许可证识别准确率(40%)

  • 主流许可证识别准确率≥95%(15%);
  • 非标准化声明及变体的识别准确率≥85%(10%);
  • 自定义许可证的条款级识别率≥80%(10%);
  • 多许可证混合声明处理能力(5%)。

许可证合规性分析(30%):

  • 兼容性冲突检测准确率≥90%(15%);
  • 许可证兼容性冲突条款定位准确率≥90%(10%);
  • 合规建议的可操作性与合理性(5%)。

项目规范与可视化(15%):

  • 许可证分析结果和兼容性评估信息报告完整性与可读性(5%);
  • 符合代码规范,说明文档是否清晰完整,包括工具使用方法和核心技术说明(5%);
  • 用户界面设计与易用性(5%)。

赛题联系人:

赵欣 zhaoxin10@nudt.edu.cn

参考资料:

参赛资源支持:无

关于
27.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号