目录
目录README.md

赛题题目:基于大语言模型的表单自动填写软件

赛题说明:

基于大模型、NLP或其他人工智能技术,通过对系统中图像、文本、音频等信息进行语义解析和总结提取从而构建用户信息体系,并实现表单的自动填写功能。充分利用操作系统的系统级能力(如文件系统、用户配置接口、设备状态监测、权限控制、安全机制等),优化模型推理性能、数据访问效率与本地化隐私保护能力,软件与操作系统之间的紧密集成与协同。

赛题要求:

支持自动收集操作系统中存储的当前用户相关信息(如个人设置、最近活动、设备状态等),对操作系统用户配置接口、系统调用、文件访问权限等机制的利用,具备一定的系统资源调度意识与采集效率优化策略; 支持基于多模态大模型技术,对操作系统中的文本、图像、音频等信息进行用户信息理解和提取,支持本地化模型部署与推理,合理管理资源使用(如内存、线程、CPU负载),结合系统进程调度机制进行推理性能优化; 支持从用户提供的pdf、doc、xls等格式文件中提取信息; 基于上述用户信息,构建用户信息体系(如姓名、性别、年龄、身份证号、兴趣爱好、个性习惯等),建议以结构化形式组织数据,支持用户信息的长期本地存储与快速调用,同时符合操作系统安全与隐私规范; 根据用户信息体系,支持对doc、xls两类格式的文件自动填充表格内容; 软件基于开源操作系统研发及运行,具备可视化图形界面,利用系统级窗口管理、文件选择、进程通信等原生能力构建高可用图形界面; 软件实现不依赖网络端工具,具备离线状态本地化处理能力,与操作系统中模型管理、缓存策略、之间的协同。

评分标准:

功能完整性(50%):

  • 支持自动收集操作系统中当前用户相关信息(20%);
  • 支持基于多模态大模型技术对文本、图像、音频等进行用户信息理解和提取(20%);
  • 支持从用户提供的pdf、doc、xls等格式文件中提取信息(20%);
  • 支持对doc、xls两类格式的文件自动填充表格内容(20%);
  • 软件实现不依赖网络端工具,具备离线状态本地化处理能力(20%)。

性能优化(20%):

  • 后台占用系统资源(CPU、内存、显存)尽量低,不影响设备正常运行(40分);
  • 系统整体响应速度快,用户操作无延迟(40分);
  • 自动填写准确率达到95%(20分)。

代码规范性(20%):

  • 代码结构清晰、可读性和可维护性高(80分);
  • 符合开源社区规范(20分)。

文档质量(10%):

  • 文档包含设计说明书(50分);
  • 提供完整的部署说明(30分);
  • 提供完成的测试报告(20分)。

赛题联系人:

孙雅彬 sunyabin@kylinos.cn

参考资料:

参赛资源支持:

[1] 麒麟软件有限公司可提供软件开发环境 OpenHarmony社区可提供:软硬件开发环境

关于
34.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号