目录
目录README.md

赛题题目:基于大语言模型的表单自动填写软件

赛题说明:

基于大模型、NLP或其他人工智能技术,通过对系统中图像、文本、音频等信息进行语义解析和总结提取从而构建用户信息体系,并实现表单的自动填写功能。充分利用操作系统的系统级能力(如文件系统、用户配置接口、设备状态监测、权限控制、安全机制等),优化模型推理性能、数据访问效率与本地化隐私保护能力,软件与操作系统之间的紧密集成与协同。

赛题要求:

支持自动收集操作系统中存储的当前用户相关信息(如个人设置、最近活动、设备状态等),对操作系统用户配置接口、系统调用、文件访问权限等机制的利用,具备一定的系统资源调度意识与采集效率优化策略; 支持基于多模态大模型技术,对操作系统中的文本、图像、音频等信息进行用户信息理解和提取,支持本地化模型部署与推理,合理管理资源使用(如内存、线程、CPU负载),结合系统进程调度机制进行推理性能优化; 支持从用户提供的pdf、doc、xls等格式文件中提取信息; 基于上述用户信息,构建用户信息体系(如姓名、性别、年龄、身份证号、兴趣爱好、个性习惯等),建议以结构化形式组织数据,支持用户信息的长期本地存储与快速调用,同时符合操作系统安全与隐私规范; 根据用户信息体系,支持对doc、xls两类格式的文件自动填充表格内容; 软件基于开源操作系统研发及运行,具备可视化图形界面,利用系统级窗口管理、文件选择、进程通信等原生能力构建高可用图形界面; 软件实现不依赖网络端工具,具备离线状态本地化处理能力,与操作系统中模型管理、缓存策略、之间的协同。

FormGPT-main/
├── output/ # 输出目录,通常用于存放程序运行产生的结果文件(如生成的文本、数据等,具体内容依实际功能而定)
├── TestDemo/ # 测试用例相关目录,可存放单元测试、集成测试等代码或测试数据
├── .gitignore # Git 忽略规则文件,定义哪些文件 / 目录不纳入版本控制
├── app.py # 项目主应用文件,可能是程序入口、核心业务逻辑承载文件
├── autofill.py # 自动填充功能模块,推测与内容自动补全、数据填充逻辑相关
├── LICENSE # 许可证文件,声明项目代码的使用权限、开源协议等
├── paddleocr_demo.py # 基于 PaddleOCR 的演示文件,可能用于 OCR 识别功能演示、测试
├── README.md # 项目说明文档,包含项目介绍、使用方法、依赖等信息(当前你正在完善的文件 )
├── structure.py # 结构相关模块,可能涉及数据结构定义、程序架构搭建等逻辑
├── transfer.py # 转换功能模块,推测用于数据格式转换、内容迁移等操作

评分标准:

功能完整性(50%):

  • 支持自动收集操作系统中当前用户相关信息(20%);
  • 支持基于多模态大模型技术对文本、图像、音频等进行用户信息理解和提取(20%);
  • 支持从用户提供的pdf、doc、xls等格式文件中提取信息(20%);
  • 支持对doc、xls两类格式的文件自动填充表格内容(20%);
  • 软件实现不依赖网络端工具,具备离线状态本地化处理能力(20%)。

性能优化(20%):

  • 后台占用系统资源(CPU、内存、显存)尽量低,不影响设备正常运行(40分);
  • 系统整体响应速度快,用户操作无延迟(40分);
  • 自动填写准确率达到95%(20分)。

代码规范性(20%):

  • 代码结构清晰、可读性和可维护性高(80分);
  • 符合开源社区规范(20分)。

文档质量(10%):

  • 文档包含设计说明书(50分);
  • 提供完整的部署说明(30分);
  • 提供完成的测试报告(20分)。

赛题联系人:

孙雅彬 sunyabin@kylinos.cn

参考资料:

参赛资源支持:

[1] 麒麟软件有限公司可提供软件开发环境 OpenHarmony社区可提供:软硬件开发环境

关于
908.0 KB
邀请码