Update README.md
智能体作为智能交互系统的核心组件,其记忆模块中的偏好记忆与知识记忆是支撑个性化服务适配、知识沉淀复用的核心载体。工具调用执行结果是两类记忆的核心数据源之一,同时记忆还来源于用户手动配置、跨场景行为数据等多类渠道。当前,操作系统在构建智体能记忆模块时面临双重挑战: 一是AI算法层面:工具调用执行结果结构化不足、数据质量参差不齐,导致偏好提取(如工具选择偏好)不精准、知识沉淀不高效;另一方面,其他数据源存在用户行为捕捉不全面、跨场景数据不一致、配置版本混乱等问题,叠加形成动态偏好提取偏差、版本化管理效率低、新旧知识冲突滞后、关联检索精度有限等痛点,制约了智能体的服务智能化水平与用户体验。 二是操作系统层面:记忆数据的存储、访问、隔离、审计缺乏OS级原生机制支撑;敏感信息(PII、密钥、Token等)的识别与过滤停留在应用层正则匹配,缺乏与OS安全子系统(LSM、namespace等)的深度结合;端侧资源受限场景下,记忆模块与OS内存子系统(页缓存、mmap)的协同优化空间未被充分挖掘。三是OS Agent 的记忆模块不仅需要完成偏好记忆与知识记忆的沉淀、管理和复用,还需要在真实交互过程中高效支撑检索增强生成,即 RAG 流程,随着记忆规模扩大、数据来源增多、端侧部署需求增强,传统仅依赖应用层向量检索或数据库调用的方式,容易在检索延迟、上下文构建、生成协同、资源占用和抗干扰能力等方面成为瓶颈。 本选题聚焦解决以下核心问题:一是优化偏好记忆的动态捕捉与适配机制,尤其是工具调用执行结果数据源的处理,实现用户操作习惯、输出风格、安全策略等偏好的精准提取、版本化更新与跨场景复用;二是提升知识记忆的结构化整合、关联检索与冲突融合能力,强化工作流程知识、历史案例、可复用模板的高效沉淀与智能调用;三是面向 OS Agent 记忆驱动的 RAG 流程,设计系统级优化机制,在端侧或本地部署环境下实现更低延迟、更高吞吐和更稳定的记忆检索与生成能力。
开发一套应用于智能体的多源融合偏好与知识记忆优化解决方案,具备偏好精准捕捉、知识智能整合、高效检索复用等核心功能,并通过 OS级机制设计体现系统创新。具体要求如下:
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802047560号
赛题题目:面向openKylin的智能体记忆提取与精准遗忘机制(社区赛题)
赛题说明:
智能体作为智能交互系统的核心组件,其记忆模块中的偏好记忆与知识记忆是支撑个性化服务适配、知识沉淀复用的核心载体。工具调用执行结果是两类记忆的核心数据源之一,同时记忆还来源于用户手动配置、跨场景行为数据等多类渠道。当前,操作系统在构建智体能记忆模块时面临双重挑战: 一是AI算法层面:工具调用执行结果结构化不足、数据质量参差不齐,导致偏好提取(如工具选择偏好)不精准、知识沉淀不高效;另一方面,其他数据源存在用户行为捕捉不全面、跨场景数据不一致、配置版本混乱等问题,叠加形成动态偏好提取偏差、版本化管理效率低、新旧知识冲突滞后、关联检索精度有限等痛点,制约了智能体的服务智能化水平与用户体验。 二是操作系统层面:记忆数据的存储、访问、隔离、审计缺乏OS级原生机制支撑;敏感信息(PII、密钥、Token等)的识别与过滤停留在应用层正则匹配,缺乏与OS安全子系统(LSM、namespace等)的深度结合;端侧资源受限场景下,记忆模块与OS内存子系统(页缓存、mmap)的协同优化空间未被充分挖掘。三是OS Agent 的记忆模块不仅需要完成偏好记忆与知识记忆的沉淀、管理和复用,还需要在真实交互过程中高效支撑检索增强生成,即 RAG 流程,随着记忆规模扩大、数据来源增多、端侧部署需求增强,传统仅依赖应用层向量检索或数据库调用的方式,容易在检索延迟、上下文构建、生成协同、资源占用和抗干扰能力等方面成为瓶颈。 本选题聚焦解决以下核心问题:一是优化偏好记忆的动态捕捉与适配机制,尤其是工具调用执行结果数据源的处理,实现用户操作习惯、输出风格、安全策略等偏好的精准提取、版本化更新与跨场景复用;二是提升知识记忆的结构化整合、关联检索与冲突融合能力,强化工作流程知识、历史案例、可复用模板的高效沉淀与智能调用;三是面向 OS Agent 记忆驱动的 RAG 流程,设计系统级优化机制,在端侧或本地部署环境下实现更低延迟、更高吞吐和更稳定的记忆检索与生成能力。
赛题要求:
开发一套应用于智能体的多源融合偏好与知识记忆优化解决方案,具备偏好精准捕捉、知识智能整合、高效检索复用等核心功能,并通过 OS级机制设计体现系统创新。具体要求如下:
评分细则(明确评审角度、标准和分值范围):
功能完整性(40%):
性能优化(30%):
采用分档给分方式,确保指标可衡量、可分级,重点关注偏好提取准确率、知识检索召回率、知识冲突处理正确率、检索响应延迟(P95)、敏感信息识别F1等指标。 指标定义与计算方法:代码规范性(20%):
文档质量(10%):
交付物清单:
赛题联系人:
韩老师 hanxinyu@kylinos.cn参考资料: