目录
目录README.md

赛题题目:基于MPAM的容器内存带宽监控管理工具

赛题说明:

MPAM(Memory system component Partitioning and Monitoring)是Arm Architecture v8.4的Extension特性。用于解决服务器系统中,混部不同类型业务时,由于共享资源的竞争(Cache,DMC,Interconnect),而带来的某些关键应用性能下降或者系统整体性能下降的问题。 MPAM应用的典型场景,例如云场景下,可针对不同业务同时作用于硬件访存路径上产生的竞争和冲突进行控制,从而帮助服务器提升利用率。 当前在主流Linux操作系统内核(如openEuler 6.6内核)上已使能MPAM的对外接口,但对于云原生容器场景,易用性不足,需要一个在K8s架构下,基于MPAM的对从节点到集群应用的内存带宽监控工具,方便运维人员在管理面对各个节点上的应用进行混部管理,保障高优业务的QoS,并能实时监测到各应用的带宽占用情况。

赛题要求:

  • 带宽监控管理工具需要基于K8s管理,支持一键分发部署能力;
  • 对于业务的优先级,可以用户指定或使用K8s默认的QoS level标准;
  • 需要自己构造不同内存带宽诉求的应用进行混部测试,支持测试自动化执行;
  • 监控结果可以在master节点收集,并提供对外接口,生成报告。

    评分标准:

    1. 在离线业务混部时,在线业务干扰率 α <10%。在线业务可以用带宽敏感型业务如redis、ngixn等业务模拟,离线使用大数据spark等业务模拟。 x:在线业务混部时TP99 时延 y:在线业务独立部署TP99 时延 α = (x - y) ) / x
    1. 插件需要易部署并提供可观测能力,在k8s管理面可以一键分发并获取集群各个节点中业务带宽占用及竞争情况,便于运维人员进行实时分析调整。
    1. 灵活的Qos调整能力,根据资源竞争对在线业务的干扰数据建模分析,灵活调整在离线业务的Qos等级、带宽限制,在在线业务干扰<10%的前提下,保障节点资源(CPU/内存等)利用率>60%。

赛题联系人:

玉凯 yukai20@huawei.com

参考资料:

[1] https://gitee.com/openeuler/community/blob/f01bdb283d3860f1ffb17547b9317fdea9f26d31/sig/Kernel/mpam.md

参赛资源支持:无

赛题交流讨论链接:

https://www.chaspark.com/#/races/competitions/1136096371816214528

关于
27.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号