目录
目录README.md

赛题题目:面向微服务基准的Trace监控数据采集与异常检测工具

赛题说明:

随着微服务架构的广泛应用,系统的复杂性和规模不断增加,传统的监控和异常检测方法难以应对微服务环境下的动态性和复杂性。本赛题要求基于OpenTracing标准的Trace采集系统(如Jaeger),结合Prometheus等性能监控组件,设计并实现一个面向TrainTicket微服务基准系统的Trace监控数据采集与异常检测系统。通过负载模拟软件(如Locust)和异常注入软件(如ChaosBlade)生成多样化的系统行为数据,利用深度学习方法对采集到的Trace数据进行分析,实现高效的异常检测,为微服务系统的稳定运行提供保障。TrainTicket是一个典型的微服务基准系统,模拟火车票售票服务,其服务间的调用链(Trace)数据包含了丰富的系统行为信息。

赛题要求:

  1. 开发环境 操作系统:基于Linux内核,可选择openKylin、openEuler、Ubuntu等发行版。 硬件约束:支持分布式部署,建议使用多节点集群环境。 软件依赖:PyTorch深度学习框架、Prometheus性能监控软件、符合OpenTracing标准的Trace采集系统等;TrainTicket微服务基准系统。

  2. 功能要求

    • Trace数据采集模块 实现对微服务系统的Trace数据采集。 配置Prometheus,采集系统性能指标(如CPU、内存、网络延迟等)。
    • 数据生成模块 模拟多种负载场景,生成不同压力下的系统运行监控数据。 注入异常(如服务超时、资源耗尽等),生成异常场景下的系统运行监控数据。
    • 异常检测算法模块 基于深度学习方法(如LSTM、Transformer等),设计并实现异常检测模型。 利用采集到的系统运行监控数据,训练模型并验证其检测效果。

评分标准:

    1. 功能完整性(30%):达成本赛题基本功能要求,包括Trace采集、数据生成、异常检测等模块的实现。
    1. 异常注入与数据集收集(20%):必须包含至少2种不同类型的异常(如服务超时、资源耗尽)每种异常类型需提供明确的注入方法、参数配置和影响程度说明。异常数据需标注明确的开始时间、持续时间和影响范围。
    1. 异常检测效果(30%):以Eadro(参考资料7)论文中提供的开源TrainTicket异常数据集为标准评测数据集,异常检测模型的准确率、召回率、F1-score等指标达到较高水平。具体来说,准确率(10%),即正确识别异常的能力,不低于0.7;召回率(10%),即发现所有异常的能力,不低于0.7;F1-score(10%),即综合评价指标,不低于0.7。提供详细的模型评估报告,包括混淆矩阵、ROC曲线、AUC值等。异常检测模型的训练、验证和测试流程需清晰可复现。
    1. 系统性能(10%):数据采集的性能开销低,对微服务系统的整体影响小于10%。
    1. 代码与文档质量(10%):代码规范,文档包含系统架构图、模块说明、实验报告及结果分析。

赛题联系人:

赵欣 zhaoxin10@nudt.edu.cn

参考资料:

参赛资源支持:无

关于
27.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号