目录
目录README.md

面向微服务基准的Trace监控数据采集与异常检测工具阶段性技术报告

第二届中国研究生操作系统开源创新大赛——应用创新
赛题选择:面向微服务基准的Trace监控数据采集与异常检测工具
队伍名称:这次一定apex队
队员姓名:梁哲浩、李瑞东、张铭轩
指导教师:梁琛教授
学校名称:西安邮电大学

项目背景意义:

随着云计算与分布式系统的持续演进,微服务架构凭借其高灵活性、强可扩展性及独立部署能力,已成为现代软件开发的核心范式。然而,架构复杂度的攀升也使得系统监控与异常检测的难度显著增加。在微服务系统中,服务间调用链(Trace)数据蕴含着丰富的运行时行为信息,但传统监控方法难以适配其动态性与复杂性,往往导致故障定位滞后、系统稳定性受损等问题。为此,设计一套高效的 Trace 监控数据采集与异常检测系统,对保障微服务架构的稳定运行具有重要现实意义。

项目简介:

在微服务架构下,系统监控与异常诊断面临调用链复杂、多源数据融合难、故障定位效率低等挑战。传统方法难以实现精准且及时的异常检测,严重影响系统稳定性与可维护性。为此,本研究基于 TrainTicket 微服务基准系统,设计并实现了一套集成追踪数据采集与多模态异常检测的监控工具。系统采用 SkyWalking 进行无侵入分布式追踪,使用 Elasticsearch 存储 Trace 数据,并借助 Prometheus 与 Grafana 实现 CPU、内存等性能指标的采集与可视化。为模拟真实异常场景,结合 LoadRunner 施加高并发负载,并通过 ChaosBlade 注入超时与资源耗尽等故障。在异常检测方面,提出基于 PyTorch 的 Eadro 深度学习框架,融合日志、指标与 Trace 多源数据,实现联合异常检测与根因定位。实验表明,该方法在 F1、召回率与精确率上均超过 0.8,根因定位指标 HR@1/3/5 表现优异,系统开销低于 10%,可稳定运行于 Kubernetes 多节点集群。本研究为微服务环境提供了高效可扩展的监控与故障诊断解决方案。

项目展示:

展示内容 位置
项目说明书 项目说明书
项目展示PPT PPT
项目展示视频 展示视频

致谢:

  • 感谢团队成员(梁哲浩、李瑞东、张铭轩)之间的相互鼓励和相互支持
  • 感谢指导老师(梁琛教授)不辞劳苦对本项目的指导
关于
343.4 MB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号