联系我们:010-88559646

  老师群

170086145

  学生群

179326524

209318323

215410234

客服电话:010-88559646

A10-基于机器学习的分布式系统故障诊断系统

时间:2023-04-03 14:21:26

   第十二届中国软件杯大赛--A组赛题

赛题名称:基于机器学习的分布式系统故障诊断系统

组类: A组( 本科、研究生、高职)

出题企业:中兴通讯股份有限公司

答疑QQ群:779690059

本赛题解析视频:https://www.bilibili.com/video/BV1Gh4y1d79o/?vd_source=07cd23156b3913ce142ea37857ce2b49

测试集已发布,请在赛题中查看(2023.7.5)

赛题简介:介绍整个赛题的实现目标、实用价值、涉及技术和整体要求

大数据时代,分布式系统成为信息存储和处理的主流系统。相对于传统系统而言,分布式系统更为庞大和复杂,故障发生的平均几率比较高,其运维的难度和复杂度大大提高。如何对分布式系统进行高效、准确的运维,成为保障信息系统高效、可靠运行的关键问题。

本赛题要求参赛人员基于技术手段(包括但不限于机器学习、深度学习等技术)对分布式系统的故障数据进行分析,设计故障诊断模型,高效地分析并识别故障类别,实现分布式系统故障运维的智能化,快速恢复故障的同时大大降低分布式系统运维工作的难度,减少运维对人力资源的消耗。

赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景

 

在分布式系统中某个节点发生故障时,故障会沿着分布式系统的拓扑结构进行传播,造成自身节点及其邻接节点相关的KPI指标和发生大量日志异常。本次比赛提供分布式数据库的故障特征数据和标签数据,其中特征数据是系统发生故障时的KPI指标数据,KPI指标包括由feature0、feature1 ...feature106共107个指标,标签数据为故障类别数据,共6个类别,用0、1、2、3、4、5分别表示6个故障,参赛人员可根据这些数据,借助机器学习、深度学习、web等技术搭建故障诊断系统,该系统支持用户上传训练集对模型进行训练和模型下载,同时支持用户上传单条或多条测试语句进行测试并可视化测试结果,支持测试结果下载。

举例:故障1会引起feature1、feature5、feature15等指标异常,反过来可以通过feature1、feature5、feature15等指标异常诊断为系统发生故障1,电梯

基本功能要求

1、选手实现故障诊断功能

①基于提供的带有故障标签的样本进行指标分析,训练故障分类模型,该模型能够对输入的测试数据进行故障诊断,在测试集上的分类准确率越高越好

2、软件运行在WEB平台

①该平台支持用户上传训练数据并在线训练,训练完成后可下载训练模型

②该平台支持单条或者批量测试样本上传,并可视化分类结果,同时支持下载分类结果

③系统运行流畅

④WEB的UI界面美观简洁、人机交互友好

非功能性要求


实现条件:开发环境、实验平台、开发语言、数据库、编译器、涉及硬件等实现条件

1、人工智能算法部分推荐使用python开发

2、WEB系统部分,选手选择熟悉的WEB框架,推荐使用主流的python web框架,如Django;或java web框架

测试数据或平台:提供给参赛者的测试环境和测试数据

测试环境:由参赛者自己准备

训练数据集:数据样例如下:

1680503803228692.png

训练数据集下载训练集5.31.zip  (总共10000个样本,数据更新日期:2023.05.31)

测试数据集:决赛或者现场比赛时由出题方提供,测试样例如下: 

1685521979165912.jpg

验证集下载:验证集5.31.zip  (总共1000个样本,验证集附带有样本标签json文件,用于验证算法的泛化性和作为测试集预测结果json文件的格式参考)

测试集下载:测试集7.5.zip   (总共2000个样本,测试集只有特征没有标签数据)

注1:参赛人员将测试集的预测结果以json文件形式提供,数据结构采用dict字典形式,其中key为测试样本sample_id,value为预测的类别,例如:

{

   “0”:3

}

参赛队伍可以通过验证集来测试生成的json文件格式或者编码是否正确,建议json文件由程序生成,避免手动生成带来的格式或者编码异常。

注2:测试集预测结果json文件(统一命名为submit.json)与介绍PPT/演示视频和文档一起打包压缩,即放置在下图所示的zip包中:

图片1.png

开发所需设备及设备指标需求说明

无特殊要求

文档及其他要求

文档内容包括队伍信息介绍,模型介绍、实现思路、原理分析、结果分析。

各评分项及大致占比

1、算法模型评测(50%)

选手在规定时间内提交生成测试集结果,按照排名计算成绩,主要依赖测试集macro_F1的得分进行排名,其中macro_F1计算方式如下

888.png

2、WEB系统(30%)

3、技术文档详细且清楚,汇报时有创新点、逻辑清晰(20%)

初赛作品提交要求

1、代码源文件。

2、模型文件。

3、系统的可执行文件。

4、系统设计文档。

5、系统测试报告(包括准确率、模型大小)。

6、测试集分类结果文件。

7、汇报PPT及讲解。

8、演示视频(10分钟内)

【参赛团队作品中团队自主开发部分的软件作品著作权归参赛团队所有,其中具有市场应用及拓展的优秀作品,出题企业具有优先权,可以优先合作开发或者优先购买。另如基于该作品的任何合作升级开发、市场拓展等活动,以及在这一过程中所获得的任何商业费用,出题企业应与参赛团队协商解决。】

 

关于我们

客服电话:010-88559646

大赛邮箱:cnsoftbei@qq.com

邮编:100048

联系地址:北京市海淀区紫竹院路66号赛迪大厦18层

网站备案/许可证号:京ICP备05039896号-10     京公网安备 11010802020860号