2021年12月7日,由中国信息通信研究院(以下简称“中国信通院”)和混沌工程实验室联合举办的混沌工程技术沙龙——金融行业精品专场在北京召开。会上发布了分布式系统稳定性评估标准体系,并公布了首批消息队列稳定性评估结果,来自阿里云、华为云、腾讯云的三款消息队列云服务在单项故障注入测试(服务器宕机、服务发现故障、服务暂停、网络故障、CPU负载高、内存负载高)和综合故障注入测试中,消息服务并未受到明显影响,服务SLA达到可信云消息队列服务稳定性先进级能力要求。中国信通院云计算与大数据研究所所长何宝宏为获奖企业颁发可信云证书。
消息队列稳定性评估主要通过混沌工程技术向消息队列服务中主动进行故障注入的方法,旨在发现消息服务的稳定性问题,打造消息服务韧性的架构,从而保障服务的连续性。测试时选择了消息服务领域典型的故障场景如服务器宕机、服务发现故障、服务暂停、网络故障、CPU负载高、内存负载高,分别进行单项故障测试和综合故障注入测试,统计基本数据如发送调用次数、发送成功次数、消费数据个数、丢失数据个数、重复数据个数,实验观察指标包括了消息发送延迟点阵图、TPS发送情况、错误次数、错误率,最后通过计算消息队列服务的业务影响关键指标(SLA)如数据丢失率、数据重复率、发送成功率、投递语义支持、平均故障恢复时间等来进行分级评定。
未来,中国信通院将继续完善分布式系统稳定性评估标准体系中服务稳定性测试规范,诚邀业内同仁参与共建!
如对消息队列稳定性评估以及分布式系统稳定性标准建设感兴趣,欢迎联系我们!
联系人:
郑立
zhengli@caict.ac.cn
王海清
wanghaiqing@caict.ac.cn