Flashcat 让监控分析变简单,Flashcat产品技术交流
INTERNAL OR RESTRICTED, ALL RIGHTS RESERVED © 北京快猫星云科技有限公司 以故障处理为中⼼的稳定性保障模型 故障开始 故障发现 故障定位 服务⽌损 状态恢复 状态正常 状态正常 发现处理 可能出现尝试定位和 尝试⽌损过程的反复 常态预防 复盘改进 ⾸要原则是:先⽌损后排查 状态异常 稳定性建设的重点 增强预防、发现处理能⼒ Flashcat 缺乏基于业务视⻆的全链路监控,故障定位耗时较⻓ 3. 缺乏对重要故障场景的应急预案的梳理和演练 效果: 1. 通过落地Flashcat平台,公司A级产品线北极星指标监控实现了全覆盖,P3级 及以上故障北极星监控发现率为100%,MTTI控制在5分钟以内。真正做到了先 于⽤户发现问题,让故障处理变被动为主动。 。 2. 故障定位能⼒建设也已取得重要进展,我们和业务⼀起梳理了公司A级产品线 核⼼主流程依赖的接⼝和0 码力 | 43 页 | 6.54 MB | 1 年前3
共 1 条
- 1