基于Consul的多Beats接入管控与多ES搜索编排
6.65 MB
23 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
中文(简体) | .pdf | 3 |
摘要 | ||
文档介绍了基于Consul的多Beats接入管控与多ES搜索编排的解决方案。背景中提到产品数量、人员规模和主机规模较大,面临日志接入和管理的多重挑战。解决方案包括提供多产品接入管理、标准化、界面化、自动化的日志接入方案,并实现多ES多索引搜索编排功能。当前收益包括快速接入、配置UI化标准化、配置变更实时感知、部署全自动化等。 | ||
AI总结 | ||
《基于Consul的多Beats接入管控与多ES搜索编排》_by 梁成(腾讯云)
概述
本文围绕基于Consul的多Beats接入管控与多ES搜索编排的设计与实现,重点介绍了在大规模场景下的产品实践与探索。
背景与挑战
产品规模:100+产品,1000+人员,10000+主机。
核心问题:
• 如何降低日志接入门槛?
• 如何保证日志实时上报?
• 如何保障日志采集不影响业务?
• 如何实现配置标准化?
• 如何帮助业务快速排障与性能调优?
多Beats/Logstash接入管控
基于Consul的接入管控方案:
1. Consul作为配置中心,支持多Beats/Logstash的标准化、界面化、自动化接入。
2. Agent管理机制:
- 通过Consul注册、配置获取与感知。
- 支持多进程管理,实时监控资源使用情况。
- Kill机制与Cgroup资源限制。
3. UI化配置:
- 提供标准化配置界面。
- 强类型设计(前端Angular、后端Golang)。
- 自定义组件降低用户操作复杂度。
多ES搜索编排系统
功能与特点:
1. 支持多ES多索引搜索。
2. 提供集中化配置管理、权限管理与资源设置。
3. 快速定位日志异常:
- 支持业务逻辑机器组划分。
- 实现配置离线分析与一致性检测。
4. 系统监控与告警:
- Agent离线感知。
- 资源监控(CPU/Mem)与延时监控。
现场案例
业务规模:
• 1000+业务
• 10000+业务主机
• 每日百T日志增量
诉求:
• 日志收集用于告警与容量分析
• 热数据保存7天,冷备1个月
• 数据上报不影响核心业务,延时可感知
传统接入 Pain Point:
• 配置分散,难以一致性管理
• 资源消耗与性能调优困难
• 异常处理与性能监控不完善
解决方案特点
• 5分钟快速接入
• 配置标准化与灰度发布
• 实时变更感知
• 多Beats同时管控
• 资源使用可控(CPU/Mem)
• 异常定位与关联分析
• 配置一致性检测
• 资源权限管理
日志AIOps探索
基于机器学习的日志分析:
• 异常定位
• 告警分类
• 根因分析
总结
• 快:快速接入与部署
• 稳:资源控制与监控
• 准:配置一致性与标准化
•Benefit:提升日志管理效率,降低运维成本。 |
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
16 页请下载阅读 -
文档评分