pdf文档 基于Consul的多Beats接入管控与多ES搜索编排

6.65 MB 23 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档介绍了基于Consul的多Beats接入管控与多ES搜索编排的解决方案。背景中提到产品数量、人员规模和主机规模较大,面临日志接入和管理的多重挑战。解决方案包括提供多产品接入管理、标准化、界面化、自动化的日志接入方案,并实现多ES多索引搜索编排功能。当前收益包括快速接入、配置UI化标准化、配置变更实时感知、部署全自动化等。
AI总结
《基于Consul的多Beats接入管控与多ES搜索编排》_by 梁成(腾讯云) 概述 本文围绕基于Consul的多Beats接入管控与多ES搜索编排的设计与实现,重点介绍了在大规模场景下的产品实践与探索。 背景与挑战 产品规模:100+产品,1000+人员,10000+主机。 核心问题: • 如何降低日志接入门槛? • 如何保证日志实时上报? • 如何保障日志采集不影响业务? • 如何实现配置标准化? • 如何帮助业务快速排障与性能调优? 多Beats/Logstash接入管控 基于Consul的接入管控方案: 1. Consul作为配置中心,支持多Beats/Logstash的标准化、界面化、自动化接入。 2. Agent管理机制: - 通过Consul注册、配置获取与感知。 - 支持多进程管理,实时监控资源使用情况。 - Kill机制与Cgroup资源限制。 3. UI化配置: - 提供标准化配置界面。 - 强类型设计(前端Angular、后端Golang)。 - 自定义组件降低用户操作复杂度。 多ES搜索编排系统 功能与特点: 1. 支持多ES多索引搜索。 2. 提供集中化配置管理、权限管理与资源设置。 3. 快速定位日志异常: - 支持业务逻辑机器组划分。 - 实现配置离线分析与一致性检测。 4. 系统监控与告警: - Agent离线感知。 - 资源监控(CPU/Mem)与延时监控。 现场案例 业务规模: • 1000+业务 • 10000+业务主机 • 每日百T日志增量 诉求: • 日志收集用于告警与容量分析 • 热数据保存7天,冷备1个月 • 数据上报不影响核心业务,延时可感知 传统接入 Pain Point: • 配置分散,难以一致性管理 • 资源消耗与性能调优困难 • 异常处理与性能监控不完善 解决方案特点 • 5分钟快速接入 • 配置标准化与灰度发布 • 实时变更感知 • 多Beats同时管控 • 资源使用可控(CPU/Mem) • 异常定位与关联分析 • 配置一致性检测 • 资源权限管理 日志AIOps探索 基于机器学习的日志分析: • 异常定位 • 告警分类 • 根因分析 总结 • 快:快速接入与部署 • 稳:资源控制与监控 • 准:配置一致性与标准化 •Benefit:提升日志管理效率,降低运维成本。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 16 页请下载阅读 -
文档评分
请文明评论,理性发言.