高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏
初始化数 据 拉起业务 进程 布署监控 开新区 部署程序 测试验证 清理脏数 据 对外开放 获取新主 机 CMDB注 册信息 关闭故障 大区入口 新机程序 布署 大区服务 重启 测试验证 故障机回 收 故障 替换 业务配置 文件修改 对外开放 选择发布 范围 备份业务 程序&数 据 屏蔽监控 告警 关闭游戏 入口 更新程序 包 更新数据 服务组件B 服务组件C 服务组件D 故障机替换 新版本发布 基础监控系统 扩容管理系统 …… …… 原子A 原子B 原子C 原子D 原子E IaaS管理 配置平台 作业平台 容器管理 DB管理 什么叫 PaaS …… 原子A 原子B 原子C 原子D 原子E 管控接入 配置平台 作业平台 容器平台 数据平台 故障机替换 新版本发布 基础监控系统 扩容管理系统 …… 服务组件A 服务组件B 服务组件C 构建 资源 准备 代码 部署 应用 开发 监控 告警 日志 追溯 基于PaaS的开发模式 应用需求 公共 组件 环境 构建 资源 准备 代码 部署 应用 开发 监控 告警 日志 追溯 运维开发 负责企业技术运营领域(CI、CD、CO)相关场景的系统构建,例如持续集成、日志分析、资 源管理、版本发布、环境变更、监控处理、灾备切换、日常巡检、电子工单、运营分析、运营0 码力 | 26 页 | 8.25 MB | 1 年前3高效智能运维[云+社区技术沙龙第29期] - ServerlessOps
微服务的架构和研发 2019 腾讯云 Serverless 产品架构师 核心诉求 Application Application Architecture 开发工具 DevOps 日志 监控告警 Lifecycle Management 网络 计算 存储 数据库 System Resource Monolithic Sprint Cloud Coding VScode EFK 功能 ❑ 函数增删改查 ❑ 调试 ❑ 打包部署 ❑ 日志 ❑ … DevOps 解决方案 Coding DevOps Serverless 平台 日志 CLS 日志服务 监控告警 Cmonitor 云监控告警 Serverless 系统运维能力 ❑mvm: 租户级别最强隔离,更低的延时 ❑ docker: 进程级别隔离 ❑ 更细粒度的资源分配,更低的成本 ❑ 实时计算扩缩容 process … Function Memory CPU Network Serverless 用户 云厂商 Serverless vs. IaaS 运维能力对比 资源创建 业务部署 监控告警 故障排查 性能调优 安全保障 弹性扩缩 故障恢复 基本运维能力 核心运维能力 Serverless vs. IaaS 运维能力 资源创建 - IaaS 2~3 周 ? 运维部门 需求文档0 码力 | 32 页 | 4.85 MB | 1 年前3CloudExplorer 3.0 部署运维手册v1.2
............................................................................................23 七、 监控服务................................................................................................. .........................................29 杭州飞致云信息科技有限公司 4 一、概述 本手册包含了云管理平台的软件架构、部署升级、服务操作、日志、监控、备份等详细 说明。CloudExplorer 云管平台采用微服务架构设计,通过本手册能快速了解 CloudExplorer 云管理平台的基础组件构成这样更方便以后在系统运维中更方便的去排查 CloudExplorer 基于 Prometheus 实现监控和告警功能 Redis 提供缓存服务 ElasticSearch 提供日志存储服务,可配置使用外部 ES 服务 Keycloak 提供 IDP 服务,用户统一认证中心,可以配置 SSO,或者对接 LDAP RabbitMQ 消息队列服务 杭州飞致云信息科技有限公司 5 InfluxDB 时序数据库服务,监控数据统计 2.1.2 基础模块 CloudExplorer0 码力 | 29 页 | 0 Bytes | 1 年前3高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践
的研究方向 展望未来 单维时间序列分析 海量时间序列 业务场景复杂 规则配置繁琐 1 2 3 时间序列异常检测 如何找到通用的解决方案? 单维时间序列分析 规则类告警策略 最大值告警 最小值告警 波动率告警 单维时间序列分析 无监督异常检测算法 (自编码器) 原始数据 生成数据 单维时间序列分析 无监督异常检测算法 (N-Sigma) 单维时间序列分析 有监督异常检测算法 模型管理:提供模型训练,预测功能。 腾讯 Metis 智能监控的功能特性(http://github.com/Tencent/Metis) 腾讯 Metis 智能监控的页面 单维时间序列分析 01 智能运维场景描述 整体介绍 02 单维时间序列分析 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的未来规划 展望未来 业务埋点 收集数据 监控系统 指标展示 多维数据 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的研究方向 展望未来 异常检测 单指标异常检测,多指标异常检测 根因分析 智能多维下钻分析,链路调用根源分析 告警收敛 事件与事件,事件与时序,时序与时序 日志分析 日志模板提取,日志异常检测,日志聚类分析 腾讯 Metis 智能运维方向 发现问题 分析问题 解决问题 THANKS 关注云加社区公众号0 码力 | 28 页 | 1.88 MB | 1 年前3高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践
网络资源 ……. Kubernetes多集群管理 Cluster1 Cluster2 ……. 应用服务管理 集群监控 集群日志 集群告警 基础设施监控 基础设施日志 基础设施告警 管理体系 业务管理 用户体系 权限 审计 安全 资源调度 服务监控 服务告警 远程日志 自动扩缩容 负载均衡 服务发现 CI/CD 蓝盾 OCI QCI 镜像仓库 CSIGHUB •角色鉴权认证 镜像仓库 •CBS(SSD/SATA) •Cehp/NFS 网络存储 •远端日志挂载 •页面日志查询 远程日志 CI/CD/CO 需求 设计 开发 构建 测试 部署 搭建 监控 计划 运营 业务上云总结 ⚫ 拥抱云原生 ⚫ 借上云革新研发模式,全面DevOps(CI/CD/CO) ⚫ 组件&工具上云,服务化,培育工程师文化 ⚫ 开源生态,合作共享 ⚫ 云基础设施经受海量业务的锤炼0 码力 | 26 页 | 2.39 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
话附加⽔印信息; 录像审计 ⽀持对资产操作的录像进⾏回放审计;⽀持将审计录像上传⾄公有云; 命令审计 ⽀持对资产操作的命令进⾏审计;⽀持⾼危命令告警; ⽂件传输 ⽀持对⽂件的上传 / 下载记录进⾏审计; 实时监控 ⽀持管理员 / 审计员实时监控⽤户的操作⾏为,并可进⾏实时终断,以提升⽤户操作的安全性; 登录⽇志 ⽀持对⽤户的登录⾏为进⾏审计;⽀持将审计信息同步⾄ Syslog ⽇志系统;0 码力 | 49 页 | 14.87 MB | 1 年前3Zadig 面向开发者的云原生 DevOps 平台
安全测试 xN 数据变更 xN 代码变更 xN 配置变更 xN 部署测试环境 xN 部署预发环境 xN 部署生产环境 xN 部署 / 灰度上线 xN 监控 / 告警 xN 版本归档 xN 交付追踪 xN 数据度量 xN 服务、工单管理 事件、缺陷管理 想 法 用 户 运行阶段 需求阶段 研发阶段 现代软件交付挑战:开发0 码力 | 59 页 | 81.43 MB | 1 年前3Zadig 面向开发者的云原生 DevOps 平台
自动化测试 xN 性能测试 xN 安全测试 xN 数据变更 xN 代码变更 xN 配置变更 xN 部署测试环境 xN 部署预发环境 xN 部署生产环境 xN 部署/灰度上线 xN 监控/告警 xN 版本归档 xN 交付追踪 xN 数据度量 xN 服务、工单管理 事件、缺陷管理 想 法 用 户 运行阶段 需求阶段 研发阶段 现代软件交付挑战:开发 5 分钟,上线 2 小时0 码力 | 59 页 | 23.57 MB | 1 年前3FIT2CLOUD CloudExplorer 产品白皮书 v1.7
或者忙于处理其他业务团队的资源申请变更请求。 一些规模较大分工较细的组织还会涉及跨部门小组的流程协作(比如投产环节,部 署完虚拟机后需要给安全部门提申请把虚拟机管理信息加入到堡垒机并授权,部署 配置监控代理、配置备份等)。 结果: 用户侧对于 IT 服务快速响应要求与管理侧 IT 服务响应速度较慢的矛盾越来越大。 图 2: "柜台式" IT 服务管理模式 针对以上申请运行环境时排期比较久的问 地址、将资源信息同步加入到 CMDB、堡垒机、应用部署平台 等运维工具,部署配置监控代理、备份代理,挂载到负载均衡,因此造成流程链路较长,协 作沟通成本高、排期等待时间比较长的问题。 通过云管平台整合 CMDB、堡垒机等运维工具,在部署虚拟机等资源后,能够按预置 策略自动同步管理信息到运维工具,自动部署监控代理、备份代理,配置负载均衡,能够有 效减少协作流程链路,简化流程,降低协作沟通成本,缩短交付时间。 运维工具中或部署运维工 具代理,一方面减少部门间的流程协作环节,另一方面自动同步信息,减少人工操作,维护 数据的一致性,如部署或变更回收虚拟机后自动同步管理信息到 CMDB、堡垒机,自动部 署监控代理、备份代理。 1.5.4 实现运营分析、IT 投入透明化及时回收优化 实现 IT 投入可视化,涵盖虚拟化、私有云、公有云的资源使用成本费用、资源使用量 可视化,并持续分析优化回收浪费资源和0 码力 | 60 页 | 0 Bytes | 1 年前3Red Hat OpenShift GitOps 1.13 了解 OpenShift GitOps
Argo CD 来维护集群资源。Argo CD 是一个开源声明工具,用于应用程 序的持续部署(CD)。Red Hat OpenShift GitOps 将 Argo CD 实现作为一个控制器,以便持续监控 Git 存 储库中定义的应用程序定义和配置。然后,Argo CD 将这些配置的指定状态与集群中的实时状态进行比 较。 Argo CD 报告与指定状态不同的配置。报告允许管理员自动或者手动将配置重新同步到定义的状态。因 OpenShift Container Platform 集群的资源。 2.1. 主要特性 Red Hat OpenShift GitOps 可帮助您自动执行以下任务: 确保集群具有类似的配置、监控和存储状态 对多个 OpenShift Container Platform 集群应用或恢复配置更改 将模板配置与不同环境关联 在集群间(从调试到生产阶段)推广应用程序。 Red Hat OpenShift 此术语表定义了常见的 OpenShift GitOps 术语。 应 应用程序控制器 用程序控制器(Argo CD 应 应用程序控制器 用程序控制器) 执行以下操作的控制器: 持续监控 Git 存储库的更改 监控正在运行的应用程序 将 live 状态与所需的目标状态进行比较 部署新更改 示例包括 Argo CD Application Controller 检测 OutOfSync 应用程序状态,并选择性地采取纠正操0 码力 | 17 页 | 203.28 KB | 1 年前3
共 12 条
- 1
- 2