高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践
冲上云霄—腾讯海量业务上云实践 腾讯云高级工程师 黄宏东 自我介绍 ⚫ 业务开发出身的运维 ⚫ 先后在腾讯负责游戏、安全、医疗类业务运维 ⚫ 经历数年业务爆量、成本优化、业务上云、智能运维等重点项目 ⚫ 目前负责腾讯自研业务的运维与上云工作 01 腾讯业务为什么要上云 02 业务上云的价值 03 如何上云 目录 04 上云案例分享 腾讯业务为什么要上云 接入服务 业务 服务框架 服务框架 KV/RDS CVM/Docker 接入服务 业务 服务框架 KV/RDS CVM/Docker 接入服务 业务 服务框架 KV/RDS CVM/Docker 接入服务 业务 服务框架 KV/RDS CVM/Docker IEG PCG WXG CDG “烟囱式”的业务支持体系 幸福的烦恼 ⚫ 重复造轮子,每个部门一套轮子 ⚫ 缺乏统一规范,包括开源代码在内 缺乏统一规范,包括开源代码在内 Bug 多 ⚫ 开源文化落后,共享精神差,很多基础框架没有内部开源 ⚫ 技术支持不足,文档陈旧 ⚫ 数据技术不互通,部门间代码相互封闭,跟业界缺乏交流 ⚫ 缺乏维护,越来越多的历史遗留组件 ⚫ 没有技术图谱 2018年930变革 开源协同 自研上云 代码开源 相互协同 基于公有云模式研发 组件框架上云,成为云服务 将原有七大事业群(BG)重组整合,新成立云与智慧产业事业群(CSIG)、平台与内容0 码力 | 26 页 | 2.39 MB | 1 年前3FIT2CLOUD CloudExplorer 产品白皮书 v1.7
和条款的约束, 本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非合同 另有约定,杭州飞致云信息科技有限公司对本文档内容不做任何明示或暗示的声明或保证。 由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档中的 所有陈述、信息和建议不构成任何明示或暗示的担保。 公司简介 FIT2CLOUD 飞致云创立于 2014 年,是多云时代技术领先的企业级软件提供商。 12 1.5.4 实现运营分析、IT 投入透明化及时回收优化.............................................12 1.5.5 建立数据中心 IT 体系演进框架支持迭代扩展建设.....................................12 1.6 各行业客户案例....................................... IT 部门采购了大量基础架构及运维安全管理工具,但是却发现在 IT 整体服务响应速度及 管理能力提升上却收效甚微,仍然难以从整体上快速供给提供运行环境资源,快速响应业务 需求,对于业务部门不得不排期等待几小时、几天甚至几周时间获取业务开发测试运行所需 的运行环境资源,对于 IT 部门又耗费大量 IT 人力在重复操作工作上,并且难以精细有效管 理 IT 资源,造成大量的资源浪费和不必要的成本投入。0 码力 | 60 页 | 0 Bytes | 1 年前3高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏
构建企业研发运营一体化体系的PaaS开发框架,提供了aPaaS(DevOps流水线、运行环境托管、前后台框架)和 iPaaS(持续集成、CMDB、作业平台、容器管理、数据平台、AI等原子平台)等模块,帮助企业技术人员快速构建基 础运营PaaS。 腾讯蓝鲸智云秉承开放共赢的理念,以改变中国运维行业为起点,致力于推动国内企业借助研发运营一体化,低成本 实现企业IT经营管理模式升级和自主化。 承载数百款 腾讯业务 管控数十万 大型游戏平台; 平铺式架构,拓扑关系复杂,模块数量上百,服务器数量 几千…… 腾讯游戏300多款业务中,大多数是由世界各地开发商开发 出来。 所使用的开发语言、开发框架、操作系统、数据库等技术, 是没有直观规律的。 开发商很难为了运维体系而对架构或技术做大规模的修改。 有几乎所有的业务类型 有几乎所有的流行技术 300多款游戏相互之间是没有关系的。 发布变更、故障处理等运维操作场景和操作流程是没有直 观规律的。 服务器数量,也就是操作单元,有二十余万。 随着容器技术的普及,操作单元的数量还会暴涨。 所有业务之间无关联 业务操作单元暴涨 运维转型,困难重重 蓝鲸进化第1步:抽象原子平台 蓝鲸配置平台 获取资源 新建大区 主机注册 创建DB 初始化数 据 拉起业务 进程 布署监控 开新区 部署程序 测试验证 清理脏数 据 对外开放 获取新主 机 CMDB注0 码力 | 26 页 | 8.25 MB | 1 年前3Zadig 面向开发者的云原生 DevOps 平台
掘 3-5 个领域敏感型场景 建立产品发展委员会 贡献者流程优化 2022 年 9 月 场 景 深 化 能 力 增 强 Helm/K8s YAML/ 托管场景接入流程优化 UX/UI 升级,工程师一线体验优化 推出效能看板,实时客观度量工程数据指标 效 率 优 化 、 开 发 者 体 验 增 强 2023 年 面向生态伙伴开放场景 面向开发者提供 IDE 插件 / 自测环境 ” 开发者常处于 今天发版、明早升级 嗷嗷待哺状态 Zadig 优势、使用场景、解决问题域 Zadig 解决问题域 Zadig 云原生开放性:极简、 0 负担接入 Zadig 业务架构 Zadig 系统架构 1 Zadig 行业方案 对比分析 职能 传统 DevOps 方案 ZadigX 云原生 DevOps 方案 降本提效 组织能力提升 业务负责人 研发不透明,规划凭感觉: 进度管理:根据团队客观数据,预测和确定项目规划 迭代进度一目了然 项目从无到有可核算 管理有数据科学依据 解放管理,更多时间花在 业务创新 平台运维 业务压力大,能力建设缓慢: • 大量工作花在工具链维护 • 项目间依赖复杂,环境管理难 • 交付版本依赖工单,发布风险高 • 公共资源 / 业务资源利用率低 赋能多业务:一个平台解决了多异构项目的管理和规范 团队高效协作:定义团队角色工作流模板,随时可用云上环境 价值0 码力 | 59 页 | 81.43 MB | 1 年前3Zadig 面向开发者的云原生 DevOps 平台
景 挖 掘 3-5 个领域敏感型场景 建立产品发展委员会 贡献者流程优化 2022年9月 场 景 深 化 能 力 增 强 Helm/K8s YAML/托管场景接入流程优化 UX/UI 升级,工程师一线体验优化 推出效能看板,实时客观度量工程数据指标 效 率 优 化 、 开 发 者 体 验 增 强 2023年 面向生态伙伴开放场景 面向开发者提供 IDE插件/ 自测环境 通用工作流广泛链接生态赋能开发者 21 个版本 开发者常处于“今天发版、明早升级”嗷嗷待哺状态 Zadig 优势、使用场景、解决问题域 Zadig 解决问题域 Zadig 云原生开放性:极简、0 负担接入 Zadig 业务架构 Zadig 系统架构 Zadig 行业方案 对比分析 职能 传统 DevOps 方案 ZadigX 云原生 DevOps方案 降本提效 组织能力提升 业务负责人 研发不透明,规划凭感觉: • 发版时间靠运气 进度管理:根据团队客观数据,预测和确定项目规划 迭代进度一目了然 项目从无到有可核算 管理有数据科学依据 解放管理,更多时间花在 业务创新 平台运维 业务压力大,能力建设缓慢: • 大量工作花在工具链维护 • 项目间依赖复杂,环境管理难 • 交付版本依赖工单,发布风险高 • 公共资源/业务资源利用率低 赋能多业务:一个平台解决了多异构项目的管理和规范 团队高效协作:定义团队角色工作流模板,随时可用云上环境 价值清0 码力 | 59 页 | 23.57 MB | 1 年前3Zadig 产品使用手册
D e v O p s 平 台 。 领先企业抢先实践 Zadig Zadig 研发数字化转型方案正成为产业数字化战略的核心环节 Zadig 设计思路:通过「平台工程」解决流程挑战,通过「技术升级」提升组织效能 01 04 02 03 工程化协同:“人、技术、流 程、工具” 四维协同基线,沉 淀全流程数据,从感知到赋 能,服务于工程师 释放云基建能力:链接任何云 及自建资源(容器、主机、车 流程平台 围绕 Jenkins 或 CI/CD 工具 搭建流程串接胶水平台 局限性大扩展性差 内部推广难度极高 做完后价值难被证明 通用性、可扩展性、技术先进性强,可以灵活 广泛接入各种技术和业务场景 基于代码管理的 DevOps 方案 Gitee 平台 GitLab 平台 局限性大、全流程安全性低 维护成本高 支持多个服务并行构建部署、产品级发布,可 灵活安全接入多个代码仓及周边工具链 自动化测试 测试工程师 • 升级预发环境 • 升级生产环境 • 变更数据库 发布工程师 核心场景介绍:不同角色工程师基于统一协作平面,操作使用自动化工作流和云原生环境 面向角色 功能描述 工作流名称样例 具体配置 开发工程师 CI 过程 project-unit-test project-scan • 单元测试、代码扫描 更新日常开发环境及 dev 业务配 置 project-dev-workflow0 码力 | 52 页 | 22.95 MB | 1 年前3Zadig 产品使用手册
D e v O p s 平 台 。 领先企业抢先实践 Zadig Zadig 研发数字化转型方案正成为产业数字化战略的核心环节 Zadig 设计思路:通过「平台工程」解决流程挑战,通过「技术升级」提升组织效能 01 04 02 03 工程化协同:“人、技术、流 程、工具” 四维协同基线, 沉淀全流程数据,从感知到赋 能,服务于工程师 释放云基建能力:链接任何云 及自建资源(容器、主机、车 流程平台 围绕 Jenkins 或 CI/CD 工具搭 建流程串接胶水平台 局限性大扩展性差 内部推广难度极高 做完后价值难被证明 通用性、可扩展性、技术先进性强,可以灵活 广泛接入各种技术和业务场景 基于代码管理的 DevOps 方案 Gitee 平台 GitLab 平台 局限性大、全流程安全性低 维护成本高 支持多个服务并行构建部署、产品级发布,可 灵活安全接入多个代码仓及周边工具链 自动化测试 测试工程师 • 升级预发环境 • 升级生产环境 • 变更数据库 发布工程师 核心场景介绍:不同角色工程师基于统一协作平面,操作使用自动化工作流和云原生环境 面向角色 功能描述 工作流名称样例 具体配置 开发工程师 CI 过程 project-unit-test project-scan • 单元测试、代码扫描 更新日常开发环境及 dev 业务配置 project-dev-workflow0 码力 | 52 页 | 16.27 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
户群体。 医疗医药 医疗医药⾏业的信息化⽔平呈现⾼速发展的态势,IT 资产规模快速扩张,迫切需要通过堡垒机实现⼤规模 IT 资产的统⼀管 理与安全运维。 房地产及酒店 房地产和酒店⾏业的业务系统通常随业务经营场所分布式构建,IT 基础设施⾼度分散,需要通过堡垒机实现 IT 基础设施的 统⼀安全运维。 1 2 企业为什么需要堡垒机? JumpServer 堡垒机的优势 JumpServer 产品安装 提供安装⽂档、远程安装、现场安装。 现场紧急救助服务 合计 5 ⼈天的原⼚专业服务:可提供现场安装服务、现场紧急救助服务、现场软件故障排査等服务。 软件升级服务 提供软件X-Pack增强功能包,提供软件⼩版本⽆缝升级服务。 在线⾃助服务 提供客户⽀持⻔户,⽀持客户在线访问⽹站并下载相关资料, 及时掌握最新的软件特性、维护经验、使⽤技 巧等相关知识。 X-Pack 增强包(已上线功能) ubernetes/远程应⽤ 全过程管控 事前授权、事中监察、事后审计 持续创新 按⽉⾼质量持续迭代,提供强⼤功能 海量案例⽀持,与⽤户共成⻓ ⽆隐形费⽤ ⽆单独收费模块和功能 版本升级⽆需额外费⽤ 完美搭档,助⼒成功 活跃的开源社区、丰富的知识库 专属企业级⽀持服务 ⾦融⾏业 JumpServer 堡垒机助⼒江苏农信⾏业云安全运维 ⾦融⾏业 宁证期货通过 JumpServer0 码力 | 49 页 | 14.87 MB | 1 年前3云原生 DevOps 平台 Zadig 产品介绍
〉数字化” 的数智跃迁,保障软件稳定升级、提升上线效率 1 倍多,节省了过去 90% 研发运营费⽤。更多⻋主感知,更快软件迭代,更好体验触 达。极氪速度,即刻触达,极客升级,赢得更多订单! ⼩鹏某部⻔,利⽤ Zadig 打通云和端的开发者协同,实现软件交付统 ⼀管理,降低运维⽇常 80% 的繁复⼯作量,轻松应对数百业务服务 的灵活接⼊。帮助研发节省出⼤量时间,投⼊到业务创新! 字节跳动⻜书的若⼲团队⽤ 化。通过云原⽣技术和⼯程能⼒,建⽴企业多维度数字化能⼒,从业务、流程、质 量、成本管理,释放“数字⼯程师”⽣产⼒。 Zadig 研发数字化成功案例 企业案例 Zadig 价值运营指标 业务管理简单⾼效,⽀持 RBAC/ABAC 权限隔离 流程模版统⼀规划,产研协同更⾼效,⾃动化⼀切 质量建设有的放⽮,全流程内建安全,测试驱动开发 多视⻆资源管理,业务协同更透明,成本可观测 ⼯程师数字化协作,幸福度更⾼更专注0 码力 | 8 页 | 18.50 MB | 1 年前3CloudExplorer 3.0 管理员手册v1.2
..........254 9.3.8 查看各个部门历史月份费用变化情况及趋势............................................255 9.3.9 查看各个业务或项目历史月份费用变化情况及趋势................................255 9.3.10 查看各个云账号下资源使用情况......................... 阅读对象 杭州飞致云信息科技有限公司 7 IT 系统管理员、云平台管理员、运营人员 云管平台实施人员 云管平台开发测试人员 1.3 名词术语 名词 解释 基础架构平台 指为业务系统开发测试、运行提供运行环境资源的各类虚拟化平台、超融 合平台、私有云平台以及公有云平台。 虚拟化平台 指以 VMware 为代表的基于虚拟化技术整合物理机以虚拟机方式提供资源 的平台,除 网络还允许划分成更小的网络,称为子网(Subnet)。 ITSM 全称 IT Service and Management,是诸多大中型企业采用的 IT 变更请 求管理工具,用于 IT 部门面向应用业务开发测试、业务部门以及 IT 部门内 部成员提交 IT 服务请求,流程管理、流程审批,派发,沟通反馈操作结果 输出,记录变更,记录管理知识库。通常 ITIL 以 ITSM 工具进行落地。比 较 常 见0 码力 | 308 页 | 0 Bytes | 1 年前3
共 16 条
- 1
- 2