在大规模Kubernetes集群上实现高SLO的方法
0 码力 | 11 页 | 4.01 MB | 1 年前3阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践
周 涛 (广侯) 阿里巴巴 云原生应用平台 技术专家 阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践 关注“阿里巴巴云原生”公众号 回复 1124 获取 PPT自我介绍 •嵌入式、微服务框架 •2017 年加入阿里巴巴,负责阿 里集团数十万集群节点规模化运 维管理系统的研发工作 •2019 年参与集团全面上云项目 并经历了整体架构的云原生升级 演进,稳定支撑双11峰值流量分享内容 演进,稳定支撑双11峰值流量分享内容 • 阿里全站上云 • 神龙 (what & why) • 规模化集群运维实践 • 未来工作云原生全景图阿里全站上云 • 2018年底:阿里经济体全面上云 • 2019上云第一仗:基础设施上云 • 双11顺利通过峰值流量考验神龙 X-Dragon • 全称:弹性裸金属服务器(神龙) • 阿里造“神龙”神龙 X-Dragon • 优势: • 性能 • 弹性 的探索和创新成为 可能 • ASI (k8s) + 容器 (runc / runv / kata / ..) + 神龙 = 阿里云原生化 的最佳组合 • 最大的电商平台之一,并池最佳化资源利用率 • 大规模混部、优先级差异化提升资源使用效率 • Alibaba Serverless Infrastructure (ASI) 的基石上云效率提升 物理机 (云下) 神龙裸金属 (云上) 交付周期 周 分钟级0 码力 | 21 页 | 7.81 MB | 5 月前3consul 集群搭建
链滴 consul 集群搭建 作者:boolean-dev 原文链接:https://ld246.com/article/1545917881597 来源网站:链滴 许可协议:署名-相同方式共享 4.0 国际 (CC BY-SA 4.0) consul集群搭建 consul agent -data-dir /tmp/node0 -node=node0 -bind=192.168.64 168.64.94:8400 192.168.64.59 consul join -rpc-addr=192.168.64.249:8400 192.168.64.59 原文链接:consul 集群搭建0 码力 | 2 页 | 124.59 KB | 1 年前3使用 Docker 建立 MySQL 集群
使用 Docker 建立 Mysql 集群 软件环境介绍 操作系统:Ubuntu server 64bit 14.04.1 Docker 版本 1.6.2 数据库:Mariadb 10.10 (Mariadb 是 MySQL 之父在 MySQL 被 Oracle 收购之后 创建的分支,性能上优于 MySQL 开源版本) 第一步 安装 Docker 对于 Ubuntu,建议直接联网安装 Docker MYSQL_PASSWORD=medical_waste \ -e MYSQL_DATABASE=medical_waste \ -e TERM=linux \ -d mariadb 第三步 配置一主一从集群 3.1 接下来启动另一个容器作为从数据库,因为镜像不支持在容器内进入 mysql 控制 台,所以依然需要把端口暴露出来以供局域网访问,但主数据库容易可以链接进 来作为一个可访问的主机 master_db。 master_log_pos=789; /*开启从数据库复制*/ start slave; 最后可以通过 show slave status; 查看同步情况。 至此我们就建立了一个基于 Docker 的 Mariadb 数据库集群。0 码力 | 3 页 | 103.32 KB | 1 年前3OpenShift Container Platform 4.7 更新集群
OpenShift Container Platform 4.7 更新集群 更新 OpenShift Container Platform 集群 Last Updated: 2023-03-24 OpenShift Container Platform 4.7 更新集群 更新 OpenShift Container Platform 集群 Enter your first name here. Enter property of their respective owners. 摘要 摘要 本文档提供了有关更新和升级 OpenShift Container Platform 集群的信息。更新集群的过程较简单, 可以在不需要使集群离线的情况下进行。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 非受管 OPERATOR 的支持策略 第 第 2 章 章 更新集群概述 更新集群概述 2.1. 了解 OPENSHIFT UPDATE SERVICE 2.2. 安装和配置 OPENSHIFT UPDATE SERVICE 2.3. 了解升级频道和发行版本 2.4. 使用 WEB 控制台更新集群 2.5. 使用 CLI 更新集群 2.6. 执行 CANARY ROLLOUT 更新 2.7.0 码力 | 62 页 | 716.72 KB | 1 年前3OpenShift Container Platform 4.14 更新集群
OpenShift Container Platform 4.14 更新集群 更新 OpenShift Container Platform 集群 Last Updated: 2024-02-23 OpenShift Container Platform 4.14 更新集群 更新 OpenShift Container Platform 集群 法律通告 法律通告 Copyright © 2024 Red property of their respective owners. 摘要 摘要 本文档提供了有关更新和升级 OpenShift Container Platform 集群的信息。更新集群的过程较简单, 可以在不需要使集群离线的情况下进行。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . OPENSHIFT 更新简介 1.2. 集群更新如何工作 1.3. 了解更新频道和发行版本 1.4. 了解 OPENSHIFT CONTAINER PLATFORM 更新持续时间 第 第 2 章 章 准 准备 备更新集群 更新集群 2.1. 准备升级到 OPENSHIFT CONTAINER PLATFORM 4.14 2.2. 准备使用手动维护的凭证更新集群 2.3. PREFLIGHT 验证内核模块管理0 码力 | 149 页 | 1.94 MB | 1 年前3Golang大规模云原生应用管理实践
Golang⼤规模云原⽣应⽤管理实践 刘洋(炎寻) 关于我 • 毕业于中国科学技术大学,定居杭州 • 就职于阿里云-云原生应用平台团队 • Problem Solver,聚焦中间件,容器,Kubernetes,PaaS平台… • OAM社区成员 开局一张图 规模化应用交付效率对比去年 每万笔峰值交易的IT成本对比4年前 提升1倍 下降80% 云原生 技术 稳定 成本 效率 tes进行的一场技术标准化演进。通过标准可扩展的调度,网络, 存储,容器运行时接口来提供基础设施;通过标准可扩展的声明式资源和控制器来提供运维能力。两层标 准化推进了细化的社会分工,各领域进一步提升规模化和专业化,全面达到成本,效率,稳定性的优化。 4 6 7 2 3 5 1 1 Kubectl plugins 2 Apiserver extension 3 4 5 6 7 Custom 控制器设计(做什么) • 基于“可重构”状态机,开放的世界 • 不要修改资源声明 • 事件驱动+主动轮询 • 重试 + 幂等 • 自愈 • e2e测试 • Ginkgo BDD • Kind本地K8s集群 新的复杂度-最终一致性 status: … phase: succeed … • 过期的状态 • 版本冲突 • 业务及时性 status: currentBatch: 10 码力 | 23 页 | 7.70 MB | 1 年前3Zabbix高级应用 -- K8S 集群监控
Zabbix高级应用 --K8s集群监控 ����� ��������FiberHome 演讲主题: • CactiFans • Zabbix • Microservice • K8s • Golang https://blog.cactifans.com/ 无边界监控 应用架构发展趋势 数据采集 RESTful 接口 LLD – 低级别发现 低级发现提供了一种监控主机上变化实体,并0 码力 | 25 页 | 11.98 MB | 1 年前3Uber 核心派单系统及其集群管理演化-李宁
Service C RPC Muttley ⼿手动发送1%流量量到新集群 服务健康检查,⾃自动流量量切换 部署管理理 •逐步部署 •Staging •Shadow •Canary •⾃自动部署 •⾃自动触发+⼈人⼯工审核 •根据监控⾃自动回滚 变更更管理理 监控优化: M3 • Uber内部⼤大规模Metric平台 • 开源: m3db/m3@github 监控优化: ⾃自愈⼒力力和⾃自动排障 动态配置和监控(内部, 外部)联动,⾃自动回滚。 ⾃自动排查故障, 通过 tracking系统 开源: Jaeger@github 右侧是Uber在线服务依 赖关系图。对于⼤大规模 复杂系统,⼈人⼯工处理理故 障速度太慢 Ring0 • 单⼀一核⼼心组,拥有⾼高系统权 线,包括流量量切换 • 在较⼤大故障的处理理中起到领导 和汇报作⽤用 流程优化 Post Mortem0 码力 | 23 页 | 15.26 MB | 1 年前3PieCloudDB Database 社区版集群安装部署手册 V2.1
PieCloudDB Database 社区版集群部署和使用手册 版本:V2.1 2023 年 03 月 08 日 目录 1. 集群规划 .......................................................................................................... ................................................................................. 10 2.9 安装 K8S 集群 .................................................................................................. ......................................................................................... 28 4. 集群部署和使用 .............................................................................................0 码力 | 42 页 | 1.58 MB | 1 年前3
共 711 条
- 1
- 2
- 3
- 4
- 5
- 6
- 72