OpenShift Dedicated集群 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践

Kubernetes 集群运维实践关注“阿里巴巴云原生”公众号回复 1124 获取 PPT自我介绍 •嵌入式、微服务框架 •2017 年加入阿里巴巴，负责阿里集团数十万集群节点规模化运维管理系统的研发工作 •2019 年参与集团全面上云项目并经历了整体架构的云原生升级演进，稳定支撑双11峰值流量分享内容 • 阿里全站上云 • 神龙 (what & why) • 规模化集群运维实践 CI/CD k8s extended Service Mesh 安全容器运维管控在离线混部额度管控监控体系多租隔离上层业务集团业务运维挑战 • 规模大 • 集群规模大 (数十个集群)，节点数量多 (数十万节点) • 业务线多、应用数量多、应用类型复杂 (有状态、无状态、多语言) • 基础环境复杂 • 大规模在线、离线混部 (运维打通) • 装机模板、OS版本

0 码力 | 21 页 | 7.81 MB | 5 月前
3
Service Mesh是下一代SDN吗：从通信角度看Service Mesh的发展

26 Service Mesh Meetup #7 成都站什么是Service Mesh？- by Willian Morgan(Buoyant) A service mesh is a dedicated infrastructure layer for handling service-to-service communication. It’s responsible for the 包括：避免不同功能的网络之间的相互影响；网络设计冗余，增强系统网络的健壮性；为不同的网络提供不同的 SLA ；通过网络隔离提高安全性；通过叠加多个网络增加系统带宽上图中的Kubernets集群使用了Knitter网络插件，部署了四个网络平面产品化增强-支持多网络平面 Istio1.0中不支持多网络平面，当服务地址和Envoy地址分别位于两个网络上时，会导致转发请求时发生死循环，导致socket耗尽，Envoy不停重启。 Service可以享受流量管理，可见性，策略控制等Istio承诺的益处 l 成本 Ø Istio不理解TCP上的应用层协议，其对TCP Service的缺省处理会影响应用层逻辑 -例子：Envoy的LB算法不能处理应用后端集群的Sharding Ø Istio中和HTTP Service 端口冲突会的TCP Service请求会被Envoy直接丢弃 - 要求对应用进行改造，避免端口冲突建议 Ø 将TCP纳入Service

0 码力 | 27 页 | 11.99 MB | 5 月前
3
TiDB中文技术文档

TiDB 运维文档软硬件环境需求部署集群 Ansible 部署方案（强烈推荐）离线 Ansible 部署方案 Docker 部署方案 Docker Compose 部署方案跨机房部署方案配置集群参数解释 TiDB 配置项解释开启 TLS 验证生成自签名证书监控集群整体监控框架概述重要监控指标详解组件状态 API & 监控扩容缩容集群扩容缩容方案使用 Ansible 扩容缩容软硬件环境需求部署集群 Ansible 部署方案（强烈推荐）离线 Ansible 部署方案 Docker 部署方案 Docker Compose 部署方案跨机房部署方案配置集群参数解释 README - 8 - 本文档使用书栈(BookStack.CN) 构建 TiDB 配置项解释使用 Ansible 变更组件配置开启 TLS 验证生成自签名证书监控集群整体监控框架概述重要监控指标详解重要监控指标详解组件状态 API & 监控扩容缩容集群扩容缩容方案使用 Ansible 扩容缩容升级升级组件版本 TiDB 2.0 升级操作指南性能调优备份与迁移备份与恢复数据迁移数据迁移概述全量导入增量导入故障诊断 TiDB 周边工具 Syncer Loader TiDB-Binlog PD Control TiKV Control TiDB Controller TiSpark

0 码力 | 444 页 | 4.89 MB | 5 月前
3
Curve元数据节点高可用

MDS使用election模块的功能进行选主 4.1 Curve中MDS的选举过程 4.2 图示说明选举流程 4.2.1 正常流程 4.2.2 异常情况1：MDS1退出，可以正常处理 4.2.3 异常情况2：Etcd集群的leader发生重新选举，MDS1未受影响，可以正常处理 4.2.4 异常情况3：Etcd的leader发生重新选举，MDS1受到影响退出，不一定可以正常处理。 4.2.4.1 LeaseTIme MDS1、MDS2、MDS3的租约全部过期 4.2.4.4 总结 4.2.5 异常情况四: Etcd集群与MDS1(当前leader)出现网络分区 4.2.5.1 事件一先发生 4.2.5.2 事件二先发生 4.2.6 异常情况4：Etcd集群的follower节点异常 4.2.7 各情况汇总 1. 需求 mds是元数据节点，负责空间分配，集群状态监控，集群节点间的资源均衡等，mds故障可能会导致client端无法写入。需要解决的问题就是：如何确定主备节点。 2. 技术选型提供配置共享和服务发现的系统比较多，其中最为大家熟知的就是zookeeper和etcd, 考虑当前系统中mds有两个外部依赖模块，一是mysql，用于存储集群拓扑的相关信息；二是etcd，用于存储文件的元数据信息。而etcd可以用于实现mds高可用，没必要引入其他组件。使用etcd实现元数据节点的leader主要依赖于它的两个核心机制: TTL和CAS。TTL(time

0 码力 | 30 页 | 2.42 MB | 5 月前
3
金融级云原生 PaaS 探索与实践

金融级云原生 PaaS 探索与实践王成昌（晙曦）蚂蚁金服技术专家2/20 一、业务背景二、多集群管控三、发布运维体系目录 contents 目录3/20 一、业务背景业务背景4/20 业务背景业务架构演进 • 容量  应用|数据库|机房 • 容灾  机房|地域5/20 业务背景业务架构单元化 • 高可用 • 一致性 • 可扩展 • 机房级和地域级容灾能力; 业务背景业务背景 CAFÉ API Server Aggregation Layer 异地多活架构同城双活架构 K8S API Server 基础发布运维跨集群应用资源管理 IaaS层（Aliyun/OpenStack/VMWare/Bare Metal） PaaS 核心层核心流程两地三中心架构跨机房和地域统一应用运维容器运行时 (SLB/ALB) 容器层跨集群管理单元化能力容器镜像管理批次发布原生资源管理 Pod伸缩管理集群伸缩管理变更管控配额管理运维原子操作精细化调度接入层流程调拨应用层流量调拨跨集群状态分发/汇聚数据层流量调拨压测/灰度流量管理单元化元数据管理弹性流量管理跨集群发布策略多集群管理跨集群网络跨集群镜像管理蓝绿发布灰度分组发布

0 码力 | 20 页 | 1.71 MB | 5 月前
3
分布式NewSQL数据库TiDB

TiDB Serverless 计费计费 TiDB TiDB Serverless 回收与删除回收与删除通知渠道 TiDB 删除 TiDB Serverless 删除实例实例创建TiDB集群查看TiDB实例列表查看TiDB实例详情删除TiDB实例⽤户⽤户添加⽤⼾及权限重置⽤⼾密码删除⾮root⽤⼾⽬录分布式NewSQL数据库 TiDB Copyright © 2012-2021 MySQL 协议，⽀持⽔平伸缩，具备强⼀致性和⾼可⽤性。 UCloud 基于PingCAP的TiDB，实现TiDB在公有云的产品化，给⽤⼾提供两种形态产品。TiDB：按⽤⼾指定节点规格⼀键部署，灵活集群管理，接⼊⽅便的⾼性能数据；TiDB Serverless：⽆需关⼼底层资源池、按需使⽤、接⼊⽅便的 Serverless ⾼性能数据库服务。什么是TiDB 分布式NewSQL数据库 TiDB Copyright 2012-2021 UCloud 优刻得 11/120 产品优势产品优势⾼度兼容⾼度兼容 MySQL ⼤多数情况下，⽆需修改代码即可从 MySQL 轻松迁移⾄ TiDB，分库分表后的 MySQL 集群亦可通过 TiDB ⼯具进⾏实时迁移。动态扩展动态扩展通过简单地增加新节点即可实现 TiDB 的⽔平扩展，按需扩展吞吐或存储，轻松应对⾼并发、海量数据场景。分布式事务分布式事务 TiDB 100%

0 码力 | 120 页 | 7.42 MB | 5 月前
3
24-云原生中间件之道-高磊

结构化/半结构化数据，支持高吞吐量实时入库及数据实时查询，实现数据资源智慧化运营。优势低成本存储：支持PB级数据存储高并发：千亿数据实时分析数据源设备监控传感器轨迹数据车联网业务集群物联网套件写入云原生 DB 轨迹查询|实时监测 MR 云原生DB 统计分析物联网数据存储和查询将车联网数据、设备监控数据、客流分析管控数据、交通数据、传感器数据实时写入HBase中度融合，提供适配云原生应用的各种能力。从实现上，可以认为 Rook 是一个提供了 Ceph 集群管理能力的 Operator。其使用 CRD 方式来对 Ceph、Minio 等存储资源进行部署和管理。 Ceph文件存储 MiniO对象存储 • Operator：实现自动启动存储集群，并监控存储守护进程，并确保存储集群的健康； • Agent：在每个存储节点上运行，并部署一个 CSI / FlexVolume 将 Ceph 存储服务作为 Kubernetes 的一个服务进行部署，MON、OSD、MGR 守护进程会以 pod 的形式在 Kubernetes 进行部署，而 rook 核心组件对 ceph 集群进行运维管理操作。 Rook 通过 ceph 可以对外提供完备的存储能力，支持对象、块、文件存储服务，让你通过一套系统实现对多种存储服务的需求。同时 rook 默认部署云原生存储接口的实现，通过

0 码力 | 22 页 | 4.39 MB | 5 月前
3
16-Nocalhost重新定义云原生开发环境-王炜

署和运维环节。但我们忽略了⼀个关键节点：开发阶段微服务应⽤使⽤ Kubernetes ⼯作负载封装后，解决了开发过程应⽤的快速启动问题，开发⼈员只需要在本地安装单节点的 Kubernetes 集群，例如 Minikube、Kind 等即可快速启动微服务应⽤。但对于开发⼈员来说，原来单体应⽤的开发体验变得不复存在，由于应⽤很难在 Docker 容器之外运⾏，所以每次代码修改，都需要经历以下步骤：体应⽤原始⼜简单。 Nocalhost 重新梳理了开发过程所涉及到的⻆⾊和资源：团队管理⼈员 Nocalhost - 重新定义云原⽣开发环境.md 2021/1/20 3 / 7 开发者应⽤集群开发空间通过对这些⻆⾊和资源的重新整合，Nocalhost 重新定义了云原⽣开发环境，并带来了全新的云原⽣开发体验。为了快速理解 Nocalhost 重新定义的云原⽣开发环境，让我们⾸先站在不同的⻆⾊来看 IDE 编辑器和开发环境联动，⽀持远程调试图形化的 IDE 插件，⽆需熟悉 kubectl 命令即可完成云原⽣环境下的开发管理⼈员：统⼀管理微服务应⽤包，降低应⽤的维护成本统⼀管理开发环境和集群，提⾼集群资源的利⽤率，同时具备隔离特性为新员⼯快速分配开发环境，分配环境后⽴刻能进⾏应⽤开发弹性的开发环境资源，⽤完销毁，降低开发成本以 Nocalhost 内置的 Demo：Bookinfo 为例，开发

0 码力 | 7 页 | 7.20 MB | 5 月前
3
13 Istio 流量管理原理与协议扩展赵化冰

Layer Service 1 Istio 流量管理 – 概览 • 控制面下发流量规则： Pilot • 数据面标准协议：xDS • 集群内Pod流量出入： Sidecar Proxy • 集群外部流量入口：Ingress Gateway • 集群外部流量出口：Egress Gateway（可选,在一个集中点对外部访问进行控制） • Service discovery • Load balancing 可以绑定到端口上直接对外服务，也可以不绑定到端口上，而是接收其他 listener 转发的请求。 • Cluster：集群是指 Envoy 连接的一组上游主机，集群中的主机是对等的，对外提供相同的服务，组成了一个可以提供负载均衡和高可用的服务集群。Envoy 通过负载均衡策略决定将请求路由到哪个集群成员。 xDS 协议的主要概念： • Listener Discovery Service (LDS) : 监听器发现服务。监听器发现服务。 • Route Discovery Service(RDS) : 路由发现服务。 • Cluster Discovery Service (CDS)：集群发现服务。 • Endpoint Discovery Service (EDS) ：集群中的服务实例发现服务。 • Secret Discovery Service (SDS) ：证书发现服务。 • Aggregated Discovery Service(ADS):

0 码力 | 20 页 | 11.31 MB | 5 月前
3
Curve核心组件之mds – 网易数帆

• 元数据节点 MDS 管理元数据信息收集集群状态信息，自动调度 • 数据节点 Chunkserver 数据存储副本一致性 • 客户端 Client 对元数据增删改查对数据增删改查 • 快照克隆服务器MDS各个组件 MDS是中心节点，负责元数据管理、集群状态收集与调度。MDS包含以下几个部分： • Topology: 管理集群的 topo 元数据信息。 • Nameserver: 通过结合curve的用户系统，LogicalPool可以通过配置限定特定user使用的方式，实现多个租户数据物理隔离（待开发）。TOPOLOGY Topology的实际例子，右侧是topo配置文件：集群有一个物理pool，由3个zone组成，每个zone有1台server。在物理pool上，还创建了一个逻辑pool，逻辑pool使用3个zone，采用 3副本，有100个copyset。 cluster 信息更新拓扑中的信息。 • ConfGenerator: 将当前上报的 copyset 信息提交给调度模块，获取该 copyset 上可能需要执行的任务。 • HealthyChecker: 检查集群中的 chunkserver 在当前时间点距离上一次心跳的时间，根据这个时间差更新chunkserver状态。 Chunkserver端：chunkserver 端的心跳由两个部分组成： •

0 码力 | 23 页 | 1.74 MB | 5 月前
3

共 110 条前往

页

分类

语言

格式

阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践

Service Mesh是下一代SDN吗：从通信角度看Service Mesh的发展

TiDB中文技术文档

Curve元数据节点高可用

金融级云原生 PaaS 探索与实践

分布式NewSQL数据库TiDB

24-云原生中间件之道-高磊

16-Nocalhost重新定义云原生开发环境-王炜

13 Istio 流量管理原理与协议扩展赵化冰

Curve核心组件之mds – 网易数帆