石油巨头与Kubernetes, Microservice & DevOps 共舞1114最终版
4+1共5个分⽀,每个 分⽀具体的⽤途 版本发布规范 版本发布评审流程, ⽣产环境上线流程 缺陷管理规范 缺陷的定义,缺陷报 告,缺陷跟踪,缺陷 分析 ⽤户需求分解指南 ⽤户需求分解法,⽤ 户故事地图 测试指南 测试的各个阶段,测 试阶段依赖的⽂档, 测试的种类,测试类 型 …… …… 产品主 管 开发主 管 开发⼈ 员 运维主 管 测试⼈ 员 运维⼈ 员 产品经0 码力 | 33 页 | 7.49 MB | 1 年前3第29 期| 2023 年9 月- 技术雷达
我们的使命,Thoughtworks 技术雷达就是为了 完成这一使命。它由 Thoughtworks 中一群资深 技术领导组成的技术顾问委员会,通过定期讨论 Thoughtworks 的全球技术战略以及对行业有重 大影响的技术趋势而创建。 技术雷达以独特的形式记录技术顾问委员会的讨 论结果,从首席技术官到开发人员,雷达将会为各 路利益相关方提供价值。这些内容只是简要的总结。 我们建议您探索雷达中提到的内容以了解更多细 采纳 采纳:我们强烈主张业界采用这些技术。我们会 在适当时候将其用于我们的项目。 试验:值得追求。重要的是理解如何建立这种能 力,企业应该在风险可控的项目中尝试此技术。 评估:为了确认它将如何影响你所在的企业,值 得作一番探究。 暂缓:谨慎推行。 新的 挪进 / 挪出 没有变化 雷达一览 技术雷达持续追踪有趣的技术是如何发展的,我们将其称之为条目。在技术雷达中,我们使用象限和环对其进 开一次视频会议。其主要职责是为 Thoughtworks 的首席技术官 Rachel Laycock 和名誉首席技术官 Rebecca Parsons 提供咨询建议。 作为一个综合型组织,TAB 能够审视影响 Thoughtworks 技术战略和技术人员的各种主题。本期技术雷达内容 基于 2023 年 8 月的 TAB 线上会议创建。 中国区技术雷达汉化组: 边晓琳、陈亮、程显通、樊田、樊卓文、冯0 码力 | 43 页 | 2.76 MB | 1 年前3Kubernetes开源书 - 周立
Node上的Label可与Pod上的Node selector(Node选择器)⼀起使⽤,从⽽控制调度——例如,限制⼀个Pod只能在指 定的节点列表上运⾏。 将Node标记为不可调度,将会阻⽌新的Pod被调度到该Node,但不会影响Node上的现有的Pod。这对于做Node重启之 前的准备⼯作很有⽤。例如,要将node标记为不可调度,可使⽤如下命令: kubectl cordon $NODENAME 请注意,由DaemonSet kubelet可以选择对运⾏容器上的两种探针执⾏和反应: livenessProbe (活动探针):指示容器是否正在运⾏。如活动探测失败,那么kubelet就会杀死容器,并且容器将 受到其 重启策略 的影响。 如容器不提供活动探针,则默认状态为 Success 。 readinessProbe (就绪探针):指示容器是否准备好服务请求。 如就绪探测失败,Endpoint Controller将会从与 字段是⼀个 label selector 。 ⼀个ReplicaSet管理所有与标签选择器相匹配的Pod。它不区分其创建或 删除的Pod,也不区分另⼀个⼈或进程创建或删除的Pod。这允许我们在不影响正在运⾏的Pod的前提下替换 ReplicaSet。 .spec.template.metadata.labels 必须与 .spec.selector 匹配,否则将被API拒绝。 在Kubernetes0 码力 | 135 页 | 21.02 MB | 1 年前3云计算白皮书
(二)云计算市场处于快速增长阶段,运营商引领新一轮市场增长.......... 12 (三)云计算技术不断推陈出新,满足多样性场景需求助力产业升级...... 15 (四)行业上云用云呈阶梯状分布,中小企业成影响上云进程关键.......... 22 三、云计算正向数字世界操作系统转变............................................................. 数据显示 1,2022 年以 IaaS、PaaS、SaaS 为代表的全球云计算市场规模为 4,910 亿美元,增速 19%,较 2021 年同比下降 13.5%。虽然受通胀压力和 宏观经济下行的双重影响,2022 年云计算市场增速下降明显,但对 比全球整体经济仅 3.4%的增长,云计算仍然是新技术融合和业态发 展的重要手段。预计在大模型、算力等需求刺激下,市场仍将保持 稳定增长,到 2026 受云原生安全理念,变革组织管理和人才培养体系,提倡责任共担和 安全内嵌。其次,正确的安全配置是安全防护的前提,持续的安全运 营才能充分发挥安全效能。 (四)行业上云用云呈阶梯状分布,中小企业成影响上 云进程关键 从行业应用来看,我国云计算应用已从互联网拓展至政务、金 融、电信、工业、交通、能源等传统行业,但各行业应用水平参差 不齐,应用深度呈现阶梯状分布。 第一梯队行业上云用云处于成熟期,已从全面上云过渡到深度0 码力 | 47 页 | 1.22 MB | 1 年前3开课吧基于混合云的Kubernetes平台落地实践-程亮
02 03 多云多K8S多环境平台 K8S集群(多个) 管理后台 发布平台 提升资源使用率 1 多云冗余高可用 2 环境并行互不影响 3 P-2 线下多环境一期方案 ‣ 一键拉起master镜像新环境 ‣ 如何确保环境间资源互不影响 ‣ 一期方案存在的问题与挑战 ‣ 如何实现线下多环境 • 一键拉起环境 注意点 • 数据建设依赖于规划 • 数据如何切分 原理 • service1 service2 service3 … jenkins 用户中心数据库 API网关数据库 应用中心数据库 基础服务数据库 基础服务数据库 … … … • 多环境资源互不影响 微服务 • 全链路服务全部属 • 注册中心独立部署 流量隔离 • 多域名,泛域名解析匹配 数据 • 全量同步线上脱敏数据 • Mysql redis ES 全搭建 • 数据全部物理隔离0 码力 | 22 页 | 7.42 MB | 9 月前3k8s操作手册 2.3
NameSpace是Linux 2.6.x之后的内核版本支持的特性,主要用于资源的隔离,有 了NameSpace,一个Linux系统可以抽象出多个网络子系统,各子系统都有自己 的网络设备、协议栈等,且互不影响;Docker容器服务给每个容器组创建一个 NameSpace,以及一个veth-pair设备,其中一半veth-x放在容器的NameSpace 里,另一半veth-y放在宿主系统的NameSpace里,再把位于宿主系统的这块veth memory: "256Mi" cpu: "200m" # 1核cpu为1000m ports: #端口暴露,仅作提示信息,无实际影响 - name: h�p containerPort: 80 protocol: TCP env: #给容器传递的环境变量 effect效应说明主要包含以下三种类型: NoSchedule 不能容忍此污点的新pod不会调度到此Node上,已有 的pod不影响 NoExecute 不能容忍此污点的新pod不会调度到此Node上,已有 的pod被驱逐 PreferNoSchedule 不能容忍此污点的新pod尽量不调度到此Node上,已 有的pod不影响 若无其他结点可调度,则也可调度到此Node上 ★master结点默认的污点: # kubectl0 码力 | 126 页 | 4.33 MB | 1 年前3高性能 Kubernetes 元数据存储 KubeBrain 的设计思路和落地效果-许辰
内存高效复用,避免 OOM 读优化 - 2 多分片并发读 通过并发,大大减少读时延 读优化 - 3 读写分离 follower 可以无限扩展,没有 raft 同步问题 读写之间无相互影响 读优化 - 4 Count 优化 基于周期性 Compact 统计,存在内存 降低时延,减轻存储压力 Watch 优化 - 1 写性能提升带来直接收益 写延迟降低,watch 延迟自然会降低 生产环境 • 2 W 节点 100w Pod 超大集群,有效降低资源碎片率 落地效果 读写 QPS > 1w • 背景介绍 • 设计思路 • 性能优化 • 落地效果 • 未来演进 影响力构建 集成进入 Kubernetes 作为新型 Storage Backend 已经开源,以 TiKV 作为存储引擎 持续优化和完善系统 架构演进 • 目前所有消息严格要求有序 • 消息不重不丢、严格有序,所以写必须单点0 码力 | 60 页 | 8.02 MB | 1 年前3Kubernetes 异常配置检测框架
• … • 找出集群不正常工作的原因 : ( Kubernetes 典型异常 组件异常 • API Server Load Balancer 异常 • API Server Pod 异常 影响 • 通过 API Server 访问集群概率失败 • 升级集群失败 Load Balancer Service Master API Server Pod Master API Server API Server Pod Kubernetes 典型异常 网络异常 • 安全组、路由表配置错误 • 节点防火墙软件等修改 iptables、内核参数 • 网络链路长,手动排查成本高 异常影响 • 应用间无法正常通信 • 集群内 Controller 无法正常工作 YUM 安装自动运维工具 自动安装依赖 firewalld 网络未知原因导致异常 Node Pod eth00 码力 | 31 页 | 9.57 MB | 1 年前3腾讯基于 Kubernetes 的企业级容器云实践-罗韩梅
提供可视化、自动化的运维能力,降低使用者的人力成本和学习成本 可靠 • 所有组件无单点; • 平台本身支持热升级; • 组件自身HA机制,如docker; • 多地域多可用区的容灾设计 • 管理机挂掉:对应用无影响 • 计算节点挂掉:跨机迁移 • 健康探针 ① 存活探针 ② 就绪探针 • 负载均衡 • 重启机制 ① 区分异常原因 ② 本地重启/跨机重启 • 黑名单机制 • 集群核心数据的备份和恢复 ① Etcd 线集群, 分布在四个地区:北京、天津、成都、深圳。 需求:减少机器,降低成本。 手段:在线离线集群做合并。 问题:容器只能管理CPU和内存,不能对网络和磁盘IO做 管理,导致在线应用受离线业务影响。 一次现网事故 一个用户需求 可靠 设计目标 ◼在某个cgroup网络繁忙时,能保证其设定配额不会被其他cgroup挤占 ◼在某个cgroup没有用满其配额时,其他cgroup可以自动使用其空闲的部分带宽0 码力 | 28 页 | 3.92 MB | 1 年前3DaoCloud Enterprise 5.0 产品介绍
DCE 5.0 原生支持 DevOps 开发运维模式,可以实现应用交付的全流程标准化 和自动化,并集成各类精选数据库和中间件,使运维治理更加高效。各个产品 模块独立解耦,支持灵活升级,对业务没有影响,并且能够与众多云原生生态 产品对接,提供完整的解决方案体系。 它经过了近千家行业客户的生产场景检 验,构建了坚实、可靠的数字底座,帮助企业定义数字边界,释放云原生生产 力。 DCE 5.0 的 策略管理:通过图形化界面进行 API 的增删改查,配置 API 策略,例如负载均 衡、路径改写、超时配置、重试机制、请求头/响应头重写、WebSocket、本地限流、 健康检查等,同时保障原生 API 的能力不受影响。 ➢ 插件管理:提供丰富的插件功能,支持安全、流量管控、缓存等插件,支持一键开启/ 停用插件。 ➢ 监控告警:微服务网关在部署时会自动配置监控、告警等功能。每个网关都自带完善 的资源监控和网关业务监控。0 码力 | 18 页 | 1.32 MB | 1 年前3
共 14 条
- 1
- 2