逐灵&木苏-阿里巴巴 K8S 超大规模实践经验
0 码力 | 33 页 | 8.67 MB | 5 月前文档介绍了阿里巴巴在K8S超大规模实践中的经验,包括从自研Sigma调度系统迁移到K8S体系的过程,以及在大规模场景下解决稳定性、容器编排质量和性能问题的实践。阿里巴巴的K8S集群规模达数十个集群、数十万节点,单集群规模可达10,000节点,支撑了数万个应用和超百万容器。文档还讨论了K8S在阿里成功的原因,包括丰富的生态系统、模块化架构设计以及与阿里运维体系的契合。破解 Kubernetes 应用开发困局-王炜
0 码力 | 20 页 | 3.58 MB | 9 月前文档主要讨论了Kubernetes应用开发面临的挑战及其解决方案。随着微服务和容器技术的普及,服务依赖、打包、运行和迁移变得越来越复杂。Docker提供了镜像打包的解决方案,而Kubernetes则专注于容器编排。然而,Kubernetes环境下的开发面临诸多困难,包括概念繁多、声明式定义的学习成本高、调试困难等,这些因素导致开发效率低下。此外,云原生开发技能要求急剧提升,开发工具缺失,进一步增加了开发和运维的负担。文档还介绍了实时热加载和一键Debug的解决方案,旨在提高开发效率。开课吧基于混合云的Kubernetes平台落地实践-程亮
0 码力 | 22 页 | 7.42 MB | 9 月前文档详细介绍了开课吧基于混合云的Kubernetes平台落地实践,重点阐述了多云、多K8S、多环境的建设过程。通过K8S多环境发布方案,实现了从传统发布到一键发布的转变,新增了服务模版,自动生成deployment。二期优化实战中,实现了一套代码支持多种环境,物理隔离和共享资源的多环境部署。最终收益包括降低服务器使用成本40%,运维100%自动化,以及多云部署的高可用性。文档还提到了基于Istio的智能路由,以及多云多K8S多环境平台建设的初衷,包括提升资源使用率、多云冗余高可用和环境并行互不影响。腾讯云 Kubernetes 高性能网络技术揭秘——使用 eBPF 增强 IPVS 优化 K8s 网络性能-范建明
0 码力 | 27 页 | 1.19 MB | 9 月前文档详细介绍了腾讯云如何利用eBPF技术优化Kubernetes服务网络性能,特别是针对IPVS模式中的conntrack性能开销问题。通过编写eBPF程序并注入内核,文档展示了如何绕过conntrack,缩短数据通路,并优化SNAT处理。与业界其他方法相比,该方法继承了IPVS的丰富功能和稳定性,同时减少了对内核的修改。性能测试表明,该方法显著提升了网络性能,但也存在部署难度增加的不足。基于 Kubernetes 构建标准可扩展的云原生应用管理平台-孙健波、周正喜
0 码力 | 27 页 | 3.60 MB | 9 月前文档介绍了基于 Kubernetes 构建标准可扩展的云原生应用管理平台的经验。传统 PaaS 存在有限的、不可扩展的专有 API 与能力,而 Kubernetes 生态提供了“无限”的应用基础设施能力。阿里云团队通过 Kubernetes 构建了多种应用管理平台,如电商 PaaS 和 Serverless 平台,旨在满足研发与运维人员日益增长的应用管理诉求。团队提出了将 Kubernetes 变成面向开发者的平台,构建一个具备“以应用为中心的 API 抽象”、“用户友好”且“高度可扩展”的 Kubernetes。KubeVela 是基于 Kubernetes 和 Open Application Model (OAM) 的可扩展应用平台,结合了 OAM Kubernetes Runtime、Capability Center 和 UI,提供了一个标准化且可扩展的应用管理引擎。Chaos Mesh让应用与混沌在 Kubernetes 上共舞-杨可奥
0 码力 | 30 页 | 1.49 MB | 9 月前文档介绍了Chaos Mesh在Kubernetes上的混沌工程应用。Chaos Mesh是一个专为Kubernetes设计的混沌工程工具,能够在Pod或Container级别进行测试,并通过Helm实现一键部署。文档以NetworkChaos为例,详细描述了Chaos Mesh的结构和工作原理。此外,文档还通过TiDB的案例展示了Chaos Mesh的实际应用,包括在生产环境、测试环境和CI中的使用方案。通过Chaos Mesh,用户可以在Kubernetes上模拟各种故障场景,帮助发现和修复系统潜在的问题。sealos 以 kubernetes 为内核的云操作系统
0 码力 | 29 页 | 7.64 MB | 9 月前Sealos 是一款以 Kubernetes 为内核的云操作系统,旨在将整个数据中心抽象成一台服务器,使云计算的使用像使用个人电脑一样简单。Sealos 通过 CRD 扩展保持与 Kubernetes API 的完全兼容,并利用 Kubernetes 的强大能力和生态系统的各种 SDK。它支持多租户共享一个 Kubernetes 集群,并提供计算安全隔离和存储隔离,确保本地磁盘的同等 IO 能力。Sealos 具有轻量化、超高性能、极易管理等特点,能够支撑超大规模数万节点集群的运行,并在全球范围内实现毫秒级发布。此外,Sealos 还提供一键打包和整体交付的能力,使应用可以在各种公有云上快速启动和运行。Operator Pattern 用 Go 扩展 Kubernetes 的最佳实践
0 码力 | 21 页 | 3.06 MB | 9 月前文档详细介绍了使用 Go 语言扩展 Kubernetes 的 Operator Pattern 最佳实践。Operator 是一种通过 CRD(Custom Resource Definition)和控制器循环(Control Loop)实现 Kubernetes 原生应用扩展的机制。文档从 Operator 的基础模型入手,解释了其核心概念如 Declarative API 和 Automation,并介绍了 Kubebuilder 框架的使用。通过一个构建 CronJob Operator 的实验,文档展示了如何从零开始开发一个生产环境可用的 Operator,涵盖了 Kubebuilder 的工程结构、CR 事件处理、Reconcile 函数的实现等关键技能点。此外,文档还提供了课后思考题,帮助读者深入理解 Operator 开发的细节和挑战。VMware SIG Intro to the vSphere Cloud Provider
0 码力 | 12 页 | 425.38 KB | 1 年前文档介绍了VMware SIG(特别兴趣小组)的使命、项目管理和如何加入的方式。重点讨论了vSphere Cloud Provider从“in-tree”向“out-of-tree”模式的转变,以及相关的存储接口(CSI)和集群API(Cluster API)的进展。文档还详细说明了如何通过GitHub和定期会议参与SIG VMware的工作,并提供了相关项目的GitHub链接和会议时间安排。最后,文档强调了Kubernetes在VMware平台上的运行和支持,并提供了加入SIG VMware的相关链接。VMware SIG Deep Dive into Kubernetes Scheduling
0 码力 | 28 页 | 1.85 MB | 1 年前文档深入探讨了在vSphere平台上运行Kubernetes时的调度和资源管理策略。Kubernetes默认调度机制通过拓扑标签实现Pod的分布,以优化资源访问和可用性。vSphere提供了高可用性和自动化放置选项,但目前Kubernetes尚无法自动感知vSphere的底层拓扑结构。文档还介绍了如何通过调整vSphere和Kubernetes配置以及标签来提高性能、资源优化和可用性,特别是利用vSphere DRS(分布式资源调度器)和HA(高可用性)功能来增强Kubernetes的资源管理和高可用性。此外,文档还讨论了NUMA(非统一内存访问)架构对CPU和内存密集型工作负载的影响,以及如何通过Kubernetes的默认资源管理机制实现效率、公平性、配额和隔离。
共 82 条
- 1
- 2
- 3
- 4
- 5
- 6
- 9
关键词