阿里云容器服务大促备战
Kubernetes (ACK, ASK) Web/mobile applications - Stateless - Idempotent - Horizontal scalable Mysql Kafka TIDB Elasti c Search Tensor Flow Spark Flink Redis Zoo keeper云原生实时计算与人工智能@微博 2.4倍性能提升 百亿实时样本 万亿维度模型云原生基础设施0 码力 | 17 页 | 17.74 MB | 5 月前3阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践
宕机根因分析诊断 • 硬件故障、运维事件 • vmcore 归类分析 • 内核错误日志分析Machine Operator • 全生命周期 • 导入 • 下线 • 维护 • 组件终态 • 安装 • 升级 • 回滚 • 故障自愈 • 运维事件 • 业务置换Machine Operator未来工作 • 稳定性、资源利用率、运维效率 • 基于安全容器的新混部架构 • 全业务上云、Serverless0 码力 | 21 页 | 7.81 MB | 5 月前3深入 Kubernetes 的无人区-蚂蚁金服双十一的调度系统
Operators AI 训练 Kubernetes TensorFlow PyTorch Horovod/mpi XGBoost Spark SparkApplication Spark Operator 在线应用 无状态服务 Node Node Node Node Node Node 无状态服务 无状态服务 无状态服务 无状态服务 无状态服务 无状态服务 TF PS 1 TF Worker spark exec 212/19 随着业务越来越多… Part 2:双十一 Kubernetes 实践13/19 调度性能优化 Part 2:双十一 Kubernetes 实践14/19 Operator开发者最佳实践 Part 2:双十一 Kubernetes 实践 • CRD 在定义时需要明确未来的最大数量,大量CR 业务最好采用 aggregate-apiserver 进行扩展 •0 码力 | 19 页 | 2.18 MB | 5 月前3蚂蚁金服双十一 Service Mesh 超大规模落地揭秘
方案落地-目标架构 MOSN APP Pod MOSN APP Pod 服务发现 More Sidecar More Sidecar Pilot MQ Kubernetes Sidecar Operator 产品层 运维能力 监控能力 流量调控 安全能力 扩展能力 HTTP/RPC13 方案落地-拷问 现有框架升级 容器如何替换 MOSN 如何升级 需要业务改代码吗 能回滚吗? New With MOSN Pod New With MOSN 扩容 缩容 资源 Buffer Pod APP:4C8G Pod APP:4C8G MOSN:4C2G Operator 注入 传统接入 VS 原地接入 4C2G? Elastic Heap CPU超卖17 方案落地-MOSN 升级策略-有感升级 MOSN V1 APP MOSN0 码力 | 26 页 | 2.71 MB | 5 月前3金融级云原生 PaaS 探索与实践
• 接入监控告警体系,全程保证 可观测性 partition:3 partition:5 InPlaceSetControlle r replica:519/20 技术风险管控 Operator变更三板斧 发布运维体系 可灰度: • Controller 发布避免 0-1; 可回滚: • 回滚到基线版本; • 快速止血,停止新版本调和; 可监控: • metrics 指标(任务队列|消费&重0 码力 | 20 页 | 1.71 MB | 5 月前3SOFAMesh的通用协议扩展
• 打包 • 安装 • 部署 • 测试 • 支持主流的微服务框架 • SOFA • HSF • DUBBO • SPRING CLOUD • … • 控制平面创新的地方 • MESH OPERATOR • RPC SERVICE CONTROLLER • …SERVICE MESH 落地中的问题常见的 MESH 落地方案 在非 KUBERNETES 环境部署 ISTIO 把 KUBERNETES0 码力 | 28 页 | 4.73 MB | 5 月前3Service Mesh 在『路口』的产品思考与实践
ub.com/sofastack/sofa-rpc28/39 Part 3: 蚂蚁金服的产品实践 虚拟机支持 • 云原生架构下,sidecar 借助于 k8s 的 webhook/operator 机制可以方便地实现注入、升级 等运维操作 • 然而大量系统还没有跑在 k8s 上,所以我们通过 agent 的模式来管理 sidecar 进程,从而可 以使 Service Mesh0 码力 | 40 页 | 15.86 MB | 5 月前3
共 7 条
- 1