Istio控制平面组件原理解析
#2920Pilot-Discovery——配置中心(PD) uv1版本和v2版本之间的区别 u建立缓存配置 u触发配置生效方式v1版本和v2版本之间的区别 V1 HTTP1 REST JSON/YAML 弱类型 轮询 SDS/CDS/RDS/LDS 奠定控制平面基础 V2 HTTP2 GRPC Proto3 强类型 Push SDS/CDS/RDS/LDS/HDS/ADS/KDS 和Google强强联手0 码力 | 30 页 | 9.28 MB | 5 月前3Envoy原理介绍及线上问题踩坑
控制面通信 • Pilot-agent进程本身创建UDS接收Envoy连接,用于证书更新下发。并且与istiod建立证书更新通道。 • Envoy 通过pilot-agent转发机制与istiod建立长连接,通过xDS协议接收系统下发的监听器、路由、集群节点等更新信息。 • 3. 数据面通信 • 客户端请求进入容器网络,并被iptables规则拦截,经过DNAT后进入Envoy virtualOutbound监听器 常观察到新连接被分配到某些线程。 • Envoy的线程模型是工作线程由libevent事件信 号驱动串行的处理发生的新事件(网络,定时器) • 请求堆积在某些线程将导致tp90上升,QPS处理 能力下降。 • 对于长连接和规格较高的Envoy影响更明显。短 链接可以一定程度上提升连接线程选择的随机性。 • 实际使用中客户更关注tp90的端到端时延,减少 由于超时导致的请求失败。 Copyright © Huawei QPS及平均时延在线程数确定时,随连 接数增加快速恶化 端到端平均时延 降低23%左右 • Envoy: 4线程,4core,默认内存 • fortio –q 0 –c 2~1024连接,http1长 连接模式,每组测试三次,每次30s 测试结果 测试条件 Copyright © Huawei Technologies Co., Ltd. All rights reserved. Page0 码力 | 30 页 | 2.67 MB | 1 年前3百度APP基于Istio实现基础架构升级 - lightning talk - MichaelXu
可观测性不足,是否有通用机制提升产品线可观测性? Ø 部分模块上下游超时配置不合理,超时倒挂,集中管理调整成本比较高。 Ø 多数模块对单点异常,慢节点等异常缺乏容忍能力,推动每个模块独立修复,成本高,上线周期长。 Ø 因重试导致雪崩,底层RPC框架需要重复建设来定制动态熔断能力。 Ø 升级一级服务建设中,发现很多模块单点、多点故障不能容忍,能否低成本解决? Ø 比如常用运维降级、止损能力各个产品线重复建0 码力 | 9 页 | 2.20 MB | 1 年前3
共 3 条
- 1