高性能 Kubernetes 元数据存储 KubeBrain 的设计思路和落地效果-许辰
Unary -> Stream 代替分页,降低延迟 内存高效复用,避免 OOM 读优化 - 2 多分片并发读 通过并发,大大减少读时延 读优化 - 3 读写分离 follower 可以无限扩展,没有 raft 同步问题 读写之间无相互影响 读优化 - 4 Count 优化 基于周期性 Compact 统计,存在内存 降低时延,减轻存储压力 Watch 优化 - 1 写性能提升带来直接收益 落地效果 压测环境 • 配合 apiserver 优化手段,规模达 5w 节点 200w Pod 生产环境 • 2 W 节点 100w Pod 超大集群,有效降低资源碎片率 落地效果 读写 QPS > 1w • 背景介绍 • 设计思路 • 性能优化 • 落地效果 • 未来演进 影响力构建 集成进入 Kubernetes 作为新型 Storage Backend 已经开源,以0 码力 | 60 页 | 8.02 MB | 1 年前3Alluxio 助力 Kubernetes, 加速云端深度学习
强大的算力需要匹配的I/O吞吐 2.计算存储分离导致I/O延迟 3.单机缓存无法满足海量数据加速 9993.6 3189.6 0 2000 4000 6000 8000 10000 12000 Synthetic ESSD云盘 PL2 RestNet50 模型训练速度 (images/second) 云盘 Alluxio - 分布式缓存的领导者 开源项目由李浩源博士(Allux Driver Web Driver Alibaba Cloud OSS Alluxio 服务器 Alluxio 服务器 大数据查询 大数据ETL 模型训练 Alluxio核心功能一:分布式数据缓存 Alluxio 服务器 A B /path1/file1 /path2/file2 C A B C A Alluxio 服务器 Alluxio 服务器 大数据查询 大数据ETL 大数据查询 大数据ETL 模型训练 Alluxio核心功能三:统一的文件系统抽象 Alluxio 服务器 Alluxio在云端AI训练场景的性能好处 • 支持大规模的数据缓存 • 本地内存加速 • 支持数据预热 • LRU缓存管理 Object storage (Fuse) Worker (local) Worker (remote) Master Training POD Tier0:0 码力 | 22 页 | 11.79 MB | 1 年前3逐灵&木苏-阿里巴巴 K8S 超大规模实践经验
•nearly one million containers 面向终态升级 通过面向终态的应用管理理 念提高应用运维的效率 自愈能力升级 统一容器与应用实例周期简化 应用启动流程 不可变基础设施 分离基础设施与应用容器简化 应用运维复杂性面向终态升级 • 过程式的运维有什么问题? 例子:升级某服务的 3000 个实例 容 器 平 台 运 维 平 台 容 器 平 台 运 维 平 台 Kubernetes 镜像,一次定义多次运行 通过镜像提供的组装机制 打包应用镜像,包含业务 及运维基础设施进程 更进一步组合多个容器 为一个 Pod,Pod 一次 定义多次运行不可变基础设施 • 应用与运维基础设施容器分离 • 支持各自独立升级 • SidecarSetOpenKruise • AdvancedStatefulSet • SidecarSet • BroadcastJob • CloneSet Read & Index APIServer Client List / Get ETCD rv=nil Page read Filter by condition• APIServer 缓存一致性读 • 索引支持动态新增 • Cache Ready Cache Read & Index APIServer Client list/get @t0 ETCD rv=nil 1.0 码力 | 33 页 | 8.67 MB | 5 月前3Kubernetes开源书 - 周立
:与VM映像相⽐,容器镜像的创建更加容易、有效率。 持续开发,集成和部署 :通过快速轻松的回滚(由于镜像的不可变性)提供可靠且频繁的容器镜像构建和部署。 Dev和Ops分离问题 :在构建/发布期间⽽⾮部署期间创建镜像,从⽽将应⽤程序与基础架构分离。 开发、测试和⽣产环境⼀致 :在笔记本电脑运⾏与云中⼀样。 云和操作系统可移植性 :可运⾏在Ubuntu、RHEL、CoreOS、内部部署,Google Container Pod中的应 ⽤程序之间共享。 Pod的使⽤ Pods可⽤于托管垂直集成的应⽤栈(例如LAMP),但其主要动机是⽀持共同协作、共同管理的⼯作程序,例如: 内容管理系统,⽂件和数据加载器,本地缓存管理等 ⽇志和检查点备份,压缩,旋转,快照等 数据更改观察者,⽇志分配器,⽇志记录和监视适配器,事件发布者等 代理,桥接器和适配器 控制器,管理器,配置器和更新器 ⼀般来说,单个Pod不会运⾏同⼀应⽤的多个实例。 如,同⼀个Node。 Always co-located in the same node(始终位于同⼀个Node) 在⼀个有3个Node的集群中,web应⽤有诸如redis的缓存。我们希望web服务器尽可能地与缓存共存。这是⼀个简单的 redis Deployment的yaml⽚段,包含3个副本和选择器标签 app=store 。 apiVersion: apps/v1beta1 #0 码力 | 135 页 | 21.02 MB | 1 年前3第29 期| 2023 年9 月- 技术雷达
可用的状态管理选项中,我们想突出 Bloc,因为我们团 队在使用该库构建复杂移动应用程序时体验很好。当 UI 组件通过流和事件接收器与业务逻辑进行通信时,围绕 BLoC 模式 结构化的组织代码实现了业务逻辑与表示层的完全分离。Bloc 在 IntelliJ 和 VSCode IDE 中都提供了 良好的插件支持。 48. cdk-nag 试验 cdk-nag 能够识别并报告 AWS CDK 应用程序或 CloudFormation 是一个用于大型语言模型(LLM)的语义缓存库。我们认为需要在 LLM 前增设缓存层主要出于两种 原因——通过减少外部 API 调用来提升整体性能,以及通过缓存近似响应来减少运营成本。不同于使用精确匹 配的传统缓存方式,基于 LLM 的缓存解决方案需要对输入进行相似或相关匹配。 GPTCache 通过使用嵌入算 法将输入转化为嵌入,再通过向量数据库对这些嵌入进行相似性搜索。这种设计有一个缺点,可能会导致缓存 命中时遇 命中时遇到假阳性结果,或缓存未命中时遇到假阴性结果,因此我们建议你在构建基于 LLM 应用时,仔细评估 GPTCache。 100. 语法性别 API 评估 在许多语言中,性别的表现都比英语更为明显,且词语会根据性别发生变化。例如,称呼用户时,可能需要对词 语进行变形,但通常的做法是默认使用男性形式。有证据表明,这会对人的表现和态度产生负面影响 —— 当然, 这也是不礼貌的。使用性别中立语言0 码力 | 43 页 | 2.76 MB | 1 年前3基于Kubernetes构建容器云平台的实践 - UCloud优刻得实验室负责⼈ 叶理灯
DaemonSet 的形式部署 Node-Exporter 采集机器器 Metrics; D. 每个 Node 上以 DaemonSet 的形式部署⾃自研 KUN-Agent 采集⽹网络、⽂文件读写等 Metrics; E. 运⾏行行 Kube-State-Metrics,从它拉取 Job, Deployment 等资源的 Metrics; F. 通过 Blackbox Exporter,实现服务的⿊黑盒主动拨测; C. 基于k8s的api对服务模块(job&watcher)进⾏行行动态管理理。 D. ⼀一个集群对应⽣生成⼀一个watcher,容易易进⾏行行横向扩展。 E. 基于watcher+redis缓存的⽅方式,保证⽤用户在控制台获取集群信息的速度⾜足够快。 Think in Cloud . 北北京 UK8S托管⽅方案 合理理利利⽤用存量量物理理资源 ⽆无需运维管理理K8S集群 ⽆无需部署外部负载均衡0 码力 | 30 页 | 3.52 MB | 1 年前3k8s操作手册 2.3
#根据此名称去寻找对应的volume存储卷 mountPath: /var/log/nginx #容器里的挂载点 readOnly: false #非只读(即可读写) volumes: #存储卷定义,与containers同级 - name: alog #存储卷名称 #访问模式 - ReadWriteMany #可同时被多个node结点读写挂载 #- ReadWriteOnce #同时只可被一个node结点读写挂载 #- ReadOnlyMany #可同时被多个node结点只读挂载 pe 10Gi accessModes: #访问模式 - ReadWriteOnce #同时只可被一个node结点读写挂载 #- ReadOnlyOnce #同时只可被一个node结点只读挂载? persistentVolumeReclaimPolicy: Retain0 码力 | 126 页 | 4.33 MB | 1 年前3腾讯基于 Kubernetes 的企业级容器云实践-罗韩梅
本地磁盘:延时低,不可迁移 共享云盘:云存储,多容器共享,同时读写 内置云盘:云存储,每容器独享,用户无感知 云存储 • 支持在线扩容、quota管理、权限管理 • 共享云盘基于cephFS • 内置云盘基于cephRBD • 腾讯内部ceph版本,微信同款 能力扩展:GPU支持 分布式存储Ceph 海量小数据读写优化 不同用户配额管理 任务带盘迁移 智能拓扑感知 GPU卡拓扑感知0 码力 | 28 页 | 3.92 MB | 1 年前3第1930期:Kubernetes基础介绍
ElasticBlockStore、GlusterFS PV的accessModes属性有以下几类: ReadWriteOnce:读写权限、并且只能被单个Node挂载 ReadOnlyMany:只读权限,允许被多个Node挂载 ReadWriteMany:读写权限,允许被多个Node挂载 PV的有如下几种状态: Avaliable(空闲状态)、Bound(已经绑定到某个PVC上)、Relea0 码力 | 49 页 | 4.11 MB | 1 年前3⾸云容器产品Kubernetes操作指南
755 或 777 存储卷名称:配置该存储类的名称,当创建pvc时,需要引⽤该名称 容量:所要创建存储卷的⼤⼩,单位GB 访问模式:ReadWirteMany:可以多个节点同时读写,ReadWriteOnce:仅单个节点读写 标签:可以添加⾃定义的标签 查看存储卷详情 点击单个存储卷的详情,即可查看该存储卷的详细信息 可以在基本信息和yaml⽂件中切换不同的显示⽅式 20 删除存储卷0 码力 | 94 页 | 9.98 MB | 1 年前3
共 21 条
- 1
- 2
- 3