设计 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Curve设计要点

01 02 03 04 总体设计系统特性近期规划背景 • 多个存储软件：SDFS、NEFS、NBS • 已有的开源软件：Ceph • 不能胜任性能、延迟敏感的场景 • 异常场景抖动较大（比如慢盘场景） • 去中心节点设计在集群不均衡的情况下需要人工运维 • 基于通用分布式存储构建上层存储服务背景 01 02 03 04 总体设计系统特性近期规划基本架构 • Chunkserver节点； 4. Client 向 leader 发送读写请求, Chunkserver 完成后通知client； 5. Client通知用户请求完成。背景 01 02 03 04 总体设计系统特性近期规划单卷4K随机读写IOPS 102k 39.7k 41.7k 127k 4K随机写 4K随机读 Ceph（L/N） Curve 151.89% 204.56% 单卷4K随机读写平均延迟(ms) 自动化部署工具 • 一键部署，一键升级高质量 • 良好的模块化和抽象设计 • 完善的测试体系 • 单元测试行覆盖80%+，分支覆盖70%+ • 集成测试 Given When Then 方法完备的测试用例集 • 自动化异常测试 41个异常用例 • 自动化大压力随机故障注入 20轮随机故障注入背景 01 02 03 04 总体设计系统特性近期规划• 性能优化 • 满足数据库性能要求

0 码力 | 35 页 | 2.03 MB | 5 月前
3
CurveFS方案设计

© XXX Page 1 of 14 CurveFS方案设计（总体设计，只实现了部分）© XXX Page 2 of 14 时间修订人修订内容 2021-03-23 李小翠初稿(背景，调研，架构设计) 2021-03-30 李小翠增加快照部分 2021-04-13 李小翠、陈威补充元数据数据结构 2021-04-19 李小翠、吴汉卿、许超杰等补充文件空间分配，讨论与确认背景背景调研开源fs 性能对比可行性分析方案对比对比结论架构设计卷和文件系统元数据架构文件系统快照方案一：文件/目录级别快照方案二：文件系统快照关键点元数据设计数据结构索引设计文件空间管理开发计划及安排背景为更好的支持云原生的场景，Curve需要支持高性能通用文件系统，其中高性能主要是适配云原生数据库的场景。当前Curve是实现了块存储，向上可行性分析方案对比根据上述调研和测试结果，我们考虑了三种curvefs的元数据设计方案： CurveFS kv方案设计 curve实现块设备时，元数据不是扁平化的设计，而是采用来有目录层级的 namespace 方式，namespace 已经实现了 fs 元数据管理的雏形，具备了基本的元数据管理功能。（当时为什么要设计为 namespace 的管理形式？留有租户这个概念），直接基于 namespace

0 码力 | 14 页 | 619.32 KB | 5 月前
3
CurveFS Client 概要设计

© XXX Page 1 of 11 CurveFS Client 概要设计（已实现）© XXX Page 2 of 11 背景概述关键接口分析 init destroy lookup write read open create & mknod mkdir forget unlink rmdir opendir readdir getattr & setattr access rename readlink link flush & fsync 其他功能分析模块划分接口设计 Cache设计时间作者内容 2021-04-27 许超杰初稿背景 CurveFS初步设计见，目前需细化Client端设计 CurveFS方案设计（总体设计，只实现了部分）概述 CurveFS client 向上提供两层接口，分别是© (fuse_req_t req, fuse_ino_t ino, fuse_ino_t newparent, const char *newname); 这个涉及到下文中”重要问题讨论“，目前暂时无法设计硬链接相关目前可先不实现。© XXX Page 9 of 11 flush & fsync 缓存的问题暂时先不考虑太细，目前默认数据和元数据直接存储到底层，这两个也可先不实现其他 xa

0 码力 | 11 页 | 487.92 KB | 5 月前
3
Curve 分布式存储设计

Curve 分布式存储设计程义 — Curve Maintainer XAgenda 第二第三第四第一 Curve的由来 Curve的设计目标 Curve块存储和 Curve文件存储 Curve社区Curve的由来 1. 代码复杂/代码量大 2. 运维难度高 3. 无法满足高的性能需求Curve的设计目标 1. Curve云原生软件定义存储 2. Curve块存储 CopySet分配算法 4. 拓扑结构 5. 高性能 6. chunkfilepool (降低写放大) 7. data stripe (增大并发) 8. zerocopy 9. 云原生核心设计Curve块存储 1. physical pool用于实现对机器资源物理隔离 2. zone故障隔离的基本单元 3. server表示物理服务器 4. chunkserver物理服务器上 chunkserver负责数据的存储 2. RAFT协议保持数据的一致性 3. chunkfile pool降低元数据开销 Chunkserver服务Curve块存储性能设计Curve块存储在线升级设计 1. 客户端分成NebdClient与 NebdServer两部分 2. NebdClient只做简单的转发 3. NebdServer实现大部分的客户端逻辑Curve块存储

0 码力 | 20 页 | 4.13 MB | 5 月前
3
curvefs client删除文件和目录功能设计

client 删除文件和目录功能设计© XXX Page 2 of 15 背景相关调研 moosefs chubaofs 方案设计思考 1.Trash机制是实现1个(类似chubaofs)，还是2个（类似moosefs）？ 2. Trash放在哪里？ 3. 是否需要做session机制（在metaserver打开），来维护inode的打开情况？方案设计 Trash机制： Session机制：遗留问题工作量评估背景目前curvefs client版本对删除unlink和rmdir的设计只有简单的删除inode和dentry结构，遗留了nlink和lookup count相关的内容还未实现，是不完备的。本文首先调研moosefs，chubaofs等分布式系统，参考并设计解决上述遗留问题。当前删除接口代码如下：© XXX Page 3 of 15 CURVEFS_ERROR 我们的整个架构设计本身就类似chubao方式，这个方案本身是chubaofs的成熟方案，说明是已经被验证过是可行的方案。缺点：由于link、unlink等接口涉及跨服务器的两个请求的处理，可能会存在孤儿inode的问题，这一情况，chubaofs是通过运维手段去修复，见遗留问题。moosefs由于单mds，不存在这个问题。方案设计思考首先我们可以确定以下几个设计点：删除

0 码力 | 15 页 | 325.42 KB | 5 月前
3
CurveFS对接S3方案设计

© XXX Page 1 of 11 curvefs对接s3方案设计（过程文档）© XXX Page 2 of 11 时间修订人修订内容 2021-05-20 胡遥初稿 2021-07-20 胡遥细化write和read流程整体架构整体思路接口和关键数据结构 mds.proto client端数据结构 metaserver.proto space相关数据结构和proto

0 码力 | 11 页 | 145.77 KB | 5 月前
3
Curve文件系统元数据持久化方案设计

0 码力 | 12 页 | 384.47 KB | 5 月前
3
Curve质量监控与运维 - 网易数帆

软件生命周期内更好地为用户服务：  质量——向用户交付稳定可靠的软件；  监控——直观地展示Curve运行状态；  运维——保障Curve始终稳定高效运行。质量 ✓ 质量管理体系（设计、开发、review、CI） ✓ 测试方法论（单元测试、集成测试、系统测试）监控 ✓ 监控架构 ✓ 指标采集、后端处理、可视化展示运维 ✓ 运维特性（易部署、易升级、自治） ✓ 运维工具（部署工具、管理工具）致的程度。为了确保最终交付的软件满足需求，必须将质量控制贯穿于设计、开发到测试的整个流程中。设计  设计流程  文档规范开发  编码规范与提交流程  版本管理测试  测试方法论  CI与异常测试 6/33设计流程 Curve团队采用敏捷开发模式，负责人在制定迭代计划时，确认哪些任务需要设计文档：  小需求（改动小）将实现思路记录到任务管理系统中（JIRA），即可进行开发；大需求（新模块、复杂功能）需要输出独立设计文档，并进行评审；对于功能或性能影响较大的功能，还需要进行POC验证；评审和验证通过后才能启动开发工作。小需求实现思路开发大需求设计文档 POC 开发 7/33设计文档规范设计文档需要具备以下内容：  修订记录  审批记录  系统介绍  相关调研  架构  重要流程  关键算法  接口  数据库设计  非功能特性设计

0 码力 | 33 页 | 2.64 MB | 5 月前
3
Curve文件系统空间分配方案

延迟分配/Allocate-on-flush Inline file/data 空间分配整体设计空间分配流程特殊情况空间回收小文件处理并发问题文件系统扩容接口设计 RPC接口空间分配器接口背景根据，文件系统基于当前的块进行实现，所以需要设计基于块的空间分配器，用于分配并存储文件数据。 CurveFS方案设计（总体设计，只实现了部分）本地文件系统空间分配相关特性局部性尽量分配空间分配整体设计分配器包括两层结构：第一层用bitmap进行表示，每个bit标识其所对应的一块空间（以4MiB为例，具体大小可配置）是否分配出去。第二层为free extent list，表示每个已分配的块，哪些仍然是空闲的（offset, length），以offset为key进行排序（这里可以用map或者btree对所有的free extent进行管理）。当前设计不考虑持久 Page 7 of 11 文件系统扩容在线扩容时，直接在新扩容的空间上，创建新的空间分配器进行空间管理。文件系统重新加载时，再将所有的空间，按照上述的策略，进行分组管理。接口设计 RPC接口当前设计是把空间分配器作为内置服务放在元数据节点，所以请求的发起方是fuse client，元数据服务器接收到请求后，根据fsId查找到对应的文件系统的空间分配器后，将空间分配/回收的任务交给这

0 码力 | 11 页 | 159.17 KB | 5 月前
3
Curve支持S3 数据缓存方案

XXX Page 2 of 9 版本时间修改者修改内容 1.0 2021/8/18 胡遥初稿背景整体设计元数据采用2层索引对象名设计读写缓存分离缓存层级对外接口后台刷数据线程本地磁盘缓存关键数据结构详细设计 Write流程 Read流程 ReleaseCache流程 Flush流程 FsSync流程后台流程 poc测试验证背景 append接口目前采用先从s3 get，在内存中合并完后再put的方式，对s3操作过多 2.对于4k 小io每次都要和s3交互，导致性能非常差。因此需要通过Cache模块解决以上2个问题。整体设计整个dataCache的设计思路，在写场景下能将数据尽可能的合并后flush到s3上，在读场景上，能够预读1个block大小，减少顺序读对于底层s3的访问频次。从这个思路上该缓存方案主要针对的场景是顺序写和顺序 x相关的S3ChunkInfoList，减少了遍历的范围。对象名设计对象名采用chunkId+blockindex+compaction（后台碎片整理才会使用，默认0）+inodeId。增加inodeId的目的是为了后续从对象存储上遍历，反查文件，这里就要求inodeId是永远不可重复。读写缓存分离读写缓存的设计采用的是读写缓存分离的方案。写缓存一旦flush即释放，读缓存采用可

0 码力 | 9 页 | 179.72 KB | 5 月前
3

共 17 条前往

页

分类

语言

格式

Curve设计要点

CurveFS方案设计

CurveFS Client 概要设计

Curve 分布式存储设计

curvefs client删除文件和目录功能设计

CurveFS对接S3方案设计

Curve文件系统元数据持久化方案设计

Curve质量监控与运维 - 网易数帆

Curve文件系统空间分配方案

Curve支持S3 数据缓存方案