数据结构 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

CurveFS方案设计

增加快照部分 2021-04-13 李小翠、陈威补充元数据数据结构 2021-04-19 李小翠、吴汉卿、许超杰等补充文件空间分配，讨论与确认背景调研开源fs 性能对比可行性分析方案对比对比结论架构设计卷和文件系统元数据架构文件系统快照方案一：文件/目录级别快照方案二：文件系统快照关键点元数据设计数据结构索引设计文件空间管理开发计划及安排背景近期要能支持mysql所要接口，长期需要支持通用文件接口。 kv 虽然改造简单，短期内对基本功能的支持没有问题，但这个架构不利于 Curve 长期的规划和演进，因此选择通用的 dentry，inode 两层映射的元数据结构。对于 fs© XXX Page 4 of 14 的场景，元数据的量比块存储场景会多很多，长期看元数据节点的设计也是需要满足高可用、高可扩、高可靠的。因此对元数据节点的要求总结为：高可用、高可扩、高可靠、高性能。 inode 和 dentry 的数据结构（ inode 和 dentry 两个结构描述还是由一个dentry描述所有信息） inode 和 dentry 的索引设计（btree / skiplist / hashmap ?）元数据的持久化（以 kv 的方式存入文件？存储 rocksdb ?）元数据节点的高可用元数据分片策略（哪些范围的元数据存储在哪些复制组上）数据结构在元数据设计上，扁平化元数据（用

0 码力 | 14 页 | 619.32 KB | 5 月前
3
CurveFS对接S3方案设计

修订人修订内容 2021-05-20 胡遥初稿 2021-07-20 胡遥细化write和read流程整体架构整体思路接口和关键数据结构 mds.proto client端数据结构 metaserver.proto space相关数据结构和proto 关键流程 init流程 write流程 read流程整体架构 S3ClientAdaptor模块：负责将文件数据进行ch ，每个block最大4M，每个block对应s3上一个object。 s3上对象已chunkid_indexblock_version进行命名，元数据则已S3ChunkInfo（见数据结构）的方式存储在inode中。对于文件顺序写场景，文件0~4M的s3对象必然为chunkid_0_0,4M~8M为chunkid_1_0，以此类推，还有一种情况是文件先写了0~2M，然后在写2M~ 对version进行++，比如覆盖写了0~4M，则数据会写到chunkid_0_1的对象，则元数据包含了2个S3Chunkinfo{2,0,0,8M}和{2,1,0,4M}。接口和关键数据结构 common.proto enum FSType { TYPE_VOLUME = 1; TYPE_S3 = 2; } message S3Info { required

0 码力 | 11 页 | 145.77 KB | 5 月前
3
Curve文件系统元数据持久化方案设计

参考前言根据之前讨论的结果，元数据节点的架构如下图所示，这里涉及到两部分需要持久化/编码的内容： Raft Log：记录 operator log Raft Snapshot：将内存中的数据结构以特定格式 dump 到文件进行持久化© XXX Page 3 of 12 Raft Log +------+------------+-----+----------------+---------+----------+ vs 自己实现? 结论：从目前元数据持久化的需要来看，更倾向于自己实现，理由如下： redis 目前不支持单独持久化 redis 中的某个 DB (一个 redis 实例可包含多个 DB) 或数据结构，这对于在要使用 multiraft 的场景下，每个 raft 实例需要独立的快照并不合适如果改造 redis，初步评估了下，其工作量要比自己实现持久化的逻辑要大一些，改造主要是为了让 redis 如果自己实现，只是一个简单的 sava/load 逻辑，比较清晰 redis 中有许多数据结构可供使用，如 (哈希、列表、set、sort_set)，但对于目前的需求来说，我们内存数据结构使用的是 C++ STL 中的哈希表（unsorted_map），之后有可能根据需求换成 B+ 树或跳表，但是 redis 中的这些数据结构我们是不需要的另外，如果 C++ 中的哈希表在后期使用中发现性能不达标的话（特别是在

0 码力 | 12 页 | 384.47 KB | 5 月前
3
CurveFS S3本地缓存盘方案

© XXX Page 1 of 9 Curvefs-S3 本地写缓存盘方案© XXX Page 2 of 9 背景方案设计主要数据结构定义方案设计思考 POC验证背景当前，s3客户端在写底层存储的时候是直接写入远端对象存储，由于写远端时延相对会较高，所以为了提升性能，引入了写本地缓存盘方案。也即要写底层存储时，先把数据写到本地缓存硬盘，然后再把本地缓存硬盘中的数据异步上传到远端对象存储。地写缓存目录中的对应文件。同时，缓存清理模块会定时检查本地硬盘缓存目录容量情况，如果容量已经达到阈值了，则进行文件的清理工作。另外，异常管理模块处理客户端挂掉后的文件重新上传问题。主要数据结构定义 class DiskCacheManagerImpl : public DiskCacheManager{ public: DiskCacheManagerImpl();

0 码力 | 9 页 | 150.46 KB | 5 月前
3
Curve支持S3 数据缓存方案

修改者修改内容 1.0 2021/8/18 胡遥初稿背景整体设计元数据采用2层索引对象名设计读写缓存分离缓存层级对外接口后台刷数据线程本地磁盘缓存关键数据结构详细设计 Write流程 Read流程 ReleaseCache流程 Flush流程 FsSync流程后台流程 poc测试验证背景基于s3的daemon版本基于基本的性能测试发现性能非常差。具体数据如下： 3InfoList。具体细节见本地磁盘缓存如果有配置writeBack dev，则会调用diskStroage进行本地磁盘write，最终写到s3则由diskStroage模块决定。关键数据结构 message S3ChunkInfo { required uint64 chunkId = 1; required uint64 compaction = 2; required

0 码力 | 9 页 | 179.72 KB | 5 月前
3
CurveFS S3数据整理(合并碎片、清理冗余)

越是散乱的状态, 就越需要发送更多次读请求至s3. 最后导致无效旧数据的堆积和读请求性能的下降, 所以需要在合适的时候进行重叠元数据和数据的合并原则是尽力而为, 并不能做到完美方案基于一下3个基础的数据结构, 2层索引 s3chuninfolist[index] = [s3chunkinfo(s)] s3chunkinfo { chunkid version // write

0 码力 | 3 页 | 101.58 KB | 5 月前
3
Curve文件系统空间分配方案

DeallocateSpace(DeallocateSpaceRequest) returns (DeallocateSpaceResponse); } 空间分配器接口空间分配器相关接口及部分数据结构定义如下： #include #include enum class AllocateType { NONE = 0, SMALL = 1

0 码力 | 11 页 | 159.17 KB | 5 月前
3
BRPC与UCX集成指南

接口服务，例如上面的EchoService6 BRPC SERVER7 BRPC SERVER8 BRPC client9 BRPC EndPoint EndPoint是一个代表通讯地址的数据结构, 是一个C++类。字段: ip，port ●在Socket创建时需要提供EndPoint ●Socket::Connect时需要Remote EndPoint ●Accept的Socket可以获得Remote

0 码力 | 66 页 | 16.29 MB | 5 月前
3
CurveFs 用户权限系统调研

#effective:r-- mask::rw- other::r-- ACL Access Entry保存在哪？ ACL的表示在Linux 中， ACL 是按照 Posix 标准来实现，其数据结构和 Posix 规定的 ACL 的数据是一致的。其定义在 include/linux/posix_acl.h ，实现在 fs/posix_acl.c 中© XXX Page 27 of 33 struct

0 码力 | 33 页 | 732.13 KB | 5 月前
3

共 9 条前往

页

分类

语言

格式

CurveFS方案设计

CurveFS对接S3方案设计

Curve文件系统元数据持久化方案设计

CurveFS S3本地缓存盘方案

Curve支持S3 数据缓存方案

CurveFS S3数据整理(合并碎片、清理冗余)

Curve文件系统空间分配方案

BRPC与UCX集成指南

CurveFs 用户权限系统调研