数据分片 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

高可用分布式流数据存储设计-李玥

⾼高可⽤用分布式流数据存储设计李玥京东集团技术架构部架构师⾃自我介绍⾃自我介绍李李玥京东集团技术架构部架构师负责主导设计新⼀一代京东消息中间件系统，专注于流数据的⼀一致性分发和可靠存储、分布式实时计算和⾼高可⽤用分布式系统架构等技术领域。从事互联⽹网研发、架构10余年年，曾在浪潮集团、当当⽹网等公司从事架构相关⼯工作。2017年年加⼊入京东，期间提升京如何定位？如何融入生态系统？ How 如何实现？如何优化？ WHY 为什什么需要流数据存储？单体应⽤用烟筒式 SOA 微服务那些年年的服务 MySQL ES HDFS KV HBase Hive 这些年年的数据 Services Data MySQL ES HDFS KV HBase Hive 统⼀一的流数据存储平台我们的愿景 Services Streaming Storage PLRU淘汰策略略⾼高并发 ≠ ⾼高性能减少等待异步: Future, Callback, React框架流程拆分减少锁：CAS原语减少锁等待: 读写锁, 细粒度锁写⼊入数据流程 IOThreads 接收请求 Requests Queue WriteThread 处理理 FlushThread 刷盘 ReplicationThread 发送复制请求 IOThreads

0 码力 | 36 页 | 6.02 MB | 1 年前
3
分布式 KV 存储系统 Cellar 演进之路

分布式KV存储Cellar演进之路美团点评·基础架构齐泽斌美团点评基础架构部，存储研发团队负责人 • Cellar：分布式KV存储服务 • Databus：数据库变更实时传输服务 • Venus：图片服务 11年毕业于天津大学 11 年到 14 年任职于百度，负责分布式文件系统和 KV 存储系统研发有多年分布式存储研发经验个人简介 • Cellar起源 • 中心节点架构演进 • Cellar日请求量达万亿级，美团点评最大NoSQL存储 Cellar起源 Cellar起源—Tair架构路由表 Cellar起源—Tair架构 HASH Key 桶号存储节点固定HASH算法固定数目数据分片桶->存储节点对照表 Cellar起源—Tair架构服务层请求 mdb 响应 ldb fdb rdb 引擎层迁移复制 • 中心化集群问题 • 可用性问题 • 性能问题 • Zookeeper选主 • 元数据Zookeeper存储 Cellar—中心节点架构演进一致性： • 主备强一致 • observer同步强一致 • Cellar起源 • 中心节点架构演进 • 节点高可用和异地容灾 • 服务可用性提升 • Cellar规划目录存储节点Failover，越快越好？ • 数据补全对业务影响 • 机器宕机五分钟，数据补全两小时节点升级，先切走流量再操作？

0 码力 | 34 页 | 1.66 MB | 1 年前
3
唯品会调度系统的前世今生

缺乏分布式运算和集中管理功能无法做到高可用 TBSchedule Elatic-Job Java事实任务标准关注点在定时任务而非数据，缺少分布式并行调度的功能阿里早期开源的分布式任务调度系统，代码略陈旧作业类型较单一，只能是获取/处理数据一种模式当当开源的分布式任务调度系统代码较新，使用Quartz进行调度。提供高可用和分布式功能功能单一，只支持Java，不支持功能单一，只支持Java，不支持 Shell(PHP)和消息驱动的作业调度对任务超时、任务执行情况、监控逻辑支持粒度功能较单一或缺乏没有容器化选型？调度产品的定位简易开发、简单维护高可用、分片并发处理、资源调度动态平衡支持Java、Shell以及本地模式(VIP还支持消息模式) 统一配置、统一监控、统一管理 VIP弹性调度系统 -- Saturn 开源地址： Github.com/vipshop/Saturn 安全管理平台 Salus 有女初张成唯品会弹性调度系统的架构与功能窥探域应用包作业执行节点 1 1 * 1 * * 创建 Binding 调度器物理机 1 1 分片 1 * * 领域模型 Ready Running Stopping Stopped 启用触发（手工, 时间或消息) 停用执行完成停用执行完成作业状态变迁内部系统集成

0 码力 | 58 页 | 5.40 MB | 1 年前
3
从百度文件系统看大型分布式系统设计中的定式与创新

百度搜索基础架构从百度文件系统看大型分布式系统设计自我介绍 • 颜世光, 专注于大规模分布式系统 • 代表作品 - 百度第三代Spider系统 - 百度文件系统BFS - 万亿量级实时数据库Tera - 集群调度系统Galaxy • 个人主页&Blog - https://github.com/bluebore - http://bluebore.cn 提纲 • 百度文件系统简介 Stack 网络通信框架Sofa-pbrpc 分布式文件系统 BFS 集群调度系统 Galaxy 分布式协调服务 Nexus 分布式数据库 Tera 分布式计算框架 Shuttle Apps(Spider/Index/Search) 数据中心操作系统(DCOS) • 进程调度&内存管理 - Galaxy - 应用部署和任务调度 • 锁和信号量 - Nexus - 分布式锁 • 数据与计算的分片 • 分区故障容忍 • 数据一致性 • 系统扩展性 • 延迟与吞吐 • 成本与资源利用率 • … 数据与计算的分片 • 哈希分片 - 简单、均衡 - 扩容复杂、易用性差 - 一致性哈希、虚拟节点 • 按范围、数据量分 - 使用简单 - 需要管理元数据 - 中心化与去中心化元数据管理 • 去中心化 - P2P技术 - 潜在的一致性问题 - 能管理的元数据有限

0 码力 | 24 页 | 937.45 KB | 1 年前
3
分布式异地多活架构实践之路

存储系统自带同步不成熟；自研组件之间同步数据同步大纲 • 产品发展中遇到的问题 • 异地多活存在哪些技术挑战 • 讯飞输入法异地多活解决方案 • 实际应用效果 • 未来规划业务特点分析业务分类业务举例业务特点场景归类核心业务皮肤、表情、资源、广告、应用墙译等读多写少主从模式（单点写，多点读）用户个性化数据同步、账号等读写均衡多主模式（多点读写）（多点写，单点读，单点写，多点读）非核心业务老版本兼容服务、运营活动、配置、管理平台、官网、论坛等 N/A 本地模式（单点读写）设计思路核心业务异地多活精准流量调度数据同步多元化最终一致性依赖关系优化配套系统支撑主从多主汇聚混合场景区分封装屏蔽细节容量合理规划当前总体架构合肥北京广州 HTTPDNS 智能DNS 广州 IDC 用户与用户数据机房对应关系，注册后首次生成 GSLB 漫游到其他机房统计，满足一定条件重新设置用户数据机房数据同步多元化 CRSync CRSync CRSync Service Service Service 专线/公网专线/公网尽可能减少数据同步控制同步的大小专线与公网互相容灾环形同步路径容灾 Push无状态数据 CRSync异步同步 Service实时同步

0 码力 | 36 页 | 1.66 MB | 1 年前
3
海量用户推送后台系统架构实践-曾振波

万 APP 198 亿移动终端 10.4 亿月独立活跃设备 90 % 覆盖率亿级长连接用户 SDK多版本并存消息实时性触达率要求移动网络环境复杂性海量用户数据存储消息推送系统面临的挑战极光推送服务架构系统通道 API 用户筛选用户分发推送通道极光通道共享通道短信通道极光推送后台系统架构 iOS SDK Android 功能按照业务拆分解耦 • 数据和业务分离 • 快速迭代 • 模块间通过MQ/RPC交互极光推送后台系统架构 01 Segment Conn StatCenter OnlineMsg 异步化 • 充分利用资源，减少请求等待时间，提升系统吞吐量 • 消息化请求 • MQ - RabbitMQ, RocketMQ • 模块间解耦 • IDC数据同步 • 异步RPC • ICE ICE - 负载均衡，AMI，AMD，多线程极光推送后台系统架构 02 并行化 • 横向扩展处理能力 • 数据分片存储 • 多节点+分片+多副本架构 • 数据读写动态路由 • 请求并行处理 • 模块级别并行 • 代码级别并行极光推送后台系统架构 03 MQ Segment OnlineMsg OnlineMsg OnlineMsg Data0-0 Data0-1

0 码力 | 23 页 | 1.26 MB | 1 年前
3
高可用与一致性：构建强一致性分布式数据库 TiDB-沈泰宁

构建强⼀一致性分布式数据库 TiDB 沈泰宁 R & D Engineer @ PingCAP ⾃自我介绍⾃自我介绍 • 沈泰宁 • R&D Engineer @ PingCAP • Maintainer • rust-prometheus • grpc-rs • … ⽬目录 • What is TiDB? • How to test? What is TiDB? Single

0 码力 | 45 页 | 4.63 MB | 1 年前
3
QCon北京2018-业务高速发展下的互联网金融系统架构演变-张现双+

分布式事务，补偿、撤销机制接口缓存，热数据尽可能前置 DB跟随服务代码、逻辑、结构等都要适时重构最终架构[简版] 移动后台打散，界限趋于不明显极大消除冗余，三级两层划分底层服务有序汇总直面前端流量统一出口积分系统优惠券基金服务保险服务理财服务支付中心电子签章第三方系统营销支持基础服务数据支持批处理 … 网关(略) 共享资源串行操作数据一致性(脏读,丢失更新等) 业务纵向拆分，化整为零资源拆分，横向扩展 cache，index，partition parallel non-blocking sync、lock，cas 额度、库存、积分、优惠券… CAP 数据竞争� [sql方案示例] 乐观锁，带来重试代价悲观锁，开销大，吞吐量差数据库锁(全局标识拦截)： where stock-X>=0 限流： max_connections(db) max_request+max_threads(middleware) 数据竞争� [NoSql方案示例] 内存操作单线程原子操作高可用保障兜底策略限流、熔断： maxclients(redis) max_request+max_threads(middleware)

0 码力 | 42 页 | 19.96 MB | 1 年前
3
降级预案在同程艺龙的工程实践-王俊翔

缺乏UI、没有灵活的参数、策略略配置，没有预案制定管理理能⼒力力业务保障平台建设之路路业务保障平台建设之路路服务管理理策略略管理理预案制定线上演练 • 降级服务统⼀一注册管理理，通过降级服务质量量数据从整体反映各应⽤用的降级点和可⽤用性保障措施 • 降级策略略集中管理理，通过参数化、配置化、脚本化⽅方式实现线上策略略的灵活调整 • 依据服务重要程度，从全局制定分级预案，对降级点进⾏行行预案编发现潜在故障，多维度验证预案有效性，评估系统可靠性，提供降级策略略、参数调整的优化依据整体架构 Agent 服务降级注册降级熔断通知元数据存储控制中⼼心 ETCD ETCD ETCD ETCD 服务注册监听降级控制中⼼心元数据 TurboMQ 熔断降级监听 Application Application Application SDK 熔断降级接⼊入熔断降级流控隔离实时策略略推送数据采集应⽤用管理理策略略管理理流控管理理预案管理理指标管理理监控告警数据⼤大盘脚本开发 ETCD管理理故障演练业务保障管理理后台应⽤用JVM进程故障动态注⼊入 Attach 故障注⼊入指标聚合查询熔断降级计算（Flink）⽇日志中⼼心 KAFKA 数据采集、计算、存储指标（HBase）指标明细（ES）

0 码力 | 26 页 | 18.67 MB | 1 年前
3
大规模分布式系统架构下调测能力构建之道

多团队协同的分布式环境下，不仅环境“重”，而且外部的服务是别的团队开发的，你很难得到一个稳定、快速的外部服务提供环境，在此背景下进行功能/接口调测存在如下困难：开发依赖重联调成本高变动把控困难拆应用拆分数据拆分团队拆分分布式服务 API Gateway 分布式文件分布式缓存分布式消息 DB Cluster 连接序列化路由负载均衡 … 问题示例 1. 我依赖一个依赖的远程服务逻辑发生变化了，但负责它的团队没有通知到我，结果上线后直接导致生产事故。 5. 我和其他团队共用一套分布式缓存服务，为了防止数据覆盖，我只能和别人轮流排队上线调试，我等了一天，结果只能用一个小时。 6. 我写了个消息Consumer，布到线上准备测测，结果，别人的消息先到了，一下把我的预置数据全搞乱了… 7. 我的开发机性能还行，我想自己装一套依赖环境提高开发调测效率，结果消息服务、缓存服务、服务框架装完一启动，80% mock能力启用时，服务容器初始化期间将加载mock数据文件到内存中，每个服务请求将和mock数据的入参定义进行比对，满足（静态匹配或动态匹配）规范的请求，直接用mock数据的出参定义作为服务调用的结果。 应用无感知无需修改应用代码，单元测试代码中也无需添加任何的mock语句。服务调用 Invoker … Remote Call 负载均衡策略 Runtime Mock数据文件远程服务 Mock配置

0 码力 | 19 页 | 2.74 MB | 1 年前
3

共 32 条前往

页

分类

语言

格式

高可用分布式流数据存储设计-李玥

分布式 KV 存储系统 Cellar 演进之路

唯品会调度系统的前世今生

从百度文件系统看大型分布式系统设计中的定式与创新

分布式异地多活架构实践之路

海量用户推送后台系统架构实践-曾振波

高可用与一致性：构建强一致性分布式数据库 TiDB-沈泰宁

QCon北京2018-业务高速发展下的互联网金融系统架构演变-张现双+

降级预案在同程艺龙的工程实践-王俊翔

大规模分布式系统架构下调测能力构建之道