Greenplum Database 管理员指南 6.2.1
.......................................................................................... - 19 - 第二章:分布式数据库概念 ........................................................................................ Greenplum Database 管理员指南 V6.2.1 版权所有:Esena(陈淼 +86 18616691889) 编写:陈淼 - 21 - 第二章:分布式数据库概念 GP 是一个分布式数据库集群系统。这就意味着在物理上,数据是存储在多个数据 库上的(称为 Instance)。这些独立的数据库通过网络进行通信(称为内联网络)。分 布 下面是一个3级分区表的例子,这里sales表被按照年、月、区域进行三级分区。 第一个SUBPARTITION TEMPLATE子句确保每年的一个一级分区都有12个月的子分区 和1个默认分区,第二个SUBPARTITION TEMPLATE子句确保每个月的二级分区都有3 个LIST分区和1个默认分区: =# CREATE TABLE sales ( id int,0 码力 | 416 页 | 6.08 MB | 1 年前3Greenplum分布式事务和两阶段提交协议
been written to stable storage. 第一点:Steal policy。更新non-volatile storage中的页面时,必须记录undo log。保 证事务的原子性。 第二点:No-Force policy。提交事务时,必须记录redo log。保证事务的持久性。 Write Ahead Logging 采用WAL协议的恢复算法: Dr. C. Mohan ARIES:0 码力 | 42 页 | 2.12 MB | 1 年前3Greenplum 排序算法
段: ● 第一阶段初始化TupleSort,通过调用函数tuplesort_begin_common,生成 Tuplesortstate。Tuplesortstate用于描述排序所需的信息 ● 第二阶段插入元组,每次调用函数puttuple_common,会根据当前TupleSort的 状态,选择将元组插入到不同的位置。 ● 第三阶段负责实际的排序逻辑,通过调用函数tuplesort_performsort,实现对已0 码力 | 52 页 | 2.05 MB | 1 年前3PostgreSQL和Greenplum 数据库故障排查
10.10.56.17/32 md5 host 参数表示安装PostgreSQL的主机 all 第一个all 表示该主机上的所有数据库实例 all 第二个all 表示所有用户 10.10.56.17/32 表示需要连接到主机的IP地址,32表示IPV4 md5 表示验证方式 2018年PostgreSQL中国技术大会 连接方式(type)0 码力 | 84 页 | 12.61 MB | 1 年前3Greenplum 新一代数据管理和数据分析解决方案
• 巨人网络(征途游戏):财务分析、游戏在线分析 • 阿里巴巴:B2B、B2C、点击、在线分析 • 上海航空:航线结算分析 • 东方航空:航线结算分析 • 民族证券:数据中心,证券投资分析 • 北京第二外语大学:图书分析 • 中信银行:信用卡分析 • 深发展银行:数据中心兼ODS • 李宁公司:销售和库存分析 • 公安部:图像分析 • 国家海洋局:海洋数据采集与分析 • 上海安吉物流:收入&市场分析、客户经理跟踪分析0 码力 | 45 页 | 2.07 MB | 1 年前3Greenplum 精粹文集
升,尤其是大机 构的大模型更为明显。 第一次扩容是从 50 节点到 74 节点,完成 30TB 业务数据的导出、传输、 导入,以及 70TB 左右的索引数据创建,实际停机时间大约 3 天左右。 第二次扩容则到了上百节点。考虑到升级操作的可控性并缩短升级和 扩容时间,仍然采用新初始化集群的方案操作,在同一集群中初始化 了一个新数据库,将数据从旧库导出后,再导入新库。该方案在 2 天 之内完成 57TB0 码力 | 64 页 | 2.73 MB | 1 年前3
共 6 条
- 1