Greenplum分布式事务和两阶段提交协议
Components 数据库管理系统组成图 Hector Garcia-Molina /Jeffrey D.Ullman/Jennifer Widom《数据库系统实现》 查询编译器/ 优化器 事务管理器 DDL编译器 执行引擎 日志和恢复 并发控制 索引/文件/ 记录管理器 缓冲区管理器 缓冲区 锁表 存储管理器 存储 查询计划 对索引、文件和 记录的请求 页命令 事务命令0 码力 | 42 页 | 2.12 MB | 1 年前3Greenplum Database 管理员指南 6.2.1
协议不 稳定,可以考虑使用 TCP 协议,例如只有几十台主机时。通常,还是强烈建议配备稳 定的网络环境,使用 UDPIFC 协议。 冗余与故障切换 GP 提供了避免单点故障的部署选项。本节讲述 GP 的冗余组件。 Instance 镜像 Master 镜像 网络层冗余 Instance 镜像 在部署 GP 系统时,可以选择配置 with DENY rules 如何添加时间约束 有两种办法添加时间约束。在 CREATE ROLE 或者 ALTER ROLE 的时候使用 DENY 关键字并跟随如下的选项来实现: 某天或者某个时间的访问限制(不需要 BETWEEN 关键字),例如:周二不允许登录。 一个有开始时间和结束时间的访问限制(需要 BETWEEN AND),例如:周二下午 要连接到 GP 的 Master,需要知道下面这些连接参数并在客户端程序进行正确的配置。 连接参数 描述 环境变量 Application name 连接到数据库的应用名称,该参数为可选项。 $PGAPPNAME Database name 需要连接的数据库名称。对于新初始化的系统来 说,首次访问可以使用 postgres。 $PGDATABASE Host name0 码力 | 416 页 | 6.08 MB | 1 年前3Greenplum数据仓库UDW - UCloud中立云计算服务商
选择节点个数:UDW 是分布式架构、所有节点数据都是双机热备,实际可⽤总容量略⼩于节点个数*节点磁盘⼤⼩/2,请根据实际数据⼤⼩选择合适的节点。 3.设置数据仓库信息 必选项有数据仓库名称、DB管理员⽤⼾名、管理员密码。可选项有默认DB,默认DB的名称为dev,你可以选择除了“test”、“postgres”、“template”、“template0”、“template1” 、 “default”之外的其他名称。 \q 退出 2. ⼀般选项 \c [数据库名]-[⽤⼾名] 连接到新数据库 \cd [⽬录名] 改变当前的⼯作⽬录 \encoding [编码] 显⽰或设置客⼾端编码 \h [名字] SQL命令的语法帮助 \set [名字 [值]] 设置内部变量 \timing 查询计时开关切换(默认关闭) \unset 名字 取消(删除)内部变量 3. 查询缓冲区选项 开发指南 Greenplum数据仓库 查询缓冲区 \s [⽂件名] 打印历史或者将其保存到⽂件 \w [⽂件名] 将查询缓冲区写出到⽂件 4. 输⼊∕输出选项 \echo [字串] 向标准输出写出⽂本 /i ⽂件名 执⾏来⾃⽂件的命令 \o [⽂件名] 向⽂件或者 |管道 发送所有查询结果 5. 信息选项 \d [名字] 描述表, 索引, 序列, 或者视图 \d{t|i|s|v|S} [模式] (加 "+" 获取更多信息)0 码力 | 206 页 | 5.35 MB | 1 年前3完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum
Services、Microsoft Azure 和 Google 云平台上运行,也可以运行在国内云平台上,如阿里云、 腾讯云等,只需选择要在群集中调配的数据节点数量(不超过预定义的最大大小),然后选择一系列部署选项,群集 便会立即启动运行,可供客户使用,国内外有相当数量的客户已选择云上 Greenplum。 图 2:Greenplum 不受限于基础架构的软件架构 完全兼容欧拉开源操作系统的 避免无用的堆截断尝试并在 VACUUM 期间采取独占锁定 l 提高 VACUUM 删除尾随空堆页面的速度 l 可以选择使用 SKIP_LOCKED 选项来跳过对无法立刻被锁的表进行 VACUUM 和 ANALYZE l 可以使用--jobs 选项并行进行 VACUUMDB 和 VACUUM;也支持—skip-locked Greenplum 集群多站点复制 Greenplum 7 数据平台,在帮助组织满足其企业数据仓库和高级分析需求的情况下,又创新性在对产品进 行改进带来了多项新功能,并且大大提升了事务处理性能 。正是由于社区的开放性和纯软件的中立性,与欧拉开源社区 合作让社区新版本扩充了客户的部署选项,与欧拉开源操作系统完全兼容,支持多样性计算,它提供了一个同时支持 OLAP 和 OLTP 的业务场景,同时支持传统和新型分析工作负载的环境,可帮助客户消除分析孤岛,避免数据来回移动。 此外,0 码力 | 17 页 | 2.04 MB | 1 年前3Pivotal Greenplum 5: 新一代数据平台
Azure 和 Google 云平台上运行,并且同时支持自带使用授权 (BYOL) 配置和以小时为单位的按需配置。只需选择要在群集中调配的数据节点数量(不超过预定义的最大大小),然后选择一系 列部署选项,群集便会立即启动运行,可供客户使用。 图 2:Pivotal Greenplum 5:不受限于基础架构的软件架构。 不受限于基础架构 裸机 私有云 公有云 pivotal.io/cn 白皮书 生产品。PostgreSQL 规划器最初是为单节点 PostgreSQL 设计的,更适用于 OLTP 查询,而不是分析数据平台中长时间运 行的查询。尽管具有精心设计的连接排序之类的功能,但架构和设计选项导致维护和添加新功能变得越来越难。1 2010 年底,Greenplum 开始在内部开发一款新型查询优化器,并在 Greenplum 4.3.5 版中首次推出,名为 GPORCA。 GPORCA Greenplum 5 是 Pivotal 推出的新一代数据平台,在对经过十几年工程设计投入的产品进行改进的同时带来了多项新功能, 可以帮助组织满足其企业数据仓库和高级分析需求。这个新版本扩充了客户的部署选项,除了目前支持的本地平台以外, 还获得了其他几种云平台的认证。它提供了一个同时支持传统和新型分析工作负载的环境,可帮助客户消除分析孤岛。此外, 它通过有助于加快创新的集成环境,为数据科学家和业务分析0 码力 | 9 页 | 690.33 KB | 1 年前3Greenplum 编译安装和调试
gpinitsystem 会失败,但是不清楚失败原因是什么。 下面提供一些思路来 RCA: 2.2.1 使用 gpinitsystem 调试模式 gpinitsystem 有一个 -D 选项,使用这个选项可以看到更多的输出信息,根据这些额外的输出信息 可以发现并解决大部分问题。 2.2.2 查看日志 常用的日志文件有两类,一种是 gpinitsystem 的日志,一种是数据库的日志。它们分别保存在不 的地方设置日志或 者调试信息可以帮助分析某些难以解决的问题。 ● 集群初始化工具 gpinitsystem 是Bash脚本工具,有些时候它的报错信息很不清楚。这个 时候可以 ○ 使用 -D 选项 ○ gp_bash_functions.sh 是内部一个被频繁调用执行系统命令的函数,可以通过 set -x 可以打印出所有执行的命令的详细信息。对调试 hang 问题很有效。 ● 在合适的代码处启用0 码力 | 15 页 | 2.07 MB | 1 年前3Greenplum备份恢复浅析
ile,-s或 者--schema-file,-S或者--exclusive-schema-file灵活指定需要全量备份的某 个table或者某个schema,其中-s和-t选项不能同时使用 gpcrondump命令使用选项--incremental和--prefix执行增量备份,但是这里 的增量备份实际上只对有如下操作的表进行备份; ALTER TABLE DELETE INSERT TRUNCATE0 码力 | 17 页 | 1.29 MB | 1 年前3Greenplum 6: 混合负载的理想数据平台
below this line Source and Footnotes Guideline . PROD Space usage (compressed) 1. 24 个生产集群 2. 2个选项: 20个节点或 40个节点 3. 600+ 服务器, 13k+ 核, 81PB存储(增长 中) 4. 2.5PB 或 25PB 原始数据 按10x压缩率 1 2 3 4 Greenplum在摩根士丹利0 码力 | 52 页 | 4.48 MB | 1 年前3
共 8 条
- 1