完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum
版本。该版本为企业级用户提供一个安全稳定可靠的 操作系统。 openEuler 也是一个技术孵化器。通过每半年发布一次的创新版,快速集成 openEuler 以及其他社区的最新技术成 果,将社区验证成熟的特性逐步回合到发行版中。这些新特性以单个开源项目的方式存在于社区,方便开发者获得源代 码,也方便其他开源社区使用。 社区中的最新技术成果持续合入发行版,发行版通过用户反馈 云原生调度增强:针对云场景在线和离线业务混合部署场景,创新 CPU 调度算法保障在线业务对 CPU 的实时抢占及抖 动抑制,创新业务优先级 00M 内存回收算法保障在线业务安全可靠运行。 • 新文件系统 EulerFS:面向非易失性内存的新文件系统,采用软更新、目录双视图等技术减少文件元数据同步 时间,提升文件读写性能。 • 内存分级扩展 etMem:新增用户态 swap 功能,策略配置淘汰的冷内存交换到用户态存储,用户无感知,性能 Greenplum 参与欧拉开源社区的贡献内容 Greenplum 中文社区通过 RPM 软件包方式进入欧拉开源社区软件仓库,yum install 即可安装 Greenplum。提要易 用性。同时 Greenplum ORCA 查询优化器的 ARM 平台兼容,平衡了 X86 和 ARM 平台的功能完整性。期待 Greenplum 中文社区能够在 openEuler 社区中有更多更深入的投入,为客户的成功共同努力。0 码力 | 17 页 | 2.04 MB | 1 年前3Greenplum Database 管理员指南 6.2.1
NOSUPERUSER,弄不好如 Greenplum Database 管理员指南 V6.2.1 版权所有:Esena(陈淼 +86 18616691889) 编写:陈淼 - 25 - 果系统中一个 SUPERUSER 都没了,可能就悲剧了(编者测试过,很悲剧)。 为每个登录的 User 分配不同的 Role。出于登录和审计的需要,每个被允许登录 到 GP 的使用者都应该分配一个属于自己的 属性为 0。 使用 DROP RESOURCE GROUP 命令来删除资源组,要删除一个资源组,该资源组 不能被分配给任何 ROLE,同时,该资源组上不能有任何活动的事务和等待的事务。如 果删除一个基于外部组件的资源组,该资源组上正在运行的实例将会被杀死。例如: =# DROP RESOURCE GROUP exec; 配置基于内存限制的查询终止 tance上该资源队列能够使用的内存 总和不能超过设定的最大值。每个查询语句分配的内存大小是资源队列的内存限制除以 最大活动语句数量(建议与活动语句数限制结合使用,而不是与cost限制结合使用,如 果是与cost限制结合使用,将按照cost的权重进行分配)。例如,资源队列的内存限 制为2000MB,活动语句数限制为10,那么每条执行语句可以得到200MB的内存。缺省 的内存分配可以针对每条语句通过0 码力 | 416 页 | 6.08 MB | 1 年前3Greenplum 精粹文集
集群数量、支撑的应用数量都飞速增长。 Big Date2.indd 20 16-11-22 下午3:38 Greenplum 精粹文集 21 Greenplum 数据库在该客户发展如此迅猛,与产品在高吞吐、开放性、 易扩展等方面的卓越表现是分不开的 。 1. 高吞吐 该客户大数据平台的 ODS 区,接入了源端近百个业务系统的生产数据, 每天需要加载进来的数据大概 5TB 左右。标准化处理完成后,需要给 后端的公共访问、类别繁多的沙箱类应用供数。 下午3:38 24 三、Greenplum 硬件选型篇 前 面 我 们 通 过 某 金 融 行 业 客 户 Greenplum 的 使 用 案 例 介 绍 了 Greenplum 产品在高吞吐、开放性、 易扩展等方面的卓越表现及其带 给客户的高价值。下面我们将从最佳实践方面介绍下 Greenplum 在具 体规划实施时,如何选取硬件。 Greenplum 是 通 过 软 件将多台 x86 服务器的 硬件组织在一起同时对 上有一份完整的拷贝。如果一张表或者中间结果的尺寸是 10GB,集群有 100 个 Primary Instance,该操作等于在集群中传播 1TB(10GB×100) 的数据!所以,对于那些尺寸较大的表或者中间结 果出现这样的操作,都是需要坚决杜绝的。 循环匹配 (Nested Loop) 该操作的代价是,从每个 Primary Instance 上来看,两个集合呈现笛 卡尔积方式的关联。这种情况一般还会伴随着广播一起出现,如果是0 码力 | 64 页 | 2.73 MB | 1 年前3Greenplum on Kubernetes 容器化MPP数据库
Segment部署策略 ○ Mirror Segment部署策略 ● 容器化Greenplum运维管理 ○ 故障检测及恢复 ○ 升级扩容 ● 容器化Greenplum存储管理 ○ 容器本地存储易失性 容器化Greenplum ● 容器粒度 ○ Segment主机 VS. Segment实例 ● 容器资源分配 ○ CPU ○ 内存 ○ 磁盘 ● 容器间网络互联 ○ 本机网络 Segment部署策略 ○ Mirror Segment部署策略 ● 容器化Greenplum运维管理 ○ 故障检测及恢复 ○ 升级扩容 ● 容器化Greenplum存储管理 ○ 容器本地存储易失性 ○ 容器外部存储关联性 容器化分布式应用程序公共问题 容器网络管理 容器资源管理 容器镜像管理 容器调度 容器监控及自 定义操作 容器存储管理 容器化Greenplum ● 容器粒度 Segment部署策略 ○ Mirror Segment部署策略 ● 容器化Greenplum运维管理 ○ 故障检测及恢复 ○ 升级扩容 ● 容器化Greenplum存储管理 ○ 容器本地存储易失性 ○ 容器外部存储关联性 Kubernetes 容器网络管理 容器资源管理 容器镜像管理 容器调度 容器监控及自 定义操作 容器存储管理 Kubernetes 101 Kubernetes0 码力 | 33 页 | 1.93 MB | 1 年前3并行不悖- OLAP 在互联网公司的实践与思考
Greenplum扩展规划 六 34 Greenplum开发规范 不规范容易出现的问题 • GP架构易出现问题 Ø 资源不足 Ø 连接、语句执行失败 Ø 多任务冲突 • 库表使用易出现问题 Ø 表定义过大 Ø 表类型单一 Ø 表的散列键不恰当 Ø 分区表的分区键性能不佳 • 加载易出现问题 Ø 文件加载出现特殊字符 Ø 数据校验标准问题 35 Greenplum开发规范 业务库表设计规范0 码力 | 43 页 | 9.66 MB | 1 年前3Greenplum 介绍
、福特、 爱立信等,国内客户包括深交所、建设银行、民生银行、广大银行、浦发银行、航旅纵横、中国 移动、华为等。自 2015 年开源以来,更是吸引了包括阿里云、百度云、中移动、旷世、去哪儿 网、易观、腾云科技、饿了么、金风科技在内大量开源用户。 Greenplum 大数据平台的优势 ● 一次打包到处运行的平台:部署灵活,不受限于硬件环境和平台,无论裸机、私有云、公 有云均可部署0 码力 | 3 页 | 220.42 KB | 1 年前3Greenplum分布式事务和两阶段提交协议
查询、更新 用户/ 应用 DDL命令 数据库管理员 数据、元数据、索引 日志页 读、写页 元数据、 统计数据 元数据 9 存储介质的类型 ■ Volatile storage 易失性存储器 DRAM, Cache, Register ■ Non-volatile storage 非易失性存储器 Disk, SSD, NVM ■ Stable stage 稳定存储器 theoretically0 码力 | 42 页 | 2.12 MB | 1 年前3Greenplum机器学习⼯具集和案例
2017.thegiac.com 问题 ● 邮件⼴广告点击预测 模型不不够精准,需 要更更好的邮件营销 策略略 ● 现有数据分析流程 繁琐,速度慢,有 很多⼿手动步骤,易易 出错 客户 数据科学解决⽅方案 ● 某⼤大型跨国多元 化传媒和娱乐公 司 ● 简化Data 流程 ● 在Madlib上重新建 模和预测 ● 实现流程全⾃自动化 背景0 码力 | 58 页 | 1.97 MB | 1 年前3
共 8 条
- 1