Greenplum 6新特性: 在线扩容工具GPexpand剖析
▪ 稳定性:在相同集群大小下,同一个Tuple每次计算结果相同 ▪ 单调性:扩容过程中,旧节点之间没有数据迁移 ▪ 高效性:对于集群大小为N的时候,时间复杂度为Log(N) – 更多算法细节请参考链接。https://arxiv.org/pdf/1406.2294.pdf – 通过GUC gp_use_legacy_hashops 可以控制,默认是Jump Consistent Hash算法0 码力 | 37 页 | 1.12 MB | 1 年前3Greenplum开源MPP数据库介绍
OLTP系统的SQL语句相对简单(CURD) Ø OLAP系统的SQL语句就复杂得多(OLTP则尽量避免) q Join 很复杂(多表, outer join, lateral…) q 子查询、子链接 q 聚集 (grouping sets, 多阶段聚集…) q 窗口函数, (Recursive) CTE q Procedure Languages(Python,R,Perl……) Ø 优化器非常非常重要0 码力 | 23 页 | 4.55 MB | 1 年前3Greenplum机器学习⼯具集和案例
(迭代控制器器) 内循环函数 (实现机器器学习逻辑) Python SQL C++ MADlib 架构 2017.thegiac.com • 是一种由搜索引擎根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,以Google 创办人 Larry Page来命名 Image from h_ps://en.wikipedia.org/wiki/PageRank0 码力 | 58 页 | 1.97 MB | 1 年前3Greenplum 6: 混合负载的理想数据平台
函数 2 Final函数 3 Segment 1 19 Madlib: PageRank性能 Greenplum集群: ● 1 master ● 4*6 segment 50亿条链接 (1K) (10K) (100K) (1M) (10M) (100M) Note: log-log scale (100s) (1s) (10K s) (1M s) 数据库内集成分析0 码力 | 52 页 | 4.48 MB | 1 年前3完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum
SIG。下面对工作内容做简要的介绍: 1. Greenplum 社区上游(Github)发布包引入 此次参与欧拉操作系统构建和发布的包来自 Greenplum 社区发布包(6.17.0-src-full.tar.gz),链接如下: https://github.com/greenplum-db/gpdb/releases/tag/6.17.0 包引入和提交到欧拉开源社区的 PR 均由 Greenplum 中文社区开发人员完成,openEuler0 码力 | 17 页 | 2.04 MB | 1 年前3Greenplum数据仓库UDW - UCloud中立云计算服务商
-1880260.html。 创建JDK安装⽬录,并将安装包解压⾄该⽬录: mkdir /usr/java tar zxvf jdk-7u79-linux-x64.tar.gz a) 建⽴软链接 ln -s /usr/java/jdk1.7.0_79 /usr/java/java 接⼊第三⽅ BI ⼯具 Greenplum数据仓库 UDW Copyright © 2012-2021 UCloud0 码力 | 206 页 | 5.35 MB | 1 年前3Greenplum Database 管理员指南 6.2.1
日志会被用来将状态恢复到最后成功提交(commit) 时的状态。激活的 Standby 实际上会成为 GP 的新 Master,通过 Master Port(该 端口需要设置和 Master 的相同)接受客户端的链接访问。一旦 Standby 被激活,旧 的 Master--那个失败了的 Master 将脱离集群,不再属于这个集群,要想将其重新 加入集群中,需要使用 gpinitstandby 命令将其添加为 Standby0 码力 | 416 页 | 6.08 MB | 1 年前3
共 7 条
- 1