Pivotal HVR meetup 20190816
13 Compare Products 天天拍车是国内领先的二手车竞拍平台,现有核心业务是二手车线上 竞拍。同时,天天拍车还提供上门检测、线上竞拍、包办手续等一站 式二手车交易服务。 天天拍车运用互联网技术,从根本上解决了二手车跨各区域成交和流 通效率低下等问题,持续推进行业升级变革。全国二手车经销商传统 的线下收车方式正在被快速颠覆——二手车经销商通过天天拍车的在 线竞拍系统,在手机端就能轻松竞拍到全国海量优质车源,收车效率 支持全量同步,但增量同步延时,数据量越大,延时更久。 ➢ JDBC驱动强依赖。 ➢ 版本更新不及时,对GreenPlum新版本无法持续性支持,不稳定。 ➢ 需开发人员支持,二次开发或脚本支持,开发时间成本和人力成本高。 ➢ 支持数据库版本少,无法支持跨多版本的Oracle、MySQL、PostgresSQL、SQL Server等 ➢ 断点续传不支持 ➢ 大量数据同步的情况下,同步组件效率低 参考:https://mp0 码力 | 31 页 | 2.19 MB | 1 年前3Greenplum Database 管理员指南 6.2.1
,总之,我 们的目标是,努力解决用户的一切不违背自然规律的诉求,我们跟随着 Greenplum 的 成长,见证了 Greenplum 从闭源到开源的成长历程,一路给 Greenplum 做各种补丁 脚本,也看到了 Greenplum 的大幅进步,甚至我们以前的小技巧也不再需要,持续的 进步,带来的是生态的蓬勃发展。 Greenplum Database 管理员指南 V6.2.1 版权所有:Esena(陈淼 之间分发执行计划、整合 Instance 处理结果、将 Instance 的 处理结果汇总并反馈给客户端程序。 目前,GP 还不支持 Master 的自动故障切换,不过,已经有很多人适用工具或者 脚本的形式实现了 Master 和 Standby 的自动 FailOver 效果,编者也实现了自动 切换命令,当 Master 出现无法正常工作的故障时,自动激活 Standby 来接管 Master Master 和 Standby 自动切换命令 更灵活的并行数据库备份恢复命令 高速 DDL 备份命令 并行 DDL 恢复命令 更先进的跨集群数据同步命令 集群间的表结构差异增量比对命令 良好兼容的 pgAdminIII 客户端 改善的 gpexpand 命令0 码力 | 416 页 | 6.08 MB | 1 年前3Greenplum 精粹文集
是大家要共享的,所以在部署 Greenplum 集群的时候,一定要规划好 网络设备的接入,在达到性能最大的同时,也要考虑大流量对现有业 务系统是否造成影响。 Greenplum 建议采用以太网万兆交换机,并通过设定跨设备链路 聚 合 组(MC-LAG Multi-ChassisLink Aggregation Group) 的 方 式将两台交换机连在一起,在服务器上将网卡通过 LACP(IEEE 802.3ad/802 核以上(主频 2G HZ 以上),1 块 RAID 卡(单块 RAID 卡的 cache 大小 1GB 以上,并带有掉电保护功能 )。 ·ETL 服务器最好和 Greenplum 接入相同的二层交换机,如果跨交 换机,确保网络不存在性能瓶颈。 ·ETL 服务器网卡尽量选用万兆网卡,某香港航空公司曾抱怨 Greenplum 加载性能缓慢,结果发现加载时把所有 ETL 服务器的 千兆网卡都打满了。 由于每 通过监控平台或者脚本程序,能够及时告警则最好。 ·系统表:日常系统表维护(vacuum analyze),在系统投产时就 应该配置好每天执行维护。 Big Date2.indd 32 16-11-22 下午3:38 Greenplum 精粹文集 33 ·统计信息收集:统计信息的准确性影响到运行效率,用户表应该及 时收集统计信息。在应用程序中增加手机统计信息的处理逻辑,通 过脚本定时批量收0 码力 | 64 页 | 2.73 MB | 1 年前3Greenplum资源管理器
2017 年象行中国(杭州 站)第一期 Greenplum资源管理器 姚珂男/Pivotal kyao@pivotal.io 2017 年象行中国(杭州 站)第一期 Agenda • Greenplum数据库 • Resource Queue • Resource Group 2017 年象行中国(杭州 站)第一期 Greenplum数据库 • 基于PostgreSQL • 分布式 MPP(Massively Parallel Processing) 2017 年象行中国(杭州 站)第一期 Greenplum数据库 2017 年象行中国(杭州 站)第一期 Resource Queue • SQL语句并发控制 • 基于cost的并发控制 • 基于priority的CPU控制 • 内存控制 2017 年象行中国(杭州 站)第一期 Running Example • CREATE RESOURCE • CREATE ROLE r1 RESOUCE QUEUE rq; • SELECT * FROM gp_toolkit.gp_resqueue_status; 2017 年象行中国(杭州 站)第一期 内存控制 • virtual memory note keeping (gp_malloc) • statement_mem • gp_resqueue_memory_policy • work_mem0 码力 | 21 页 | 756.29 KB | 1 年前3Greenplum备份恢复浅析
2017 年象行中国(杭州 站)第一期 Greenplum备份恢复浅析 姓名:张文杰 邮箱:zhuodao.zwj@alibaba-inc.com 公司:阿里云 2017 年象行中国(杭州 站)第一期 Greenplum数据备份恢复: 1. 数据量较大 2. 不能完全使用Xlog日志备份 3. 需要保证数据完整性和一致性 2017 年象行中国(杭州 站)第一期 Greenplum提供了: tore) --copy、psql 2. 并行备份和恢复 --gpcrondump(gpdbrestore) 2017 年象行中国(杭州 站)第一期 并⾏备份和恢复 gpcrondump gpdbrestore 2017 年象行中国(杭州 站)第一期 gpcrondump⽤法(1/3) gpcrondump -x database_name [-s| -S [--oids] [--no-owner | --use-set-session-authorization] [--no-privileges] [--rsyncable] 2017 年象行中国(杭州 站)第一期 gpcrondump⽤法(2/3) gpcrondump命令使用-K 来指定唯一时间戳来标示某个备份集 文件,其中如果当前备份目录中存在更未来的备份集,则备份报错。 0 码力 | 17 页 | 1.29 MB | 1 年前3Greenplum 编译安装和调试
command+R 进入恢复模式 3. 从 Utilities 菜单选择 Terminal 4. 执行 csrutil disable 5. 重启操作系统 // 安装Greenplum管理脚本依赖的 Python 包 $ wget https://bootstrap.pypa.io/get-pip.py $ sudo python get-pip.py $ sudo pip install | g20 | 25443 2. 初始化 Greenplum 集群 前面编译部分介绍了如何使用 Greenplum 源代码中的 demo 集群脚本创建集群。这种方法简单快 捷,然而屏蔽了很多细节。 2.1 手工集群初始化 下面介绍如何手工部署一个单机集群:在一台笔记本上安装一个Greenplum的集群,包括一个 master,两个segments。 2.2.3 初始化 master 数据库失败 手动执行initdb查看详细错误信息,然后分析具体错误信息采取相应错误。不同的版本可 能参数不同,可以通过在 gpinitsystem 脚本中找到完整的命令。 $ initdb -E UNICODE -D /data/master/gpseg-1 --locale=en_US.utf8 --0 码力 | 15 页 | 2.07 MB | 1 年前3并行不悖- OLAP 在互联网公司的实践与思考
kettle调度 Ø单个存储过程,可以在shell中 select func_name() 的方式调度 • 外部任务调度 Ø将整个过程封装成shell脚本,或 Python脚本 Ø用crontab在操作系统调用脚本 Ø用 opencron在图形界面调用脚本 32 Greenplum运维体系 Greenplum任务调度-opencron 33 Greenplum现状说明 三 Greenplum体系架构0 码力 | 43 页 | 9.66 MB | 1 年前3Greenplum on Kubernetes 容器化MPP数据库
数据共享 ● 云数据库市场巨大 ● 云数据库增速巨大 ● DBasS的需求 ● 跨云的需求 云数据库实现方案 云数据库需求 ● DBasS ○ 自动化运维 ○ 自动化调优 ● 弹性资源管理 ○ 存储资源 ○ 计算资源 ● 安全 ○ 用户数据 ○ 临时文件 ○ 网络传输 ○ 权限控制 ● 跨云 ○ 公有云 ○ 私有云 云数据库实现方案 ● 全新数据库 ○ Snowflake 容器化Greenplum ● 容器粒度 ○ Segment主机 VS. Segment实例 ● 容器资源分配 ○ CPU ○ 内存 ○ 磁盘 ● 容器间网络互联 ○ 本机网络 ○ 跨机网络 ● 容器化Greenplum部署策略 ○ Master部署策略 ○ Primary Segment部署策略 ○ Mirror Segment部署策略 ● 容器化Greenplum运维管理 容器化Greenplum ● 容器粒度 ○ Segment主机 VS. Segment实例 ● 容器资源分配 ○ CPU ○ 内存 ○ 磁盘 ● 容器间网络互联 ○ 本机网络 ○ 跨机网络 ● 容器化Greenplum部署策略 ○ Master部署策略 ○ Primary Segment部署策略 ○ Mirror Segment部署策略 ● 容器化Greenplum运维管理0 码力 | 33 页 | 1.93 MB | 1 年前3完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum
用例失败 1 个 其它 手动验证用例 2 个 管理工具脚本 全部 455 用例通过 详尽报告参看 https://gitee.com/src-openeuler/gpdb/blob/openEuler-20.03-LTS-SP2/report.md 5. Greenplum 集群管理 python 工具/脚本 为了提高用户的易用性,在引入 Greenplum 数据库核心服务的同时,还引入方便搭建和管理 Greenplum 集群的 Python 脚本工具,工具均来自社区上游,随 RPM 软件包一键安装,真正让客户方便安装、管理自己的 Greenplum 生产环境。 6. 与欧拉开源社区联合完成的性能测试 除了进行功能性测试外,Greenplum 中文开源社区与 openEuler DB SIG 联合在 openEuler 20.03 LTS0 码力 | 17 页 | 2.04 MB | 1 年前3Greenplum上云与优化
为该用户放开部分superuser的权限 查看其它用户数据 查看所有连接信息 杀连接 创建和删除插件 2016Postgres中国用户大会 解决OOM问题 实例的OOM有时很频繁,同时OOM很难提前监控 我们的办法 利用外部脚本监控cgroup中的内存统计 发生内存水位较高时,将实例移入公共 cgroup;同时发出cancel query信号给内核 水位下降时移回实例的cgroup 2016Postgres中国用户大会0 码力 | 26 页 | 1.13 MB | 1 年前3
共 14 条
- 1
- 2