云原生虚拟数仓PieCloudDB Database产品白皮书
计原则复用为技术路线,可将物理数仓整合 到云原生数据计算平台,根据数据授权动态创建虚拟数仓,按需灵活计算,打破数据孤岛,支撑更大模型所需的数据 和计算。在云上,数据计算资源按需扩缩容,提升数仓的敏捷性和弹性,助力企业降低数仓管理复杂度,实现数量级 增加可计算数据空间的同时,数量级降低数仓成本,打开无限数据计算空间,推进AI/BI到下一个精度。PieCloudDB 在eMPP分布式专利技术、 湖仓一体化分析 PieCloudDB 支持统一的资源管控,通过云原生存储引擎支持多种存储模型,用分布式计算引擎和数据接口来实现湖 仓一体化架构。通过云原生大数据服务以更低成本满足企业业务高弹性和敏捷性的需求。 PieCloudDB 打破了数据湖与数据仓库割裂的体系,架构上实现了将数据湖的灵活性、生态丰富与数据仓库的企业级 能力充分融合,帮助企业构建数据湖和数据仓库融合的数据管理平台。 PieCloudDB MADlib,从而可以原生实现一些高级机器学习功能。该拓展提供数学、统计学以及机器学习方法,包括 但不限于线性回归、关联规则、贝叶斯分类、决策树和随机森林等算法支持。同时 OpenPie 团队经验丰富的数据科学 家团队可以为企业用户提供相关建议。 10 多云部署 PieCloudDB 可根据客户需求在任何IaaS(裸金属服务器、虚拟机、K8S容器等)上运行。借助这种“不受限于基础架 构0 码力 | 17 页 | 2.02 MB | 1 年前3PieCloudDB Database 产品白皮书
PieCloudDB ,是以对行业顶级数据库的抽象思考和设计原则复用为技术路线,采用领先的数仓 虚拟化技术,可将多个数仓统一整合到一个高可用的云虚拟数仓,打通多云的数据管道,数据计算资源按需扩缩容, 提升数仓的敏捷性和弹性,助力企业降低数仓管理复杂度,实现数量级增加可计算数据空间的同时,数量级降低数仓 成本,打开无限数据计算空间,推进AVBI到下一个精度。PieCloudDB在eMPP分布式专利技术、服务器无感知 MADlib,从而可以原生实现一些高级机器学习功能。该拓展提供数学、统计学以及机器学习方法,包括 但不限于线性回归、关联规则、贝叶斯分类、决策树和随机森林等算法支持。同时 Openpie 团队经验丰富的数据科学 家团队可以为企业用户提供相关建议。 ,* 多云部署 pieCloudDB 可根据客户需求在任何laaS (裸金属服务器、虚拟机、K8S容器等) 上运行。借助这种“不受限于基础架 构”的跨云 (弹性大规模并行计算) 的云原生虚拟数仓 产品白皮书 PiecloudDB 产品优势 作为一款云原生虚拟数仓,PieCloudDB 具备的弹性灵活、高性能、稳定成熟等特点,兼备云原生数据库所特有的即 开即用、敏捷灵活、安全可靠等优势,为企业的 PB 级海量数据分析需求提供极高的可用性和可千性。 完备的SQL标准 PiecloudDB 去原生特仁 ,* 弹性灵活 传统数据仓库的计算和存情是紧密灶合的,0 码力 | 17 页 | 2.68 MB | 1 年前3πDataCS赋能工业软件创新与实践
Confidential 杭州拓数派科技发展有限公司 ,简称“OpenPie” 企业简介 l OpenPie是立⾜于国内的基础数据计算领域⾼科技创新机构; l 拥有强⼤的数据库内核研发团队、数据科学团队和数字化 转型团队; l 国内虚拟数仓和eMPP技术提出者,不断在数据计算引擎⽅ 向进⾏创新,全面拥抱AI技术趋势。 企业⽂化 使命:数据计算,只为新发现 愿景:成为立⾜中国基础数据计算领域的全球顶级⾼科技创新机构 杭 州 总 部 上海全球品牌战略与⽣态发展中⼼ ⼴州研发中⼼ @2024 OpenPie. All rights reserved. OpenPie Confidential 国际顶级创始团队 原 Pivotal 中 国 领 团 队 和 原 Greenplum产品及社区核⼼成员 均已加⼊拓数派。成员毕业自 CMU、北⼤、清华和科⼤少年班 等顶级学术机构,并有成员获有 奥赛奖牌。 与东吴证券在数仓虚拟化和信创领域展开试点合作 12月 创始⼈冯雷再度荣登数字商业周刊“年度智造中国商业领袖” 4月 冯雷被评为杭州市所有的独角兽和准独角兽企 业中唯⼀“年度创业⼈物” 打造⼤模型时代 立身中国的世界级团队 首家以虚拟数仓通过信通院/可信AP数据库评测 7月 拓数派数据计算引擎PieCloudDB虚拟数仓再获信创认可 8月 拓数派⼊选中国信通院“铸基计划”「⾼质量数字化 转型产品及服务全景图」0 码力 | 36 页 | 4.25 MB | 1 年前3Greenplum 介绍
2017 年 Pivotal 在 github 的开源贡献列表中全球排 名第四左右。 采用开源方案,不担心后门问题,不担心被锁定。开源还可以构建更好的 生态。 ● 采用敏捷软件开发方法开发的平台:Greenplum 采用敏捷方法开发,实现了快速迭代、持 续发布和质量内建。2017 年 Greenplum 发布了 10 个版本,以前发布一个版本需要 1 个 月左右,现在只需要十几个小时。 Greenplum 数据库产品。2010 年 Greenplum 被 高端存储领域巨头 EMC 收购,同年 Greenplum 借助 EMC 中国卓越研发集团进入中国,并创建 Greenplum 中国研发团队。2014 年 Greenplum 从 EMC 独立出来创立 Pivotal,并获得通用电气、 福特汽车和微软的投资。2018 年 4 月 Pivotal 在纽约证券交易所上市,目前市值 60 多亿美元。 中文社区尤为活跃,目前约有半数的贡献来自中国开发者,社 区贡献者包括阿里云、中移动等大公司,也有诸多中小公司和数据库爱好者。 开源之后,Greenplum 把敏捷软件开发方法学引入到分布式数据库的开发中,通过使用站立会议、 回顾会议、结对编程、持续集成、测试驱动、单周迭代等敏捷方法建立了高效的快速反馈系统, 大大提高了产品的质量和客户的满意度。Greenplum 5.0 是开源之后发布的第一个稳定版本,大 约保持0 码力 | 3 页 | 220.42 KB | 1 年前3Greenplum 精粹文集
做为 DaaS 服务来提供,对于 Mesos 或其它云计算技术的爱好者,也可以考虑采用容器镜像技术 + 集群资源框架管理技术来部署 Greenplum, 从而可以实现在公共计算 资源集群上的 MPP 敏捷部署和资源共享与分配。 总之,相信沿着开放、开源、云计算的路线继续前行,Greenplum MPP 数据库在新的时代将保持旺盛的生命力,继续高速发展。 Big Date2.indd 19 在使用任何 Protegrity 产品的时候都需要先安装 Protegrity ESA 服务 器。Protegrity ESA 的安装不在本文的讨论范围之内,不过你可以从 Protegrity 客户团队中轻松获取相关信息。 Big Date2.indd 53 16-11-22 下午3:38 54 在安装 ESA 之后,下一步将安装 Pivotal Greenplum 的 Protegrity Pivotal 成立于 2013 年 4 月,由 EMC、VMware 和 GE 共同投资成立。 公司总部位于美国硅谷,专注于下一代企业级云计算与大数据基础平 台,以及下一代应用程序运行框架支撑实现,在敏捷与快速应用程序 开发、数据科学、云计算、开放源代码软件、大规模并行处理和实时 数据系统领域颇有建树。2016 年 5 月,又获得了来自福特和微软的共 同投资,目前公司整体估值达到 28 亿美金。 作0 码力 | 64 页 | 2.73 MB | 1 年前3兼容龙蜥的云原生大模型数据计算系统:πDataCS
拓数派创始人、董事长兼首席执行官 • 冯雷带领团队实现数据库云原生虚拟化突破,打造的PieCloudDB(πCloudDB)数据库是来自本土的 全球创新热点。凭此再度荣登数字商业周刊“年度智造中国商业领袖”。(《数字商业时代》报道) 拓数派创始人、董事长兼首席执行官;原Pivotal/Greenplum(中国)创始人 • 与核心团队在PaaS云第一股Pivotal(PVTL)的成功基础上,在腾讯投资天使轮投资支持下成立 由于拓数派在云上数据库和数据计算领域的卓越表现,冯雷在杭州万物生长大会上被评为杭州市所有的 独角兽和准独角兽企业中唯一“年度创业人物”。 拓数派引领数据计算领域新发展。(中国网报道) • 原Pivotal中国领团队和原Greenplum产品及社区核心成员均已加入拓数派。成员毕业自CMU、北大、清华和科大少年班 等顶级学术机构,并有成员获有奥赛奖牌。 • 我们秉承硅谷创新文化和普及数字化公益等社会责任。在公 原Pivotal/Greenplum(中国)创始人 • 卡内基梅隆大学(CMU)硕士学位,校友会主席 强 悍 的 研 发 核 心 团 队 和 有 成 功 上 市 经 验 的 管 理 团 队 具备国际顶级数据库内核研发能力的研发团队 2021 2022 当天即获得头部产业基金天使轮投资 成为Day-1准独角兽 7月 与中国人民大学成立实习基地,打造中国 的云原生数据库世界级智力高地 11月 4月 获得元禾重元和东吴证券Pre-A轮投资0 码力 | 29 页 | 7.46 MB | 1 年前3阿里云 AnalyticDB for PostgreSQL - 打造更简单易用的Cloud SQL Data Warehouse
有幸参与了Oracle RAC到 Greenplum再到Hadoop以及最终到 ODPS的架构演进工作。 ⚫ 2012年起,转至阿里巴巴大数据团队,负责Hbase/OTS业务支 撑,期间多次负责阿里大数据双11架构和稳定性工作 ⚫ 2018年,在阿里云数据库负责OLAP产品管理团队。 1. Greenplum发展史 @Alibaba 2. AnalyticDB for PostgreSQL产品介绍 3 DTS 实时同步 Dump Data Dump Data 数据集成 按需回流 数据仓库应用 在线数据仓库 数据 查询 数据集成 批量同步 1 3 4 2 云化在线数仓 : 简化、敏捷、一栈式构筑数据仓库 • 一键实现 十分钟 集群创建部署 • 图形化实例管理及自动监控报警 实例SQL安全审计 实例实时监控 实例配置信息 • 云上多种生态工具配套: DTS数据传输 QuickBI0 码力 | 22 页 | 2.98 MB | 1 年前3Greenplum机器学习⼯具集和案例
强大的灵活性、可扩展:PL/X、Extension、PXF、外部表机制 • 完善的标准支持:SQL、JDBC、ODBC • 集成数据平台:BI/DW、文本、GIS、图、图像、机器学习 • 开放源代码,持续大力投入 • 敏捷方法学:快速迭代、持续发布、质量内建 • 企业级稳定性,成熟生态系统 2017.thegiac.com Greenplum: 机器学习工具集 2017.thegiac.com com 问题 ● 更更好地理理解不不同种 类的⽤用户 ● 更更好地了了解⽤用户与 APP的交互 ● 对实时API请求进 ⾏行行分类和安全检测 ● 数据量量⼤大,现有数 据分析团队缺乏技 能 客户 数据科学解决⽅方案 ● 某⼤大型跨国⾦金金 融服务公司 ● 移动应⽤用 API 分析 ● 使⽤用Madlib进⾏行行聚 类分析,建⽴立会话 识别模型和主题模0 码力 | 58 页 | 1.97 MB | 1 年前3PieCloudDB 的云原生之路
ü 持续产品升级,体验产品最新特性 ü 丰富的社区活动,赋能社区用户 ü 强大的开发者支持 ü 云原生 eMPP 专利技术支持与赋能 ü 7*24小时产品故障服务响应 ü 基于业务需求的专家团队服务 ü 国产化软硬件,技术自主可控 ü 存算分离支持独立扩容 ü 全面适配信创环境 公 有 云 私 有 云 裸 硬 件 企 业 版 社 区 版 云 上 云 版 一 体 器无感知技术(Serverless)利用云上无限计算资 源和弹性保证了虚拟数仓永远在线可用,S3 存储和 跨云灾备能力保证了永不丢数。 数据计算资源按需扩缩容,实现计算资源配置最优化, 提升数仓的敏捷性和弹性,打开无限数据计算空间, 更好地赋能业务发展并走向绿色。 降低数仓硬件和管理成本 提升数据计算资源利用效益 坚如磐石 | 高安全 高在线 高可靠 突 破 性 创 新 的 核 心 技 术0 码力 | 47 页 | 1.80 MB | 1 年前3PieCloudDB云原生数仓虚拟化之路
ü 持续产品升级,体验产品最新特性 ü 丰富的社区活动,赋能社区⽤户 ü 强⼤的开发者⽀持 ü 云原⽣eMPP专利技术⽀持与赋能 ü 7*24⼩时产品故障服务响应 ü 基于业务需求的专家团队服务 ü 国产化软硬件,技术⾃主可控 ü 存算分离⽀持独⽴扩容 ü 全⾯适配信创环境 公 有 云 私 有 云 裸 硬 件 企 业 版 社 区 版 云 上 云 版 一 体 器⽆感知技术(Serverless)利⽤云上⽆限计算资源 和弹性保证了虚拟数仓永远在线可⽤,S3存储和跨 云灾备能⼒保证了永不丢数。 数据计算资源按需扩缩容,实现计算资源配置最优化, 提升数仓的敏捷性和弹性,打开⽆限数据计算空间, 更好地赋能业务发展并⾛向绿⾊。 降低数仓硬件和管理成本 提升数据计算资源利用效益 坚如磐石 | 高安全 高在线 高可靠 突 破 性 创 新 的 核 心 技 术0 码力 | 44 页 | 1.64 MB | 1 年前3
共 66 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7