pdf文档 PieCloudDB Database 产品白皮书

2.68 MB 17 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
《PieCloudDB Database 产品白皮书》介绍了PieCloudDB,一款基于eMPP(弹性大规模并行计算)的云原生虚拟数仓。该产品通过计算与存储分离、多集群支持、湖仓一体化架构等技术,解决了传统数据仓库的痛点,如弹性不足、运维复杂和资源耦合。其核心优势包括弹性灵活的资源扩展、高性能的数据查询优化、多云部署能力以及完善的安全性和数据生态兼容性,旨在帮助企业以更低的成本高效管理PB级数据。
AI总结
《PieCloudDB Database 产品白皮书》总结如下: ### 1. 产品概述 PieCloudDB 是一款基于 eMPP(弹性大规模并行计算)的云原生虚拟数仓产品,支持大规模并行计算和多集群能力,能够弹性扩展计算和存储资源,满足高并发和高弹性需求。其核心优势在于: - **弹性灵活**:计算和存储分离,资源按需扩展,避免传统数仓资源耦合的限制。 - **高性能**:通过全链路优化(如聚集下推、Block Skipping)和高效的查询优化器(Orca),显著提升查询性能。 - **多租户支持**:原生多租户设计,支持租户间数据隔离和独立权限管理。 - **湖仓一体化**:统一资源管控,支持多种存储模型和数据格式,实现数据湖与数据仓库的融合。 ### 2. 核心技术 - **eMPP 架构**:支持大规模并行计算,实现自动化弹性伸缩。 - **查询优化**: - **聚集下推**:将聚集操作提前执行,减少连接操作的数据量。 - **Block Skipping**:通过预计算跳过非必要的数据块,减少数据读取量。 - **Orca 优化器**:开源的基于 Cascades 模型的查询优化器,生成高效查询计划。 - **多级缓存技术**:元数据和用户数据的多层缓存,降低网络延迟,提升查询速度。 - **统一元数据管理**:支持多集群间数据共享,避免数据复制与移动的复杂性。 ### 3. 产品优势 - **弹性扩展**:计算和存储资源独立扩展,按需分配,降低成本。 - **高性能与实时性**:通过多种优化技术(如聚集下推、Block Skipping)显著提升查询效率。 - **安全性**:支持数据透明加密、多级权限管理、白名单配置等,保障数据安全。 - **生态兼容性**:兼容 PostgreSQL/Greenplum 生态,支持多种存储格式和外部数据源。 - **多云部署**:支持裸金属、虚拟机、K8S 等多种基础设施,实现跨云部署。 ### 4. 行业背景与需求 - **数据量爆发式增长**:企业需要高效处理 PB 级数据。 - **传统数仓痛点**: - 资源耦合导致弹性不足。 - 运维复杂,成本高昂。 - 木桶效应影响性能。 - **云原生需求**:云计算技术发展推动数据处理向云原生架构转型,企业需要更敏捷、更低成本的数仓解决方案。 ### 5. 公司背景 杭州拓数派科技发展有限公司(Openpie)是专注于云原生数据计算领域的高科技企业,致力于通过创新技术(如 eMPP 分布式专利技术)构建高安全、高可靠的云原生虚拟数仓,帮助企业实现数据驱动的数字化转型。 ### 总结 PieCloudDB 作为一款云原生虚拟数仓,凭借其弹性灵活、高性能、安全可靠等特点,解决了传统数仓在弹性、成本、运维等方面的痛点,满足企业在云原生时代对数据处理的高要求,是企业 PB 级数据分析的理想选择。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 5 页请下载阅读 -
文档评分
请文明评论,理性发言.