PieCloudDB Database 产品白皮书
2.68 MB
17 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
中文(简体) | .pdf | 3 |
摘要 | ||
《PieCloudDB Database 产品白皮书》介绍了PieCloudDB,一款基于eMPP(弹性大规模并行计算)的云原生虚拟数仓。该产品通过计算与存储分离、多集群支持、湖仓一体化架构等技术,解决了传统数据仓库的痛点,如弹性不足、运维复杂和资源耦合。其核心优势包括弹性灵活的资源扩展、高性能的数据查询优化、多云部署能力以及完善的安全性和数据生态兼容性,旨在帮助企业以更低的成本高效管理PB级数据。 | ||
AI总结 | ||
《PieCloudDB Database 产品白皮书》总结如下:
### 1. 产品概述
PieCloudDB 是一款基于 eMPP(弹性大规模并行计算)的云原生虚拟数仓产品,支持大规模并行计算和多集群能力,能够弹性扩展计算和存储资源,满足高并发和高弹性需求。其核心优势在于:
- **弹性灵活**:计算和存储分离,资源按需扩展,避免传统数仓资源耦合的限制。
- **高性能**:通过全链路优化(如聚集下推、Block Skipping)和高效的查询优化器(Orca),显著提升查询性能。
- **多租户支持**:原生多租户设计,支持租户间数据隔离和独立权限管理。
- **湖仓一体化**:统一资源管控,支持多种存储模型和数据格式,实现数据湖与数据仓库的融合。
### 2. 核心技术
- **eMPP 架构**:支持大规模并行计算,实现自动化弹性伸缩。
- **查询优化**:
- **聚集下推**:将聚集操作提前执行,减少连接操作的数据量。
- **Block Skipping**:通过预计算跳过非必要的数据块,减少数据读取量。
- **Orca 优化器**:开源的基于 Cascades 模型的查询优化器,生成高效查询计划。
- **多级缓存技术**:元数据和用户数据的多层缓存,降低网络延迟,提升查询速度。
- **统一元数据管理**:支持多集群间数据共享,避免数据复制与移动的复杂性。
### 3. 产品优势
- **弹性扩展**:计算和存储资源独立扩展,按需分配,降低成本。
- **高性能与实时性**:通过多种优化技术(如聚集下推、Block Skipping)显著提升查询效率。
- **安全性**:支持数据透明加密、多级权限管理、白名单配置等,保障数据安全。
- **生态兼容性**:兼容 PostgreSQL/Greenplum 生态,支持多种存储格式和外部数据源。
- **多云部署**:支持裸金属、虚拟机、K8S 等多种基础设施,实现跨云部署。
### 4. 行业背景与需求
- **数据量爆发式增长**:企业需要高效处理 PB 级数据。
- **传统数仓痛点**:
- 资源耦合导致弹性不足。
- 运维复杂,成本高昂。
- 木桶效应影响性能。
- **云原生需求**:云计算技术发展推动数据处理向云原生架构转型,企业需要更敏捷、更低成本的数仓解决方案。
### 5. 公司背景
杭州拓数派科技发展有限公司(Openpie)是专注于云原生数据计算领域的高科技企业,致力于通过创新技术(如 eMPP 分布式专利技术)构建高安全、高可靠的云原生虚拟数仓,帮助企业实现数据驱动的数字化转型。
### 总结
PieCloudDB 作为一款云原生虚拟数仓,凭借其弹性灵活、高性能、安全可靠等特点,解决了传统数仓在弹性、成本、运维等方面的痛点,满足企业在云原生时代对数据处理的高要求,是企业 PB 级数据分析的理想选择。 |
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余
5 页请下载阅读 -
文档评分