PieCloudDB是杭州拓数派科技发展有限公司(OpenPie)推出的云原生虚拟数仓数据库产品,它以云原生技术重构数据存储和计算,实现数据的高效管理、安全加密和弹性伸缩,支持AI和数据科学,为企业用户提供强大的数据计算基础设施。
  • pdf 文档 兼容龙蜥的云原生大模型数据计算系统:πDataCS

    0 码力 | 29 页 | 7.46 MB | 1 年前
    3
    文档介绍了兼容龙蜥的云原生大模型数据计算系统πDataCS,主要包括三个方面的优势:全面升级Hadoop大数据和Greenplum数仓至云原生数据平台;全面支持大语言基础模型和私域数据结合做垂直应用;云原生下eMPP计算引擎全面颠覆MPP技术。系统通过PieCloudVector和PieCloudDB两个计算引擎,分别具备向量搜索能力和虚拟数仓服务,解决了传统数据库和向量数据库在弹性扩缩、易用性和数据一致性等方面的局限性。πDataCS采用全新云原生架构,实现一份数据多引擎计算,支持HTAP和湖仓一体,能够打破数据孤岛并支持大模型训练。
  • pdf 文档 PieCloudDB 的云原生之路

    0 码力 | 47 页 | 1.80 MB | 1 年前
    3
    文档介绍了拓数派及其云原生分析型数据库 PieCloudDB,阐述了其核心技术优势,包括 eMPP 弹性大规模并行计算、存算分离、弹性计算、多云部署、实时处理和数据安全等。PieCloudDB 旨在帮助企业实现数据价值最大化,适应云计算时代的需求,并在多云环境中提供高效、安全的数据处理解决方案。文档还提到了 PieCloudDB 的发展历程和产品版本发布情况。
  • pdf 文档 云原生数据库PieCloudDB 性能优化之路

    0 码力 | 26 页 | 711.44 KB | 1 年前
    3
    云原生数据库PieCloudDB基于PostgreSQL优化器,扩展其分布式架构,引入Motion概念,实现分布式查询计划优化。通过云原生特性和对象存储设计,实现了聚集下推、Block skipping、预计算等多项优化技术,提升查询性能。其分布式架构支持多阶段聚集和数据重分配,优化器将查询计划拆分为小单元并行执行,减少处理数据量。这些技术使PieCloudDB在新基建中承担可靠的云数据库底座角色,帮助企业实现数据价值最大化。
  • pdf 文档 云原生虚拟数仓 PieCloudDB ETL 方案设计与实现

    0 码力 | 29 页 | 5.24 MB | 1 年前
    3
    文档介绍了云原生虚拟数仓PieCloudDB的ETL方案设计与实现,强调了对象存储的低成本扩展性和共享底层数据的优势。PieCloudDB支持直接读取对象存储上的Parquet等格式文件,并通过不同的存储方式优化各种查询需求。ETL过程包括数据抽取、转换和加载,支持多种模式如文件拷贝、CDC和流式传输。PieCloudDB采用存算分离的分布式架构,各模块可独立伸缩,兼容PostgreSQL生态,并提供了增量数据实时同步演示。
  • pdf 文档 PieCloudDB:云原生分布式虚拟数仓的诞生之旅

    0 码力 | 24 页 | 2.01 MB | 1 年前
    3
    文档介绍了PieCloudDB,这是一款云原生分布式虚拟数仓。其核心目标包括安全、可靠、简单、功能完善和高性能,支持公有云、私有云和混合云。PieCloudDB基于Postgres,采用存算分离的架构,支持弹性计算和弹性存储,并提供多租户隔离功能。2022年10月24日发布了1.0版本,实现了云原生技术和产品目标。2023年3月14日上线了公有云(阿里云)。文档还讨论了未来的功能增强和技术优化,如元数据存储、持久存储访问优化、稳定性和异常处理增强等。
  • pdf 文档 PostgreSQL 查询优化器解析

    0 码力 | 37 页 | 851.23 KB | 1 年前
    3
    文档主要介绍了PostgreSQL查询优化器的工作原理和优化策略。优化器会根据关系数量选择合适的算法,如GEQO。当关系过多时,优化器会将复杂的连接问题分解为更小的子问题,并通过路径结构来管理查询计划。文档还详细说明了后扫描规划的步骤,包括路径扩展、计划调整和子查询处理等。此外,文档通过具体查询示例展示了不同连接方式(如嵌套循环左连接和哈希连接)的执行计划。优化器会根据查询条件选择最优的连接方法,并通过过滤条件来提高查询效率。
  • pdf 文档 PieCloudDB云原生数仓虚拟化之路

    0 码力 | 44 页 | 1.64 MB | 1 年前
    3
    文档介绍了PieCloudDB云原生数仓虚拟化的技术与优势。其核心技术包括eMPP分布式专利技术、存算分离架构和Serverless功能,能够提升数据计算资源利用效率和系统弹性。虚拟数仓实现了多个数仓的统一管理,打破数据孤岛,降低硬件和管理成本,同时保证高安全、高可用性。文档还提到了PieCloudDB在云计算和大数据领域的应用前景及其发展历程,展示了其在云原生数据库领域的创新与领导地位。
  • pdf 文档 AGI 趋势下的云原生数据计算系统

    0 码力 | 26 页 | 2.84 MB | 1 年前
    3
    文档介绍了拓数派(OpenPie)在AGI趋势下的云原生数据计算系统的创新与应用。该系统通过重构数据存储和计算,实现一份存储多引擎数据计算,全面升级大数据系统至大模型时代。文档还探讨了中国AGI市场的发展趋势,指出市场融资活跃,顶级人才短缺,预计到2030年市场规模将达到4543.6亿元人民币,由企业市场主导。拓数派在云原生数据计算系统领域具有领先地位,提出虚拟数仓和eMPP技术,并在数据共享、安全加密等方面取得突破,为AIGC全生命周期管理提供了高效解决方案。
  • pdf 文档 云原生虚拟数仓 PieCloudDB 的架构和关键模块实现

    0 码力 | 43 页 | 1.14 MB | 1 年前
    3
    文档详细介绍了云原生虚拟数仓PieCloudDB的架构和关键模块实现。PieCloudDB采用弹性伸缩集群、无状态Segment节点和多集群支持等云原生特性,结合高效的分布式计算能力和完备的事务支持,提供了强大的数据处理能力。文档还提到PieCloudDB在CTE(公共表表达式)中的性能优化,如CTE的聚集下推,以及其在公有云环境下的优势,如存算分离和按需付费的弹性计算资源。此外,PieCloudDB支持ANSI标准SQL的完备实现,包括复杂查询和时间旅行功能,为用户提供了高效、灵活的数据分析能力。
  • pdf 文档 PieCloudDB:基于PostgreSQL的eMPP云原生数据库

    0 码力 | 45 页 | 1.32 MB | 1 年前
    3
    本文档介绍了PieCloudDB,这是一个基于PostgreSQL的云原生数据库,支持弹性计算资源和分布式海量数据处理。PieCloudDB采用存算分离架构,具备eMPP(弹性大规模并行处理)技术,能够高效处理复杂OLAP查询。其优化器为分布式查询提供最优计划,支持多模和serverless的实时大数据平台,适用于高性能、安全可靠的大数据应用场景。
共 23 条
  • 1
  • 2
  • 3
前往