pdf文档 Apache Kyuubi 1.8.0-rc0 Documentation

3.82 MB 220 页 0 评论
语言 格式 评分
英语
.pdf
3
摘要
Apache Kyuubi 1.8.0-rc0 是一个基于 Apache Spark 的统一多租户 JDBC 接口,旨在提供大规模数据处理和分析的支持。它通过扩展 Spark Thrift Server 的功能,在企业应用中提供了多租户支持、身份验证和高可用性等关键特性。Kyuubi 与 HiveServer2 相比,提供了更好的性能和数据安全性,特别是在多租户环境中。文档详细介绍了 Kyuubi 的功能、社区贡献指南,以及如何配置和扩展其功能,包括支持多种计算框架如 Spark、Flink 和 Doris,以及与 Iceberg 和 Kudu 的集成。
AI总结
《Apache Kyuubi 1.8.0-rc0 Documentation》主要介绍了Apache Kyuubi的功能、技术优势及社区生态。以下是核心内容的总结: ### 1. **概述** Apache Kyuubi是一个基于Apache Spark™构建的统一多租户JDBC接口,用于大规模数据处理和分析。它扩展了Spark Thrift Server的功能,核心优势在于支持多租户,适用于企业级应用场景。 ### 2. **技术优势** - **与HiveServer2的对比**:两者均支持多客户端并发和认证,且都为JDBC/ODBC客户端提供对大数据的管理和分析支持。但Kyuubi在性能优化、多租户支持、服务可用性和安全性方面更为突出。 - **与Spark Thrift JDBC/ODBC Server的对比**:Kyuubi在Spark Thrift Server的基础上增强了多租户支持、服务可用性、并发能力和数据安全性。 - **多租户支持**:提供端到端的多租户功能,通过集中认证层降低数据和资源泄露风险,支持LDAP和Kerberos等协议。 ### 3. **核心功能** - **高可用性**:通过负载均衡和故障检测机制提供高可用性,避免单点故障,支持零停机时间维护。 - **安全性**:支持细粒度的行/列级权限控制,进一步优化数据安全模型。 - **多数据源支持**:支持Delta Lake、Iceberg、Kudu等多种数据源,提供多样化的数据处理和分析能力。 ### 4. **生态与扩展** - **Distributed SQL查询引擎**:Kyuubi支持Apache Spark、Flink、Doris、Hive、Trino等多种计算框架,适用于Data Warehouses和Lakehouses。 - **社区与贡献**:Apache Kyuubi是一个开放的社区项目,鼓励贡献和参与。其发布流程严格,确保代码质量和安全性。 - **扩展性**:支持动态扩展,例如通过Java SPI机制实现自定义功能。 ### 5. **发布与安装** - **发布流程**:包括功能 freeze、版本构建、候选版本测试、社区投票等步骤,确保每个版本的稳定性和安全性。 - **快速上手**:提供了详细的安装和配置指南,支持通过Beeline工具测试连接与数据操作。 ### 总结 Apache Kyuubi是一款功能强大且灵活的分布式SQL网关,专为现代数据仓库和湖仓设计。它在多租户支持、安全性、高可用性和多数据源场景方面具有显著优势,是企业级大数据处理和分析的理想选择。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 213 页请下载阅读 -
文档评分
请文明评论,理性发言.