pdf文档 Apache Kyuubi 1.7.0 Documentation

3.78 MB 206 页 0 评论
语言 格式 评分
英语
.pdf
3
摘要
Apache Kyuubi 1.7.0文档详细阐述了其作为一个统一的多租户和高可用性网关的功能。Kyuubi支持多种计算框架如Spark、Flink和Doris,并提供多租户安全机制,包括身份验证和授权扩展。高可用性通过负载均衡和故障检测实现,确保系统持续运行。文档还介绍了Kyuubi的技术架构、引擎生命周期管理、以及支持的JDBC、RESTful APIs和MySQL协议接口。
AI总结
《Apache Kyuubi 1.7.0 Documentation》主要介绍了Apache Kyuubi的功能、架构、特性及操作指南,以下是核心内容的总结: ### 1. **Kyuubi概述** - **功能**:Kyuubi是一个分布式且多租户的统一网关,为数据仓库和数据湖提供无服务器SQL查询能力。它支持基于多种计算框架(如Apache Spark、Flink、Doris、Hive、Trino等)的分布式SQL引擎,能够高效处理海量数据。 - **目标用户**:将用户分为终端用户和管理员,分别隐藏技术细节和业务逻辑复杂性,提供零停机时间组件升级和安全管理。 ### 2. **核心特性** - **多租户支持(Multi-tenancy)**: - 控制平面:提供集中式身份验证(支持LDAP、Kerberos等协议),减少数据和资源泄露风险。 - 数据平面:引擎使用可信客户端身份,资源获取和数据访问均在独立引擎内完成,支持细粒度行/列级安全性。 - **高可用性(High Availability)**: - 提供负载均衡,避免单点故障,实现零停机时间。 - 支持故障检测,通过指标和日志监控Kyuubi服务器和引擎的状态。 ### 3. **技术架构** - **核心组件**:Kyuubi服务器处理客户端连接和执行请求,支持轻量级和重量级会话创建。SparkContext可以在本地或远端集群中创建,并共享以提高资源利用率。 - **引擎管理**:引擎通过Thrift接口注册到Zookeeper,Kyuubi服务器从中获取连接信息并建立连接。 ### 4. **接口与协议** - **Hive Thrift Protocol**:兼容HiveServer2,支持跨语言客户端、JDBC和ODBC接口。 - **RESTful APIs**:提供系统管理、SQL查询提交、结果返回等功能,支持批量任务提交。 - **MySQL Protocol**:支持MySQL连接器(如Connector/J)。 - **扩展性**:计划增加更多协议,欢迎社区贡献。 ### 5. **工具与运维** - **测试工具**:支持基于Maven和ScalaTest的单元测试和模块化测试。 - **部署与配置**:提供命令行工具(如`bin/kyuubi`)进行启动、配置和日志查看。 - **管理工具**:`kyuubi-admin`提供配置刷新、引擎管理等功能,方便管理员操作。 - **发布流程**:包括版本发布、网站更新、邮件公告等步骤,确保社区协作和版本管理规范。 ### 6. **用例与场景** - **数据湖仓库(Data Lakehouse)**:支持使用Kyuubi、Spark和Iceberg构建统一平台,实现ETL和OLAP处理,提供单一SQL接口。 - **多租户安全**:通过多租户隔离和细粒度权限管理,确保数据和资源的安全性。 ### 总结 Apache Kyuubi 1.7.0作为一个多租户分布式SQL网关,凭借其高可用性、多协议支持和统一接口,适用于大规模数据处理和分析场景,同时提供了完善的安全管理和运维工具,能够满足数据仓库和数据湖的多样化需求。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 199 页请下载阅读 -
文档评分
请文明评论,理性发言.