Apache Kyuubi 1.7.0 Documentation
3.78 MB
206 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
英语 | .pdf | 3 |
摘要 | ||
Apache Kyuubi 1.7.0文档详细阐述了其作为一个统一的多租户和高可用性网关的功能。Kyuubi支持多种计算框架如Spark、Flink和Doris,并提供多租户安全机制,包括身份验证和授权扩展。高可用性通过负载均衡和故障检测实现,确保系统持续运行。文档还介绍了Kyuubi的技术架构、引擎生命周期管理、以及支持的JDBC、RESTful APIs和MySQL协议接口。 | ||
AI总结 | ||
《Apache Kyuubi 1.7.0 Documentation》主要介绍了Apache Kyuubi的功能、架构、特性及操作指南,以下是核心内容的总结:
### 1. **Kyuubi概述**
- **功能**:Kyuubi是一个分布式且多租户的统一网关,为数据仓库和数据湖提供无服务器SQL查询能力。它支持基于多种计算框架(如Apache Spark、Flink、Doris、Hive、Trino等)的分布式SQL引擎,能够高效处理海量数据。
- **目标用户**:将用户分为终端用户和管理员,分别隐藏技术细节和业务逻辑复杂性,提供零停机时间组件升级和安全管理。
### 2. **核心特性**
- **多租户支持(Multi-tenancy)**:
- 控制平面:提供集中式身份验证(支持LDAP、Kerberos等协议),减少数据和资源泄露风险。
- 数据平面:引擎使用可信客户端身份,资源获取和数据访问均在独立引擎内完成,支持细粒度行/列级安全性。
- **高可用性(High Availability)**:
- 提供负载均衡,避免单点故障,实现零停机时间。
- 支持故障检测,通过指标和日志监控Kyuubi服务器和引擎的状态。
### 3. **技术架构**
- **核心组件**:Kyuubi服务器处理客户端连接和执行请求,支持轻量级和重量级会话创建。SparkContext可以在本地或远端集群中创建,并共享以提高资源利用率。
- **引擎管理**:引擎通过Thrift接口注册到Zookeeper,Kyuubi服务器从中获取连接信息并建立连接。
### 4. **接口与协议**
- **Hive Thrift Protocol**:兼容HiveServer2,支持跨语言客户端、JDBC和ODBC接口。
- **RESTful APIs**:提供系统管理、SQL查询提交、结果返回等功能,支持批量任务提交。
- **MySQL Protocol**:支持MySQL连接器(如Connector/J)。
- **扩展性**:计划增加更多协议,欢迎社区贡献。
### 5. **工具与运维**
- **测试工具**:支持基于Maven和ScalaTest的单元测试和模块化测试。
- **部署与配置**:提供命令行工具(如`bin/kyuubi`)进行启动、配置和日志查看。
- **管理工具**:`kyuubi-admin`提供配置刷新、引擎管理等功能,方便管理员操作。
- **发布流程**:包括版本发布、网站更新、邮件公告等步骤,确保社区协作和版本管理规范。
### 6. **用例与场景**
- **数据湖仓库(Data Lakehouse)**:支持使用Kyuubi、Spark和Iceberg构建统一平台,实现ETL和OLAP处理,提供单一SQL接口。
- **多租户安全**:通过多租户隔离和细粒度权限管理,确保数据和资源的安全性。
### 总结
Apache Kyuubi 1.7.0作为一个多租户分布式SQL网关,凭借其高可用性、多协议支持和统一接口,适用于大规模数据处理和分析场景,同时提供了完善的安全管理和运维工具,能够满足数据仓库和数据湖的多样化需求。 |
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
199 页请下载阅读 -
文档评分