蔡岳毅-基于ClickHouse+StarRocks构建支撑千亿级数据量的高可用查询引擎
全球敏捷运维峰会 广州站 基于ClickHouse+StarRocks 构建支撑千亿级数据量的高可用查询引擎 演讲人:蔡岳毅 全球敏捷运维峰会 广州站 1. 为什么选择ClickHouse/StarRocks; 2. ClickHouse/StarRocks的高可用架构; 3. 如何合理的应用ClickHouse的优点,StarRocks 如何来补充ClickHouse 的短板; 4 广州站 StarRocks的特点 优点: 1. 支持标准的SQL语法,兼容MySql协议; 2. MPP架构,扩缩容非常简单方便; 3. 支持高并发查询; 4. 跨机房部署,实现最低成本的DR 缺点: 1. 不支持大规模的批处理; 2. 支持insert into,但最理想的是消费Kafka; 全球敏捷运维峰会 广州站 ClickHouse/StarRocks在酒店数据智能平台的架构 query_log; • 数据存储磁盘尽量采用ssd; • 减少数据中文本信息的冗余存储; • 特别适用于数据量大,查询频次可控的场景,如数据分析,埋点日志系统; 全球敏捷运维峰会 广州站 StarRocks应用小结 • 发挥分布式的优势,要提前做好分区字段规划; • 支持各种join,语法会相对clickhouse简单很多; • 一个sql可以多处用; • 建立好守护进程以及节点监控;0 码力 | 15 页 | 1.33 MB | 1 年前32021 中国开源年度报告
source projects 开源项目代码公开透明,可能会存在多个下游供应商基于上游社区技术进行各自的商业化开发, 这会导致开源项目技术归属出现争议。Apache Doris 和 StarRocks(原 DorisDB)就存在由 于开源技术归属引发的矛盾: Open source projects are open and transparent, and there may be technologies, which may lead to disputes over the ownership of open source projects. Apache Doris and StarRocks (formerly DorisDB) have conflicts caused by the ownership of open source technology: 【专家点评】 Apache 软件基金会。2020 年 2 月,百度 Doris 团 队的个别成员离职创业,基于 Apache Doris 之前的版本做了自己的商业化闭源产品 DorisDB ,也就是 StarRocks 的前身。DorisDB 在 2021 年 9 月宣布采用 Elastic 2.0 许 可证下全面开源。这件事引起了很大争议。 Apache Doris was contributed to0 码力 | 199 页 | 9.63 MB | 1 年前3Apache Kyuubi 1.9.0-SNAPSHOT Documentation
[https://doris.apache.org/], Hive [https://hive.apache.org/], Trino [https://trino.io/], and StarRocks [https://www.starrocks.io/], etc., to query massive datasets distributed over fleets of machines from heterogeneous phoenix: For establishing Phoenix connec postgresql: For establishing PostgreSQL c starrocks: For establishing StarRocks conn kyuubi.engine.jdbc.connection.urlThe server url that engine will type will laun forward queries to the database system t driver, for now, it supports Doris, MySQ StarRocks. CHAT: specify this engine type will laun kyuubi.engine.ui.retainedSessions 200 The number of SQL 0 码力 | 405 页 | 4.96 MB | 1 年前32021 中国开源年度报告
3.3.1 开源项目技术归属风险 开源项目代码公开透明,可能会存在多个下游供应商基于上游社区技术进行各自的商业化开发,这会导 致开源项目技术归属出现争议。Apache Doris 和 StarRocks(原 DorisDB)就存在由于开源技术归属 引发的矛盾 专家点评 姜宁:这个问题还是集中在商标权的问题, 不是技术归属的问题。 开源许可协议允许在满足一定条件下的二 次分发,由于 DorisDB 年由百度贡献给 Apache 软件基金会。2020 年 2 月,百度 Doris 团队的个别成员 离职创业,基于 Apache Doris 之前的版本做了自己的商业化闭源产品 DorisDB ,也就是 StarRocks 的前身。DorisDB 在 2021 年 9 月宣布采用 Elastic 2.0 许可证下全面开源。这件事引起了很大争议。 Apache Doris 认 为 DorisDB 作为 Fork 》调整的范围。 ● Elastic License 2.0 (ELv2) 虽 然 满 足 源 码 可 见, 但 并 不 符 合 OSI 的 开 源 定 义, 采 用 ELv2 的 StarRocks 因自称开源,而引起业界非议。 ● 国外一开发者在网上抱怨深圳手机公司 UMIDIGI 未公开其采用了 GPL-2.0 协议的手机操作系统内 核源代码,位于深圳的知名博主机械妖姬(Naomi0 码力 | 132 页 | 14.24 MB | 1 年前3202306 ⼈⼈可⽤的开源数据可视化分析⼯具
Elasticsearch / ClickHouse / MongoDB / AWS RedShift / MariaDB / Doris / Hive / DB2 数据库 / Impala / StarRocks / TiDB / MaxCompute / Presto / Kylin / 达梦 / API 数据源等;⽀持数据源的⾼级设置,例如最⼤连接数、最⼩连接数、连接超时时间等; ⽀持数据源有效0 码力 | 27 页 | 3.61 MB | 1 年前3DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 06 ⽉
Elasticsearch / ClickHouse / MongoDB / AWS RedShift / MariaDB / Doris / Hive / DB2数据库 / Impala / StarRocks / TiDB / MaxCompute / Presto / API 数据源等; ⽀持数据源的新建、编辑、删除等;⽀持数据源的⾼级设置,如最⼤连接数、最⼩连接数、连接超时时间等; ⽀持数0 码力 | 27 页 | 10.32 MB | 1 年前3DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 12 ⽉
Elasticsearch / ClickHouse / MongoDB / AWS RedShift / MariaDB / Doris / Hive / DB2数据库 / Impala / StarRocks / TiDB /MaxCompute / Presto / Kylin / 达梦 / API 数据源等; ⽀持数据源的新建、编辑、删除等;⽀持数据源的⾼级设置,如最⼤连接数、最⼩连接数、连接超时时间等;0 码力 | 27 页 | 3.58 MB | 1 年前3DataEase 人人可⽤的开源数据可视化分析⼯具 2023 年 04 ⽉
Elasticsearch / ClickHouse / MongoDB / AWS RedShift / MariaDB / Doris / Hive / DB2数据库 / Impala / StarRocks / TiDB /MaxCompute / Presto / Kylin / 达梦 / API 数据源等; ⽀持数据源的新建、编辑、删除等;⽀持数据源的⾼级设置,如最⼤连接数、最⼩连接数、连接超时时间等;0 码力 | 27 页 | 3.60 MB | 1 年前3DBeaver Lite User Guide v24.2.ea
Salesforce Not available in Community Edition Salesforce Data Cloud - SingleStore ✓ Snowflake ✓ StarRocks - Sybase jConnect ✓ Sybase jTDS ✓ Teradata ✓ TiDB - Trino - Vertica ✓ Virtuoso - Yellowbrick Salesforce Not available in Community Edition Salesforce Data Cloud - SingleStore ✓ Snowflake ✓ StarRocks - Sybase jConnect ✓ Sybase jTDS ✓ Teradata ✓ TiDB - Trino - DBeaver Lite User Guide 24.2.ea Not available in Community Edition - Salesforce Data Cloud - - SingleStore ✓ - Snowflake ✓ - StarRocks - - Sybase jConnect ✓ - Sybase jTDS ✓ - Teradata ✓ - TiDB - - Trino - - Vertica ✓ - Virtuoso0 码力 | 1010 页 | 79.48 MB | 1 年前3DBeaver Lite User Guide v.24.1
Salesforce Not available in Community Edition Salesforce Data Cloud - SingleStore ✓ Snowflake ✓ StarRocks - Sybase jConnect ✓ Sybase jTDS ✓ Teradata ✓ TiDB - Trino - Vertica ✓ Virtuoso - Yellowbrick Salesforce Not available in Community Edition Salesforce Data Cloud - SingleStore ✓ Snowflake ✓ StarRocks - Sybase jConnect ✓ Sybase jTDS ✓ Teradata ✓ TiDB - Trino - DBeaver Lite User Guide 24.1. Not available in Community Edition - Salesforce Data Cloud - - SingleStore ✓ - Snowflake ✓ - StarRocks - - Sybase jConnect ✓ - Sybase jTDS ✓ - Teradata ✓ - TiDB - - Trino - - Vertica ✓ - Virtuoso0 码力 | 1008 页 | 79.40 MB | 1 年前3
共 15 条
- 1
- 2