ClickHouse in Production
Highload Architecture › Webserver (Apache, Nginx) › Cache (Memcached) https://github.com/donnemartin/system-design-primer 4 / 97 Highload Architecture › Webserver (Apache, Nginx) › Cache (Memcached) › Message Highload Architecture › Webserver (Apache, Nginx) › Cache (Memcached) › Message Broker (Kafka, Amazon SQS) › Coordination system (Zookeeper, etcd) › MapReduce (Hadoop, Spark) › Network File System (S3, HDFS) Highload Architecture › Webserver (Apache, Nginx) › Cache (Memcached) › Message Broker (Kafka, Amazon SQS) › Coordination system (Zookeeper, etcd) › MapReduce (Hadoop, Spark) › Network File System (S3, HDFS)0 码力 | 100 页 | 6.86 MB | 1 年前34. ClickHouse在苏宁用户画像场景的实践
仅存储40亿一个数值也需要477m的空间。也就是说稀疏的Bitmap和稠密的占用空间相 同。通常会使用一种bitmap压缩算法迚行优化。 RoaringBitmap是一种已被业界广泛使用的高效的bitmap压缩算法,使用者包括Spark、 Hive、ElasticSearch、Kylin、Druid、InfluxDB等, 详见:http://roaringbitmap.org/ 通过单个bitmap可以完成精确去重操作 用户画像原有的流程及痛点 Hive表 商品数据 ElasticSearch 用户数据 交易数据 HBase Redis 第三方… Spark 用户画像平台 现有的流程: ES中定义标签的大宽表 通过Spark关联各种业务数据,插入到ES大 宽表。 高频查询的画像数据通过后台任务保存到加 速层:Hbase 戒者 Redis 实时标签通过Flink计算,然后写入Redis FS导入标签数据的sql to-ch-sql模块,将用户画像查询条件转换为ClickHouse sql诧句 用户画像平台通过Proxy从ClickHouse集群查询标签数据 Spark tag-generate tag-loader MySQL ClickHouse集群 ClickHouse1 ClickHouse Manager HDFS 用户画像平台0 码力 | 32 页 | 1.47 MB | 1 年前3ClickHouse在B站海量数据场景的落地实践
查询处理器 ClickHouse 监控管理平台 元数据管理 库表管理 权限管理 埋点分析 报表平台 HDFS/Hive Kafka/Databus 离线接入 (Rider/Spark/WaterDrop) 实时接入 (BSQL/Saber/Flink & ClickHouse JDBC) Applications 用户程序 Flink/JDBC/Go/HTTP 标签圈人 v 不同事件有不同的私有属性字段。 v 动态选择的过滤维度和聚合维度。 v 交互式分析延迟要求 (5秒内)。 路径分析 v 选定中⼼事件。 v 按时间窗⼜确定上下游事件。 v 离线Spark与计算出事件路径及相关⽤户id的RBM。 v 离线计算结果导⼊ClickHouse做交互式路径分析。 漏斗分析 v 预定义事件漏⽃ v ⽀持各个事件单独设置过滤条件 v 查询时间跨度最⼤⼀个⽉0 码力 | 26 页 | 2.15 MB | 1 年前32. 腾讯 clickhouse实践 _2019丁晓坤&熊峰
Hadoop Data Lake 计算引擎 MR & Spark Data Warehouse OLTP Big Data Analysis 数据报表 多 维 聚 合 iData大数据分析引擎 TGMars TGSpark & Storage 大数据仓库 Hadoop Data Lake 计算引擎 MR & Spark Data Warehouse OLTP Big0 码力 | 26 页 | 3.58 MB | 1 年前3ClickHouse: настоящее и будущее
система Я расскажу 01 Почему ClickHouse — плохая система 02 И что с этим делать 03 3 Impala Spark SQL Presto/Trino Drill Actian Vortex Kylin Kudu MonetDB Actian Vector Actian Matrix Redshift Greenplum0 码力 | 32 页 | 2.62 MB | 1 年前3ClickHouse: настоящее и будущее
система Я расскажу 01 Почему ClickHouse — плохая система 02 И что с этим делать 03 3 Impala Spark SQL Presto/Trino Drill Actian Vortex Kylin Kudu MonetDB Actian Vector Actian Matrix Redshift Greenplum0 码力 | 32 页 | 776.70 KB | 1 年前36. ClickHouse在众安的实践
数据洞察与可视化 数据治理 预测分析与机器学习 CHAPTER 众安集智平台与clickhouse 02 集智平台 X-Brain AI 开放平台 计算框架 Hadoop, JStorm, Spark Streaming, Flink 离线/实时任务监控 数据、模型存储 Hive, HBase, Clickhouse, Kylin 数据接入 消 息 中 间 件 模型、 算法 模版 机器学习平台0 码力 | 28 页 | 4.00 MB | 1 年前3ClickHouse on Kubernetes
a single easy-to-manage resource ClickHouse Operator ClickHouseInstallation YAML file (Apache 2.0 source, distributed as Docker image) ClickHouse cluster resources kubectl apply create0 码力 | 34 页 | 5.06 MB | 1 年前3ClickHouse on Kubernetes
ClickHouseInstallation YAML file your-favorite namespace ClickHouse cluster resources (Apache 2.0 source, distributed as Docker image) Altinity ClickHouse Operator Quick Start Installing0 码力 | 29 页 | 3.87 MB | 1 年前3Тестирование ClickHouse которого мы заслуживаем
запускаются на ветки × Артефакты скачать нельзя 59 / 77 Тестирование ClickHouse, которого мы заслуживаем Apache Ignite › Разработка на GitHub › Изменения через пулл реквесты › Для CI используется TeamCity Понравилось:0 码力 | 84 页 | 9.60 MB | 1 年前3
共 10 条
- 1