TiDB中文技术文档
集群目前已用数据库空间大小 Store Status — up store : TiKV 正常节点数量 Store Status — down store : TiKV 异常节点数量 如果大于 0,证明有节点不正常 Store Status — offline store : 手动执行下线操作 TiKV 节点数量 Store Status — Tombstone store : 下线成功的 TiKV not match 这样的错误, 表明收到了不属于这个集群发过来的消息 Vote : Raft vote 的频率 通常这个值只会在发生 split 的时候有变动,如果长时间出现了 vote 偏高的情况,证明系统出现了 严重的问题, 有一些节点无法工作了 95% & 99% coprocessor request duration : 95% & 99% coprocessor 执行时间 和业务相关,但通常不会出现持续高位的值 charset_name] [COLLATE collation_name] 41. > 集合。可以有零或者多个值的字符串对象,每一个值必须选自允许值列表中。 Json 类型可以存储 Json 这种半结构化的数据,相比于直接将 Json 存储为字符串,它的好处在于: 1. 使用 Binary 格式进行序列化,对 Json 的内部字段的查询、解析加快; 2. 多了 Json 合法性验证的步骤,只有合法的0 码力 | 444 页 | 4.89 MB | 6 月前3TiDB v8.0 中文手册
backup.num-threads,限制处理备份的工作线程数量。具体原理如下: 目前,备份过程会涉及大量的 SST 解码、编码、压缩、解压,而此过程会需要消耗大量的 CPU 资源。 另外,以往的测试证明,备份过程中,用于备份的线程池的 CPU 利用率接近 100%。也就是说,备 份任务会占用大量 CPU 资源。通过调整备份任务使用的线程数量,TiKV 可以控制备份任务使用的 CPU 核心数,从而减少其任务对集群性能的影响。 使用率,通常代表写入的负载。在这个场景下 tikv-3 为 Raft Leader,tikv-0 和 tikv-1 是 Raft 的 Follower,其他的 TiKV 节点的负载几乎为空。 从 PD 的监控中也可以证明热点的产生: 1440 图 208: QPS4 12.5.4.5 热点问题产生的原因 以上测试并未达到理论场景中最佳实践,因为刚创建表的时候,这个表在 TiKV 中只会对应为一个 Region,范 Checksum,如果该值与 TiDB 写入的值相同,则可 以证明数据在 TiDB 至 TiCDC 的传输过程中是正确的。 TiCDC 将数据编码成特定格式并发送至 Kafka。Kafka Consumer 读取数据后,可以使用与 TiDB 相同的算法计算 得到新的 Checksum,将此值与数据中携带的 Checksum 值进行比较,若二者一致,则可证明从 TiCDC 至 Kafka Consumer 的传输链路上的数据是正确的。0 码力 | 4805 页 | 101.28 MB | 1 年前3TiDB v8.1 中文手册
backup.num-threads,限制处理备份的工作线程数量。具体原理如下: 目前,备份过程会涉及大量的 SST 解码、编码、压缩、解压,而此过程会需要消耗大量的 CPU 资源。 另外,以往的测试证明,备份过程中,用于备份的线程池的 CPU 利用率接近 100%。也就是说,备 份任务会占用大量 CPU 资源。通过调整备份任务使用的线程数量,TiKV 可以控制备份任务使用的 CPU 核心数,从而减少其任务对集群性能的影响。 使用率,通常代表写入的负载。在这个场景下 tikv-3 为 Raft Leader,tikv-0 和 tikv-1 是 Raft 的 Follower,其他的 TiKV 节点的负载几乎为空。 从 PD 的监控中也可以证明热点的产生: 1424 图 208: QPS4 12.5.4.5 热点问题产生的原因 以上测试并未达到理论场景中最佳实践,因为刚创建表的时候,这个表在 TiKV 中只会对应为一个 Region,范 Checksum,如果该值与 TiDB 写入的值相同,则可 以证明数据在 TiDB 至 TiCDC 的传输过程中是正确的。 TiCDC 将数据编码成特定格式并发送至 Kafka。Kafka Consumer 读取数据后,可以使用与 TiDB 相同的算法计算 得到新的 Checksum,将此值与数据中携带的 Checksum 值进行比较,若二者一致,则可证明从 TiCDC 至 Kafka Consumer 的传输链路上的数据是正确的。0 码力 | 4807 页 | 101.31 MB | 1 年前3TiDB v8.4 中文手册
8.1.1.1 向量嵌入 向量嵌入 (vector embedding) 也称为嵌入 (embedding) ,是在高维空间中用于表示现实世界对象的数字序列。它 可以捕捉文档、图像、音频和视频等非结构化数据的语义特征和上下文。 向量嵌入在机器学习中至关重要,是语义相似性搜索的基础。 TiDB 专门引入了向量数据类型以及向量搜索索引,用于优化向量嵌入的存储和检索,增强其在人工智能领域 的应用。你可以使用向量类型在 中存储向量嵌入,并执行向量搜索查询,找到语义上最相关的数据。 4.8.1.1.2 嵌入模型 嵌入模型是将数据转换为向量嵌入的算法。 选择一种合适的嵌入模型对于确保语义搜索结果的准确性和相关性至关重要。对于非结构化的文本数据,你 可以在 Massive Text Embedding Benchmark (MTEB) Leaderboard 上找到性能最佳的文本嵌入模型。 如需了解如何为特定数据类型生成向量嵌入,请参阅相关嵌入模型的教程或示例。 -------------------------------------------------------------------------------- 用作检索器 在 Langchain 中,检索器是一个接口,用于响应非结构化查询,检索相关文档。相比于向量存储,检索器可以 为你提供更多的功能。以下代码演示了如何将 TiDB 向量存储用作检索器。 retriever = vector_store.as_retriever(0 码力 | 5072 页 | 104.05 MB | 9 月前3TiDB v8.5 中文手册
8.1.1.1 向量嵌入 向量嵌入 (vector embedding) 也称为嵌入 (embedding) ,是在高维空间中用于表示现实世界对象的数字序列。它 可以捕捉文档、图像、音频和视频等非结构化数据的语义特征和上下文。 向量嵌入在机器学习中至关重要,是语义相似性搜索的基础。 TiDB 专门引入了向量数据类型以及向量搜索索引,用于优化向量嵌入的存储和检索,增强其在人工智能领域 的应用。你可以使用向量类型在 中存储向量嵌入,并执行向量搜索查询,找到语义上最相关的数据。 4.8.1.1.2 嵌入模型 嵌入模型是将数据转换为向量嵌入的算法。 选择一种合适的嵌入模型对于确保语义搜索结果的准确性和相关性至关重要。对于非结构化的文本数据,你 可以在 Massive Text Embedding Benchmark (MTEB) Leaderboard 上找到性能最佳的文本嵌入模型。 如需了解如何为特定数据类型生成向量嵌入,请参阅相关嵌入模型的教程或示例。 -------------------------------------------------------------------------------- 用作检索器 在 Langchain 中,检索器是一个接口,用于响应非结构化查询,检索相关文档。相比于向量存储,检索器可以 为你提供更多的功能。以下代码演示了如何将 TiDB 向量存储用作检索器。 retriever = vector_store.as_retriever(0 码力 | 5095 页 | 104.54 MB | 9 月前3TiDB v8.2 中文手册
backup.num-threads,限制处理备份的工作线程数量。具体原理如下: 目前,备份过程会涉及大量的 SST 解码、编码、压缩、解压,而此过程会需要消耗大量的 CPU 资源。 另外,以往的测试证明,备份过程中,用于备份的线程池的 CPU 利用率接近 100%。也就是说,备 份任务会占用大量 CPU 资源。通过调整备份任务使用的线程数量,TiKV 可以控制备份任务使用的 CPU 核心数,从而减少其任务对集群性能的影响。 使用率,通常代表写入的负载。在这个场景下 tikv-3 为 Raft Leader,tikv-0 和 tikv-1 是 Raft 的 Follower,其他的 TiKV 节点的负载几乎为空。 从 PD 的监控中也可以证明热点的产生: 1468 图 207: QPS4 12.5.4.5 热点问题产生的原因 以上测试并未达到理论场景中最佳实践,因为刚创建表的时候,这个表在 TiKV 中只会对应为一个 Region,范 Checksum,如果该值与 TiDB 写入的值相同,则可 以证明数据在 TiDB 至 TiCDC 的传输过程中是正确的。 TiCDC 将数据编码成特定格式并发送至 Kafka。Kafka Consumer 读取数据后,可以使用与 TiDB 相同的算法计算 得到新的 Checksum,将此值与数据中携带的 Checksum 值进行比较,若二者一致,则可证明从 TiCDC 至 Kafka Consumer 的传输链路上的数据是正确的。0 码力 | 4987 页 | 102.91 MB | 9 月前3TiDB v7.6 中文手册
backup.num-threads,限制处理备份的工作线程数量。具体原理如下: 目前,备份过程会涉及大量的 SST 解码、编码、压缩、解压,而此过程会需要消耗大量的 CPU 资源。 另外,以往的测试证明,备份过程中,用于备份的线程池的 CPU 利用率接近 100%。也就是说,备 份任务会占用大量 CPU 资源。通过调整备份任务使用的线程数量,TiKV 可以控制备份任务使用的 CPU 核心数,从而减少其任务对集群性能的影响。 使用率,通常代表写入的负载。在这个场景下 tikv-3 为 Raft Leader,tikv-0 和 tikv-1 是 Raft 的 Follower,其他的 TiKV 节点的负载几乎为空。 从 PD 的监控中也可以证明热点的产生: 1412 图 208: QPS4 12.5.4.5 热点问题产生的原因 以上测试并未达到理论场景中最佳实践,因为刚创建表的时候,这个表在 TiKV 中只会对应为一个 Region,范 Checksum,如果该值与 TiDB 写入的值相同,则可 以证明数据在 TiDB 至 TiCDC 的传输过程中是正确的。 TiCDC 将数据编码成特定格式并发送至 Kafka。Kafka Consumer 读取数据后,可以使用与 TiDB 相同的算法计算 得到新的 Checksum,将此值与数据中携带的 Checksum 值进行比较,若二者一致,则可证明从 TiCDC 至 Kafka Consumer 的传输链路上的数据是正确的。0 码力 | 4666 页 | 101.24 MB | 1 年前3TiDB v7.5 中文手册
backup.num-threads,限制处理备份的工作线程数量。具体原理如下: 目前,备份过程会涉及大量的 SST 解码、编码、压缩、解压,而此过程会需要消耗大量的 CPU 资源。 另外,以往的测试证明,备份过程中,用于备份的线程池的 CPU 利用率接近 100%。也就是说,备 份任务会占用大量 CPU 资源。通过调整备份任务使用的线程数量,TiKV 可以控制备份任务使用的 CPU 核心数,从而减少其任务对集群性能的影响。 使用率,通常代表写入的负载。在这个场景下 tikv-3 为 Raft Leader,tikv-0 和 tikv-1 是 Raft 的 Follower,其他的 TiKV 节点的负载几乎为空。 从 PD 的监控中也可以证明热点的产生: 1395 图 208: QPS4 12.5.4.5 热点问题产生的原因 以上测试并未达到理论场景中最佳实践,因为刚创建表的时候,这个表在 TiKV 中只会对应为一个 Region,范 Checksum,如果该值与 TiDB 写入的值相同,则可 以证明数据在 TiDB 至 TiCDC 的传输过程中是正确的。 TiCDC 将数据编码成特定格式并发送至 Kafka。Kafka Consumer 读取数据后,可以使用与 TiDB 相同的算法计算 得到新的 Checksum,将此值与数据中携带的 Checksum 值进行比较,若二者一致,则可证明从 TiCDC 至 Kafka Consumer 的传输链路上的数据是正确的。0 码力 | 4590 页 | 100.91 MB | 1 年前3TiDB v7.1 中文手册
backup.num-threads,限制处理备份的工作线程数量。具体原理如下: 目前,备份过程会涉及大量的 SST 解码、编码、压缩、解压,而此过程会需要消耗大量的 CPU 资源。 另外,以往的测试证明,备份过程中,用于备份的线程池的 CPU 利用率接近 100%。也就是说,备 份任务会占用大量 CPU 资源。通过调整备份任务使用的线程数量,TiKV 可以控制备份任务使用的 CPU 核心数,从而减少其任务对集群性能的影响。 使用率,通常代表写入的负载。在这个场景下 tikv-3 为 Raft Leader,tikv-0 和 tikv-1 是 Raft 的 Follower,其他的 TiKV 节点的负载几乎为空。 从 PD 的监控中也可以证明热点的产生: 1376 图 207: QPS4 12.5.4.5 热点问题产生的原因 以上测试并未达到理论场景中最佳实践,因为刚创建表的时候,这个表在 TiKV 中只会对应为一个 Region,范 Checksum,如果该值与 TiDB 写入的值相同,则可 以证明数据在 TiDB 至 TiCDC 的传输过程中是正确的。 TiCDC 将数据编码成特定格式并发送至 Kafka。Kafka Consumer 读取数据后,可以使用与 TiDB 相同的算法计算 得到新的 Checksum,将此值与数据中携带的 Checksum 值进行比较,若二者一致,则可证明从 TiCDC 至 Kafka Consumer 的传输链路上的数据是正确的。0 码力 | 4369 页 | 98.92 MB | 1 年前3TiDB v5.4 中文手册
backup.num-threads,限制处理备份的工作线程数量。具体原理如下: 目前,备份过程会涉及大量的 SST 解码、编码、压缩、解压,而此过程会需要消耗大量的 CPU 资源。 另外,以往的测试证明,备份过程中,用于备份的线程池的 CPU 利用率接近 100%。也就是说,备 份任务会占用大量 CPU 资源。通过调整备份任务使用的线程数量,TiKV 可以控制备份任务使用的 CPU 核心数,从而减少其任务对集群性能的影响。 使用率,通常代表写入的负载。在这个场景下 tikv-3 为 Raft Leader,tikv-0 和 tikv-1 是 Raft 的 Follower,其他的 TiKV 节点的负载几乎为空。 从 PD 的监控中也可以证明热点的产生: 664 图 91: QPS4 10.5.4.5 热点问题产生的原因 以上测试并未达到理论场景中最佳实践,因为刚创建表的时候,这个表在 TiKV 中只会对应为一个 Region,范 backup.num-threads,限制处理备份的工作线程数量。具体原理如下: 目前,备份过程会涉及大量的 SST 解码、编码、压缩、解压,而此过程会需要消耗大量的 CPU 资源。 另外,以往的测试证明,备份过程中,用于备份的线程池的 CPU 利用率接近 100%。也就是说,备 份任务会占用大量 CPU 资源。通过调整备份任务使用的线程数量,TiKV 可以控制备份任务使用的 CPU 核心数,从而减少其任务对集群性能的影响。0 码力 | 2852 页 | 52.59 MB | 1 年前3
共 15 条
- 1
- 2