数据结构与算法 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Greenplum 排序算法

Greenplum内核揭秘之排序算法 5 ● 内排序算法 ● 外排序算法 ● Greenplum TupleSort ● 排序在Greenplum中的应用 Outline 6 ● 冒泡排序 ● 插入排序 ● 快速排序 ● 堆排序 ● 基数排序内排序算法 7 快速排序是最常用的排序算法，由Tony Hoare在1959年发明。快速排序算法的三个步骤： ● 挑选基准值列分别进行排序快速排序 8 ● 快速排序算法每次选取一个基准元素，将比基准元素小的排到基准元素左边，比基准元素大的排到基准元素的右边，从而将待排序数组分成两个子集。快速排序 6 8 3 2 7 1 7 9 8 7 7 9 6 3 2 1 分治法 9 快速排序 ● 快速排序算法： 10 堆排序是最常用的排序算法，由J.Williams在1964年发明。 ● 堆堆是一种近似完全二叉树的结构，最大值堆要求每个子节点的键值总是小于父节点。最小值堆要求每个子节点的键值总是大于父节点。堆排序算法 ● 步骤1：建立最大值堆,最大元素在堆顶 ● 步骤2：重复将堆顶元组移除并插入到排序数组，更新堆使其保持堆的性质 ● 步骤3：当堆的元素个数为零时，数组排序完毕堆排序 11 ● 建堆堆排序 9 5 8 1 3 6 2 1 2 5 9 8

0 码力 | 52 页 | 2.05 MB | 1 年前
3
TiDB 原理与实战

TiDB 原理与实战 lixia@pingcap.com @紫沐夏_go About me ● 程序媛，TiDB committer， Go 语言狂热粉 ○ 主要研究方向为分布式系统，坚信分布式系统才是未来 ● 目前在 PingCAP 就职 ○ 15 年中旬加入 PingCAP ○ 主要参与模块为 TiDB 的 online DDL，SQL 优化器，各种必要的功能改进以及性能提升 ● join 并行优化，支持 hash join ● 小表放到内存，等值 key 建立哈希表 ● 大表是用 goroutine 分批取值，匹配哈希表 ● 之后会支持 merge sort join 等常用算法 small table big table build hash table join worker join worker join worker hash table output Online

0 码力 | 23 页 | 496.41 KB | 5 月前
3
Greenplum上云与优化

张广舟（明虚）阿里云高级专家 Greenplum上云与优化 — ApsaraDB for Greenplum介绍 2016Postgres中国用户大会目录 content ApsaraDB for GP的定位 ApsaraDB for GP的内核优化未来的规划 2016Postgres中国用户大会 ApsaraDB for GP的定位 2016Postgres中国用户大会 2016Postgres中国用户大会 GP vs. RDS? Select count(*) from customer where status = valid group by city 列存与压缩原理举例 ….. ….. Name Id status city 列存块 ….. 列存块列存 ≈索引 + index only 2016Postgres中国用户大会 GP vs

0 码力 | 26 页 | 1.13 MB | 1 年前
3
PostgreSQL WAL日志解析与应用

Postgres Conference China 2016 中国用户大会 PostgreSQL WAL日志解析与应用王硕山东瀚高基础软件股份有限公司 2016Postgres中国用户大会 Postgres Conference China 2016 中国用户大会 CONTENTS Part 01 Part 02 Part 03 WAL 日志简介

0 码力 | 16 页 | 705.31 KB | 1 年前
3
Apache Cassandra static column 介绍与实战

Apache Cassandra static column 介绍与实战 Spark大数据博客 - https://www.iteblog.com Apache Cassandra static column 介绍与实战假设我们有这样的场景：我们想在 Cassandra 中使用一张表记录用户基本信息（比如 email、密码等）以及用户状态更新。我们知道，用户的基本信息一般很少会变动，但是状态会经常变化， KEY ("username") 1 / 5 Apache Cassandra static column 介绍与实战 Spark大数据博客 - https://www.iteblog.com ... ); InvalidRequest: Error from server: ... ); 2 / 5 Apache Cassandra static column 介绍与实战 Spark大数据博客 - https://www.iteblog.com InvalidRequest: Error from server: code=2200 [Invalid query]

0 码力 | 5 页 | 0 Bytes | 1 年前
3
Al原生数据库与RAG

Al原生数据库与RAG 张颖峰英飞流（上海）信息科技有限公司创始人目录 RAG技术实践 01 Infinity系统架构 02 RAG技术实践第一部分基于向量数据库的RAG解决方案文档文本块向量 VectorDB Embedding 向量相似度提问答案查询结果文本切分相关文本块提示词提示词模版对话机器人搜索推荐

0 码力 | 25 页 | 4.48 MB | 1 年前
3
πDataCS赋能工业软件创新与实践

reserved. OpenPie Confidential @2024 OpenPie. All rights reserved. OpenPie Confidential πDataCS 赋能⼯业软件创新与实践吴疆拓数派产品社区总监 CONTENTS @2024 OpenPie. All rights reserved. OpenPie Confidential 杭州拓数派科技发展有限公司使命：数据计算，只为新发现愿景：成为立⾜中国基础数据计算领域的全球顶级⾼科技创新机构价值观：以⼈为本、开放创新、拥抱变化、诚信正直拓数派中国总部与全球分支机构海外研发中⼼北京研发中⼼杭州总部上海全球品牌战略与⽣态发展中⼼⼴州研发中⼼ @2024 OpenPie. All rights reserved. OpenPie Confidential 国际顶级创始团队 2021 2022 当天即获得头部产业基⾦天使轮投资成为Day-1准独角兽 7月与中国⼈民⼤学成立实习基地，打造中国的云原⽣数据库世界级智⼒⾼地 11月 4月获得元⽲重元和东吴证券Pre-A轮投资标志着企业进⼊快速成长期拓数派正式成立成立杭州总部、北京研发中⼼、上海全球品牌战略与⽣态发展中⼼蓬勃发展的拓数派驱动数据计算时代的到来 9月成立加拿⼤研发中⼼

0 码力 | 36 页 | 4.25 MB | 1 年前
3
02 TiDB Operator 架构与实现付业成

0 码力 | 47 页 | 1.73 MB | 5 月前
3
TiDB: HBase分布式事务与SQL实现

TiDB: HBase分布式事务与SQL实现 About me ● TiDB & Codis founder ● Golang expert ● Distributed database developer ● Currentlly, CEO and co-founder of PingCAP liuqi@pingcap.com https://github.com/pingcap/tidb

0 码力 | 34 页 | 526.15 KB | 1 年前
3
Brin Index主Greenplum 7中的理论与实现

Confidential │ ©2021 VMware, Inc. 3 Confidential │ ©2021 VMware, Inc. Brin Index 在Greenplum 7中的理论与实践陈金豹，VMWare内核工程师 Confidential │ ©2021 VMware, Inc. 目录 Brin Index On Heap AppendOnly Table

0 码力 | 32 页 | 1.04 MB | 1 年前
3

共 129 条前往

页

分类

语言

格式

Greenplum 排序算法

TiDB 原理与实战

Greenplum上云与优化

PostgreSQL WAL日志解析与应用

Apache Cassandra static column 介绍与实战

Al原生数据库与RAG

πDataCS赋能工业软件创新与实践

02 TiDB Operator 架构与实现付业成

TiDB: HBase分布式事务与SQL实现

Brin Index主Greenplum 7中的理论与实现