二叉堆（大优先）

1. Introduction

二叉堆是实现高效优先队列（PQ）抽象数据类型（ADT）的一种可能的数据结构。在PQ中，每个元素都有一个“优先级”，优先级较高的元素在优先级较低的元素之前被服务（平局可以简单地随意解决，或者按照普通队列的先进先出（FIFO）规则解决）。尝试点击 ExtractMax()，查看上面随机二叉堆提取最大值的示例动画。

为了集中讨论范围，这个可视化展示了一个允许重复的整数二叉最大堆。查看这个，了解如何轻松转换为二叉最小堆。通常，任何可以比较的其他对象都可以存储在二叉最大堆中，例如，浮点数的二叉最大堆等。

1-1. 定义

完全二叉树：二叉树中的每一层，除了可能的最后/最低层，都被完全填满，且最后一层的所有顶点尽可能地靠左。

二叉最大堆属性：每个顶点的父顶点（除了根）包含的值大于（或等于 —— 我们现在允许重复）该顶点的值。这比以下的替代定义更容易验证：一个顶点的值（除了叶子/叶子）必须大于（或等于）其一个（或两个）子节点的值。

1-2. 优先队 ADT（抽象数据类型）

优先队列 (PQ) 抽象数据类型 (ADT) 与普通队列 ADT 类似，但有以下两个主要操作：

Enqueue(x)：将新元素（键）x放入 PQ（按某种顺序），
y = Dequeue()：返回 PQ 中具有最高优先级（键）的现有元素 y，如果有并列，返回任意一个。

讨论：一些 PQ ADT 在 PQ 中最高优先级（键）并列的情况下，会恢复到普通队列的先进先出 (FIFO) 行为。保证在最高优先级（键）相等的情况下的稳定性是否使 PQ ADT 更难实现？

1-3. 等高键的稳定性

[This is a hidden slide]

1-4. 例子

想象一下：你是一名在机场控制塔T工作的空中交通管制员 (ATC)。你已经安排飞机X/Y分别在接下来的3/6分钟内降落。两架飞机的燃料都足够飞行至少接下来的15分钟，而且都离你的机场只有2分钟的路程。你观察到你的机场跑道目前是清晰的。

如果你不知道，飞机可以被指示在机场附近保持飞行模式，直到指定的降落时间。

1-5. NUS 课堂独享

你必须参加现场讲座才能弄清楚接下来会发生什么...

将向你提供两个选项，你需要做出决定：

如果你选择选项A，举手并挥手，
如果你选择选项B，举手但不挥手，

如果这两个选项都不合理，那就什么都不做。

1-6. 例子 - 继续上页

[This is a hidden slide]

1-7. 优先队例子

除了你刚才看到的关于ATC（仅在现场讲座中）的内容外，优先队列 ADT在现实生活中还有几种潜在的用途。

讨论：你能提出几个其他需要优先队列的现实生活情况吗？

1-8. 潜在答案

[This is a hidden slide]

1-9. 线性的数据结构来做优先队？

我们可以用数组（头尾相连数组）或者链表来构造优先队ADT（抽象数据结构）但是入列队和出列队会比较慢 O(N)

讨论：为什么？

1-10. 答案 - 第一部分

[This is a hidden slide]

1-11. 答案 - 第二部分

[This is a hidden slide]

2. 动画 + 最大堆特性复习

现在，让我们查看上面的（随机）二叉（最大）堆的可视化。你应该看到一个完全二叉树，除根节点外的所有顶点都满足最大堆属性（A[parent(i)] ≥ A[i]）。可能会出现重复的整数键。

你可以 Toggle the Visualization Mode 在直观的完全二叉树形式和基于紧凑数组实现的二叉（最大）堆之间切换。

Quiz: Based on this Binary (Max) Heap property, where will the largest integer be located?

2-1. 二叉堆的高度是 O(log N)

要记住的重要知识点：如果我们有一个含有N个元素的二叉堆，因为我们要把它储存成一个完整的二叉树，所以他的高度不会高过 O(log N)

简单分析：一个满的（不止是完整的）含有N个元素的二叉树的高度 h 总是 N = 2^(h+1)-1，所以 h = log₂(N+1)-1 ~= log₂ N。

看上面的例子 N = 7 = 2⁽²⁺¹⁾-1 或者 h = log₂(7+1)-1 = 2.

对于有关二叉堆的操作以上知识点很重要。

2-2. 以1为首元素的紧凑数组

完全二叉树可以作为紧凑数组A有效地存储，因为完全二叉树的顶点/紧凑数组的元素之间没有间隙。为了简化下面的导航操作，我们使用基于1的数组。VisuAlgo在每个顶点下方以红色标签显示每个顶点的索引。按照从1到N的排序顺序阅读这些索引，然后你会看到从上到下，从左到右的完全二叉树的顶点。为了帮助你理解这一点，Toggle the Visualization Mode几次。

这样，我们可以使用简单的索引操作（借助位移操作的帮助）实现基本的二叉树遍历操作：

parent(i) = i>>1，索引i除以2（整数除法），
left(i) = i<<1，索引i乘以2，
right(i) = (i<<1)+1，索引i乘以2并加1。

专业提示：尝试在两个浏览器窗口上打开两个VisuAlgo的副本。尝试在两种不同的模式下可视化同一个二叉最大堆，并进行比较。

3. 最大二叉堆操作

在这个可视化中，你可以执行几个二叉（最大）堆操作：

Create(A) - O(N log N) 版本（N 次调用下面的 Insert(v)）
Create(A) - O(N) 版本
Insert(v) 在 O(log N) 中 — 你可以插入重复项
3个版本的 ExtractMax()：
1. 一次，在 O(log N) 中
2. K 次，即 PartialSort()，在 O(K log N) 中，或者
3. N 次，即 HeapSort()，在 O(N log N) 中
UpdateKey(i, newv) 在 O(log N 中，如果 i 已知)
Delete(i) 在 O(log N 中，如果 i 已知)

还有一些其他可能的二叉（最大）堆操作，但是我们目前在某个NUS模块中出于教学原因并未详细说明。

3-1. 那些额外的操作是什么？

[This is a hidden slide]

4. Insert(v) //插入v

Insert(v): 当我们在往最大二叉堆插入元素 v 的时候我们只能插入到最后一个元素 N + 1 来维持一个紧凑的数组 = 完整二叉树特性。然而最大堆的特性仍然可能没被满足。这时我们从插入点往上去修复最大堆特性（如果需要的话）直到整个堆符合最大堆特性。现在点 Insert(v) 几次来插入几个随机的 v 进去现在显示的最大二叉堆。

这个向上走并且修复最大堆特性的操作没有公认的名字。我们叫它 ShiftUp （上移）但是还有人叫它 BubbleUp 或者 IncreaseKey 操作.

4-1. 为什么这样是正确的？

你明白为什么当你插入的新元素违反了最大堆的特性的时候从插入点（第N+1个元素）往上（最多上到根元素）走，把当前顶点和它的父顶点换位永远是正确的方法？

4-2. 答案

[This is a hidden slide]

4-3. 时间复杂度分析

Insert(v) 的时间复杂度是 O(log N)。

讨论：你理解这个推论吗？

4-4. 答案

[This is a hidden slide]

5. ExtractMax() //提取最大元素一次

ExtractMax(): 提取并删除最大二叉堆中的最大元素（根）的操作需要一个在堆中的元素来替换根，不然最大堆（一个完整的二叉树，在中文中的'林‘）会变成两个断开的子树（中文中两个'木’）。这同样也是这个元素必须是最后一个元素N的原因：维持紧凑数组 = 完整二叉树性质。

因为我们要把最大二叉堆中的一个叶顶点晋升成根顶点，它很可能是会违背最大堆特性。ExtractMax() 这时从根往下比较当前值和它的两个子元素的值（如果必要的话）来修复最大二叉堆特性。现在在当前显示的最大二叉堆中试试 ExtractMax()

这个向下走并修复最大堆特性的操作没有公认的名字。我们叫它 ShiftDown （下移）但是还有人叫它 BubbleDown 或者 Heapify 操作。.

5-1. 为什么和比较大的子项比较？

在向下运动修复最大堆特性的时候，为什么当一个顶点有两个子元素的时候，我们必须检查（甚至交换）它两个子元素中较大的那个？

为什么我们不能只比较左（或者右，如果存在的话）顶点？

5-2. 答案

[This is a hidden slide]

5-3. 时间复杂度分析

ExtractMax() 的时间复杂度是 O(log N)。

讨论：你理解这个推论吗？

5-4. 答案

[This is a hidden slide]

6. 用二叉堆来实现高效的优先队

到目前为止，我们有一个数据结构，可以有效地实现优先队列 (PQ) ADT的两个主要操作：

对于Enqueue(x)，我们可以在 O(log N) 时间内使用Insert(x)，和
对于y = Dequeue()，我们可以在 O(log N) 时间内使用y = ExtractMax()。

然而，我们可以用二叉堆做更多的操作。

7. Create(A) - 两种版本

Create(A): 用含有 N 个逗号分隔的数组 A 从一个空的最大二叉堆开始创建一个合法的最大二叉堆

有两种方法完成创建操作一个简单但是慢 -> O(N log N) 另一个用更复杂的技术但是快 -> O(N).

教你一招：在两个浏览器里面同时打开 VisuAlgo。用最差情况 '已排序例子' 去执行不同版本的 Create(A)，你会看到可怕的差距。

7-1. Create(A) - O(N log N)

Create(A) - O(N log N)：简单地插入（即，通过调用 Insert(v) 操作）输入数组中的所有 N 个整数到一个最初为空的二叉最大堆中。

分析：这个操作显然是 O(N log N)，因为我们调用 O(log N) Insert(v) 操作 N 次。让我们来看看 '排序示例'，这是这个操作的一个难点（现在试试 Hard Case - O(N log N)，我们展示了一个案例，其中 A = [1,2,3,4,5,6,7] -- 请耐心等待，因为这个示例需要一些时间来完成）。如果我们按递增顺序将值插入到一个最初为空的二叉最大堆中，那么每次插入都会触发一条从插入点（一个新的叶子）向上到根的路径。

7-2. Create(A) - O(N)

Create(A) - O(N)：这个更快的Create(A)操作版本是由Robert W. Floyd在1964年发明的。它利用了一个紧凑数组 = 完全二叉树和所有叶子（即，一半的顶点 - 见下一张幻灯片）默认为二叉最大堆的事实。然后，此操作仅从最后一个内部顶点回到根部修复二叉最大堆属性（如果需要）。

分析：一个松散的分析给出了另一个O(N/2 log N) = O(N log N)的复杂性，但实际上只是O(2*N) = O(N) - 在接下来的几张幻灯片中有详细信息。现在尝试在相同的输入数组A = [1,2,3,4,5,6,7]上使用 Hard Case - O(N)，并看到在与前一张幻灯片相同的困难情况下（但不是生成最大交换次数的情况 - 你自己尝试'对角线条目'测试用例），这个操作远优于O(N log N)版本。

7-3. 很多叶元素（叶顶点）

简单证明为什么在最大堆中（里面N个元素）一半的元素都是叶元素（为了概括性，我们假设N是偶数）：

假设最后一个叶元素的序号是 N, 那么它的父元素的序号是 i = N/2 (回忆这节课). 它的左子元素的序号是 i+1, 如果存在的话 (它其实并不存在), 将会是 2*(i+1) = 2*(N/2+1) = N+2, 这个结果超过了 N (最后一个叶元素) 所以 i+1 一定是一个没有子元素的叶元素。因为二叉堆的序号是连续的，所以序号s [i+1 = N/2+1, i+2 = N/2+2, ..., N], 或者说一半的顶点，都是叶元素。

7-4. 为什么是 O(N)? - 第一部分

首先，我们回忆含有N个元素的满二叉树的高度是log₂ N.

其次，要明白运行shiftDown(i)操作所需要的时间不是最高值O(log N), 而是 O(h)，h是在以顶点 i 为跟的从树的高度。

最后，在一个高度为 h 的满二叉树中有ceil(N/2^h+1)个顶点。

在上面这个满二叉树的例子中 N = 7， h = 2。 顶点数量为 ceil(7/2⁰⁺¹) = 4 分别是在h = 0 的 {44,35,26,17} 。在高度h = 1有ceil(7/2¹⁺¹) = 2 个顶点分别是: {62,53} 在高度h = 2 有 ceil(7/2²⁺¹) = 1 个顶点它是 {71}。

7-5. 为什么是 O(N)? - 第二部分

Create(A) 用 O(N) 的版本是这样：

如果以上公式太复杂的话，现代学生会想到用 WolframAlpha 来解决。

8. HeapSort() //堆排序

堆排序函数HeapSort()： John William Joseph Williams 在1964年发明了堆排序算法和这个二叉堆数据结构. 堆排序的操作（假定最大二叉堆已经在O(n)的时间复杂度内建立）非常简单。只需要调用提取堆顶函数ExtractMax() n次即可，每次的时间复杂度为O(log N). 现在你可以试一下屏幕上的这个最大二叉堆 HeapSort()

分析：堆排序显然是O(N log N) - 一个最优的通过比较来排序的算法

Quiz: In worst case scenario, HeapSort() is asymptotically faster than...

Bubble Sort
Merge Sort
Insertion Sort
Selection Sort

8-1. 讨论

尽管 HeapSort() 在最好/平均/最坏情况下的时间复杂度都是 θ(N log N) ，它真的是最好的用比较元素的方法来实现的排序算法吗？

讨论点：HeapSort()的缓存性能如何？

8-2. 答案

[This is a hidden slide]

8-3. PartialSort()

实际上，如果我们只对二叉（最大）堆中的前K个最大元素感兴趣，我们只需调用O(log N)的ExtractMax()操作K次。现在尝试在当前显示的二叉（最大）堆上执行PartialSort()。这个操作被称为PartialSort()。

简单分析：PartialSort()显然以O(K log N)运行 - 这是一个输出敏感的算法，其中时间复杂度取决于输出大小K。

9. 一些额外内容

现在你已经到了最大二叉堆基础知识这章的结尾，我们希望你可以在探索模式中探索更多。

然而我们还有一些更有趣的最大二叉堆的挑战，这些在这章节列出。

当你全部学会了的时候，我们邀请你学习更高级的算法，它们用优先队做底层数据结构（之一），例如 Prim's MST algorithm, Dijkstra's SSSP algorithm, A* 搜索算法(还不在 VisuAlgo里), 一些贪婪算法，等等.

9-1. 简单的最大堆 -> 最小堆转换

如果我们只处理数字（包括这个只接受整数的动画），转换最大二叉堆变为最小二叉堆很容易不需要改任何东西，反之亦然。

我们可以取每一个元素的相反数去重新构造一个二叉堆。如果最开始我们用的是最大二叉堆，那么结果就是最小二叉堆（忽视负号，见上图），反之亦然。

9-2. UpdateKey(i, newv)

对于一些优先队列的应用场景，我们需要修改（增加或降低）一个已经在（最大）二叉堆里的值的优先度。如果我们知道此值的序号i，我们可以利用以下简单的策略：更新A[i] = newv，然后shiftUp(i)和shiftDown(i)，只有一个恢复最大堆的动作会成功 - 如果newv > / < A[parent(i)]/A[i更大的子值] shiftUp(i)/shiftDown(i)会被触发。

所以，UpdateKey(i, newv)可以在O(log N)内完成，如果我们已知序号i。

9-3. Delete(i)

对于一些优先队列的应用场景，我们需要修改（增加或降低）一个已经在（最大）二叉堆里的值的优先度。如果我们知道此值的序号i，我们可以利用以下简单的策略：更新A[i] = A[1]+1（一个比当前根更大的值）。然后shiftUp(i)（实际上是UpdateKey(i, A[1]+1)。这样会使序号i变成新的根，然后我们可以ExtractMax()一次来删除它。

所以，Delete(i)可以在O(log N)内完成，前提是我们已知序号i。

讨论：对于UpdateKey(i, newv)和Delete(i)，如果我们只有oldv，必须搜索它在最大二叉树中的的位置，会怎样？可以比O(N)更快吗？

9-4. 答案

[This is a hidden slide]

9-5. 源代码

如果你正在寻找二叉（最大）堆的实现来实际模拟优先队列，那么有个好消息。

C++ 和 Java 已经有内置的优先队列实现，很可能使用了这种数据结构。它们是 C++ STL priority_queue（默认是最大优先队列）和 Java PriorityQueue（默认是最小优先队列）。然而，内置的实现可能不适合有效地执行一些 PQ 扩展操作（在某个 NUS 课程中出于教学原因省略了详细信息）。

Python 的 heapq 存在，但其性能相当慢。OCaml 没有内置的优先队列，但我们可以使用将在 VisuAlgo 的其他模块中提到的其他东西（省略详细信息的原因与上述相同）。

附言：堆排序可能用于 C++ STL 算法 partial_sort。

然而，这是我们的 BinaryHeapDemo.cpp | py | java 的实现。

9-6. 在线测试

如果你想了解更多关于这个数据结构的有趣问题，你可以去这里做一些训练和测试二叉堆（不需要登录）。

NUS学生请登录并且通过这个单元的考试，相应的成就会被记录在你的账户里.

9-7. 在线评审练习

我们还有一些编程问题可以用到二叉堆数据结构UVa 01203 - Argus 和 Kattis - numbertree.

试着解决它们来提高你对这个数据结构的理解。你可以用C++ STL priority_queue, Python heapq或者JAVA PriorityQueue 如果它们可以简化你的解法

9-8. 讨论

[This is a hidden slide]

9-9. 令人震惊的东西

在漫长的最大二叉堆的课程之后，惊悚时刻到了...

最大二叉堆有可能不是实现优先队列最好的数据结构...

思考：所以用什么更好？

9-10. 答案

[This is a hidden slide]

二叉堆（大优先）

1. Introduction

1-1. 定义

1-2. 优先队 ADT（抽象数据类型）

1-3. 等高键的稳定性

1-4. 例子

1-5. NUS 课堂独享

1-6. 例子 - 继续上页

1-7. 优先队例子

1-8. 潜在答案

1-9. 线性的数据结构来做优先队？

1-10. 答案 - 第一部分

1-11. 答案 - 第二部分

2. 动画 + 最大堆特性复习

2-1. 二叉堆的高度是 O(log N)

2-2. 以1为首元素的紧凑数组

3. 最大二叉堆操作

3-1. 那些额外的操作是什么？

4. Insert(v) //插入v

4-1. 为什么这样是正确的？

4-2. 答案

4-3. 时间复杂度分析

4-4. 答案

5. ExtractMax() //提取最大元素一次

5-1. 为什么和比较大的子项比较？

5-2. 答案

5-3. 时间复杂度分析

5-4. 答案

6. 用二叉堆来实现高效的优先队

7. Create(A) - 两种版本

7-1. Create(A) - O(N log N)

7-2. Create(A) - O(N)

7-3. 很多叶元素（叶顶点）

7-4. 为什么是 O(N)? - 第一部分

7-5. 为什么是 O(N)? - 第二部分

8. HeapSort() //堆排序

8-1. 讨论

8-2. 答案

8-3. PartialSort()

9. 一些额外内容

9-1. 简单的最大堆 -> 最小堆 转换

9-2. UpdateKey(i, newv)

9-3. Delete(i)

9-4. 答案

9-5. 源代码

9-6. 在线测试

9-7. 在线评审练习

9-8. 讨论

9-9. 令人震惊的东西

9-10. 答案

9-1. 简单的最大堆 -> 最小堆转换