堆排序算法实现思想个人理解

技术交流QQ群:1027579432，欢迎你的加入！

一.概述

堆排序是简单选择排序的改进算法，简单选择排序在待排序的个数据中选择一个最小的元素需要进行n-1次的比较，但是并没有将每一次循环的结果保存下来，在下一次循环中，有很多比较已经在上一次的循环中做过了，但由于上一次循环时没有保存这些比较结果，所以下一次循环时又要重复这些比较操作，因此数据的比较次数较多。堆排序可以做到每次在选择最小记录的同时，根据比较结果对其他元素做出相应的调整。

二.大顶堆与小顶堆介绍

大顶堆.jpg

小顶堆.jpg

从上面的两幅图可以看出，它们都是完全二叉树。下面给出堆的定义：
- 大顶堆：每个结点的值都大于或等于其左右孩子结点的值，根结点的值一定是所有结点中最大的
- 小顶堆：每个结点的值都小于或等于其左右孩子结点的值，根结点的值一定是所有结点中最小的
- 按照层序遍历，给结点从1开始编号，则结点之间满足下面的关系,其中1<=i<=[n/2]:
  
  大顶堆中结点之间的关系.jpg
按照层序遍历，将上图中的大顶堆存入数组中，小顶堆类似，如下图所示:

大顶堆按层序遍历存入数组中.jpg

三.原理

首先，将待排序的n个元素构造成一个大顶堆(小顶堆也可以，下面以大顶堆为例)。此时，这个序列的最大值就是大顶堆的根结点；然后，将大顶堆的根结点与堆数组中的最后一个元素进行交换，交换后，大顶堆的根结点存放的就是堆数组中的最后一个元素，大顶堆的根结点中存储的原始的最大值被移走啦；接着，将剩下的n-1个元素重新调整后，构造成一个新的大顶堆，重复上面的步骤，被移动的元素就构成了一个有序的数据。下面解决两个问题:(1)怎么将一个无序的数据构造成一个大顶堆?;(2)怎么将剩余的元素重新调整，构成一个新的大顶堆?

四.堆排序过程

构建大顶堆.jpg

重新调整.jpg

5.堆排序的完整代码

#include <iostream>

        using namespace std;

        #define N 9
        #define MAXSIZE 10
        #define OK 1
        #define ERROR 0
        #define TRUE 1
        #define FALSE 0

        typedef int Status;
        typedef struct{
            int r[MAXSIZE+1];
            int len;
        }Sqlist;

        void show(Sqlist L){
            for(int i = 1; i <= L.len; i++)
                cout << L.r[i] << " ";
            cout << endl;
        }

        void Swap(Sqlist *L, int i, int j){
            int temp = L->r[i];
            L->r[i] = L->r[j];
            L->r[j] = temp;
        }
        // 堆排序需要考虑的两个问题：
        /*
            1.如何将一个无序的序列构造成一个大/小顶堆
            2.在输出堆顶元素后，怎么调整剩余的元素，使剩余的元素成为一个新的大/小顶堆
        */
        // 堆调整函数
        // 已知L->r[s..m]中的记录的关键字除L->r[s]之外均满足堆的定义，需要调整的关键字是L->r[s],使L->r[s...m]成为一个大顶堆
        void HeapAdjust(Sqlist *L, int s, int m){
            int temp, j;
            temp = L->r[s];  // L->r[s]是不满足大顶堆条件的结点，需要进行调整
            for(j = 2*s; j <= m; j*=2){  // 循环遍历当前结点s的左右孩子j，因为是完全二叉树，所以左孩子的序号是2*s，右孩子的序号是2*s+1
                if(j < m && L->r[j] < L->r[j+1])  // L->r[j]是左孩子,L->r[j+1]是右孩子,j<m说明当前的孩子结点不是完全二叉树的最后一个结点
                    ++j;  // L->r[j] < L->r[j+1]说明左孩子小于右孩子,说明最大值在右孩子结点上
                if(temp >= L->r[j])  // 当前的结点s就是最大值，不需要调整，直接跳出循环
                    break;
                L->r[s] = L->r[j];  // 将当前结点s与左右孩子结点j进行交换，调整成大顶堆
                s = j;
            }
            L->r[s] = temp;
        }

        // 下面的程序是以大顶堆为例！！！
        // 堆排序函数
        void HeapSort(Sqlist *L){
            int i;
            // 构建一个大顶堆,时间复杂度是O(n)
            for(i = L->len / 2; i >0; i--)  // 将L中的r[i]构造成一个大顶堆，i从L->len / 2开始是因为它们都是有左右孩子的结点
                HeapAdjust(L, i, L->len);
            // 重建一个大顶堆，时间复杂度是O(nlogn)
            for(i = L->len; i > 1; i--){    // 逐步将每个最大值的根结点与完全二叉树中的末尾元素进行交换，并且再调整使其成为一个新的大顶堆
                Swap(L, 1, i);   // 将大顶堆根结点与完全二叉树中最后一个元素交换，移除旧的大顶堆的根结点，现在剩余结点总数是i-1
                HeapAdjust(L, 1, i-1);  // 将L->r[1...i-1]重新调整为大顶堆，需要调整的元素索引是大顶堆的根结点1和剩余结点总数i-1
            }
        }



        int main(){
            Sqlist L;
            int d[N] = {50, 10, 90, 30, 70, 40, 80, 60, 20};
            for(int i = 0; i < N; i++)
                L.r[i+1] = d[i];
            L.len = N;
            cout << "堆排序前: ";
            show(L);
            cout << "堆排序后: ";
            HeapSort(&L);
            show(L);
            return 0;
        }

STL实现

#include <iostream>
#include <vector>
#include <algorithm>


using namespace std;
// 堆排序：（最大堆，有序区）。从堆顶把堆顶元素弹出来放在有序区，再恢复堆。


// 打印元素
void PrintV(vector<int>& v){
    for(auto &e: v){
        cout << e << ' ';
    }
    cout << endl;
}

// 堆排序核心代码
void HeapSortCore(vector<int>& v, int start, int end){
    // 建立父节点和子节点指针
    int parent = start;
    int son = parent * 2 + 1;
    while(son <= end){  // 子节点在范围内才做比较
        if(son + 1 <= end && v[son] < v[son+1]){  // 先比较两个子节点大小，选择最大的
            son++;
        }

        if(v[parent] > v[son]){  // 如果父节点大于子节点，代表堆调整完毕，跳出循环
            return;
        }
        else{  // 否则，交换父子节点的内容，再继续子节点和孙节点比较
            swap(v[parent], v[son]);
            parent = son;
            son = parent * 2 + 1;
        }
    }
}


// 堆排序----外部调用接口
void HeapSort(vector<int>& v){
    // 初始化，i从最后一个父节点从下向上开始调整
    int n = v.size();
    for(int i = n/2 - 1; i>=0; --i){
        HeapSortCore(v, i, n-1);
    }
    // 先将第一个元素和已经排好序的元素前一位做交换，再重新调整堆
    for(int i=n-1; i > 0; --i){
        swap(v[0], v[i]);
        HeapSortCore(v, 0, i-1);
    }
}


int main(){
    vector<int> v{7, 30, 16, 4, 1, 2, 9};
    cout << "堆排序前: ";
    PrintV(v);
    HeapSort(v);
    cout << "堆排序后: ";
    PrintV(v);
    return 0;
}

六、堆排序时间复杂度总结：

平均时间复杂度：O(nlogn)
最好情况：O(nlogn)
最坏情况：O(nlogn)
空间复杂度：O(1)
稳定性：不稳定