技术交流QQ群:1027579432,欢迎你的加入!

一.概述

  • 堆排序是简单选择排序的改进算法,简单选择排序在待排序的个数据中选择一个最小的元素需要进行n-1次的比较,但是并没有将每一次循环的结果保存下来,在下一次循环中,有很多比较已经在上一次的循环中做过了,但由于上一次循环时没有保存这些比较结果,所以下一次循环时又要重复这些比较操作,因此数据的比较次数较多。堆排序可以做到每次在选择最小记录的同时,根据比较结果对其他元素做出相应的调整。

二.大顶堆与小顶堆介绍

大顶堆.jpg

小顶堆.jpg
  • 从上面的两幅图可以看出,它们都是完全二叉树。下面给出堆的定义:
    • 大顶堆:每个结点的值都大于或等于其左右孩子结点的值,根结点的值一定是所有结点中最大的
    • 小顶堆:每个结点的值都小于或等于其左右孩子结点的值,根结点的值一定是所有结点中最小的
    • 按照层序遍历,给结点从1开始编号,则结点之间满足下面的关系,其中1<=i<=[n/2]:
      大顶堆中结点之间的关系.jpg
  • 按照层序遍历,将上图中的大顶堆存入数组中,小顶堆类似,如下图所示:
    大顶堆按层序遍历存入数组中.jpg

三.原理

  • 首先,将待排序的n个元素构造成一个大顶堆(小顶堆也可以,下面以大顶堆为例)。此时,这个序列的最大值就是大顶堆的根结点;然后,将大顶堆的根结点与堆数组中的最后一个元素进行交换,交换后,大顶堆的根结点存放的就是堆数组中的最后一个元素,大顶堆的根结点中存储的原始的最大值被移走啦;接着,将剩下的n-1个元素重新调整后,构造成一个新的大顶堆,重复上面的步骤,被移动的元素就构成了一个有序的数据。下面解决两个问题:(1)怎么将一个无序的数据构造成一个大顶堆?;(2)怎么将剩余的元素重新调整,构成一个新的大顶堆?

四.堆排序过程

构建大顶堆.jpg

重新调整.jpg

5.堆排序的完整代码

#include <iostream>

        using namespace std;

        #define N 9
        #define MAXSIZE 10
        #define OK 1
        #define ERROR 0
        #define TRUE 1
        #define FALSE 0

        typedef int Status;
        typedef struct{
            int r[MAXSIZE+1];
            int len;
        }Sqlist;

        void show(Sqlist L){
            for(int i = 1; i <= L.len; i++)
                cout << L.r[i] << " ";
            cout << endl;
        }

        void Swap(Sqlist *L, int i, int j){
            int temp = L->r[i];
            L->r[i] = L->r[j];
            L->r[j] = temp;
        }
        // 堆排序需要考虑的两个问题:
        /*
            1.如何将一个无序的序列构造成一个大/小顶堆
            2.在输出堆顶元素后,怎么调整剩余的元素,使剩余的元素成为一个新的大/小顶堆
        */
        // 堆调整函数
        // 已知L->r[s..m]中的记录的关键字除L->r[s]之外均满足堆的定义,需要调整的关键字是L->r[s],使L->r[s...m]成为一个大顶堆
        void HeapAdjust(Sqlist *L, int s, int m){
            int temp, j;
            temp = L->r[s];  // L->r[s]是不满足大顶堆条件的结点,需要进行调整
            for(j = 2*s; j <= m; j*=2){  // 循环遍历当前结点s的左右孩子j,因为是完全二叉树,所以左孩子的序号是2*s,右孩子的序号是2*s+1
                if(j < m && L->r[j] < L->r[j+1])  // L->r[j]是左孩子,L->r[j+1]是右孩子,j<m说明当前的孩子结点不是完全二叉树的最后一个结点
                    ++j;  // L->r[j] < L->r[j+1]说明左孩子小于右孩子,说明最大值在右孩子结点上
                if(temp >= L->r[j])  // 当前的结点s就是最大值,不需要调整,直接跳出循环
                    break;
                L->r[s] = L->r[j];  // 将当前结点s与左右孩子结点j进行交换,调整成大顶堆
                s = j;
            }
            L->r[s] = temp;
        }

        // 下面的程序是以大顶堆为例!!!
        // 堆排序函数
        void HeapSort(Sqlist *L){
            int i;
            // 构建一个大顶堆,时间复杂度是O(n)
            for(i = L->len / 2; i >0; i--)  // 将L中的r[i]构造成一个大顶堆,i从L->len / 2开始是因为它们都是有左右孩子的结点
                HeapAdjust(L, i, L->len);
            // 重建一个大顶堆,时间复杂度是O(nlogn)
            for(i = L->len; i > 1; i--){    // 逐步将每个最大值的根结点与完全二叉树中的末尾元素进行交换,并且再调整使其成为一个新的大顶堆
                Swap(L, 1, i);   // 将大顶堆根结点与完全二叉树中最后一个元素交换,移除旧的大顶堆的根结点,现在剩余结点总数是i-1
                HeapAdjust(L, 1, i-1);  // 将L->r[1...i-1]重新调整为大顶堆,需要调整的元素索引是大顶堆的根结点1和剩余结点总数i-1
            }
        }



        int main(){
            Sqlist L;
            int d[N] = {50, 10, 90, 30, 70, 40, 80, 60, 20};
            for(int i = 0; i < N; i++)
                L.r[i+1] = d[i];
            L.len = N;
            cout << "堆排序前: ";
            show(L);
            cout << "堆排序后: ";
            HeapSort(&L);
            show(L);
            return 0;
        }
  • STL实现
#include <iostream>
#include <vector>
#include <algorithm>


using namespace std;
// 堆排序:(最大堆,有序区)。从堆顶把堆顶元素弹出来放在有序区,再恢复堆。


// 打印元素
void PrintV(vector<int>& v){
    for(auto &e: v){
        cout << e << ' ';
    }
    cout << endl;
}

// 堆排序核心代码
void HeapSortCore(vector<int>& v, int start, int end){
    // 建立父节点和子节点指针
    int parent = start;
    int son = parent * 2 + 1;
    while(son <= end){  // 子节点在范围内才做比较
        if(son + 1 <= end && v[son] < v[son+1]){  // 先比较两个子节点大小,选择最大的
            son++;
        }

        if(v[parent] > v[son]){  // 如果父节点大于子节点,代表堆调整完毕,跳出循环
            return;
        }
        else{  // 否则,交换父子节点的内容,再继续子节点和孙节点比较
            swap(v[parent], v[son]);
            parent = son;
            son = parent * 2 + 1;
        }
    }
}


// 堆排序----外部调用接口
void HeapSort(vector<int>& v){
    // 初始化,i从最后一个父节点从下向上开始调整
    int n = v.size();
    for(int i = n/2 - 1; i>=0; --i){
        HeapSortCore(v, i, n-1);
    }
    // 先将第一个元素和已经排好序的元素前一位做交换,再重新调整堆
    for(int i=n-1; i > 0; --i){
        swap(v[0], v[i]);
        HeapSortCore(v, 0, i-1);
    }
}


int main(){
    vector<int> v{7, 30, 16, 4, 1, 2, 9};
    cout << "堆排序前: ";
    PrintV(v);
    HeapSort(v);
    cout << "堆排序后: ";
    PrintV(v);
    return 0;
}

六、堆排序时间复杂度总结:

  • 平均时间复杂度:O(nlogn)
  • 最好情况:O(nlogn)
  • 最坏情况:O(nlogn)
  • 空间复杂度:O(1)
  • 稳定性:不稳定