回 帖 发 新 帖 刷新版面

主题:[原创]我所理解的堆排序算法

堆排序在最坏的情况下,其时间复杂度也能达到O(nlogn)。相对于快速排序来说,
这是它最大的优点,此外,堆排序仅需要一个记录大小供交换用的辅助存储空间。
      堆排序的数据结构是二叉堆,二叉堆的特点有两个,一个是它是一棵完全二叉树,另一个是它的根结点小于孩子结点,所以我们很容易找到它的最小结点----根结点;当然如果你想找到最大结点的话,那就要扫描所有的叶子结点,这是很费时间的,如果你想找的是最大结点的话,你最好把它弄成一个大顶堆,即一棵根结点大于孩子结点的完全二叉树。
      二叉堆通常用数组来实现,它舍弃下标0,从下标1开始置数,则很容易满足,对于数组中任意位置i上的元素,其左儿子的位置在2i上,右儿子的位置在2i+1上,双亲的位置则在i/2上。
      堆排序的算法之一是把数组构建成二叉堆----这只要增添一个长度为n+1的辅助空间,然后把原数组的元素依次插入到二叉堆即可。然后删除二叉堆的根,把它作为排序后的数组的第一个元素,然后使二叉堆的长度减1,并通过上移使得新得到的序列仍为二叉堆,再提取新二叉堆的第一个元素到新数组。依此类推,直到提取最后一个元素,新得到的数组就是排序后的数组。
template <class T>
void Insert(T a[], int len, T x)//把x插入到原长度为len的二叉堆,注意保证新二叉堆不越界
{
      int i;
      for (i=len; i/2>0 && a[i/2]>x; i/=2)
            a[i] = a[i/2];
      a[i] = x;
}

template <class T>
T DeleteMin(T a[], int len)//删除二叉堆的根,并通过上移使得新得到的序列仍为二叉堆
{
      if (len == 0)
            exit(1);
      T min = a[1];//二叉堆的根
      T last = a[len--];//二叉堆的最后一个元素

      int c;
      int i;
      for (i=1; i*2<=len; i=c)//把二叉堆的某些元素往前移,使得新得到的序列仍为二叉堆
      {
            c = i * 2;//i的左儿子
            if (c != len && a[c+1] < a[c])//若i有右儿子,且右儿子小于左儿子,c指向右儿子
                  c++;

            if (last > a[c])//若i的小儿子小于二叉堆的最后一个元素,把其移到i的位置
                  a[i] = a[c];
            else
                  break;
      }
      a[i] = last; //把二叉堆的最后一个元素放到适当的空位,此时得到的序列仍为二叉堆

      return min;
}

template <class T>
void HeapSort(T a[], int len)
{
      T *ca = new T[len+1]; //复制原数组到二叉堆
      ca[0] = 0;
      for (int i=0; i<len; i++) //把元素依次插入到二叉堆
            Insert(ca, i+1, a[i]);

      for (int i=0; i<len; i++)//依次提取二叉堆的根作为排序后的数组的元素
      {
            a[i] = DeleteMin(ca, len-i);
      }

      a[len-1] = ca[1]; //注意不能忘了最后一个元素

      delete []ca;
}
      在《数据结构习题与解析》(李春葆 编著 清华大学出版社)中看到一个类似的算法,
它是把原数组构建成一个大顶堆,然后把大顶堆的第一个元素与最后一个元素交换;
再把前n-1个元素重新构造成一个大顶堆,把新大顶堆的第一个元素与最后一个元素交换;
依此类推,直到新大顶堆只有一个元素,这样就得到了一个有序的二叉堆。
算法如下:
template <class T>
void HeapSort(T a[], int len)
{
      T *ca = new T[len+1];
      ca[0] = 0;
      for (int i=0; i<len; i++)
            ca[i+1] = a[i];

      for (int i=len/2; i>0; i--) //建立初始堆
            HeapAdjust(ca, len, i);

      for (int i=len; i>1; i--)//进行len-1次循环,完成堆排序
      {
            Swap(ca[1], ca[i]); //新大顶堆的第一个元素与最后一个元素交换
            HeapAdjust(ca, i-1, 1);//筛a[1]元素,得到i-1个元素的堆
      }

      for (int i=0; i<len; i++)
            a[i] = ca[i+1];

      delete []ca;
}

template <class T>
void HeapAdjust(T a[], int len, int left) //将i与其小儿子交换位置
{
      if (len == 0)
            exit(1);

      T x = a[left];
      int i = left;
      int c = 2 * i;
      while (c <= len)
      {
            if (c < len && a[c+1] > a[c])//若i有右儿子,且右儿子大于左儿子,c指向右儿子
                  c++;
            if (last < a[c])//若i的大儿子大于二叉堆的最后一个元素,把其移到i的位置
            {
                  a[i] = a[c];
                  i = c;
                  c = 2 * i;
            }
            else
                  break;
      }
      a[i] = x; //把原二叉堆的第一个元素放到适当的空位
}

template <class T>
void Swap(T & a, T & b)
{
      T t = a;
      a = b;
      b = t;
}

回复列表 (共8个回复)

沙发

还有一种方法是每次都要重新调整大顶堆,使得父亲比儿子大,这样调整的函数较简单,但因为每次都要遍历一半的元素,时间复杂度较大。
算法如下:
template <class T>
void HeapSort(T a[], int len)
{
      T *ca = new T[len+1];
      ca[0] = 0;
      for (int i=0; i<len; i++)
            ca[i+1] = a[i];

      for (int i=len/2; i>0; i--) //把原数组构建成一个大顶堆
            HeapAdjust(ca, len, i);
      Swap(ca[1], ca[len]); //把大顶堆的第一个元素与最后一个元素交换
      
      for (int i=len-1; i>0; i--)
      {
            for (int j=i/2; j>0; j--)//遍历长度为i的堆,得到新的大顶堆
                  HeapAdjust(ca, i, j);
            Swap(ca[1], ca[i]);
      }
      
      for (int i=0; i<len; i++)
            a[i] = ca[i+1];

      delete []ca;
}

template <class T>
void HeapAdjust(T a[], int len, int i) //将i与其小儿子交换位置
{
      int c = 2 * i;

      if (c < len)
      {
            T & max = (a[c] > a[c+1])? a[c] : a[c+1];
            if (a[i] < max)
                  Swap(a[i], max);
      }
      else
      {
            if (a[i] < a[c])
                  Swap(a[i], a[c]);
      }
}

template <class T>
void Swap(T & a, T & b)
{
      T t = a;
      a = b;
      b = t;
}

      模仿构造大顶堆的方法,我们可以调用HeapAdjust()构造一个二叉堆,并提取二叉堆的根到新数组,然后把原二叉堆的最后一个元素放到根的位置,再调用HeapAdjust()构造一个新二叉堆,依此类推。
算法如下:
template <class T>
void HeapSort(T a[], int len)
{
      T *ca = new T[len+1];
      ca[0] = 0;
      for (int i=0; i<len; i++)
            ca[i+1] = a[i];

      for (int i=len/2; i>0; i--) //把原数组构建成一个大顶堆
            HeapAdjust(ca, len, i);
      a[0] = ca[1];
      ca[1] = ca[len]; //把二叉堆的最后一个元素放到根的位置

      for (int i=len-1; i>0; i--)
      {
            for (int j=i/2; j>0; j--)
                  HeapAdjust(ca, i, j);
            a[len-i] = ca[1];
            ca[1] = ca[i]; //把二叉堆的最后一个元素放到根的位置
      }

      delete []ca;
}

template <class T>
void HeapAdjust(T a[], int len, int i)
{
      int c = 2 * i;

      if (c < len)
      {
            T & min = (a[c] < a[c+1])? a[c] : a[c+1];
            if (a[i] > min)
                  Swap(a[i], min);
      }
      else
      {
            if (a[i] > a[c])
                  Swap(a[i], a[c]);
      }
}

template <class T>
void Swap(T & a, T & b)
{
      T t = a;
      a = b;
      b = t;
}
      后面两种方法采用的是递归,容易理解,但时间复杂度较高,因为比前两种要慢上很多,所以不可能是O(nlogn),估计是O(n^2),但具体我也不会算,请高手指教。

板凳

楼主是做什么的?做学问很认真啊,看了你的BLOG,业余的?佩服~


我只知道第2个算法。

3 楼

确实是业余的啊
我大学读的是物理专业,以前对计算机没什么认识,近两年自己有电脑了才逐渐对她感兴趣.

4 楼

偑服!!!!

5 楼

不用n+1个辅助空间,只要对数组下标能够精确的确定孩子的位置,从0开始又何妨?

左孩子 = ( n + 1 ) * 2 - 1; 第一个+1是换成数组元素在堆中的编号,后一个-1是在从堆号换回数组下标。
整理得 lchild = n * 2 + 1 = ( n << 1 ) + 1;

附上我的HeapSort代码:

inline int GetLeftChild( int parent )
{
        return ( ( parent << 1 ) + 1 );
}

/* percolate A[start] to adjust A[ start ~ end ] to max heap */
/* before use it, make sure that A[start+1 ~ end] submit heap order */
void PercolateDown( int A[], int start, int end )
{
        int tmp = A[start];
        int hole = start;
        int child;

        while ( ( child = GetLeftChild( hole ) ) <= end )
        {
                if ( ( child != end ) && ( A[child] < A[child + 1] ) )
                {
                        ++child;
                }
                if ( A[child] > tmp )
                {
                        A[hole] = A[child];
                        hole = child; /* percalate the hole */
                }
                else
                {
                        break;
                }
        }
        A[hole] = tmp; /* fill the hole */
        return;
}

void HeapSort( int A[], int n )
{
        int tmp;
        int i;

        /* make A[] to a max heap */
        for ( i = ( n >> 1 ) - 1; i >= 0; --i )
        {
                PercolateDown( A, i, n-1 );
        }

        /* HeapSort */
        for ( i = n - 1; i > 0; --i )
        {
                /* Delete Max */
                tmp = A[0];
                A[0] = A[i];
                A[i] = tmp;

                /* adjust max heap */
                PercolateDown( A, 0, i-1 );
        }
}

6 楼

这里写出为什么建立堆要遍历前一半的元素

很简单,因为一棵完全二叉树最后一个非叶子节点是int( n/2 )

我们从满二叉树入手证明:
一棵深度为k的满二叉树节点 n = 2^k - 1 (等比数列求和)

那么这棵树的叶子数 leaves = 2^(k-1) = (n+1)/2
那么最后一个非叶子节点的编号就是 n - (n+1)/2 = (n-1)/2
不用怀疑,因为满二叉树必须有奇数个节点。

再来看完全二叉树:我们补上x个使之成为满二叉树
分情况讨论:
1.n为奇数
  则x为偶数,那么完全二叉树倒数第二层有 x/2 个叶子。所以我们要求的最后一个非叶子节点编号为: (n+x-1)/2 - x/2 = (n-1)/2
2.n为偶数
  则x为奇数,那么完全二叉树倒数第二层有 (x-1)/2 个叶子。所以我们要求的最后一个非叶子节点编号为: (n+x-1)/2 - (x-1)/2 = n/2

综合1和2,得出棵完全二叉树最后一个非叶子节点是int( n/2 )

所以,只要对前一半元素从后向前每个做一次Percolate Down,就能建立一个堆。

7 楼

很佩服[em12]

8 楼

偶给你提议一个算法,用混合排序实现快排。
三点取中作为枢轴,如果偏向一边就自动转化为堆排,当递归深度大于4转为堆排,当基本有序并且分割片段很短的时候转化为插入排序,其余情况是快排分割,这样速度平均比堆排快几倍,最坏情况下时间复杂度就是堆排序的时间复杂度

我来回复

您尚未登录,请登录后再回复。点此登录或注册