回 帖 发 新 帖 刷新版面

主题:[原创]各排序算法的实现,原理,及性能比较(Java)

完整的测试程序,请下载附件。

从大家熟悉的冒泡排序开始:

    /**
     * 冒泡排序 Bubble Sort 
     * <p>原理:
     * 比较n轮,每一轮都把最大元素移动到数组后端。
     * @return
     */
    public int[] bubbleSort(int[] result) {


        for (int i = 0; i < ARRAYSIZE; i ++) {
            for (int j = i + 1; j < ARRAYSIZE; j ++) {
                if (result[i] > result[j]) {
                    // 交换
                    swap(result, i, j);
                }

            }
        }

        return result;
    }

插入排序:

    /**
     * 插入排序 Insert Sort
     * <p>原理:
     * 从第二个元素开始,因为左侧的数组为排序后的数组,
     * 只要将当前元素插入到左侧数组的适当位置,就能保持数组为有序
     * 然后处理第三个元素...直到最后一个元素
     * @return
     */
    public int[] insertSort(int[] result) {
      
        for (int i = 1; i < ARRAYSIZE; i ++) {
            for (int j = i; j > 0 && result[j] < result[j - 1]; j --) {
                swap(result, j, j -1);

            }
        }

        return result;
    }

折半搜索插入排序:
    /**
     * 折半搜索插入排序 BinarySearchThenInsert Sort
     * <p>原理与插入排序类似,不同点在于寻找插入位置的时候,采取的是折半查找方法
     * @return
     */
    public int[] binsertSort(int[] result) {

        for (int i = 1; i < ARRAYSIZE; i ++) {
            if (result[i] < result[0]) {
                int temp = result[i];
                for (int j = i - 1; j >= 0; j --) {
                    result[j + 1] = result[j];

                }
                result[0] = temp;
    
            } else if (result[i] < result[i - 1]) {
                int larrange = 0;
                int rarrange = i - 1;
                while (rarrange - larrange > 1) {
                    int p = (rarrange + larrange + 1)/2;
                    if (result[i] < result[p]) {
                        rarrange = p;
                    } else {
                        larrange = p;
                    }

                }
                int temp = result[i];
                for (int j = i - 1; j >= larrange + 1; j --) {
                    result[j + 1] = result[j];

                }
                result[larrange + 1] = temp;
 
            }
        }

        return result;
    }

然后是堆排序:

    /**
     * 堆排序 Heap Sort
     * <p>原理:
     * 利用了堆的易调整的特点来进行的一种选择排序。
     * 以大顶堆为例,什么是大顶堆?
     * 大顶堆的逻辑结构是一颗完全二叉树,[把满二叉树最后一层右侧的一些叶子摘掉]
     * 假设其高度为h,则元素个数介于
     * 1 + 2 + ... + exp(2, h - 2) ~ 1 + 2 + ... + exp(2, h -1)之间
     * 符合如下定义为大顶堆:(此定义基于大顶堆的顺序存储结构)
     * for (int i = array.length - 1; i > 0; i --) {
     *         任意 array[i] <= array[(i - 1)/2];
     * }
     * (还有一种是小顶堆,不同的只是比较时候的大于号方向不同)。
     * 容易想到,当堆顶元素(MaxValue)被替换后,
     * 至多只要在双亲和子节点间进行h(大顶堆的高度) - 1次交换,
     * (参照交换算法可以发现比较次数一般来说是交换次数的2~3倍,也不算多)
     * 就可以形成新的大顶堆。由此大大提高了排序效率。
     * @return
     */
    public int[] heapSort(int[] result) {

        
        // 初始化无序数组为大顶堆
        for (int i = result.length - 2; i >= 0; i --) {
            adjustHeap(result, i, result.length - 1);
        }
        
        // 将最大值元素交换至数组末端,并调整前端为大顶堆,循环直至前端只剩下一个元素
        for (int i = result.length - 1; i > 0; i --) {
            swap(result, 0, i);
            adjustHeap(result, 0, i - 1);
        }

        return result;
    }
    
    /**
     * 将除顶(不确定是否满足大顶堆条件)外,左子树和右子树都为一个堆的数组调整为大顶堆
     * @param array 待调整数组
     * @param from  顶的指针
     * @param to    调整的末端(就是调整array[from]...array[to]这一段为一个大顶堆)
     */
    private void adjustHeap(int[] array, int from, int to) {
        int i = 0;
        // 比较节省比较次数的方法,只要比较到比其左右子树的根结点的值都大,就可以return了
        while (from + 2 * i + 2 <= to) {
            if (array[from + i] < array[from + 2 * i + 1]
                 || array[from + i] < array[from  + 2 * i + 2]) {
                if (array[from + 2 * i + 1] > array[from  + 2 * i + 2]) {
                    swap(array, from + i, from + 2 * i + 1);
                    i += i + 1;
                } else {
                    swap(array, from + i, from + 2 * i + 2);
                    i += i + 2;
                }

            } else {
                return;
            }
        }
        if (from + 2 * i + 1 == to
                && array[from + i] < array[from + 2 * i + 1]) {
            // 有时会出现仅存在左子树的情况(左子树为调整数组的最后一个元素)
            swap(array, from + i, from + 2 * i + 1);

        }
    }

快速排序:

        /**
     * 快速排序 Quick Sort
     * <p>原理:
     * 选择数组中的一个元素作为标准,将所有比标准小的元素放到左边,
     * 所有比标准大的元素放到右边。
     * 并对左边和右边的元素做一样的快速排序过程。
     * @return
     */
    public int[] quickSort(int[] result) {
          quick(result, 0, result.length - 1);
          return result;
    }
    
        /**
     * 选择数组中的一个元素作为标准,将所有比标准小的元素放到左边,
     * 所有比标准大的元素放到右边。
     * 并对左边和右边的元素做一样的快速排序过程。
     * @param array
     * @param startIndex
     * @param endIndex
     */
    private void quick(int[] array, int startIndex, int endIndex) {
        int pIndex = startIndex;
        for (int i = startIndex + 1; i <= endIndex; i ++) {
            if (array[i] < array[pIndex]) {
                int temp = array[i];
                for (int j = i; j > pIndex; j --) {
                    array[j] = array[j - 1];
                }
                array[pIndex] = temp;
                pIndex ++;
            }

        }
        if (pIndex - startIndex > 1) {
            quick(array, startIndex, pIndex - 1);
        }
        if (endIndex - pIndex > 1) {
            quick(array, pIndex + 1, endIndex);
        }
    }

回复列表 (共12个回复)

沙发

二路归并排序:

    /**
     * 归并排序 Merge Sort
     * <p>原理:
     * 分治。将数组分为左,右两部分,
     * 首先将数组分为左右两部分,分别进行归并排序,
     * 然后合并左右两部分的排序结果就构成了一个有序数组。
     * @return
     */
    public int[] mergeSort(int[] result) {

        mergeR(result, 0, result.length - 1);

        return result;
    }

 /**
     * 递归对数组进行归并排序
     * @param array
     * @param startIndex
     * @param endIndex
     */
    private void mergeR(int[] array, 
            int startIndex,
            int endIndex) {
        if (startIndex < endIndex) {
            int mid = (startIndex + endIndex)/2;
            // 对包括中点在内的左侧数组区间进行归并排序
            mergeR(array, startIndex, mid);
            // 对中点之后的右侧数组区间进行归并排序
            mergeR(array, mid + 1, endIndex);
            // 合并左和右两个独立的有序区间为一个有序区间
            merge(array, startIndex, mid, endIndex);
        }
    }


   /**
     * 将array数组的两个有序区间array[startIndex]...array[midIndex]
     * 和array[midIndex + 1]...array[endIndex]合并为一个有序区间
     * array[startIndex]...array[endIndex]
     * @param array
     * @param startIndex
     * @param midIndex
     * @param endIndex
     */
    private void merge(int[] array, 
            int startIndex,
            int midIndex,
            int endIndex) {
        int[] resultTemp = new int[endIndex - startIndex + 1];
        
        int pr = 0;
        int p1 = startIndex;
        int p2 = midIndex + 1;
        while (p1 <= midIndex || p2 <= endIndex) {
            if (p1 == midIndex + 1) {
                while (p2 <= endIndex) {
                    resultTemp[pr ++] = array[p2 ++];

                }
            } else if (p2 == endIndex + 1) {
                while (p1 <= midIndex) {
                    resultTemp[pr ++] = array[p1 ++];

                }
            } else if (array[p1] <= array[p2]) {
                resultTemp[pr ++] = array[p1 ++];

            } else {
                resultTemp[pr ++] = array[p2 ++];

            }
        }
        for (p1 = startIndex, p2 = 0; p1 <= endIndex; p1 ++, p2 ++) {
            array[p1] = resultTemp[p2];

        }
    }

希尔排序:
   
    /**
     * 希尔排序 Shell Sort
     * <p>原理:
     * 分别以数组大小的1/2,1/4,1/8....1的作为步伐d,
     * 将array[i],array[i + d],array[i + 2d]....array[i + nd]看作一个数组进行排序,
     * 与插入排序相比,因为可以更有效的消除逆序,因此交换次数是很少的,
     * 缺点是比较次数过多
     * @return
     */
    public int[] shellSort(int[] result) {
        
        for (int d = ARRAYSIZE/2; d > 0; d = d/2) {
            //print(result);
            for (int i = d; i < ARRAYSIZE; i ++) {
                for (int j = i; j >= d; j = j - d) {
                    if (result[j] < result[j - d]) {
                        swap(result, j, j - d);
                    }

                }
            }
        }
   
        return result;
    }

简单选择排序:

    /**
     * 简单选择排序 SimpleSelection Sort
     * <p>原理:每遍历未排序部分一次都选出一个最小值,并将最小值元素移动到数组前端
     * @return
     */
    public int[] simpleSelectionSort(int[] result) {

        // 重复此过程:选取最小值,并将其交换至数组前端
        int minIndex = 0;
        for (int i = 0; i < result.length; i ++) {
            minIndex = i;
            for (int j = i + 1; j < result.length; j ++) {
                if (result[j] < result[minIndex]) {
                    minIndex = j;
                }

            }
            swap(result, minIndex, i);
        }
   
        return result;
    }

以下是程序中有用到的工具函数:

    /**
     * 交换元素
     */
    private void swap(int[] arr, int i, int j) {
        int temp = arr[i];
        arr[i] = arr[j];
        arr[j] = temp;

    }

}

板凳

在数组大小为32000的时候,测试得到如下结果:
bubble ok, compare:511984000 move:369884430 time:7719ms
insert ok, compare:256844895 move:256844895 time:2891ms
binsert ok, compare:466378 move:256876884 time:1828ms
shell ok, compare:822653060 move:785643 time:6015ms
quick ok, compare:568480 move:257132432 time:1813ms
simple select ok, compare:511984000 move:32000 time:3141ms
merge ok, compare:220635 move:958464 time:15ms
heap ok, compare:1770388 move:1550523 time:31ms

时间性能上,Merge > Heap > Quick > BInsert > Insert > Simple Selection > Shell > Bubble

比较次数上,Shell > Bubble = SimpleSelection > Insert > Heap > Quick > BInsert > Merge

数组元素的交换次数上,Bubble > Quick > BInsert > Insert > Heap > Merge > Shell > SimpleSelection

内存的消耗上,Merge > Heap > Quick = BInsert = Insert = SimpleSelection = Shell = Bubble

因为只是根据一个特定序列得到的测试结果,所以不一定可以完全准确的反映各算法的性能。
但结合各算法的实现和统计结果,可以得出以下建议:
1. 大数据量的情况下,如果对时间效率有苛刻要求,应优先采用MergeSort。内存不足问题可利用分布式的计算环境来解决。
2. 在内存相对有限的情况下,采用堆排序和快速排序是不错的选择。
3. 如果在读写速度较慢的介质上操作,应该用简单选择排序。(这点我也不很确定,下次增加读写次数的统计来验证)
4. 待排序数据集的特性很大程度上影响到算法的效率,算法的采用应根据实际数据的情况来选择。

3 楼

呼呼,发个大贴不容易啊。哈,希望大家支持一下,都来顶顶~

4 楼

根据我的经验,应届毕业生笔试的时候基本上算法都是这些排序算法!

5 楼

顶,支持!

Java的确有点慢,如果C++实现的话,快速排序,堆排序,归并排序,希尔排序 用这么小的数据量(32000)都会小于1毫秒。

6 楼

怎么没有基数排序啊。。。不过,总体来讲,是个好帖。顶了。。。。

7 楼

谢谢4,5,6楼
基数是多关键字排序,与其他不方便比较,所以没有实现

8 楼

看了半天!
觉得楼主的第一个实际上是选择排序,不是冒泡排序!!
只是最后的那个选择排序实现的要好一些,避免了一些无谓的交换,多了一个minIndex,其实也可以不要的!
for (int i = 0; i < ARRAYSIZE; i ++) {
            for (int j = i + 1; j < ARRAYSIZE; j ++) {
                if (result[i] > result[j]) {
                    // 交换
                    swap(result, i, j);
变成了:
 for (int i = 0; i < result.length; i ++) {
            minIndex = i;
            for (int j = i + 1; j < result.length; j ++) {
                if (result[j] < result[minIndex]) {
                    minIndex = j;
                }

            }
            swap(result, minIndex, i);
冒泡排序:
for(i=1,flg=1;i<result.length&&flg;i++)
        for(j=0,j<result.length-i;j++){     {
                   flg=0;
                   if(result[i]>result[i+1]{
                          swap(result,i,i+1);
                          flg=1;
                   }  

               }
还望指点!!!

9 楼

for(i=1,flg=1;i<result.length&&flg;i++)
        for(j=0,j<result.length-i;j++){     
                   flg=0;
                   if(result[i]>result[i+1]{
                          swap(result,i,i+1);
                          flg=1;
                   }  

               }
多了一个括号!
呵呵!

10 楼

[quote]在数组大小为32000的时候,测试得到如下结果:
bubble ok, compare:511984000 move:369884430 time:7719ms
insert ok, compare:256844895 move:256844895 time:2891ms
binsert ok, compare:466378 move:256876884 time:1828ms
shell ok, compare:822653060 move:785643 time:6015ms
quick ok, compare:568480 move:257132432 time:1813ms
simple select ok, compare:511984000 move:32000 time:3141ms
merge ok, compare:220635 move:958464 time:15ms
heap ok, compare:1770388 move:1550523 time:31ms
[/quote]
1. 不知道楼主的的比较次数和移动次数是如何计算出来的?简单从数据规模来看就不可能。
32000^2=1024000000,而shell排序比较居然要花费822653060次,比简单插入排序还远远不如?

2.当n=32000时,nlog(n)约为480000,而你的快排移动次数居然达到了2.5亿次,难道你就没怀疑过自己数据的真实性?还有你的快排算法不知道从哪得来的,与我见过的快排算法差的老远啊。

从你的测试结果来看,快排简直就是垃圾嘛,叫快排还有意义?呵呵。

我来回复

您尚未登录,请登录后再回复。点此登录或注册