溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

【數(shù)據(jù)結(jié)構(gòu)】找出N個(gè)數(shù)據(jù)中最大的前k個(gè)數(shù)據(jù)(利用堆排序)

發(fā)布時(shí)間:2020-06-26 07:03:25 來源:網(wǎng)絡(luò) 閱讀:2073 作者:韓靜靜 欄目:編程語言

我們舉例,假若從10000萬個(gè)數(shù)里選出前100個(gè)最大的數(shù)據(jù)。


首先我們先分析:既然要選出前100個(gè)最大的數(shù)據(jù),我們就建立一個(gè)大小為100的堆(建堆時(shí)就按找最大堆的規(guī)則建立,即每一個(gè)根節(jié)點(diǎn)都大于它的子女節(jié)點(diǎn)),然后再將后面的剩余數(shù)據(jù)若符合要求就插入堆中,不符合就直接丟棄該數(shù)據(jù)。


那我們現(xiàn)在考慮:確定是該選擇最大堆的數(shù)據(jù)結(jié)構(gòu)還是最小堆的數(shù)據(jù)結(jié)構(gòu)呢。


分析一下:

若選用最大堆的話,堆頂是堆的最大值,我們考慮既然要選出從10000萬個(gè)數(shù)里選出前100個(gè)最大的數(shù)據(jù),我們在建堆的時(shí)候,已經(jīng)考慮了最大堆的特性,那這樣的話最大的數(shù)據(jù)必然在它頂端。假若真不巧,我開始的前100個(gè)數(shù)據(jù)中已經(jīng)有這10000個(gè)數(shù)據(jù)中的最大值了,那對于我后面剩余的10000-100的元素再想入堆是不是入不進(jìn)去了!?。?strong>所以,選用最大堆從10000萬個(gè)數(shù)里選出前100個(gè)最大的數(shù)據(jù)只能找出一個(gè),而不是100個(gè)。


那如果選用最小堆的數(shù)據(jù)結(jié)構(gòu)來解決,最頂端是最小值,再次遇到比它大的值,就可以入堆,入堆后重新調(diào)整堆,將小的值pass掉。這樣我們就可以選出最大的前K個(gè)數(shù)據(jù)了。言外之意,假若我們要找出N個(gè)數(shù)據(jù)中最小的前k個(gè)數(shù)據(jù),就要用最大堆了。



代碼實(shí)現(xiàn)(對于最大堆最小堆的代碼,若有不明白的地方,大家可以查看我的博客http://10740184.blog.51cto.com/10730184/1767076):

#define _CRT_SECURE_NO_WARNINGS 1
#include<iostream>
using namespace std;

#include<assert.h>

void AdjustDown(int* a, int parent, int size)
{
    int child = 2 * parent + 1;
    while (child < size)
    {
        if (child + 1 < size && a[child] > a[child + 1])
        {
            child++;
        }
        if (a[parent]>a[child])
        {
            swap(a[parent], a[child]);
            parent = child;
            child = 2 * parent + 1;
        }
        else
        {
            break;
        }
    }
}


void Print(int* a, int size)
{
    cout << "前k個(gè)最大的數(shù)據(jù):" << endl;
    for (int i = 0; i < size; i++)
    {
        cout << a[i] << "  ";
    }
    cout << endl;
}


int* HeapSet(int*a,int N,int K)
{
    assert(a);
    assert(K > 0);
    int* arr = new int[K];
    //將前K個(gè)數(shù)據(jù)保存
    for (int i = 0; i < K; i++)
    {
        arr[i] = a[i];
    }

    //建堆
    for (int i = (K-2)/2; i >=0; i--)
    {
        AdjustDown(arr,i,K);
    } 

    //對剩余的N-K個(gè)元素比較大小
    for (int i = K; i < N; i++)
    {
        if (arr[0]<a[i])
        {
            arr[0] = a[i];
            AdjustDown(arr, 0, K);
        }
    }

    return arr;
    delete[] arr;
}


void Test()
{
    int arr[] = { 12, 2, 10, 4, 6, 8, 54, 67, 25, 178 };
    int k = 5;
    int* ret = HeapSet(arr, sizeof(arr) / sizeof(arr[0]), k);
    Print(ret, k); 
}


int main()
{
    Test();
    system("pause");
    return 0;
}


由此可以看出,時(shí)間復(fù)雜度為:K+(K-2)/2*lgn+(N-K)*lgn  -->  O(N)

空間復(fù)雜度為:K-->O(1)。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI