溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

【海量數(shù)據(jù)處理】N個(gè)數(shù)中找出最大的前K個(gè)數(shù)

發(fā)布時(shí)間:2020-09-26 21:09:35 來源:網(wǎng)絡(luò) 閱讀:1224 作者:威尼斯小艇 欄目:編程語言

N個(gè)數(shù)中找出最大的前K個(gè)數(shù),需要用小堆實(shí)現(xiàn)。

分析:由于小堆的堆頂存放堆中最小的數(shù)據(jù),可以通過與堆頂數(shù)據(jù)進(jìn)行比較,將大數(shù)據(jù)存放在堆中,注意在每次改變堆頂數(shù)據(jù)后,進(jìn)行調(diào)堆,使堆頂一直存放整個(gè)堆中最小元素。

void AdjustDown(int *a, size_t root, size_t size)//下調(diào)
{//小堆
	size_t parent = root;
	size_t child = parent * 2 + 1;
	while (child < size)
	{
		if (child + 1 < size && a[child] > a[child + 1])
		{
			++child;
		}
		if (a[parent] > a[child])
		{
			swap(a[parent], a[child]);
			parent = child;
			child = parent * 2 + 1;
		}
		else//注意不滿足交換條件時(shí)跳出本次循環(huán)
		{
			break;
		}
	}
void CreateRetPacket(vector<int>& moneys)//創(chuàng)建N個(gè)數(shù)
{
	srand((unsigned int)time(NULL));
	//srand(time(0));
	moneys.reserve(N);
	for (size_t i = 0; i<N; i++)
	{
		moneys.push_back(rand() % 1000);//產(chǎn)生N個(gè)隨機(jī)值
	}
	for (size_t i = K; i < N; ++i)
	{
		moneys[i] *= 100;
	}
}
void GetTopk(const vector<int>& moneys, int n, int k)//N個(gè)數(shù)中找最大的前k個(gè)數(shù)--小堆實(shí)現(xiàn)
{
	assert(n>k);
	int *TopkArray = new int[k];//通過前k個(gè)元素建立含有k個(gè)元素的堆
	for (size_t i = 0; i < k; i++)
	{
		TopkArray[i] = moneys[i];
	}
	for (int i = (k - 2) / 2; i >= 0; --i)//建小堆
	{
		AdjustDown(TopkArray, i, k);
	}
	//從第k個(gè)元素開始到第n個(gè)元素分別與堆頂元素進(jìn)行比較,較大數(shù)據(jù)入堆頂,再對整個(gè)堆進(jìn)行下調(diào),使堆頂存放最小元素(小堆)
	for (size_t i = k; i < n; ++i)
	{
		if (moneys[i]  > TopkArray[0])
		{
			TopkArray[0] = moneys[i];
			AdjustDown(TopkArray, 0, k);
		}
	}
	size_t count = 0;
	for (size_t i = 0; i < k; ++i)//打印k個(gè)最大數(shù)據(jù),即堆中所有元素
	{
		cout << TopkArray[i] << " ";
		++count;
		if (count % 10 == 0)
		{
			cout << endl;
		}
	}
	cout << endl;
	delete[] TopkArray;//注意釋放TopkArray所占的內(nèi)存
	TopkArray = NULL;
}

測試用例如下:

#include<iostream>
#include<assert.h>
#include<vector>//容器--類模板
#include<stdlib.h>//利用隨機(jī)值
#include<time.h>
using namespace std;

#define N 10000
#define K 100
void Test8()
{//N個(gè)里面找最大的前k個(gè)數(shù)
	vector<int> moneys;
	CreateRetPacket(moneys);
	GetTopk(moneys, N, K);
}

上述可實(shí)現(xiàn)下列題:

    春節(jié)期間,A公司的支付軟件某寶和T公司某信紅包大亂戰(zhàn)。春節(jié)后高峰以后,公司Leader要求后臺的攻城獅對后臺的海量數(shù)據(jù)進(jìn)行分析。先要求分析出各地區(qū)發(fā)紅包金額最多的前100用戶?,F(xiàn)在知道人數(shù)最多的s地區(qū)大約有1000w用戶。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI