溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

C++實(shí)現(xiàn)LeetCode之前K個(gè)高頻詞的示例分析

發(fā)布時(shí)間:2021-08-10 09:06:30 來(lái)源:億速云 閱讀:107 作者:小新 欄目:開(kāi)發(fā)技術(shù)

這篇文章主要介紹了C++實(shí)現(xiàn)LeetCode之前K個(gè)高頻詞的示例分析,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

[LeetCode] 692.Top K Frequent Words 前K個(gè)高頻詞

Given a non-empty list of words, return the k most frequent elements.

Your answer should be sorted by frequency from highest to lowest. If two words have the same frequency, then the word with the lower alphabetical order comes first.

Example 1:

Input: ["i", "love", "leetcode", "i", "love", "coding"], k = 2
Output: ["i", "love"]
Explanation: "i" and "love" are the two most frequent words.
Note that "i" comes before "love" due to a lower alphabetical order.

Example 2:

Input: ["the", "day", "is", "sunny", "the", "the", "the", "sunny", "is", "is"], k = 4
Output: ["the", "is", "sunny", "day"]
Explanation: "the", "is", "sunny" and "day" are the four most frequent words,
with the number of occurrence being 4, 3, 2 and 1 respectively.

Note:

  1. You may assume k is always valid, 1 ≤ k ≤ number of unique elements.

  2. Input words contain only lowercase letters.

Follow up:

  1. Try to solve it in O(n log k) time and O(n) extra space.

  2. Can you solve it in O(n) time with only O(k) extra space?

這道題讓我們求前K個(gè)高頻詞,跟之前那道題 Top K Frequent Elements 極其類(lèi)似,換了個(gè)數(shù)據(jù)類(lèi)型就又是一道新題。唯一的不同就是之前那道題對(duì)于出現(xiàn)頻率相同的數(shù)字,沒(méi)有順序要求。而這道題對(duì)于出現(xiàn)頻率相同的單詞,需要按照字母順序來(lái)排。但是解法都一樣,還是用最小堆和桶排序的方法。首先來(lái)看最小堆的方法,思路是先建立每個(gè)單詞和其出現(xiàn)次數(shù)之間的映射,然后把單詞和頻率的pair放進(jìn)最小堆,如果沒(méi)有相同頻率的單詞排序要求,我們完全可以讓頻率當(dāng)作pair的第一項(xiàng),這樣priority_queue默認(rèn)是以pair的第一項(xiàng)為key進(jìn)行從大到小的排序,而當(dāng)?shù)谝豁?xiàng)相等時(shí),又會(huì)以第二項(xiàng)由大到小進(jìn)行排序,這樣第一項(xiàng)的排序方式就與題目要求的相同頻率的單詞要按字母順序排列不相符,當(dāng)然我們可以在存入結(jié)果res時(shí)對(duì)相同頻率的詞進(jìn)行重新排序處理,也可以對(duì)priority_queue的排序機(jī)制進(jìn)行自定義,這里我們采用第二種方法,我們自定義排序機(jī)制,我們讓a.second > b.second,讓小頻率的詞在第一位,然后當(dāng)a.second == b.second時(shí),我們讓a.first < b.first,這是讓字母順序大的排在前面(這里博主需要強(qiáng)調(diào)一點(diǎn)的是,priority_queue的排序機(jī)制的寫(xiě)法和vector的sort的排序機(jī)制的寫(xiě)法正好順序相反,同樣的寫(xiě)法,用在sort里面就是頻率小的在前面,不信的話(huà)可以自己試一下)。定義好最小堆后,我們首先統(tǒng)計(jì)單詞的出現(xiàn)頻率,然后組成pair排序最小堆之中,我們只保存k個(gè)pair,超過(guò)了就把隊(duì)首的pair移除隊(duì)列,最后我們把單詞放入結(jié)果res中即可,參見(jiàn)代碼如下:

解法一:

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) {
        vector<string> res(k);
        unordered_map<string, int> freq;
        auto cmp = [](pair<string, int>& a, pair<string, int>& b) {
            return a.second > b.second || (a.second == b.second && a.first < b.first);
        };
        priority_queue<pair<string, int>, vector<pair<string, int>>, decltype(cmp) > q(cmp);
        for (auto word : words) ++freq[word];
        for (auto f : freq) {
            q.push(f);
            if (q.size() > k) q.pop();
        }
        for (int i = res.size() - 1; i >= 0; --i) {
            res[i] = q.top().first; q.pop();
        }
        return res;
    }
};

下面這種解法還是一種堆排序的思路,這里我們用map,來(lái)建立次數(shù)和出現(xiàn)該次數(shù)所有單詞的集合set之間的映射,這里也利用了set能自動(dòng)排序的特性,當(dāng)然我們還是需要首先建立每個(gè)單詞和其出現(xiàn)次數(shù)的映射,然后將其組成pair放入map種,map是從小到大排序的,這樣我們從最后面取pair,就是次數(shù)最大的,每次取出一層中所有的單詞,如果此時(shí)的k大于該層的單詞個(gè)數(shù),就將整層的單詞加入結(jié)果res中,否則就取前K個(gè)就行了,取完要更更新K值,如果K小于等于0了,就break掉,返回結(jié)果res即可,參見(jiàn)代碼如下:

解法二:

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) {
        vector<string> res;
        unordered_map<string, int> freq;
        map<int, set<string>> m;
        for (string word : words) ++freq[word];
        for (auto a : freq) {
            m[a.second].insert(a.first);
        }
        for (auto it = m.rbegin(); it != m.rend(); ++it) {
            if (k <= 0) break;
            auto t = it->second;
            vector<string> v(t.begin(), t.end());
            if (k >= t.size()) {
                res.insert(res.end(), v.begin(), v.end());
            } else {
                res.insert(res.end(), v.begin(), v.begin() + k);
            }
            k -= t.size();
        }
        return res;
    }
};

下面這種解法是一種桶排序的思路,我們根據(jù)出現(xiàn)次數(shù)建立多個(gè)bucket,桶的個(gè)數(shù)不會(huì)超過(guò)單詞的個(gè)數(shù),在每個(gè)桶中,我們對(duì)單詞按字符順序進(jìn)行排序。我們可以用個(gè)數(shù)組來(lái)表示桶,每一層中放一個(gè)集合,利用set的自動(dòng)排序的功能,使其能按字母順序排列。我們還是需要首先建立每個(gè)單詞和其出現(xiàn)次數(shù)的映射,然后將其組成pair放入map種,map是從小到大排序的,這樣我們倒序遍歷所有的桶,這樣取pair,就是次數(shù)最大的,每次取出一層中所有的單詞,如果此時(shí)的k大于該層的單詞個(gè)數(shù),就將整層的單詞加入結(jié)果res中,否則就取前K個(gè)就行了,取完要更更新K值,如果K小于等于0了,就break掉,返回結(jié)果res即可,參見(jiàn)代碼如下:

解法三:

class Solution {
public:
    vector<string> topKFrequent(vector<string>& words, int k) {
        vector<string> res;
        unordered_map<string, int> freq;
        vector<set<string>> v(words.size() + 1, set<string>());
        for (string word : words) ++freq[word];
        for (auto a : freq) {
            v[a.second].insert(a.first);
        }
        for (int i = v.size() - 1; i >= 0; --i) {
            if (k <= 0) break;
            vector<string> t(v[i].begin(), v[i].end());
            if (k >= t.size()) {
                res.insert(res.end(), t.begin(), t.end());
            } else {
                res.insert(res.end(), t.begin(), t.begin() + k);
            }
            k -= t.size();
        }
        return res;
    }
};

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“C++實(shí)現(xiàn)LeetCode之前K個(gè)高頻詞的示例分析”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來(lái)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI