<thead id="vxxbr"><ruby id="vxxbr"><object id="vxxbr"></object></ruby></thead>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點(diǎn)擊重新獲取二維碼

服務(wù)器哈希沖突怎么解決

發(fā)布時間：2022-01-04 15:53:29 來源：億速云閱讀：135 作者：iii 欄目：服務(wù)器

本篇內(nèi)容主要講解“服務(wù)器哈希沖突怎么解決”，感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷，實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“服務(wù)器哈希沖突怎么解決”吧!

一、哈希表概述

哈希表的哈希函數(shù)輸入一個鍵，并向返回一個哈希表的索引?？赡艿逆I的集合很大，但是哈希函數(shù)值的集合只是表的大小。

哈希函數(shù)的其他用途包括密碼系統(tǒng)、消息摘要系統(tǒng)、數(shù)字簽名系統(tǒng)，為了使這些應(yīng)用程序按預(yù)期工作，沖突的概率必須非常低，因此需要一個具有非常大的可能值集合的散列函數(shù)。

密碼系統(tǒng):給定用戶密碼，操作系統(tǒng)計算其散列，并將其與存儲在文件中的該用戶的散列進(jìn)行比較。(不要讓密碼很容易被猜出散列到相同的值)。

消息摘要系統(tǒng):給定重要消息，計算其散列，并將其與消息本身分開發(fā)布。希望檢查消息有效性的讀者也可以使用相同的算法計算其散列，并與發(fā)布的散列進(jìn)行比較。(不要希望偽造消息很容易，仍然得到相同的散列)。

這些應(yīng)用的流行哈希函數(shù)算法有:

md5 : 2^128個值（找一個沖突鍵，需要哈希大約2 ^ 64個值）
sha-1：2^160個值（找一個沖突鍵，需要大約2^80個值）

二、哈希沖突

來看一個簡單的實(shí)例吧，假設(shè)采用hash函數(shù)：H(K) = K mod M，插入這些值：217、701、19、30、145

H(K) = 217 % 7 = 0
H(K) = 701 % 7 = 1
H(K) = 19 % 7 = 2
H(K) = 30 % 7 = 2
H(K) = 145 % 7 = 5

服務(wù)器哈希沖突怎么解決

上面實(shí)例很明顯 19 和 30 就發(fā)生沖突了。

三、沖突解決策略

除非您要進(jìn)行“完美的散列”，否則必須具有沖突解決策略，才能處理表中的沖突。
同時，該策略必須允許查找，插入和刪除正確運(yùn)行的操作！

沖突解決技術(shù)可以分為兩類：開散列方法( open hashing，也稱為拉鏈法，separate chaining )和閉散列方法( closed hashing，也稱為開地址方法，open addressing )。這兩種方法的不同之處在于：開散列法把發(fā)生沖突的關(guān)鍵碼存儲在散列表主表之外，而閉散列法把發(fā)生沖突的關(guān)鍵碼存儲在表中另一個槽內(nèi)。

下面介紹業(yè)內(nèi)比較流行的hash沖突解決策略：

線性探測(Linear probing)
雙重哈希(Double hashing)
隨機(jī)散列(Random hashing)
分離鏈接(Separate chaining)

上面線性探測、雙重哈希、隨機(jī)散列都是閉散列法，而分離鏈接則是開散列法。

1、線性探測(Linear probing)

插入一個值

使用散列函數(shù)H（K）在大小為M的表中插入密鑰K時：

設(shè)置 indx = H（K）
如果表位置indx已經(jīng)包含密鑰，則無需插入它。Over
否則，如果表位置indx為空，則在其中插入鍵。Over
其他碰撞。設(shè)置 indx =（indx + 1）mod M.
如果 indx == H（K），則表已滿！就只能做哈希表的擴(kuò)容了

因此，線性探測基本上是在發(fā)生碰撞時對空槽進(jìn)行線性搜索。

優(yōu)點(diǎn)：易于實(shí)施；總是找到一個位置（如果有）；當(dāng)表不是很滿時，平均情況下的性能非常好。

缺點(diǎn)：表的相鄰插槽中會形成“集群”或“集群”鍵；當(dāng)這些簇填滿整個陣列的大部分時，性能會嚴(yán)重下降，因?yàn)樘结樞蛄袌?zhí)行的工作實(shí)際上是對大部分陣列的窮舉搜索。

簡單例子

如哈希表大小M = 7, 哈希函數(shù)：H(K) = K mod M。插入這些值：701, 145, 217, 19, 13, 749

H(K) = 701 % 7 = 1
H(K) = 145 % 7 = 5
H(K) = 217 % 7 = 0
H(K) = 19 % 7 = 2
H(K) = 13 % 7 = 1(沖突) --> 2(已經(jīng)有值) --> 3(插入位置3)
H(K) = 749 % 7 = 2(沖突) --> 3(已經(jīng)有值) --> 4(插入位置4)

可見，如果哈希表如果不是很大，隨著數(shù)據(jù)插入，沖突也會組件發(fā)生，探針遍歷次數(shù)將會逐漸變低，檢索過程也就成為窮舉。

檢索一個值

如果使用線性探測將鍵插入表中，則線性探測將找到它們！

當(dāng)使用散列函數(shù) H（K）在大小為N的表中搜索鍵K時：

設(shè)置 indx = H（K）
如果表位置indx包含鍵，則返回FOUND。
否則，如果表位置 indx 為空，則返回NOT FOUND。
否則設(shè)置 indx =（indx + 1）modM。
如果 indx == H（K），則返回NOT FOUND。就只能做哈希表的擴(kuò)容了

問題：如何從使用線性探測的表中刪除鍵？

能否進(jìn)行“延遲刪除”，而只是將已刪除密鑰的插槽標(biāo)記為空？

很明顯，在線性探測很難做到，如果把位置置為空，那么如果后面的值也是哈希沖突，線性探測插入，則再也無法遍歷這些值了。

2、雙重哈希(Double hashing)

線性探測沖突解決方案會導(dǎo)致表中出現(xiàn)簇，因?yàn)槿绻麅蓚€鍵發(fā)生碰撞，則探測到的下一個位置對于這兩個鍵都是相同的。

雙重哈希的思想：使偏移到下一個探測到的位置取決于鍵值，因此對于不同的鍵可以不同。

需要引入第二個哈希函數(shù) H 2（K），用作探測序列中的偏移量（將線性探測視為 H 2（K）== 1 的雙重哈希）。

對于大小為 M 的哈希表，H 2（K）的值應(yīng)在 1到M-1 的范圍內(nèi)；如果M為質(zhì)數(shù)，則一個常見選擇是 H2（K）= 1 +（（K / M）mod（M-1））。

然后，用于雙哈希的插入算法為：

設(shè)置 indx = H（K）; offset = H 2（K）
如果表位置indx已經(jīng)包含密鑰，則無需插入它。Over
否則，如果表位置 indx 為空，則在其中插入鍵。Over
其他碰撞。設(shè)置 indx =（indx + offset）mod M.
如果 indx == H（K），則表已滿！就只能做哈希表的擴(kuò)容了

哈希表為質(zhì)數(shù)情況，雙重hash在實(shí)踐中非常有效

雙重 Hash 也見： https://blog.csdn.net/chenxuegui1234/article/details/103454285

3、隨機(jī)散列(Random hashing)

與雙重哈希一樣，隨機(jī)哈希通過使探測序列取決于密鑰來避免聚類。

使用隨機(jī)散列時，探測序列是由密鑰播種的偽隨機(jī)數(shù)生成器的輸出生成的（可能與另一個種子組件一起使用，該組件對于每個鍵都是相同的，但是對于不同的表是不同的）。

然后，用于隨機(jī)哈希的插入算法為：

創(chuàng)建以 K 為種子的 RNG。設(shè)置indx = RNG.next() mod M。
如果表位置 indx 已經(jīng)包含密鑰，則無需插入它。Over
否則，如果表位置 indx 為空，則在其中插入鍵。Over
其他碰撞。設(shè)置 indx = RNG.next() mod M.
如果已探測所有M個位置，則放棄。就只能做哈希表的擴(kuò)容了。

隨機(jī)散列很容易分析，但是由于隨機(jī)數(shù)生成的“費(fèi)用”，它并不經(jīng)常使用。雙重哈希在實(shí)踐中還是經(jīng)常被使用。

4、分離鏈接(Separate chaining)

在具有哈希函數(shù) H（K）的表中插入鍵K時

設(shè)置 indx = H（K）
將關(guān)鍵字插入到以 indx 為標(biāo)題的鏈接列表中。（首先搜索列表，以避免重復(fù)。）

在具有哈希函數(shù)H（K）的表中搜索鍵K時

設(shè)置 indx = H（K）
使用線性搜索在以 indx 為標(biāo)題的鏈表中搜索關(guān)鍵字。

使用哈希函數(shù) H（K）刪除表中的鍵K時

設(shè)置 indx = H（K）
刪除鏈接列表中以 indx 為標(biāo)題的鍵

優(yōu)點(diǎn)：隨著條目數(shù)量的增加，平均案例性能保持良好。甚至超過M；刪除比開放地址更容易實(shí)現(xiàn)。

缺點(diǎn)：需要動態(tài)數(shù)據(jù)，除數(shù)據(jù)外還需要存儲指針，本地性較差，導(dǎo)致緩存性能較差。

很明顯，Java7 的 HashMap 就是一種分裂鏈接的實(shí)現(xiàn)方式。

分離鏈哈希分析

請記住表的填充程度的負(fù)載系數(shù)度量：α = N / M。

其中M是表格的大小，并且 N 是表中已插入的鍵數(shù)。

通過單獨(dú)的鏈接，可以使 α> 1 給定負(fù)載因子α，我們想知道在最佳，平均和最差情況下的時間成本。

成功找到

新鍵插入和查找失?。ㄟ@些相同），最好的情況是O（1），最壞的情況是O（N）。讓我們分析平均情況

分裂鏈接的平均成本

假設(shè)負(fù)載系數(shù)為 α = N / M 的表
在M個鏈接列表中總共分配了N個項(xiàng)目（其中一些可能為空），因此每個鏈接列表的平均項(xiàng)目數(shù)為：

如果查找/插入失敗，則必須窮舉搜索表中的鏈表之一，并且表中鏈表的平均長度為α。因此，使用單獨(dú)鏈接進(jìn)行插入或不成功查找的比較平均次數(shù)為

成功查找后，將搜索包含目標(biāo)密鑰的鏈接列表。除目標(biāo)密鑰外，該列表中平均還有（N-1）/ M個密鑰；在找到目標(biāo)之前，將平均搜索其中一半。因此，使用單獨(dú)鏈接成功找到的比較平均次數(shù)為

當(dāng)α<1時，它們分別小于1和1.5。并且即使當(dāng)α超過1時，它們?nèi)匀皇荗（1），與N無關(guān)。

四、開散列方法 VS 閉散列方法

如果將鍵保留為哈希表本身中的條目，則可以使用線性探測，雙重和隨機(jī)哈希... 這樣做稱為“開放式尋址”，也稱為“封閉式哈希”。

另一個想法：哈希表中的條目只是指向鏈表（“鏈”）頭部的指針；鏈接列表的元素包含鍵... 這稱為“單獨(dú)鏈接”，也稱為“開放式哈希”。

通過單獨(dú)的鏈接，沖突解決變得容易：只要在其鏈表中插入一個鍵，就可以將其插入（為此，可以使用比鏈表更高級的數(shù)據(jù)結(jié)構(gòu)；但是正如我們將看到的，鏈表在一般情況下效果很好）。

讓下面我們看一下這些策略的時間成本。

開放式地址哈希分析

分析哈希表“查找”或“插入”性能時，一個有用的參數(shù)是負(fù)載系數(shù) α = N / M。

其中 M 是表格的大小，并且 N 是表中已插入的鍵數(shù)負(fù)載系數(shù)是表滿度的一種度量。

給定負(fù)載因子 α ，我們想知道在最佳，平均和最差情況下的時間成本。

成功找到
對所有鍵，最好的情況是O（1），最壞的情況是O（N），新鍵插入和查找失?。ㄟ@些相同），所以讓我們分析平均情況。
我們將給出隨機(jī)哈希和線性探測的結(jié)果。實(shí)際上，雙重哈希類似于隨機(jī)哈希；

平均不成功的查找/插入成本

假定負(fù)載系數(shù)為α= N / M的表?？紤]隨機(jī)散列，因此聚類不是問題。每個探針位置是隨機(jī)且獨(dú)立生成的對于每個探針，找到空位置的可能性為（1-α）。查找空位置將停止查找或插入，這是一個伯努利過程，成功概率為（1-α）。該過程的預(yù)期一階到達(dá)時間為 1 /（1-α）。所以：

使用隨機(jī)哈希進(jìn)行插入或不成功查找的探針的平均數(shù)量為

服務(wù)器哈希沖突怎么解決

使用線性探測時，探頭的位置不是獨(dú)立的。團(tuán)簇形成，當(dāng)負(fù)載系數(shù)高時會導(dǎo)致較長的探針序列?？梢宰C明，用于線性探測的插入或未成功發(fā)現(xiàn)的探針的平均數(shù)量約為

服務(wù)器哈希沖突怎么解決

當(dāng) α 接近1時，這些平均案例時間成本很差，僅受M限制；但當(dāng) α 等于或小于7.75（與M無關(guān)）時，效果還不錯（分別為4和8.5）

平均成功查找成本

假定負(fù)載系數(shù)為 α= N / M 的表。考慮隨機(jī)散列，因此聚類不是問題。每個探針位置是隨機(jī)且獨(dú)立生成的。

對于表中的鍵，成功找到它所需的探針數(shù)等于將其插入表中時所采用的探針數(shù)。每個新密鑰的插入都會增加負(fù)載系數(shù)，從0開始到α。

因此，通過隨機(jī)散列成功發(fā)現(xiàn)的探測器的平均數(shù)量為

服務(wù)器哈希沖突怎么解決

通過線性探測，會形成簇，從而導(dǎo)致更長的探針序列?？梢宰C明，通過線性探測成功發(fā)現(xiàn)的平均探針數(shù)為

服務(wù)器哈希沖突怎么解決

當(dāng)α接近1時，這些平均案例時間成本很差，僅受M限制；但當(dāng)α等于或小于7.75時好（分別為1.8和2.5），與M無關(guān)。

到此，相信大家對“服務(wù)器哈希沖突怎么解決”有了更深的了解，不妨來實(shí)際操作一番吧！這里是億速云網(wǎng)站，更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢，關(guān)注我們，繼續(xù)學(xué)習(xí)！

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Coherence X for mac工具有什么用
下一篇新聞：
JS的script標(biāo)簽屬性有哪些

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼

<kbd id="bg106"></kbd>

<source id="bg106"></source>

<source id="bg106"></source>