溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python中hash指的是什么

發(fā)布時間:2020-08-04 14:35:53 來源:億速云 閱讀:202 作者:清晨 欄目:編程語言

不懂python中hash指的是什么?其實想解決這個問題也不難,下面讓小編帶著大家一起學習怎么去解決,希望大家閱讀完這篇文章后大所收獲。

什么是哈希?

hash,一般翻譯為散列、雜湊,或音譯為哈希,是把任意長度的輸入(又叫做預映射pre-image)通過散列算法變換成固定長度的輸出,該輸出就是散列值。這種轉(zhuǎn)換是一種壓縮映射,也就是,散列值的空間通常遠小于輸入的空間。

它其實就是一個算法,最簡單的算法就是加減乘除,比方,我設計個數(shù)字算法,輸入+7=輸出,比如我輸入1,輸出為8;輸入2,輸出為9。

哈希算法不過是一個更為復雜的運算,它的輸入可以是字符串,可以是數(shù)據(jù),可以是任何文件,經(jīng)過哈希運算后,變成一個固定長度的輸出,該輸出就是哈希值。但是哈希算法有一個很大的特點,就是你不能從結(jié)果推算出輸入,所以又稱為不可逆的算法。

>>> hash('我愛你')
3471388576844338423

如上所示,輸入“我愛你”三個字,經(jīng)過哈希運算后,會得到一個隨機數(shù)列,而且不管你的輸入文件多大,最后得到的結(jié)果都是這么一個固定長度的數(shù)列,即使你輸入的是一部電影,輸出也是這么大。而且通過數(shù)列不能推導出輸入。

哈希特性

不可逆:在具備編碼功能的同時,哈希算法也作為一種加密算法存在。即,你無法通過分析哈希值計算出源文件的樣子,換句話說:你不可能通過觀察香腸的紋理推測出豬原來的樣子。

計算極快:20G高清電影和一個5K文本文件復雜度相同,計算量都極小,可以在0.1秒內(nèi)得出結(jié)果。也就是說,不管豬有多肥,骨頭多硬,做成香腸都只要眨眨眼的時間。

哈希的用途

哈希算法的不可逆特性使其在以下領域使用廣泛:

(1)密碼,我們?nèi)粘J褂玫母鞣N電子密碼本質(zhì)上都是基于hash的,你不用擔心支付寶的工作人員會把你的密碼泄漏給第三方,因為你的登錄密碼是先經(jīng)過 hash+各種復雜算法得出密文后,再存進支付寶的數(shù)據(jù)庫里的。

(2)文件完整性校驗,通過對文件進行hash,得出一段hash值 ,這樣文件內(nèi)容以后被修改了,hash值就會變。 MD5 Hash算法的"數(shù)字指紋"特性,使它成為應用最廣泛的一種文件完整性校驗和(Checksum)算法,不少Unix系統(tǒng)有提供計算md5 checksum的命令。

(3)數(shù)字簽名,數(shù)字簽名技術是將摘要信息用發(fā)送者的私鑰加密,與原文一起傳送給接收者。接收者只有用發(fā)送者的公鑰才能解密被加密的摘要信息,然后用HASH函數(shù)對收到的原文產(chǎn)生一個摘要信息,與解密的摘要信息對比。如果相同,則說明收到的信息是完整的,在傳輸過程中沒有被修改,否則說明信息被修改過,因此數(shù)字簽名能夠驗證信息的完整性。

此外,hash算法在區(qū)塊鏈領域也使用廣泛。

基于hash的數(shù)據(jù)類型有哪些?

Python 中基于hash的2個數(shù)據(jù)類型是dict and set , 之前說dict查詢速度快,為何快? 說set天生去重,怎么做到的?其實都是利用了hash的特性,我們下面來剖析

dict 為何查詢速度超快,且不受dict大小影響?

解析:假設我要存14億人的基本信息

data = {
    "張三":[23742364782642342323234,28,"山東濟南"],
    "李四":[12124234232311214458271,25,"北京昌平"],
    "王五":[23030293483727384383929,33,"山東濟南"],
    "趙六":[42302033030302482634674,28,"河北保定"],
    # "alex":["xxxx"],
    # "黑姑娘":["xxxx"]
    # ...
}

dict 的每個key 都要先經(jīng)過hash生成一段固定長度的hash值,假設生成的hash值如下:

python中hash指的是什么

dict會把這些數(shù)字按大小排序好放在一個列表里kd = [-10, 53, 67, 81, 99, 123]

當我們想查找"趙六"的信息時, 會把“趙六”先hash, 得到99這個值,然后拿這個值去到kd列表里找,想象這個列表有14億個值 ,如何快速找到99? 二分法就行,具體看剖析視頻。

只要找到了99的位置,就可以定位到趙六對應的value的值了。 通過2分法查找,每次數(shù)據(jù)量都會少一半,這樣查找最多31次(2**31=2147483648)就能從20億信息里找到這個人的信息。

當然 dict 真實的查找算法比這個還要復雜些, 我只是通過這個例子讓大家理解下為何基于hash的數(shù)據(jù)類型查找速度會快很多。

set為何是天生去重的?

因為每存一個值到set里時, 都要先經(jīng)過hash,然后通過得出的這個hash值算出應該存在set里的哪個位置,存的時候會先檢查那個位置上有沒有值 ,有的話就對比是否相等,如果相等,則不再存儲此值。 如果不相等(即為空),則把新值存在這。

感謝你能夠認真閱讀完這篇文章,希望小編分享python中hash指的是什么內(nèi)容對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業(yè)資訊頻道,遇到問題就找億速云,詳細的解決方法等著你來學習!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI