溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

用于密碼破譯的深層學習方法PassGAN該如何理解

發(fā)布時間:2022-01-06 17:25:51 來源:億速云 閱讀:240 作者:柒染 欄目:網(wǎng)絡安全

這篇文章給大家介紹用于密碼破譯的深層學習方法PassGAN該如何理解,內(nèi)容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

這些規(guī)則定義了轉(zhuǎn)換規(guī)則,比如單詞的連接(例如:password123456)和leet speaking(比如:”password”變成”p4s5w0rd”)。盡管這些規(guī)則在當前的數(shù)據(jù)集中表現(xiàn)良好,創(chuàng)造一個為新的數(shù)據(jù)集優(yōu)化的新規(guī)則是一項費力的任務,要完成這項文物需要具備特定的專業(yè)知識。

在這篇文章中,我們設計如何用基于機器學習理論的密碼生成方法替代人工產(chǎn)生的密碼規(guī)則。這一成就的結果就是PassGAN,一種利用生成對抗網(wǎng)絡(GANs)來增強密碼破譯的新方法。PassGAN通過在泄露密碼列表中訓練GAN來實現(xiàn)密碼破譯。因為GAN的輸出與訓練集密切相關,通過PassGAN生成的密碼很可能會匹配到那些還沒有泄露密碼。PassGAN的出現(xiàn)表明基于規(guī)則的密碼生成工具產(chǎn)生了實質(zhì)性的改進,因為它是通過密碼數(shù)據(jù)而不是利用手動分析,自動推斷密碼分布信息。因此,PassGAN能夠毫不費力的利用新的密碼泄露生成一個更豐富的密碼分布。

我們的實驗表明,這種方式非常有前途。當我們在兩個大的密碼數(shù)據(jù)集中評估PassGAN時,我們平均超過John the RipperSpyderLab規(guī)則兩倍,而且我們和HashCatbest64gen2規(guī)則競爭——我們的結果在HashCat規(guī)則的兩倍以內(nèi)。更重要的是,當我們把PassGAN的輸出和HashCat的輸出結合起來時,我們大約比單獨使用HashCat多匹配18%~24%的密碼。這是非常引人注目的,因為它表明PassGAN能夠產(chǎn)生相當數(shù)量的密碼,遠超過了當前的工具。

 

1 .介紹

密碼是最受歡迎的認證方式,主要是因為它很容易的實施,不需要其他的硬件或軟件,用戶和開發(fā)者都對密碼非常熟悉。不幸的是,多個密碼數(shù)據(jù)庫泄露表明用戶傾向于選擇容易猜到的密碼,主要由常見字符串和常見字符串的變種組成(比如:password,1234546,iloveyou)。

密碼破譯工具為識別弱密碼提供了有價值的工具,特別是當它們以散列形式存儲時。密碼破譯軟件針對每一個密碼的哈希值做測試,密碼破譯軟件的有效性取決于快速測試大量密碼的能力。取代嘗試所有可能的字符組合,密碼破譯工具采用了新的方法,即使用字典中的單詞和之前泄露的密碼作為候選人密碼。很多殿堂級的密碼破譯工具,例如:John the RipperHashCat,通過定義密碼轉(zhuǎn)換的試探方法,進一步理解這種方法。這種方法包含多種單詞組合(比如:iloveyou123456,混合字母(比如:iLoVeyOu,leet peak(比如:il0v3you).這些探索法,結合Markov模型,允許John the RipperHashCat產(chǎn)生大量新的具有極高可能性的密碼。

盡管這個探索法在實踐中極有可能成功,他們是點對點并且基于用戶如何選擇密碼的直覺,而不是從大型密碼數(shù)據(jù)庫的連貫性和原則性分析出來。之后,發(fā)展和測試新的探索法是一個耗時的任務.為了解決這一短板,在這篇文章中我們提出PassGAN,一個新的生成密碼評估的方式,基于深度學習和生成對抗性網(wǎng)絡(GANs)。GANs是最近介紹的機器學習工具,被設計用來執(zhí)行高維空間的密度估計。一個GANs是由兩個深度神經(jīng)網(wǎng)絡組成:一個生成的深度神經(jīng)網(wǎng)絡(G)和一個判別式深度神經(jīng)網(wǎng)絡(D)。D的設計目的是區(qū)分由G生成的“真實樣本”和“偽樣本”。這兩個深度神經(jīng)網(wǎng)絡通過多次迭代,互相影響。在每一次迭代,把來自G的偽樣本為D,D的輸出會提供給G,GD的輸出作為反饋生成與實際樣本越來越接近的偽樣本。經(jīng)過做夠數(shù)量的重復,G的輸出成為了GAN的輸出。PassGAN促使這一技術成為新的密碼猜測。我們的核心觀點是使用泄露的密碼列表(真實樣本)訓練D。因此,每一次迭代,PassGAN的輸出(偽樣本)變得接近原始泄露中的密碼的分布,而且因此更加匹配真正的用戶的密碼。據(jù)我們所知,這個工作是第一次為這個目的使用GANs。

PassGAN表示原則性強的和扎根理論呈現(xiàn)這一代密碼猜測。我們探索不同的神經(jīng)網(wǎng)絡配置,參數(shù)和培訓程序,為了確定適當?shù)钠胶庠趯W習和過擬合之間,和報告我們的結果。特別是,我們的貢獻遵循:(1)我們表明GANs能夠生成高質(zhì)量的密碼猜測。在我們的實驗中,我們能夠匹配5,919,936個密碼當中的2774269個(46.86%)從RockYou數(shù)據(jù)集中一個由真實用戶密碼組成的測試集,以及LinkedIn數(shù)據(jù)集當中43,354,871個密碼當中的4,996,980個(11.53%)。更進一步,具有壓倒性優(yōu)勢的數(shù)量的由PassGAN生成的密碼不匹配我們的測試集仍然“看起來像”人類生成的密碼;(2)我們發(fā)現(xiàn)我們的技術能夠跟蛋湯記得密碼生成規(guī)則競爭。即使這些規(guī)則都是真悶針對在我們的評估中使用的數(shù)據(jù)集,PassGAN的輸出的質(zhì)量可以和這些殿堂級的密碼規(guī)則媲美(在hashCat情況下),或者比那些殿堂級的密碼規(guī)則更好(在John the Ripper的情況下);(3)我們的結果同樣也表明PassGAN能夠用來補充密碼生成規(guī)則。在我們的實驗中,我們成功地使用PassGAN生成不由密碼規(guī)則生成的密碼匹配。當我們吧PassGAN的產(chǎn)出和HashCat的產(chǎn)出結合在一起,和HashCat相比,我們能夠額外匹配18%24% 獨特代碼;(4)與密碼生成規(guī)則相比,PassGAN能夠生成幾乎無限大的密碼猜想。我們的實驗表明,新的密碼猜想的數(shù)量隨著GAN生成的密碼的總數(shù)量穩(wěn)固增長。這是非常重要的,因為當前用規(guī)則生成的密碼的數(shù)量,最終取決于實例化這些規(guī)則的密碼數(shù)據(jù)集的規(guī)模。

 

我們認為這個工作是實現(xiàn)自動化生成高質(zhì)量密碼猜測的第一步。當我們用足夠大的密碼數(shù)據(jù)集訓練,或者當我們把一個足夠復雜的神經(jīng)網(wǎng)體系結構實例化時,我們的結果構成GANs能夠超越基于規(guī)則的密碼猜測的證據(jù)。此外,PassGAN實現(xiàn)這一結果,當要求沒有用戶成就通常與密碼猜測規(guī)則

 

我們認為這個工作是有重要意義的,具有重要性的,而且及時的。之所以說有重要意義,是因為盡管有無數(shù)的選擇,我們幾乎看不到密碼將會很快被取代的可能性。之所以說具有重要性,是因為建立密碼破譯的限制能夠有助于使基于密碼的系統(tǒng)更安全。至于及時性,則是因為近期的密碼泄露包含數(shù)億密碼,為攻擊者破壞系統(tǒng)提供一個強大的數(shù)據(jù)源,而且系統(tǒng)管理員也會重新評估密碼策略。

關于用于密碼破譯的深層學習方法PassGAN該如何理解就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI