溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何解決Python3標準庫glob文件名模式匹配的問題

發(fā)布時間:2021-07-02 10:12:40 來源:億速云 閱讀:132 作者:小新 欄目:開發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)如何解決Python3標準庫glob文件名模式匹配的問題的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

1. glob文件名模式匹配

盡管glob API很小,但這個模塊的功能卻很強大。只要程序需要查找文件系統(tǒng)中名字與某個模式匹配的一組文件,就可以使用這個模塊。要創(chuàng)建一個文件名列表,要求其中各個文件名都有某個特定的擴展名、前綴或者中間都有某個共同的字符串,就可以使用glob而不用編寫定制代碼來掃描目錄內(nèi)容。

glob的模式規(guī)則與re模塊使用的正則表達式并不相同。實際上,glob的模式遵循標準UNIX路徑擴展規(guī)則。只使用幾個特殊字符來實現(xiàn)兩個不同的通配符和字符區(qū)間。模式規(guī)則應(yīng)用于文件名中的段(在路徑分隔符/處截止)。

1.1 實例數(shù)據(jù)

本節(jié)中的示例假定當前工作目錄中存在以下測試文件。

test_files
test_files/file.txt
test_files/file1.txt
test_files/file2.txt
test_files/filea.txt
test_files/fileb.txt
test_files/subfiles
test_files/subfiles/subfile.txt

如果這些文件不存在,請glob_maketestdata.py在運行以下示例之前使用示例代碼創(chuàng)建它們。

如何解決Python3標準庫glob文件名模式匹配的問題

1.2 通配符

星號(*)匹配一個文件名段中的0個或多個字符。例如,test_files/*。

import glob
for name in sorted(glob.glob('test_files/*')):
  print(name)

這個模式會匹配目錄test_files中的所有路徑名(文件或目錄),但不會進一步遞歸搜索到子目錄。glob()返回的數(shù)據(jù)不會排序,所以這里的實例會進行排序以便研究結(jié)果。

如何解決Python3標準庫glob文件名模式匹配的問題

要列出子目錄中的文件,必須把子目錄包含在模式中。

import glob
print('Named explicitly:')
for name in sorted(glob.glob('test_files/subfiles/*')):
  print(' {}'.format(name))
print('Named with wildcard:')
for name in sorted(glob.glob('test_files/*/*')):
  print(' {}'.format(name))

前面顯示的第一種情況顯式列出了子目錄名,第二種情況則依賴一個通配符來查找目錄。

如何解決Python3標準庫glob文件名模式匹配的問題

在這里,兩種做法的結(jié)果是一樣的。如果還有另一個子目錄,則通配符會匹配這兩個子目錄,并且兩個子目錄中的文件名都會出現(xiàn)在結(jié)果中。

1.3 單字符通配符

問號(?)也是一個通配符。它會匹配文件名中該位置的單個字符。

import glob
for name in sorted(glob.glob('test_files/file?.txt')):
  print(name)

前面的例子會匹配以file開頭,然后是另外一個任意字符,最后以.txt結(jié)尾的所有文件名。

如何解決Python3標準庫glob文件名模式匹配的問題

1.4 字符區(qū)間

如果使用字符區(qū)間([a-z])而不是問號,則可以匹配多個字符中的一個字符。下面這個例子會查找名字中擴展名前有一個數(shù)字的所有文件。

import glob
for name in sorted(glob.glob('test_files/*[0-9].*')):
  print(name)

字符區(qū)間[0-9]會匹配所有單個數(shù)字。區(qū)間根據(jù)各字母/數(shù)字的字符碼排序,短橫線指示連續(xù)字符組成的一個不間斷區(qū)間。這個區(qū)間值也可以寫為[0123456789]。

如何解決Python3標準庫glob文件名模式匹配的問題

1.5 轉(zhuǎn)義元字符

有時有必要搜索名字中包含一些特殊元字符的文件,glob使用這些特殊元字符表示模式。escape()函數(shù)會建立一個適合的模式,其中的特殊字符會被“轉(zhuǎn)義”,使它們不會被glob擴展或解釋為特殊字符。

import glob
specials = '?*['
for char in specials:
  pattern = 'test_files/*' + glob.escape(char) + '.txt'
  print('Searching for: {!r}'.format(pattern))
  for name in sorted(glob.glob(pattern)):
    print(name)
  print()

可以通過構(gòu)建一個包含單個元素的字符區(qū)間來轉(zhuǎn)義各個特殊字符。

如何解決Python3標準庫glob文件名模式匹配的問題

感謝各位的閱讀!關(guān)于“如何解決Python3標準庫glob文件名模式匹配的問題”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI