溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python怎么打印不合法的文件名

發(fā)布時間:2020-08-01 09:01:44 來源:億速云 閱讀:140 作者:小豬 欄目:開發(fā)技術

這篇文章主要講解了Python怎么打印不合法的文件名,內容清晰明了,對此有興趣的小伙伴可以學習一下,相信大家閱讀完之后會有幫助。

問題

你的程序獲取了一個目錄中的文件名列表,但是當它試著去打印文件名的時候程序崩潰, 出現(xiàn)了 UnicodeEncodeError 異常和一條奇怪的消息—— surrogates not allowed 。

解決方案

當打印未知的文件名時,使用下面的方法可以避免這樣的錯誤:

def bad_filename(filename):
  return repr(filename)[1:-1]

try:
  print(filename)
except UnicodeEncodeError:
  print(bad_filename(filename))

如果你有代碼需要操作文件名或者將文件名傳遞給 open() 這樣的函數(shù),一切都能正常工作。 只有當你想要輸出文件名時才會碰到些麻煩(比如打印輸出到屏幕或日志文件等)。 特別的,當你想打印上面的文件名列表時,你的程序就會崩潰:

>>> for name in files:
...   print(name)
...
spam.py
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
UnicodeEncodeError: 'utf-8' codec can't encode character '\udce4' in
position 1: surrogates not allowed
>>>
>>> for name in files:
... try:
...   print(name)
... except UnicodeEncodeError:
...   print(bad_filename(name))
...
spam.py
b\udce4d.txt
foo.txt
>>>

在 bad_filename() 函數(shù)中怎樣處置取決于你自己。 另外一個選擇就是通過某種方式重新編碼,示例如下:

def bad_filename(filename):
  temp = filename.encode(sys.getfilesystemencoding(), errors='surrogateescape')
  return temp.decode('latin-1')

譯者注:

surrogateescape:
這種是Python在絕大部分面向OS的API中所使用的錯誤處理器,
它能以一種優(yōu)雅的方式處理由操作系統(tǒng)提供的數(shù)據(jù)的編碼問題。
在解碼出錯時會將出錯字節(jié)存儲到一個很少被使用到的Unicode編碼范圍內。
在編碼時將那些隱藏值又還原回原先解碼失敗的字節(jié)序列。
它不僅對于OS API非常有用,也能很容易的處理其他情況下的編碼錯誤。

使用這個版本產(chǎn)生的輸出如下:

>>> for name in files:
...   try:
...     print(name)
...   except UnicodeEncodeError:
...     print(bad_filename(name))
...
spam.py
b&auml;d.txt
foo.txt
>>>

這一小節(jié)主題可能會被大部分讀者所忽略。但是如果你在編寫依賴文件名和文件系統(tǒng)的關鍵任務程序時, 就必須得考慮到這個。否則你可能會在某個周末被叫到辦公室去調試一些令人費解的錯誤。

看完上述內容,是不是對Python怎么打印不合法的文件名有進一步的了解,如果還想學習更多內容,歡迎關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。

AI