溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python如何過濾序列元素

發(fā)布時間:2020-08-01 09:24:34 來源:億速云 閱讀:156 作者:小豬 欄目:開發(fā)技術(shù)

這篇文章主要講解了Python如何過濾序列元素,內(nèi)容清晰明了,對此有興趣的小伙伴可以學(xué)習(xí)一下,相信大家閱讀完之后會有幫助。

問題

你有一個數(shù)據(jù)序列,想利用一些規(guī)則從中提取出需要的值或者是縮短序列

解決方案

最簡單的過濾序列元素的方法就是使用列表推導(dǎo)。比如:

>>> mylist = [1, 4, -5, 10, -7, 2, 3, -1]
>>> [n for n in mylist if n > 0]
[1, 4, 10, 2, 3]
>>> [n for n in mylist if n < 0]
[-5, -7, -1]
>>>

使用列表推導(dǎo)的一個潛在缺陷就是如果輸入非常大的時候會產(chǎn)生一個非常大的結(jié)果集,占用大量內(nèi)存。 如果你對內(nèi)存比較敏感,那么你可以使用生成器表達(dá)式迭代產(chǎn)生過濾的元素。比如:

>>> pos = (n for n in mylist if n > 0)
>>> pos
<generator object <genexpr> at 0x1006a0eb0>
>>> for x in pos:
... print(x)
...
1
4
10
2
3
>>>

有時候,過濾規(guī)則比較復(fù)雜,不能簡單的在列表推導(dǎo)或者生成器表達(dá)式中表達(dá)出來。 比如,假設(shè)過濾的時候需要處理一些異?;蛘咂渌麖?fù)雜情況。這時候你可以將過濾代碼放到一個函數(shù)中, 然后使用內(nèi)建的 filter() 函數(shù)。示例如下:

values = ['1', '2', '-3', '-', '4', 'N/A', '5']
def is_int(val):
  try:
    x = int(val)
    return True
  except ValueError:
    return False
ivals = list(filter(is_int, values))
print(ivals)
# Outputs ['1', '2', '-3', '4', '5']

filter() 函數(shù)創(chuàng)建了一個迭代器,因此如果你想得到一個列表的話,就得像示例那樣使用 list() 去轉(zhuǎn)換。

討論

列表推導(dǎo)和生成器表達(dá)式通常情況下是過濾數(shù)據(jù)最簡單的方式。 其實(shí)它們還能在過濾的時候轉(zhuǎn)換數(shù)據(jù)。比如:

>>> mylist = [1, 4, -5, 10, -7, 2, 3, -1]
>>> import math
>>> [math.sqrt(n) for n in mylist if n > 0]
[1.0, 2.0, 3.1622776601683795, 1.4142135623730951, 1.7320508075688772]
>>>

過濾操作的一個變種就是將不符合條件的值用新的值代替,而不是丟棄它們。 比如,在一列數(shù)據(jù)中你可能不僅想找到正數(shù),而且還想將不是正數(shù)的數(shù)替換成指定的數(shù)。 通過將過濾條件放到條件表達(dá)式中去,可以很容易的解決這個問題,就像這樣:

>>> clip_neg = [n if n > 0 else 0 for n in mylist]
>>> clip_neg
[1, 4, 0, 10, 0, 2, 3, 0]
>>> clip_pos = [n if n < 0 else 0 for n in mylist]
>>> clip_pos
[0, 0, -5, 0, -7, 0, 0, -1]
>>>

另外一個值得關(guān)注的過濾工具就是 itertools.compress() , 它以一個 iterable 對象和一個相對應(yīng)的 Boolean 選擇器序列作為輸入?yún)?shù)。 然后輸出 iterable 對象中對應(yīng)選擇器為 True 的元素。 當(dāng)你需要用另外一個相關(guān)聯(lián)的序列來過濾某個序列的時候,這個函數(shù)是非常有用的。 比如,假如現(xiàn)在你有下面兩列數(shù)據(jù):

addresses = [
  '5412 N CLARK',
  '5148 N CLARK',
  '5800 E 58TH',
  '2122 N CLARK',
  '5645 N RAVENSWOOD',
  '1060 W ADDISON',
  '4801 N BROADWAY',
  '1039 W GRANVILLE',
]
counts = [ 0, 3, 10, 4, 1, 7, 6, 1]

現(xiàn)在你想將那些對應(yīng) count 值大于5的地址全部輸出,那么你可以這樣做:

>>> from itertools import compress
>>> more5 = [n > 5 for n in counts]
>>> more5
[False, False, True, False, False, True, True, False]
>>> list(compress(addresses, more5))
['5800 E 58TH', '1060 W ADDISON', '4801 N BROADWAY']
>>>

這里的關(guān)鍵點(diǎn)在于先創(chuàng)建一個 Boolean 序列,指示哪些元素符合條件。 然后 compress() 函數(shù)根據(jù)這個序列去選擇輸出對應(yīng)位置為 True 的元素。

filter() 函數(shù)類似, compress() 也是返回的一個迭代器。因此,如果你需要得到一個列表, 那么你需要使用 list() 來將結(jié)果轉(zhuǎn)換為列表類型。

看完上述內(nèi)容,是不是對Python如何過濾序列元素有進(jìn)一步的了解,如果還想學(xué)習(xí)更多內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI