<rp id="ilphg"><table id="ilphg"></table></rp>

<track id="ilphg"><th id="ilphg"></th></track>

<address id="ilphg"><sub id="ilphg"><tbody id="ilphg"></tbody></sub></address>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

Python中迭代器與迭代器切片的示例分析

發(fā)布時(shí)間：2021-08-03 11:23:09 來(lái)源：億速云閱讀：103 作者：小新欄目：開(kāi)發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)Python中迭代器與迭代器切片的示例分析的內(nèi)容。小編覺(jué)得挺實(shí)用的，因此分享給大家做個(gè)參考，一起跟隨小編過(guò)來(lái)看看吧。

迭代器是 Python 中獨(dú)特的一種高級(jí)特性，而切片也是一種高級(jí)特性，兩者相結(jié)合，會(huì)產(chǎn)生什么樣的結(jié)果呢？

1、迭代與迭代器

首先，有幾個(gè)基本概念要澄清：迭代、可迭代對(duì)象、迭代器。

迭代是一種遍歷容器類(lèi)型對(duì)象（例如字符串、列表、字典等等）的方式，例如，我們說(shuō)迭代一個(gè)字符串“abc”，指的就是從左往右依次地、逐個(gè)地取出它的全部字符的過(guò)程。（PS：漢語(yǔ)中迭代一詞有循環(huán)反復(fù)、層層遞進(jìn)的意思，但 Python 中此詞要理解成單向水平線性的，如果你不熟悉它，我建議直接將其理解為遍歷。）

那么，怎么寫(xiě)出迭代操作的指令呢？最通用的書(shū)寫(xiě)語(yǔ)法就是 for 循環(huán)。

# for循環(huán)實(shí)現(xiàn)迭代過(guò)程
for char in "abc":
  print(char, end=" ")
# 輸出結(jié)果：a b c

for 循環(huán)可以實(shí)現(xiàn)迭代的過(guò)程，但是，并非所有對(duì)象都可以用于 for 循環(huán)，例如，上例中若將字符串“abc”換成任意整型數(shù)字，則會(huì)報(bào)錯(cuò)： 'int' object is not iterable .

這句報(bào)錯(cuò)中的單詞“iterable”指的是“可迭代的”，即 int 類(lèi)型不是可迭代的。而字符串（string）類(lèi)型是可迭代的，同樣地，列表、元組、字典等類(lèi)型，都是可迭代的。

那怎么判斷一個(gè)對(duì)象是否可迭代呢？為什么它們是可迭代的呢？怎么讓一個(gè)對(duì)象可迭代呢？

要使一個(gè)對(duì)象可迭代，就要實(shí)現(xiàn)可迭代協(xié)議，即要實(shí)現(xiàn)__iter__()魔術(shù)方法，換言之，只要實(shí)現(xiàn)了這個(gè)魔術(shù)方法的對(duì)象都是可迭代對(duì)象。

那怎么判斷一個(gè)對(duì)象是否實(shí)現(xiàn)了這個(gè)方法呢？除了上述的for循環(huán)外，我知道四種方法：

# 方法1：dir()查看__iter__
dir(2)   # 沒(méi)有，略
dir("abc") # 有，略

# 方法2：isinstance()判斷
import collections
isinstance(2, collections.Iterable)   # False
isinstance("abc", collections.Iterable) # True

# 方法3：hasattr()判斷
hasattr(2,"__iter__")   # False
hasattr("abc","__iter__") # True

# 方法4：用iter()查看是否報(bào)錯(cuò)
iter(2)   # 報(bào)錯(cuò)：'int' object is not iterable
iter("abc") # <str_iterator at 0x1e2396d8f28>

### PS：判斷是否可迭代，還可以查看是否實(shí)現(xiàn)__getitem__，為方便描述，本文從略。

這幾種方法中最值得一提的是 iter() 方法，它是 Python 的內(nèi)置方法，其作用是將可迭代對(duì)象變成迭代器。這句話可以解析出兩層意思：（1）可迭代對(duì)象跟迭代器是兩種東西；（2）可迭代對(duì)象能變成迭代器。

實(shí)際上，迭代器必然是可迭代對(duì)象，但可迭代對(duì)象不一定是迭代器。兩者有多大的區(qū)別呢？

Python中迭代器與迭代器切片的示例分析

如上圖藍(lán)圈所示，普通可迭代對(duì)象與迭代器的最關(guān)鍵區(qū)別可概括為：一同兩不同，所謂“一同”，即兩者都是可迭代的（__iter__），所謂“兩不同”，即可迭代對(duì)象在轉(zhuǎn)化為迭代器后，它會(huì)丟失一些屬性（__getitem__），同時(shí)也增加一些屬性（__next__）。

首先看看增加的屬性 __next__ ，它是迭代器之所以是迭代器的關(guān)鍵，事實(shí)上，我們正是把同時(shí)實(shí)現(xiàn)了 __iter__ 方法和 __next__ 方法的對(duì)象定義為迭代器的。

有了多出來(lái)的這個(gè)屬性，可迭代對(duì)象不需要借助外部的 for 循環(huán)語(yǔ)法，就能實(shí)現(xiàn)自我的迭代/遍歷過(guò)程。我發(fā)明了兩個(gè)概念來(lái)描述這兩種遍歷過(guò)程（PS：為了易理解，這里稱(chēng)遍歷，實(shí)際也可稱(chēng)為迭代）：它遍歷指的是通過(guò)外部語(yǔ)法而實(shí)現(xiàn)的遍歷，自遍歷指的是通過(guò)自身方法實(shí)現(xiàn)的遍歷。

借助這兩個(gè)概念，我們說(shuō)，可迭代對(duì)象就是能被“它遍歷”的對(duì)象，而迭代器是在此基礎(chǔ)上，還能做到“自遍歷”的對(duì)象。

ob1 = "abc"
ob2 = iter("abc")
ob3 = iter("abc")

# ob1它遍歷
for i in ob1:
  print(i, end = " ")  # a b c
for i in ob1:
  print(i, end = " ")  # a b c
# ob1自遍歷
ob1.__next__() # 報(bào)錯(cuò)： 'str' object has no attribute '__next__'

# ob2它遍歷
for i in ob2:
  print(i, end = " ")  # a b c  
for i in ob2:
  print(i, end = " ")  # 無(wú)輸出
# ob2自遍歷
ob2.__next__() # 報(bào)錯(cuò)：StopIteration

# ob3自遍歷
ob3.__next__() # a
ob3.__next__() # b
ob3.__next__() # c
ob3.__next__() # 報(bào)錯(cuò)：StopIteration

通過(guò)上述例子可看出，迭代器的優(yōu)勢(shì)在于支持自遍歷，同時(shí)，它的特點(diǎn)是單向非循環(huán)的，一旦完成遍歷，再次調(diào)用就會(huì)報(bào)錯(cuò)。

對(duì)此，我想到一個(gè)比方：普通可迭代對(duì)象就像是子彈匣，它遍歷就是取出子彈，在完成操作后又裝回去，所以可以反復(fù)遍歷（即多次調(diào)用for循環(huán)，返回相同結(jié)果）；而迭代器就像是裝載了子彈匣且不可拆卸的槍?zhuān)M(jìn)行它遍歷或者自遍歷都是發(fā)射子彈，這是消耗性的遍歷，是無(wú)法復(fù)用的（即遍歷會(huì)有盡頭）。

寫(xiě)了這么多，稍微小結(jié)一下：迭代是一種遍歷元素的方式，按照實(shí)現(xiàn)方式劃分，有外部迭代與內(nèi)部迭代兩種，支持外部迭代（它遍歷）的對(duì)象就是可迭代對(duì)象，而同時(shí)還支持內(nèi)部迭代（自遍歷）的對(duì)象就是迭代器；按照消費(fèi)方式劃分，可分為復(fù)用型迭代與一次性迭代，普通可迭代對(duì)象是復(fù)用型的，而迭代器是一次性的。

2、迭代器切片

前面提到了“一同兩不同”，最后的不同是，普通可迭代對(duì)象在轉(zhuǎn)化成迭代器的過(guò)程中會(huì)丟失一些屬性，其中關(guān)鍵的屬性是 __getitem__ 。在《Python進(jìn)階：自定義對(duì)象實(shí)現(xiàn)切片功能》中，我曾介紹了這個(gè)魔術(shù)方法，并用它實(shí)現(xiàn)了自定義對(duì)象的切片特性。

那么問(wèn)題來(lái)了：為啥迭代器不繼承這個(gè)屬性呢？

首先，迭代器使用的是消耗型的遍歷，這意味著它充滿不確定性，即其長(zhǎng)度與索引鍵值對(duì)是動(dòng)態(tài)衰減的，所以很難 get 到它的 item ，也就不再需要 __getitem__ 屬性了。其次，若強(qiáng)行給迭代器加上這個(gè)屬性，這并不合理，正所謂強(qiáng)扭的瓜不甜……

由此，新的問(wèn)題來(lái)了：既然會(huì)丟失這么重要的屬性（還包括其它未標(biāo)識(shí)的屬性），為什么還要使用迭代器呢？

這個(gè)問(wèn)題的答案在于，迭代器擁有不可替代的強(qiáng)大的有用的功能，使得 Python 要如此設(shè)計(jì)它。限于篇幅，此處不再展開(kāi)，后續(xù)我會(huì)專(zhuān)門(mén)填坑此話題。

還沒(méi)完，死纏爛打的問(wèn)題來(lái)了：能否令迭代器擁有這個(gè)屬性呢，即令迭代器繼續(xù)支持切片呢？

hi = "歡迎關(guān)注公眾號(hào)：Python貓"
it = iter(hi)

# 普通切片
hi[-7:] # Python貓

# 反例：迭代器切片
it[-7:] # 報(bào)錯(cuò)：'str_iterator' object is not subscriptable

迭代器因?yàn)槿鄙?code>__getitem__ ，因此不能使用普通的切片語(yǔ)法。想要實(shí)現(xiàn)切片，無(wú)非兩種思路：一是自己造輪子，寫(xiě)實(shí)現(xiàn)的邏輯；二是找到封裝好的輪子。

Python 的 itertools 模塊就是我們要找的輪子，用它提供的方法可輕松實(shí)現(xiàn)迭代器切片。

import itertools

# 例1：簡(jiǎn)易迭代器
s = iter("123456789")
for x in itertools.islice(s, 2, 6):
  print(x, end = " ")  # 輸出：3 4 5 6
for x in itertools.islice(s, 2, 6):
  print(x, end = " ")  # 輸出：9

# 例2：斐波那契數(shù)列迭代器
class Fib():
  def __init__(self):
    self.a, self.b = 1, 1

  def __iter__(self):
    while True:
      yield self.a
      self.a, self.b = self.b, self.a + self.b
f = iter(Fib())
for x in itertools.islice(f, 2, 6):
  print(x, end = " ") # 輸出：2 3 5 8
for x in itertools.islice(f, 2, 6):
  print(x, end = " ") # 輸出：34 55 89 144

itertools 模塊的 islice() 方法將迭代器與切片完美結(jié)合，終于回答了前面的問(wèn)題。然而，迭代器切片跟普通切片相比，前者有很多局限性。首先，這個(gè)方法不是“純函數(shù)”（純函數(shù)需遵守“相同輸入得到相同輸出”的原則，之前在《來(lái)自Kenneth Reitz大神的建議：避免不必要的面向?qū)ο缶幊獭诽岬竭^(guò)）；其次，它只支持正向切片，且不支持負(fù)數(shù)索引，這都是由迭代器的損耗性所決定的。

那么，我不禁要問(wèn)：itertools 模塊的切片方法用了什么實(shí)現(xiàn)邏輯呢？下方是官網(wǎng)提供的源碼：

def islice(iterable, *args):
  # islice('ABCDEFG', 2) --> A B
  # islice('ABCDEFG', 2, 4) --> C D
  # islice('ABCDEFG', 2, None) --> C D E F G
  # islice('ABCDEFG', 0, None, 2) --> A C E G
  s = slice(*args)
  # 索引區(qū)間是[0,sys.maxsize]，默認(rèn)步長(zhǎng)是1
  start, stop, step = s.start or 0, s.stop or sys.maxsize, s.step or 1
  it = iter(range(start, stop, step))
  try:
    nexti = next(it)
  except StopIteration:
    # Consume *iterable* up to the *start* position.
    for i, element in zip(range(start), iterable):
      pass
    return
  try:
    for i, element in enumerate(iterable):
      if i == nexti:
        yield element
        nexti = next(it)
  except StopIteration:
    # Consume to *stop*.
    for i, element in zip(range(i + 1, stop), iterable):
      pass

islice() 方法的索引方向是受限的，但它也提供了一種可能性：即允許你對(duì)一個(gè)無(wú)窮的（在系統(tǒng)支持范圍內(nèi)）迭代器進(jìn)行切片的能力。這是迭代器切片最具想象力的用途場(chǎng)景。

除此之外，迭代器切片還有一個(gè)很實(shí)在的應(yīng)用場(chǎng)景：讀取文件對(duì)象中給定行數(shù)范圍的數(shù)據(jù)。

在《給Python學(xué)習(xí)者的文件讀寫(xiě)指南（含基礎(chǔ)與進(jìn)階，建議收藏）》里，我介紹了從文件中讀取內(nèi)容的幾種方法：readline() 比較雞肋，不咋用；read() 適合讀取內(nèi)容較少的情況，或者是需要一次性處理全部?jī)?nèi)容的情況；而 readlines() 用的較多，每次迭代讀取內(nèi)容，既減少內(nèi)存壓力，又方便逐行對(duì)數(shù)據(jù)處理。

雖然 readlines() 有迭代讀取的優(yōu)勢(shì)，但它是從頭到尾逐行讀取，若文件有幾千行，而我們只想要讀取少數(shù)特定行（例如第1000-1009行），那它還是效率太低了?？紤]到文件對(duì)象天然就是迭代器，我們可以使用迭代器切片先行截取，然后再處理，如此效率將大大地提升。

# test.txt 文件內(nèi)容
'''
貓
Python貓
python is a cat.
this is the end.
'''

from itertools import islice
with open('test.txt','r',encoding='utf-8') as f:
  print(hasattr(f, "__next__")) # 判斷是否迭代器
  content = islice(f, 2, 4)
  for line in content:
    print(line.strip())
### 輸出結(jié)果：
True
python is a cat.
this is the end.

感謝各位的閱讀！關(guān)于“Python中迭代器與迭代器切片的示例分析”這篇文章就分享到這里了，希望以上內(nèi)容可以對(duì)大家有一定的幫助，讓大家可以學(xué)到更多知識(shí)，如果覺(jué)得文章不錯(cuò)，可以把它分享出去讓更多的人看到吧！

向AI問(wèn)一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
python機(jī)器學(xué)習(xí)中支持向量機(jī)的示例分析
下一篇新聞：
如何解決某些HTML字符打不出來(lái)的問(wèn)題

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專(zhuān)題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢(xún)

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼

<source id="11161"></source>

<track id="11161"><th id="11161"><nobr id="11161"></nobr></th></track>