溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

淺談Python3.9 beta2版本發(fā)布的7個新的PEP

發(fā)布時間:2020-07-17 11:39:03 來源:億速云 閱讀:190 作者:小豬 欄目:開發(fā)技術(shù)

小編這次要給大家分享的是淺談Python3.9 beta2版本發(fā)布的7個新的PEP,文章內(nèi)容豐富,感興趣的小伙伴可以來了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。

隨著 Python 3.9.0b1 的發(fā)布,即開發(fā)周期中計劃的四個 beta 版本的首個,Python 3.9 的功能已經(jīng)是完善了。在 10 月發(fā)布最終版本之前,還會有許多測試和穩(wěn)定性方面的工作要做。

(譯注:beta1 版本發(fā)布于 5 月 18 日,作者文章寫于 5 月 20,而到本篇譯文發(fā)布時,beta2 剛好在今天即 6 月 9 日發(fā)布,這是一個巧合?。?/p>

該發(fā)布說明中列出了被 3.9 接受的 7 個 Python 增強提案(PEP)。我們研究了其中的一些 PEP,看到有一些更新。現(xiàn)在似乎是一個介紹 Python 3.9 帶來的一些東西的好時機。

1、字符串操作

有時最簡單(表明上的)的事情最困難,或者至少會引起巨大的討論。其中大部分的爭議是關(guān)于命名(還能是什么?),但是給標(biāo)準(zhǔn)字符串對象添加函數(shù),來刪除前綴和后綴,這種想法是毫無爭議的。

是否可以將那些詞綴(前綴和后綴的統(tǒng)稱)指定為序列,以便在一次調(diào)用中處理多個詞綴,這一點尚不明確,最后它被從提案中刪除了,等待著其他人再次推動更改。

在 3 月底,Dennis Sweeney 在 python-dev 郵件列表上請求核心開發(fā)者支持 PEP 616(“字符串刪除前綴和后綴的方法”)。他指出了自 2019 年 3 月以來關(guān)于該話題的 python-ideas 討論。埃里克·史密斯(Eric V. Smith)同意支持該 PEP,這促使 Sweeney 發(fā)布并啟動了討論。

在最初版本中,他使用 cutprefix() 和 cutsuffix() 作為要添加給字符串對象的方法名。四種類型的 Python 對象將獲得新的方法:str(Unicode 字符串),byte(二進(jìn)制序列),bytearray(可變的二進(jìn)制序列)和 collections.UserString(字符串對象的一種封裝)。

它的寫法如下:

'abcdef'.cutprefix('abc') # 返回'def'
'abcdef'.cutsuffix('ef') # 返回'abcd'

針對命名部分,出現(xiàn)了一大堆的建議。基本上很少有人喜歡“cut”,因此“strip”、“strim”和“remove”被提出來了,并且都獲得了一些支持。

stripprefix() 以及 stripsuffix() 由于 PEP 中指出的一種理由,至少是被部分地反對了;現(xiàn)有的“strip”函數(shù)令人困惑,因此應(yīng)避免重用該名稱。

str.lstrip() 和 str.rstrip() 方法也用于刪除前導(dǎo)字符和尾隨字符,但是它們對于真正在尋找 cutprefix() 功能的程序員來說是一個困惑的來源。

*strip() 在調(diào)用時接收一個字符串參數(shù),但會將其視為一組字符,并從字符串開頭或結(jié)尾消除:

'abcdef'.lstrip('abc') # 返回“def”,符合預(yù)期
'abcbadefed'.lstrip('abc') # 返回'defed',完全不符合預(yù)期

最終,removeprefix() 和 removesuffix() 似乎占據(jù)了上風(fēng),這正是 Sweeney 最終改成的版本。Guido van Rossum 也支持這些名字。

埃里克·法格倫(Eric Fahlgren)這樣搞笑地總結(jié)了命名的爭論:

我認(rèn)為如果你先寫文檔,則名稱的選擇會更容易些:

  • cutprefix - 刪除指定的前綴。
  • trimprefix - 刪除指定的前綴。
  • stripprefix - 刪除指定的前綴。
  • removeprefix - 刪除指定的前綴。廢話 :)

Sweeney 更新了 PEP,回應(yīng)了許多評論,但還增加了提議將字符串元組作為詞綴的功能(可以在 PEP GitHub 倉庫中看到該版本)。

但是史蒂文·達(dá)普拉諾(Steven D'Aprano)不確定這樣做是否合理。他指出,唯一接受元組參數(shù)的字符串操作是 str.startswith() 和 str.endswith(),而它們不返回字符串(只是一個布爾值)。他懷疑添加這一種接收元組參數(shù)卻返回字符串的方法,因為無論選擇何種規(guī)則來處理元組,對于某些人來說都是“錯誤的”選擇。

例如:

這里的困難在于,如果兩個或多個前綴都能匹配,則“剪切這些前綴中的一個”的概念是模棱兩可的。對 startwith 沒有區(qū)別:

"extraordinary".startswith(('ex', 'extra'))

因為是從左到右,從最短到最大,甚至是隨機順序匹配都為True。但是對于 cutprefix,應(yīng)該刪除哪個前綴?

如他所說,建議的規(guī)則是使用從左到右處理元組的第一個匹配字符串,但是有些人可能想要最長的匹配或最后一個匹配;這一切都取決于使用的上下文。他建議在提交添加此類行為之前,要給該功能更多的“浸泡時間”(譯注:即預(yù)備時間):“在添加多前綴/后綴的支持之前,我們首先應(yīng)該對簡單的情況進(jìn)行一些實際的體驗?!?/p>

伊?!じヂ‥than Furman)同意達(dá)普拉諾(D'Aprano)的意見。但是維克托·斯汀納(Victor Stinner)強烈贊成元組參數(shù)的想法,只不過,他還想知道當(dāng)傳入的元組有空字符串時,會怎么處理。根據(jù) PEP 提議,在處理元組時遇到空字符串(實際上可以匹配任何內(nèi)容)只會返回原始字符串,這會導(dǎo)致令人驚訝的結(jié)果:

cutsuffix("Hello World", ("", " World"))  # 返回 "Hello World"
cutsuffix("Hello World", (" World", ""))  # 返回 "Hello"

這個例子不太明顯;詞綴不一定是硬編碼的,因此空字符串可能會溜進(jìn)意想不到的位置。Stinner 建議如果遇到空字符串,則拋出 ValueError,類似于 str.split()。但是 Sweeney 決定完全刪除元組參數(shù)功能,以便“允許對此有更強見解的人在另外的 PEP 中提出并捍衛(wèi)一系列的語義”。他在 3 月 28 日發(fā)布了該 PEP 的最新版本。

4 月 9 日,Sweeney 發(fā)起了一個指導(dǎo)委員會 issue,請求對其 PEP 進(jìn)行評審。4 月 20 日,Stinner 代表委員會接受了該提案。

這是一個很小的更改,但值得花時間確保它具有長期適用的接口(和語義)。我們將在 Python 3.9 中看到 removeprefix() 和removesuffix()。

2、新解析器

并不令人感到驚訝的是,指導(dǎo)委員會已經(jīng)接受了我們在 4 月中旬介紹過的 CPython 新解析器。PEP 617(“CPython 新的 PEG 解析器”)由 Python 創(chuàng)始人即前仁慈的獨裁者(BDFL) Guido van Rossum 以及 Pablo Galindo Salgado 和 Lysandros Nikolaou 共同提出。

它已經(jīng)運行良好,并且在現(xiàn)有解析器的速度和內(nèi)存使用方面提升了 10% 以內(nèi)的性能。由于解析器是基于解析表達(dá)語法(PEG),因此也將簡化語言規(guī)范。CPython 現(xiàn)有的 LL(1) 解析器存在諸多缺點和一些 hack,新的解析器將會消除掉。

這一更改為 Python 超越 LL(1) 語法鋪平了道路,盡管現(xiàn)有語言并不完全是 LL(1)。這一更改不會太快,因為計劃是在 Python 3.9 的命令行中提供開關(guān),保持現(xiàn)有解析器可用。

但是 Python 3.10 將刪除現(xiàn)有的解析器,這可能會導(dǎo)致語言變更。如果做了那些更改,那么,其它的 Python 實現(xiàn)(例如 PyPy 和 MicroPython)就需要切換解析器的 LL(1) 實現(xiàn),以便跟上語言規(guī)范的要求。這可能會使核心開發(fā)者暫停進(jìn)行此類更改。

3、更多內(nèi)容

我們在三月初查看了 PEP 615(“在標(biāo)準(zhǔn)庫中支持 IANA 時區(qū)數(shù)據(jù)庫”)。它將在標(biāo)準(zhǔn)庫中添加一個zoneinfo 模塊,該模塊將有助于從 IANA 時區(qū)數(shù)據(jù)庫中(也稱為“Olson數(shù)據(jù)庫”)獲取時區(qū)信息,以填充時區(qū)對象。在撰寫本文時,它看起來很順利。

在 3 月底,Paul Ganssle 請求就該 PEP 作出決議。他認(rèn)為在一個有趣的時間范圍內(nèi)接受它,可能會很有趣:

... 我希望(出于異想天開的原因)在 4 月 5 日(星期日)UTC 時間 02:00-04:00 或 13:00-17:30 之間接受它,因為這些時間代表著地球上某些地方的不明確時間(主要在澳大利亞)。還有另一個時機,那就是在 4 月 19 日星期日 UTC 01:00-03:00 之間,這段時間在西撒哈拉是不明確的。
他意識到這可能難以實現(xiàn),它當(dāng)然不是優(yōu)先考慮的事。指導(dǎo)委員會沒有錯過第二個時間窗太多;Barry Warsaw 于 4 月 20 日宣布接受該 PEP。

Python 現(xiàn)在將具有一種機制來訪問系統(tǒng)的時區(qū)數(shù)據(jù)庫,以創(chuàng)建和處理時區(qū)。另外,Python 軟件包索引(PyPI)中有一個 tzdata 模塊,它為缺少 IANA 數(shù)據(jù)的系統(tǒng)提供這些數(shù)據(jù);它將由 Python 核心開發(fā)者維護(hù)。

PEP 593(“靈活的函數(shù)和變量注釋”)添加了一種將上下文特定的(context-specific)元數(shù)據(jù)與函數(shù)和變量關(guān)聯(lián)的方法。實際上,type hint 注解已擠出了很多年前在 Python 3.0 中實現(xiàn)的 PEP 3107(“函數(shù)注釋”)中設(shè)想的其它用例。PEP 593 使用注解的(Annotated)類型提示為這些用例創(chuàng)建了一種新的機制。

PEP 585(“標(biāo)準(zhǔn)集合中的類型提示泛型”)提供了另一種清除方法。它將允許刪除在 typing 模塊中維護(hù)的一組并行的類型別名,以支持泛型。例如,type.List 類型將不再需要支持諸如“dict[str,list[int]]”之類的注解(例如,一個帶有字符串鍵和整數(shù)列表的值的字典)。

字典“加法”的聯(lián)合操作也會是 Python 3.9 的一部分。它曾不時引起爭議,但是 2 月中旬,PEP 584(“給字典添加聯(lián)合操作符”)被 Van Rossum 推薦采納。指導(dǎo)委員會迅速同意了,該特性于 2 月 24 日合入。

最后一個 PEP 是 PEP 602(“Python 的年度發(fā)布周期”)。如提案所書,它將發(fā)布節(jié)奏從每 18 個月更改為每年一次。但是,開發(fā)和發(fā)布周期是重疊的,因此整個功能開發(fā)需要 12 個月的時間。當(dāng)?shù)谝粋€ Python 3.9 beta 版本發(fā)布時(即現(xiàn)在),Python 3.10 的功能開發(fā)就開始了。請繼續(xù)關(guān)注來年的下一輪 PEP。

看完這篇關(guān)于淺談Python3.9 beta2版本發(fā)布的7個新的PEP的文章,如果覺得文章內(nèi)容寫得不錯的話,可以把它分享出去給更多人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI