溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python拼接字符串的7種方法總結(jié)

發(fā)布時(shí)間:2020-10-18 12:07:25 來源:腳本之家 閱讀:148 作者:Python貓 欄目:開發(fā)技術(shù)

前言

忘了在哪看到一位編程大牛調(diào)侃,他說程序員每天就做兩件事,其中之一就是處理字符串。相信不少同學(xué)會(huì)有同感。

在Python中,我們經(jīng)常會(huì)遇到字符串的拼接問題,幾乎任何一種編程語言,都把字符串列為最基礎(chǔ)和不可或缺的數(shù)據(jù)類型。而拼接字符串是必備的一種技能。今天,我跟大家一起來學(xué)習(xí)Python拼接字符串的七種方式。

下面話不多說了,來一起看看詳細(xì)的介紹吧

1、來自C語言的%方式

print('%s %s' % ('Hello', 'world'))
>>> Hello world

%號(hào)格式化字符串的方式繼承自古老的C語言,這在很多編程語言都有類似的實(shí)現(xiàn)。上例的%s是一個(gè)占位符,它僅代表一段字符串,并不是拼接的實(shí)際內(nèi)容。實(shí)際的拼接內(nèi)容在一個(gè)單獨(dú)的%號(hào)后面,放在一個(gè)元組里。

類似的占位符還有:%d(代表一個(gè)整數(shù))、%f(代表一個(gè)浮點(diǎn)數(shù))、%x(代表一個(gè)16進(jìn)制數(shù)),等等。%占位符既是這種拼接方式的特點(diǎn),同時(shí)也是其限制,因?yàn)槊糠N占位符都有特定意義,實(shí)際使用起來太麻煩了。

2、format()拼接方式

# 簡潔版
s1 = 'Hello {}! My name is {}.'.format('World', 'Python貓')
print(s1)
>>>Hello World! My name is Python貓.

# 對(duì)號(hào)入座版
s2 = 'Hello {0}! My name is {1}.'.format('World', 'Python貓')
s3 = 'Hello {name1}! My name is {name2}.'.format(name1='World', name2='Python貓')
print(s2)
>>>Hello World! My name is Python貓.
print(s3)
>>>Hello World! My name is Python貓.

這種方式使用花括號(hào){}做占位符,在format方法中再轉(zhuǎn)入實(shí)際的拼接值。容易看出,它實(shí)際上是對(duì)%號(hào)拼接方式的改進(jìn)。這種方式在Python2.6中開始引入。

上例中,簡潔版的花括號(hào)中無內(nèi)容,缺點(diǎn)是容易弄錯(cuò)次序。對(duì)號(hào)入座版主要有兩種,一種傳入序列號(hào),一種則使用key-value的方式。實(shí)戰(zhàn)中,我們更推薦后一種,既不會(huì)數(shù)錯(cuò)次序,又更直觀可讀。

3、() 類似元組方式

s_tuple = ('Hello', ' ', 'world')
s_like_tuple = ('Hello' ' ' 'world')

print(s_tuple) 
>>>('Hello', ' ', 'world')
print(s_like_tuple) 
>>>Hello world

type(s_like_tuple) >>>str

注意,上例中s_like_tuple并不是一個(gè)元組,因?yàn)樵亻g沒有逗號(hào)分隔符,這些元素間可以用空格間隔,也可以不要空格。使用type()查看,發(fā)現(xiàn)它就是一個(gè)str類型。我沒查到這是啥原因,猜測或許()括號(hào)中的內(nèi)容是被Python優(yōu)化處理了。

這種方式看起來很快捷,但是,括號(hào)()內(nèi)要求元素是真實(shí)字符串,不能混用變量,所以不夠靈活。

# 多元素時(shí),不支持有變量
str_1 = 'Hello'
str_2 = (str_1 'world')
>>> SyntaxError: invalid syntax
str_3 = (str_1 str_1)
>>> SyntaxError: invalid syntax
# 但是下面寫法不會(huì)報(bào)錯(cuò)
str_4 = (str_1)

4、面向?qū)ο竽0迤唇?/strong>

from string import Template
s = Template('${s1} ${s2}!') 
print(s.safe_substitute(s1='Hello',s2='world')) 
>>> Hello world!

說實(shí)話,我不喜歡這種實(shí)現(xiàn)方式。濃濃的一股被面向?qū)ο笏枷攵竞Φ某粑丁?/p>

就不多說了。

5、常用的+號(hào)方式

str_1 = 'Hello world! ' 
str_2 = 'My name is Python貓.'
print(str_1 + str_2)
>>>Hello world! My name is Python貓.
print(str_1)
>>>Hello world! 

這種方式最常用、直觀、易懂,是入門級(jí)的實(shí)現(xiàn)方式。但是,它也存在兩處讓人容易犯錯(cuò)的地方。

首先,新入門編程的同學(xué)容易犯錯(cuò),他們不知道字符串是不可變類型,新的字符串會(huì)獨(dú)占一塊新的內(nèi)存,而原來的字符串保持不變。上例中,拼接前有兩段字符串,拼接后實(shí)際有三段字符串。

其次,一些有經(jīng)驗(yàn)的老程序員也容易犯錯(cuò),他們以為當(dāng)拼接次數(shù)不超過3時(shí),使用+號(hào)連接符就會(huì)比其它方式快(ps:不少Python教程都是如此建議),但這沒有任何合理根據(jù)。

事實(shí)上,在拼接短的字面值時(shí),由于CPython中的 常數(shù)折疊 (constant folding)功能,這些字面值會(huì)被轉(zhuǎn)換成更短的形式,例如'a'+'b'+'c' 被轉(zhuǎn)換成'abc','hello'+'world'也會(huì)被轉(zhuǎn)換成'hello world'。這種轉(zhuǎn)換是在編譯期完成的,而到了運(yùn)行期時(shí)就不會(huì)再發(fā)生任何拼接操作,因此會(huì)加快整體計(jì)算的速度。

常數(shù)折疊優(yōu)化有一個(gè)限度,它要求拼接結(jié)果的長度不超過20。所以,當(dāng)拼接的最終字符串長度不超過20時(shí),+號(hào)操作符的方式,會(huì)比后面提到的join等方式快得多,這與+號(hào)的使用次數(shù)無關(guān)。

題外話:你是否覺得20這個(gè)數(shù)字很熟悉呢?沒錯(cuò),我們之前在《Python中的“特權(quán)種族”是什么?》中提到過,字符串類的特權(quán)種族也是以20為限。當(dāng)時(shí)也有一個(gè)例子,展示了編譯期和運(yùn)行期的區(qū)別,建議你去回看。

6、join()拼接方式

str_list = ['Hello', 'world']
str_join1 = ' '.join(str_list)
str_join2 = '-'.join(str_list)
print(str_join1) >>>Hello world
print(str_join2) >>>Hello-world

str對(duì)象自帶的join()方法,接受一個(gè)序列參數(shù),可以實(shí)現(xiàn)拼接。拼接時(shí),元素若不是字符串,需要先轉(zhuǎn)換一下??梢钥闯?,這種方法比較適用于連接序列對(duì)象中(例如列表)的元素,并設(shè)置統(tǒng)一的間隔符。

當(dāng)拼接長度超過20時(shí),這種方式基本上是首選。不過,它的缺點(diǎn)就是,不適合進(jìn)行零散片段的、不處于序列集合的元素拼接。

7、f-string方式

name = 'world'
myname = 'python_cat'
words = f'Hello {name}. My name is {myname}.'
print(words)
>>> Hello world. My name is python_cat.

f-string方式出自PEP 498(Literal String Interpolation,字面字符串插值),從Python3.6版本引入。其特點(diǎn)是在字符串前加 f 標(biāo)識(shí),字符串中間則用花括號(hào){}包裹其它字符串變量。

這種方式在可讀性上秒殺format()方式,處理長字符串的拼接時(shí),速度與join()方法相當(dāng)。

盡管如此,這種方式與其它某些編程語言相比,還是欠優(yōu)雅,因?yàn)樗肓艘粋€(gè) f 標(biāo)識(shí)。而其它某些程序語言可以更簡練,比如shell:

name="world"
myname="python_cat"
words="Hello ${name}. My name is ${myname}."
echo $words
>>>Hello world. My name is python_cat.

總結(jié)一下,我們前面說的“字符串拼接”,其實(shí)是從結(jié)果上理解。若從實(shí)現(xiàn)原理上劃分的話,我們可以將這些方法劃分出三種類型:

格式化類:%、format()、template

拼接類:+、()、join()

插值類:f-string

當(dāng)要處理字符串列表等序列結(jié)構(gòu)時(shí),采用join()方式;拼接長度不超過20時(shí),選用+號(hào)操作符方式;長度超過20的情況,高版本選用f-string,低版本時(shí)看情況使用format()或join()方式。

One more thing:

你以為這就要結(jié)束了?

圖樣!這不是我的風(fēng)格!

我的風(fēng)格是發(fā)散思考、系統(tǒng)思考、以及追求編程哲學(xué)的思考。

最近,我在讀《黑客與畫家》,保羅•格雷厄姆在書中提出了這個(gè)問題:

從語義上看,字符串或多或少可以理解成列表的一個(gè)子集,其中的每一個(gè)元素都是字符。那么,為什么還需要把字符串單列為一種數(shù)據(jù)結(jié)構(gòu)呢?

作者認(rèn)為“編程語言設(shè)置字符串似乎就是一個(gè)過早優(yōu)化的例子”,這個(gè)觀點(diǎn)令我大為震撼!前文提到的七種拼接字符串的方法瞬間變成紙,薄得似乎一觸就破。

但是,作者認(rèn)為這還不夠,他還有更驚人想法:

還有比這更驚人的預(yù)言。在邏輯上其實(shí)不需要對(duì)整數(shù)設(shè)置單獨(dú)的表示法,因?yàn)榭梢园阉鼈円部醋髁斜?,整?shù)n可以用一個(gè)n元素的列表表示?!?編程語言會(huì)發(fā)展到放棄基本數(shù)據(jù)類型之一的整數(shù)這一步嗎?

不知道你讀完這段話,有何感想。我在閱讀時(shí),雖然有上下文語境的鋪墊,還是驚嘆不已。

在此,先行預(yù)告一下:下期薦書系列的書目是《黑客與畫家》,到時(shí)候,還會(huì)有幸運(yùn)抽獎(jiǎng),送出一本《黑客與畫家》,敬請留意。

附幾個(gè)相關(guān)PEP鏈接:

  • https://www.python.org/dev/peps/pep-0215/
  • https://www.python.org/dev/peps/pep-0292/
  • https://www.python.org/dev/peps/pep-3101/
  • https://www.python.org/dev/peps/pep-0498/

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,如果有疑問大家可以留言交流,謝謝大家對(duì)億速云的支持。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI