您好,登錄后才能下訂單哦!
使用python怎么去掉 unicode 字符串前面的u?針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。
有時(shí)我們會(huì)碰到類似下面這樣的 unicode 字符串:
u'\xe4\xbd\xa0\xe5\xa5\xbd'
這明顯不是一個(gè)正確的 unicode 字符串,可能是在哪個(gè)地方轉(zhuǎn)碼轉(zhuǎn)錯(cuò)了。
我們要想得到正確的 unicode 字符串首先就必須先將這個(gè)字符串轉(zhuǎn)成非 unicode 字符串, 然后再進(jìn)行解碼。按照普通的辦法進(jìn)行 encode 肯定是不行的,因?yàn)檫@不是一個(gè)正確的 unicode 字符串:
In [1]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8') Out[1]: '\xc3\xa4\xc2\xbd\xc2\xa0\xc3\xa5\xc2\xa5\xc2\xbd' In [2]: print u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8') 盲陸聽(tīng)氓樓陸 那如何才能得到我們想要的 \xe4\xbd\xa0\xe5\xa5\xbd 呢? python 提供了一個(gè)特殊的編碼( raw_unicode_escape )用來(lái)處理這種情況: In [4]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape') Out[4]: '\xe4\xbd\xa0\xe5\xa5\xbd' In [5]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape').decode('utf8') Out[5]: u'\u4f60\u597d' In [7]: print u'\u4f60\u597d' 你好
python的數(shù)據(jù)類型:1. 數(shù)字類型,包括int(整型)、long(長(zhǎng)整型)和float(浮點(diǎn)型)。2.字符串,分別是str類型和unicode類型。3.布爾型,Python布爾類型也是用于邏輯運(yùn)算,有兩個(gè)值:True(真)和False(假)。4.列表,列表是Python中使用最頻繁的數(shù)據(jù)類型,集合中可以放任何數(shù)據(jù)類型。5. 元組,元組用”()”標(biāo)識(shí),內(nèi)部元素用逗號(hào)隔開(kāi)。6. 字典,字典是一種鍵值對(duì)的集合。7. 集合,集合是一個(gè)無(wú)序的、不重復(fù)的數(shù)據(jù)組合。
關(guān)于使用python怎么去掉 unicode 字符串前面的u問(wèn)題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒(méi)有解開(kāi),可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識(shí)。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。