使用python怎么去掉 unicode 字符串前面的u

發(fā)布時(shí)間：2021-05-20 16:18:21 來(lái)源：億速云閱讀：421 作者：Leah 欄目：開(kāi)發(fā)技術(shù)

使用python怎么去掉 unicode 字符串前面的u？針對(duì)這個(gè)問(wèn)題，這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答，希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。

有時(shí)我們會(huì)碰到類似下面這樣的 unicode 字符串：

u'\xe4\xbd\xa0\xe5\xa5\xbd'

這明顯不是一個(gè)正確的 unicode 字符串，可能是在哪個(gè)地方轉(zhuǎn)碼轉(zhuǎn)錯(cuò)了。

我們要想得到正確的 unicode 字符串首先就必須先將這個(gè)字符串轉(zhuǎn)成非 unicode 字符串，然后再進(jìn)行解碼。按照普通的辦法進(jìn)行 encode 肯定是不行的，因?yàn)檫@不是一個(gè)正確的 unicode 字符串：

In [1]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
Out[1]: '\xc3\xa4\xc2\xbd\xc2\xa0\xc3\xa5\xc2\xa5\xc2\xbd'

In [2]: print u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('utf8')
盲陸聽(tīng)氓樓陸
那如何才能得到我們想要的 \xe4\xbd\xa0\xe5\xa5\xbd 呢？

python 提供了一個(gè)特殊的編碼（ raw_unicode_escape ）用來(lái)處理這種情況：

In [4]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape')
Out[4]: '\xe4\xbd\xa0\xe5\xa5\xbd'

In [5]: u'\xe4\xbd\xa0\xe5\xa5\xbd'.encode('raw_unicode_escape').decode('utf8')
Out[5]: u'\u4f60\u597d'

In [7]: print u'\u4f60\u597d'
你好

python的數(shù)據(jù)類型有哪些?

python的數(shù)據(jù)類型：1. 數(shù)字類型，包括int（整型）、long（長(zhǎng)整型）和float（浮點(diǎn)型）。2.字符串，分別是str類型和unicode類型。3.布爾型，Python布爾類型也是用于邏輯運(yùn)算，有兩個(gè)值：True（真）和False（假）。4.列表，列表是Python中使用最頻繁的數(shù)據(jù)類型，集合中可以放任何數(shù)據(jù)類型。5. 元組，元組用”()”標(biāo)識(shí)，內(nèi)部元素用逗號(hào)隔開(kāi)。6. 字典，字典是一種鍵值對(duì)的集合。7. 集合，集合是一個(gè)無(wú)序的、不重復(fù)的數(shù)據(jù)組合。

關(guān)于使用python怎么去掉 unicode 字符串前面的u問(wèn)題的解答就分享到這里了，希望以上內(nèi)容可以對(duì)大家有一定的幫助，如果你還有很多疑惑沒(méi)有解開(kāi)，可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識(shí)。

向AI問(wèn)一下細(xì)節(jié)

使用python怎么去掉 unicode 字符串前面的u

python的數(shù)據(jù)類型有哪些?

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽