您好,登錄后才能下訂單哦!
這篇文章主要介紹了python判斷中文是否一致的方法,具有一定借鑒價(jià)值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。
Python判斷兩個(gè)相等的中文字符串為false,將兩個(gè)待比較的字符串都把unicode編碼設(shè)為‘utf-8’也不能解決問題,具體原因如下:
1、首先查看待比較兩個(gè)字符串的編碼格式 ,使用命令:
import chardet ...... string_code = chardet.detect(string_word)
比較兩個(gè)字符串的編碼結(jié)果,如下圖所示:
一個(gè)編碼格式為‘UTF-8-SIG',另一個(gè)編碼格式為‘utf-8',兩個(gè)字符串的編碼格式不同,所以比較的結(jié)果為不相等;
出現(xiàn)編碼為‘UTF-8-SIG'是因?yàn)槲募诖鎯Φ臅r(shí)候以UTF-8格式編碼保存,將文件以UTF-8無BOM格式編碼存儲,則讀取出的數(shù)據(jù)編碼格式自然變?yōu)椤畊tf-8'。
2、文件以UTF-8無BOM格式編碼重新存儲,重新比較兩個(gè)相等的字符串,返回值為True,即兩個(gè)字符串相等。
感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享python判斷中文是否一致的方法內(nèi)容對大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,遇到問題就找億速云,詳細(xì)的解決方法等著你來學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。