溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python正則表達(dá)式匹配中文的方法

發(fā)布時(shí)間:2020-07-21 14:31:33 來(lái)源:億速云 閱讀:634 作者:小豬 欄目:開(kāi)發(fā)技術(shù)

這篇文章主要講解了Python正則表達(dá)式匹配中文的方法,內(nèi)容清晰明了,對(duì)此有興趣的小伙伴可以學(xué)習(xí)一下,相信大家閱讀完之后會(huì)有幫助。

用 '[\u4e00-\u9fa5]‘ 匹配中文

在字符串中匹配中文

示例:

匹配字符串中的第一個(gè)中文字符

Python正則表達(dá)式匹配中文的方法

匹配字符串中的第一個(gè)連續(xù)的中文片段

Python正則表達(dá)式匹配中文的方法

匹配字符串中的所有中文字符

Python正則表達(dá)式匹配中文的方法

Python正則表達(dá)式匹配中文的方法

注:要確保正則字符和匹配文本是 unicode 范圍內(nèi)的編碼。

其他 擴(kuò)充 范圍

幾個(gè)主要非英文語(yǔ)系字符范圍:
2E80~33FFh:中日韓符號(hào)區(qū)。收容康熙字典部首、中日韓輔助部首、注音符號(hào)、日本假名、韓文音符,中日韓的符號(hào)、標(biāo)點(diǎn)、帶圈或帶括符文數(shù)字、月份,以及日本的假名組合、單位、年號(hào)、月份、日期、時(shí)間等。
3400~4DFFh:中日韓認(rèn)同表意文字?jǐn)U充A區(qū),總計(jì)收容6,582個(gè)中日韓漢字。
4E00~9FFFh:中日韓認(rèn)同表意文字區(qū),總計(jì)收容20,902個(gè)中日韓漢字。
A000~A4FFh:彝族文字區(qū),收容中國(guó)南方彝族文字和字根。
AC00~D7FFh:韓文拼音組合字區(qū),收容以韓文音符拼成的文字。
F900~FAFFh:中日韓兼容表意文字區(qū),總計(jì)收容302個(gè)中日韓漢字。
FB00~FFFDh:文字表現(xiàn)形式區(qū),收容組合拉丁文字、希伯來(lái)文、阿拉伯文、中日韓直式標(biāo)點(diǎn)、小符號(hào)、半角符號(hào)、全角符號(hào)等。

看完上述內(nèi)容,是不是對(duì)Python正則表達(dá)式匹配中文的方法有進(jìn)一步的了解,如果還想學(xué)習(xí)更多內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI