溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么在python中將中文數(shù)字轉(zhuǎn)換成阿拉伯?dāng)?shù)字

發(fā)布時(shí)間:2021-03-11 15:00:15 來源:億速云 閱讀:259 作者:Leah 欄目:開發(fā)技術(shù)

本篇文章為大家展示了怎么在python中將中文數(shù)字轉(zhuǎn)換成阿拉伯?dāng)?shù)字,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過這篇文章的詳細(xì)介紹希望你能有所收獲。

正則表達(dá)式提取文本中的數(shù)字

import re
m0 = "在一九四九年新中國(guó)成立比一九九零年低百分之五點(diǎn)二人一九九六年擊敗俄軍,取得實(shí)質(zhì)獨(dú)立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[〇一二三四五六七八九零壹貳叁肆伍陸柒捌玖貮兩]{4,}'
time1 = re.findall(pattrern1,m0)#轉(zhuǎn)化數(shù)字

提取年份如:‘1949', ‘1990', ‘1996'

這里給出許多正則表達(dá)式的樣例:example

中文轉(zhuǎn)化成阿拉伯?dāng)?shù)字

創(chuàng)建一個(gè)字典然后講數(shù)字進(jìn)項(xiàng)匹配:

CN_NUM = {
 '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
 '壹': 1, '貳': 2, '叁': 3, '肆': 4, '伍': 5, '陸': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '兩': 2,}

for i in range(len(time1)):
 new_str = ''
 for j in time1[i]:
 new_str += str(CN_NUM[j])
 time1[i] = new_str
time1

這樣結(jié)果就出來啦,成功將上文例子中文年份轉(zhuǎn)化成阿拉伯?dāng)?shù)字:‘1949', ‘1990', ‘1996'

完整代碼

# 2、將句子中年份的大寫數(shù)字改為阿拉伯?dāng)?shù)字
import re
m0 = "在一九四九年新中國(guó)成立比一九九零年低百分之五點(diǎn)二人一九九六年擊敗俄軍,取得實(shí)質(zhì)獨(dú)立"
pattrern1 = '[零一二三四五六七八九]{4,}'
pattrern2 = '[〇一二三四五六七八九零壹貳叁肆伍陸柒捌玖貮兩]{4,}'
time1 = re.findall(pattrern1,m0)#轉(zhuǎn)化數(shù)字
CN_NUM = {
 '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0,
 '壹': 1, '貳': 2, '叁': 3, '肆': 4, '伍': 5, '陸': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '兩': 2,}

for i in range(len(time1)):
 new_str = ''
 for j in time1[i]:
 new_str += str(CN_NUM[j])
 time1[i] = new_str
time1

上述內(nèi)容就是怎么在python中將中文數(shù)字轉(zhuǎn)換成阿拉伯?dāng)?shù)字,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI