溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

asp.net中C#怎么獲取字符串中漢字的個(gè)數(shù)

發(fā)布時(shí)間:2021-09-10 17:11:44 來源:億速云 閱讀:124 作者:chen 欄目:開發(fā)技術(shù)

本篇內(nèi)容介紹了“asp.net中C#怎么獲取字符串中漢字的個(gè)數(shù)”的有關(guān)知識(shí),在實(shí)際案例的操作過程中,不少人都會(huì)遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

符串可以包括數(shù)字,字母,漢字或者其他的字符。使用Char類型的IsDigit靜態(tài)方法可以判斷字符串中的字符是否為數(shù)字,使用Char類型中的IsLetter靜態(tài)方法可以判斷字符串中是否為字母。我們來實(shí)現(xiàn)一種方法來實(shí)現(xiàn)判斷字符串中是否為漢字,通過此方法可以計(jì)算字符串中漢字的個(gè)數(shù),運(yùn)行效果如圖:

asp.net中C#怎么獲取字符串中漢字的個(gè)數(shù)

首先根據(jù)效果圖設(shè)置好Form的界面和內(nèi)容,Box1.Text為輸入的字符串,我們對(duì)該字符串的處理,來計(jì)算漢字的個(gè)數(shù),雙擊Buton控件,編輯其單擊事件代碼。

我們看下漢字的Unicode范圍,普遍給出了0x4E00到0x9FA5,只要我們接受到的字符的16進(jìn)制編碼在此范圍,我們就認(rèn)為此字符為漢字(label4.Text顯示漢字的個(gè)數(shù))

復(fù)制代碼 代碼如下:


string a=Box1.Text;
int K = 0;
for (int i = 0; i < a.Length;i++ )
{
char j=a[i];
ushort s = j;
if (s >= 0x4E00&&s<=0x9FA5)
{
K++;
}
label4.Text = “” + K;

后再再整理了一些函數(shù) C#中使用正則表達(dá)式來從字符串中判斷出漢字

復(fù)制代碼 代碼如下:


//首先引用命名空間
using System.Text.RegularExpressions;

//定義一個(gè)函數(shù),返回字符串中的漢字個(gè)數(shù)
public static int GetHanNumFromString(string str)
{
    int count = 0;
    Regex regex = new Regex(@"^[u4E00-u9FA5]{0,}$");

    for (int i = 0; i < str.Length; i++)
    {
        if (regex.IsMatch(str[i].ToString()))
        {
            count++;
        }
    }

    return count;
}

代碼說明:

1、Unicode字符的u4E00到u9FA5之間為漢字編碼,所以使用它來表示漢字的正則匹配范圍。
2、字符串可以直接進(jìn)行索引,索引得到的值的數(shù)據(jù)類型為char,所以str[i].ToString()是為了把char再度轉(zhuǎn)換為字符串。
3、使用Regex的IsMatch方法,可以判斷字符串是否與給定的正則表達(dá)式匹配,如果匹配成功則返回True,否則為False。

例,獲取一個(gè)字符串中的漢字的個(gè)數(shù) C#獲取字符串全角的個(gè)數(shù)

復(fù)制代碼 代碼如下:


static void Main(string[] args)
        {
            while (true)
            {

      Console.WriteLine("輸入一串字符");
                string str = Console.ReadLine();//定義一個(gè)變量str用來存儲(chǔ)輸入的字符串
                int num= Encoding.Default.GetByteCount(str);//Encoding.Default.GetByteCount(str)在系統(tǒng)默認(rèn)下計(jì)算對(duì)字符進(jìn)行編碼是所產(chǎn)生的字節(jié)數(shù)
                int len = str.Length;//獲取字符串的長(zhǎng)度
                Console.WriteLine("有{0}漢字",num-len);//num-len就是字符串中的漢字個(gè)數(shù)         
            }
}

例,這個(gè)也是正常的

復(fù)制代碼 代碼如下:


ArrayList itemList = new ArrayList();
CharEnumerator CEnumerator = textBox1.Text.GetEnumerator();
Regex regex = new Regex("^[/u4E00-/u9FA5]{0,}$");
while (CEnumerator.MoveNext())
{
     if(regex.IsMatch(CEnumerator.Current.ToString(),0))
         itemList.Add(CEnumerator.Current.ToString());
     textBox2.Text = itemList.Count.ToString();
}

原理是:獲得字符串中漢字的個(gè)數(shù)時(shí),可以首先定義一個(gè)與漢字相匹配的正則表達(dá)式,然后使用CharEnumerator對(duì)象的MoveNext方法循環(huán)訪問字符串中的每個(gè)字符,如果訪問的字符與定義的正則表達(dá)式相匹配,則將其添加到一個(gè)數(shù)組中,最后獲得該數(shù)組的項(xiàng)數(shù)即為字符串中漢字的個(gè)數(shù)。

“asp.net中C#怎么獲取字符串中漢字的個(gè)數(shù)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI