溫馨提示×

C#字符串處理中Unicode和UTF-8怎么用

c#
小億
958
2024-04-28 18:56:45
欄目: 編程語言

在C#中,Unicode和UTF-8都是用來表示字符編碼的方式。Unicode是一種字符集,定義了每個字符對應的唯一代碼點,而UTF-8是一種編碼方式,用來將Unicode字符編碼為字節(jié)序列。

在C#中,可以使用Encoding.UnicodeEncoding.UTF8類來進行Unicode和UTF-8編碼的轉(zhuǎn)換。下面是一個示例代碼:

using System;
using System.Text;

class Program
{
    static void Main()
    {
        string unicodeString = "你好";
        
        // 將Unicode字符串編碼為UTF-8字節(jié)序列
        byte[] utf8Bytes = Encoding.UTF8.GetBytes(unicodeString);
        Console.WriteLine("UTF-8 bytes: " + BitConverter.ToString(utf8Bytes));

        // 將UTF-8字節(jié)序列解碼為Unicode字符串
        string decodedString = Encoding.UTF8.GetString(utf8Bytes);
        Console.WriteLine("Decoded string: " + decodedString);
    }
}

在上面的示例中,我們首先將Unicode字符串"你好"編碼為UTF-8字節(jié)序列,然后將UTF-8字節(jié)序列解碼為Unicode字符串。可以看到,通過使用Encoding.UTF8類,我們可以方便地進行Unicode和UTF-8之間的轉(zhuǎn)換。

1