您好,登錄后才能下訂單哦!
本篇內(nèi)容介紹了“.NET Compact Framework中解碼GB2312怎么實(shí)現(xiàn)”的有關(guān)知識(shí),在實(shí)際案例的操作過程中,不少人都會(huì)遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
代碼如下:
Imports System.Text Imports System.IO Module Module1Module Module1 Sub Main()Sub Main() Dim sr As New StreamReader("D:gb2312.txt") Dim fs As New FileStream("D:gb2312.dat", FileMode.Create) Dim sw As New BinaryWriter(fs) For i As Integer = 1 To 70 sr.ReadLine() Next Do Until sr.EndOfStream Dim ss As String() = sr.ReadLine.Split Dim HEX As Short = CShort(Val(ss(1).Replace("0x", "&H"))) Dim offset As Integer = (CInt(Val(ss(0).Replace("0x", "&H"))) - &H2121) * 2 sw.BaseStream.Position = offset sw.Write(HEX) Loop sw.Close() End Sub End Module
使用的時(shí)候?qū)⒂獯a的GB2312編碼減去0x8080,再減去0x2121(偏移),也就是說減去0xA1A1,然后將 FileStream.Position指向所得到的結(jié)果的2倍(兩個(gè)字節(jié)一個(gè)碼)并讀取一個(gè)Int16就可以得到對(duì)應(yīng)的Unicode碼。下面是我在掌 心IP通中的一段代碼。
public class GB2312ToUnicode { private FileStream fs; private BinaryReader br; public GB2312ToUnicode(string index) { fs=new FileStream(index, FileMode.Open); br = new BinaryReader(fs); } public char Convert(byte[] b) { int index = ((b[0] << 8) + b[1] - 0xa1a1)*2; fs.Position = index; int tmp = (int)br.ReadInt16() & 0xFFFF; return System.Convert.ToChar(tmp); } ~GB2312ToUnicode() { br.Close(); } }
這樣就方便的得到了GB2312的解碼器。
另外,如果打開GB2312.DAT文件可以看到,數(shù)據(jù)中有很多的0。本來可以通過重新計(jì)算偏移的方法來壓縮數(shù)據(jù),但是考慮到PocketPC上面的速度,尤其是要解碼大量文本的時(shí)候,就只好用空間換取時(shí)間了。
“.NET Compact Framework中解碼GB2312怎么實(shí)現(xiàn)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。