溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

JsonCpp第五課 讀取帶BOM的UTF-8編碼文本

發(fā)布時間:2020-07-03 04:58:04 來源:網(wǎng)絡 閱讀:480 作者:fengyuzaitu 欄目:編程語言

知識解讀
?????????????在Windows通過記事本打開的UTF-8編碼文件,默認會在保存的時候,往文件開頭多添加三個字節(jié)EF BB BF,表明文本的編碼方式是UTF-8,這種技術(shù)就叫做BOM(Byte Order Mark,就是字節(jié)序標記)。在Unix或者Linux操作系統(tǒng)中不會出現(xiàn)這種情況。如果該文本是ANSI格式編碼的,也沒有添加其他的字符。


文本內(nèi)容讀取差異
帶有BOM的文本字節(jié)流
"锘縖\r\n{\r\n\t\"version\": \"1.0.0\",\r\n\t\"messagetype\": \"alarm\",\r\n\t\"cmdtype\": 10009,\r\n\t\"sn\":\"202039248932482934\"

不帶BOM的文本字節(jié)流
"[\r\n{\r\n\t\"version\": \"1.0.0\",\r\n\t\"messagetype\": \"alarm\",\r\n\t\"cmdtype\": 10009,\r\n\t\"sn\": \"202039248932482934\"


問題
?默認情況下傳遞帶有BOM的文本字節(jié)流給JsonCpp解析,肯定是解析不出來的,因為多了EF BB BF三個字節(jié),所以需要將這三個字節(jié)從文本中剔除


代碼
?std::ifstream ifs;
?ifs.open(pFileName, std::ifstream::in | std::ifstream::binary);

?std::string str((std::istreambuf_iterator<char>(ifs)), std::istreambuf_iterator<char>());
?std::string strValidJson;
?if ((0xef == (unsigned char)str[0]) && (0xbb == (unsigned char)str[1]) && (0xbf == (unsigned char)str[2]))
?{
??strValidJson = str.substr(3, str.length() - 3);
?}
?else
?{
??strValidJson = str;
?}
?//開始解析Json文本
?Json::Reader reader;
?Json::Value root;
?if (NULL == reader.parse(strJson, root))?

{

ifstream.close();

return;

}


向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI