溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

關(guān)于文件的UTF-8的BOM標記問題記錄

發(fā)布時間:2020-09-03 12:02:27 來源:網(wǎng)絡(luò) 閱讀:1166 作者:shadow001 欄目:編程語言
在svn上提交了一個文件trac進行codereview 的時候,發(fā)現(xiàn)其中的中文是亂碼,猜測是文件編碼的問題,用emedit查看之后,發(fā)現(xiàn)這個文件的編碼時utf-8 (無bom)格式,然后對比了一下其它顯示正確的文件格式:utf-8(含bom),問題就是bom有無的問題,使用emedit保存完后,調(diào)查了一下這個bom是什么.

"UTF- 8編碼的文件中,BOM占三個字節(jié)。如果用記事本把一個文本文件另存為UTF-8編碼方式的話,用UE打開這個文件,切換到十六進制編輯狀態(tài)就可以看到開 頭的FFFE了。這是個標識UTF-8編碼文件的好辦法,軟件通過BOM來識別這個文件是否是UTF-8編碼,很多軟件還要求讀入的文件必須帶BOM???是,還是有很多軟件不能識別BOM。"

"UTF-8 BOM又叫UTF-8 簽名,其實UTF-8的BOM對UFT-8沒有作用,是為了支援UTF-16,UTF-32才加上"


才發(fā)現(xiàn)這個bom在utf-8格式的文件中代表了頭三個字節(jié)“EF BB BF”,很多文件就沒有這個概念,經(jīng)常會被當做數(shù)據(jù)進行處理。php好像暫時不支持,不能處理帶bom的utf-8文件。

所以說,數(shù)據(jù)文件最好不要帶bom,當然你如果知道bom,處理程序中做了處理那就是另一說了。,

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI