溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何解決php讀取csv文件后uft8 bom導(dǎo)致在頁面上顯示出現(xiàn)問題

發(fā)布時(shí)間:2021-10-11 09:54:54 來源:億速云 閱讀:126 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要介紹如何解決php讀取csv文件后uft8 bom導(dǎo)致在頁面上顯示出現(xiàn)問題,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

date.csv:
"ID" "NAME" "EMAIL"
"1" "小明" "xm@163.com"
"2" "小東" "xd@sina.com"
"3" "小少" "shaozi@hotmai.com"

讀取這個(gè)csv文件

復(fù)制代碼 代碼如下:


<?php
$handle=fopen('date.csv','r');
while($data=fgetcsv($handle,10000,"/t"))  
{  
  echo "$data[0]"."$data[1]"."$data[2]";  
}
?>


讀取后在頁面上顯示時(shí),成了這樣:
"ID" NAME EMAIL
 1 小明 xm@163.com
 2 小東 xd@sina.com
 3 小少 shaozi@hotmai.com
fgetcsv函數(shù)的字段環(huán)繞符默認(rèn)是雙引號(hào),
為什么我讀取出來時(shí),其它字段都好好的,可是ID還有雙引號(hào)包著?

上網(wǎng)查了下,原來是utf8編碼的bom在php下無法識(shí)別.
下面是查來的資料:
Unicode規(guī)范中有一個(gè)BOM的概念。BOM——Byte Order Mark,就是字節(jié)序標(biāo)記。在
這里
找到一段關(guān)于BOM的說明:
在UCS 編碼中有一個(gè)叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應(yīng)該出現(xiàn)在實(shí)際傳輸中。UCS規(guī)范建議我們?cè)趥鬏斪止?jié)流前,先傳輸字符"ZERO WIDTH NO-BREAK SPACE"。這樣如果接收者收到FEFF,就表明這個(gè)字節(jié)流是Big-Endian的;如果收到FFFE,就表明這個(gè)字節(jié)流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被稱作BOM。

UTF-8不需要BOM來表明字節(jié)順序,但可以用BOM來表明編碼方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8編碼是EF BB BF。所以如果接收者收到以EF BB BF開頭的字節(jié)流,就知道這是UTF-8編碼了。
Windows就是使用BOM來標(biāo)記文本文件的編碼方式的。

另外unicode網(wǎng)站的
FAQ-BOM
詳細(xì)介紹了BOM。官方的自然權(quán)威,不過是英文的,看起來比較費(fèi)勁。
UTF-8編碼的文件中,BOM占三個(gè)字節(jié)。如果用記事本把一個(gè)文本文件另存為UTF-8編碼方式的話,用UE打開這個(gè)文件,切換到十六進(jìn)制編輯狀態(tài)就可以看到開頭的FFFE了。這是個(gè)標(biāo)識(shí)UTF-8編碼文件的好辦法,軟件通過BOM來識(shí)別這個(gè)文件是否是UTF-8編碼,很多軟件還要求讀入的文件必須帶BOM。可是,還是有很多軟件不能識(shí)別BOM。我在研究Firefox的時(shí)候就知道,在Firefox早期的版本里,擴(kuò)展是不能有BOM的,不過Firefox 1.5以后的版本已經(jīng)開始支持BOM了?,F(xiàn)在又發(fā)現(xiàn),PHP也不支持BOM。

PHP在設(shè)計(jì)時(shí)就沒有考慮BOM的問題,也就是說他不會(huì)忽略UTF-8編碼的文件開頭BOM的那三個(gè)字符。由于必須在轉(zhuǎn)換->UTF-8轉(zhuǎn)ASCII,或者在另存為里選擇ASCII編碼。如果是DOS格式的行尾符,可以用記事本打開,點(diǎn)另存為,選ASCII編碼。如果包含中文字符的話,可以用UE的另存為功能,選擇“UTF-8 無 BOM”即可。請(qǐng)參考下面的圖片:
如何解決php讀取csv文件后uft8 bom導(dǎo)致在頁面上顯示出現(xiàn)問題根據(jù)Bo-Blog的wiki的說明:Editplus需要先另存為gb,再另存為UTF-8。不過這樣做要小心,所有GBK編碼中不包含的字符就會(huì)都丟了。如果有一些非中文的字符在文件里的話還是不要用這種辦法了。(從這一個(gè)小方面來看,UE——UltraEdite-32確實(shí)比Editplus好很多,Editplus太輕量級(jí)了)

另外我發(fā)現(xiàn)了一個(gè)辦法,就是利用Wordpress提供的文件編輯器。這個(gè)辦法不受限制,不需要去下載專門的編輯器,畢竟大家都在用Wordpress嘛。先在ftp里把要編輯的文件的寫入權(quán)限打開,然后進(jìn)入Wordpress后臺(tái)->管理->文件編輯器,輸入要編輯文件的路徑,點(diǎn)編輯文件。在顯示出來的編輯界面中,你是看不到開頭的那三個(gè)字符的,不過沒關(guān)系,把光標(biāo)定位在整個(gè)文件的第一個(gè)字符前,按一下Backspace鍵。OK了,點(diǎn)更新文件吧,在ftp里刷新一下,可以看到文件小了3字節(jié),大功告成。

以上是“如何解決php讀取csv文件后uft8 bom導(dǎo)致在頁面上顯示出現(xiàn)問題”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI