您好,登錄后才能下訂單哦!
這篇文章將為大家詳細(xì)講解有關(guān)解決python在html中顯示亂碼的問題,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。
python寫入html文件中文亂碼問題
使用open函數(shù)將爬蟲爬取的html寫入文件,有時(shí)候在控制臺(tái)不會(huì)亂碼,但是寫入文件的html中的中文是亂碼的
案例分析
看下面一段代碼:
# 爬蟲未使用cookie from urllib import request if __name__ == '__main__': url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url) html = rsp.read().decode() with open("rsp.html","w")as f: # 將爬取的頁面 print(html) f.write(html)
看似沒有問題,并且在控制臺(tái)輸出的html也不會(huì)出現(xiàn)中文亂碼,但是創(chuàng)建的html文件中
解決方案
使用open方法的一個(gè)參數(shù),名為encoding=” “,加入encoding=”utf-8”即可
# 爬蟲未使用cookie from urllib import request if __name__ == '__main__': url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url) html = rsp.read().decode() with open("rsp.html","w",encoding="utf-8")as f: # 將爬取的頁面 print(html) f.write(html)
運(yùn)行結(jié)果
關(guān)于解決python在html中顯示亂碼的問題就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。