溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

解決python在html中顯示亂碼的問題

發(fā)布時(shí)間:2020-07-23 11:25:54 來源:億速云 閱讀:519 作者:清晨 欄目:編程語言

這篇文章將為大家詳細(xì)講解有關(guān)解決python在html中顯示亂碼的問題,小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,希望大家閱讀完這篇文章后可以有所收獲。

python寫入html文件中文亂碼問題

使用open函數(shù)將爬蟲爬取的html寫入文件,有時(shí)候在控制臺(tái)不會(huì)亂碼,但是寫入文件的html中的中文是亂碼的

案例分析

看下面一段代碼:

# 爬蟲未使用cookie
from urllib import request

if __name__ == '__main__':
    url = "http://www.renren.com/967487029/profile"

    rsp = request.urlopen(url)

    html = rsp.read().decode()

    with open("rsp.html","w")as f:
        # 將爬取的頁面
        print(html)
        f.write(html)

看似沒有問題,并且在控制臺(tái)輸出的html也不會(huì)出現(xiàn)中文亂碼,但是創(chuàng)建的html文件中 

解決python在html中顯示亂碼的問題

解決方案

使用open方法的一個(gè)參數(shù),名為encoding=” “,加入encoding=”utf-8”即可

# 爬蟲未使用cookie
from urllib import request

if __name__ == '__main__':
    url = "http://www.renren.com/967487029/profile"

    rsp = request.urlopen(url)

    html = rsp.read().decode()

    with open("rsp.html","w",encoding="utf-8")as f:
        # 將爬取的頁面
        print(html)
        f.write(html)

運(yùn)行結(jié)果

解決python在html中顯示亂碼的問題

關(guān)于解決python在html中顯示亂碼的問題就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI