溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python數(shù)據(jù)序列化的pickle模塊怎么用

發(fā)布時(shí)間:2022-03-07 09:09:34 來源:億速云 閱讀:170 作者:iii 欄目:開發(fā)技術(shù)

這篇文章主要介紹了Python數(shù)據(jù)序列化的pickle模塊怎么用的相關(guān)知識(shí),內(nèi)容詳細(xì)易懂,操作簡單快捷,具有一定借鑒價(jià)值,相信大家閱讀完這篇Python數(shù)據(jù)序列化的pickle模塊怎么用文章都會(huì)有所收獲,下面我們一起來看看吧。

前言:

在英語中 pickle 名詞是泡菜,動(dòng)詞是腌漬的意思??梢岳斫鉃榘褨|西腌起來保存成文件,要用的時(shí)候讀出來洗洗再用。

pythonpickle模塊實(shí)現(xiàn)了基本的數(shù)據(jù)序列化和反序列化。

序列化對(duì)象可以在磁盤上保存對(duì)象,并在需要的時(shí)候讀取出來。任何對(duì)象都可以執(zhí)行序列化操作。

pickle的本質(zhì)是將Python數(shù)據(jù)還原為內(nèi)存中的二進(jìn)制數(shù)據(jù),供用戶轉(zhuǎn)移、儲(chǔ)存。

pickle模塊通常會(huì)在2種場景下使用:

  • 將Python的數(shù)據(jù)保存為磁盤上的二進(jìn)制文件,需要時(shí)讀取還原為Python數(shù)據(jù),可以是可打印的基本數(shù)據(jù)(字符串、列表、字典等等),也可以是不可打印的類數(shù)據(jù)。相比之下,使用Json方式只能保存可打印的基本數(shù)據(jù)

  • 將已經(jīng)創(chuàng)建好的類數(shù)據(jù)字符串化,保存為一個(gè)變量。在程序下次運(yùn)行時(shí)直接讀取變量還原為類數(shù)據(jù),省去類數(shù)據(jù)的創(chuàng)建過程

1 將Python數(shù)據(jù)存儲(chǔ)為本地文件

設(shè)計(jì)一個(gè)程序,輸出產(chǎn)物是Excel工作簿output.xlsx,工作簿中有一個(gè)工作表out_sheet 是從 標(biāo)準(zhǔn)文檔input.xlsx中的 in_sheet 中復(fù)制而來。

工作表in_sheet 的內(nèi)容很龐大,難以用手動(dòng)重現(xiàn),通常我們會(huì)選擇將 標(biāo)準(zhǔn)文檔 input.xlsx 作為程序的引用素材放在工程里。程序運(yùn)行過程中將工作表 in_sheet復(fù)制到工作表out_sheet中。

如果我們要求不能明文存儲(chǔ) 工作表 in_sheet文件,只能存儲(chǔ)工作表對(duì)應(yīng)的Worksheet()數(shù)據(jù) ,將使用到pickle模塊

① 存儲(chǔ)過程

import pickle
from openpyxl import load_workbook

# 創(chuàng)建類數(shù)據(jù)
wb = load_workbook('input.xlsx')
ws = wb['in_sheet']

# 將 in_sheet 復(fù)制到 out_sheet
# 注意,這里的 usr_copy_sheet() 是自定義方式,openpyxl自帶的copy_sheet()不能復(fù)制不同workbook中的worksheet
usr_copy_sheet(ws, out_ws)

# 將out_ws轉(zhuǎn)化為二進(jìn)制數(shù)據(jù)
obj = pickle.dumps(out_ws)

# 將二進(jìn)制數(shù)據(jù)存到本地文件,必須使用二進(jìn)制寫入
with open(file='data.txt', mode='wb') as f:
    f.write(obj)

此時(shí),ws被存儲(chǔ)到本地文件 data.txt,打開是二進(jìn)制亂碼

② 加載過程

import pickle
from openpyxl.worksheet.worksheet import Worksheet

# 創(chuàng)建空的類數(shù)據(jù)準(zhǔn)備接收數(shù)據(jù),如果類有parent屬性,必須和要接收的數(shù)據(jù)保持一致
out_ws= Worksheet(parent=out_wb)

# 將本地文件數(shù)據(jù)加載到類數(shù)據(jù)上,必須使用二進(jìn)制打開文件
with open(file='data.txt', mode='rb') as f:
    out_ws= pickle.loads(f.read())

便可以省去讀取 工作表in_sheet,復(fù)制到工作表 out_sheet等等過程

2 將Python數(shù)據(jù)存儲(chǔ)為程序的一部分

如果我們要求 工作表in_sheet文件的數(shù)據(jù)不但不能明文存儲(chǔ),還不能作為外部文件,必須作為 程序.exe 的一部分,以防丟失。有些小程序一共只有一個(gè) exe文件,外掛一個(gè)文件不方便,此時(shí)可使用到pickle模塊

① 存儲(chǔ)過程

import pickle
from openpyxl import load_workbook

# 創(chuàng)建類數(shù)據(jù)
wb = load_workbook('input.xlsx')
ws = wb['in_sheet']

# 將 in_sheet 復(fù)制到 out_sheet
# 注意,這里的 usr_copy_sheet() 是自定義方式,openpyxl自帶的copy_sheet()不能復(fù)制不同workbook中的worksheet
usr_copy_sheet(ws, out_ws)

# 將out_ws轉(zhuǎn)化為二進(jìn)制數(shù)據(jù)
obj = pickle.dumps(out_ws)

# 將二進(jìn)制數(shù)據(jù)存為py文件,必須使用文本寫入
with open(file='out_sheet.py', mode='w') as f:
    # 將二進(jìn)制數(shù)據(jù)轉(zhuǎn)為 b'''xxx''' 字符串寫入 py文件
    data = 'data=' + str(obj).replace('b\'', 'b\'\'\'') + '\'\''
    f.write(data)

此時(shí),out_ws 被存儲(chǔ)到本地文件out_sheet.py,內(nèi)容是一串二進(jìn)制碼:

data=b'''\x80\x04......'''

② 加載過程

將生成的out_sheet.py 加載到程序中,直接讀取數(shù)據(jù)

import pickle
from openpyxl.worksheet.worksheet import Worksheet
import out_sheet

# 創(chuàng)建空的類數(shù)據(jù)準(zhǔn)備接收數(shù)據(jù),如果類有parent屬性,必須和要接收的數(shù)據(jù)保持一致
out_ws= Worksheet(parent=out_wb)

# 直接讀取out_sheet.py文件中的data變量
out_ws= pickle.loads(out_sheet.data)

out_sheet.py最終會(huì)被編譯為程序的一部分

關(guān)于“Python數(shù)據(jù)序列化的pickle模塊怎么用”這篇文章的內(nèi)容就介紹到這里,感謝各位的閱讀!相信大家對(duì)“Python數(shù)據(jù)序列化的pickle模塊怎么用”知識(shí)都有一定的了解,大家如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI