您好,登錄后才能下訂單哦!
本篇內(nèi)容介紹了“Python操作Excel文件的方法有哪些”的有關(guān)知識(shí),在實(shí)際案例的操作過程中,不少人都會(huì)遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
數(shù)據(jù)處理是 Python 的一大應(yīng)用場(chǎng)景,而 Excel 則是最流行的數(shù)據(jù)處理軟件。因此用 Python 進(jìn)行數(shù)據(jù)相關(guān)的工作時(shí),難免要和 Excel 打交道。
如果僅僅是要以表單形式保存數(shù)據(jù),可以借助 CSV 格式(一種以逗號(hào)分隔的表格數(shù)據(jù)格式)進(jìn)行處理,Excel 也支持此格式。但標(biāo)準(zhǔn)的 Excel 文件(xls/xlsx)具有較復(fù)雜的格式,并不方便像普通文本文件一樣直接進(jìn)行讀寫,需要借助第三方庫(kù)來實(shí)現(xiàn)。
常用的庫(kù)是 python-excel 系列:
xlrd、xlwt、xlutils
xlrd - 讀取 Excel 文件
xlwt - 寫入 Excel 文件
xlutils - 操作 Excel 文件的實(shí)用工具,如復(fù)制、分割、篩選等
盡管這是目前被用得最多的 Excel 庫(kù),我還是很想吐槽為什么這三個(gè)包不能放在一個(gè)模塊里……另外它們有個(gè)缺陷,就是只能處理 xls 文件。如果你想用新版本的 xlsx,可以考慮 openpyxl 和 xlsxwriter。
不過今天只說說這三個(gè)。
安裝
安裝的方法沒啥特別的,只是得裝三遍??梢韵螺d安裝包、下載代碼壓縮包、或者通過 pip 等。
如果安裝過之前推薦的 anaconda,那么就已經(jīng)有了 xlrd 和 xlwt,但 xlutils 沒有附帶在安裝包中,使用時(shí)仍需另行安裝。
讀取
結(jié)合一段簡(jiǎn)單的代碼來看:
import xlrd # 打開 xls 文件 book = xlrd.open_workbook("test.xls") print "表單數(shù)量:", book.nsheets print "表單名稱:", book.sheet_names() # 獲取第1個(gè)表單 sh = book.sheet_by_index(0) print u"表單 %s 共 %d 行 %d 列" % (sh.name, sh.nrows, sh.ncols) print "第二行第三列:", sh.cell_value(1, 2) # 遍歷所有表單 for s in book.sheets(): for r in range(s.nrows): # 輸出指定行 print s.row(r)
測(cè)試文件:
輸出結(jié)果:
表單數(shù)量: 2 表單名稱: [u'Group.A', u'Group.B'] 表單 Group.A 共 7 行 3 列 第二行第三列: 15.0 [text:u'Rank', text:u'Team', text:u'Points'] [number:1.0, text:u'Brazil', number:15.0] [number:2.0, text:u'Russia', number:12.0] ...
常用的方法:
open_workbook 打開文件
sheet_by_index 獲取某一個(gè)表單
sheets 獲取所有表單
cell_value 獲取指定單元格的數(shù)據(jù)
寫入
還是看代碼:
import xlwt # 創(chuàng)建 xls 文件對(duì)象 wb = xlwt.Workbook() # 新增一個(gè)表單 sh = wb.add_sheet('A Test Sheet') # 按位置添加數(shù)據(jù) sh.write(0, 0, 1234.56) sh.write(1, 0, 8888) sh.write(2, 0, 'hello') sh.write(2, 1, 'world') # 保存文件 wb.save('example.xls')
生成文件:
常用的方法:
Workbook 創(chuàng)建文件對(duì)象
add_sheet 新增一個(gè)表單
write 在指定單元格寫入數(shù)據(jù)
修改
很遺憾,并沒有直接修改 xls 文件的方法。通常的做法是,讀取出文件,復(fù)制一份數(shù)據(jù),對(duì)其進(jìn)行修改,再保存。
在復(fù)制時(shí),需要用到 xlutils 中的方法。
from xlrd import open_workbook from xlutils.copy import copy # 打開文件 rb = open_workbook("example.xls") # 復(fù)制 wb = copy(rb) # 選取表單 s = wb.get_sheet(0) # 寫入數(shù)據(jù) s.write(0, 1, 'new data') # 保存 wb.save('example.xls')
修改后文件:
特別要注意的是,選取讀取表單時(shí),要使用 sheet_by_index,而在選取寫入表單時(shí),則要用 get_sheet。不要問我為什么,我也很想知道這么設(shè)定的用意何在……
時(shí)間轉(zhuǎn)換
如果表單中有時(shí)間格式的數(shù)據(jù),通過處理之后,你會(huì)發(fā)現(xiàn)時(shí)間數(shù)據(jù)出了差錯(cuò)。
輸出單元格內(nèi)容:
[number:8888.0, xldate:42613.0]
因?yàn)檫@里 xldate 有自己的格式定義。如果要使用正確的格式,必須轉(zhuǎn)換:
new_date = xlrd.xldate.xldate_as_datetime(date, book.datemode)
date 是對(duì)應(yīng)單元格的數(shù)據(jù),book 是打開的文件對(duì)象。
另外,在打開文件時(shí),加上參數(shù) formatting_info=True,可以保證在時(shí)間數(shù)據(jù)在 copy 時(shí)保持原樣。
寫入時(shí)間數(shù)據(jù),則可通過此方法創(chuàng)建 excel 的時(shí)間對(duì)象:
xlrd.xldate.xldate_from_datetime_tuple
或者通過 xlwt.easyxf 指定時(shí)間格式:
style = xlwt.easyxf(num_format_str='D-MMM-YY')ws.write(1, 0, datetime.now(), style)
“Python操作Excel文件的方法有哪些”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。