您好,登錄后才能下訂單哦!
背景:生活中常常因日常工作,在記錄統(tǒng)計方面需頻繁處理較多 Excel 表格,這部分工作雖可由人工完成,但這樣會顯得有些繁瑣且可能存在偏差,遂閑時查閱了是否有相關基于python處理Excel表格的學習文檔,后獲知這主要可以運用 win32 和 openpyxl 等第三方庫來幫助完成。在此分享一下學習過程中有關 openpyxl 庫的基本使用方法和一些心得體會。
openpyxl 是一個用于處理 xlsx 格式Excel表格文件的第三方python庫,其支持Excel表格絕大多數(shù)基本操作。
安裝方法
使用 pip 或通過專門python IDE(如pyCharm)進行安裝
其中pip安裝方法,命令行輸入:? pip install openpyxl
基本使用
第一步先是要導入 openpyxl 模塊
importopenpyxl
讀取Excel文檔
通過調(diào)用方法load_workbook(filename)進行文件讀取,該方法中還有一個read_only參數(shù)用于設置文件打開方式,默認為可讀可寫,該方法最終將返回一個workbook的數(shù)據(jù)對象
# 文件必須是xlsx格式,如果是其他格式在執(zhí)行前可利用win32輔助轉(zhuǎn)化wb = openpyxl.load_workbook(‘example.xlsx’)
(一)獲取工作表
每一個Excel表格中都會有很多張sheet工作表,在對表格操作前需要先選定一張工作表
(二)獲取單元格
對Excel表格的操作最終都落于對單元格的操作,獲取單元格有兩種獲取方法:sheet[列行名]和sheet.cell(row,column)
需要注意的是,sheet.cell(row,column)中參數(shù)分別是行和列,且必須為整數(shù),如果列為英文字母,可以利用?openpyxl.utils?中的?column_index_from_string(char)進行字母數(shù)字的轉(zhuǎn)化。順便一說,同理也可以利用get_column_letter(number)進行數(shù)字字母間的轉(zhuǎn)化
(三)獲取行和列
在處理Excel表格有時可能需要對表格進行遍歷查找,openpyxl中便提供了一個行和列的生成器(sheet.rows和sheet.columns),這兩個生成器里面是每一行(或列)的數(shù)據(jù),每一行(或列)又由一個tuple包裹,借此可以很方便地完成對行和列的遍歷
學習時還發(fā)現(xiàn)也可以通過list(sheet.rows)[index](或list(sheet.columns)[index])對某一行或列進行遍歷,而在此值得注意的是,由于sheet.rows(或sheet.columns)是生成器類型,是不能直接調(diào)用的,需將其轉(zhuǎn)化為一個list類型,然后再通過索引遍歷
同時,也可以通過使用sheet[行列值:行列值]來對給定單元格范圍進行遍歷
另外,有時候我們還可能需要確定表格的大小,即獲取表格行和列的最大值,可以用max_row和max_column來獲取
寫入Excel文檔
在開頭讀取時已經(jīng)介紹,默認的打開方式為可讀可寫,那么使用load_workbook(filename)讀取Excel文檔后也就可以直接寫入了。另外,如果需要新建一個Excel文件,可以使用Workbook()方法,同時它會自動提供一個sheet工作表。對于刪除一個工作表,則可以使用workbook對象的remove(sheet)方法刪除
(一)寫入單元格
獲取工作表和之前一樣,如果使用load_workbook(filename)讀取,那么獲取工作表后可以直接通過sheet[行列值]寫入單元格。學習時,有資料介紹還可以傳入Excel中的公式進行賦值,不過要注意,在讀取文件時需要加上參數(shù)data_only=True,這樣才能返回數(shù)字,否則將返回字符串,即公式本身
另外,也可使用sheet.append(parameters)一行或多行寫入
(二)保存文件
寫完文件后,使用workbook.save(path+filename)進行保存,不過要注意文件擴展名一定要是xlsx格式
# 保存文件至當前目錄wb.save('new_file.xlsx')
設置單元格樣式
單元格樣式主要包括字體、邊框、顏色以及對齊方式等,這些均位于openpyxl.styles庫中
# 導入字體、邊框、顏色以及對齊方式相關庫fromopenpyxl.stylesimportFont, Border, Side, PatternFill, colors, Alignment
(一)字體
通過sheet單元格font屬性設置字體風格
# 設置字體風格為Times New Roman,大小為16,粗體、斜體,顏色藍色sheet['A1'].font = Font(name='Times New Roman', size=16, bold=True, italic=True, color=colors.BLUE)
(二)對齊方式
通過sheet單元格alignment屬性設置文本對齊風格
# 通過參數(shù)horizontal和vertical來設置文字在單元格里的對齊方式,此外設置值還可為left和rightsheet['B1'].alignment = Alignment(horizontal='center',vertical='center')
(三)邊框
通過sheet單元格border屬性設置字體風格
(四)設置行高和列寬
行和列的長度大小可以通過row_dimensions[序號].height和column_dimensions[標號].width來設置
(五)合并和拆分單元格
對單元格的合并與拆分,主要是通過sheet的merge_cells(args1:args2)和unmerge_cells(args1:args2)兩個方法來實現(xiàn)的
當然,除了對角矩形區(qū)域化合并,也可以對一行或一列進行合并,只需相應修改參數(shù)即可。不過,這里要注意的是,合并后單元格顯示的文本內(nèi)容是合并前最左上角單元格的內(nèi)容,而其他單元格內(nèi)容則會自動清除。
其他
在學習過程中,發(fā)現(xiàn)了一個有趣的現(xiàn)象:在對Excel文件利用前面所介紹的workbook.save(path+filename)方法保存后,再次打開保存的文件時發(fā)現(xiàn)之前已合并的單元格都只保留了原最左上角單元格的邊框效果,而其他單元格的效果則全部被去除了。就此問題,起初是通過對合并區(qū)域內(nèi)所有子單元格設置邊框以防止保存后邊框效果的消失,不過這種策略難免有一些麻煩。究此現(xiàn)象原因,目前博客論壇上較少有相關問題的提出和解釋,我也暫時未能很好地解決此問題,如大家有更好的想法或見解,歡迎留言分享。
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。