溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python利用pandas處理Excel數(shù)據(jù)的應(yīng)用詳解

發(fā)布時(shí)間:2020-10-19 20:43:03 來(lái)源:腳本之家 閱讀:143 作者:華妹陀 欄目:開(kāi)發(fā)技術(shù)

最近迷上了高效處理數(shù)據(jù)的pandas,其實(shí)這個(gè)是用來(lái)做數(shù)據(jù)分析的,如果你是做大數(shù)據(jù)分析和測(cè)試的,那么這個(gè)是非常的有用的??!但是其實(shí)我們平時(shí)在做自動(dòng)化測(cè)試的時(shí)候,如果涉及到數(shù)據(jù)的讀取和存儲(chǔ),那么而利用pandas就會(huì)非常高效,基本上3行代碼可以搞定你20行代碼的操作!該教程僅僅限于結(jié)合檸檬班的全棧自動(dòng)化測(cè)試課程來(lái)講解下pandas在項(xiàng)目中的應(yīng)用,這僅僅只是冰山一角,希望大家可以踴躍的去嘗試和探索!

一、安裝環(huán)境:

 1:pandas依賴處理Excel的xlrd模塊,所以我們需要提前安裝這個(gè),安裝命令是:pip install xlrd

2:安裝pandas模塊還需要一定的編碼環(huán)境,所以我們自己在安裝的時(shí)候,確保你的電腦有這些環(huán)境:Net.4 、VC-Compiler以及winsdk_web,如果大家沒(méi)有這些軟件~可以咨詢我們的輔導(dǎo)員索要相關(guān)安裝工具。

3:步驟1和2 準(zhǔn)備好了之后,我們就可以開(kāi)始安裝pandas了,安裝命令是:pip install pandas

一切準(zhǔn)備就緒,就可以開(kāi)始愉快的玩???!

ps:在這個(gè)過(guò)程中,可能會(huì)遇到安裝不順利的情況,萬(wàn)能的度娘有N種解決方案,你這么大應(yīng)該要學(xué)著自己解決問(wèn)題。

二、pandas操作Excel表單

數(shù)據(jù)準(zhǔn)備,有一個(gè)Excel文件:lemon.xlsx有兩個(gè)表單,表單名分別為:Python 以及student,

Python的表單數(shù)據(jù)如下所示:

Python利用pandas處理Excel數(shù)據(jù)的應(yīng)用詳解

student的表單數(shù)據(jù)如下所示:

Python利用pandas處理Excel數(shù)據(jù)的應(yīng)用詳解

1:在利用pandas模塊進(jìn)行操作前,可以先引入這個(gè)模塊,如下:

import pandas as pd

2:讀取Excel文件的兩種方式:

#方法一:默認(rèn)讀取第一個(gè)表單
df=pd.read_excel('lemon.xlsx')#這個(gè)會(huì)直接默認(rèn)讀取到這個(gè)Excel的第一個(gè)表單
data=df.head()#默認(rèn)讀取前5行的數(shù)據(jù)
print("獲取到所有的值:\n{0}".format(data))#格式化輸出

得到的結(jié)果是一個(gè)二維矩陣,如下所示:

Python利用pandas處理Excel數(shù)據(jù)的應(yīng)用詳解

#方法二:通過(guò)指定表單名的方式來(lái)讀取
df=pd.read_excel('lemon.xlsx',sheet_name='student')#可以通過(guò)sheet_name來(lái)指定讀取的表單
data=df.head()#默認(rèn)讀取前5行的數(shù)據(jù)
print("獲取到所有的值:\n{0}".format(data))#格式化輸出

得到的結(jié)果如下所示,也是一個(gè)二維矩陣:

Python利用pandas處理Excel數(shù)據(jù)的應(yīng)用詳解

#方法三:通過(guò)表單索引來(lái)指定要訪問(wèn)的表單,0表示第一個(gè)表單
#也可以采用表單名和索引的雙重方式來(lái)定位表單
#也可以同時(shí)定位多個(gè)表單,方式都羅列如下所示
df=pd.read_excel('lemon.xlsx',sheet_name=['python','student'])#可以通過(guò)表單名同時(shí)指定多個(gè)
# df=pd.read_excel('lemon.xlsx',sheet_name=0)#可以通過(guò)表單索引來(lái)指定讀取的表單
# df=pd.read_excel('lemon.xlsx',sheet_name=['python',1])#可以混合的方式來(lái)指定
# df=pd.read_excel('lemon.xlsx',sheet_name=[1,2])#可以通過(guò)索引 同時(shí)指定多個(gè)
data=df.values#獲取所有的數(shù)據(jù),注意這里不能用head()方法哦~
print("獲取到所有的值:\n{0}".format(data))#格式化輸出

具體結(jié)果是怎樣的,同學(xué)們可以自己一個(gè)一個(gè)的去嘗試,這個(gè)結(jié)果是非常有意思的,但是同時(shí)同學(xué)們也發(fā)現(xiàn)了,這個(gè)數(shù)據(jù)是一個(gè)二維矩陣,對(duì)于我們?nèi)プ鲎詣?dòng)化測(cè)試,并不能很順利的處理,所以接下來(lái),我們就會(huì)詳細(xì)的講解,如何來(lái)讀取行號(hào)和列號(hào)以及每一行的內(nèi)容 以及制定行列的內(nèi)容。

三、pandas操作Excel的行列

1:讀取指定的單行,數(shù)據(jù)會(huì)存在列表里面

#1:讀取指定行
df=pd.read_excel('lemon.xlsx')#這個(gè)會(huì)直接默認(rèn)讀取到這個(gè)Excel的第一個(gè)表單
data=df.ix[0].values#0表示第一行 這里讀取數(shù)據(jù)并不包含表頭,要注意哦!
print("讀取指定行的數(shù)據(jù):\n{0}".format(data))

得到的結(jié)果如下所示:

Python利用pandas處理Excel數(shù)據(jù)的應(yīng)用詳解

2:讀取指定的多行,數(shù)據(jù)會(huì)存在嵌套的列表里面:

df=pd.read_excel('lemon.xlsx')
data=df.ix[[1,2]].values#讀取指定多行的話,就要在ix[]里面嵌套列表指定行數(shù)
print("讀取指定行的數(shù)據(jù):\n{0}".format(data))

3:讀取指定的行列:

df=pd.read_excel('lemon.xlsx')
data=df.ix[1,2]#讀取第一行第二列的值,這里不需要嵌套列表
print("讀取指定行的數(shù)據(jù):\n{0}".format(data))

4:讀取指定的多行多列值:

df=pd.read_excel('lemon.xlsx')
data=df.ix[[1,2],['title','data']].values#讀取第一行第二行的title以及data列的值,這里需要嵌套列表
print("讀取指定行的數(shù)據(jù):\n{0}".format(data))

5:獲取所有行的指定列

df=pd.read_excel('lemon.xlsx')
data=df.ix[:,['title','data']].values#讀所有行的title以及data列的值,這里需要嵌套列表
print("讀取指定行的數(shù)據(jù):\n{0}".format(data))

6:獲取行號(hào)并打印輸出

df=pd.read_excel('lemon.xlsx')
print("輸出行號(hào)列表",df.index.values)

輸出結(jié)果是:
輸出行號(hào)列表 [0 1 2 3]

7:獲取列名并打印輸出

df=pd.read_excel('lemon.xlsx')
print("輸出列標(biāo)題",df.columns.values)

運(yùn)行結(jié)果如下所示:
輸出列標(biāo)題 ['case_id' 'title' 'data']

8:獲取指定行數(shù)的值:

df=pd.read_excel('lemon.xlsx')
print("輸出值",df.sample(3).values)#這個(gè)方法類似于head()方法以及df.values方法

輸出值
 [[2 '輸入錯(cuò)誤的密碼' '{"mobilephone":"18688773467","pwd":"12345678"}']
 [3 '正常充值' '{"mobilephone":"18688773467","amount":"1000"}']
 [1 '正常登錄' '{"mobilephone":"18688773467","pwd":"123456"}']]

9:獲取指定列的值:

df=pd.read_excel('lemon.xlsx')
print("輸出值\n",df['data'].values)

四:pandas處理Excel數(shù)據(jù)成為字典

我們有這樣的數(shù)據(jù),Python利用pandas處理Excel數(shù)據(jù)的應(yīng)用詳解,處理成列表嵌套字典,且字典的key為表頭名。

實(shí)現(xiàn)的代碼如下所示:

df=pd.read_excel('lemon.xlsx')
test_data=[]
for i in df.index.values:#獲取行號(hào)的索引,并對(duì)其進(jìn)行遍歷:
  #根據(jù)i來(lái)獲取每一行指定的數(shù)據(jù) 并利用to_dict轉(zhuǎn)成字典
  row_data=df.ix[i,['case_id','module','title','http_method','url','data','expected']].to_dict()
  test_data.append(row_data)
print("最終獲取到的數(shù)據(jù)是:{0}".format(test_data))

最后得到的結(jié)果是:

最終獲取到的數(shù)據(jù)是:
[{'title': '正常登錄', 'case_id': 1, 'data': '{"mobilephone":"18688773467","pwd":"123456"}'},
{'title': '輸入錯(cuò)誤的密碼', 'case_id': 2, 'data': '{"mobilephone":"18688773467","pwd":"12345678"}'},
{'title': '正常充值', 'case_id': 3, 'data': '{"mobilephone":"18688773467","amount":"1000"}'},
{'title': '充值輸入負(fù)數(shù)', 'case_id': 4, 'data': '{"mobilephone":"18688773467","amount":"-100"}'}]

關(guān)于pandas的學(xué)習(xí),今天就告一段落啦!趕緊打開(kāi)pycharm跑起來(lái)!??!

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI