溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python數(shù)據(jù)處理之怎樣選取csv文件中某幾行的數(shù)據(jù)

發(fā)布時間:2021-02-03 11:11:41 來源:億速云 閱讀:472 作者:小新 欄目:開發(fā)技術(shù)

小編給大家分享一下python數(shù)據(jù)處理之怎樣選取csv文件中某幾行的數(shù)據(jù),相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

前言

有些人看到這個問題覺得不是問題,是嘛,不就是df.col[]函數(shù)嘛,其實忽略了一個重點,那就是我們要省去把csv文件全部讀取這個過程,因為如果在面臨億萬級別的大規(guī)模數(shù)據(jù),得到的結(jié)果就是boom,boom,boom。

我們要使用一下現(xiàn)成的函數(shù)里面的參數(shù)nrows,和skiprows,一個代表你要讀幾行,一個代表你從哪開始讀,這就可以了,比如從第3行讀取4個

示例代碼

import pandas as pd
df = pd.DataFrame({'a':[1,2,3,4,5,6,7,8,9],'b':[22,33,44,55,66,77,88,99,10]})
df.to_csv('test.csv')
dt = pd.read_csv('test.csv',skiprows=5,nrows=3)
 
print(dt)
 
 
out:
 4 5 66
0 5 6 77
1 6 7 88
2 7 8 99
3 8 9 10

就可以了,不過這個列頭不知道是怎么回事,順便如果想根據(jù)列值找index,可以參考下面的

然后

df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},
  index=[10,20,30,40,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)
 
 
df = pd.DataFrame({'BoolCol': [1, 2, 3, 3, 4],'attr': [22, 33, 22, 44, 66]},
  index=[10,20,30,40,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)

問題得到了解決

以上是“python數(shù)據(jù)處理之怎樣選取csv文件中某幾行的數(shù)據(jù)”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學習更多知識,歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI