溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么用Python讀取CSV文件

發(fā)布時間:2022-03-04 14:10:40 來源:億速云 閱讀:235 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要介紹了怎么用Python讀取CSV文件,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

典型的數(shù)據(jù)集stocks.csv:

怎么用Python讀取CSV文件

一個股票的數(shù)據(jù)集,其實(shí)就是常見的表格數(shù)據(jù)。有股票代碼,價格,日期,時間,價格變動和成交量。這個數(shù)據(jù)集其實(shí)就是一個表格數(shù)據(jù),有自己的頭部和身體。

第一招:簡單的讀取

我們先來看一種簡單讀取方法,先用csv.reader()函數(shù)讀取文件的句柄f生成一個csv的句柄,其實(shí)就是一個迭代器,我們看一下這個reader的源碼:

怎么用Python讀取CSV文件

喂給reader一個可迭代對象或者是文件的object,然后返回一個可迭代對象。

怎么用Python讀取CSV文件

  • 首先讀取csv 文件,然后用csv.reader生成一個csv迭代器f_csv

  • 然后利用迭代器的特性,next(f_csv)獲取csv文件的頭,也就是表格數(shù)據(jù)的頭

  • 接著利用for循環(huán),一行一行打印row的內(nèi)容,也就是表格數(shù)據(jù)的身體

怎么用Python讀取CSV文件 

第二招:用nametuple

上面的第一招其實(shí)是最簡單的,下面我們用nametuple 來包裹一下這個生成的row數(shù)據(jù)。

怎么用Python讀取CSV文件

  • nametuple其實(shí)是一個非常有用的類,這個類屬于collections模塊,而這個模塊簡直就是一個百寶箱里面有非常多的牛逼的庫;

  • 這里我們用next(f_csv)其實(shí)就是獲取表格的頭部來初始化這個Row;

  • 然后循環(huán)來構(gòu)造這個Row的數(shù)據(jù),把我們表格里面的每一行的數(shù)據(jù)都喂成nametuple格式的row_info;

  • 這樣做的好處就是你可以隨心所欲的訪問這個row_info里面的數(shù)據(jù),就想訪問類數(shù)據(jù)一樣,比如row_info.price

第三招:用tuple類型轉(zhuǎn)換

如果我們對csv數(shù)據(jù)每一行的類型都非常清楚的話,嘿嘿可以用一個設(shè)定好的數(shù)據(jù)格式轉(zhuǎn)換頭來對數(shù)據(jù)進(jìn)行轉(zhuǎn)換。

怎么用Python讀取CSV文件

操作的步驟其實(shí)跟上面差不多,就是對數(shù)據(jù)結(jié)果的清洗處理稍微不一樣。這里非常巧妙的zip來構(gòu)造一個嵌套的數(shù)據(jù)列表,然后用convert(data)把csv文件里面每一行的數(shù)據(jù)進(jìn)行類型轉(zhuǎn)換,這招真的不錯!
看一下結(jié)果:

怎么用Python讀取CSV文件

第四招:用DictReader

上面用的nametuple其實(shí)也是一個數(shù)據(jù)的映射,有沒有什么方法可以直接把csv 的內(nèi)容用映射的方法讀取,直接出來一個字典,還真有的,來看一下代碼:

怎么用Python讀取CSV文件

是不是非常簡捷,原來csv模塊直接內(nèi)置了DictReader(),按照字典的方法進(jìn)行讀取,然后生成一個有序的字典,看一下結(jié)果:

怎么用Python讀取CSV文件

有興趣的可以看一下這個DictReader()的源碼,它其實(shí)一個內(nèi)部構(gòu)造的迭代器類,在內(nèi)部的__next__其實(shí)也是用的OrderedDict(zip(self.fieldnames, row))來生成的。

第五招:用字典轉(zhuǎn)換

如果我們需要對這個csv里面的數(shù)據(jù)進(jìn)行清洗,因?yàn)樽x出來的時候都是字符串,我們需要更新為特定的數(shù)據(jù)類型,這個時候也可以用字典轉(zhuǎn)換這一招,也是非常巧妙的,我們看一下源碼:

怎么用Python讀取CSV文件

原來的數(shù)據(jù)價格Price和成交量,我希望最后讀取生成的是一個浮點(diǎn)型數(shù)據(jù)和整形的數(shù)據(jù),這么搞呢,用一個字典來巧妙的更新key即可。

  • 首先我們聲明一個自定義的類型轉(zhuǎn)換器field_types;

  • 然后循環(huán)生成一個可迭代的對象(key,conversion(row[key]);

  • 最后更新一下字典里面相同的key,比如row[‘price']的內(nèi)容就會被更新了

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“怎么用Python讀取CSV文件”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI