您好,登錄后才能下訂單哦!
利用numpy庫
(缺點(diǎn):有缺失值就無法讀取)
讀:
import numpy my_matrix = numpy.loadtxt(open("1.csv","rb"),delimiter=",",skiprows=0)
寫:
numpy.savetxt('2.csv', my_matrix, delimiter = ',')
可能遇到的問題:
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position
原因是文件路徑名中含有轉(zhuǎn)義字符,將路徑中的\換成\即可。
利用pandas庫
讀:(可以處理缺失值)
>>> import pandas as pd >>> df = pd.read_csv('D:\Python\\l\B_train1.csv') >>> df.values >>> df.as_matrix(columns=None)
寫:(將dataFrame直接寫入)
>>> testB = test[test.intersection_id.isin(["B"])] >>> pd.DataFrame.to_csv(testB,"D:\Python\\k\\t5B.csv") #testB是個(gè)dataFrame
利用sklearn包中的Imputer處理缺失值
>>> m = df.as_matrix(columns=None) >>> from sklearn.preprocessing import Imputer >>> imp = Imputer(missing_values='NaN', strategy='mean', axis=0) >>> imp.fit(m) Imputer(axis=0, copy=True, missing_values='NaN', strategy='mean', verbose=0) >>> imp.transform(m)
以上這篇python 讀取.csv文件數(shù)據(jù)到數(shù)組(矩陣)的實(shí)例講解就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。