您好,登錄后才能下訂單哦!
小編給大家分享一下python如何讀取以空格分開(kāi)的文件操作,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
在查找數(shù)據(jù)集的時(shí)候發(fā)現(xiàn),并不是所有的數(shù)據(jù)集都是以csv的格式存儲(chǔ),也就是每一列特征數(shù)據(jù)的分割并不是都以逗號(hào)分割,有的數(shù)據(jù)格式是以空格為分割
例如.data格式,
(數(shù)據(jù)來(lái)源于Boston房?jī)r(jià)預(yù)測(cè)數(shù)據(jù)集,文件名稱為“housing.data”)
import pandas as pd data = pd.read_csv('./housing.data', delim_whiteshape=True)
以上代碼就是實(shí)現(xiàn)了對(duì)空格的分割,但是不知道針對(duì)也是以一列存儲(chǔ),并且數(shù)據(jù)分割也是空格的csv文件此方法還行得通不。
另外pd.read_csv()中的參數(shù)sep和delimiter表示的意義一樣,具體如何使用不清楚,目前用到不多。
遇到讀取文件不知如何操作的,最后要訪問(wèn)下官方文檔或者google查詢。
pd.read_csv官方文檔
另外,可以直接在原數(shù)據(jù)集文件加后綴名.csv即可轉(zhuǎn)換成csv文件,但前提是data中的數(shù)據(jù)已經(jīng)以,分割好了。
pd.read_csv()中讀取文件時(shí),默認(rèn)第一行作為列名,但有時(shí)候第一行也是我們需要的數(shù)據(jù),這時(shí)需制定參數(shù)header=None,或者給每列提前設(shè)置好名字,names=[‘column0',‘column1',…]
補(bǔ)充:python 實(shí)現(xiàn)以空格分隔的文件讀寫及二維數(shù)組按列折半查找
最近文件讀寫的工作比較多,每一次讀文件都會(huì)寫單獨(dú)的函數(shù)來(lái)適應(yīng)文件格式,所以寫了一個(gè)類對(duì)文件進(jìn)行操作。
import os class DealData: # 數(shù)據(jù)加載函數(shù) def load(self, filename): data = [] file = open(filename, 'r') for line in file.readlines(): line = line.strip('\n') # 除去換行 line = line.split(' ') # 文件以“ ”分隔 if "" in line: # 解決每行結(jié)尾有空格的問(wèn)題 line.remove("") data.append(line) file.close() return data # 折半查找 # array是一個(gè)二維數(shù)組,函數(shù)實(shí)現(xiàn)的功能是按照array的第lie列折半查找 def search(self, array, lie, target): low = 0 high = len(array) - 1 while array[low][lie] <= array[high][lie]: mid = int((low + high) / 2) midval = array[mid][lie] if midval < target: low = mid + 1 elif midval > target: high = mid - 1 if high < 0 or low >= len(array): break return high # 將數(shù)據(jù)保存到文件 def save(self, data, filename): file = open(filename, 'w') for i in range(0, len(data), 1): for k in range(0, len(data[i]), 1): file.write(str(data[i][k])) file.write(" ") file.write("\n") file.close()
可以將Dealdata類單獨(dú)創(chuàng)建一個(gè)python文件,命名為Dealdata,調(diào)用方法如下:
from DealData import DealData deal = DealData() totaldata = deal.load("E:\low_data.txt")
之前先引用類:from Dealdata import Dealdata, 其中第一個(gè)Dealdata為被調(diào)用的python文件名, 第二個(gè)Dealdata為被調(diào)用的類名。
看完了這篇文章,相信你對(duì)“python如何讀取以空格分開(kāi)的文件操作”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。