您好,登錄后才能下訂單哦!
這篇文章主要講解了“python怎么進(jìn)行數(shù)據(jù)加載”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“python怎么進(jìn)行數(shù)據(jù)加載”吧!
首先,你要先學(xué)會(huì)安裝軟件,anaconda軟件,安裝成功后,你點(diǎn)擊jupyter notebook打開(kāi)代碼框。
現(xiàn)在可以開(kāi)始嘗試做數(shù)據(jù)分析了。
數(shù)據(jù)集下載 https://www.kaggle.com/c/titanic/overview
導(dǎo)入numpy和pandas
import pandas as pd import numpy as np
如果出錯(cuò)了,需要注意大小寫(xiě)、有沒(méi)有單詞寫(xiě)錯(cuò)了
(1) 使用相對(duì)路徑載入數(shù)據(jù)
(2) 使用絕對(duì)路徑載入數(shù)據(jù)
df = pd.read_csv('train.csv') df.head(3)
df = pd.read_csv('/Users/Documents/train.csv') df.head(3)
注意絕對(duì)路徑的 “ / ” 方向不要錯(cuò)。
每1000行為一個(gè)數(shù)據(jù)模塊,逐塊讀取
chunker = pd.read_csv('train.csv', chunksize=1000)
對(duì)著整個(gè)表修改列名:將表頭改成中文,索引改為乘客ID ,要注意的是,要記得把名字跟列一一對(duì)上,數(shù)量對(duì)上、順序?qū)ι?/p>
PassengerId => 乘客ID
Survived => 是否幸存
Pclass => 乘客等級(jí)(1/2/3等艙位)
Name => 乘客姓名
Sex => 性別
Age => 年齡
SibSp => 堂兄弟/妹個(gè)數(shù)
Parch => 父母與小孩個(gè)數(shù)
Ticket => 船票信息
Fare => 票價(jià)
Cabin => 客艙
Embarked => 登船港口
df = pd.read_csv('train.csv', names=['乘客ID','是否幸存','倉(cāng)位等級(jí)','姓名','性別','年齡','兄弟姐妹個(gè)數(shù)','父母子女個(gè)數(shù)','船票信息','票價(jià)','客艙','登船港口'],index_col='乘客ID',header=0) df.head()
導(dǎo)入數(shù)據(jù)后,我們可以對(duì)數(shù)據(jù)的整體結(jié)構(gòu)和樣例進(jìn)行概覽,比如說(shuō),數(shù)據(jù)大小、有多少列,各列都是什么格式的,是否包含null等。info 后面加()跟不加()會(huì) 有不同的內(nèi)容。
print(df.info())
如想在python的查看數(shù)據(jù),可以用head
df.head(10) df.tail(15)
判斷數(shù)據(jù)是否為空,為空的地方返回True,其余地方返回False
df.isnull().head()
在工作目錄下保存為一個(gè)新文件train_chinese.csv,如不希望表格自帶index,可以加入index=false
df.to_csv('train_chinese.csv',index=flase)
感謝各位的閱讀,以上就是“python怎么進(jìn)行數(shù)據(jù)加載”的內(nèi)容了,經(jīng)過(guò)本文的學(xué)習(xí)后,相信大家對(duì)python怎么進(jìn)行數(shù)據(jù)加載這一問(wèn)題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云,小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。