溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

NumPy.npy與pandas DataFrame的示例分析

發(fā)布時(shí)間：2021-07-23 14:07:32 來源：億速云閱讀：167 作者：小新欄目：開發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)NumPy.npy與pandas DataFrame的示例分析的內(nèi)容。小編覺得挺實(shí)用的，因此分享給大家做個(gè)參考，一起跟隨小編過來看看吧。

用CSV格式來保存文件是個(gè)不錯(cuò)的主意，因?yàn)榇蟛糠殖绦蛟O(shè)計(jì)語言和應(yīng)用程序都能處理這種格式，所以交流起來非常方便。然而這種格式的存儲(chǔ)效率不是很高，原因是CSV及其他純文本格式中含有大量空白符;而后來發(fā)明的一些文件格式，如zip、bzip和gzip等，壓縮率則有了顯著提升。

首先導(dǎo)入模塊：

In [1]: import numpy as np
 
In [2]: import pandas as pd
 
In [3]: from tempfile import NamedTemporaryFile
 
In [4]: from os.path import getsize

這里我們將使用Python標(biāo)準(zhǔn)的NamedTemporaryFile來存儲(chǔ)數(shù)據(jù)，這些臨時(shí)文件隨后會(huì)自動(dòng)刪除。

接下來獲取CSV文件格式的大?。?/strong>

In [5]: np.random.seed(42)
 
In [6]: a = np.random.randn(365,4)
 
In [7]: tmpf = NamedTemporaryFile()
 
In [8]: np.savetxt(tmpf,a,delimiter=',')
 
In [9]: print("Size CSV file",getsize(tmpf.name))
Size CSV file 36693

下面首先以NumPy.npy格式來保存該數(shù)組，隨后載入內(nèi)存，并檢查數(shù)組的形狀以及.npy文件的大?。?/strong>

In [10]: tmpf = NamedTemporaryFile()
 
In [11]: np.save(tmpf,a)
 
In [12]: tmpf.seek(0)
Out[12]: 0
 
In [13]: loaded = np.load(tmpf)
 
In [14]: print("Shape",loaded.shape)
Shape (365, 4)
 
In [15]: print("Size .npy file",getsize(tmpf.name))
Size .npy file 11760

.npy文件的大小只有CSV文件的三分之一左右。實(shí)際上，利用Python可以存儲(chǔ)任意復(fù)雜的數(shù)據(jù)結(jié)構(gòu)。也可以序列化格式來存儲(chǔ)pandas的DataFrame或者Series數(shù)據(jù)結(jié)構(gòu)

在Python中，pickle是將Python對(duì)象存儲(chǔ)到磁盤或其他介質(zhì)時(shí)采用的一種格式，這個(gè)格式化的過程叫做序列化。之后，我們可以從存儲(chǔ)器中重建該P(yáng)ython對(duì)象，這個(gè)逆過程稱為反序列化。并非所有的Python對(duì)象都能夠序列化;不過借助諸如dill之列的模塊，可以將更多種類的Python對(duì)象序列化。

首先用前面生成的NumPy數(shù)組創(chuàng)建一個(gè)DataFame，接著用to_pickle()方法將其寫入一個(gè)pickle對(duì)象中，然后用read_pickle()函數(shù)從這個(gè)pickle對(duì)象中檢索該DataFrame：

In [16]: tmpf.name
Out[16]: '/tmp/tmpyy06safp'
 
In [17]: df = pd.DataFrame(a)
 
In [18]: df.to_pickle(tmpf.name) 是將DataFrame()寫入到/tmp/tmpyy06safp中
 
In [19]: print("Size pickled dataframes",getsize(tmpf.name))
Size pickled dataframes 12250
 
In [20]: tmpf.name
Out[20]: '/tmp/tmpyy06safp'
 
In [21]: print("DF from pickle\n",pd.read_pickle(tmpf.name))
DF from pickle
    0   1   2   3
0 0.496714 -0.138264 0.647689 1.523030
1 -0.234153 -0.234137 1.579213 0.767435
2 -0.469474 0.542560 -0.463418 -0.465730
3 0.241962 -1.913280 -1.724918 -0.562288
4 -1.012831 0.314247 -0.908024 -1.412304
5 1.465649 -0.225776 0.067528 -1.424748
6 -0.544383 0.110923 -1.150994 0.375698
7 -0.600639 -0.291694 -0.601707 1.852278
8 -0.013497 -1.057711 0.822545 -1.220844
9 0.208864 -1.959670 -1.328186 0.196861
10 0.738467 0.171368 -0.115648 -0.301104
11 -1.478522 -0.719844 -0.460639 1.057122
12 0.343618 -1.763040 0.324084 -0.385082
13 -0.676922 0.611676 1.031000 0.931280
14 -0.839218 -0.309212 0.331263 0.975545
15 -0.479174 -0.185659 -1.106335 -1.196207
16 0.812526 1.356240 -0.072010 1.003533
17 0.361636 -0.645120 0.361396 1.538037
18 -0.035826 1.564644 -2.619745 0.821903
19 0.087047 -0.299007 0.091761 -1.987569
20 -0.219672 0.357113 1.477894 -0.518270
21 -0.808494 -0.501757 0.915402 0.328751
22 -0.529760 0.513267 0.097078 0.968645
23 -0.702053 -0.327662 -0.392108 -1.463515
24 0.296120 0.261055 0.005113 -0.234587
25 -1.415371 -0.420645 -0.342715 -0.802277
26 -0.161286 0.404051 1.886186 0.174578
27 0.257550 -0.074446 -1.918771 -0.026514
28 0.060230 2.463242 -0.192361 0.301547
29 -0.034712 -1.168678 1.142823 0.751933
..  ...  ...  ...  ...
335 0.160574 0.003046 0.436938 1.190646
336 0.949554 -1.484898 -2.553921 0.934320
337 -1.366879 -0.224765 -1.170113 -1.801980
338 0.541463 0.759155 -0.576510 -2.591042
339 -0.546244 0.391804 -1.478912 0.183360
340 -0.015310 0.579291 0.119580 -0.973069
341 1.196572 -0.158530 -0.027305 -0.933268
342 -0.443282 -0.884803 -0.172946 1.711708
343 -1.371901 -1.613561 1.471170 -0.209324
344 -0.669073 1.039905 -0.605616 1.826010
345 0.677926 -0.487911 2.157308 -0.605715
346 0.742095 0.299293 1.301741 1.561511
347 0.032004 -0.753418 0.459972 -0.677715
348 2.013387 0.136535 -0.365322 0.184680
349 -1.347126 -0.971614 1.200414 -0.656894
350 -1.046911 0.536653 1.185704 0.718953
351 0.996048 -0.756795 -1.421811 1.501334
352 -0.322680 -0.250833 1.328194 0.556230
353 0.455888 2.165002 -0.643518 0.927840
354 0.057013 0.268592 1.528468 0.507836
355 0.538296 1.072507 -0.364953 -0.839210
356 -1.044809 -1.966357 2.056207 -1.103208
357 -0.221254 -0.276813 0.307407 0.815737
358 0.860473 -0.583077 -0.167122 0.282580
359 -0.248691 1.607346 0.490975 0.734878
360 0.662881 1.173474 0.181022 -1.296832
361 0.399688 -0.651357 -0.528617 0.586364
362 1.238283 0.021272 0.308833 1.702215
363 0.240753 2.601683 0.565510 -1.760763
364 0.753342 0.381158 1.289753 0.673181
 
[365 rows x 4 columns]

感謝各位的閱讀！關(guān)于“NumPy.npy與pandas DataFrame的示例分析”這篇文章就分享到這里了，希望以上內(nèi)容可以對(duì)大家有一定的幫助，讓大家可以學(xué)到更多知識(shí)，如果覺得文章不錯(cuò)，可以把它分享出去讓更多的人看到吧！

向AI問一下細(xì)節(jié)

推薦閱讀：

pandas分組與聚合

從列表或字典創(chuàng)建Pandas的DataFrame對(duì)象的方法

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

numpy npy pandas

上一篇新聞：
php入庫(kù)和出庫(kù)的用法

下一篇新聞：
bootstrap中怎么設(shè)置div邊框

猜你喜歡

java中封裝是什么意思

Android中Snackbar的使用方法及小技巧

JavaApplet及其應(yīng)用

Ubuntu下的幾種常見輸入法極其配置方式

怎么提取微信小程序的鏈接

獲取Java程序的窗口句柄

kernelutil.dll文件丟失解決辦法

java+opencv實(shí)現(xiàn)人臉識(shí)別功能

Character.UnicodeBlock中cjk的說明詳解

js中javascript:void(0)用法詳解

最新資訊

LAMP環(huán)境MySQL索引優(yōu)化方法

LAMP服務(wù)器資源監(jiān)控與管理技巧

LAMP環(huán)境PHP版本升級(jí)注意事項(xiàng)

Apache在LAMP中的角色與性能考量

LAMP架構(gòu)適合哪些類型網(wǎng)站

Linux中LAMP配置最佳實(shí)踐分享

LAMP與LEMP，Linux服務(wù)器如何選擇

LAMP環(huán)境如何保障網(wǎng)站安全

Linux下LAMP環(huán)境搭建難點(diǎn)解析

LAMP架構(gòu)如何優(yōu)化Linux服務(wù)器性能

相關(guān)推薦

pandas中層次索引與取值的示例分析

pandas.dataframe按行索引表達(dá)式選取的示例分析

pandas之DataFrame行列數(shù)據(jù)篩選的示例分析

Pandas序列怎么用

python中使用pandas功能的示例分析

怎么在Pandas中將DataFrame轉(zhuǎn)換為字典

Spark 3.0中pandas支持及其與DataFrame相互轉(zhuǎn)換的示例分析

Pandas DataFrame如何實(shí)現(xiàn)連接與追加

Pandas中DataFrame條件格式化的示例分析

Pandas如何批量拆分Excel與合并Excel

相關(guān)標(biāo)簽

flappy bird python3.5 python文件讀取 python序列 python多態(tài) python編譯器 python re python培訓(xùn) python模擬 python正則 ssh-copy-id python threadpool pywinauto python文件 scrapy框架 python27.dll docker-py python運(yùn)維 python全棧 Python 3.x

AI
助
手

產(chǎn)品服務(wù)

云服務(wù)器

高防服務(wù)器

高防IP

裸金屬服務(wù)器

機(jī)柜租用

SSL證書

高防CDN

彈性IP

地區(qū)劃分

中國(guó)香港服務(wù)器

美國(guó)服務(wù)器

德國(guó)服務(wù)器

日本服務(wù)器

韓國(guó)服務(wù)器

新加坡服務(wù)器

專題活動(dòng)

控制臺(tái)

應(yīng)用市場(chǎng)

最新活動(dòng)

幫助支持

幫助中心

網(wǎng)站備案

法律條款

全國(guó)服務(wù)

安全漏洞

主題地圖

關(guān)于我們

關(guān)于億速云

客戶案例

新聞資訊

資訊地圖

問答地圖

聯(lián)系我們

人才招聘

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼

Copyright ? Yisu Cloud Ltd. All Rights Reserved. 2018 版權(quán)所有

廣州億速云計(jì)算有限公司粵ICP備17096448號(hào)-1 粵公網(wǎng)安備 44010402001142號(hào)增值電信業(yè)務(wù)經(jīng)營(yíng)許可證編號(hào)：B1-20181529

感谢您访问我们的网站，您可能还对以下资源感兴趣：
女人爽到高潮潮喷18禁
欧美日韩亚洲国产精品自拍精品丝袜国产自在线拍日本高清视频在线网站 97久久超碰国产精品旧版麻豆久久久国产一区二区三区