溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

數(shù)據(jù)分析中pandas有什么用

發(fā)布時(shí)間:2021-11-30 10:35:54 來源:億速云 閱讀:265 作者:小新 欄目:大數(shù)據(jù)

這篇文章主要為大家展示了“數(shù)據(jù)分析中pandas有什么用”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“數(shù)據(jù)分析中pandas有什么用”這篇文章吧。

數(shù)據(jù)分析

  • python數(shù)據(jù)科學(xué)的基礎(chǔ)

  • 機(jī)器學(xué)習(xí)課程的基礎(chǔ)

  • 工具anaconda和jupyter

  • matplotlib

  • 查看系統(tǒng)字體:fc-list :lang=zh

numpy

  • NumPy是使用Python進(jìn)行科學(xué)計(jì)算的基礎(chǔ)包

  • 官網(wǎng):https://www.numpy.org.cn/

pandas

  • Seres一維數(shù)組

    • t.index

    • t.values

  • DataFrame二維數(shù)組

    • 處理方式1:刪除NaN所在的行列dropna(axis=0,how='any',inplace=False)

    • 處理方式2:填充數(shù)據(jù)t.fillna(t.mean())#均值,t.fiall(t.median()),t.fillna(0)

      處理為0的數(shù)據(jù):t[t=0]=np.nan
      當(dāng)然并不是每次為0的數(shù)據(jù)都需要處理
      計(jì)算平均值等情況,nan是不參與計(jì)算的,但是0會(huì)


    • 指定索引:t.index = ['x', 'y']

    • 重新設(shè)置索引:t.reindex(['x', 'y'])

    • 指定某一列作為index:t.set_index("name", drop=False)

    • 返回index的唯一值:t.set_index("name").index.unique()

    • 交換levels里面的索引:t.swaplevel()

    • 行索引,表明不同行,橫向索引,叫index,0軸,axis=0

    • 行索引,表明不同列,縱向索引,叫columns,1軸,axis=1

    • t.index 行索引

    • t.columns 列索引

    • t.values 對(duì)象值,二維ndarray數(shù)組

    • t.shape 形狀(行數(shù),列數(shù))

    • t.dtypes 類型

    • t.ndim 數(shù)據(jù)維度

    • t.head(3) 顯示頭部幾行,默認(rèn)5行

    • t.tail(3) 顯示尾部幾行,默認(rèn)5行

    • t.info() 相關(guān)信息概覽:行數(shù)、列數(shù)、列索引、列非空值個(gè)數(shù)、列類型、行類型、內(nèi)存占用

    • t.describe() 快速綜合統(tǒng)計(jì)結(jié)果:計(jì)算、均值、標(biāo)準(zhǔn)差、最大值、四分位數(shù)、最小值

    • t.loc() 通過標(biāo)簽索引行數(shù)據(jù)

    • t.iloc() 通過位置獲取行數(shù)據(jù)

    • 判斷數(shù)據(jù)是否為NaN:pd.isnull(t),pd.notnull(t)

  • pandas 常用統(tǒng)計(jì)方法

    • on:指定列

    • how->inner(默認(rèn))交集方式合并

    • how->outer 并集方式合并,NaN補(bǔ)全

    • how->left 以左邊為準(zhǔn)合并,NaN補(bǔ)全

    • how->right 以右邊為準(zhǔn)合并,NaN補(bǔ)全

    • 平均值:df["xx"].mean()

    • 最大值:df["xx"].max()

    • 最大值索引:df["xx"].idxmax()

    • 最小值:df["xx"].max()

    • 最小值索引:df["xx"].idxmin()

    • 中位數(shù):df["xx"].median()

    • join:默認(rèn)是把行索引相同的數(shù)據(jù)合并到一起t1.join(t2)

    • merge:按照指定的列把數(shù)據(jù)按照一定的方式合并到一起t1.merge(t2, on="a", how="inner")

  • 時(shí)間序列

    • ps.to_datetime(df["timeStamp"])

數(shù)據(jù)分析中pandas有什么用

以上是“數(shù)據(jù)分析中pandas有什么用”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI