溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python中pd.concat與pd.merge怎么使用

發(fā)布時(shí)間:2022-06-15 10:15:02 來(lái)源:億速云 閱讀:266 作者:iii 欄目:開(kāi)發(fā)技術(shù)

這篇“Python中pd.concat與pd.merge怎么使用”文章的知識(shí)點(diǎn)大部分人都不太理解,所以小編給大家總結(jié)了以下內(nèi)容,內(nèi)容詳細(xì),步驟清晰,具有一定的借鑒價(jià)值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來(lái)看看這篇“Python中pd.concat與pd.merge怎么使用”文章吧。

數(shù)據(jù)拼接:pd.concat

concat 是pandas級(jí)的函數(shù),用來(lái)拼接或合并數(shù)據(jù),其根據(jù)不同的軸既可以橫向拼接,又可以縱向拼接

函數(shù)參數(shù)

pd.concat(
    objs: 'Iterable[NDFrame] | Mapping[Hashable, NDFrame]',
    axis=0,
    join='outer',
    ignore_index: 'bool' = False,
    keys=None,
    levels=None,
    names=None,
    verify_integrity: 'bool' = False,
    sort: 'bool' = False,
    copy: 'bool' = True,
) -> 'FrameOrSeriesUnion'
  • objs:合并的數(shù)據(jù)集,一般用列表傳入,例如:[df1,df2,df3]

  • axis:指定數(shù)據(jù)拼接時(shí)的軸,0是行,在行方向上拼接;1是列,在列方向上拼接

  • join:拼接的方式有 inner,或者outer,與sql中的意思一樣

以上三個(gè)參數(shù)在實(shí)際工作中經(jīng)常使用,其他參數(shù)不再做介紹

案例:

Python中pd.concat與pd.merge怎么使用

模擬數(shù)據(jù)

橫向拼接

Python中pd.concat與pd.merge怎么使用

橫向拼接-1

字段相同的列進(jìn)行堆疊,字段不同的列分列存放,缺失值用NAN來(lái)填充,下面對(duì)模擬數(shù)據(jù)進(jìn)行變換用相同的字段,進(jìn)行演示

Python中pd.concat與pd.merge怎么使用

橫向拼接-2

縱向拼接

Python中pd.concat與pd.merge怎么使用

縱向拼接

可以看出在縱向拼接的時(shí)候,會(huì)按索引進(jìn)行關(guān)聯(lián),使相同名字的成績(jī)放在一起,而不是簡(jiǎn)單的堆疊

數(shù)據(jù)關(guān)聯(lián):pd.merge

數(shù)據(jù)關(guān)聯(lián)與SQL中的join基本一樣,一次可以關(guān)聯(lián)兩個(gè)數(shù)據(jù)表,有左表、右表的區(qū)分,需要可以指定關(guān)聯(lián)的字段

函數(shù)參數(shù)

pd.merge(
    left: 'DataFrame | Series',
    right: 'DataFrame | Series',
    how: 'str' = 'inner',
    on: 'IndexLabel | None' = None,
    left_on: 'IndexLabel | None' = None,
    right_on: 'IndexLabel | None' = None,
    left_index: 'bool' = False,
    right_index: 'bool' = False,
    sort: 'bool' = False,
    suffixes: 'Suffixes' = ('_x', '_y'),
    copy: 'bool' = True,
    indicator: 'bool' = False,
    validate: 'str | None' = None,
) -> 'DataFrame'
  • left:左表

  • right:右表

  • how:關(guān)聯(lián)的方式,{‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, 默認(rèn)關(guān)聯(lián)方式為 ‘inner’

  • on:關(guān)聯(lián)時(shí)指定的字段,兩個(gè)表共有的

  • left_on:關(guān)聯(lián)時(shí)用到左表中的字段,在兩個(gè)表不共有關(guān)聯(lián)字段時(shí)使用

  • right_on:關(guān)聯(lián)時(shí)用到右表中的字段,在兩個(gè)表不共有關(guān)聯(lián)字段時(shí)使用

以上參數(shù)在實(shí)際工作中經(jīng)常使用,其他參數(shù)不再做介紹

案例:

Python中pd.concat與pd.merge怎么使用

數(shù)據(jù)關(guān)聯(lián)

merge 的使用與SQL中的 join 很像,使用方式基本一致,既有內(nèi)連接,也有外連接,用起來(lái)基本沒(méi)有什么難度

兩者區(qū)別

  • concat 只是 pandas 下的方法,而 merge 即是 pandas 下的方法,又是DataFrame 下的方法

  • concat 可以橫向、縱向拼接,又起到關(guān)聯(lián)的作用

  • merge 只能進(jìn)行關(guān)聯(lián),也就是縱向拼接

  • concat 可以同時(shí)處理多個(gè)數(shù)據(jù)框DataFrame,而 merge 只能同時(shí)處理 2 個(gè)數(shù)據(jù)框

以上就是關(guān)于“Python中pd.concat與pd.merge怎么使用”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對(duì)大家有幫助,若想了解更多相關(guān)的知識(shí)內(nèi)容,請(qǐng)關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI