溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python的concat與merge函數(shù)怎么使用

發(fā)布時間:2022-05-27 13:35:54 來源:億速云 閱讀:251 作者:iii 欄目:編程語言

這篇“Python的concat與merge函數(shù)怎么使用”文章的知識點大部分人都不太理解,所以小編給大家總結(jié)了以下內(nèi)容,內(nèi)容詳細(xì),步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“Python的concat與merge函數(shù)怎么使用”文章吧。

Python的concat與merge函數(shù)怎么使用

一、concat函數(shù)

  1. concat()函數(shù)可以沿著一條軸將多個對象進行堆疊,其使用方式類似數(shù)據(jù)庫中的數(shù)據(jù)表合并
    pandas.concat(objs, axis=0, join=’outer’, join_axes=None, ignore_index=False, keys=None, levels=None, verify_integrity=False, sort=None, copy=True)

  2. 參數(shù)含義如下:

參數(shù)作用
axis表示連接的軸向,可以為0或者1,默認(rèn)為0
join表示連接的方式,inner表示內(nèi)連接,outer表示外連接,默認(rèn)使用外連接
ignore_index接收布爾值,默認(rèn)為False。如果設(shè)置為True,則表示清除現(xiàn)有索引并重置索引值
keys接收序列,表示添加最外層索引
levels用于構(gòu)建MultiIndex的特定級別(唯一值)
names設(shè)置了keys和level參數(shù)后,用于創(chuàng)建分層級別的名稱
verify_integerity檢查新的連接軸是否包含重復(fù)項。接收布爾值,當(dāng)設(shè)置為True時,如果有重復(fù)的軸將會拋出錯誤,默認(rèn)為False
  1. 根據(jù)軸方向的不同,可以將堆疊分成橫向堆疊縱向堆疊,默認(rèn)采用的是縱向堆疊方式

Python的concat與merge函數(shù)怎么使用

  1. 在堆疊數(shù)據(jù)時,默認(rèn)采用的是外連接(join參數(shù)設(shè)為outer)的方式進行合并,當(dāng)然也可以通過join=inner設(shè)置為內(nèi)連接的方式。

Python的concat與merge函數(shù)怎么使用

1)橫向堆疊與外連接

import pandas as pd
df1=pd.DataFrame({'A':['A0','A1','A2'],
                  'B':['B0','B1','B2']})df1

Python的concat與merge函數(shù)怎么使用

df2=pd.DataFrame({'C':['C0','C1','C2'],
                  'D':['D0','D1','D2']})df2

Python的concat與merge函數(shù)怎么使用

橫向堆疊合并df1和df2,采用外連接的方式

pd.concat([df1,df2],join='outer',axis=1)

Python的concat與merge函數(shù)怎么使用

2) 縱向堆疊與內(nèi)鏈接


import pandas as pd
first=pd.DataFrame({'A':['A0','A1','A2'],
                   'B':['B0','B1','B2'],
                   'C':['C0','C1','C2']})first

Python的concat與merge函數(shù)怎么使用


second=pd.DataFrame({'B':['B3','B4','B5'],
                   'C':['C3','C4','C5'],
                    'D':['D3','D4','D5']})second

Python的concat與merge函數(shù)怎么使用

  1. 當(dāng)使用concat()函數(shù)合并時,若是將axis參數(shù)的值設(shè)為0,且join參數(shù)的值設(shè)為inner,則代表著使用縱向堆疊與內(nèi)連接的方式進行合并

pd.concat([first,second],join='inner',axis=0)

Python的concat與merge函數(shù)怎么使用

二、merge()函數(shù)

1)主鍵合并數(shù)據(jù)

  1. 在使用merge()函數(shù)進行合并時,默認(rèn)會使用重疊的列索引做為合并鍵,并采用內(nèi)連接方式合并數(shù)據(jù),即取行索引重疊的部分。

import pandas as pd
left=pd.DataFrame({'key':['K0','K1','K2'],
                  'A':['A0','A1','A2'],
                  'B':['B0','B1','B2']})left

Python的concat與merge函數(shù)怎么使用

right=pd.DataFrame({'key':['K0','K1','K2','K3'],
                   'C':['C0','C1','C2','C3'],
                   'D':['D0','D1','D2','D3']})right

Python的concat與merge函數(shù)怎么使用

pd.merge(left,right,on='key')

Python的concat與merge函數(shù)怎么使用

2)merge()函數(shù)還支持對含有多個重疊列的DataFrame對象進行合并。

import pandas as pd
data1=pd.DataFrame({'key':['K0','K1','K2'],
                  'A':['A0','A1','A2'],
                  'B':['B0','B1','B2']})data1

Python的concat與merge函數(shù)怎么使用

data2=pd.DataFrame({'key':['K0','K5','K2','K4'],
                         'B':['B0','B1','B2','B5'],
                         'C':['C0','C1','C2','C3'],
                         'D':['D0','D1','D2','D3']})data2

Python的concat與merge函數(shù)怎么使用

pd.merge(data1,data2,on=['key','B'])

Python的concat與merge函數(shù)怎么使用

1)根據(jù)行索引合并數(shù)據(jù)

  1. join()方法能夠通過索引或指定列來連接多個DataFrame對象

  2. join(other,on = None,how =‘left’,lsuffix =‘’,rsuffix =‘’,sort = False )


參數(shù)作用
on名稱,用于連接列名
how?可以從{‘‘left’’ ,‘‘right’’, ‘‘outer’’, ‘‘inner’’}中任選一個,默認(rèn)使用左連接的方式。
sort根據(jù)連接鍵對合并的數(shù)據(jù)進行排序,默認(rèn)為False
import pandas as pd
data3=pd.DataFrame({'A':['A0','A1','A2'],
                   'B':['B0','B1','B2']})data3

Python的concat與merge函數(shù)怎么使用

data4=pd.DataFrame({'C': ['C0', 'C1', 'C2'],
                         'D': ['D0', 'D1', 'D2']},
                     index=['a','b','c'])data3.join(data4,how='outer')  # 外連接

Python的concat與merge函數(shù)怎么使用

data3.join(data4,how='left')  #左連接

Python的concat與merge函數(shù)怎么使用

data3.join(data4,how='right')  #右連接

Python的concat與merge函數(shù)怎么使用

data3.join(data4,how='inner')  #內(nèi)連接

Python的concat與merge函數(shù)怎么使用

import pandas as pd
left = pd.DataFrame({'A': ['A0', 'A1', 'A2'],
                        'B': ['B0', 'B1', 'B2'],
                      'key': ['K0', 'K1', 'K2']})left

Python的concat與merge函數(shù)怎么使用

right = pd.DataFrame({'C': ['C0', 'C1','C2'],
                         'D': ['D0', 'D1','D2']},
                        index=['K0', 'K1','K2'])right

Python的concat與merge函數(shù)怎么使用
on參數(shù)指定連接的列名

left.join(right,how='left',on='key')  #on參數(shù)指定連接的列名

Python的concat與merge函數(shù)怎么使用

2)合并重疊數(shù)據(jù)

當(dāng)DataFrame對象中出現(xiàn)了缺失數(shù)據(jù),而我們希望使用其他DataFrame對象中的數(shù)據(jù)填充缺失數(shù)據(jù),則可以通過combine_first()方法為缺失數(shù)據(jù)填充。

import pandas as pdimport numpy as npfrom numpy import NAN
left = pd.DataFrame({'A': [np.nan, 'A1', 'A2', 'A3'],
                        'B': [np.nan, 'B1', np.nan, 'B3'],
                        'key': ['K0', 'K1', 'K2', 'K3']})left

Python的concat與merge函數(shù)怎么使用

right = pd.DataFrame({'A': ['C0', 'C1','C2'],
                         'B': ['D0', 'D1','D2']},
                         index=[1,0,2])right

Python的concat與merge函數(shù)怎么使用
用right的數(shù)據(jù)填充left缺失的部分

left.combine_first(right) # 用right的數(shù)據(jù)填充left缺失的部分

Python的concat與merge函數(shù)怎么使用

以上就是關(guān)于“Python的concat與merge函數(shù)怎么使用”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對大家有幫助,若想了解更多相關(guān)的知識內(nèi)容,請關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI