您好,登錄后才能下訂單哦!
摘要
數(shù)據(jù)分析與建模的時(shí)候大部分時(shí)間在數(shù)據(jù)準(zhǔn)備上,包括對數(shù)據(jù)的加載、清理、轉(zhuǎn)換以及重塑。pandas提供了一組高級的、靈活的、高效的核心函數(shù),能夠輕松的將數(shù)據(jù)規(guī)整化。這節(jié)主要對pandas合并數(shù)據(jù)集的merge函數(shù)進(jìn)行詳解。(用過SQL或其他關(guān)系型數(shù)據(jù)庫的可能會(huì)對這個(gè)方法比較熟悉。)碼字不易,喜歡請點(diǎn)贊?。。?/strong>
1.merge函數(shù)的參數(shù)一覽表
2.創(chuàng)建兩個(gè)DataFrame
3.pd.merge()方法設(shè)置連接字段。
默認(rèn)參數(shù)how是inner內(nèi)連接,并且會(huì)按照相同的字段key進(jìn)行合并,即等價(jià)于on=‘key'
。
也可以顯示的設(shè)置on=‘key',這里也推薦這么做。
當(dāng)兩邊合并字段不同時(shí),可以使用left_on和right_on參數(shù)設(shè)置合并字段。當(dāng)然這里合并字段都是key所以left_on和right_on參數(shù)值都是key。
4.pd.merge()方法設(shè)置連接方法。
主要包括inner(內(nèi)連接)、outer(外鏈接)、left(左連接)、right(右連接)。
參數(shù)how默認(rèn)值是inner內(nèi)連接,上面的都是采用內(nèi)連接,連接兩邊都有的值。
當(dāng)采用outer外連接時(shí),會(huì)取并集,并用NaN填充。
外連接其實(shí)左連接和右連接的并集。左連接是左側(cè)DataFrame取全部數(shù)據(jù),右側(cè)DataFrame匹配左側(cè)DataFrame。(右連接right和左連接類似)
5.pd.merge()方法索引連接,以及重復(fù)列名命名。
pd.merge()方法可以通過設(shè)置left_index或者right_index的值為True來使用索引連接,例如這里df1使用data1當(dāng)連接關(guān)鍵字,而df2使用索引當(dāng)連接關(guān)鍵字。
從上面可以發(fā)現(xiàn)兩個(gè)DataFrame中都有key列,merge合并之后,pandas會(huì)自動(dòng)在后面加上(_x,_y)來區(qū)分,我們也可以通過設(shè)置suffixes來設(shè)置名字。
總結(jié)
以上所述是小編給大家介紹的詳解Python3 pandas.merge用法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對億速云網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。