<samp id="762xh"><tbody id="762xh"><dl id="762xh"></dl></tbody></samp>

<video id="762xh"><th id="762xh"></th></video>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

python?pandas怎么遍歷每行并累加進(jìn)行條件過(guò)濾

發(fā)布時(shí)間：2022-05-12 11:26:12 來(lái)源：億速云閱讀：268 作者：iii 欄目：開(kāi)發(fā)技術(shù)

今天小編給大家分享一下python pandas怎么遍歷每行并累加進(jìn)行條件過(guò)濾的相關(guān)知識(shí)點(diǎn)，內(nèi)容詳細(xì)，邏輯清晰，相信大部分人都還太了解這方面的知識(shí)，所以分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后有所收獲，下面我們一起來(lái)了解一下吧。

pandas遍歷每行并累加進(jìn)行條件過(guò)濾

python?pandas怎么遍歷每行并累加進(jìn)行條件過(guò)濾

本次記錄主要實(shí)現(xiàn)對(duì)每行進(jìn)行排序，并保留前80%以前的偏好。

思路：

將每行的概率進(jìn)行排序，然后累加，累加值小于等于0.8的偏好保留，獲得一個(gè)累加過(guò)濾的dataframe,然后映射回原始數(shù)據(jù)中，保留每行的偏好。接下來(lái)是代碼的實(shí)現(xiàn)

a = [[0.2, 0.35, 0.45], [0.1,0.2, 0.7], [0.3, 0.5, 0.2]]
data = pd.DataFrame(a, index=['user1','user2','user3'], columns=["a", "b", "c"])

sum_df=[]
for index,row in data.iterrows():
    df = row.sort_values(ascending=False).cumsum()
    if df[0]>0.8:
        new_df = df[:1]
    else:
        new_df = df[df<=0.8]
    sum_df.append(new_df)
sum_df = pd.DataFrame(sum_df)
print(sum_df)

python?pandas怎么遍歷每行并累加進(jìn)行條件過(guò)濾

這是累加之后每個(gè)用戶保留的前80%偏好的類型，接下來(lái)如何將這個(gè)特征映射回去，將累加后的dataframe通過(guò)空值將其轉(zhuǎn)化為0-1dataframe,再和原數(shù)據(jù)集一一對(duì)應(yīng)相乘，就可以映射回去了，代碼如下

d = (sum_df.notnull())*1
print(d)

python?pandas怎么遍歷每行并累加進(jìn)行條件過(guò)濾

final_df = d*data #將保留地特征映射到原始數(shù)據(jù)中
print(final_df)

python?pandas怎么遍歷每行并累加進(jìn)行條件過(guò)濾

本節(jié)內(nèi)容目標(biāo)明確，實(shí)現(xiàn)了每個(gè)用戶的前80%偏好，不知道正在看的小伙伴有沒(méi)有懂？可以一起討論哦！

接下來(lái)，考慮優(yōu)化這個(gè)實(shí)現(xiàn)的代碼，前面的思路是通過(guò)兩個(gè)dataframe相乘實(shí)現(xiàn)的，當(dāng)數(shù)據(jù)集非常大的時(shí)候，效率很低，于是不用list,利用字典的形式實(shí)現(xiàn)

sum_df=[]
for index,row in data.iterrows():
    df = row.sort_values(ascending=False).cumsum()
    origin = row.to_dict() #原始每個(gè)用戶值
    if df[0]>0.8:
        new_df = df[:1]
    else:
        new_df = df[df<=0.8]
    name = new_df.name  #user
    tmp = new_df.to_dict()
    for key in tmp.keys(): # 原始值映射
        tmp[key] = origin[key]
    tmp['user'] = name
    sum_df.append(tmp)
sum_df = pd.DataFrame(sum_df).set_index('user').fillna(0)
print(sum_df)

python?pandas怎么遍歷每行并累加進(jìn)行條件過(guò)濾

通過(guò)字典映射效率很高，新測(cè)有效！

python DataFrame遍歷

在數(shù)據(jù)分析的過(guò)程中，往往需要用到DataFrame的類型，因?yàn)檫@個(gè)類型就像EXCEL表格一樣，便于我們個(gè)中連接、計(jì)算、統(tǒng)計(jì)等操作。在數(shù)據(jù)分析的過(guò)程中，避免不了的要對(duì)數(shù)據(jù)進(jìn)行遍歷，那么，DataFrame如何遍歷呢？之前，小白每次使用時(shí)都是Google或百度，想想，還是總結(jié)一下~

小白經(jīng)常用到的有三種方式，如下：

首先，先讀入一個(gè)DataFrame

import pandas as pd
#讀入數(shù)據(jù)
df = pd.read_table('d:/Users/chen_lib/Desktop/tmp.csv',sep=',', header='infer')
df.head()
 
-----------------result------------------
        mas  effectdate     num
0    371379    2019-07-15    361
1    344985    2019-07-13    77
2    425090    2019-07-01    105
3    344983    2019-02-19    339
4    432430    2019-02-21    162

1.DataFrame.iterrows()

將DataFrame的每一行迭代為{索引，Series}對(duì)，對(duì)DataFrame的列，用row['cols']讀取元素

for index, row in df.iterrows():
    print(index,row['mas'],row['num']) 
  
 
------------result---------------
0 371379 361
1 344985 77
2 425090 105
3 344983 339
4 432430 162

從結(jié)果可以看出，第一列就是對(duì)應(yīng)的index，也就是索引，從0開(kāi)始，第二第三列是自定義輸出的列，這樣就完成了對(duì)DataFrame的遍歷。

2.DataFrame.itertuples()

將DataFrame的每一行迭代為元祖，可以通過(guò)row['cols']對(duì)元素進(jìn)行訪問(wèn)，方法一效率高。

for row in df.itertuples():
    print(getattr(row, 'mas'), getattr(row, 'num')) # 輸出每一行
 
 
-------------result-----------------
371379 361
344985 77
425090 105
344983 339
432430 162

從結(jié)果可以看出，這種方法是沒(méi)有index的，直接輸出每一行的結(jié)果。

3.DataFrame.iteritems()

這種方法和上面兩種不同，這個(gè)是按列遍歷，將DataFrame的每一列迭代為(列名, Series)對(duì)，可以通過(guò)row['cols']對(duì)元素進(jìn)行訪問(wèn)。

for index, row in df.iteritems():
    print(index,row[0],row[1],row[2])
 
 
-------------result------------------
masterhotelid 371379 344985 425090
effectdate 2019-07-15 2019-07-13 2019-07-01
quantity 361 77 105

從結(jié)果可以看出，index輸出的是列名，row是用來(lái)讀取第幾行的數(shù)據(jù)，結(jié)果是按列展示

以上就是“python pandas怎么遍歷每行并累加進(jìn)行條件過(guò)濾”這篇文章的所有內(nèi)容，感謝各位的閱讀！相信大家閱讀完這篇文章都有很大的收獲，小編每天都會(huì)為大家更新不同的知識(shí)，如果還想學(xué)習(xí)更多的知識(shí)，請(qǐng)關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Java實(shí)現(xiàn)屏幕截圖工具的代碼怎么寫(xiě)
下一篇新聞：
C語(yǔ)言怎么實(shí)現(xiàn)飛機(jī)游戲

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼