<blockquote id="b2cz1"><listing id="b2cz1"></listing></blockquote>

<tt id="b2cz1"></tt>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

利用iloc實(shí)現(xiàn)DataFrame的隨機(jī)樣本分層

發(fā)布時(shí)間：2024-09-01 15:41:39 來(lái)源：億速云閱讀：92 作者：小樊欄目：編程語(yǔ)言

要使用iloc實(shí)現(xiàn)DataFrame的隨機(jī)樣本分層，首先需要對(duì)數(shù)據(jù)進(jìn)行分層，然后在每個(gè)層次上隨機(jī)抽取樣本。以下是一個(gè)示例：

import pandas as pd
import numpy as np

# 創(chuàng)建一個(gè)模擬數(shù)據(jù)集
data = {'A': np.random.randint(1, 100, 100),
        'B': np.random.randint(1, 100, 100),
        'C': np.random.choice(['a', 'b', 'c'], 100)}

df = pd.DataFrame(data)

# 對(duì)數(shù)據(jù)集進(jìn)行分層
stratified_data = df.groupby('C')

# 定義要抽取的樣本數(shù)量
sample_size = 5

# 從每個(gè)層次上隨機(jī)抽取樣本
random_samples = []
for group_name, group_data in stratified_data:
    random_indices = np.random.choice(group_data.index, size=min(sample_size, len(group_data)), replace=False)
    random_samples.append(group_data.loc[random_indices])

# 將抽取的樣本合并為一個(gè)新的DataFrame
random_sampled_df = pd.concat(random_samples)

print(random_sampled_df)

這個(gè)示例首先創(chuàng)建了一個(gè)包含3列（A、B和C）的模擬數(shù)據(jù)集，其中C列有3個(gè)類別（a、b、c）。然后，我們使用groupby函數(shù)對(duì)數(shù)據(jù)集進(jìn)行分層，并從每個(gè)層次上隨機(jī)抽取5個(gè)樣本。最后，我們將抽取的樣本合并為一個(gè)新的DataFrame。

向AI問(wèn)一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
靜態(tài)庫(kù)在C程序中的加載機(jī)制
下一篇新聞：
Pandas iloc與Numpy的關(guān)聯(lián)

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼

<menu id="2aomy"></menu>