R語(yǔ)言中subset函數(shù)用于從數(shù)據(jù)框中選擇需要的觀測(cè)值和變量,可以根據(jù)條件進(jìn)行子集的選擇。其基本用法如下:
subset(data, subset, select)
示例:
# 從數(shù)據(jù)框df中選擇滿足條件的觀測(cè)值
new_df <- subset(df, subset = condition)
# 從數(shù)據(jù)框df中選擇滿足條件的觀測(cè)值,并選擇需要的變量
new_df <- subset(df, subset = condition, select = variables)
其中,condition
可以是一個(gè)邏輯向量,也可以是一個(gè)邏輯表達(dá)式,例如df$var > 10
表示選擇變量var
大于10的觀測(cè)值。variables
可以是一個(gè)字符向量,也可以是一個(gè)數(shù)值向量,例如c("var1", "var2")
表示選擇var1
和var2
這兩個(gè)變量。
需要注意的是,subset函數(shù)會(huì)在選擇變量時(shí)自動(dòng)將結(jié)果轉(zhuǎn)換為數(shù)據(jù)框,因此返回的結(jié)果仍然是一個(gè)數(shù)據(jù)框。