您好,登錄后才能下訂單哦!
原文鏈接:http://www.datastudy.cc/to/17
很多時(shí)候,我們拿到的數(shù)據(jù),都是匯總的一份數(shù)據(jù),例如我們示例中的數(shù)據(jù),已經(jīng)把所有倉(cāng)庫(kù)的數(shù)據(jù)都匯總起來(lái)了。
但是我們?cè)诮y(tǒng)計(jì)建模的時(shí)候,如果想要把他們拆分開(kāi)來(lái)進(jìn)行處理,那么如何進(jìn)行分層處理呢?其實(shí)非常簡(jiǎn)單,我們使用split函數(shù)即可。
split(x, f, drop = FALSE, ...)
下面我們來(lái)看分層處理的案例:
數(shù)據(jù)請(qǐng)從百度盤(pán)下載:
鏈接: http://pan.baidu.com/s/1kFxoy 密碼: tnbf
data <- read.csv("D:\\data\\20150922\\data.csv", fileEncoding="UTF8", stringsAsFactors=FALSE)
datas <- split(data, data$倉(cāng)庫(kù))
result <- c();
for(d in datas) {
#這里執(zhí)行我們需要的建模,
#我這里演示就用了個(gè)計(jì)算平均數(shù)
m <- mean(d$進(jìn)價(jià));
#把建模后的模型加入到結(jié)果數(shù)組中
result <- append(result, m)
}
result
以上就是分層處理的最基本模型,包括分層抽取數(shù)據(jù),以及將處理后的結(jié)果組裝成為一個(gè)向量返回。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。