您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關如何分析大數(shù)據(jù)中數(shù)據(jù)的對象類型及文件的讀入輸出,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
一、對象類型:
包括標量、向量、矩陣、數(shù)組、數(shù)據(jù)框和列表。
1)向量(vector):用于存儲數(shù)值型、字符型或邏輯型數(shù)據(jù)的一維數(shù)組。函數(shù)c()用來創(chuàng)建向量:
示例如下:
a <- c(1:10) b <- c("A","B") d <- c(TRUE,FALSE)
注:單個向量中的數(shù)據(jù)必須擁有相同的類型或模式(數(shù)值型、字符型或邏輯型)。
2)矩陣:二維數(shù)組,每個元素都擁有相同的模式(數(shù)值型、字符型或邏輯型)。函數(shù)matrix創(chuàng)建矩陣:
myymatrix <- matrix(vector, nrow=number_of_rows, ncol=number_of_columns,byrow=logical_value, dimnames=list(char_vector_rownames, char_vector_colnames))
其中:vector包含了矩陣的元素, nrow和ncol用以指定行和列的維數(shù), dimnames包含了可選的、以字符型向量表示的行名和列名。默認情況按列填充。
示例如下:
mymatrix <- matrix(1:4, nrow=2, ncol=2, byrow=FALSE,dimnames=list(c("R1","R2"),c("C1","C2"))) C1 C2R1 1 3R2 2 4
3)數(shù)組(array):與矩陣類似,維度可以大于2。array函數(shù)創(chuàng)建:
myarray <- array(vector, dimensions, dimnames)
其中:vector包含了數(shù)組中的數(shù)據(jù),dimensions是一個數(shù)值型向量,給出了各個維度下標的最大值,而dimnames是可選的、各維度名稱標簽的列表
示例如下:
myarray <- array(1:24, c(2, 3, 4), dimnames=list(c("A1", "A2"), c("B1", "B2", "B3"), c("C1", "C2", "C3", "C4")))
4)數(shù)據(jù)框(data.frame):不同的列可以包含不同模式(數(shù)值型、字符型等)的數(shù)據(jù),很重要!data.frame()創(chuàng)建:
mydata <- data.frame(col1, col2, col3,…)
其中的列向量col1, col2, col3,… 可為任何類型(如字符型、數(shù)值型或邏輯型)。每一列的名稱可由函數(shù)names指定
示例如下:
patientID <- c(1, 2, 3, 4)
age <- c(25, 34, 28, 52)
diabetes <- c("Type1", "Type2", "Type1", "Type1")
status <- c("Poor", "Improved", "Excellent", "Poor")
patientdata <- data.frame(patientID, age, diabetes, status)
patientID age diabetes status
1 1 25 Type1 Poor
2 2 34 Type2 Improved
3 3 28 Type1 Excellent
4 4 52 Type1 Poor
是不是和EXCEL內容很像,所以重要??!
5)因子(factor):類別(名義型)變量和有序類別(有序型)變量在R中稱為因子(factor),繪圖時候重要。
6)列表(list)是R的數(shù)據(jù)類型中最為復雜的一種。一般來說,列表就是一些對象(或成分,component)的有序集合。列表允許你整合若干(可能無關的)對象到單個對象名下。函數(shù)list()創(chuàng)建:
mylist <- list(object1, object2, …)
示例如下:
g <- "My First List"h <- c(25, 26, 18, 39)j <- matrix(1:10, nrow=5)k <- c("one", "two", "three")mylist <- list(title=g, ages=h, j, k)
二、數(shù)據(jù)下標
注:第一個元素下標從1開始!
1)向量:a[2];d[1]
2)矩陣:使用下標和方括號來選擇矩陣中的行、 列或元素。X[i,]指矩陣X中的第i 行,X[,j]指第j 列, X[i, j]指第i 行第j 個元素。選擇多行或多列時,下標i 和j 可為數(shù)值型向量。
3)數(shù)組:從數(shù)組中選取元素的方式與矩陣相同
4)數(shù)據(jù)框:可以使用前述(如矩陣中的)下標記號,亦可直接指定列名。
patientdata$age && patientdata[,2] 一樣的結果
另:在每個變量名前都鍵入一次patientdata$麻煩,可以走一些捷徑。聯(lián)合使用函數(shù)attach()和detach()或單獨使用函數(shù)with()來簡化代碼;
示例如下:
attach(mtcars) #函數(shù)attach()可將數(shù)據(jù)框添加到R的搜索路徑中
summary(mpg) #檢查搜索路徑中的數(shù)據(jù)框,以定位到這個變量
plot(mpg, disp)
detach(mtcars) #函數(shù)detach()將數(shù)據(jù)框從搜索路徑中移除
with(mtcars, {
nokeepstats <- summary(mpg)
keepstats <<- summary(mpg) #使用特殊賦值符<<-替代標準賦值符(<-)即可,它可將對象保存到with()之外的全局環(huán)境中。
})
#查看nokeepstats 和 keepstats 的區(qū)別:
nokeepstats
Error: object 'nokeepstats' not found
keepstats
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
5)列表:雙重方括號中指明代表某個成分的數(shù)字或名稱來訪問列表中的元素。
mylist[[2]]和mylist[["ages"]]均指那個含有四個元素的向量mylist[[2]][1] 25 26 18 39mylist[["ages"]][1] 25 26 18 39
三、數(shù)據(jù)讀入與寫入:
1)使用read.table()從帶分隔符的文本文件中導入數(shù)據(jù)。
mydataframe <- read.table(file, header=logical_value,sep="delimiter", row.names="name")
注1:help(read.table):更多詳情
注2:stringsAsFactors=FALSE,可禁止將字符型變量將轉換為因子。
2)使用read.csv()導入csv(excel)數(shù)據(jù)。
3)write.table , write.csv 輸出R結果到文件中.
以上就是如何分析大數(shù)據(jù)中數(shù)據(jù)的對象類型及文件的讀入輸出,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業(yè)資訊頻道。
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。