如何分析大數(shù)據(jù)中數(shù)據(jù)的對象類型及文件的讀入輸出

發(fā)布時間：2021-12-10 15:20:56 來源：億速云閱讀：128 作者：柒染欄目：大數(shù)據(jù)

本篇文章給大家分享的是有關如何分析大數(shù)據(jù)中數(shù)據(jù)的對象類型及文件的讀入輸出，小編覺得挺實用的，因此分享給大家學習，希望大家閱讀完這篇文章后可以有所收獲，話不多說，跟著小編一起來看看吧。

一、對象類型：

包括標量、向量、矩陣、數(shù)組、數(shù)據(jù)框和列表。

1)向量(vector)：用于存儲數(shù)值型、字符型或邏輯型數(shù)據(jù)的一維數(shù)組。函數(shù)c()用來創(chuàng)建向量：

示例如下：

a <- c(1:10) b <- c("A","B") d <- c(TRUE,FALSE)

注：單個向量中的數(shù)據(jù)必須擁有相同的類型或模式(數(shù)值型、字符型或邏輯型)。

2)矩陣：二維數(shù)組，每個元素都擁有相同的模式(數(shù)值型、字符型或邏輯型)。函數(shù)matrix創(chuàng)建矩陣：

myymatrix <- matrix(vector, nrow=number_of_rows, ncol=number_of_columns,byrow=logical_value, dimnames=list(char_vector_rownames, char_vector_colnames))

其中：vector包含了矩陣的元素， nrow和ncol用以指定行和列的維數(shù)， dimnames包含了可選的、以字符型向量表示的行名和列名。默認情況按列填充。

示例如下：

mymatrix <- matrix(1:4, nrow=2, ncol=2, byrow=FALSE,dimnames=list(c("R1","R2"),c("C1","C2")))   C1 C2R1  1  3R2  2  4

3)數(shù)組(array):與矩陣類似，維度可以大于2。array函數(shù)創(chuàng)建:

myarray <- array(vector, dimensions, dimnames)

其中：vector包含了數(shù)組中的數(shù)據(jù)，dimensions是一個數(shù)值型向量，給出了各個維度下標的最大值，而dimnames是可選的、各維度名稱標簽的列表

示例如下：

myarray <- array(1:24, c(2, 3, 4), dimnames=list(c("A1", "A2"), c("B1", "B2", "B3"), c("C1", "C2", "C3", "C4")))

4)數(shù)據(jù)框(data.frame)：不同的列可以包含不同模式(數(shù)值型、字符型等)的數(shù)據(jù)，很重要！data.frame()創(chuàng)建：

mydata <- data.frame(col1, col2, col3,…)

其中的列向量col1, col2, col3,… 可為任何類型(如字符型、數(shù)值型或邏輯型)。每一列的名稱可由函數(shù)names指定

示例如下：

patientID <- c(1, 2, 3, 4)
age <- c(25, 34, 28, 52)
diabetes <- c("Type1", "Type2", "Type1", "Type1")
status <- c("Poor", "Improved", "Excellent", "Poor")
patientdata <- data.frame(patientID, age, diabetes, status)

patientID age diabetes    status
1         1  25    Type1      Poor
2         2  34    Type2  Improved
3         3  28    Type1 Excellent
4         4  52    Type1      Poor

是不是和EXCEL內容很像，所以重要??！

5)因子(factor)：類別(名義型)變量和有序類別(有序型)變量在R中稱為因子（factor），繪圖時候重要。

6)列表(list)是R的數(shù)據(jù)類型中最為復雜的一種。一般來說，列表就是一些對象（或成分，component）的有序集合。列表允許你整合若干（可能無關的）對象到單個對象名下。函數(shù)list()創(chuàng)建：

mylist <- list(object1, object2, …)

示例如下：

g <- "My First List"h <- c(25, 26, 18, 39)j <- matrix(1:10, nrow=5)k <- c("one", "two", "three")mylist <- list(title=g, ages=h, j, k)

二、數(shù)據(jù)下標

注：第一個元素下標從1開始！

1)向量：a[2];d[1]

2)矩陣：使用下標和方括號來選擇矩陣中的行、列或元素。X[i,]指矩陣X中的第i 行，X[,j]指第j 列， X[i, j]指第i 行第j 個元素。選擇多行或多列時，下標i 和j 可為數(shù)值型向量。

3)數(shù)組：從數(shù)組中選取元素的方式與矩陣相同

4)數(shù)據(jù)框：可以使用前述（如矩陣中的）下標記號，亦可直接指定列名。

patientdata$age && patientdata[,2] 一樣的結果

另：在每個變量名前都鍵入一次patientdata$麻煩，可以走一些捷徑。聯(lián)合使用函數(shù)attach()和detach()或單獨使用函數(shù)with()來簡化代碼；

示例如下：

attach(mtcars) #函數(shù)attach()可將數(shù)據(jù)框添加到R的搜索路徑中
summary(mpg)    #檢查搜索路徑中的數(shù)據(jù)框，以定位到這個變量
plot(mpg, disp)
detach(mtcars) #函數(shù)detach()將數(shù)據(jù)框從搜索路徑中移除

with(mtcars, {
nokeepstats <- summary(mpg)
keepstats <<- summary(mpg) #使用特殊賦值符<<-替代標準賦值符（<-）即可，它可將對象保存到with()之外的全局環(huán)境中。
})
#查看nokeepstats 和 keepstats 的區(qū)別：
nokeepstats
Error: object 'nokeepstats' not found
keepstats
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  10.40   15.43   19.20   20.09   22.80   33.90

5)列表：雙重方括號中指明代表某個成分的數(shù)字或名稱來訪問列表中的元素。

mylist[[2]]和mylist[["ages"]]均指那個含有四個元素的向量mylist[[2]][1] 25 26 18 39mylist[["ages"]][1] 25 26 18 39

三、數(shù)據(jù)讀入與寫入：

1)使用read.table()從帶分隔符的文本文件中導入數(shù)據(jù)。

mydataframe <- read.table(file, header=logical_value,sep="delimiter", row.names="name")

注1：help(read.table)：更多詳情

注2：stringsAsFactors=FALSE，可禁止將字符型變量將轉換為因子。

2)使用read.csv()導入csv(excel)數(shù)據(jù)。

3)write.table , write.csv 輸出R結果到文件中.

以上就是如何分析大數(shù)據(jù)中數(shù)據(jù)的對象類型及文件的讀入輸出，小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

如何分析大數(shù)據(jù)中數(shù)據(jù)的對象類型及文件的讀入輸出

猜你喜歡

最新資訊

相關推薦

相關標簽