溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何分析大數(shù)據(jù)中數(shù)據(jù)的對象類型及文件的讀入輸出

發(fā)布時間:2021-12-10 15:20:56 來源:億速云 閱讀:128 作者:柒染 欄目:大數(shù)據(jù)

本篇文章給大家分享的是有關如何分析大數(shù)據(jù)中數(shù)據(jù)的對象類型及文件的讀入輸出,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

一、對象類型:

包括標量、向量、矩陣、數(shù)組、數(shù)據(jù)框和列表。

1)向量(vector):用于存儲數(shù)值型、字符型或邏輯型數(shù)據(jù)的一維數(shù)組。函數(shù)c()用來創(chuàng)建向量:

示例如下:

a <- c(1:10) b <- c("A","B") d <- c(TRUE,FALSE)

注:單個向量中的數(shù)據(jù)必須擁有相同的類型或模式(數(shù)值型、字符型或邏輯型)。

2)矩陣:二維數(shù)組,每個元素都擁有相同的模式(數(shù)值型、字符型或邏輯型)。函數(shù)matrix創(chuàng)建矩陣:

myymatrix <- matrix(vector, nrow=number_of_rows, ncol=number_of_columns,byrow=logical_value, dimnames=list(char_vector_rownames, char_vector_colnames))

其中:vector包含了矩陣的元素, nrow和ncol用以指定行和列的維數(shù), dimnames包含了可選的、以字符型向量表示的行名和列名。默認情況按列填充。

示例如下:

mymatrix <- matrix(1:4, nrow=2, ncol=2, byrow=FALSE,dimnames=list(c("R1","R2"),c("C1","C2")))   C1 C2R1  1  3R2  2  4

3)數(shù)組(array):與矩陣類似,維度可以大于2。array函數(shù)創(chuàng)建:

myarray <- array(vector, dimensions, dimnames)

其中:vector包含了數(shù)組中的數(shù)據(jù),dimensions是一個數(shù)值型向量,給出了各個維度下標的最大值,而dimnames是可選的、各維度名稱標簽的列表

示例如下:

myarray <- array(1:24, c(2, 3, 4), dimnames=list(c("A1", "A2"), c("B1", "B2", "B3"), c("C1", "C2", "C3", "C4")))

4)數(shù)據(jù)框(data.frame):不同的列可以包含不同模式(數(shù)值型、字符型等)的數(shù)據(jù),很重要!data.frame()創(chuàng)建:

mydata <- data.frame(col1, col2, col3,…)

其中的列向量col1, col2, col3,… 可為任何類型(如字符型、數(shù)值型或邏輯型)。每一列的名稱可由函數(shù)names指定

示例如下:

patientID <- c(1, 2, 3, 4)
age <- c(25, 34, 28, 52)
diabetes <- c("Type1", "Type2", "Type1", "Type1")
status <- c("Poor", "Improved", "Excellent", "Poor")
patientdata <- data.frame(patientID, age, diabetes, status)


patientID age diabetes    status
1         1  25    Type1      Poor
2         2  34    Type2  Improved
3         3  28    Type1 Excellent
4         4  52    Type1      Poor

是不是和EXCEL內容很像,所以重要??!

5)因子(factor):類別(名義型)變量和有序類別(有序型)變量在R中稱為因子(factor),繪圖時候重要。

6)列表(list)是R的數(shù)據(jù)類型中最為復雜的一種。一般來說,列表就是一些對象(或成分,component)的有序集合。列表允許你整合若干(可能無關的)對象到單個對象名下。函數(shù)list()創(chuàng)建:

mylist <- list(object1, object2, …)

示例如下:

g <- "My First List"h <- c(25, 26, 18, 39)j <- matrix(1:10, nrow=5)k <- c("one", "two", "three")mylist <- list(title=g, ages=h, j, k)

二、數(shù)據(jù)下標

注:第一個元素下標從1開始!

1)向量:a[2];d[1]

2)矩陣:使用下標和方括號來選擇矩陣中的行、 列或元素。X[i,]指矩陣X中的第i 行,X[,j]指第j 列, X[i, j]指第i 行第j 個元素。選擇多行或多列時,下標i 和j 可為數(shù)值型向量。

3)數(shù)組:從數(shù)組中選取元素的方式與矩陣相同

4)數(shù)據(jù)框:可以使用前述(如矩陣中的)下標記號,亦可直接指定列名。

patientdata$age && patientdata[,2] 一樣的結果

另:在每個變量名前都鍵入一次patientdata$麻煩,可以走一些捷徑。聯(lián)合使用函數(shù)attach()和detach()或單獨使用函數(shù)with()來簡化代碼;

示例如下:

attach(mtcars) #函數(shù)attach()可將數(shù)據(jù)框添加到R的搜索路徑中
summary(mpg)    #檢查搜索路徑中的數(shù)據(jù)框,以定位到這個變量
plot(mpg, disp)
detach(mtcars) #函數(shù)detach()將數(shù)據(jù)框從搜索路徑中移除


with(mtcars, {
nokeepstats <- summary(mpg)
keepstats <<- summary(mpg) #使用特殊賦值符<<-替代標準賦值符(<-)即可,它可將對象保存到with()之外的全局環(huán)境中。
})
#查看nokeepstats 和 keepstats 的區(qū)別:
nokeepstats
Error: object 'nokeepstats' not found
keepstats
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
  10.40   15.43   19.20   20.09   22.80   33.90

5)列表:雙重方括號中指明代表某個成分的數(shù)字或名稱來訪問列表中的元素。

mylist[[2]]和mylist[["ages"]]均指那個含有四個元素的向量mylist[[2]][1] 25 26 18 39mylist[["ages"]][1] 25 26 18 39

三、數(shù)據(jù)讀入與寫入:

1)使用read.table()從帶分隔符的文本文件中導入數(shù)據(jù)。

mydataframe <- read.table(file, header=logical_value,sep="delimiter", row.names="name")

注1:help(read.table):更多詳情

注2:stringsAsFactors=FALSE,可禁止將字符型變量將轉換為因子。

2)使用read.csv()導入csv(excel)數(shù)據(jù)。

3)write.table , write.csv 輸出R結果到文件中.

以上就是如何分析大數(shù)據(jù)中數(shù)據(jù)的對象類型及文件的讀入輸出,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。

AI