溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

R語言-如何讀寫帶分隔符的文件

發(fā)布時間:2021-04-26 14:05:46 來源:億速云 閱讀:423 作者:小新 欄目:開發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)R語言-如何讀寫帶分隔符的文件的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

什么是R語言

R語言是用于統(tǒng)計分析、繪圖的語言和操作環(huán)境,屬于GNU系統(tǒng)的一個自由、免費、源代碼開放的軟件,它是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具。

有眾多的格式和文本文件標準可用于存儲數(shù)據(jù)。用于存儲數(shù)據(jù)的通用格式為分隔符值(即CSV或制表符分割文件)、可擴展標記語言(XML)、JavaScript對象表示法(JSON)

將數(shù)據(jù)存儲在文本文件中的主要優(yōu)點是:他們可被幾乎所有的其他數(shù)據(jù)分析軟件或人讀取

R語言提供豐富的函數(shù)來讀取不同格式的數(shù)據(jù),包括:

文本文件(TXT文件)

逗號分隔文件(CSV文件)

TXT文件——read.table()

矩形(類似電子表格的)數(shù)據(jù)通常存儲在帶有分隔符的文件中,特別是逗號分隔值(CSV)和制表符分隔值文件。read.table將讀取這些分隔符文件,并將結(jié)果存儲在一個數(shù)據(jù)框中。其格式如下:

read.table(file,header = FALSE,sep = “”,quote = “”'",
dec = “.”,numerals = c(“allow.loss”,“warn.loss”,“no.loss”),
row.name,col.name,as.is = !stringsAsFactors,
na.strings = “NA”,colClasses = NA,nrow = -1,
skip = 0,check.names = TRUE,fill = !blank.lines.skip,
strip.white = FALSE,bla nk.lines.skip = TRUE,
comment.char = “#”,
allowEscapes = FALSE,flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = “”,encoding = “unknown”,text,skipNul = FALSE)

read.table 函數(shù)的常用參數(shù)描述

參數(shù)描述
file文件名(包含在“”內(nèi),或使用一個字符型變量),可能需要全路徑(即使是在Windows下,符號 \ 也不允許包含在內(nèi),必須用 / 或者 \ \ 替換)或者一個URL(Uniform Resource Location,統(tǒng)一資源定位符)鏈接(用URL對文件遠程訪問)
header一個邏輯值,用來反映這個文件的第1行是否包含變量名,為TRUE時表示文件的第1行為變量名
sep文件中的字段分隔符,例如,對用制表符分隔的文件使用sep=“\t”
quote指定用于包圍字符型數(shù)據(jù)的字符
dec用來標識小數(shù)點的字符
fill如果為TRUE且所有行中的變量數(shù)目并不相同,則用空白填補
row.names保存著行名的向量,或文件中一個變量的序號或名字,默認時行號取為1、2、3···
col.names指定列名的字符型向量,默認值為V1、V2、V3···
encoding若文件中包含非ASCII字符字段,則使用此參數(shù)進行設(shè)置,可確保以正確的編碼方式讀取,避免出現(xiàn)亂碼

更多高級選項包括:覆蓋默認的行名、列名和類,指定輸入文件的字符編碼,以及輸入的字符串格式的列如何聲明

R語言-如何讀寫帶分隔符的文件 R語言-如何讀寫帶分隔符的文件

CSV文件——read.csv()

read.csv函數(shù)可讀入一個逗號分隔文件并將其保存為一個數(shù)據(jù)框,其格式如下:

read.csv(file,header = TRUE,sep = “,”,quote = “” “,dec=” . ",fill = TRUE,comment.char = " ",ecoding = "unknown ",…)
參數(shù)描述
file文件名(包含在“”內(nèi),或使用一個字符型變量),可能需要全路徑(即使是在Windows下,符號 \ 也不允許包含在內(nèi),必須用 / 或者 \ \ 替換)或者一個URL鏈接(用URL對文件遠程訪問)
header一個邏輯值,用來反映這個文件的第1行是否包含變量名,為TRUE時表示文件的第1行為變量名
sep文件中的字段分隔符,CSV文件默認為sep=","
quote指定用于包圍字符型數(shù)據(jù)的字符
dec用來標識小數(shù)點的字符
fill如果為TRUE且所有行中的變量數(shù)目并不相同,則用空白填補
comment.char包含單個字符或空字符串的長度為1的字符向量,以這個字符開頭的行將被忽略(要禁用這個參數(shù),可使用comment.char=""
encoding若文件中包含非ASCII字符字段,則使用此參數(shù)進行設(shè)置,可確保以正確的編碼方式讀取,避免出現(xiàn)亂碼

R語言-如何讀寫帶分隔符的文件

與此相反的任務(wù)是寫入文件,write.table和write.csv分別對應(yīng)著read.table和read.csv的讀操作

感謝各位的閱讀!關(guān)于“R語言-如何讀寫帶分隔符的文件”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI