您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“TCGA臨床信息如何正確的保存格式”,內(nèi)容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“TCGA臨床信息如何正確的保存格式”這篇文章吧。
TCGA臨床信息如何正確的保存格式, 避免錯(cuò)行,錯(cuò)列的情況
TCGA的臨床數(shù)據(jù),經(jīng)過TCGAbiolinks 下載之后,需要保存到文件中,一般大家都希望保存的文件能夠采用excel 打開。
但是臨床數(shù)據(jù)中存在幾個(gè)問題:
1. 一些值缺失,沒有值填充
2, 一些字段中存在空格,逗號(hào)等
如果直接采用R中的 write.table進(jìn)行讀寫,經(jīng)常會(huì)存在數(shù)據(jù)錯(cuò)行,字段錯(cuò)列的情況,主要的原因是該函數(shù)默認(rèn)采用tab格式 :“\t” 進(jìn)行數(shù)據(jù)分割,而excel 無法區(qū)分 空格和tab。
這就需要采用一個(gè)臨床信息中沒有的分隔符,對(duì)數(shù)據(jù)進(jìn)行分割 ,比如,采用星號(hào)(*)去分割。
# 將數(shù)據(jù)保存到文件 clinical_file <- paste0(DataDirectory, "_","clinical",".txt") write.table(clinical, file = clinical_file, row.names = F, col.names=T,quote = T,sep='*',na = "NA")
之后打開excel 時(shí),對(duì)數(shù)據(jù)進(jìn)行分列,同樣選用星號(hào)(*) 即可。
以上是“TCGA臨床信息如何正確的保存格式”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。