這篇文章將為大家詳細講解有關(guān)R語言怎么將大型Excel文件轉(zhuǎn)為dta格式詳解,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
本文以2000年度我國工業(yè)企業(yè)數(shù)據(jù)庫為例,該文件后綴名為xlsx,包含約16萬條記錄,文件有88M這么大。直接使用Excel打開都費勁:等待時間久,電腦風(fēng)扇呼呼呼作響。如果嘗試用Stata打開該xlsx文件,則會出現(xiàn)提示報錯。
報錯原因在于,Stata無法讀取超過40M的Excel文件。
這就好比瓜迪奧拉的傳控足球固然美麗,但是面對擺大巴的球隊無能為力。
破大巴需要攻城錘,這把錘子的名字就是R語言。萬事開頭難啊,正憧憬著數(shù)據(jù)清洗和花式選取變量建模呢,可不能連數(shù)據(jù)們長啥模樣都沒見著啊。R語言適時挺身而出,幫助Stata叩開大型Excel文件之門。
在RStudio中運行如下代碼,過程較為淺顯,首先引入兩個R包,然后輸入xlsx后綴名文件,最后便可輸出dta后綴名文件。等待2分鐘,誰讓文件那么龐大呢,接下來便是見證奇跡的時刻。
library(openxlsx) library(foreign) x = read.xlsx('2000.xlsx',1) # 讀取 Excel 的 Sheet1 # View(x) write.dta(x, '2000.dta') # 輸出為 Stata 能讀取的格式
在Stata中打開該文件,屏幕會顯示這份文件是在R中轉(zhuǎn)化而來。
關(guān)于“R語言怎么將大型Excel文件轉(zhuǎn)為dta格式詳解”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。