您好,登錄后才能下訂單哦!
前言
最近在工作中碰到一個(gè)很棘手的問(wèn)題,需要讀取出ubuntu系統(tǒng)中某個(gè)目錄下所有文件,由于服務(wù)器中存儲(chǔ)的文件實(shí)在太多,導(dǎo)致此過(guò)程效率十分低下,動(dòng)輒需要等待一個(gè)小時(shí)之久,還只是一個(gè)目錄。于是如何快速獲取文件列表便是這兩天的頭等大事,折騰半天找到一個(gè)較為快速的方法,記錄如下,話不多說(shuō)了,來(lái)一起看看詳細(xì)的介紹吧。
多種實(shí)現(xiàn)方法
嘗試了多種方法,有編程的和非編程的。
1、walk
python的walk庫(kù)能夠遞歸的讀取目錄下所有文件,這個(gè)是最常規(guī)的方法,然而效率有些緩慢。實(shí)現(xiàn)很簡(jiǎn)單,不贅述。
2、os.scandir
python中的os.scandir
方法官方解釋為快速讀取目錄,測(cè)試了一下速度相對(duì)walk而言是由提高,但是還是達(dá)不到要求,也需要自己寫(xiě)遞歸,代碼如下:
def scan_path(file_path, level = 3): files = [] if level >= 0: path = os.scandir(file_path) for p in path: if p.is_dir(): files.extend(scan_path(p.path, level - 1)) else: files.append(p.path) return files
當(dāng)這兩種方法都行不通的時(shí)候我就開(kāi)始考慮才用非編程方法了。理論上來(lái)說(shuō)python的執(zhí)行效率已經(jīng)蠻高了,雖然可能達(dá)不到c或者c++的速度,但是相比java、C#來(lái)說(shuō)已經(jīng)夠快了,所以就沒(méi)有再考慮編程的方式,而是轉(zhuǎn)向linux系統(tǒng)原生的方式。
3、ls
最先想到的就是ls命令,使用如下命令
ls –l –R(或-lR) src > list.txt
此命令能夠列出src目錄下的所有文件,但是效率還是不夠高,而且結(jié)果包含了目錄信息以及文件信息,不太整齊,需要后續(xù)處理。
4、tree
tree命令本身用于列出文件系統(tǒng)的結(jié)構(gòu)樹(shù),在設(shè)置一些參數(shù)的情況下也能夠?qū)崿F(xiàn)列出所有目錄和文件的功能。
tree -afi -L 3 -o 2.txt --noreport src
-a列出所有文件,-f列出完整路徑(結(jié)果為絕對(duì)路徑或者相對(duì)路徑與find用法一致),-i不畫(huà)tree的結(jié)構(gòu)線, -L列出多少層目錄,-o輸出到文件,--noreport不要最后的summary。
5、find
find命令本身是查找文件的命令,但是如果使用得當(dāng),能夠快速列出目錄下文件,命令如下:
find src > 1.txt
此命令速度足夠快,基本能夠滿足需要了。find的結(jié)果相對(duì)當(dāng)前src的路徑,也就是說(shuō)其每條結(jié)果的開(kāi)頭均是src,如果src為絕對(duì)路徑,則結(jié)果為絕對(duì)路徑,如果src為相對(duì)路徑,則結(jié)果以此相對(duì)路徑為開(kāi)頭。
6、locate
又Google了一下,發(fā)現(xiàn)locate與find的功能相似,locate也能夠查找文件,于是猜想locate也能夠?qū)崿F(xiàn)此功能,試之,果然可以,寫(xiě)法都是一樣的。
locate src > 1.txt
不同點(diǎn)在于無(wú)論src為相對(duì)路徑還是絕對(duì)路徑,其結(jié)果均為絕對(duì)路徑。
使用time命令進(jìn)行命令執(zhí)行時(shí)間測(cè)試,發(fā)現(xiàn)find和locate時(shí)間基本相同,有時(shí)locate會(huì)稍微快一些,而tree命令則有些慢。
結(jié)論
以上均可取到文件夾下所有文件,使用walk和scandir最為方便與程序集成,但是速度稍微有些慢,find和locate命令速度較快,tree命令功能強(qiáng)大,但速度相對(duì)find和locate有些慢,此三者若要與python集成,則需要在程序中使用os.popen等管道機(jī)制來(lái)執(zhí)行拼接的bash命令。所以以上命令各有所長(zhǎng),按照自己的需求取舍。
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,如果有疑問(wèn)大家可以留言交流,謝謝大家對(duì)億速云的支持。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。