python為什么讀取大文件越來越慢

發(fā)布時間：2021-05-11 10:21:22 來源：億速云閱讀：424 作者：小新欄目：開發(fā)技術

這篇文章主要介紹python為什么讀取大文件越來越慢，文中介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們一定要看完！

python主要應用領域有哪些

1、云計算，典型應用OpenStack。2、WEB前端開發(fā)，眾多大型網站均為Python開發(fā)。3.人工智能應用，基于大數據分析和深度學習而發(fā)展出來的人工智能本質上已經無法離開python。4、系統(tǒng)運維工程項目，自動化運維的標配就是python+Django/flask。5、金融理財分析，量化交易，金融分析。6、大數據分析。

背景：

今天同事寫代碼，用python讀取一個四五百兆的文件，然后做一串邏輯上很直觀的處理。結果處理了一天還沒有出來結果。問題出在哪里呢？

解決：

1. 同事打印了在不同時間點的時間，在需要的地方插入如下代碼:

print time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))

發(fā)現一個規(guī)律，執(zhí)行速度到后面時間越來越長，也就是處理速度越來越慢。

2. 為什么會越來越慢呢？

1）可能原因1，GC 的問題，有篇文章里面寫，python list append 的時候會越來越慢，解決方案是禁止GC:

使用 gc.disable（）和gc.enable（）

2）改完上面，仍然不行，然后看到一篇文章里面寫，可能是因為 git 導致的，因為append 的時候 git 會不斷同步，會出問題，于是刪除 .git 文件夾，結果還是不行。

3）繼續(xù)查詢，發(fā)下一個及其有可能出問題的地方。dict 的 in dict.key()，判斷 key 是否在 dict 里面，這個的效率是非常低的?？吹揭黄恼卤容^了效率：

① 使用 in dict.keys() 效率:

python為什么讀取大文件越來越慢

② 使用 has_key() 效率:

python為什么讀取大文件越來越慢

發(fā)現 has_key() 效率比較穩(wěn)定。于是修改，問題解決。

后話：

最初的時候，的確是使用 has_key(), 結果后面上傳代碼的時候，公司代碼檢查過不了，提示不能使用這個函數，只能改成 in dict.key() 這種方式，為什么公司不讓這么傳呢？經過一番百度，發(fā)現原因所在：在 python3 中，直接將 has_key() 函數給刪除了，所以禁止使用。那禁止了該怎么辦呢？原來 python 中 in 很智能，能自動判斷 key 是否在字典中存在。所以最正規(guī)的做法不是 has_key(), 更不是 in dict.keys(), 而是 in dict. 判斷 key 在 map 中，千萬別用 in dict.keys() ！??！

附錄:

in、 in dict.keys()、 has_key() 方法實戰(zhàn)對比:

>>> a = {'name':"tom", 'age':10, 'Tel':110}
>>> a
{'age': 10, 'Tel': 110, 'name': 'tom'}
>>> print 'age' in a
True
>>> print 'age' in a.keys()
True
>>>
>>> print a.has_key("age")
True

以上是“python為什么讀取大文件越來越慢”這篇文章的所有內容，感謝各位的閱讀！希望分享的內容對大家有幫助，更多相關知識，歡迎關注億速云行業(yè)資訊頻道！

向AI問一下細節(jié)

python為什么讀取大文件越來越慢

python主要應用領域有哪些

猜你喜歡

最新資訊

相關推薦

相關標簽