溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么在Python3中使用mmap內(nèi)存映射文件

發(fā)布時間:2021-04-30 15:52:57 來源:億速云 閱讀:313 作者:Leah 欄目:開發(fā)技術(shù)

怎么在Python3中使用mmap內(nèi)存映射文件?針對這個問題,這篇文章詳細(xì)介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

Python主要用來做什么

Python主要應(yīng)用于:1、Web開發(fā);2、數(shù)據(jù)科學(xué)研究;3、網(wǎng)絡(luò)爬蟲;4、嵌入式應(yīng)用開發(fā);5、游戲開發(fā);6、桌面應(yīng)用開發(fā)。

1. mmap內(nèi)存映射文件

建立一個文件的內(nèi)存映射將使用操作系統(tǒng)虛擬內(nèi)存來直接訪問文件系統(tǒng)上的數(shù)據(jù),而不是使用常規(guī)的I/O函數(shù)訪問數(shù)據(jù)。內(nèi)存映射通??梢蕴峁㊣/O性能,因為使用內(nèi)存映射是,不需要對每個訪問都建立一個單獨的系統(tǒng)調(diào)用,也不需要在緩沖區(qū)之間復(fù)制數(shù)據(jù);實際上,內(nèi)核和用戶應(yīng)用都能直接訪問內(nèi)存。

內(nèi)存映射文件可以看作是可修改的字符串或類似文件的對象,這取決于具體的需要。映射文件支持一般的文件API方法,如close()、flush()、read()、readline()、seek()、tell()和write()。它還支持字符串API,提供分片等特性以及類似find()的方法。

下面的所有示例都會使用文本文件lorem.txt,其中包含一些Lorem Ipsum。為便于參考,下面的代碼清單給出這個文件的文本。

Lorem ipsum dolor sit amet, consectetuer adipiscing elit.
Donec egestas, enim et consectetuer ullamcorper, lectus ligula rutrum leo,
a elementum elit tortor eu quam. Duis tincidunt nisi ut ante. Nulla
facilisi. Sed tristique eros eu libero. Pellentesque vel
arcu. Vivamus purus orci, iaculis ac, suscipit sit amet, pulvinar eu,
lacus. Praesent placerat tortor sed nisl. Nunc blandit diam egestas
dui. Pellentesque habitant morbi tristique senectus et netus et
malesuada fames ac turpis egestas. Aliquam viverra fringilla
leo. Nulla feugiat augue eleifend nulla. Vivamus mauris. Vivamus sed
mauris in nibh placerat egestas. Suspendisse potenti. Mauris
massa. Ut eget velit auctor tortor blandit sollicitudin. Suspendisse
imperdiet justo.

1.1 讀文件

使用mmap()函數(shù)可以創(chuàng)建一個內(nèi)存映射文件。第一個參數(shù)是文件描述符,可能來自file對象的fileno()方法,也可能來自os.open()。調(diào)用者在調(diào)用mmap()之前負(fù)責(zé)打開文件,不再需要文件時要負(fù)責(zé)將其關(guān)閉。

mmap()的第二個參數(shù)是要映射的文件部分的大小(以字節(jié)為單位)。如果這個值為0,則映射整個文件。如果這個大小大于文件的當(dāng)前大小,則會擴展該文件。

這兩個平臺都支持一個可選的關(guān)鍵字參數(shù)access。使用ACCESS_READ表示只讀訪問;ACCESS_WRITE表示“寫通過”(write-through),即對內(nèi)存的賦值直接寫入文件;ACCESS_COPY表示“寫時復(fù)制”(copy-on-write),對內(nèi)存的賦值不會寫至文件。

import mmap
with open('lorem.txt', 'r') as f:
  with mmap.mmap(f.fileno(), 0,
          access=mmap.ACCESS_READ) as m:
    print('First 10 bytes via read :', m.read(10))
    print('First 10 bytes via slice:', m[:10])
    print('2nd  10 bytes via read :', m.read(10))

文件指針會跟蹤通過一個分片操作訪問的最后一個字節(jié)。在這個例子中,第一次讀之后,指針向前移動10個字節(jié)。然后由分片操作將指針重置回文件的起點位置,并由分片使指針再次向前移動10個字節(jié)。分片操作之后,再調(diào)用read()會給出文件的11~20字節(jié)。

怎么在Python3中使用mmap內(nèi)存映射文件

1.2 寫文件

要建立內(nèi)存映射文件來接收更新,映射之前首先要使用模式'r+'(而不是'w')打開文件以便完成追加。然后可以使用任何改變數(shù)據(jù)的API方法(例如write()或賦值到一個分片等)。

下面的例子使用了默認(rèn)訪問模式ACCESS_WRITE,并賦值到一個分片,以原地修改某一行的一部分。

import mmap
import shutil
# Copy the example file
shutil.copyfile('lorem.txt', 'lorem_copy.txt')
word = b'consectetuer'
reversed = word[::-1]
print('Looking for  :', word)
print('Replacing with :', reversed)
with open('lorem_copy.txt', 'r+') as f:
  with mmap.mmap(f.fileno(), 0) as m:
    print('Before:\n{}'.format(m.readline().rstrip()))
    m.seek(0) # rewind
    loc = m.find(word)
    m[loc:loc + len(word)] = reversed
    m.flush()
    m.seek(0) # rewind
    print('After :\n{}'.format(m.readline().rstrip()))
    f.seek(0) # rewind
    print('File :\n{}'.format(f.readline().rstrip()))

內(nèi)存的文件中第一行中間的單詞“consectetuer”將被替換。

怎么在Python3中使用mmap內(nèi)存映射文件

使用訪問設(shè)置ACCESS_COPY時不會把修改寫入磁盤上的文件。

import mmap
import shutil
# Copy the example file
shutil.copyfile('lorem.txt', 'lorem_copy.txt')
word = b'consectetuer'
reversed = word[::-1]
with open('lorem_copy.txt', 'r+') as f:
  with mmap.mmap(f.fileno(), 0,
          access=mmap.ACCESS_COPY) as m:
    print('Memory Before:\n{}'.format(
      m.readline().rstrip()))
    print('File Before :\n{}\n'.format(
      f.readline().rstrip()))
    m.seek(0) # rewind
    loc = m.find(word)
    m[loc:loc + len(word)] = reversed
    m.seek(0) # rewind
    print('Memory After :\n{}'.format(
      m.readline().rstrip()))
    f.seek(0)
    print('File After  :\n{}'.format(
      f.readline().rstrip()))

在這個例子中,必須單獨的回轉(zhuǎn)文件句柄和mmap句柄,因為這兩個對象的內(nèi)部狀態(tài)會單獨維護。

怎么在Python3中使用mmap內(nèi)存映射文件

1.3 正則表達(dá)式

由于內(nèi)存映射文件就類似于一個字符串,因此也常與其他處理字符串的模塊一起使用,如正則表達(dá)式。下面的例子會找出所有包含“nulla”的句子。

import mmap
import re
pattern = re.compile(rb'(\.\W+)?([^.]?nulla[^.]*?\.)',
           re.DOTALL | re.IGNORECASE | re.MULTILINE)
with open('lorem.txt', 'r') as f:
  with mmap.mmap(f.fileno(), 0,
          access=mmap.ACCESS_READ) as m:
    for match in pattern.findall(m):
      print(match[1].replace(b'\n', b' '))

由于這個模式包含兩個組,所以findall()的返回值是一個元組序列。print語句會找到匹配的句子,并用空格代替換行符,使各個結(jié)果都打印在同一行上。

怎么在Python3中使用mmap內(nèi)存映射文件

關(guān)于怎么在Python3中使用mmap內(nèi)存映射文件問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI