您好,登錄后才能下訂單哦!
Python數(shù)據(jù)處理MongoDB的操作方法,相信很多沒有經(jīng)驗(yàn)的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。
1. 前言
MongoDB 是基于分布式存儲,由 C++ 編寫的開源的 NoSql 數(shù)據(jù)庫
MongoDB 的內(nèi)容存儲類似 JSON 對象,數(shù)據(jù)結(jié)構(gòu)包含 3 種
分別是:
數(shù)據(jù)庫 - Databases
對應(yīng)關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)庫(Database)
集合 - Collection
對應(yīng)關(guān)系型數(shù)據(jù)庫中的 Table 表(Table)
文檔 - Document
對應(yīng)數(shù)據(jù)庫表中的一條數(shù)據(jù)(Row Data)
2. 準(zhǔn)備
Python 操作 MongoDB,常見的兩種方式是:Pymongo、Mongoengine
其中
Mongoengine:面相對象,針對文檔型數(shù)據(jù)庫的 ORM,直接繼承于 Document 文檔,對文檔進(jìn)行增刪改查
Pymongo:通過 JSON 和 MongoDB 進(jìn)行通信,將 MongoDB 的數(shù)據(jù)映射成 Python 內(nèi)置的數(shù)據(jù)類型
首先,我們通過 pip3 命令安裝依賴
# 安裝依賴 # pymongo pip3 install pymongo # mongoengine pip3 install mongoengine
下面分別對 Pymongo 和 Mongoengine 進(jìn)行說明
3. PyMongo
首先,創(chuàng)建一個(gè)數(shù)據(jù)庫連接對象
創(chuàng)建數(shù)據(jù)庫連接對象有二種方式,分別是:多參數(shù)、字符串拼接
import pymongo # 創(chuàng)建數(shù)據(jù)庫連接對象的兩種方式 # 方式一:多參數(shù) self.client = pymongo.MongoClient(host='ip地址', port=27017, username="root", password="123456", authMechanism="SCRAM-SHA-1") # 方式二:拼接 # self.client = pymongo.MongoClient('mongodb://root:123456@ip地址:27017/')
接著,通過數(shù)據(jù)庫連接對象指定要操作的數(shù)據(jù)庫和操作集合
比如:要操作數(shù)據(jù)庫 temp 中的 students 集合
# 指定要操作的數(shù)據(jù)庫:temp self.db = self.client.temp # 指定要操作集合students self.collection_students = self.db.students
接著,我們來實(shí)現(xiàn)增刪改查操作
1、新增
新增包含:新增單條數(shù)據(jù)和多條數(shù)據(jù)
單條數(shù)據(jù)插入對應(yīng)的方法是:
insert_one(dict)
該方法的返回值類型為 InsertOneResult
通過 inserted_id 屬性,可以獲取插入數(shù)據(jù)的 _id 值
temp_data = { "id": "1", "name": "xag", "age": 18 } # 1、直接調(diào)用集合的insert_one()方法插入數(shù)據(jù)(插入一條數(shù)據(jù)) result = self.collection_students.insert_one(temp_data) # 返回值為InsertOneResult,通過inserted_id屬性獲取_id的值 print(result.inserted_id)
多條數(shù)據(jù)插入對應(yīng)的方法是:
insert_many([dict1,dict2...])
該方法的返回值類型為 InsertManyResult
通過 inserted_ids 屬性,可以獲取插入數(shù)據(jù)的 _id 屬性值列表
# 2、插入多條數(shù)據(jù)-insert_many() result = self.collection_students.insert_many([temp_data, temp_data2]) # 返回值為InsertManyResult,通過inserted_ids屬性獲取插入數(shù)據(jù)的_id列表值 print(result.inserted_ids)
2、查詢
使用 PyMongo 查詢 MongoDB 數(shù)據(jù)庫,常用方法如下:
通過某一個(gè)屬性鍵值對,去查詢一條記錄 - find_one()
通過 ObjectId 值去查詢某一條記錄 - find_one()
通過某一個(gè)屬性鍵值對,去查詢多條記錄 - find()
通過大于、小于、等于等條件去比較查詢
正則匹配查詢
前面 3 種查詢方式,由于比較簡單,直接給出實(shí)例:
def manage_query(self): """查詢數(shù)據(jù)""" # 1、通過某個(gè)屬性鍵值對,去查詢一條記錄 find_one() # 返回值為字典類型 # {'_id': ObjectId('5f5c437cfe49fa9a16664179'), 'id': '1', 'name': 'xag', 'age': 18} result = self.collection_students.find_one({"name": "xag"}) print(result) # 2、通過ObjectId值去查詢某一條記錄 result = self.collection_students.find_one({"_id": ObjectId('5f5c437cfe49fa9a16664179')}) print(result) # 3.1 查詢多條記錄 find() # 返回值為一個(gè)游標(biāo)(生成器),pymongo.cursor.Cursor result_lists = self.collection_students.find({"name":"xag"}) print(result_lists) for item in result_lists: print(item)
條件比較查詢,包含:大于($gt)、大于等于($gte)、小于($lt)、小于等于($lte)、不等于($ne)、在范圍內(nèi)($in)、不在范圍內(nèi)($nin)
比如:查詢年齡大于 18 歲的數(shù)據(jù)
# 3.2 條件比較查詢,包含大于($gt)、大于等于($gte)、小于($lt)、小于等于($lte)、不等于($ne)、在范圍內(nèi)($in)、不在范圍內(nèi)($nin) # 查詢年齡大于18歲的記錄 result = self.collection_students.find({'age': {'$gt': 18}}) for item in result: print(item)
正則匹配查詢,包含:
$regex:匹配正則表達(dá)式
$exists:屬性是否存在
$type:數(shù)據(jù)類型判斷
$mod:數(shù)據(jù)模操作
$text:文本包含查詢
$where:高級條件查詢
比如,查詢 name 值以 "xag" 開頭的數(shù)據(jù)
# 正則匹配查詢 results = self.collection_students.find({'name': {'$regex': '^xag.*'}}) for item in results: print(item)
關(guān)于查詢更加復(fù)雜的功能可以參考:
https://docs.mongodb.com/manual/reference/operator/query/
3、更新
更新操作包含:更新一條記錄和更新多條記錄
其中,更新一條記錄對應(yīng)的方法是:
update_one(query,update_content)
參數(shù)包含:查詢的條件、要修改的內(nèi)容
# 1、修改一條記錄 update_one(query,update_data) # 方法中有兩個(gè)參數(shù),分別是:查詢條件、要修改的內(nèi)容 # 查詢條件 query_condition = {"name": "xag"} # 要修改的內(nèi)容 update_content = {"$set": {"name": "星安果"}} # 使用update_one() 方法進(jìn)行更新一條記錄 result = self.collection_students.update_one(query_condition, update_content)
通過返回的結(jié)果可以獲取查詢匹配的記錄個(gè)數(shù)及影響的記錄個(gè)數(shù)
# matched_count:匹配的記錄個(gè)數(shù) # modified_count:影響的記錄個(gè)數(shù) print(result.matched_count, result.modified_count)
更新多條記錄對應(yīng)的方法是:
update_many(query,update_content)
方法中的參數(shù)、返回值與修改單條記錄類似
# 2、修改多條記錄 update_many(query,update_data) # 查詢條件 query_condition = {"name": {"$regex": "^星.*"}} # 要修改的內(nèi)容 update_content = {"$set": {"name": "xag"}} # 將文檔中name以星開頭的記錄都設(shè)置為xag result = self.collection_students.update_many(query_condition, update_content) print(result) print(result.matched_count, result.modified_count)
4、刪除
刪除同樣包含:刪除查詢到的第一條記錄、刪除查詢到的所有記錄
分別對應(yīng)的方法是:delete_one(query)、delete_many(query)
另外,在返回結(jié)果中可以獲取到真實(shí)被刪除的數(shù)目
def manage_remove(self): """ 刪除操作 :return: """ # 1、刪除查詢到的第一條記錄 delete_one() # result = self.collection_students.delete_one({'name': "xag2"}) # print(result) # 刪除的數(shù)目 # print(result.deleted_count) # 2、刪除多條記錄 delete_many() result = self.collection_students.delete_many({'name': "xag"}) print(result) # 刪除的數(shù)目 print(result.deleted_count)
5、計(jì)數(shù)和排名
常用的方法包含:
limit(num):限制返回的結(jié)果數(shù)量
skip(num):忽略 num 個(gè)元素,從 num + 1 個(gè)元素開始查看
count_documents():查看集合中所有的文檔數(shù)量,也可以根據(jù)條件去查詢滿足的文檔數(shù)量
sort():升序或者降序
def manage_count_and_sort(self): """ 計(jì)數(shù)和排序 :return: """ # 1、限制返回的結(jié)果數(shù)量 - limit() # result = self.collection_students.find().limit(2) # for item in result: # print(item) # 2、偏移 skip() # 比如:忽略前面兩個(gè)元素,從第3個(gè)元素開始查看 # result = self.collection_students.find().skip(2) # print([result['name'] for result in result]) # 3.1 查詢出集合中所有的文檔數(shù)量 count_documents() # result = self.collection_students.count_documents({}) # print(result) # 3.2 根據(jù)條件去查詢,然后判斷結(jié)果數(shù)目 # query_regex = {'name': {'$regex': '^xag.*'}} # result = self.collection_students.count_documents(query_regex) # print(result) # 4、排序 sort() # pymongo.ASCENDING:升序,DESCENDING:降序 result = self.collection_students.find().sort('name', pymongo.DESCENDING) print([result['name'] for result in result])
4. Mongoengine
在使用 Mongoengine 操作 MongoDB 之前,需要先定義一個(gè) Document 的子類
該子類對應(yīng) MongoDB 中的文檔,內(nèi)部加入的靜態(tài)變量(包含:類型、長度等)對應(yīng)數(shù)據(jù)庫文檔中的數(shù)據(jù)
from mongoengine import * # Document的子類,對應(yīng)文檔對象 class Student(Document): name = StringField(required=True, max_length=500) age = IntField(required=True, default=18) create_time = DateTimeField(default=datetime.now) # 配置元數(shù)據(jù) # 指定集合為student meta = {'collection': 'student', 'strict': False}
利用 Mongoengine 內(nèi)置的 connect() 方法,連接指定的數(shù)據(jù)庫
# 連接數(shù)據(jù)庫temp def __init__(self): # 連接數(shù)據(jù)庫 # 數(shù)據(jù)庫名稱:temp # auth方式:SCRAM-SHA-1 result = connect('temp', host='ip地址', port=27017, username='root', password='123456', authentication_source='admin', authentication_mechanism="SCRAM-SHA-1") print(result)
接著,我們來實(shí)現(xiàn)增刪改查操作
1、新增
使用 Mongoengine 新增一條記錄到數(shù)據(jù)庫非常方便
只需要實(shí)例化一個(gè)文檔對象,調(diào)用 save() 方法,即可以存儲一條記錄到數(shù)據(jù)庫當(dāng)中
def insert(self): """ 插入數(shù)據(jù) :return: """ person = Student(name='xag2', age=20) person.save()
2、查詢
常見的查詢操作包含:
查詢集合中的所有記錄
查詢第一條記錄
通過主鍵 _ID,來查詢數(shù)據(jù)
條件查詢
對應(yīng)的代碼如下:
def query(self): """ 普通查詢 :return: """ # 1、查看集合中所有數(shù)據(jù) # students = Student.objects.all() # print([item['name'] for item in students]) # 2、查詢第一條記錄 # student = Student.objects.first() # print(student.name, student.age, student.create_time) # 3、通過主鍵_ID來查詢數(shù)據(jù) result = Student.objects.filter(pk="5f5c5b34f5b0c049707a1710").first() print(result.name, result.age, result.create_time) # 4、條件查詢 # 查詢年齡在18-20歲的數(shù)據(jù) # __gte:大于等于;__lte:小于等于 # 默認(rèn)是升序,可以加一個(gè):-,代表逆序 # students = Student.objects(age__gte=18, age__lte=20).order_by('name') students = Student.objects(age__gte=18, age__lte=20).order_by('-name') # for item in students: # print(item.name, item.age, item.create_time)
值得一提的是,Mongoengine 提供了關(guān)鍵字 Q 來實(shí)現(xiàn)高級查詢
比如:查詢 name 字段值為 xag,年齡為 18 歲的數(shù)據(jù)
def query_advance(self): """ 高級查詢 :return: """ # 查看name為xag,age為18的記錄的第一條 student = Student.objects(Q(name="xag") & Q(age=18)).first() print(student.name, student.age, student.create_time)
進(jìn)階操作可以參考:
https://docs.mongoengine.org/guide/querying.html
3、更新
Mongoengine 提供了 filter() 和 update() 兩個(gè)方法,分別用于過濾待更新的數(shù)據(jù),指定的更新內(nèi)容
def update(self): """ 更新記錄 :return: """ # 1、修改所有記錄 # 修改name為xag的年齡都減少1歲 # 增加一歲:inc__age=1 # 減少一歲:dec__age=1 # Student.objects.filter(name="xag").update(dec__age=1) # Student.objects.filter(name="xag").update(inc__age=1) # name為xag,age小于18的的所有記錄,更新為age=23 # __lt:小于 # __lte:小于等于 # __gt:大于 # __gte:大于等于 # Student.objects.filter(name="xag", age__lt=18).update(age=23) # Student.objects.filter(age__lte=20).update(age=23)
如果只需要更改查詢到的第一條記錄,可以使用 update_one() 方法
# 2、修改一條記錄 # 年齡減少5歲 Student.objects.filter(name='xag').update_one(dec__age=5)
4、刪除
刪除操作對應(yīng) delete() 方法
同樣,可以利用 filter() 和 first() 方法限制要?jiǎng)h除的范圍
def delete(self): """ 刪除數(shù)據(jù) :return: """ # 1、刪除查詢到的第一條記錄 # Student.objects.filter(name="xag").first().delete() # 2、刪除多條記錄 # Student.objects.filter(name="xag").delete() # 刪除name值以xag開頭的所有記錄 Student.objects.filter(name__startswith="xag").delete()
看完上述內(nèi)容,你們掌握Python數(shù)據(jù)處理MongoDB的操作方法的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。