溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

爬蟲數(shù)據(jù)保存到mongoDB的方法

發(fā)布時間:2020-07-02 15:11:52 來源:億速云 閱讀:149 作者:清晨 欄目:編程語言

小編給大家分享一下爬蟲數(shù)據(jù)保存到mongoDB的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討方法吧!

爬蟲數(shù)據(jù)保存到mongoDB的方法:

import pymongo

# 首先需要注意,mongodb數(shù)據(jù)庫存儲的類型是以鍵值對類型進行存儲,所以在存儲以前一定要進行數(shù)據(jù)篩選

def save_mongo(傳入的數(shù)據(jù)):

  # 創(chuàng)建連接 因為使用的為本機數(shù)據(jù)庫,所以IP寫localhost即可,端口號為27017

  client = pymongo.MongoClient('localhost',27017)

  # 連接數(shù)據(jù)庫(這里注意一點,mongo數(shù)據(jù)庫有一個優(yōu)點,就是當(dāng)自己連接的數(shù)據(jù)庫和表都沒有的時候,會自動創(chuàng)建,所以不用擔(dān)心寫錯或者沒有表)

  db = client['自己創(chuàng)建數(shù)據(jù)庫名']

  # 連接表

  collection = db['自己的表名(mongo中叫做集合)']

  # 插入到數(shù)據(jù)庫中(這里使用dict進行強制轉(zhuǎn)換,是為了保證數(shù)據(jù)為字典格式)

  collection.insert(dict(傳入的數(shù)據(jù)))

mongoDB介紹:

它的特點是高性能、易部署、易使用,存儲數(shù)據(jù)非常方便。主要功能特性有:

*面向集合存儲,易存儲對象類型的數(shù)據(jù)。

*模式自由。

*支持動態(tài)查詢。

*支持完全索引,包含內(nèi)部對象。

*支持查詢。

*支持復(fù)制和故障恢復(fù)。

*使用高效的二進制數(shù)據(jù)存儲,包括大型對象(如視頻等)。

*自動處理碎片,以支持云計算層次的擴展性。

*支持 Golang,RUBY,PYTHON,JAVA,C++,PHP,C#等多種語言。

*文件存儲格式為BSON(一種JSON的擴展)。

*可通過網(wǎng)絡(luò)訪問。

看完了這篇文章,相信你對爬蟲數(shù)據(jù)保存到mongoDB的方法有了一定的了解,想了解更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI