您好,登錄后才能下訂單哦!
小編給大家分享一下Python如何實現(xiàn)E-Mail收集插件,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
__import__函數(shù)
我們都知道import是導(dǎo)入模塊的,但是其實import實際上是使用builtin函數(shù)import來工作的。在一些程序中,我們可以動態(tài)去調(diào)用函數(shù),如果我們知道模塊的名稱(字符串)的時候,我們可以很方便的使用動態(tài)調(diào)用
def getfunctionbyname(module_name, function_name): module = __import__(module_name) return getattr(module, function_name)
通過這段代碼,我們就可以簡單調(diào)用一個模塊的函數(shù)了
插件系統(tǒng)開發(fā)流程
一個插件系統(tǒng)運轉(zhuǎn)工作,主要進行以下幾個方面的操作
獲取插件,通過對一個目錄里的.py文件掃描得到
將插件目錄加入到環(huán)境變量sys.path
爬蟲將掃描好的 URL 和網(wǎng)頁源碼傳遞給插件
插件工作,工作完畢后將主動權(quán)還給掃描器
插件系統(tǒng)代碼
在lib/core/plugin.py中創(chuàng)建一個spiderplus類,實現(xiàn)滿足我們要求的代碼
# __author__ = 'mathor' import os import sys class spiderplus(object): def __init__(self, plugin, disallow = []): self.dir_exploit = [] self.disallow = ['__init__'] self.disallow.extend(disallow) self.plugin = os.getcwd() + '/' + plugin sys.path.append(plugin) def list_plusg(self): def filter_func(file): if not file.endswith('.py'): return False for disfile in self.disallow: if disfile in file: return False return True dir_exploit = filter(filter_func, os.listdir(self.plugin) return list(dir_exploit) def work(self, url, html): for _plugin in self.list_plusg(): try: m = __import__(_plugin.split('.')[0]) spider = getattr(m, 'spider') p = spider() s = p.run(url, html) except Exception as e: print (e)
work函數(shù)中需要傳遞 url,html,這個就是我們掃描器傳給插件系統(tǒng)的,通過代碼
spider = getattr(m, 'spider') p = spider() s = p.run(url, html)
我們定義插件必須使用class spider中的run方法調(diào)用
掃描器中調(diào)用插件
我們主要用爬蟲調(diào)用插件,因為插件需要傳遞 url 和網(wǎng)頁源碼這兩個參數(shù),所以我們在爬蟲獲取到這兩個的地方加入插件系統(tǒng)代碼即可
首先打開Spider.py,在Spider.py文件開頭加上
from lib.core import plugin
然后在文件的末尾加上
disallow = ['sqlcheck'] _plugin = plugin.spiderplus('script', disallow) _plugin.work(_str['url'], _str['html'])
disallow是不允許的插件列表,為了方便測試,我們可以把 sqlcheck 填上
SQL 注入融入插件系統(tǒng)
其實非常簡單,只需要修改script/sqlcheck.py為下面即可
關(guān)于Download模塊,其實就是Downloader模塊,把Downloader.py復(fù)制一份命名為Download.py就行
import re, random from lib.core import Download class spider: def run(self, url, html): if (not url.find("?")): # Pseudo-static page return false; Downloader = Download.Downloader() BOOLEAN_TESTS = (" AND %d=%d", " OR NOT (%d=%d)") DBMS_ERRORS = { # regular expressions used for DBMS recognition based on error message response "MySQL": (r"SQL syntax.*MySQL", r"Warning.*mysql_.*", r"valid MySQL result", r"MySqlClient\."), "PostgreSQL": (r"PostgreSQL.*ERROR", r"Warning.*\Wpg_.*", r"valid PostgreSQL result", r"Npgsql\."), "Microsoft SQL Server": (r"Driver.* SQL[\-\_\ ]*Server", r"OLE DB.* SQL Server", r"(\W|\A)SQL Server.*Driver", r"Warning.*mssql_.*", r"(\W|\A)SQL Server.*[0-9a-fA-F]{8}", r"(?s)Exception.*\WSystem\.Data\.SqlClient\.", r"(?s)Exception.*\WRoadhouse\.Cms\."), "Microsoft Access": (r"Microsoft Access Driver", r"JET Database Engine", r"Access Database Engine"), "Oracle": (r"\bORA-[0-9][0-9][0-9][0-9]", r"Oracle error", r"Oracle.*Driver", r"Warning.*\Woci_.*", r"Warning.*\Wora_.*"), "IBM DB2": (r"CLI Driver.*DB2", r"DB2 SQL error", r"\bdb2_\w+\("), "SQLite": (r"SQLite/JDBCDriver", r"SQLite.Exception", r"System.Data.SQLite.SQLiteException", r"Warning.*sqlite_.*", r"Warning.*SQLite3::", r"\[SQLITE_ERROR\]"), "Sybase": (r"(?i)Warning.*sybase.*", r"Sybase message", r"Sybase.*Server message.*"), } _url = url + "%29%28%22%27" _content = Downloader.get(_url) for (dbms, regex) in ((dbms, regex) for dbms in DBMS_ERRORS for regex in DBMS_ERRORS[dbms]): if (re.search(regex,_content)): return True content = {} content['origin'] = Downloader.get(_url) for test_payload in BOOLEAN_TESTS: # Right Page RANDINT = random.randint(1, 255) _url = url + test_payload % (RANDINT, RANDINT) content["true"] = Downloader.get(_url) _url = url + test_payload % (RANDINT, RANDINT + 1) content["false"] = Downloader.get(_url) if content["origin"] == content["true"] != content["false"]: return "sql found: %" % url
E-Mail 搜索插件
最后一個簡單的例子,搜索網(wǎng)頁中的 E-Mail,因為插件系統(tǒng)會傳遞網(wǎng)頁源碼,我們用一個正則表達式([\w-]+@[\w-]+\.[\w-]+)+搜索出所有的郵件。創(chuàng)建script/email_check.py文件
# __author__ = 'mathor'
import re class spider(): def run(self, url, html): #print(html) pattern = re.compile(r'([\w-]+@[\w-]+\.[\w-]+)+') email_list = re.findall(pattern, html) if (email_list): print(email_list) return True return False
運行python w8ay.py
可以看到網(wǎng)頁中的郵箱都被采集到了
以上是“Python如何實現(xiàn)E-Mail收集插件”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。