溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

python如何對(duì)比兩個(gè)目錄的文件是否相同

發(fā)布時(shí)間:2020-08-26 10:30:50 來(lái)源:億速云 閱讀:354 作者:Leah 欄目:編程語(yǔ)言

這篇文章將為大家詳細(xì)講解有關(guān)python如何對(duì)比兩個(gè)目錄的文件是否相同,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。

有時(shí)候我們要對(duì)比兩份配置文件是不是一樣,或者比較兩個(gè)文本是否異樣,可以使用linux命令行工具diff a_file b_file,但是輸出的結(jié)果讀起來(lái)不是很友好。這時(shí)候使用python的標(biāo)準(zhǔn)庫(kù)difflib就能滿(mǎn)足我們的需求。

下面這個(gè)腳本使用了difflib和argparse,argparse用于解析我們給此腳本傳入的兩個(gè)參數(shù)(即兩份待比較的文件),由difflib執(zhí)行比較,比較的結(jié)果放到了一個(gè)html里面,只要找個(gè)瀏覽器打開(kāi)此html文件,就能直觀地看到比較結(jié)果,兩份文件有差異的地方會(huì)高亮顯示出來(lái)。

以python2.7為例,compare_two_files.py程序正文:

#!/bin/env python
# -*- coding: utf-8 -*-
import difflib
import sys
import argparse
# 讀取建表語(yǔ)句或配置文件
def read_file(file_name):
    try:
        file_desc = open(file_name, 'r')
        # 讀取后按行分割
        text = file_desc.read().splitlines()
        file_desc.close()
        return text
    except IOError as error:
        print 'Read input file Error: {0}'.format(error)
        sys.exit()
# 比較兩個(gè)文件并把結(jié)果生成一份html文本
def compare_file(file1, file2):
    if file1 == "" or file2 == "":
        print '文件路徑不能為空:第一個(gè)文件的路徑:{0}, 第二個(gè)文件的路徑:{1} .'.format(file1, file2)
        sys.exit()
    else:
        print "正在比較文件{0} 和 {1}".format(file1, file2)
    text1_lines = read_file(file1)
    text2_lines = read_file(file2)
    diff = difflib.HtmlDiff()    # 創(chuàng)建HtmlDiff 對(duì)象
    result = diff.make_file(text1_lines, text2_lines)  # 通過(guò)make_file 方法輸出 html 格式的對(duì)比結(jié)果
    # 將結(jié)果寫(xiě)入到result_comparation.html文件中
    try:
        with open('result_comparation.html', 'w') as result_file:
            result_file.write(result)
            print "0==}==========> Successfully Finished\n"
    except IOError as error:
        print '寫(xiě)入html文件錯(cuò)誤:{0}'.format(error)
if __name__ == "__main__":
    # To define two arguments should be passed in, and usage: -f1 fname1 -f2 fname2
    my_parser = argparse.ArgumentParser(description="傳入兩個(gè)文件參數(shù)")
    my_parser.add_argument('-f1', action='store', dest='fname1', required=True)
    my_parser.add_argument('-f2', action='store', dest='fname2', required=True)
    # retrieve all input arguments
    given_args = my_parser.parse_args()
    file1 = given_args.fname1
    file2 = given_args.fname2
    compare_file(file1, file2)

【待比較的文件】

兩份文件分別是old_ddl_file和new_ddl_file,內(nèi)容分別是:

old_ddl_file文件內(nèi)容

CREATE EXTERNAL TABLE raw_tags(
p0 string COMMENT ‘uid’,
p3 string COMMENT ‘tag name, e.g. news, games, fairs, shoopingURL’,
p4 string COMMENT ‘e.g. 0, Games’,
p11 int COMMENT ‘gender’,
dt string COMMENT ‘date, like 26/6/2017’,
action string COMMENT ‘clickmodule, click_taghead_link, clicklink’)
CLUSTERED BY (
dt)
INTO 4 BUCKETS
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘,’
STORED AS INPUTFORMAT
‘org.apache.hadoop.mapred.TextInputFormat’
OUTPUTFORMAT
‘org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat’
LOCATION
‘hdfs://hdfs-ha/apps/hive/warehouse/ksai.db/raw_tags’
TBLPROPERTIES (
‘numFiles’=’1’,
‘numRows’=’0’,
‘rawDataSize’=’0’,
‘totalSize’=’70575510’,
‘transient_lastDdlTime’=’1500469448’)

new_ddl_file文件內(nèi)容

CREATE EXTERNAL TABLE raw_tags(
p0 string COMMENT ‘uid’,
p3 string COMMENT ‘tag name, e.g. news, games, fairs, shoopingURL’,
p4 string COMMENT ‘e.g. 0, Games’,
p11 int COMMENT ‘gender’,
dt string COMMENT ‘date, like 26/6/2017’,
action string COMMENT ‘clickmodule, click_taghead_link, clicklink’)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘,’
STORED AS INPUTFORMAT
‘org.apache.hadoop.mapred.TextInputFormat’
OUTPUTFORMAT
‘org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat’
LOCATION
‘hdfs://hdfs-ha/apps/hive/warehouse/ksai.db/raw_tags’
TBLPROPERTIES (
‘COLUMN_STATS_ACCURATE’=’{\”BASIC_STATS\”:\”true\”}’,
‘numFiles’=’0’,
‘numRows’=’0’,
‘rawDataSize’=’0’,
‘totalSize’=’0’,
‘transient_lastDdlTime’=’1521546069’)

肉眼很難看出來(lái)區(qū)別吧?

【執(zhí)行結(jié)果】

那么就使用上面的腳本來(lái)比較,在linux命令行的使用方法 python -f1 file1 -f2 file2 也就是:

python compare_two_files.py -f1 old_ddl_file -f2 new_ddl_file

python如何對(duì)比兩個(gè)目錄的文件是否相同

再把運(yùn)行結(jié)果產(chǎn)生的html文件下載到本地,用任一種瀏覽器打開(kāi)即可,如截圖:

python如何對(duì)比兩個(gè)目錄的文件是否相同

運(yùn)行結(jié)果:

python如何對(duì)比兩個(gè)目錄的文件是否相同

使用瀏覽器查看html文件,可以看到,里面給出了各種顏色標(biāo)注的圖例說(shuō)明,一目了然。

關(guān)于python如何對(duì)比兩個(gè)目錄的文件是否相同就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI