您好,登錄后才能下訂單哦!
這篇文章主要介紹“怎么利用Python實(shí)現(xiàn)一個論文降重工具”,在日常操作中,相信很多人在怎么利用Python實(shí)現(xiàn)一個論文降重工具問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”怎么利用Python實(shí)現(xiàn)一個論文降重工具”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!
時值畢業(yè)季,有不少小伙伴深受論文查重的困擾。因此我便想到做一個簡單的自動去重的工具,先看看效果,我們再對原理或是代碼實(shí)現(xiàn)做進(jìn)一步的分析。
首先需要輸入appid以及key,這些可以在百度翻譯開放平臺申請一個賬號,可以免費(fèi)申請一個賬號。接著將需要進(jìn)行降重的文本內(nèi)容復(fù)制到相應(yīng)的輸入框內(nèi),點(diǎn)擊開始按鈕,即可輸出不同但意思相近的語句,即達(dá)到降重去重的作用。點(diǎn)擊復(fù)制按鈕便可以將得到的新文本復(fù)制到剪貼板上,點(diǎn)擊清楚按鈕可以重新輸入需要降重的文本,并且循環(huán)往復(fù)地進(jìn)行。
論文查重的粒度是句子,兩個句子的相似度主要取決于句子包含哪些詞,以及詞在句子中的位置。句子相似度只是文字上的對比,不考慮語義上的相近。
正因如此,我們可以采取的措施便是變換句子結(jié)構(gòu),使用近似詞替換。
為了完成這些句子的自動替換,從而達(dá)到降重的目的,這里很容易便想到利用不同語種之間的互相轉(zhuǎn)換來生成新文本。比如在本工具中,我采用了中文→英文→韓文→中文的策略,你也可以采取更長的轉(zhuǎn)換路徑,但那樣似乎會在很大程度上降低文本的可讀性。
語句的翻譯我采用了百度翻譯開放平臺的接口,簡單地申請之后就可以獲取每個月200萬的免費(fèi)字符翻譯權(quán)限。
此API的接入方式略微有些麻煩,需要生成簽名sign并且拼接完整的url。
def translate(q,lan_from,lan_to): url = 'http://api.fanyi.baidu.com/api/trans/vip/translate' salt = random.randint(1, 65536) sign = hashlib.md5((str(appid)+str(q)+str(salt)+str(key)).encode('utf-8')).hexdigest() params = { 'from' :lan_from, 'to' :lan_to, 'salt' : salt, 'sign' : sign, 'appid' : appid, 'q': q } r = requests.get(url,params=params) txt = r.json() if txt.get('trans_result', -1) == -1: print('ERROR Code:{}'.format(txt)) return q return txt['trans_result'][0]['dst']
在弄清楚原理以及API的調(diào)用方法之后,我們可以輕松地寫出一個GUI界面,也就是這個降重工具。當(dāng)然這個工具非常初級,大家可以進(jìn)行更加全面的擴(kuò)展。
到此,關(guān)于“怎么利用Python實(shí)現(xiàn)一個論文降重工具”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注億速云網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。