您好,登錄后才能下訂單哦!
這篇文章給大家介紹怎么在python中使用jieba.analyse提取關(guān)鍵詞,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
代碼如下:
#!/usr/bin/env python # -*- coding: utf-8 -*- # @File : jieba.analyse.py # @Author: 趙路倉 # @Date : 2020/3/14 # @Desc : 提取關(guān)鍵字 # @Contact : 398333404@qq.com import jieba.analyse text='安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發(fā)技術(shù),我們預(yù)先開展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開' Key=jieba.analyse.extract_tags(text,topK=3) print(Key)
keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
第一個參數(shù):待提取關(guān)鍵詞的文本
第二個參數(shù):返回關(guān)鍵詞的數(shù)量,重要性從高到低排序
第三個參數(shù):是否同時返回每個關(guān)鍵詞的權(quán)重
第四個參數(shù):詞性過濾,為空表示不過濾,若提供則僅返回符合詞性要求的關(guān)鍵詞
代碼如下:
#!/usr/bin/env python # -*- coding: utf-8 -*- # @File : jieba.analyse.py # @Author: 趙路倉 # @Date : 2020/3/14 # @Desc : 提取關(guān)鍵字 # @Contact : 398333404@qq.com import jieba.analyse # 字符串前面加u表示使用unicode編碼 content = u'安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發(fā)技術(shù),我們預(yù)先開展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開' keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) # 訪問提取結(jié)果 for item in keywords: # 分別為關(guān)鍵詞和相應(yīng)的權(quán)重 print(item[0], item[1])
關(guān)于怎么在python中使用jieba.analyse提取關(guān)鍵詞就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。