溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么在python中使用jieba.analyse提取關(guān)鍵詞

發(fā)布時間:2020-12-18 14:18:56 來源:億速云 閱讀:267 作者:Leah 欄目:開發(fā)技術(shù)

這篇文章給大家介紹怎么在python中使用jieba.analyse提取關(guān)鍵詞,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

1、簡單應(yīng)用

代碼如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : jieba.analyse.py
# @Author: 趙路倉
# @Date : 2020/3/14
# @Desc : 提取關(guān)鍵字
# @Contact : 398333404@qq.com

import jieba.analyse


text='安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發(fā)技術(shù),我們預(yù)先開展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開'
Key=jieba.analyse.extract_tags(text,topK=3)
print(Key)

怎么在python中使用jieba.analyse提取關(guān)鍵詞

2、含參使用

keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
  • 第一個參數(shù):待提取關(guān)鍵詞的文本

  • 第二個參數(shù):返回關(guān)鍵詞的數(shù)量,重要性從高到低排序

  • 第三個參數(shù):是否同時返回每個關(guān)鍵詞的權(quán)重

  • 第四個參數(shù):詞性過濾,為空表示不過濾,若提供則僅返回符合詞性要求的關(guān)鍵詞

代碼如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : jieba.analyse.py
# @Author: 趙路倉
# @Date : 2020/3/14
# @Desc : 提取關(guān)鍵字
# @Contact : 398333404@qq.com

import jieba.analyse


# 字符串前面加u表示使用unicode編碼
content = u'安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發(fā)技術(shù),我們預(yù)先開展了水深1500米管道式油氣水分離器的概念設(shè)計(jì)。通過該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開'

keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
# 訪問提取結(jié)果
for item in keywords:
  # 分別為關(guān)鍵詞和相應(yīng)的權(quán)重
  print(item[0], item[1])

怎么在python中使用jieba.analyse提取關(guān)鍵詞

關(guān)于怎么在python中使用jieba.analyse提取關(guān)鍵詞就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI