溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

jieba庫(kù)

發(fā)布時(shí)間:2020-02-24 12:13:31 來(lái)源:網(wǎng)絡(luò) 閱讀:237 作者:王果果ooo 欄目:編程語(yǔ)言

jieba庫(kù):
利用一個(gè)中文詞庫(kù),確定中文字符之間的關(guān)聯(lián)概率
中文字符間概率大的組成詞組,形成分詞結(jié)果
jieba庫(kù)分詞的三種模式:精確模式、全模式、搜索引擎模式
精確模式:把文本精確的切分開(kāi),不存在冗余單詞
全模式:把文本中所有可能的詞語(yǔ)都掃描出來(lái),有冗余
搜索引擎模式:在精確模式的基礎(chǔ)上,對(duì)長(zhǎng)詞再次切分
常用函數(shù):
jieba.lcut(s):精確模式,返回一個(gè)列表類(lèi)型的分詞結(jié)果
jieba.lcut(s,cut_all=True):全模式,返回一個(gè)列表類(lèi)型的分詞結(jié)果,存在冗余
jieba.lcut_for_search(s):搜索引擎模式,返回一個(gè)列表類(lèi)型的分詞結(jié)果,存在冗余
jieba.add_word(w):向分詞詞典增加新詞w

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI