溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么使用python中similarity函數(shù)

發(fā)布時(shí)間:2021-10-20 10:57:17 來源:億速云 閱讀:275 作者:iii 欄目:開發(fā)技術(shù)

本篇內(nèi)容主要講解“怎么使用python中similarity函數(shù)”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“怎么使用python中similarity函數(shù)”吧!

1、similarity函數(shù)接收兩個(gè)列表,并返回由兩個(gè)列表中相同元素組成的列表。

2、函數(shù)使用列表推導(dǎo),遍歷所有a列表中的元素,并使用in關(guān)鍵詞來判斷這些元素是否存在于b列表中。

實(shí)例

def similarity(a, b):
  return [item for item in a if item in b]
 
# EXAMPLES
similarity([1, 2, 3], [1, 2, 4]) # [1, 2]

知識(shí)點(diǎn)擴(kuò)充:

python 語義similarity_Python:string的語義相似度得分

Python:string的語義相似度得分

有沒有用于計(jì)算一對(duì)句子的語義相似度分?jǐn)?shù)的庫?

我知道WordNet的語義數(shù)據(jù)庫,以及如何為2個(gè)單詞生成分?jǐn)?shù),但是我正在尋找能夠在整個(gè)句子和輸出中執(zhí)行所有預(yù)處理任務(wù)(如端口詞干,停用詞刪除等)的庫兩個(gè)句子如何相關(guān)的分?jǐn)?shù)。

我發(fā)現(xiàn)了一個(gè)使用.NET框架編寫的工作 ,它使用一系列預(yù)處理步驟來計(jì)算分?jǐn)?shù)。 有沒有任何項(xiàng)目,在Python中做到這一點(diǎn)?

我不是在尋找能夠幫助我find分?jǐn)?shù)的操作順序(就像這里要求的那樣)

我喜歡自己實(shí)現(xiàn)每個(gè)階段,或者從不同的庫中粘貼函數(shù),以便它可以用于句對(duì),但是我主要需要這個(gè)工具來testing數(shù)據(jù)的推論。

編輯:我正在考慮使用NLTK和計(jì)算每?jī)蓚€(gè)單詞對(duì)這兩個(gè)句子迭代的得分,然后從結(jié)果的標(biāo)準(zhǔn)偏差中得出推論,但我不知道這是否是一個(gè)合理的相似性估計(jì)。 另外,這將花費(fèi)很長(zhǎng)的時(shí)間。

再次,我正在尋找已經(jīng)實(shí)現(xiàn)這個(gè)智能的項(xiàng)目/庫。 東西,讓我這樣做:

import amazing_semsim_package str1='Birthday party ruined as cake explodes' str2='Grandma mistakenly bakes cake using gunpowder' >>similarity(str1,str2) >>0.889

我見過的最好的包裝是在Gensim主頁find的Gensim 。 我已經(jīng)使用過很多次了,總體而言非常滿意,它的易用性, 它是用Python編寫的,并且有一個(gè)簡(jiǎn)單的跟隨教程來開始,它比較了9個(gè)string。 它可以通過點(diǎn)安裝,所以你不會(huì)有很多麻煩得到它安裝,我希望。

你使用哪種評(píng)分algorithm在很大程度上取決于你的問題的背景,但是如果你想要一些基本的東西的話,我build議開始使用LSI的function。 (這是教程引導(dǎo)你通過。)

如果您閱讀gensim教程,它將引導(dǎo)您通過比較兩個(gè)string,使用Similaritiesfunction。 這樣可以讓你看到你的叮咬是如何根據(jù)它們所包含的文字相互比較的,或者是一些其他的刺痛。

到此,相信大家對(duì)“怎么使用python中similarity函數(shù)”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI