溫馨提示×

spaCy中怎么進(jìn)行文本距離計算

小億
91
2024-05-11 19:14:52
欄目: 編程語言

在spaCy中,可以使用similarity方法來計算兩個文本之間的相似度(文本距離)。以下是一個示例代碼:

import spacy

# 加載預(yù)訓(xùn)練的模型
nlp = spacy.load("en_core_web_sm")

# 創(chuàng)建兩個文本
text1 = "apple"
text2 = "banana"

# 處理文本
doc1 = nlp(text1)
doc2 = nlp(text2)

# 計算文本相似度
similarity = doc1.similarity(doc2)
print(similarity)

在上面的示例中,我們加載了英文的預(yù)訓(xùn)練模型en_core_web_sm,然后創(chuàng)建了兩個文本text1text2,并將它們分別處理為spaCy文檔對象doc1doc2。最后,我們使用similarity方法計算了這兩個文本之間的相似度,并打印輸出結(jié)果。

請注意,文本相似度的值范圍在0到1之間,值越接近1表示文本越相似。

0