在spaCy中,可以使用similarity
方法來計算兩個文本之間的相似度(文本距離)。以下是一個示例代碼:
import spacy
# 加載預(yù)訓(xùn)練的模型
nlp = spacy.load("en_core_web_sm")
# 創(chuàng)建兩個文本
text1 = "apple"
text2 = "banana"
# 處理文本
doc1 = nlp(text1)
doc2 = nlp(text2)
# 計算文本相似度
similarity = doc1.similarity(doc2)
print(similarity)
在上面的示例中,我們加載了英文的預(yù)訓(xùn)練模型en_core_web_sm
,然后創(chuàng)建了兩個文本text1
和text2
,并將它們分別處理為spaCy文檔對象doc1
和doc2
。最后,我們使用similarity
方法計算了這兩個文本之間的相似度,并打印輸出結(jié)果。
請注意,文本相似度的值范圍在0到1之間,值越接近1表示文本越相似。