溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

django使用haystack調(diào)用Elasticsearch實(shí)現(xiàn)索引搜索

發(fā)布時(shí)間:2020-08-25 03:08:55 來(lái)源:腳本之家 閱讀:470 作者:苦瓜爆炒牛肉 欄目:開(kāi)發(fā)技術(shù)

前言:

在做一個(gè)商城項(xiàng)目的時(shí)候,需要實(shí)現(xiàn)商品搜索功能。

說(shuō)到搜索,第一時(shí)間想到的是數(shù)據(jù)庫(kù)的 select * from tb_sku where name like %蘋(píng)果手機(jī)%

或者django的 SKU.objects.filter(name__contains="蘋(píng)果手機(jī)")

但是,假如你的數(shù)據(jù)庫(kù)有幾千萬(wàn)條數(shù)據(jù),name字段沒(méi)有索引,可能查詢需要十幾分鐘,用戶可能會(huì)等你?那為什么不給name字段增加索引?商品表不僅僅是用來(lái)查詢,也會(huì)經(jīng)常修改數(shù)據(jù),新增刪除數(shù)據(jù)等。建立索引后,做增刪改操作時(shí)也會(huì)大大占用數(shù)據(jù)庫(kù)資源。所以應(yīng)該怎么解決呢?

Elasticsearch!

一個(gè)強(qiáng)大的基于Lucene的全文搜索服務(wù)器!維基百科、Stack Overflow、Github都在用。

如果想詳細(xì)了解其原理的話,可以參考:Elasticsearch 基礎(chǔ)介紹及索引原理分析

這里只是簡(jiǎn)單說(shuō)一下他的原理。

Elasticsearch原理:

django使用haystack調(diào)用Elasticsearch實(shí)現(xiàn)索引搜索

部署好ElasticSearch服務(wù)器后,剛開(kāi)始需要?jiǎng)?chuàng)建索引,ES索引庫(kù)會(huì)對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行一遍預(yù)處理,單獨(dú)建立起一份索引結(jié)構(gòu)數(shù)據(jù)。

理解:

假如你的商品表里有這幾個(gè)字段。id,名字,副標(biāo)題,價(jià)格,商品圖片鏈接地址,評(píng)論數(shù),是否上架。

一般用戶會(huì)根據(jù)名字或者副標(biāo)題來(lái)搜索。此時(shí)名字、副標(biāo)題這個(gè)字段就需要建立索引(當(dāng)然,id也要,人家在mysql那里是主鍵總要給點(diǎn)面子吧)。但是后端返回給前端的數(shù)據(jù),不僅僅是需要名字、副標(biāo)題啊。你還要價(jià)格什么的呢!所以我們還要指定需要的字段,不然直接找個(gè)名字或者副標(biāo)題出來(lái)有什么用?

所以剛開(kāi)始創(chuàng)建索引庫(kù)時(shí),ElasticSearch服務(wù)端會(huì)根據(jù)我們指定要作為索引的字段(名字、副標(biāo)題、id)、要返回的字段(價(jià)格...),同步一份到ES索引庫(kù)里面。為什么要同步到elasticsearch?因?yàn)椴檎铱煅?。至于為什么ElasticSearch查找這么快,可以參考一下上面鏈接的原理。

注意上面的圖,ElasticSearch是C/S架構(gòu)的軟件。下面說(shuō)一下,服務(wù)端怎么搭建?

ElasticSearch服務(wù)端的搭建:

在搭建前說(shuō)下,ElasticSearch建立索引時(shí)會(huì)分詞。什么是分詞呢?例如“我今天吃了一個(gè)漢堡包”。分詞后是“我”、“今天”、“吃了”、“一個(gè)”、“漢堡包”。你以為ElasticSearch會(huì)這么智能?沒(méi)錯(cuò),它對(duì)英文是這么智能,但是對(duì)我們的中文,只會(huì)分成“我”、“今”、“天”、“吃”、“了”、“一”、“個(gè)”、“漢”、“堡”、“包”。這樣用戶還怎么搜索啊。。。所以我們需要一個(gè)在ElasticSearch服務(wù)端集成一個(gè)插件,ElasticSearch-ik插件。有了這個(gè)插件,真的可以這么智能了。

所以,帶有-ik插件的ElasticSearch服務(wù)端怎么裝呢?

太麻煩了,所以我選擇docker(滑稽.jpg)

(1)加載docker鏡像

sudo docker load -i elasticsearch-ik-2.4.6_docker.tar

(2)修改配置文件

elasticsearc-2.4.6/config/elasticsearch.yml第54行,更改ip地址為本機(jī)ip地址:

network.host: xxx.xxx.xxx.xxx

如果docker不是運(yùn)行在開(kāi)發(fā)環(huán)境的本機(jī),可以設(shè)為0.0.0.0。表示允許所有ip訪問(wèn)此服務(wù)器。

(3)運(yùn)行容器

docker run -d -p 9200:9200 --network=host --name=elasticsearch -v /var/elasticsearch-2.4.6/config:/usr/share/elasticsearch/config delron/elasticsearch-ik:2.4.6-1.0

(4)測(cè)試ElasticSearch是否安裝成功

curl 'http://xxx.xxx.xxx.xxx:9200/' # IP地址是ElasticSearch的IP

如果測(cè)試成功,那么ElasticSearch服務(wù)器就已經(jīng)全部搭建完畢啦,而且這個(gè)鏡像集中了-ik插件,支持中文分詞。搭建完服務(wù)端后,就要用客戶端了。

使用Haystack對(duì)接Elasticsearch客戶端:

如果直接在Django項(xiàng)目直接編寫(xiě)代碼作為ElasticSearch的客戶端,比較復(fù)雜,所以借助第三方包Haystack來(lái)對(duì)接ELasticSearch的客戶端。而且使用了Haystack后,以后你換其他的全文搜索服務(wù)器時(shí)(雖然不太可能換),也不用修改Django項(xiàng)目已經(jīng)寫(xiě)好的代碼。

(1)安裝Haystack和ElasticSearch客戶端。

pip install drf-haystack # 因?yàn)樵擁?xiàng)目是用DRF寫(xiě)的前后端分離,所以安裝的是drf-haystack。如果不用DRF的話,安裝的是django-haystack
pip install elasticsearch==2.4.1

(2)配置

1.注冊(cè)應(yīng)用

  INSTALLED_APPS = [
    ...
    'haystack',
    ...
  ]

2.在項(xiàng)目的配置文件中配置haystack

  # 配置haystack全文檢索框架
  HAYSTACK_CONNECTIONS = {
    'default': {
      'ENGINE': 'haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine',
      # 此處為elasticsearch運(yùn)行的服務(wù)器ip地址,端口號(hào)默認(rèn)為9200
      'URL': 'http://xxx.xxx.xxx.xxx:9200/', 
      # 指定elasticsearch建立的索引庫(kù)的名稱(chēng)
      'INDEX_NAME': 'meiduo', 
    },
  }
  # 當(dāng)添加、修改、刪除數(shù)據(jù)時(shí),自動(dòng)更新索引
  HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

(3)創(chuàng)建索引類(lèi)

創(chuàng)建索引類(lèi)的目的是指定要保存的字段,ElasticSearch服務(wù)器會(huì)把mysql的這些字段的數(shù)據(jù)進(jìn)行同步。方便查詢出來(lái)時(shí)進(jìn)行返回。

# goods(應(yīng)用名)/search_indexes.py  # search_indexes名字不能改,固定
from haystack import indexes
from .models import SKU

class SKUIndex(indexes.SearchIndex, indexes.Indexable):
  """
  SKU索引類(lèi)
  """  # text表示被查詢的字段,用戶搜索的是這些字段的值,具體被索引的字段寫(xiě)在另一個(gè)文件里。
  text = indexes.CharField(document=True, use_template=True)

  # 保存在索引庫(kù)中的字段
  id = indexes.IntegerField(model_attr='id')
  name = indexes.CharField(model_attr='name')
  price = indexes.DecimalField(model_attr='price')
  default_image_url = indexes.CharField(model_attr='default_image_url')
  comments = indexes.IntegerField(model_attr='comments')

  def get_model(self):
    """返回建立索引的模型類(lèi)"""
    return SKU

  def index_queryset(self, using=None):
    """返回要建立索引的數(shù)據(jù)查詢集"""
    return self.get_model().objects.filter(is_launched=True)

(4)指定被索引的字段

# templates/search/indexes/goods(應(yīng)用名)/sku_text.txt  # 路徑和名字是固定的
{{ object.name }}
{{ object.caption }}
{{ object.id }}

(5)生成索引庫(kù)

python manage.py rebuild_index

此時(shí),索引庫(kù)成功生成了。接下來(lái)就是后端接受用戶存過(guò)來(lái)的查詢參數(shù),并返回相應(yīng)的字段了。

完善后端:

django使用haystack調(diào)用Elasticsearch實(shí)現(xiàn)索引搜索

剛剛寫(xiě)的SKUIndex可以當(dāng)做是我們平時(shí)寫(xiě)DRF時(shí)的model類(lèi),接下來(lái)還要寫(xiě)序列化器,視圖,注冊(cè)路由。

(1)Haystack序列化器類(lèi)

from drf_haystack.serializers import HaystackSerializer

class SKUIndexSerializer(HaystackSerializer):
  """
  SKU索引結(jié)果數(shù)據(jù)序列化器
  """
  class Meta:
    index_classes = [SKUIndex]
    fields = ('text', 'id', 'name', 'price', 'default_image_url', 'comments')

(2)Haystack視圖

from drf_haystack.viewsets import HaystackViewSet

class SKUSearchViewSet(HaystackViewSet):  # HaystackViewSet繼承了RetrieveModelMixin, ListModelMixin, ViewSetMixin, HaystackGenericAPIView,所以可以查一條或多條數(shù)據(jù)
  """
  SKU搜索
  HaystackViewSet: 查一條,查多條
  """
  index_models = [SKU]
  serializer_class = SKUIndexSerializer

(3)注冊(cè)路由

router = DefaultRouter()
router.register('skus/search', views.SKUSearchViewSet, base_name='skus_search')
...
urlpatterns += router.urls

(4)訪問(wèn):127.0.0.1:8080/skus/search/?text=Apple

就可以查詢出帶有Apple的數(shù)據(jù)了~

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI