溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何處理elasticsearch父子文檔

發(fā)布時(shí)間:2021-10-11 21:42:35 來(lái)源:億速云 閱讀:207 作者:iii 欄目:編程語(yǔ)言

這篇文章主要介紹“如何處理elasticsearch父子文檔”,在日常操作中,相信很多人在如何處理elasticsearch父子文檔問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”如何處理elasticsearch父子文檔”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!

一、背景

在我們工作的過(guò)程中,有些時(shí)候我們需要用到父子文檔的關(guān)系映射。**比如:**一個(gè)問(wèn)題有多個(gè)答案、一本書(shū)籍有多個(gè)評(píng)論等等。此處我們可以使用 es 的 jion數(shù)據(jù)類型或 nested來(lái)實(shí)現(xiàn)。此處我們使用join來(lái)建立es中的父子文檔關(guān)系。

二、需求

我們需要?jiǎng)?chuàng)建一個(gè)計(jì)劃(plan),計(jì)劃下存在活動(dòng)(activity)和書(shū)籍(book),書(shū)籍下存在評(píng)論(comments)。

即層級(jí)結(jié)構(gòu)為:

     plan
    /    \
   /      \
activity  book
           |
           |
          comments

三、前置知識(shí)

  1. 每一個(gè)mapping下只能有一個(gè)join類型的字段。

  2. 父文檔和子文檔必須在同一個(gè)分片(shard)上。即: 增刪改查一個(gè)子文檔都必須和父文檔使用相同的 routing key。

  3. 每個(gè)元素只能有一個(gè)父,但是可以存在多個(gè)子。

  4. 可以為一個(gè)已經(jīng)存在的 join 字段增加新的關(guān)聯(lián)關(guān)系。

  5. 可以為一個(gè)已經(jīng)是父的元素增加一個(gè)子元素。

join數(shù)據(jù)類型在elasticsearch中不應(yīng)該像關(guān)系型數(shù)據(jù)庫(kù)那種使用。而且has_childhas_parent都是比較消耗性能的。

只有當(dāng) 子的數(shù)據(jù) 遠(yuǎn)遠(yuǎn)大于 父的數(shù)據(jù)時(shí),使用join才是有意義的。比如:一個(gè)博客下,有多個(gè)評(píng)論。

四、實(shí)現(xiàn)步驟

1、創(chuàng)建 mapping

PUT /plan_index
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 1
  },
  "mappings": {
    "properties": {
      "plan_id":{
        "type": "keyword"
      },
      "plan_name":{
        "type": "text",
        "fields": {
          "keyword":{
            "type" : "keyword",
            "ignore_above" : 256
          }
        }
      },
      "act_id":{
        "type": "keyword"
      },
      "act_name":{
        "type": "text",
        "fields": {
          "keyword":{
            "type" : "keyword",
            "ignore_above" : 256
          }
        }
      },
      "comment_id":{
        "type": "keyword"
      },
      "comment_name":{
        "type": "text",
        "fields": {
          "keyword":{
            "type" : "keyword",
            "ignore_above" : 256
          }
        }
      },
      "creator":{
        "type": "keyword"
      },
      "create_time":{
        "type": "date",
        "format": "yyyy-MM-dd||yyyy-MM-dd HH:mm:ss"
      },
      "plan_join": {
        "type": "join",
        "relations": {
          "plan": ["activity", "book"],
          "book": "comments"
        }
      }
    }
  }
}

注意??

如何處理elasticsearch父子文檔

2、添加父文檔數(shù)據(jù)

此處添加的是 (plan) 數(shù)據(jù)。

PUT /plan_index/_doc/plan-001
{
  "plan_id": "plan-001",
  "plan_name": "四月計(jì)劃",
  "creator": "huan",
  "create_time": "2021-04-07 16:27:30",
  "plan_join": {
    "name": "plan"
  }
}

PUT /plan_index/_doc/plan-002
{
  "plan_id": "plan-002",
  "plan_name": "五月計(jì)劃",
  "creator": "huan",
  "create_time": "2021-05-07 16:27:30",
  "plan_join": "plan"
}

注意??:

1、如果是創(chuàng)建父文檔,則需要使用 plan_join 指定父文檔的關(guān)系的名字(此處為plan)。

2、plan_join為創(chuàng)建索引的 mapping時(shí)指定join的字段的名字。

3、指定父文檔時(shí),plan_join的這2種寫(xiě)法都可以。

3、添加子文檔

PUT /plan_index/_doc/act-001?routing=plan-001
{
  "act_id":"act-001",
  "act_name":"四月第一個(gè)活動(dòng)",
  "creator":"huan.fu",
  "plan_join":{
    "name":"activity",
    "parent":"plan-001"
  }
}

PUT /plan_index/_doc/book-001?routing=plan-001
{
  "book_id":"book-001",
  "book_name":"四月讀取的第一本書(shū)",
  "creator":"huan.fu",
  "plan_join":{
    "name":"book",
    "parent":"plan-001"
  }
}

PUT /plan_index/_doc/book-002?routing=plan-001
{
  "book_id":"book-002",
  "book_name":"編程珠璣",
  "creator":"huan.fu",
  "plan_join":{
    "name":"book",
    "parent":"plan-001"
  }
}

PUT /plan_index/_doc/book-003?routing=plan-002
{
  "book_id":"book-003",
  "book_name":"java編程思想",
  "creator":"huan.fu",
  "plan_join":{
    "name":"book",
    "parent":"plan-002"
  }
}

# 理論上 comment 的父文檔是 book ,但是此處routing使用 plan 也是可以的。
PUT /plan_index/_doc/comment-001?routing=plan-001
{
  "comment_id":"comment-001",
  "comment_name":"這本書(shū)還可以",
  "creator":"huan.fu",
  "plan_join":{
    "name":"comments",
    "parent":"book-001"
  }
}

PUT /plan_index/_doc/comment-002?routing=plan-001
{
  "comment_id":"comment-002",
  "comment_name":"值得一讀,棒。",
  "creator":"huan.fu",
  "plan_join":{
    "name":"comments",
    "parent":"book-001"
  }
}

注意??:

如何處理elasticsearch父子文檔

1、子文檔(子孫文檔等)需要和父文檔使用相同的路由鍵。

2、需要指定父文檔的id。

3、需要指定join的名字。

4、查詢文檔

1、根據(jù)父文檔id查詢它下方的子文檔

**需求:**返回父文檔id是plan-001下的類型為book的所有子文檔。

GET /plan_index/_search
{
  "query":{
    "parent_id": {
      "type":"book",
      "id":"plan-001"
    }
  }
}

2、has_child返回滿足條件的父文檔

**需求:**返回創(chuàng)建者(creator)是huan.fu,并且子文檔最少有2個(gè)的父文檔。

GET /plan_index/_search
{
  "query": {
    "has_child": {
      "type": "book",
      "min_children": 2,  
      "query": {
        "match": {
          "creator": "huan.fu"
        }
      }
    }
  }
}

如何處理elasticsearch父子文檔

3、has_parent返回滿足父文檔的子文檔

**需求:**返回父文檔(book)的創(chuàng)建者是huan.fu的所有子文檔

GET /plan_index/_search
{
  "query": {
    "has_parent": {
      "parent_type": "book",
      "query": {
        "match": {
          "creator":"huan.fu"
        }
      }
    }
  }
}

如何處理elasticsearch父子文檔

五、Nested Object 和 join 對(duì)比

Nested Objectjoin (Parent/Child)
1、文檔存儲(chǔ)在一起,讀取性能高1、父子文檔單獨(dú)存儲(chǔ),互不影響。但是為了維護(hù)join的關(guān)系,需要占用額外的內(nèi)容,讀取性能略差。
2、更新父文檔或子文檔時(shí),需要更新整個(gè)文檔。2、父文檔和子文檔可以單獨(dú)更新。
3、適用于查詢頻繁,子文檔偶爾更新的情況。3、適用于更新頻繁的情況,且子文檔的數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)父文檔的數(shù)量。

到此,關(guān)于“如何處理elasticsearch父子文檔”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI