您好,登錄后才能下訂單哦!
這篇文章主要介紹“如何處理elasticsearch父子文檔”,在日常操作中,相信很多人在如何處理elasticsearch父子文檔問(wèn)題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”如何處理elasticsearch父子文檔”的疑惑有所幫助!接下來(lái),請(qǐng)跟著小編一起來(lái)學(xué)習(xí)吧!
在我們工作的過(guò)程中,有些時(shí)候我們需要用到父子文檔的關(guān)系映射。**比如:**一個(gè)問(wèn)題有多個(gè)答案、一本書(shū)籍有多個(gè)評(píng)論等等。此處我們可以使用 es 的 jion
數(shù)據(jù)類型或 nested
來(lái)實(shí)現(xiàn)。此處我們使用join
來(lái)建立es中的父子文檔關(guān)系。
我們需要?jiǎng)?chuàng)建一個(gè)計(jì)劃(plan
),計(jì)劃下存在活動(dòng)(activity
)和書(shū)籍(book
),書(shū)籍下存在評(píng)論(comments
)。
即層級(jí)結(jié)構(gòu)為:
plan / \ / \ activity book | | comments
每一個(gè)mapping
下只能有一個(gè)join
類型的字段。
父文檔和子文檔必須在同一個(gè)分片(shard
)上。即: 增刪改查一個(gè)子文檔都必須和父文檔使用相同的 routing key。
每個(gè)元素只能有一個(gè)父,但是可以存在多個(gè)子。
可以為一個(gè)已經(jīng)存在的 join 字段增加新的關(guān)聯(lián)關(guān)系。
可以為一個(gè)已經(jīng)是父的元素增加一個(gè)子元素。
join
數(shù)據(jù)類型在elasticsearch
中不應(yīng)該像關(guān)系型數(shù)據(jù)庫(kù)那種使用。而且has_child
和has_parent
都是比較消耗性能的。只有當(dāng) 子的數(shù)據(jù) 遠(yuǎn)遠(yuǎn)大于 父的數(shù)據(jù)時(shí),使用
join
才是有意義的。比如:一個(gè)博客下,有多個(gè)評(píng)論。
PUT /plan_index { "settings": { "number_of_shards": 3, "number_of_replicas": 1 }, "mappings": { "properties": { "plan_id":{ "type": "keyword" }, "plan_name":{ "type": "text", "fields": { "keyword":{ "type" : "keyword", "ignore_above" : 256 } } }, "act_id":{ "type": "keyword" }, "act_name":{ "type": "text", "fields": { "keyword":{ "type" : "keyword", "ignore_above" : 256 } } }, "comment_id":{ "type": "keyword" }, "comment_name":{ "type": "text", "fields": { "keyword":{ "type" : "keyword", "ignore_above" : 256 } } }, "creator":{ "type": "keyword" }, "create_time":{ "type": "date", "format": "yyyy-MM-dd||yyyy-MM-dd HH:mm:ss" }, "plan_join": { "type": "join", "relations": { "plan": ["activity", "book"], "book": "comments" } } } } }
注意??
此處添加的是 (plan
) 數(shù)據(jù)。
PUT /plan_index/_doc/plan-001 { "plan_id": "plan-001", "plan_name": "四月計(jì)劃", "creator": "huan", "create_time": "2021-04-07 16:27:30", "plan_join": { "name": "plan" } } PUT /plan_index/_doc/plan-002 { "plan_id": "plan-002", "plan_name": "五月計(jì)劃", "creator": "huan", "create_time": "2021-05-07 16:27:30", "plan_join": "plan" }
注意??:
1、如果是創(chuàng)建父文檔,則需要使用 plan_join
指定父文檔的關(guān)系的名字(此處為plan)。
2、plan_join
為創(chuàng)建索引的 mapping
時(shí)指定join
的字段的名字。
3、指定父文檔時(shí),plan_join
的這2種寫(xiě)法都可以。
PUT /plan_index/_doc/act-001?routing=plan-001 { "act_id":"act-001", "act_name":"四月第一個(gè)活動(dòng)", "creator":"huan.fu", "plan_join":{ "name":"activity", "parent":"plan-001" } } PUT /plan_index/_doc/book-001?routing=plan-001 { "book_id":"book-001", "book_name":"四月讀取的第一本書(shū)", "creator":"huan.fu", "plan_join":{ "name":"book", "parent":"plan-001" } } PUT /plan_index/_doc/book-002?routing=plan-001 { "book_id":"book-002", "book_name":"編程珠璣", "creator":"huan.fu", "plan_join":{ "name":"book", "parent":"plan-001" } } PUT /plan_index/_doc/book-003?routing=plan-002 { "book_id":"book-003", "book_name":"java編程思想", "creator":"huan.fu", "plan_join":{ "name":"book", "parent":"plan-002" } } # 理論上 comment 的父文檔是 book ,但是此處routing使用 plan 也是可以的。 PUT /plan_index/_doc/comment-001?routing=plan-001 { "comment_id":"comment-001", "comment_name":"這本書(shū)還可以", "creator":"huan.fu", "plan_join":{ "name":"comments", "parent":"book-001" } } PUT /plan_index/_doc/comment-002?routing=plan-001 { "comment_id":"comment-002", "comment_name":"值得一讀,棒。", "creator":"huan.fu", "plan_join":{ "name":"comments", "parent":"book-001" } }
注意??:
1、子文檔(子孫文檔等)需要和父文檔使用相同的路由鍵。
2、需要指定父文檔的id。
3、需要指定join的名字。
**需求:**返回父文檔id是plan-001下的類型為book的所有子文檔。
GET /plan_index/_search { "query":{ "parent_id": { "type":"book", "id":"plan-001" } } }
**需求:**返回創(chuàng)建者(creator)是huan.fu,并且子文檔最少有2個(gè)的父文檔。
GET /plan_index/_search { "query": { "has_child": { "type": "book", "min_children": 2, "query": { "match": { "creator": "huan.fu" } } } } }
**需求:**返回父文檔(book)的創(chuàng)建者是huan.fu的所有子文檔
GET /plan_index/_search { "query": { "has_parent": { "parent_type": "book", "query": { "match": { "creator":"huan.fu" } } } } }
Nested Object | join (Parent/Child) |
---|---|
1、文檔存儲(chǔ)在一起,讀取性能高 | 1、父子文檔單獨(dú)存儲(chǔ),互不影響。但是為了維護(hù)join的關(guān)系,需要占用額外的內(nèi)容,讀取性能略差。 |
2、更新父文檔或子文檔時(shí),需要更新整個(gè)文檔。 | 2、父文檔和子文檔可以單獨(dú)更新。 |
3、適用于查詢頻繁,子文檔偶爾更新的情況。 | 3、適用于更新頻繁的情況,且子文檔的數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)父文檔的數(shù)量。 |
到此,關(guān)于“如何處理elasticsearch父子文檔”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)?lái)更多實(shí)用的文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。