溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

ElasticSearch的功能和特點是什么

發(fā)布時間:2021-09-13 10:23:25 來源:億速云 閱讀:504 作者:柒染 欄目:大數據

本篇文章為大家展示了ElasticSearch的功能和特點是什么,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

1.自動維護數據的分布到多個節(jié)點的索引的簡歷,還有搜索請求分布到多個節(jié)點的執(zhí)行

2.自動維護數據的冗余副本,保證說,一些機器宕機了,不會丟失任何的數據

3.封裝了更多的高級功能,以提供更多高級的支持,快速開發(fā)應用

Elaticsearch的功能

1.分布式的搜索引擎和數據分析引擎 搜索:百度,網站的站內搜索、OA 數據分析:電商網站,最近7天牙膏銷量排名前幾的商家 分布式

2.全文檢索,結構化檢索,數據分析 全文檢索:搜索商品名稱包含牙膏的商品 select * from products where product_name like "%牙膏%" 結構化檢索:搜索商品分類為日化商品都有哪些 select * from peoducts where category_id='日化用品' 部分搜索、自動完成、搜索糾錯、搜索推薦 數據分析:分析每一個商品分類下有多少個商品 select categoey_id,count(*) from products group by category_id

3.對海量數據進行實時的處理 分布式:es自動可以將海量數據分散到多臺服務器上去存儲和檢索 海量數據的處理:分布式以后,就可以采用大量的服務器去存儲和檢索數據,自然而然就可以實現海量數據的處理 近實時:檢索數據需要花費1小時(這就不叫近實時,離線批處理,batch-peocessing);在秒級別對數據進行搜索和分析 跟分布式/海量數據相反的:lucence單機應用,只能在單臺服務上使用,最多只能處理單臺服務器可以處理的數據量

使用場景

1.github

2.Stack Overflow

3.電商搜索商品

4.日志數據分析 ELK技術 elasticsearch+logstash+kibana 復雜數據分析

5.商品價格監(jiān)控網站

6.BI 商業(yè)智能,Business Intelligence 數據挖掘 分析某某區(qū)域最近三年的用戶消費金額的趨勢,產生數據報表,es進行數據分析和挖掘,kibanna進行數據可視化

國內: 站內搜索: 電商,招聘,門戶

it系統搜索,OA,crm,Erp 數據分析:當前熱門的一個使用場景

特點

1.可以作為大型分布式集群技術,處理PB級數據,服務大公司;也可以運用在單機上,服務小公司

2.es不是什么新技術 主要是將全文檢索、數據分析以及分布式技術,合并在一起,形成es lucene全文檢索,分布式數據庫mycat

核心概念

1.Near Realtime (NRT):近實時,從寫入數據到數據可以被搜索到有一個小延遲 大概1秒 2.Cluster:集群,包含多個節(jié)點 3.Node:節(jié)點 4.Dcoument&field:文檔,通常用json數據結構表示,每個index下的type中,都可以存儲多個document。一個document里面有多個field,每個field就是一個數據字段 5.index:索引,包含一堆有相似結構的文檔數據,比如可以有一個客戶索引,商品分類索引,訂單索引 商品index:里面存放了所有的商品數據,商品document 6.Type類型,每個索引里有一個或多個type type,商品種類分很多種類,

7.shard:單臺機器無法存儲大量數據,es可以將一個索引中的數據切分為多個shard,分布在墮胎服務器上,有了shard就可以橫向擴展 存儲更多數據,讓搜索和分析等操作到多臺服務器上去執(zhí)行,提升吞吐量和性能。每個shard都是一個lucene index 8.replica:服務器會出現故障或宕機,因此shard可能會丟失,每個shard創(chuàng)建多個replica,可以在shard故障時提供備用服務,多個splica可以提升搜索操作的吞吐量。 primary shard(建立索引時一次設置,不能修改,默認5個),replica shard(隨時修改數量,默認1個),默認每個索引10個shard,5個primaryshard,5個replia shard,最小高可用配置,是兩臺服務器

shard和replia 是部分存儲在節(jié)點上

elasticSearch核心概念 vs 數據庫核心概念

Elasticsearch 數據庫 document 行 Type 表 index 數據庫

如何快速了解集群的健康狀況?green、yellow、red

green:每個索引的primary shard和replica shard都是active狀態(tài) yellow:每個索引的primary shard都是active狀態(tài),但是部分replica shard不是active狀態(tài),處于不可用狀態(tài) red:不是所有索引的peimary shard都是active狀態(tài),部分索引有數據丟失了

處于yellow情況下的原因 因為是一個筆記本,就啟動了一個es進程,相當于只有一個node。現在es中有一個index,就是kibanna自己內置建立的index 由于默認是給每個index分配5個primary shard和relica shard,而primary shard和replica shard不能再同一臺機器上(為了容錯) 所以只有一個primary shard被分配和啟動了,但一個replica shard沒有第二臺機器啟動

上述內容就是ElasticSearch的功能和特點是什么,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI