您好,登錄后才能下訂單哦!
Operator是指一類基于Kubernetes自定義資源對象(CRD)和控制器(Controller)的云原生拓展服務(wù),其中CRD定義了每個operator所創(chuàng)建和管理的自定義資源對象,Controller則包含了管理這些對象所相關(guān)的運維邏輯代碼。
對于普通用戶來說,如果要在k8s集群中部署一個高可用的etcd集群,那么不僅要了解其相關(guān)的配置,同時又需要特定的etcd專業(yè)知識才能完成維護(hù)仲裁,重新配置集群成員,創(chuàng)建備份,處理災(zāi)難恢復(fù)等等繁瑣的事件。
而在operator這一類拓展服務(wù)的協(xié)助下,我們就可以使用簡單易懂的YAML文件(同理參考Deployment)來聲明式的配置,創(chuàng)建和管理我們的etcd集群,下面我們就來一同了解下etcd-operator這個服務(wù)的架構(gòu)以及它所包含的一些功能。
了解etcd-operator的架構(gòu)與CRD資源對象
部署etcd-operator
使用etcd-operator創(chuàng)建etcd cluster
etcd-operator的設(shè)計是基于k8s的API Extension機(jī)制來進(jìn)行拓展的,它為用戶設(shè)計了一個類似于Deployment的Controller,只不過這個Controller是用來專門管理etcd這一服務(wù)的。
用戶默認(rèn)還是通過kubectl或UI來與k8s的API進(jìn)行交互,只不過在這個k8s集群中多了一個用戶自定義的控制器(custom controller),operator controller的服務(wù)是以Pod的方式運行在k8s集群中的,同時這個服務(wù)也需要配置所需的RBAC權(quán)限(比如對Pod,Deployment,Volume等使用到的資源進(jìn)行增刪改查的操作),下面我們用一個簡單的架構(gòu)圖來進(jìn)行闡述:
在k8s中,所有自定義的Controller和其自定義的資源對象(CRD)都必須滿足k8s API的規(guī)范(參考下圖):
apiVersion
描述了當(dāng)前自定義資源對象的版本號
Kind
表示自定義資源對象的名稱,用戶可通過執(zhí)行kubectl get $KIND_NAME
來獲取所創(chuàng)建的CRD對象
Metadata
繼承了原生k8s的metadata,用于添加標(biāo)簽,Annotations等元數(shù)據(jù)
Spec
是用戶可自定義設(shè)計的服務(wù)配置參數(shù),如鏡像版本號,節(jié)點數(shù)量,資源配置等等..
Status
包含了當(dāng)前資源的的相關(guān)狀態(tài),每個operator controller可自定義status所包含的信息,一般會選擇添加如conditions,updateTime和message等一類的信息。
1、EtcdCluster: etcdcluster用來描述用戶自定義的etcd集群,可一鍵式部署和配置一個相關(guān)的etcd集群。
apiVersion: etcd.database.coreos.com/v1beta2
kind: EtcdCluster
metadata:
name: etcd-cluster
spec:
size: 3
version: 3.2.25
2、EtcdBackup: etcdbackup用來描述和管理一個etcd集群的備份,當(dāng)前支持定期備份到云端存儲,如AWS s3, Aliyun oss(oss當(dāng)前需使用quay.io/coreos/etcd-operator:dev
鏡像)。
apiVersion: etcd.database.coreos.com/v1beta2
kind: EtcdBackup
metadata:
name: etcd-backup
spec:
etcdEndpoints: [<etcd-cluster-endpoints>]
storageType: OSS #options are S3/ABS/GCS/OSS
backupPolicy:
backupIntervalInSecond: 125
maxBackups: 4
oss:
#"<oss-bucket-name>/<path-to-backup-file>"
path: <full-oss-path>
ossSecret: <oss-secret>
# Details about regions and endpoints, see https://www.alibabacloud.com/help/doc-detail/31837.htm
endpoint: <endpoint>
3、EtcdRestore:etcdrestore
用來幫助將etcdbackup
服務(wù)所創(chuàng)建的備份恢復(fù)到一個指定的etcd的集群。
apiVersion: etcd.database.coreos.com/v1beta2
kind: EtcdRestore
metadata:
# name must be same to the spec.etcdCluster.name
name: example-etcd-cluster
spec:
etcdCluster:
name: example-etcd-cluster
backupStorageType: OSS
oss:
path: <full-oss-path>
ossSecret: <oss-secret>
endpoint: <endpoint>
1、部署etcd-operator
在Rancher最新的stable v2.3.2 的版本中,用戶可通過應(yīng)用商店(Catalog)來一鍵式部署 etcd-operator v0.9.0版本,同時原生k8s也可下載rancher/charts到本地后通過helm install的方式進(jìn)行部署。
1)(可選)部署etcd-operator時可選擇同時創(chuàng)建一個etcd集群(此集群在etcd-operator被刪除時會被一同移除),當(dāng)然用戶也可待etcd-operator部署完成通過kubectl apply -f myetcd.yaml來創(chuàng)建一個新的etcd集群。
2)部署時,如果用戶選擇啟動Enable Clusterwide of etcd Operator這個選項,那么這個etcd-operator將作為集群層級對象來使用(否則為namespaced隔離),如果enable這個選項,那么在創(chuàng)建etcd集群時需添加以下注釋才能創(chuàng)建創(chuàng)建:
kind: EtcdCluster
metadata:
name: etcd-cluster
# add this annotation when the clusterWide is enabled
annotations:
etcd.database.coreos.com/scope: clusterwide
2、創(chuàng)建etcd集群
接下來我們就可以使用上述的CRD自定義資源對象對來創(chuàng)建和管理我們的etcd集群了。
2.1 手動創(chuàng)建etcd集群
cat <<EOF | kubectl apply -f -
apiVersion: etcd.database.coreos.com/v1beta2
kind: EtcdCluster
metadata:
name: "etcd-cluster"
spec:
size: 3 # 默認(rèn)etcd節(jié)點數(shù)
version: "3.2.25" # etcd版本號
EOF
2.2 部署后可通過CRD對象來查看我們創(chuàng)建的etcd集群和pod狀態(tài)
$ kubectl get etcdcluster
NAME AGE
etcd-cluster 2m
$ kubectl get pod
NAME READY STATUS RESTARTS AGE
etcd-cluster-g28f552vvx 1/1 Running 0 2m
etcd-cluster-lpftgqngl8 1/1 Running 0 2m
etcd-cluster-sdpcfrtv99 1/1 Running 0 2m
2.3 可以往etcd集群任意的寫入幾條數(shù)據(jù)驗證etcd集群是正常工作的(后續(xù)也可用來驗證集群的備份和恢復(fù)功能)
$ kubectl get svc
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
etcd-cluster ClusterIP None <none> 2379/TCP,2380/TCP 17h
etcd-cluster-client ClusterIP 10.43.130.71 <none> 2379/TCP 17h
## write data
$ kubectl exec -it any-etcd-pod -- env "ETCDCTL_API=3" etcdctl --endpoints http://etcd-cluster-client:2379 put foo "Hello World"
## get data
$ kubectl exec -it any-etcd-pod -- env "ETCDCTL_API=3" etcdctl --endpoints http://etcd-cluster-client:2379 get foo
foo
Hello World
3、基于operator備份etcd cluster
3.1 確認(rèn)了etcd集群正常運行后,作為devops后面要考慮的就是如何創(chuàng)建etcd集群的自動化備份,下面以阿里云的OSS舉例:
cat <<EOF | kubectl apply -f -
apiVersion: etcd.database.coreos.com/v1beta2
kind: EtcdBackup
metadata:
name: example-etcd-cluster-periodic-backup
spec:
etcdEndpoints: [http://etcd-cluster-client:2379] #內(nèi)網(wǎng)可使用svc地址,外網(wǎng)可用NodePort或LB代理地址
storageType: OSS
backupPolicy:
backupIntervalInSecond: 120 #備份時間間隔
maxBackups: 4 #最大備份數(shù)
oss:
path: my-bucket/etcd.backup
ossSecret: oss-secret #需預(yù)先創(chuàng)建oss secret
endpoint: oss-cn-hangzhou.aliyuncs.com
EOF
3.2 若OSS Secret不存在,用戶可先手動創(chuàng)建,具體配置可參考如下:
cat << EOF | kubectl apply -f -
apiVersion: v1
kind: Secret
metadata:
name: oss-secret
type: Opaque
stringData:
accessKeyID: myAccessKey
accessKeySecret: mySecret
EOF
3.3 待etcdbackup創(chuàng)建成功后,用戶可以通過kubectl describe etcdbackup或查看etcd-backup controller日志來查看備份狀態(tài),如狀態(tài)顯示為Succeeded: true,可以前往oss查看具體的備份內(nèi)容。
4、基于operator恢復(fù)etcd cluster
最后,假設(shè)我們要將etcd集群A的備份數(shù)據(jù)恢復(fù)到另一個新的etcd集群B,那么我們先手動創(chuàng)建一個名為etcd-cluster2的新集群(oss備份/恢復(fù)當(dāng)前需使用quay.io/coreos/etcd-operator:dev
鏡像)。
cat <<EOF | kubectl apply -f -
apiVersion: etcd.database.coreos.com/v1beta2
kind: EtcdCluster
metadata:
name: "etcd-cluster2"
spec:
size: 3
version: "3.2.25"
EOF
然后通過創(chuàng)建etcdresotre將備份數(shù)據(jù)恢復(fù)到etcd-cluster2集群
cat <<EOF | kubectl apply -f -
apiVersion: etcd.database.coreos.com/v1beta2
kind: EtcdRestore
metadata:
# name必須與下面的spec.etcdCluster.name保持一致
name: etcd-cluster2
spec:
etcdCluster:
name: etcd-cluster2
backupStorageType: OSS
oss:
path: my-bucket/etcd.backup_v1_2019-08-07-06:44:17
ossSecret: oss-secret
endpoint: oss-cn-hangzhou.aliyuncs.com
EOF
待etcdresotre對象創(chuàng)建成功后,可以查看etcd-operator-restore的日志,大致內(nèi)容如下:
$ kubectl logs -f etcd-operator-restore
...
time="2019-08-07T06:50:26Z" level=info msg="listening on 0.0.0.0:19999"
time="2019-08-07T06:50:26Z" level=info msg="starting restore controller" pkg=controller
time="2019-08-07T06:56:25Z" level=info msg="serving backup for restore CR etcd-cluster2"
通過kubectl查看pod我們可以看到etcd-cluster2
集群的etcd節(jié)點被刪除重建:
NAME READY STATUS RESTARTS AGE
etcd-cluster2-5tq2d5bvpf 0/1 Terminating 0 93s
etcd-cluster2-kfgvc692pp 1/1 Terminating 0 101s
etcd-cluster2-xqkgz8chb8 0/1 Init:1/3 0 6s
etcd-cluster2-pf2qxgtg9d 1/1 Running 0 48s
etcd-cluster2-x92l9vpx97 1/1 Running 0 40s
最后可通過etcdctl
來驗證之前的數(shù)據(jù)是否存在(需設(shè)置ETCDCTL_API=3
):
$ kubectl exec -it etcd-pod -- env "ETCDCTL_API=3" etcdctl --endpoints http://etcd-cluster2-client:2379 get foo
foo
Hello World
Etcd作為當(dāng)前非常流行的key-value分布式文件存儲,它本身的強一致性和較優(yōu)的性能可以為許多分布式計算解決分布式存儲的需求,如果你的微服務(wù)和應(yīng)用需要用到此類的數(shù)據(jù)庫,不妨來試試Rancher Catalog應(yīng)用中的etcd-operator吧,Just do it!
相關(guān)資料:
https://github.com/coreos/etcd-operator
https://coreos.com/blog/introducing-the-etcd-operator.html
https://github.com/rancher/charts/tree/master/charts/etcd-operator/v0.9.0
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。