溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

kubernetes中pod資源的調(diào)度

發(fā)布時(shí)間:2020-06-11 16:24:45 來(lái)源:億速云 閱讀:168 作者:元一 欄目:云計(jì)算

kubernetes簡(jiǎn)介

kubernetes,簡(jiǎn)稱K8s,是用8代替8個(gè)字符“ubernete”而成的縮寫。是一個(gè)開(kāi)源的,用于管理云平臺(tái)中多個(gè)主機(jī)上的容器化的應(yīng)用,Kubernetes的目標(biāo)是讓部署容器化的應(yīng)用簡(jiǎn)單并且高效(powerful),Kubernetes提供了應(yīng)用部署,規(guī)劃,更新,維護(hù)的一種機(jī)制。

Pod簡(jiǎn)介

Pod是Kubernetes創(chuàng)建或部署的最小/最簡(jiǎn)單的基本單位,一個(gè)Pod代表集群上正在運(yùn)行的一個(gè)進(jìn)程。

一個(gè)Pod封裝一個(gè)應(yīng)用容器(也可以有多個(gè)容器),存儲(chǔ)資源、一個(gè)獨(dú)立的網(wǎng)絡(luò)IP以及管理控制容器運(yùn)行方式的策略選項(xiàng)。Pod代表部署的一個(gè)單位:Kubernetes中單個(gè)應(yīng)用的實(shí)例,它可能由單個(gè)容器或多個(gè)容器共享組成的資源。

通常情況下,使用的都是k8s默認(rèn)的調(diào)度調(diào)度方式,但是在有些情況下,我們需要將pod運(yùn)行在具有特點(diǎn)的標(biāo)簽的node上才能都運(yùn)行,這個(gè)時(shí)候,pod的調(diào)度策略就不能使用k8s默認(rèn)的調(diào)度策略了,這個(gè)時(shí)候,就需要指定調(diào)度策略,告訴k8s需要將pod調(diào)度到那些node(節(jié)點(diǎn))上。

nodeSelector
常規(guī)情況下,會(huì)直接使用nodeSelector這種調(diào)度策略。labels(標(biāo)簽) 是k8s里面用來(lái)編標(biāo)記資源的一種常用的方式,我們可以給node標(biāo)記特殊的標(biāo)簽,然后nodeSelector會(huì)將pod調(diào)度到帶有指定labels的node上的。

下面看個(gè)示例:

首先,查看node的label信息,通過(guò)下面的命令查看的 node 的 label:

$ kubectl get nodes --show-labels
NAME      STATUS    ROLES     AGE       VERSION   LABELS
master    Ready     master    147d      v1.10.0   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,kubernetes.io/hostname=master,node-role.kubernetes.io/master=
node02    Ready     <none>    67d       v1.10.0   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,course=k8s,kubernetes.io/hostname=node02
node03    Ready     <none>    127d      v1.10.0   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,jnlp=haimaxy,kubernetes.io/hostname=node03

然后,可以給node02節(jié)點(diǎn)新增一個(gè)label:

$ kubectl label nodes node02 com=yijiadashuju
node "node02" labeled

然后通過(guò)上面的--show-labels參數(shù)可以查看上述標(biāo)簽是否生效。當(dāng) node 被打上了相關(guān)標(biāo)簽后,在調(diào)度的時(shí)候就可以使用這些標(biāo)簽了,只需要在 Pod 的spec字段中添加nodeSelector字段,里面是我們需要被調(diào)度的節(jié)點(diǎn)的 label 即可。比如,要將 Pod 我們要強(qiáng)制調(diào)度到 node02 這個(gè)節(jié)點(diǎn)上去,可以使用 nodeSelector 來(lái)表示了:(pod-selector-demo.yaml)

apiVersion: v1
kind: Pod
metadata:
  labels:
    app: busybox-pod
  name: test-busybox
spec:
  containers:
  - command:
    - sleep
    - "3600"
    image: busybox
    imagePullPolicy: Always
    name: test-busybox
  nodeSelector:
    com: yijiadashuju

然后,執(zhí)行pod-selector-demo.yaml文件后,可以通過(guò)下面的命令查看pod運(yùn)行的節(jié)點(diǎn)信息

kubectl get pod -o wide -n default

也可以使用description命令查看pod被調(diào)度到哪個(gè)節(jié)點(diǎn)上:

$ kubectl create -f pod-selector-demo.yaml
pod "test-busybox" created
$ kubectl describe pod test-busybox
Name:         test-busybox
Namespace:    default
Node:         node02/10.151.30.63
......
QoS Class:       BestEffort
Node-Selectors:  com=youdianzhishi
Tolerations:     node.kubernetes.io/not-ready:NoExecute for 300s
                 node.kubernetes.io/unreachable:NoExecute for 300s
Events:
  Type    Reason                 Age   From               Message
  ----    ------                 ----  ----               -------
  Normal  SuccessfulMountVolume  55s   kubelet, node02    MountVolume.SetUp succeeded for volume "default-token-n9w2d"
  Normal  Scheduled              54s   default-scheduler  Successfully assigned test-busybox to node02
  Normal  Pulling                54s   kubelet, node02    pulling image "busybox"
  Normal  Pulled                 40s   kubelet, node02    Successfully pulled image "busybox"
  Normal  Created                40s   kubelet, node02    Created container
  Normal  Started                40s   kubelet, node02    Started container

從上面的執(zhí)行結(jié)果可以看出,pod 通過(guò)默認(rèn)的 default-scheduler 調(diào)度器到了node02節(jié)點(diǎn)上。不過(guò),這種調(diào)度方式屬于強(qiáng)制性的。如果node02上的資源不足,那么pod的狀態(tài)將會(huì)一直是pending狀態(tài)。這就是nodeselector的用法了。

通過(guò)上面的介紹,可以看出nodeselector使用起來(lái)非常方便,但是還有很多的不足,那就是不夠靈活,控制粒度偏大,在實(shí)際使用中還是有許多的不便。接下來(lái)一起看先親和性和反親和性調(diào)度。

親和性和反親和性調(diào)度

k8s的默認(rèn)調(diào)度流程實(shí)際上是經(jīng)過(guò)了兩個(gè)階段:predicates 和 priorities 。使用默認(rèn)的調(diào)度流程的話,k8s會(huì)將pod調(diào)度到資源充裕的節(jié)點(diǎn)上,使用nodeselector的調(diào)度方法,又會(huì)將pod調(diào)度具有指定標(biāo)簽的pod上。然后在實(shí)際生產(chǎn)環(huán)ongoing境中,我們需要將pod調(diào)度到具有默些label的一組node才能滿足實(shí)際需求,這個(gè)時(shí)候就需要nodeAffinity(節(jié)點(diǎn)親和性)、podAffinity(pod 親和性) 以及 podAntiAffinity(pod 反親和性)。

親和性可以分為具體可以細(xì)分為硬和軟兩種親和性,

軟親和性:如果調(diào)度的時(shí)候,沒(méi)有滿足要求,也可以繼續(xù)調(diào)度,即能滿足最好,不能也無(wú)所謂
硬親和性:是指調(diào)度的時(shí)候必須滿足特定的要求,如果不滿足,那么pod將不會(huì)被調(diào)度到當(dāng)前node

規(guī)則可以設(shè)置:
軟策略: preferredDuringSchedulingIgnoredDuringExecution

硬策略: requiredDuringSchedulingIgnoredDuringExecution

nodeAffinity 節(jié)點(diǎn)親和性
節(jié)點(diǎn)親和性主要是用來(lái)控制 pod 能部署在哪些節(jié)點(diǎn)上,以及不能部署在哪些節(jié)點(diǎn)上的。它可以進(jìn)行一些簡(jiǎn)單的邏輯組合了,不只是簡(jiǎn)單的相等匹配。

接下來(lái)看一個(gè)示例,使用 Deployment 來(lái)管理3個(gè) pod 副本,使用nodeAffinity控制 pod 的調(diào)度,如下例子:(node-affinity-demo.yaml)

apiVersion: apps/v1beta1
kind: Deployment
metadata:
  name: affinity
  labels:
    app: affinity
spec:
  replicas: 3
  revisionHistoryLimit: 15
  template:
    metadata:
      labels:
        app: affinity
        role: test
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports:
        - containerPort: 80
          name: nginxweb
      affinity:
        nodeAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:  # 硬策略
            nodeSelectorTerms:
            - matchExpressions:
              - key: kubernetes.io/hostname
                operator: NotIn
                values:
                - node03
          preferredDuringSchedulingIgnoredDuringExecution:  # 軟策略
          - weight: 1
            preference:
              matchExpressions:
              - key: com
                operator: In
                values:
                - yijiadashuju

這個(gè)pod調(diào)度的時(shí)候,首先要求不能運(yùn)行在node03節(jié)點(diǎn)上,但是如果有節(jié)點(diǎn)滿足labels為com:yijiadashuju 的話,就會(huì)優(yōu)先調(diào)度到這個(gè)節(jié)點(diǎn)上。

接下來(lái)看下節(jié)點(diǎn)信息:

$ kubectl get nodes --show-labels
NAME      STATUS    ROLES     AGE       VERSION   LABELS
master    Ready     master    154d      v1.10.0   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,kubernetes.io/hostname=master,node-role.kubernetes.io/master=
node02    Ready     <none>    74d       v1.10.0   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,com=yijiadashuju,course=k8s,kubernetes.io/hostname=node02
node03    Ready     <none>    134d      v1.10.0   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,jnlp=haimaxy,kubernetes.io/hostname=node03

可以看到 node02 節(jié)點(diǎn)有com=yijiadashuju的 label,按要求會(huì)優(yōu)先調(diào)度到這個(gè)節(jié)點(diǎn),接下來(lái)創(chuàng)建 pod,然后使用descirbe命令查看調(diào)度情況。

$ kubectl create -f node-affinity-demo.yaml
deployment.apps "affinity" created
$ kubectl get pods -l app=affinity -o wide
NAME                        READY     STATUS    RESTARTS   AGE       IP             NODE
affinity-7b4c946854-5gfln   1/1       Running   0          47s       10.244.4.214   node02
affinity-7b4c946854-l8b47   1/1       Running   0          47s       10.244.4.215   node02
affinity-7b4c946854-r86p5   1/1       Running   0          47s       10.244.4.213   node02

從結(jié)果可以看到 pod 均被部署到了 node02節(jié)點(diǎn)。

現(xiàn)在Kubernetes提供的操作符有下面的幾種

In:label 的值在某個(gè)標(biāo)簽中
NotIn:label 的值不在某個(gè)標(biāo)簽中
Gt:label 的值大于某個(gè)值
Lt:label 的值小于某個(gè)值
Exists:某個(gè) label 存在
DoesNotExist:某個(gè) label 不存在

如果nodeSelectorTerms下面有多個(gè)選項(xiàng)的話,滿足任何一個(gè)條件就可以了;如果matchExpressions有多個(gè)選項(xiàng)的話,則必須同時(shí)滿足這些條件才能正常調(diào)度 POD。

podAffinity pod親和性

pod的親和性主要用來(lái)解決pod可以和哪些pod部署在同一個(gè)集群里面,即拓?fù)溆颍ㄓ蒼ode組成的集群)里面;而pod的反親和性是為了解決pod不能和哪些pod部署在一起的問(wèn)題,二者都是為了解決pod之間部署問(wèn)題。需要注意的是,Pod 間親和與反親和需要大量的處理,這可能會(huì)顯著減慢大規(guī)模集群中的調(diào)度,不建議在具有幾百個(gè)節(jié)點(diǎn)的集群中使用,而且Pod 反親和需要對(duì)節(jié)點(diǎn)進(jìn)行一致的標(biāo)記,即集群中的每個(gè)節(jié)點(diǎn)必須具有適當(dāng)?shù)臉?biāo)簽?zāi)軌蚱ヅ?nbsp;topologyKey。如果某些或所有節(jié)點(diǎn)缺少指定的 topologyKey 標(biāo)簽,可能會(huì)導(dǎo)致意外行為。

下面是pod間親和的示例:

pods/pod-with-pod-affinity.yaml:

apiVersion: v1
kind: Pod
metadata:
  name: with-pod-affinity
spec:
  affinity:
    podAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
      - labelSelector:
          matchExpressions:
          - key: security
            operator: In
            values:
            - S1
        topologyKey: failure-domain.beta.kubernetes.io/zone
    podAntiAffinity:
      preferredDuringSchedulingIgnoredDuringExecution:
      - weight: 100
        podAffinityTerm:
          labelSelector:
            matchExpressions:
            - key: security
              operator: In
              values:
              - S2
          topologyKey: failure-domain.beta.kubernetes.io/zone
  containers:
  - name: with-pod-affinity
    image: k8s.gcr.io/pause:2.0

podAntiAffinity pod反親和性

下面是一個(gè)pod反親和yaml文件示例:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: redis-cache
spec:
  selector:
    matchLabels:
      app: store
  replicas: 3
  template:
    metadata:
      labels:
        app: store
    spec:
      affinity:
        podAntiAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
          - labelSelector:
              matchExpressions:
              - key: app
                operator: In
                values:
                - store
            topologyKey: "kubernetes.io/hostname"
      containers:
      - name: redis-server
        image: redis:3.2-alpine
向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI