GitXplorerGitXplorer
k

sockshop-kashinoki38

public
1 stars
1 forks
0 issues

Commits

List of commits on branch master.
Unverified
cd04ca3420792caf7f651c64033f8552e1d7181f

modify

kkashinoki38 committed 4 years ago
Unverified
134b16fbb46d04326ebf7889433d31849e94bd29

modify

kkashinoki38 committed 4 years ago
Unverified
051d84bcccddd5160079ac0c6fdc6a2b678dbe39

modify for flagger

kkashinoki38 committed 4 years ago
Unverified
75699aa13d3d60ef998990338916d33151dad0e7

modify for flagger configuration

kkashinoki38 committed 4 years ago
Unverified
75ba99b1a9ae2db359a5563ad2d64f0af17c97da

modify for jmeter-flagger to have scenario as configmap

kkashinoki38 committed 4 years ago
Unverified
495e7b8edcb6cc88410ec5658340cc0c0ef88744

modify imagePullPolicy

kkashinoki38 committed 4 years ago

README

The README file for this repository.

概要

sock-shop をサンプルアプリとして、Observability と負荷試験自動化スタックを追加した資材です。

導入スタック&前提条件

  • GKE 1.17.15-gke.800
  • Istio 1.6.11 (istioctl 使用して導入)
    > istioctl version
    client version: 1.6.11
    control plane version: 1.6.11-gke.0
    data plane version: 1.6.11-gke.0 (15 proxies)
  • prometheus-community/kube-prometheus-stack : Chart version 13.7.2 (Helm 使用して導入)
  • loki/loki-stack : 2.3.1 (Helm 使用して導入)
  • flagger/flagger : 1.6.3 (Helm 使用して導入)
  • flagger/loadtester : 0.18.0 (Docker イメージは独自で Jmeter 追加したイメージ) (Kustomize で導入)
    • kashinoki38/jmeter-flagger

セットアップ手順

1. istio マニフェストデプロイ (istioctl 使用して導入)

事前に Kubernetes マニフェスト確認

$ istioctl manifest generate -f istio-manifest-v1.6.11.yaml

マニフェスト適用

$ istioctl upgrade -f istio-manifest-v1.6.11.yaml
...
✔ Istio core installed
✔ Istiod installed
✔ Ingress gateways installed
✔ Addons installed
✔ Installation complete

Kiali の設定

Credential(Secret 作成)
$ KIALI_USERNAME=$(read -p 'Kiali Username: ' uval && echo -n $uval | base64)
Kiali Username: admin
$ KIALI_PASSPHRASE=$(read -sp 'Kiali Passphrase: ' pval && echo -n $pval | base64)
Kiali Passphrase:
$ cat <<EOF | kubectl apply -f -
apiVersion: v1
kind: Secret
metadata:
  name: kiali
  namespace: istio-system
  labels:
    app: kiali
type: Opaque
data:
  username: $KIALI_USERNAME
  passphrase: $KIALI_PASSPHRASE
EOF

2. Prometheus (kube-prometheus-stack、Helm 使用して導入)

kube-prometheus-stack(旧 Prometheus-Operator)を使用。
https://github.com/prometheus-community/helm-charts/tree/main/charts/kube-prometheus-stack

> kubectl create ns monitoring
> helm upgrade -i kube-prometheus-stack -f kube-prometheus-stack/values.yaml  kube-prometheus-stack/ -n monitoring
Release "kube-prometheus-stack" has been upgraded. Happy Helming!
NAME: kube-prometheus-stack
LAST DEPLOYED: Wed Feb 17 04:29:42 2021
NAMESPACE: monitoring
STATUS: deployed
REVISION: 2
NOTES:
kube-prometheus-stack has been installed. Check its status by running:
  kubectl --namespace monitoring get pods -l "release=kube-prometheus-stack"

Visit https://github.com/prometheus-operator/kube-prometheus for instructions on how to create & configure Alertmanager and Prometheus instances using the Operator.

> helm list -n monitoring
NAME                    NAMESPACE       REVISION        UPDATED                                 STATUS          CHART                           APP VERSION
kube-prometheus-stack   monitoring    1               2021-02-19 01:53:54.9194679 +0900 JST   deployed        kube-prometheus-stack-13.7.2    0.45.0

> kubectl get po -n monitoring
NAME                                                       READY   STATUS    RESTARTS   AGE
alertmanager-kube-prometheus-stack-alertmanager-0          2/2     Running   0          2m33s
kube-prometheus-stack-grafana-5c4fbd566f-vmkjw             2/2     Running   0          2m44s
kube-prometheus-stack-kube-state-metrics-db6d5b5cb-kpszl   1/1     Running   0          2m44s
kube-prometheus-stack-operator-f55f8b965-rdtnc             1/1     Running   0          2m44s
kube-prometheus-stack-prometheus-node-exporter-8v852       1/1     Running   0          2m44s
kube-prometheus-stack-prometheus-node-exporter-drhsv       1/1     Running   0          2m44s
kube-prometheus-stack-prometheus-node-exporter-gr9xh       1/1     Running   0          2m44s
kube-prometheus-stack-prometheus-node-exporter-jtbk8       1/1     Running   0          2m44s
kube-prometheus-stack-prometheus-node-exporter-szqgx       1/1     Running   0          2m44s
kube-prometheus-stack-prometheus-node-exporter-tggqj       1/1     Running   0          2m44s
prometheus-kube-prometheus-stack-prometheus-0              2/2     Running   0          2m32s

> kubectl get svc -n monitoring
NAME                                             TYPE        CLUSTER-IP      EXTERNAL-IP   PORT(S)                      AGE
alertmanager-operated                            ClusterIP   None            <none>        9093/TCP,9094/TCP,9094/UDP   74m
kube-prometheus-stack-alertmanager               ClusterIP   10.179.7.210    <none>        9093/TCP                     74m
kube-prometheus-stack-grafana                    ClusterIP   10.179.0.232    <none>        80/TCP                       74m
kube-prometheus-stack-kube-state-metrics         ClusterIP   10.179.13.106   <none>        8080/TCP                     74m
kube-prometheus-stack-operator                   ClusterIP   10.179.7.213    <none>        443/TCP                      74m
kube-prometheus-stack-prometheus                 ClusterIP   10.179.9.170    <none>        9090/TCP                     74m
kube-prometheus-stack-prometheus-node-exporter   ClusterIP   10.179.5.94     <none>        9100/TCP                     74m
prometheus-operated                              ClusterIP   None            <none>        9090/TCP                     74m

Dashboard へのアクセス

外部公開していなくてもポートフォワードでダッシュボードへアクセス可能。
port-forward.sh使える。

> ./port-forward.sh
Forwarding from 127.0.0.1:3000 -> 3000
Forwarding from [::1]:3000 -> 3000
Grafana の Credential

grafana.adminPasswordadminユーザのパスワードを設定可能。
以下デフォルト。

user password
admin prom-operator

Grafana Dashboard 追加

Helm チャートのgrafana.sidecar.dashboards.enabledtrueにしているため、 Grafana ダッシュボード JSON をgrafana.sidecar.dashboards.labelで定義されたラベルを持つ ConfigMap で定義するとインポートしてくれる。

Dashboard の ConfigMap マニフェスト作成方法

https://github.com/prometheus-community/helm-charts/blob/main/charts/kube-prometheus-stack/hack/sync_grafana_dashboards.py
上記 py を参考にローカルの JSON を読むように改修。

26 行目からのchartsリストに以下のようなダッシュボード JSON リンクを追記。

# Source files list
charts = [
  ...
    {
        'source': 'grafana-dashboards-base/node-exporter-dashboard.json',
        'destination': 'kube-prometheus-stack/templates/grafana/dashboards-1.14',
        'type': 'json',
        'min_kubernetes': '1.14.0-0'
    },
  ...

sync_grafana_dashboards.py実行。
Dashboard 用の ConfigMap yaml が生成される。

> python3 sync_grafana_dashboards.py
> ll ./kube-prometheus-stack/templates/grafana/dashboards-1.14/
...
-rwxrwxrwx 1 kashinoki38 kashinoki38 294K Feb 19 02:50 pod-detail-dashboard.yaml*
...

ConfigMap マニフェストを生成後、helm upgradeを実施することで ConfigMap がデプロイされた後、Grafana にもダッシュボードが反映される。

> helm upgrade kube-prometheus-stack -f kube-prometheus-stack/values.yaml kube-prometheus-stack/ -n monitoring
Release "kube-prometheus-stack" has been upgraded. Happy Helming!
NAME: kube-prometheus-stack
LAST DEPLOYED: Fri Feb 19 02:51:06 2021
NAMESPACE: monitoring
STATUS: deployed
REVISION: 4
NOTES:
kube-prometheus-stack has been installed. Check its status by running:
  kubectl --namespace monitoring get pods -l "release=kube-prometheus-stack"

Visit https://github.com/prometheus-operator/kube-prometheus for instructions on how to create & configure Alertmanager and Prometheus instances using the Operator.

> kubectl get cm
...
kube-prometheus-stack-pod-detail-dashboard                1      5m59s
...

3. Loki(Helm 使用して導入)

> helm upgrade -i loki-stack loki-stack/ -n monitoring
> helm list -n monitoring
NAME                    NAMESPACE       REVISION        UPDATED                                 STATUS          CHART                           APP VERSION
loki-stack              monitoring      1               2021-02-23 01:50:30.7269591 +0900 JST   deployed        loki-stack-2.3.1                v2.1.0

4. SockShop クラスタデプロイ(Kustomize 使用して導入)

sock-shop namespace と jmeter namespace がデプロイされ、Sock-shop のクラスタ(service, deployment, gateway, virtualservice)と Loadtest のクラスタ(service, deployment, configmap)がデプロイされる。

$ kubectl apply -f sock-shop-ns.yaml
$ kubectl apply -f jmeter-ns.yaml
$ kustomize build overlays/ | kubectl apply -f -

アンデプロイ

$ kustomize build overlays/ | kubectl delete -f -

カスタマイズ

overlays/配下のkustomization.yamlで Kustomize のパッチ当て。

5. Flagger (Helm 使用して導入)

Flagger 自体のデプロイは Helm で実施。

$ helm upgrade -i flagger flagger/ \
 -n istio-sytem \
 —set slack.url=https://hooks.slack.com/services/YOUR-WEBHOOK-ID \
 —set slack.channel=general \
 —set slack.user=flagger

$ helm list -n istio-system
NAME    NAMESPACE       REVISION        UPDATED                                 STATUS          CHART           APP VERSION
flagger istio-system    1               2021-02-23 09:35:00.4708245 +0900 JST   deployed        flagger-1.6.3   1.6.3

$ helm get values flagger
USER-SUPPLIED VALUES:
metricsServer: http://prometheus.monitoring:9090
slack:
  channel: 'general'
  url: https://hooks.slack.com/services/YOUR-WEBHOOK-ID
  user: flagger

Canary.yaml

Flagger の設定としてcanary.yamlをデプロイする。

$ kubectl apply -f canary.yaml -n sock-shop
$ kubectl get canary -n sock-shop
NAME        STATUS        WEIGHT   LASTTRANSITIONTIME
sock-shop   Initialized   0        2021-02-23T13:54:07Z

Canary をデプロイすると自動的にターゲットリソースが以下のように変更される。
具体的にはターゲットの Deployment に関連する service に-primary-canaryが追加。
ターゲットの Deployment に-primaryが追加。
VirtualService が追加。(Destination がfront-end-primaryfront-end-canary

$ kubectl get all -n sock-shop | grep front-end
pod/front-end-7b5f8c5b59-hlgxk           2/2     Running   0          72m
pod/front-end-primary-76c6668fbb-qtc2q   2/2     Running   0          3m41s
service/front-end           ClusterIP   10.179.3.9      <none>        80/TCP                       20h
service/front-end-canary    ClusterIP   10.179.5.186    <none>        80/TCP                       3m41s
service/front-end-primary   ClusterIP   10.179.3.89     <none>        80/TCP                       3m41s
deployment.apps/front-end           1/1     1            1           20h
deployment.apps/front-end-primary   1/1     1            1           3m41s
replicaset.apps/front-end-7b5f8c5b59           1         1         1       72m
replicaset.apps/front-end-primary-76c6668fbb   1         1         1       3m41s

$ kubectl get vs
NAME        GATEWAYS                        HOSTS   AGE
front-end   [sock-shop/sock-shop-gateway]   [*]     13s


$ kubectl describe canary sock-shop -n sock-shop | tail
Events:
  Type     Reason  Age                    From     Message
  ----     ------  ----                   ----     -------
  Warning  Synced  5m15s                  flagger  front-end-primary.sock-shop not ready: wa
iting for rollout to finish: observed deployment generation less then desired generation
  Normal   Synced  4m16s (x2 over 5m16s)  flagger  all the metrics providers are available!
  Normal   Synced  4m15s                  flagger  Initialization done! sock-shop.sock-shop
Flagger の監視対象

対象となる deployment を.spec.targetRefに記載。
当該 Deployment に変更が加わった際に Canary Analysis が開始される。

spec:
  # deployment reference
  targetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: front-end
デプロイ手法と Canary Analysis 設定

.spe.analysisにて設定

  • Canary Release の場合

    • maxWeight%までstepWeight%ずつ新規 Deployment へトランザクションを増加させる割り振る
    • リトライ間隔(interval), rollback するまでののリトライ回数(threshold)
  • Blue/Green デプロイメントの場合

    • maxWeight, stepWeightを設定せず、iterationsを設定することで Blue/Green デプロイメントを実現可能。
    • 1 分 ×iterationsの間、Canary Analysis が実施される。
analysis:
  # schedule interval (default 60s)
  interval: 1m
  # max number of failed metric checks before rollback
  threshold: 5
  # max traffic percentage routed to canary
  # percentage (0-100)
  # maxWeight: 50
  # canary increment step
  # percentage (0-100)
  # stepWeight: 10
  # You can use the blue/green deployment strategy by replacing stepWeight/maxWeight with iterations in the analysis spec:
  # With this configuration Flagger will run conformance and load tests on the canary pods for ten minutes.
  iterations: 15
判定条件として metrics

.spec.analysis.metricsにて Canary Analysis 中の判定条件を設定できる。

analysis:
  ...
  metrics:
    - name: request-success-rate
      # minimum req success rate (non 5xx responses)
      # percentage (0-100)
      thresholdRange:
        min: 99
      interval: 1m
    - name: request-duration
      # maximum req duration P99
      # milliseconds
      thresholdRange:
        max: 1000
      interval: 30s
MetricTemplate
apiVersion: flagger.app/v1beta1
kind: MetricTemplate
metadata:
  name: request-duration-custome
  namespace: istio-system
spec:
  provider:
    type: prometheus
    address: http://kube-prometheus-stack-prometheus.monitoring.svc.cluster.local:9090
  query: |
    histogram_quantile(0.95, 
      sum(
        irate(
          istio_request_duration_milliseconds_bucket{
            reporter="destination",
            destination_workload=~"front-end",
            destination_workload_namespace=~"sock-shop"
          }[2m]
        )
      ) by (le)
    )

canary.yaml

metrics:
  - name: request-duration-custome
    templateRef:
      name: request-duration-custome
      namespace: istio-system
  ...

//TODO 追加のメトリクス(リソース)

Flagger の Webhook としての Jmeter

sock-shop の Kustomize にて以下 Deployment と Service が導入済み。

  • svc/jmeter-flagger-loadtester
  • deploy/jmeter-flagger-loadtester canary.yaml
webhooks:
  ...
  - name: load-test
    url: http://jmeter-flagger-loadtester.jmeter/
    timeout: 5s
    metadata:
      # /jmeter/apache-jmeter-*/bin/jmeter -n -t $1 -Dserver.rmi.ssl.disable=true -JServerName=$2 -JNumOfThreads=$3 -JRampUp=$4 -JDuration=$5 -JTPM=$6
      cmd: '/bin/bash /load_test /scenario.jmx "front-end-canary.sock-shop" "50" "180" "600" "3000"'
Jmeter Scenario 更新方法

base/kustomization.yamlの以下定義により Kustomize で jmx ファイルを ConfigMap 化している。

configMapGenerator:
  - name: jmeter-scenario-load-test
    files:
      - scenario.jmx
  - name: jmeter-scenario-user-preparation
    files:
      - preparation.jmx

base/scenario.jmxを更新し、Kustomize 再実行で ConfigMap が生成される。
kubectl apply -f'にて更新すると更新分がmetadata.annotationsに入り切らずエラーが出る。 シナリオを更新する場合はkubectl create -f`を使用すること。

$ kustomize build overlays/ | kubectl apply -f -
Error from server (Invalid): error when creating "STDIN": ConfigMap "jmeter-scenario-load-test-kg4kc24f6t" is invalid: metadata.annotations: Too long: must have at most 262144 bytes
Error from server (Invalid): error when creating "STDIN": ConfigMap "jmeter-scenario-user-preparation-gh5g4kgk66" is invalid: metadata.annotations: Too long: must have at most 262144 bytes

# deploy/jmeter-flagger-loadtesterを削除しkubectl create -f で再デプロイすること
$ kubectl delete deploy jmeter-flagger-loadtester
$ kustomize build overlays/ | kubectl create -f -
configmap/jmeter-scenario-load-test-kg4kc24f6t created
configmap/jmeter-scenario-user-preparation-gh5g4kgk66 created
deployment.apps/jmeter-flagger-loadtester created

生成される ConfigMap には末尾に Hash が追加されるが、その ConfigMap を参照する Deployment のマニフェストは自動で書き換えられる。

apiVersion: apps/v1
kind: Deployment
metadata:
  name: jmeter-flagger-loadtester
  namespace: jmeter
spec:
...
        volumeMounts:
        - mountPath: /scenario
          name: jmeter-scenario-load-test
          subPath: scenario.jmx
        - mountPath: /scenario
          name: jmeter-scenario-user-preparation
          subPath: preparation.jmx
      volumes:
      - configMap:
          defaultMode: 420
          name: jmeter-scenario-load-test-kg4kc24f6t
        name: jmeter-scenario-load-test
      - configMap:
          defaultMode: 420
          name: jmeter-scenario-user-preparation-gh5g4kgk66
        name: jmeter-scenario-user-preparation
jmeter-flagger Docker イメージ

weaveworks/flagger-loadtesterに jmeter 資材を注入したコンテナイメージを以下コマンドでビルド

$ cd jmeter
$ docker build -t jmeter-flagger -f jmeter-flagger.dockerfile .
$ docker run -d --name jmeter-flagger jmeter-flagger:latest

Jmeter 手動実行

ユーザデータ準備

> cd jmeter
> vi start_test.sh #負荷量調整
...
24: # /jmeter/apache-jmeter-*/bin/jmeter -n -t $1 -Dserver.rmi.ssl.disable=true -JServerName=$2 -JNumOfThreads=$3 -JRampUp=$4 -JDuration=$5 -JTPM=$6
25: kubectl -n $namespace exec -ti $master_pod -- /bin/bash /load_test "$test_name" "34.84.80.98" "10" "10" "600" "300"

> bash start_test.sh
Enter path to the jmx file
preparation.jmx #指定

試験実施

> cd jmeter
> vi start_test.sh #負荷量調整
...
24: # /jmeter/apache-jmeter-*/bin/jmeter -n -t $1 -Dserver.rmi.ssl.disable=true -JServerName=$2 -JNumOfThreads=$3 -JRampUp=$4 -JDuration=$5 -JTPM=$6
25: kubectl -n $namespace exec -ti $master_pod -- /bin/bash /load_test "$test_name" "34.84.80.98" "100" "180" "900" "6000"

> bash start_test.sh
Enter path to the jmx file
scenario.jmx #指定

デフォルト SockShop からのカスタム箇所

istio の導入

namespace へのistio-injection追加。

deploy/kubernetes/manifests/00-sock-shop-ns.yaml

kind: Namespace
metadata:
  name: sock-shop
  labels:
    istio-injection: enabled

各 deployment へのsidecar.istio.io/proxyCPU追加。

deploy/kubernetes/manifests/carts-dep.yaml

metadata:
  labels:
    app: carts
  annotations:
    sidecar.istio.io/proxyCPU: "10m"
spec:
  containers:
    - name: carts

各 deployment のサービスポート名追加。

(Istio テレメトリ収集のための修正)
https://kiali.io/documentation/validations/#_kia0601_port_name_must_follow_protocol_suffix_form
https://istio.io/docs/ops/configuration/traffic-management/protocol-selection/#manual-protocol-selection
> Istio では、サービスポートが「protocol-suffix」の命名形式に従う必要があります。「-suffix」部分はオプションです。命名がこの形式と一致しない場合(または未定義の場合)、Istio は定義で定義されているプロトコルではなく、すべてのトラフィック TCP を処理します。ダッシュはプロトコルとサフィックスの間に必要な文字です。たとえば、「http2foo」は無効ですが、「http2-foo」は有効です(http2 プロトコルの場合)。

deploy/kubernetes/manifests/carts-svc.yml

spec:
  ports:
    - name: http-carts
      protocol: TCP
      port: 80
      targetPort: 80
  selector:
    app: carts

Grafana のダッシュボード

Prometheus Operator のスクレイプ

service monitor

以下のservice monitorについて、node 名をnodeラベルとして取ってくるようにrelabelingを追加

  • kube-state-metrics
  • node exporter
  serviceMonitor:
    ...
    relabelings:
      - sourceLabels: [__meta_kubernetes_pod_node_name]
        targetLabel: node
    ...

additionalScrapeConfigs

Istio のテレメトリをスクレイプするようにadditionalScrapeConfigsを追加。

additionalScrapeConfigs:
  # Mixer scrapping. Defaults to Prometheus and mixer on same namespace.
  #
  - job_name: "istio-mesh"
    kubernetes_sd_configs:
      - role: endpoints
        namespaces:
          names:
            - istio-system
    relabel_configs:
      - source_labels:
          [__meta_kubernetes_service_name, __meta_kubernetes_endpoint_port_name]
        action: keep
        regex: istio-telemetry;prometheus
  # Scrape config for envoy stats
  - job_name: "envoy-stats"
    metrics_path: /stats/prometheus
    kubernetes_sd_configs:
      - role: pod

    relabel_configs:
      - source_labels: [__meta_kubernetes_pod_container_port_name]
        action: keep
        regex: ".*-envoy-prom"
      - source_labels:
          [__address__, __meta_kubernetes_pod_annotation_prometheus_io_port]
        action: replace
        regex: ([^:]+)(?::\d+)?;(\d+)
        replacement: $1:15090
        target_label: __address__
      - action: labeldrop
        regex: __meta_kubernetes_pod_label_(.+)
      - source_labels: [__meta_kubernetes_namespace]
        action: replace
        target_label: namespace
      - source_labels: [__meta_kubernetes_pod_name]
        action: replace
        target_label: pod_name

Kiali の Prometheus 向き先

spec:
  ...
  values:
  ...
    kiali:
    ...
      prometheusAddr: http://prometheus.monitoring.svc.cluster.local:9090

Jaeger/ZIPKIN の向き先

//TODO

env:
  - name: ZIPKIN
    value: zipkin.jaeger.svc.cluster.local

Jmeter