cd.sh oom deployment script
[logging-analytics.git] / deploy / cd.sh
1 #!/bin/bash
2 #############################################################################
3 #
4 # Copyright © 2018 Amdocs, Bell.
5 #
6 # Licensed under the Apache License, Version 2.0 (the "License");
7 # you may not use this file except in compliance with the License.
8 # You may obtain a copy of the License at
9 #        http://www.apache.org/licenses/LICENSE-2.0
10 #
11 # Unless required by applicable law or agreed to in writing, software
12 # distributed under the License is distributed on an "AS IS" BASIS,
13 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
14 # See the License for the specific language governing permissions and
15 # limitations under the License.
16 #
17 #############################################################################
18 # v20180318
19 # https://wiki.onap.org/display/DW/ONAP+on+Kubernetes
20 # source from https://jira.onap.org/browse/OOM-715, 716, 711
21 # Michael O'Brien
22 #
23
24 usage() {
25   cat <<EOF
26 Usage: $0 [PARAMs]
27 example 
28 ./cd.sh -b amsterdam -e onap (will rerun onap in the onap namespace, no new repo, no deletion of existing repo, no sdnc workaround, no onap removal at the end
29 ./cd.sh -b master -e onap -c true -d true -w true -r true (run as cd server, new oom, delete prev oom, run workarounds, clean onap at the end of the script
30 ./cd.sh -b master -e onap -c true -d false -w true -r false (standard new server/dev environment - use this as the default)
31
32 -u                  : Display usage
33 -b [branch]         : branch = master or amsterdam (required)
34 -e [environment]    : use the default (onap)
35 -c [true|false]     : FLAG clone new oom repo (default: true)
36 -d [true|false]     : FLAG delete prev oom - (cd build) (default: false)
37 -w [true|false]     : FLAG apply workarounds  IE: sdnc (default: true)
38 -r [true|false]     : FLAG remove oom at end of script - for use by CD only (default: false)
39 EOF
40 }
41
42 deploy_onap() {
43   
44   echo "$(date)"
45   echo "running with: -b $BRANCH -e $ENVIRON -c $CLONE_NEW_OOM -d $DELETE_PREV_OOM -w $APPLY_WORKAROUNDS -r $REMOVE_OOM_AT_END"
46   echo "provide onap-parameters.yaml(amsterdam) or values.yaml(master) and aai-cloud-region-put.json"
47   #exit 0
48   # fix virtual memory for onap-log:elasticsearch under Rancher 1.6.11 - OOM-431
49   sudo sysctl -w vm.max_map_count=262144
50   if [[ "$DELETE_PREV_OOM" != false ]]; then
51     echo "remove existing oom"
52     # master/beijing only - not amsterdam
53     if [ "$BRANCH" == "master" ]; then
54       kubectl delete namespace $ENVIRON
55       kubectl delete namespace dcae
56       kubectl delete namespace dev
57       sudo helm delete --purge dev
58       sudo helm delete --purge $ENVIRON
59       sudo helm delete --purge onap
60       sudo helm delete --purge dcae
61     else
62       oom/kubernetes/oneclick/deleteAll.bash -n $ENVIRON
63     fi
64
65     sleep 1
66     # verify
67     DELETED=$(kubectl get pods --all-namespaces -a | -E '0/|1/2' | wc -l)
68     echo "verify deletion is finished."
69     while [  $(kubectl get pods --all-namespaces | grep -E '0/|1/2' | wc -l) -gt 0 ]; do
70       sleep 15
71       echo "waiting for deletions to complete"
72     done
73     # wait for 0/1 before deleting
74     echo "sleeping 30 sec"
75     # delete potential hanging clustered pods
76     kubectl delete pod $ENVIRON-aaf-sms-vault-0 -n $ENVIRON --grace-period=0 --force
77     kubectl delete pod $ENVIRON-aai-cassandra-0 -n $ENVIRON --grace-period=0 --force
78     kubectl delete pod $ENVIRON-aai-cassandra-1 -n $ENVIRON --grace-period=0 --force
79     kubectl delete pod $ENVIRON-aai-cassandra-2 -n $ENVIRON --grace-period=0 --force
80     # specific to when there is no helm release
81     kubectl delete pv --all
82     kubectl delete clusterrolebinding --all
83     # replace with watch
84     # keep jenkins 120 sec timeout happy with echos
85     sleep 30
86     echo "List of ONAP Modules - look for terminating pods"
87     LIST_ALL=$(kubectl get pods --all-namespaces --show-all -o wide )
88     echo "${LIST_ALL}"
89
90     # for use by continuous deployment only
91     echo " deleting /dockerdata-nfs"
92     sudo chmod -R 777 /dockerdata-nfs/onap
93     sudo chmod -R 777 /dockerdata-nfs/dev
94     rm -rf /dockerdata-nfs/onap
95     rm -rf /dockerdata-nfs/dev
96   fi
97   # for use by continuous deployment only
98   if [[ "$CLONE_NEW_OOM" != false ]]; then
99     rm -rf oom
100     echo "pull new oom"
101     git clone -b $BRANCH http://gerrit.onap.org/r/oom
102   fi
103
104   if [ "$BRANCH" == "master" ]; then
105     echo "moving values.yaml to oom/kubernetes/"
106     #sudo cp values.yaml oom/kubernetes/onap
107   else
108     echo "start config pod"
109     # still need to source docker variables
110     source oom/kubernetes/oneclick/setenv.bash
111     #echo "source setenv override"
112     echo "moving onap-parameters.yaml to oom/kubernetes/config"
113     cp onap-parameters.yaml oom/kubernetes/config
114     cd oom/kubernetes/config
115     ./createConfig.sh -n $ENVIRON
116     cd ../../../
117     echo "verify onap-config is 0/1 not 1/1 - as in completed - an error pod - means you are missing onap-parameters.yaml or values are not set in it."
118     while [  $(kubectl get pods -n onap -a | grep config | grep 0/1 | grep Completed | wc -l) -eq 0 ]; do
119       sleep 15
120       echo "waiting for config pod to complete"
121     done
122   fi
123
124   # usually the prepull takes up to 25-300 min - however hourly builds will finish the docker pulls before the config pod is finished
125   #echo "pre pull docker images - 35+ min"
126   #wget https://jira.onap.org/secure/attachment/11261/prepull_docker.sh
127   #chmod 777 prepull_docker.sh
128   #./prepull_docker.sh
129   echo "start onap pods"
130   if [ "$BRANCH" == "master" ]; then
131     cd oom/kubernetes/
132     sudo make clean
133     sudo make all
134     sudo make onap
135     sudo helm install local/onap -n onap --namespace $ENVIRON
136     cd ../../
137   else
138     cd oom/kubernetes/oneclick
139     ./createAll.bash -n $ENVIRON
140     cd ../../../
141   fi
142
143   echo "wait for all pods up for 15-80 min"
144   FAILED_PODS_LIMIT=0
145   MAX_WAIT_PERIODS=480 # 120 MIN
146   COUNTER=0
147   PENDING_PODS=0
148   while [  $(kubectl get pods --all-namespaces | grep -E '0/|1/2' | wc -l) -gt $FAILED_PODS_LIMIT ]; do
149     PENDING=$(kubectl get pods --all-namespaces | grep -E '0/|1/2' | wc -l)
150     PENDING_PODS=$PENDING
151     sleep 15
152     LIST_PENDING=$(kubectl get pods --all-namespaces -o wide | grep -E '0/|1/2' )
153     echo "${LIST_PENDING}"
154     echo "${PENDING} pending > ${FAILED_PODS_LIMIT} at the ${COUNTER}th 15 sec interval"
155     echo ""
156     COUNTER=$((COUNTER + 1 ))
157     MAX_WAIT_PERIODS=$((MAX_WAIT_PERIODS - 1))
158     if [ "$MAX_WAIT_PERIODS" -eq 0 ]; then
159       FAILED_PODS_LIMIT=800
160     fi
161   done
162
163   echo "report on non-running containers"
164   PENDING=$(kubectl get pods --all-namespaces | grep -E '0/|1/2')
165   PENDING_COUNT=$(kubectl get pods --all-namespaces | grep -E '0/|1/2' | wc -l)
166   PENDING_COUNT_AAI=$(kubectl get pods -n $ENVIRON | grep aai- | grep -E '0/|1/2' | wc -l)
167   if [ "$PENDING_COUNT_AAI" -gt 0 ]; then
168     echo "down-aai=${PENDING_COUNT_AAI}"
169   fi
170
171   # todo don't stop if aai is down
172   PENDING_COUNT_APPC=$(kubectl get pods -n $ENVIRON | grep appc- | grep -E '0/|1/2' | wc -l)
173   if [ "$PENDING_COUNT_APPC" -gt 0 ]; then
174     echo "down-appc=${PENDING_COUNT_APPC}"
175   fi
176   PENDING_COUNT_MR=$(kubectl get pods -n $ENVIRON | grep message-router- | grep -E '0/|1/2' | wc -l)
177   if [ "$PENDING_COUNT_MR" -gt 0 ]; then
178     echo "down-mr=${PENDING_COUNT_MR}"
179   fi
180   PENDING_COUNT_SO=$(kubectl get pods -n $ENVIRON | grep so- | grep -E '0/|1/2' | wc -l)
181   if [ "$PENDING_COUNT_SO" -gt 0 ]; then
182     echo "down-so=${PENDING_COUNT_SO}"
183   fi
184   PENDING_COUNT_POLICY=$(kubectl get pods -n $ENVIRON | grep policy- | grep -E '0/|1/2' | wc -l)
185   if [ "$PENDING_COUNT_POLICY" -gt 0 ]; then
186     echo "down-policy=${PENDING_COUNT_POLICY}"
187   fi
188   PENDING_COUNT_PORTAL=$(kubectl get pods -n $ENVIRON | grep portal- | grep -E '0/|1/2' | wc -l)
189   if [ "$PENDING_COUNT_PORTAL" -gt 0 ]; then
190     echo "down-portal=${PENDING_COUNT_PORTAL}"
191   fi
192   PENDING_COUNT_LOG=$(kubectl get pods -n $ENVIRON | grep log- | grep -E '0/|1/2' | wc -l)
193   if [ "$PENDING_COUNT_LOG" -gt 0 ]; then
194     echo "down-log=${PENDING_COUNT_LOG}"
195   fi
196   PENDING_COUNT_ROBOT=$(kubectl get pods -n $ENVIRON | grep robot- | grep -E '0/|1/2' | wc -l)
197   if [ "$PENDING_COUNT_ROBOT" -gt 0 ]; then
198     echo "down-robot=${PENDING_COUNT_ROBOT}"
199   fi
200   PENDING_COUNT_SDC=$(kubectl get pods -n $ENVIRON | grep sdc- | grep -E '0/|1/2' | wc -l)
201   if [ "$PENDING_COUNT_SDC" -gt 0 ]; then
202     echo "down-sdc=${PENDING_COUNT_SDC}"
203   fi
204   PENDING_COUNT_SDNC=$(kubectl get pods -n $ENVIRON | grep sdnc- | grep -E '0/|1/2' | wc -l)
205   if [ "$PENDING_COUNT_SDNC" -gt 0 ]; then
206     echo "down-sdnc=${PENDING_COUNT_SDNC}"
207   fi
208   PENDING_COUNT_VID=$(kubectl get pods -n $ENVIRON | grep vid- | grep -E '0/|1/2' | wc -l)
209   if [ "$PENDING_COUNT_VID" -gt 0 ]; then
210     echo "down-vid=${PENDING_COUNT_VID}"
211   fi
212
213   PENDING_COUNT_AAF=$(kubectl get pods -n $ENVIRON | grep aaf- | grep -E '0/|1/2' | wc -l)
214   if [ "$PENDING_COUNT_AAF" -gt 0 ]; then
215     echo "down-aaf=${PENDING_COUNT_AAF}"
216   fi
217   PENDING_COUNT_CONSUL=$(kubectl get pods -n $ENVIRON | grep consul- | grep -E '0/|1/2' | wc -l)
218   if [ "$PENDING_COUNT_CONSUL" -gt 0 ]; then
219     echo "down-consul=${PENDING_COUNT_CONSUL}"
220   fi
221   PENDING_COUNT_MSB=$(kubectl get pods -n $ENVIRON | grep msb- | grep -E '0/|1/2' | wc -l)
222   if [ "$PENDING_COUNT_MSB" -gt 0 ]; then
223     echo "down-msb=${PENDING_COUNT_MSB}"
224   fi
225   PENDING_COUNT_DCAE=$(kubectl get pods -n $ENVIRON | grep dcaegen2- | grep -E '0/|1/2' | wc -l)
226   if [ "$PENDING_COUNT_DCAE" -gt 0 ]; then
227     echo "down-dcae=${PENDING_COUNT_DCAE}"
228   fi
229   PENDING_COUNT_CLI=$(kubectl get pods -n $ENVIRON | grep cli- | grep -E '0/|1/2' | wc -l)
230   if [ "$PENDING_COUNT_CLI" -gt 0 ]; then
231     echo "down-cli=${PENDING_COUNT_CLI}"
232   fi
233   PENDING_COUNT_MULTICLOUD=$(kubectl get pods -n $ENVIRON | grep multicloud- | grep -E '0/|1/2' | wc -l)
234   if [ "$PENDING_COUNT_MULTICLOUD" -gt 0 ]; then
235     echo "down-multicloud=${PENDING_COUNT_MULTICLOUD}"
236   fi
237   PENDING_COUNT_CLAMP=$(kubectl get pods -n $ENVIRON | grep clamp- | grep -E '0/|1/2' | wc -l)
238   if [ "$PENDING_COUNT_CLAMP" -gt 0 ]; then
239     echo "down-clamp=${PENDING_COUNT_CLAMP}"
240   fi
241   PENDING_COUNT_VNFSDK=$(kubectl get pods -n $ENVIRON | grep vnfsdk- | grep -E '0/|1/2' | wc -l)
242   if [ "$PENDING_COUNT_VNFSDK" -gt 0 ]; then
243     echo "down-vnfsdk=${PENDING_COUNT_VNFSDK}"
244   fi
245   PENDING_COUNT_UUI=$(kubectl get pods -n $ENVIRON | grep uui- | grep -E '0/|1/2' | wc -l)
246   if [ "$PENDING_COUNT_UUI" -gt 0 ]; then
247     echo "down-uui=${PENDING_COUNT_UUI}"
248   fi
249   PENDING_COUNT_VFC=$(kubectl get pods -n $ENVIRON | grep vfc- | grep -E '0/|1/2' | wc -l)
250   if [ "$PENDING_COUNT_VFC" -gt 0 ]; then
251     echo "down-vfc=${PENDING_COUNT_VFC}"
252   fi
253   PENDING_COUNT_KUBE2MSB=$(kubectl get pods -n $ENVIRON | grep kube2msb- | grep -E '0/|1/2' | wc -l)
254   if [ "$PENDING_COUNT_KUBE2MSB" -gt 0 ]; then
255     echo "down-kube2msb=${PENDING_COUNT_KUBE2MSB}"
256   fi
257   echo "pending containers=${PENDING_COUNT}"
258   echo "${PENDING}"
259
260   echo "check filebeat 2/2 count for ELK stack logging consumption"
261   FILEBEAT=$(kubectl get pods --all-namespaces -a | grep 2/)
262   echo "${FILEBEAT}"
263   echo "sleep 5 min - to allow rest frameworks to finish"
264   sleep 300
265   echo "List of ONAP Modules"
266   LIST_ALL=$(kubectl get pods --all-namespaces -a  --show-all )
267   echo "${LIST_ALL}"
268   echo "run healthcheck 2 times to warm caches and frameworks so rest endpoints report properly - see OOM-447"
269
270   echo "curl with aai cert to cloud-region PUT"
271
272   curl -X PUT https://127.0.0.1:30233/aai/v11/cloud-infrastructure/cloud-regions/cloud-region/CloudOwner/RegionOne --data "@aai-cloud-region-put.json" -H "authorization: Basic TW9kZWxMb2FkZXI6TW9kZWxMb2FkZXI=" -H "X-TransactionId:jimmy-postman" -H "X-FromAppId:AAI" -H "Content-Type:application/json" -H "Accept:application/json" --cacert aaiapisimpledemoopenecomporg_20171003.crt -k
273
274   echo "get the cloud region back"
275   curl -X GET https://127.0.0.1:30233/aai/v11/cloud-infrastructure/cloud-regions/ -H "authorization: Basic TW9kZWxMb2FkZXI6TW9kZWxMb2FkZXI=" -H "X-TransactionId:jimmy-postman" -H "X-FromAppId:AAI" -H "Content-Type:application/json" -H "Accept:application/json" --cacert aaiapisimpledemoopenecomporg_20171003.crt -k
276
277   # OOM-484 - robot scripts moved
278   cd oom/kubernetes/robot
279   echo "run healthcheck prep 1"
280   # OOM-722 adds namespace parameter
281   if [ "$BRANCH" == "amsterdam" ]; then
282     ./ete-k8s.sh health > ~/health1.out
283   else
284     ./ete-k8s.sh $ENVIRON health > ~/health1.out
285   fi
286   echo "sleep 5 min"
287   sleep 300
288   echo "run healthcheck prep 2"
289   if [ "$BRANCH" == "amsterdam" ]; then
290     ./ete-k8s.sh health > ~/health2.out
291   else
292     ./ete-k8s.sh $ENVIRON health > ~/health2.out
293   fi
294   echo "run healthcheck for real - wait a further 5 min"
295   sleep 300
296   if [ "$BRANCH" == "amsterdam" ]; then
297     ./ete-k8s.sh health
298   else
299     ./ete-k8s.sh $ENVIRON health
300   fi
301   echo "run partial vFW"
302 #  sudo chmod 777 /dockerdata-nfs/onap
303 #  if [ "$BRANCH" == "amsterdam" ]; then
304 #    ./demo-k8s.sh init_robot
305 #  else
306 #    ./demo-k8s.sh $ENVIRON init
307 #  fi
308 #  if [ "$BRANCH" == "amsterdam" ]; then
309 #    ./demo-k8s.sh init
310 #  else
311 #    ./demo-k8s.sh $ENVIRON init
312 #  fi
313   echo "report results"
314   cd ../../../
315   
316   echo "$(date)"
317   #set +a
318 }
319
320 BRANCH=
321 ENVIRON=onap
322 APPLY_WORKAROUNDS=true
323 DELETE_PREV_OOM=false
324 REMOVE_OOM_AT_END=false
325 CLONE_NEW_OOM=true
326
327 while getopts ":u:b:e:c:d:w:r" PARAM; do
328   case $PARAM in
329     u)
330       usage
331       exit 1
332       ;;
333     b)
334       BRANCH=${OPTARG}
335       ;;
336     e)
337       ENVIRON=${OPTARG}
338       ;;
339     c)
340       CLONE_NEW_OOM=${OPTARG}
341       ;;
342     d)
343       DELETE_PREV_OOM=${OPTARG}
344       ;;
345     w)
346       APPLY_WORKAROUNDS=${OPTARG}
347       ;;
348     r)
349       REMOVE_OOM_AT_END=${OPTARG}
350       ;;
351     ?)
352       usage
353       exit
354       ;;
355   esac
356 done
357
358 if [[ -z $BRANCH ]]; then
359   usage
360   exit 1
361 fi
362
363 deploy_onap  $BRANCH $ENVIRON $CLONE_NEW_OOM $DELETE_PREV_OOM $APPLY_WORKAROUNDS $REMOVE_OOM_AT_END
364
365 printf "**** Done ****\n"