티스토리 뷰

[에러내용]

Jan 13 09:58:10 ocpmaster1 atomic-openshift-node[9799]: F0113 09:58:10.708454    9799 start_node.go:126] cannot fetch "default" cluster network: Get https://ocpmgmt.ocp.com/oapi/v1/clusternetworks/default: x509: certificate is valid for kubernetes, kubernetes.default, kubernetes.default.svc, kubernetes.default.svc.cluster.local, localhost, openshift, openshift.default, openshift.default.svc, openshift.default.svc.cluster.local, 10.1.25.12, 127.0.0.1, 172.30.0.1, 192.168.3.1, not ocpmgmt.ocp.com


[발생 원인]

master-config.yaml 의 podEviction 수정 후 적용하는 단계 중 잘못된 파일로 엎어치게 되어, invalid certification error 발생.

/etc/origin/master 안의 yaml , cert 파일 변경으로 인해 node 프로세스 기동 불가


# wrong command

openshift start master --write-config=/openshift.local.config/master/



[문제현상]

1. GUI console 정상 접속 불가

2. systemctl start atomin-openshift-node 불가

3. oc command 에러 

# oc get all

Unable to connect to the server: x509: certificate is valid for kubernetes, kubernetes.default, kubernetes.default.svc, kubernetes.default.svc.cluster.local, localhost, openshift, openshift.default, openshift.default.svc, openshift.default.svc.cluster.local, 10.1.25.13, 127.0.0.1, 172.17.0.1, 172.30.0.1, not ocpmgmt.ocp.com 

4. key, yaml 파일 변경(구축시점 16-12-09 에서 17-01-12로 변경)

-rw-r--r--. 1 root root   1070 Jan 12 15:32 ca-bundle.crt

-rw-r--r--. 1 root root   2534 Jan 12 15:32 master.server.crt

-rw-------. 1 root root   1675 Jan 12 15:32 master.server.key

-rw-r--r--. 3 root root      2 Jan 12 15:32 ca.serial.txt

-rw-------. 1 root root   1675 Jan 12 15:32 etcd.server.key

-rw-r--r--. 1 root root   2534 Jan 12 15:32 etcd.server.crt

-rw-r--r--. 1 root root 169892 Jan 12 15:32 policy.json

-rw-------. 3 root root   5622 Jan 12 18:58 admin.kubeconfig

-rw-------. 1 root root   5678 Jan 12 18:59 openshift-master.kubeconfig

-rw-------. 3 root root   5690 Jan 12 19:00 openshift-registry.kubeconfig

-rw-------. 3 root root   5674 Jan 12 19:00 openshift-router.kubeconfig

-rw-------. 1 root root   4521 Jan 12 19:11 master-config.yaml.bak

-rw-------. 1 root root   4521 Jan 12 19:16 master-config.yaml 



[해결방법]

wirte-config 시 기존 config 설정 백업? ---> 불명확

/etc/origin/generated-configs 경로에 master1을 제외한 configration backup 파일이 존재 ---> 생성된 방법 불명확

drwx------.  2 root root  4096 Dec  9 14:48 master-ocpmaster2.ocp.com

-rw-r--r--.  1 root root 32329 Dec  9 14:48 master-ocpmaster2.ocp.com.tgz

drwx------.  2 root root  4096 Jan 12 18:54 master-ocpmaster3.ocp.com

-rw-r--r--.  1 root root 33312 Dec  9 14:48 master-ocpmaster3.ocp.com.tgz

drwxr-xr-x.  2 root root  4096 Dec  9 14:55 node-ocpmaster1.ocp.com

-rw-r--r--.  1 root root  8845 Dec  9 14:55 node-ocpmaster1.ocp.com.tgz

drwxr-xr-x.  2 root root  4096 Dec  9 14:55 node-ocpmaster2.ocp.com

-rw-r--r--.  1 root root  8851 Dec  9 14:55 node-ocpmaster2.ocp.com.tgz

drwxr-xr-x.  2 root root  4096 Dec  9 14:55 node-ocpmaster3.ocp.com

-rw-r--r--.  1 root root  8848 Dec  9 14:55 node-ocpmaster3.ocp.com.tgz

drwxr-xr-x.  2 root root  4096 Dec  9 14:55 node-ocpnode1.ocp.com

-rw-r--r--.  1 root root  8608 Dec  9 14:55 node-ocpnode1.ocp.com.tgz

drwxr-xr-x.  2 root root  4096 Dec  9 14:55 node-ocpnode2.ocp.com

-rw-r--r--.  1 root root  8615 Dec  9 14:55 node-ocpnode2.ocp.com.tgz

drwxr-xr-x.  2 root root  4096 Dec  9 14:55 node-ocpnode3.ocp.com

-rw-r--r--.  1 root root  8624 Dec  9 14:55 node-ocpnode3.ocp.com.tgz 


해당 서버의 백업파일로 원복하여 master, node 서버 프로세스 재기동 ---> 정상 접속 완료

* master 서버별 configration 백업 필요

  etcd 데이터 백업 필요



* EAP7의 jconsole 실행 시 다음과 같이 정상동작 불가 (위의 에러와 연관된 부분이 있을지 확인 필요)


공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함