공유 하고 있는 시스템에서 오류가 발생하여 심각한 운영 문제가 발생했다. 급한 마음에 해당 시스템에 대한 현상을 분석하고 확인하는데, 간혹 아니 생각보다 자주 **까마귀 날자 배 떨어지는** 현상을 이야기한다.
회사 내 시스템 중 HTTP -> HTTPS로 변환해주는 시스템 안에 Docker가 있다. Docker의 컨테이너 중 Wordpress가 있는데, 이 버전이 매우 낮은 상태였다. 그래서 이미지를 업데이트하고 컨테이너를 재 실행 했다. 그런데, 이상하게 Docker의 서비스가 제대로 올라오지 않는 것이였다. Docker만 재 실행하면 될 것 같았지만, 제어용 UI에서는 그 부분이 없어 부득이 시스템 자체를 재시작해야 했다.
대략 4~5분의 재부팅 시간 후에 모든 시스템이 연결되는 것을 확인하고, 내 쪽에서 발생된 Docker 문제도 해결을 했다.
그리고 1시간 후.... 갑자기 Git 동작이 안된다고 한다. Git에서 HTTPS로 전환할 때, 이 서버를 게이트웨이로 이용하는데, Commit이 비정상인 이유가 내가 재시작한 부분의 문제가 아니냐며 의견을 제시한다.
그럴 수 있을 것 같아서, 이번엔 내가 git 을 이용해 clone을 해봤다. clone이 되었다. 연결 문제는 아닌 것 같아, 이번에는 commit을 해봤다. comit이 안된다.
내 재시작 문제로 인해 발생되는 문제가 아님을 생각했고, 이번에는 git 서버 쪽을 확인했다. 그러다가 문득, 소스 원본을 저장하는 디렉토리인 repo 부분을 보니, git 서버가 동작하는 계정이 아닌 전혀 다른 계정으로 모든 권한이 바뀌어 있었다. 775 의 권한을 가지고 있으니, read는 되나, write가 되지 않는다. git 계정/그룹이 아니니까.
그래서 git 서버 동작에 해당하는 계정/그룹으로 모두 변경했고, 이 이슈는 해결 되었다.
위의 스토리를 보면 뭐 그럴 수도 있지 라고 생각은 든다.
그런데, 저런 형태를 가만히 보면, 딱 마녀 사냥의 모습을 띈다.
현재 상황만 파악하고, 그 근본 이유를 차근히 밟는 작업이 아니고, 지금 당장 누군가가 무슨일을 했는지 상관 없이 변경 사항은 그거 뿐이니 니가 문제 일으킨거 아니냐식의 문제 파악 떠넘기기다.
왜 발생했을까, 어떻게 발생했을까의 근원적 문제가 아니라, 그저 현재 상태와 이전 로그만으로 잘잘못을 결정하고, 알아서 해결하라는 문제다.
물론 시스템을 잘 모르고 분석이 어려운 상황이거나, 아예 시스템 내부를 확인하기 어려운 블랙박스 상태면 그럴 수는 있다.
하지만, 아무리 그럴 수 있는 상황이라고 하더라도, 스스로 확인해보고, 스스로 어떤 문제가 있는지 먼저 파악했어야 하지 않나? 더욱이 저 문제 부분에서 주기적으로 이전에도 발생했다고 한다. 그러면 그 때 발생한 문제를 나에게 떠 넘긴건 아닌가 싶다. 그 때도 해결을 못하고 넘어간 뒤, 이번에 재 확인 후 나에게 떠넘긴 느낌.
몸도 마음도 피폐해진 상황에서 저런 사소한 것들도 이제는 전부 밟히는 것 같다.
스스로 반성들을 하면 좋겠지만, 블로그에만 나의 짜증을 남기고 그냥 뭏어버린다.
굳이 그 상대나 조직에게 더 나은 방향이라고 주장하고 다음에는 좀 잘하자라고 하기엔 이제 진짜 에너지가 없다.
지친다.
728x90