본문 바로가기
네트워크 장애처리(트러블슈팅) 사례

스위치 파워장애 처리 (장비불량 발생 ㅠㅠ)

by 우진아빠의 네트워크 실무 2024. 12. 27.
728x90
반응형
SMALL

스위치 파워장애 처리 (장비불량 발생 ㅠㅠ)

필자가 근무하는 기관에는 각 건물마다 L3 스위치가 있다. 해당 건물의 게이트웨이가 되겠다. 이 L3 스위치가 장애가 발생하게 되면 필자는 아마 미쳐버릴 것이다.

그래서, 필자는 모든 건물의 L3 스위치의 장비를 전원을 갈아끼울수도 있고 전원이 2개가 연결되도록 파워이중화를 구현했다. 전원이 이중화이니 1개가 고장나도 전혀 발생하지 않으며 고장난 파워모듈을 A/S 보내면 된다. 네트워크를 운영하는데 굉장히 효율적이라고 보시면 되겠다. 이해가 잘 안가는 분들을 위해서 그림으로 설명드리겠다.

보통 스위치의 경우이다

위 그림처럼 보통의 스위치 같은 경우에는 파워모듈이 내장되어 있어서 분해가 불가능하며 파워가 고장나면 바로 교체를 진행하는 것이 훨씬 빠르다.

이렇게 전원을 이중화 해놓으면 훨씬 더 유리하다

더욱더 좋은 것은 핫스왑(전원이 들어와있는 상태에서 연결가능)이 지원되며 위 전원이 분리가 된다는 것이다. 2개다 파워가 나갔을때 다른 건물에서 동일한 기종의 파워만 분리해서 연결하면 즉시 복구가 된다는 엄청난 장점이 존재한다.

우선 필자가 장비를 설치하기 전에 영상을 찍어놓은 것이 있어서 이해를 올려드리기 위해서 영상을 올려드리겠다. 아마 왜 필자가 이런 제품군을 선호하게 되었는지를 이해하실 것이다.

https://youtu.be/qi1GsYHgZOg

이렇게 분리가 되면 굉장히 편리하다. 그런데, 이런 파워들도 장애가 발생한다. ㅠㅠ 뭐...어쩔 수 없다.

실제로 필자가 겪은 일을 썰로 풀어보자.

한 건물의 L3 스위치에 접속을 해보자.

명령어를 줘보자.

Switch#show enviroment power를 하면 되겠다.

이렇게 정상이다.

이렇게 되어야 정상이고...이렇게 매일 체크를 해주어야만 하는 것이 네트워크 관리자의 숙명이자 업무이다.

헐...1개가 장애가 발생하였다.

일단 장애가 발생하였으니 해당 파워모듈이 불량인지 장비 자체가 불량인지 확인을 하여야 한다. single로 운영되다보니 굉장히 불안한 것은 사실이다. 위 건물에서 아무거나 1개를 빼왔다. 그래도, 전혀 상관이 없다. 장애가 발생한 파워모듈 1A를 제거하고 다른 건물에서 빼온것을 연결해도 결과는 똑같다. 헐...파워모듈이 아닐 가능성이 굉장히 높다. 

그렇다면 장애가 발생한 파워모듈을 아까 파워모듈을 뺴온 건물에 다시 장착해보자. 헐....정상적으로 동작한다. 

이미지출처: 구글

이런 젠장!!! 장비 불량이 확실하다. 이건 공지를 올리고 장비교체를 하루 빨리 진행하는 것이 옳다고 본다.

그래서, 새 장비를 꺼내서 새롭게 설정하고 남들 다 쉬는 휴일에 작업을 진행하기로 하였다. 밑에 직원한테도 이야기를 하였다. 괜히 업무시간중에 장애나서 난리치는 것보다 그냥 우리가 희생하는 것이 속편하고 욕도 안 얻어먹는다고 했다.

벌써 전산밥 먹은지 23년이 넘어가지만 평소에도 일하고 휴일에도 일을 해야하는 것이 전산직렬의 비애가 아닐까 싶다.

상세한 내용은 필자가 제작한 영상으로 봐주셨으면 한다.

https://youtu.be/lTMD-2Kr4Vg

전산관련으로 일하시는 분들께 조금이나마 위안이 되었으면 하는 바램으로 오늘의 포스팅을 마친다.

 

 

 

728x90
반응형
LIST

댓글