본문 바로가기
네트워크 장애처리(트러블슈팅) 사례

Uplink 포트 잘 봐야합니다

by 우진아빠의 네트워크 실무 2022. 12. 4.
728x90
반응형
SMALL

Uplink 포트 잘 봐야합니다.

필자가 근무하는 기관의 1층 강의장에서 인터넷이 안된다고 연락이 왔다.  1층에 고작 1대이다. NMS상에는 장애가 발생한것이 보이지 않는다. 그래서 강의장 PC자체라고 생각을 하였는데...자꾸 전화오는게 계속 1층에만 연락이 온다. 좀 이상하다는 생각이 들었다. 뭐지???  ......조금 있다가 또 1층에 장애가 발생했다고 연락이 온다.

 

해당 건물의 네트워크 구성도

아....이건 좀 이상하다라고 생각을 했고, Switch를 다 뒤져본다. L3부터 문제가 일어나는 L2 스위치까지 다 뒤져봤다. 근데,  전혀 이상한 낌새가 보이지 않는다.  약간 의심이 드는게 L2 Switch에 접속해서 명령어를 내려보니까, 조금 버벅거리는 느낌외에는 느껴지지 않는다. 어....이상하다. 하지만 원인을 곧 찾았다. 헐......

장애의 원인이 되는 Uplink 포트의 속도를 보시라....겨우 10M....ㅠㅠ

일단 10M라도 통신을 하고 있으니 NMS상에서는 장애로 인식을 못 했던거다. ping도 되고 원격접속 (ssh)도 되니까 장애라고 보기엔 힘든거였다. L3에서 show int status로 찾았던 것이다. 그래도 5분만에 찾아내서 금방 조치를 했다.

Uplink 포트의 불량으로 인해서 10M로 인식되니까...해당 Uplink 포트에 엄청난 부하가 발생했던 것이었다. 당연히 통신은 되지만 해당 포트에 병목이 일어나니까 해당 L2  Switch에 연결되어 있는 강의실은 모두 장애가 발생했던것은 아주 당연한 일이었다. 경험으로 판단해보건데 저건 절대로 케이블 불량은 아니라는 생각이 들었다. 포트 불량....헐....

그래서 해당 Uplink용 케이블을 다른 포트로 옮기고 나니 즉시 해결되었다. 바로 1000M 뜬다.  장애신고가 왔던 강의실도 다 잘된다고 한다.

다른 포트로 Uplink 포트를 옮긴 후 정상적으로 동작하는 화면

이번에도 뼈져리게 느껴본다. 역시 대규모 네트워크를 관리하려면 snmp를 지원하는 Switch로 구성해야하고, 원격접속이 되지 않으면  이거 원인 찾으려면 정말 힘들다는 생각이 들었다. 아마 못 찾을꺼다. 그럼 민원에 계속해서 시달리는 거고...

그래서 네트워크 관리자는 힘들다. 좀 알고 네트워크를 잘 사용해줬으면 한다. 이런 예상하지 못한 장애가 발생하게 되면 원인을 찾는 것이 힘들고, 원인만 찾으면 해결은 정말 금방이다. 그런 원인을 빨리 찾으려면 역시 장비빨이다. 

조금 비싸더라도 네트워크 관리자가 원하는 장비로 사달라 이 이야기를 하고 싶다. 싸구려 사주지 말고. 싸구려 사주고 나면 나중에 장애나면 못 찾는다. 그래놓고  나한테 욕하지 말라는 이야기다. 한번씩 정말 화가 날때도 있다. 싸구려 사주고 나서 장애나면 내가 관리를 못해서 고장났다고 덮어씌우면 정말 계급장 떼고 한판 붙을까 하는 생각도 든다.

그래도, 요즘은 필자가 이 기관에서 근무한지 20년이 넘은 상태라서 나도 나름 짠밥 많이 먹었다. 필자가 사달라고 하는 장비는 그래도 잘 사주는 편이다. 예전에는 정말 택도 없었다. 그래서 결국에는 필자가 다 걷어내는데 성공했지만, 그렇게 되면 그게 다 예산낭비가 아니겠는가? 인프라가 되는 장비는 해당 기관의 특성에 맞게 구매하는 게 절대적으로 옳다고 생각하고, 그 결정은 담당자가 하는것이다. 왜 담당이 필요하겠는가? 조금 돌이켜볼 문제라고 생각한다.

https://www.youtube.com/watch?v=_ohd40TBIXU&list=PLAqJhdb8Bd4GvvijYPxDguS60P_ZLiuDw&index=1

필자가 제작한 유튜브 영상이다

오늘 주저리 주저리 글을 써본다. 그러면서 오늘의 포스팅을 마친다.

 

 

 

728x90
반응형
LIST

댓글