[서론 정보]
장비 모델 : C9800-401
영향 수준 : 3 [방치하면 한 번씩 짜증날 수 있음]
내용 요약 :
잘못된 WNCd 로드밸런싱으로 인한 부하 발생으로 L1, L2 쓰로틀링 발생과 이로 인한 사용자 AAA 인증 지연 등 무선 경험(품질) 악화 발생
해결 방법 :
현재 WLC 모델에 따라 가능한 WNCd 개수의 N배로 맞춰 Site Tag 추가 및 AP 분배
[본론]
확인 방법 :
1. show logging으로 다음과 같은 log들의 발생 확인 가능
%EWLC_INFRA_MESSAGE-4-EWLC_CAC_WARNING_MSG: Chassis 1 R0/0: wncd: CPU Utilization is at 88%, applying L2 throttling
%EWLC_INFRA_MESSAGE-4-EWLC_CAC_WARNING_MSG: Chassis 1 R0/0: wncd: CPU Utilization is at 85%, applying L1 throttling
%EWLC_INFRA_MESSAGE-6-EWLC_CAC_INFO: Chassis 1 R0/0: wncd: CPU Utilization is down at 76%, turning off throttling
2-1. show processes cpu platform sorted 커맨드로 실제 Linux 커널단에서의 CPU 사용률 확인 가능

2-2. 또는, GUI 하단에서 Core별 사용률 정보 확인 가능 (CPU Utilization 우측의 파란 글씨로 Click here라 되어있는 부분 클릭)

해결 방법 :
1. Site Tag를 추가로 생성하여 AP에 매핑시키기 (이상적인 Site Tag 개수는 C9800 모델별로 지원되는 WNCd 개수의 N배)

2. 전체 AP 개수를 Site Tag 개수로 나눠 평등하게 분배하기 (단, Site Tag로 동일 로밍 도메인 여부를 확인하므로, 같은 건물/층에 위치한 AP는 동일한 Site Tag를 사용할 것을 권장함)
2-1. 단, Site별로 평등하게 분배하기 어려운 경우 Site Tag에 Load 값을 설정하여 WNCd 로드밸런싱이 보다 똑똑하게 이루어지게끔 할 수 있음 (이 경우 Load값으로는 AP의 개수를 사용하는 것이 일반적임)2 3
2-1-1. 단, Load값 설정을 통한 로드밸런싱의 경우 WLC Reload 후에 반영됨에 유의할 것
[잡담]
Cisco에서는 Site Tag마다 설정되는 AP의 개수를 500대 이하로 할 것을 권고하고 있습니다. 이는 어떤 C9800 모델이든 간에 공통으로 권고하기 위한 의도4가 다분하지만, 일정 개수 이상으로 넘어가면 온전한 성능을 내기 어려워지는 것 또한 사실이죠.
재미난 점은 Site Tag당 최대로 Mapping할 수 있는 AP의 개수가 모델별로 다른데, C9800-40의 경우 Site Tag 하나에 AP 800대를 설정할 수 있다고 문서에 나와있지만 실제로는 794대 정도 설정하면 Site Tag에 Mapping할 수 없다는 오류 로그가 나타납니다.
분명 로그 사진을 찍어놓았던 거 같은데 어째서인지 보이질 않네요. 삶이란 게 다 그런 것 같습니다. 그러니 열심히 기록을 남겨야겠죠…
그나저나 17.12.x부터 RF 기반 자동 AP 로드밸런싱 기능이 추가되었는데, 신규 구축 건이 있지 않는 이상 테스트 겸 결과를 확인해볼 방법이 없네요.
[각주]
- 발견 모델이 C9800-40이라 그렇게 작성하였으나, 실제로는 모든 C9800 모델에서 발생할 수 있는 이슈입니다. ↩︎
- Load값을 통한 로드밸런싱 기능은 IOS-XE 17.09.03 이후 버전부터 가능합니다. ↩︎
- 참고문서 : C9800 Software Configuration Guide, IOS-XE 17.9.X ↩︎
- 다만 Local Mode (Central Switching Mode)에 한정됩니다. ↩︎

답글 남기기