2018年9月20日 星期四

監控到 esxi 網路異常了,esxi明明就運作正常

最近
收到監控系統
傳來的 Alarm mail

告警訊息描述:
大致如下
vSwitch0(Down at least 5 min)...


就訊息來看
大致上是說,esxi上的所有 vSS 和 vDS 全掛了
當然連同上面的 vmkernel 也都掛了

但是
我到 vCenter 對這台 esxi 檢查了好幾次
vSS 正常
vDS 正常


怎麼看都正常

想說是不是監控系統異常
到監控系統
偏偏同網段的esxi都監控正常
就唯獨這台 esxi 異常
去 對這台 esxi 重新 polling 狀態
竟然還是一樣
監控系統顯示這台esxi的vSwitch全掛了

最後竟然是
esxi 內的 snmp service 掛了
導致 監控系統 poll 不到 snmp 資訊
造成誤判

處理
重啟 snmp service 就好了
點到異常的 esxi
>Configuration>Security Profile>Properties...>snmpd 
若發現 esxi 無法透過 Web 去啟用的話

就 SSH 到 esxi
手動下指令去啟用 snmp

設定 SNMP
esxcli system snmp set --communities public

啟用 SNMP
esxcli system snmp set --enable true


沒有留言:

張貼留言