監控工程萬建電子介紹監控知識:
1、監控方法
1.了解(jie)監控對象(xiang)(xiang):我(wo)們(men)要監控的(de)對象(xiang)(xiang)你是否(fou)了解(jie)呢?比如CPU到底(di)是如何工作的(de)?
2.性能基準指標:我們要監控這個東(dong)西(xi)的(de)什么(me)屬(shu)性?比如CPU的(de)使(shi)用率、負載、用戶態、內核態、上下文切(qie)換。
3.報警閾值定(ding)義:怎么樣(yang)才算(suan)是故障(zhang),要(yao)報警呢?比(bi)如CPU的(de)負載到底多少(shao)算(suan)高,用戶態、內(nei)核態分別跑多少(shao)算(suan)高?
4.故(gu)障處(chu)理(li)流(liu)程:收到了故(gu)障報警,那(nei)么(me)我(wo)們(men)怎么(me)處(chu)理(li)呢?有什么(me)更高(gao)效的處(chu)理(li)流(liu)程嗎?
2、監控核心
1.發現問題:當系統(tong)發生故(gu)障(zhang)報警(jing),我們會收到故(gu)障(zhang)報警(jing)的信息
2.定位(wei)問題(ti)(ti):故(gu)(gu)障(zhang)郵件(jian)一(yi)般(ban)都會寫(xie)某某主機故(gu)(gu)障(zhang)、具體(ti)故(gu)(gu)障(zhang)的(de)內(nei)容,我們(men)需(xu)要對報警內(nei)容進行分析,比如一(yi)臺(tai)服務(wu)器連不上:我們(men)就(jiu)需(xu)要考慮(lv)是(shi)網絡問題(ti)(ti)、還是(shi)負(fu)載太高導致長時間(jian)無法連接,又(you)或者某開發(fa)觸發(fa)了防火墻禁(jin)止的(de)相關策略(lve)等等,我們(men)就(jiu)需(xu)要去分析故(gu)(gu)障(zhang)具體(ti)原因。
3.解(jie)決問題:當然我們了解(jie)到(dao)故障的原因后,就(jiu)需要通過故障解(jie)決的優先級(ji)去解(jie)決該故障。
4.總(zong)結(jie)問題:當(dang)我(wo)們解決完重(zhong)(zhong)大(da)故(gu)障后(hou),需要對故(gu)障原因以(yi)及防范進行(xing)總(zong)結(jie)歸納,避免以(yi)后(hou)重(zhong)(zhong)復出現。