了解zabbix,有必要了聊一下監(jiān)控系統(tǒng)相關(guān)內(nèi)容
企業(yè)中常用的開(kāi)源監(jiān)視系統(tǒng)目前有 cacti、Nagios、Open-Falcon、zabbix、prometheus等
/1、能夠及時(shí)發(fā)現(xiàn)故障、及時(shí)處理、降低損失
/2、另一方面降低運(yùn)維人員的工作量
/3、監(jiān)控對(duì)象幾乎涵蓋所有服務(wù)程序 { 服務(wù)器的硬件:CPU使用率 / 負(fù)載、內(nèi)存使用率 / 空閑情況、磁盤(pán)使用情況等
服務(wù)器性能:帶寬 IO、磁盤(pán) IO、進(jìn)程等
網(wǎng)絡(luò)服務(wù):不同服務(wù)的運(yùn)行情況等
當(dāng)前業(yè)務(wù):訪問(wèn)量、發(fā)貨狀態(tài)、成交量、正在支付的用戶量等
網(wǎng)絡(luò)設(shè)備,及應(yīng)用程序等 }
在系統(tǒng)構(gòu)建時(shí),通常不允許未被監(jiān)控的系統(tǒng)或應(yīng)用上線,因?yàn)槲幢槐O(jiān)控的系統(tǒng)存在不可預(yù)知性,故障未知性等不穩(wěn)定因素,且無(wú)法及時(shí)被發(fā)現(xiàn)并排除。這對(duì)整個(gè)架構(gòu)或系統(tǒng)都是很大的風(fēng)險(xiǎn)隱患,所以原則上需要對(duì)整個(gè)架構(gòu)或系統(tǒng)進(jìn)行監(jiān)控,隨時(shí)監(jiān)測(cè)各方面指標(biāo)正常與否,提高系統(tǒng)穩(wěn)定性。
· 數(shù)據(jù)采樣 :周期性的獲取某個(gè)被監(jiān)測(cè)指標(biāo)的相關(guān)數(shù)據(jù)
· 數(shù)據(jù)存儲(chǔ) :將采集的數(shù)據(jù)存儲(chǔ)在指定的存儲(chǔ)系統(tǒng),zabbix默認(rèn)是MySQL
· 數(shù)據(jù)展示 :直觀的展示在用戶面前,可將采集的數(shù)據(jù)做二次處理,做成各類圖形
· 報(bào)警 :當(dāng)監(jiān)控指標(biāo)出現(xiàn)異常時(shí)需要實(shí)時(shí)發(fā)出告警信息,必要情況可自行修復(fù)等
基于WEB界面的提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級(jí)的開(kāi)源解決方案,目前大部分企業(yè)公司均有使用
官方手冊(cè)https://www.zabbix.com/documentation/4.0/zh/manual……支持中文版
zabbix 是一個(gè)高度集成的網(wǎng)絡(luò)監(jiān)控套件,通過(guò)一個(gè)軟件包就可提供諸多特性
/1、數(shù)據(jù)收集 :通過(guò) snmp 、ssh 、telnet 、agent 、ipmi 、jmx 、等通道采集被監(jiān)控?cái)?shù)據(jù)的數(shù)據(jù)。詳情點(diǎn)擊
/2、實(shí)時(shí)繪圖:展示,讀取數(shù)據(jù)繪圖,支持 graph 、map 、screen 、slide show
/3、告警:郵件,短息,微信,釘釘?shù)韧ㄓ嵻浖?/span>
/4、數(shù)據(jù)存儲(chǔ):mysql 、pgsql 、時(shí)間序列數(shù)據(jù)庫(kù)
/5、靈活閾值定義:zabbix中稱為觸發(fā)器 trigger
/6、配置簡(jiǎn)單:一次配置,終生監(jiān)控
/7、網(wǎng)絡(luò)自動(dòng)發(fā)現(xiàn):自動(dòng)發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備,agent 自動(dòng)注冊(cè)
/8、WEB 接口:使用PHP編寫(xiě),訪問(wèn)快速無(wú)障礙
/9、二進(jìn)制守護(hù)進(jìn)程:高性能,低內(nèi)存消耗,易移植
等
· Server 服務(wù)端,數(shù)據(jù)集成地
· Agent 客戶端,收集數(shù)據(jù)
· Proxy 代理,相當(dāng)于中轉(zhuǎn)站,需要把收集到的數(shù)據(jù)提交 / 被提交到 Server
· Database 數(shù)據(jù)存儲(chǔ),配置信息及采集的數(shù)據(jù)
· Web GUI 提供的WEB界面
zabbix agent需要安裝到被監(jiān)控的主機(jī)上,它負(fù)責(zé)定期收集各項(xiàng)數(shù)據(jù),并發(fā)送到zabbix server端;
zabbix server將數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)中,zabbix web根據(jù)數(shù)據(jù)在前端進(jìn)行展現(xiàn)和繪圖。
這里agent收集數(shù)據(jù)分為主動(dòng)和被動(dòng)兩種模式:
主、agent請(qǐng)求server獲取主動(dòng)的監(jiān)控項(xiàng)列表,并主動(dòng)將監(jiān)控項(xiàng)內(nèi)需要檢測(cè)的數(shù)據(jù)提交給server/proxy
被、server向agent請(qǐng)求獲取監(jiān)控項(xiàng)的數(shù)據(jù),agent返回?cái)?shù)據(jù)
· zabbix_get 單獨(dú)使用命令,用來(lái)故障排錯(cuò)
· zabbix_sender 發(fā)送數(shù)據(jù)給server或proxy,用于耗時(shí)較長(zhǎng)的檢查
· zabbix_java_gateway 2.0后引入,Java 網(wǎng)關(guān),主動(dòng)的獲取數(shù)據(jù)
· zabbix_agentd 客戶端守護(hù)進(jìn)程
· zabbix_proxy 代理守護(hù)進(jìn)程
· zabbix_server 服務(wù)端守護(hù)進(jìn)程
host · 主機(jī) 要監(jiān)控的網(wǎng)絡(luò)設(shè)備,可由IP或DNS名稱指定
host group · 主機(jī)組 主機(jī)的邏輯容器,可以包含主機(jī)和模板,但同一個(gè)組織內(nèi)的主機(jī)和模板不能互相鏈接
item · 監(jiān)控項(xiàng) 一個(gè)特定監(jiān)控指標(biāo)的相關(guān)的數(shù)據(jù);item是zabbix進(jìn)行數(shù)據(jù)收集的核心,相對(duì)某個(gè)監(jiān)控對(duì)象,每個(gè)item都由"key"標(biāo)識(shí);
trigger · 觸發(fā)器 一個(gè)表達(dá)式,用于評(píng)估某監(jiān)控對(duì)象的特定item內(nèi)接收到的數(shù)據(jù)是否在合理范圍內(nèi),也就是閾值
event · 事件 觸發(fā)一個(gè)值得關(guān)注的事情,比如觸發(fā)器狀態(tài)轉(zhuǎn)變,新的agent或重新上線的agent的自動(dòng)注冊(cè)等
action · 動(dòng)作 指對(duì)于特定事件事先定義的處理方法,如發(fā)送通知,何時(shí)執(zhí)行操作
escalation · 報(bào)警升級(jí) 發(fā)送警報(bào)或者執(zhí)行遠(yuǎn)程命令的自定義方案
media · 媒介 發(fā)送通知的手段或者通道,如Email、Jabber或者SMS等
notification · 通知 通過(guò)選定的媒介向用戶發(fā)送的有關(guān)某事件的信息
template · 模版 用于快速定義被監(jiān)控主機(jī)的預(yù)設(shè)條目集合,通常包含了item、trigger、graph、等,模板可以直接鏈接至某個(gè)主機(jī)
application · 應(yīng)用 一組item的集合
web scennario · web場(chǎng)景 用于檢測(cè)web站點(diǎn)可用性的一個(gè)或多個(gè)HTTP請(qǐng)求
frontend · 前端 Zabbix的web接口
根據(jù)網(wǎng)絡(luò)環(huán)境、監(jiān)控規(guī)模等,分以下三種架構(gòu)
/1、server-client 直接由zabbix server和zabbix agentd之間進(jìn)行數(shù)據(jù)交互,適用于網(wǎng)絡(luò)比較簡(jiǎn)單,設(shè)備比較少的監(jiān)控環(huán)境
/2、server-proxy-client server+proxy+agentd建立,一般適用于跨機(jī)房、跨網(wǎng)絡(luò)的中型網(wǎng)絡(luò)架構(gòu)的監(jiān)控
/3、master-node-client 每個(gè)node同時(shí)也是一個(gè)server端,node下面可以接proxy,也可以直接接client 。node有自已的配置文件和數(shù)據(jù)庫(kù),將配置信息和監(jiān)控?cái)?shù)據(jù)向master同步
適用于跨網(wǎng)絡(luò)、跨機(jī)房、設(shè)備較多的大型環(huán)境
聯(lián)系客服