Différences entre versions de « Nagios »

De The Linux Craftsman
Aller à la navigation Aller à la recherche
Ligne 7 : Ligne 7 :
 
yum -y install httpd nagios nagios-plugins-all
 
yum -y install httpd nagios nagios-plugins-all
 
</pre>
 
</pre>
 +
 +
Avant d'aller plus loin, intéressons-nous au fonctionnement de Nagios.
 +
 +
= Fonctionnement =
 +
 +
== Configuration ==
 +
Plusieurs éléments de configuration sont présents dans Nagios:
 +
===timeperiods===
 +
Elles permettent de fixer les plages de notifications des contacts et de contrôle des hôtes et services.
 +
===contact===
 +
Ceux sont les personnes qu'ils faut alerter par la supervision
 +
===contactgroup===
 +
Ceux sont des groupes de plusieurs ''contact'' qui vont être alertées en même temps. Ceux sont souvent des personnes occupant le même poste (administrateur système, webmestre
 +
, responsable d'exploitation, etc...)
 +
===hosts===
 +
Ils représentent les machines physiques à superviser
 +
===hostgroup===
 +
Permettent de rassembler plusieurs ''host'' occupant le même rôle ou faisant tourner une même application.
 +
===services===
 +
Ceux sont les contrôles à effectuer sur un ''host'' (DNS, est-ce que le démon SSH tourne ?, % d'utilisation CPU, % d'utilisation mémoire, l’IO disque, ...)
 +
===servicegroup===
 +
Permet de rassembler des services pour les considerer comme un bloc comme c'est souvent le cas dans un cluster applicatif.
 +
===template===
 +
Ils permettent d'éviter les redondances au niveau des définitions d’hôtes et de services en regroupant des variables communes.
 +
 +
[[Fichier:nagios_config_operation.png|centré]]
 +
 +
== Notifications ==
 +
#Au début le service est disponible, le voyant est au vert (état OK)
 +
#Quand le service ne répond plus, Nagios le passe de l’état ''OK'' à ''Warning''. Le service passe en état ''SOFT'', c'est à dire que Nagios va déclencher le cycle de vérification de la fiabilité de l’incident (utilisation de retry_check et max_check_attemps)
 +
# Au bout du cycle de vérification, Nagios passe le service en état ''HARD'', c'est à dire que l’incident est certifié. Le cycle de notification va commencer (tous les notification_interval).
 +
# Quand le service répond de nouveau, Nagios envoi une dernière notification pour signaler que le service est repassé à l'état ''OK''.
 +
 +
[[Fichier:nagios_service_notification.png|centré]]
 +
= Configuration =
 +
== Un hôte ==

Version du 16 juillet 2015 à 11:15

Prérequis

Tout d'abord, assurez-vous d'avoir installer le dépôt EPEL car la majeure partie de nos paquets viennent de cette source !

Installation

Nagios à besoin d'un serveur web pour fonctionner, ce qui nous donne :

yum -y install httpd nagios nagios-plugins-all

Avant d'aller plus loin, intéressons-nous au fonctionnement de Nagios.

Fonctionnement

Configuration

Plusieurs éléments de configuration sont présents dans Nagios:

timeperiods

Elles permettent de fixer les plages de notifications des contacts et de contrôle des hôtes et services.

contact

Ceux sont les personnes qu'ils faut alerter par la supervision

contactgroup

Ceux sont des groupes de plusieurs contact qui vont être alertées en même temps. Ceux sont souvent des personnes occupant le même poste (administrateur système, webmestre , responsable d'exploitation, etc...)

hosts

Ils représentent les machines physiques à superviser

hostgroup

Permettent de rassembler plusieurs host occupant le même rôle ou faisant tourner une même application.

services

Ceux sont les contrôles à effectuer sur un host (DNS, est-ce que le démon SSH tourne ?, % d'utilisation CPU, % d'utilisation mémoire, l’IO disque, ...)

servicegroup

Permet de rassembler des services pour les considerer comme un bloc comme c'est souvent le cas dans un cluster applicatif.

template

Ils permettent d'éviter les redondances au niveau des définitions d’hôtes et de services en regroupant des variables communes.

Nagios config operation.png

Notifications

  1. Au début le service est disponible, le voyant est au vert (état OK)
  2. Quand le service ne répond plus, Nagios le passe de l’état OK à Warning. Le service passe en état SOFT, c'est à dire que Nagios va déclencher le cycle de vérification de la fiabilité de l’incident (utilisation de retry_check et max_check_attemps)
  3. Au bout du cycle de vérification, Nagios passe le service en état HARD, c'est à dire que l’incident est certifié. Le cycle de notification va commencer (tous les notification_interval).
  4. Quand le service répond de nouveau, Nagios envoi une dernière notification pour signaler que le service est repassé à l'état OK.
Nagios service notification.png

Configuration

Un hôte