Supervision des serveurs de la plateforme : Différence entre versions
De Wiki d'activités IMA
(→Recherche sur des applications de surveillance système et réseau) |
(→Nagios) |
||
Ligne 45 : | Ligne 45 : | ||
3 UNKNOWN (impossible de connaître l'état du service) | 3 UNKNOWN (impossible de connaître l'état du service) | ||
− | # | + | ==== <span style="color:#6A6AFF">Zabbix</span> ==== |
+ | |||
+ | ==== <span style="color:#6A6AFF">MRTG</span> ==== | ||
+ | |||
+ | ==== <span style="color:#6A6AFF">PRTG</span> ==== | ||
+ | |||
+ | ==== <span style="color:#6A6AFF">Xymon</span> ==== | ||
==== <span style="color:#6FB7B7">Debian URL d'installation</span> ==== | ==== <span style="color:#6FB7B7">Debian URL d'installation</span> ==== |
Version du 24 mai 2018 à 10:43
Sommaire
Présentation générale du projet
Objectif du stage
L'objectif de ce stage est que trouver une application Web standard sous Linux permettant à un administrateur d'obtenir un tableau de bord de machines virtuelles désiminées sur plusieurs machines physiques. Configurer cette application pour obtenir les informations suivantes :
- état de santé des machines physiques : température, état des disques, ...
- occupation des machines physiques : utilisation CPU, utilisation espace disque, utilisation mémoire
- état de santé des connexions réseau : réseau Renater, réseau ADSL, réseau SDSL
- état de santé des machines virtuelles : temps d'exécution de chaque machine virtuelle
- occupation des machines virtuelles : utilisation disque et mémoire
- état de certaines applications critiques :
* date de validité des clefs DNSSEC * dates des dernières sauvegardes des machines virtuelles
Recherche sur des applications de surveillance système et réseau
Nagios
- Superviser des services réseaux : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP, etc.)
- Superviser les ressources des serveurs (charge du processeur, occupation des disques durs, utilisation de la mémoire paginée) et ceci sur les systèmes #d'exploitation les plus répandus.
- Interface avec le protocole SNMP.
- La supervision à distance peut utiliser SSH ou un tunnel SSL (notamment via un agent NRPE).
- Les plugins sont écrits dans les langages de programmation les plus adaptés à leur tâche : scripts shell (Bash, ksh, etc.), C++, Perl, Python, Ruby, PHP, C#, etc.
- La vérification des services se fait en parallèle.
- Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence entre un serveur en panne et un serveur injoignable.
- La remontée des alertes est entièrement paramétrable grâce à l'utilisation de plugins (alerte par courrier électronique, SMS, etc.).
- Acquittement des alertes par les administrateurs.
- Gestion des escalades pour les alertes (une alerte non acquittée est envoyée à un groupe différent).
- Limitation de la visibilité, les utilisateurs peuvent avoir un accès limité à quelques éléments.
- Capacité de gestion des oscillations (nombreux passages d'un état normal à un état d'erreur dans un temps court).
- Créer ses propres plugins, dans le langage désiré. Il suffit de respecter la norme Nagios des Codes retour
0 OK (tout va bien) 1 WARNING (le seuil d'alerte est dépassé) 2 CRITICAL (le service a un problème) 3 UNKNOWN (impossible de connaître l'état du service)