Supervision des serveurs de la plateforme : Différence entre versions
De Wiki d'activités IMA
(→recherche sur des applications de surveillance système et réseau) |
(→Recherche sur des applications de surveillance système et réseau) |
||
Ligne 24 : | Ligne 24 : | ||
* dates des dernières sauvegardes des machines virtuelles | * dates des dernières sauvegardes des machines virtuelles | ||
==== <span style="color:#6A6AFF">Recherche sur des applications de surveillance système et réseau</span> ==== | ==== <span style="color:#6A6AFF">Recherche sur des applications de surveillance système et réseau</span> ==== | ||
+ | Nagios: | ||
+ | |||
+ | #Superviser des services réseaux : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP, etc.) | ||
+ | #Superviser les ressources des serveurs (charge du processeur, occupation des disques durs, utilisation de la mémoire paginée) et ceci sur les systèmes #d'exploitation les plus répandus. | ||
+ | #Interface avec le protocole SNMP. | ||
+ | #La supervision à distance peut utiliser SSH ou un tunnel SSL (notamment via un agent NRPE). | ||
+ | #Les plugins sont écrits dans les langages de programmation les plus adaptés à leur tâche : scripts shell (Bash, ksh, etc.), C++, Perl, Python, Ruby, PHP, C#, etc. | ||
+ | #La vérification des services se fait en parallèle. | ||
+ | #Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence entre un serveur en panne et un serveur injoignable. | ||
+ | #La remontée des alertes est entièrement paramétrable grâce à l'utilisation de plugins (alerte par courrier électronique, SMS, etc.). | ||
+ | #Acquittement des alertes par les administrateurs. | ||
+ | #Gestion des escalades pour les alertes (une alerte non acquittée est envoyée à un groupe différent). | ||
+ | #Limitation de la visibilité, les utilisateurs peuvent avoir un accès limité à quelques éléments. | ||
+ | #Capacité de gestion des oscillations (nombreux passages d'un état normal à un état d'erreur dans un temps court). | ||
+ | #Créer ses propres plugins, dans le langage désiré. Il suffit de respecter la norme Nagios des Codes retour | ||
+ | |||
+ | 0 OK (tout va bien) | ||
+ | 1 WARNING (le seuil d'alerte est dépassé) | ||
+ | 2 CRITICAL (le service a un problème) | ||
+ | 3 UNKNOWN (impossible de connaître l'état du service) | ||
+ | |||
+ | #Les possibilités de tests deviennent donc infinies, il suffit d'écrire tout plugin qui n'existerait pas déjà sur les sites spécialisés. | ||
==== <span style="color:#6A6AFF">Debian URL d'installation</span> ==== | ==== <span style="color:#6A6AFF">Debian URL d'installation</span> ==== |
Version du 24 mai 2018 à 10:37
Sommaire
Présentation générale du projet
Objectif du stage
L'objectif de ce stage est que trouver une application Web standard sous Linux permettant à un administrateur d'obtenir un tableau de bord de machines virtuelles désiminées sur plusieurs machines physiques. Configurer cette application pour obtenir les informations suivantes :
- état de santé des machines physiques : température, état des disques, ...
- occupation des machines physiques : utilisation CPU, utilisation espace disque, utilisation mémoire
- état de santé des connexions réseau : réseau Renater, réseau ADSL, réseau SDSL
- état de santé des machines virtuelles : temps d'exécution de chaque machine virtuelle
- occupation des machines virtuelles : utilisation disque et mémoire
- état de certaines applications critiques :
* date de validité des clefs DNSSEC * dates des dernières sauvegardes des machines virtuelles
Recherche sur des applications de surveillance système et réseau
Nagios:
- Superviser des services réseaux : (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP, etc.)
- Superviser les ressources des serveurs (charge du processeur, occupation des disques durs, utilisation de la mémoire paginée) et ceci sur les systèmes #d'exploitation les plus répandus.
- Interface avec le protocole SNMP.
- La supervision à distance peut utiliser SSH ou un tunnel SSL (notamment via un agent NRPE).
- Les plugins sont écrits dans les langages de programmation les plus adaptés à leur tâche : scripts shell (Bash, ksh, etc.), C++, Perl, Python, Ruby, PHP, C#, etc.
- La vérification des services se fait en parallèle.
- Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence entre un serveur en panne et un serveur injoignable.
- La remontée des alertes est entièrement paramétrable grâce à l'utilisation de plugins (alerte par courrier électronique, SMS, etc.).
- Acquittement des alertes par les administrateurs.
- Gestion des escalades pour les alertes (une alerte non acquittée est envoyée à un groupe différent).
- Limitation de la visibilité, les utilisateurs peuvent avoir un accès limité à quelques éléments.
- Capacité de gestion des oscillations (nombreux passages d'un état normal à un état d'erreur dans un temps court).
- Créer ses propres plugins, dans le langage désiré. Il suffit de respecter la norme Nagios des Codes retour
0 OK (tout va bien) 1 WARNING (le seuil d'alerte est dépassé) 2 CRITICAL (le service a un problème) 3 UNKNOWN (impossible de connaître l'état du service)
- Les possibilités de tests deviennent donc infinies, il suffit d'écrire tout plugin qui n'existerait pas déjà sur les sites spécialisés.