Pourquoi attendre qu'un utilisateur se plaigne que "le serveur est lent" ? La plupart des outils de supervision (Zabbix, Nagios) sondent votre serveur toutes les 5 minutes. Netdata le fait chaque seconde. Résultat : vous voyez les pics de charge CPU invisibles ailleurs et diagnostiquez les ralentissements instantanément.
1. Pourquoi Netdata ?
- Zéro Config : Vous l'installez, il détecte automatiquement Nginx, MySQL, Docker, etc.
- Léger : Écrit en C, il consomme très peu de ressources (environ 1% du CPU).
- Visuel : Des centaines de graphiques interactifs dès la première seconde.
2. Installation (Script Kickstart)
La méthode recommandée fonctionne sur toutes les distributions Linux (Debian, Ubuntu, CentOS...). Elle installe les dépendances, compile l'outil et configure le service systemd.
wget -O /tmp/netdata-kickstart.sh https://my-netdata.io/kickstart.sh && sh /tmp/netdata-kickstart.sh
Une fois terminé, le service démarre automatiquement.
systemctl status netdata
3. Accès et Sécurité (Firewall)
Netdata écoute par défaut sur le port 19999.
Si vous êtes sur un réseau sécurisé (VPN WireGuard) ou pour tester, ouvrez le port dans UFW :
sudo ufw allow 19999/tcp
Accédez ensuite à : http://VOTRE_IP:19999
4. Comprendre les métriques clés
Ne vous laissez pas noyer par les graphiques. Voici les 3 zones à surveiller en priorité :
A. Total CPU utilization
Si vous voyez du iowait (en rouge souvent), ce n'est pas le processeur qui sature, mais votre disque dur qui est trop lent. C'est le diagnostic n°1 des lenteurs web.
B. RAM (Memory)
Linux utilise la RAM libre pour le cache disque. Ne paniquez pas si la RAM semble pleine. Regardez la valeur Available, pas "Free".
C. Network (Interfaces)
Vérifiez les erreurs (dropped packets). Si vous en avez, votre réseau sature ou votre câble est défectueux.
5. Configurer les Alertes (Discord / Email)
Regarder des graphiques, c'est bien. Être réveillé quand le serveur plante, c'est mieux. Netdata possède un système d'alarme intégré.
Pour configurer les notifications, on utilise le script d'édition :
cd /etc/netdata/
sudo ./edit-config health_alarm_notify.conf
Cherchez la section DISCORD_WEBHOOK_URL et collez votre lien (que vous aurez créé dans votre canal Discord > Intégrations) :
SEND_DISCORD="YES"
DISCORD_WEBHOOK_URL="https://discord.com/api/webhooks/..."
DEFAULT_RECIPIENT_DISCORD="alerts"
Testez la configuration :
# Envoi d'une alerte de test
sudo su -s /bin/bash netdata
/usr/libexec/netdata/plugins.d/alarm-notify.sh test
Conclusion
Netdata est l'outil parfait pour le "Troubleshooting" (diagnostic de panne). Si votre site est lent à 14h05 précises, vous pouvez zoomer sur cette seconde exacte et voir quel processus a mangé le CPU. C'est un "Must-Have" sur tout serveur de production.