Lorsqu'un serveur devient non réactif, obtenir un VMcore (également appelé core dump ou kernel dump) peut être une étape cruciale pour diagnostiquer le problème. Un VMcore est un instantané de la mémoire du système au moment d'un crash ou d'un kernel panic, qui peut être analysé pour identifier la cause profonde du problème.
Voici les étapes que vous pouvez suivre pour obtenir un VMcore lorsque le serveur est non réactif :
Vérifier les problèmes matériels :
Assurez-vous qu'il n'y a pas de problèmes matériels physiques tels que des connexions desserrées, de la RAM défectueuse ou de la surchauffe.
Activer Kdump :
Kdump est un mécanisme de vidage de la mémoire du noyau qui permet au noyau d'exécuter un noyau secondaire en cas de panic. Assurez-vous qu'il est installé et correctement configuré.
Vérifier l'espace disque :
Assurez-vous que vous disposez de suffisamment d'espace libre sur le disque pour stocker le vmcore. Kdump réserve généralement une partie de l'espace disque à cette fin.
Vérifier que Kexec est installé et fonctionne :
Kexec est un outil qui permet de charger un nouveau noyau sans redémarrer le système. Assurez-vous qu'il est installé et fonctionne correctement.
Accès à distance :
Si possible, essayez d'accéder au serveur à distance en utilisant des outils comme SSH, IPMI, iLO ou DRAC.
Déclencher un crash :
Si vous pouvez accéder au serveur, vous pouvez déclencher manuellement un crash en utilisant la combinaison de touches SysRq. Appuyer sur Alt + SysRq + c déclenchera un crash.
Crash automatique :
Si le serveur est complètement non réactif et que vous ne pouvez pas y accéder à distance, vous devrez attendre qu'un crash naturel se produise.
Collecter le vmcore après le crash :
Une fois le crash survenu, Kdump devrait automatiquement collecter le vmcore et le sauvegarder à l'emplacement spécifié.
Analyser le Vmcore :
Une fois que vous avez le vmcore, vous pouvez l'analyser à l'aide d'outils comme crash, gdb ou d'autres outils de débogage. Cela nécessite une bonne connaissance des détails internes du noyau.
Geler le Vmcore pour analyse (facultatif) :
Si vous ne pouvez pas analyser le vmcore immédiatement, assurez-vous de le préserver dans un endroit sûr, car il pourrait être écrasé par des crashes ultérieurs.
Documenter et rapporter :
Documentez les résultats et, si nécessaire, signalez le problème à votre administrateur système ou au support du fournisseur. Incluez des détails sur le crash, le vmcore et tous les fichiers journaux pertinents.
Rappelez-vous que la gestion des vmcores et le débogage du noyau nécessitent des connaissances techniques avancées. Si vous n'êtes pas sûr d'une étape, il est préférable de consulter un administrateur système qualifié ou une équipe de support.