Cuando un servidor se vuelve no receptivo, obtener un VMcore (también conocido como core dump o kernel dump) puede ser un paso crucial para diagnosticar el problema. Un VMcore es una instantánea de la memoria del sistema en el momento de un crash o kernel panic, que puede ser analizada para identificar la causa raíz del problema.
Aquí están los pasos que puedes seguir para obtener un VMcore cuando el servidor está no receptivo:
Verificar problemas de hardware:
Asegúrate de que no haya problemas físicos con el hardware, como conexiones sueltas, RAM defectuosa o sobrecalentamiento.
Habilitar Kdump:
Kdump es un mecanismo de volcado del núcleo que permite al núcleo ejecutar un segundo núcleo en caso de pánico. Asegúrate de que esté instalado y correctamente configurado.
Verificar espacio en disco:
Asegúrate de tener suficiente espacio libre en el disco para almacenar el vmcore. Kdump generalmente reserva una parte del espacio en disco para este propósito.
Verificar que Kexec esté instalado y funcionando:
Kexec es una herramienta que permite cargar un nuevo núcleo sin reiniciar el sistema. Asegúrate de que esté instalada y funcionando correctamente.
Acceso remoto:
Si es posible, intenta acceder al servidor de forma remota utilizando herramientas como SSH, IPMI, iLO o DRAC.
Provocar un crash:
Si puedes acceder al servidor, puedes provocar manualmente un crash utilizando la combinación de teclas SysRq. Al presionar Alt + SysRq + c se provocará un crash.
Crash automático:
Si el servidor está completamente no receptivo y no puedes acceder a él de forma remota, tendrás que esperar a que ocurra un crash natural.
Recoger el vmcore después del crash:
Una vez que ocurra el crash, Kdump debería recopilar automáticamente el vmcore y guardarlo en la ubicación especificada.
Analizar el Vmcore:
Una vez que tengas el vmcore, puedes analizarlo utilizando herramientas como crash, gdb u otras herramientas de depuración. Esto requiere conocimientos sobre los detalles internos del núcleo.
Congelar el Vmcore para análisis (opcional):
Si no puedes analizar el vmcore de inmediato, asegúrate de preservarlo en un lugar seguro, ya que podría ser sobrescrito por crashes posteriores.
Documentar y reportar:
Documenta los hallazgos y, si es necesario, informa del problema a tu administrador de sistema o soporte del proveedor. Incluye detalles sobre el crash, el vmcore y cualquier archivo de registro relevante.
Recuerda que trabajar con vmcores y depuración del núcleo requiere conocimientos técnicos avanzados. Si no estás seguro de algún paso, es mejor consultar con un administrador de sistema calificado o un equipo de soporte.