Когда сервер становится неотзывчивым, получение VMcore (также известного как core dump или kernel dump) может быть решающим шагом для диагностики проблемы. VMcore — это снимок памяти системы в момент сбоя или kernel panic, который можно проанализировать, чтобы выявить основную причину проблемы.
Вот шаги, которые вы можете выполнить, чтобы получить VMcore, если сервер неотзывчив:
Проверка аппаратных проблем:
Убедитесь, что нет физических проблем с оборудованием, таких как ослабленные соединения, неисправная оперативная память или перегрев.
Включение Kdump:
Kdump — это механизм сбора дампов ядра, который позволяет ядру запустить вторичное ядро в случае паники. Убедитесь, что он установлен и правильно настроен.
Проверка свободного места на диске:
Убедитесь, что на диске достаточно свободного места для хранения vmcore. Обычно Kdump резервирует часть дискового пространства для этой цели.
Проверка установки и работы Kexec:
Kexec — это инструмент, который позволяет загрузить новое ядро без перезагрузки системы. Убедитесь, что он установлен и работает корректно.
Доступ по сети:
Если возможно, попытайтесь получить доступ к серверу удаленно с помощью таких инструментов, как SSH, IPMI, iLO или DRAC.
Триггер сбоя:
Если вы можете получить доступ к серверу, вы можете вручную вызвать сбой с помощью комбинации клавиш SysRq. Нажатие Alt + SysRq + c вызовет сбой.
Автоматический сбой:
Если сервер полностью неотзывчив и вы не можете получить доступ к нему удаленно, вам придется дождаться, когда произойдет естественный сбой.
Сбор VMcore после сбоя:
После того как произошел сбой, Kdump должен автоматически собрать vmcore и сохранить его в указанном месте.
Анализ VMcore:
Как только у вас будет vmcore, вы можете проанализировать его с помощью инструментов, таких как crash, gdb или других средств отладки. Это требует знаний о внутреннем устройстве ядра.
Заморозка VMcore для анализа (по желанию):
Если вы не можете немедленно проанализировать vmcore, убедитесь, что вы сохранили его в безопасном месте, так как оно может быть перезаписано в случае последующих сбоев.
Документация и отчет:
Документируйте результаты и, если необходимо, сообщите о проблеме вашему системному администратору или в службу поддержки поставщика. Включите подробности о сбое, vmcore и любые соответствующие журналы.
Помните, что работа с vmcore и отладка ядра требует продвинутых технических знаний. Если вы не уверены в каком-либо шаге, лучше проконсультироваться с квалифицированным системным администратором или службой поддержки.