У меня нестабильная система (перезагружается наугад) и пытаюсь определить причину перезагрузок. Мой вопрос заключается в том, являются ли эти MCE серьезными ошибками, которые могут привести к перезагрузке. Если да, то должны ли они заставить меня заменить процессор или оперативную память?
После каждой перезагрузки (случайной или инициированной судо перезагрузка
) производятся следующие МКЭ:
14:50:45 ядро: [0.778792] mce: [аппаратная ошибка]: регистрируются события проверки компьютера
14:50:45 ядро: [0.778793] mce: [Аппаратная ошибка]: ЦП 0: Проверка машины: 0 Банк 17: ee2000000004017a
14:50:45 ядро: [0.778795] mce: [аппаратная ошибка]: TSC 0 ADDR 5f000000 MISC 8cf00031e0000086
14:50:45 ядро: [0.778797] mce: [аппаратная ошибка]: ПРОЦЕССОР 0:306f2 ВРЕМЯ 1639083036 СОКЕТ 0 APIC 0 микрокод 46
14:50:45 ядро: [0.778798] mce: [аппаратная ошибка]: зарегистрированы события проверки компьютера
14:50:45 ядро: [0.778799] mce: [Аппаратная ошибка]: ЦП 0: Проверка машины: 0 Банк 18: ee2000000004017a
14:50:45 ядро: [0.778799] mce: [аппаратная ошибка]: TSC 0 ADDR 5f100040 MISC 1cf00031e0000086
14:50:45 ядро: [0.778801] mce: [аппаратная ошибка]: ПРОЦЕССОР 0:306f2 ВРЕМЯ 1639083036 СОКЕТ 0 APIC 0 микрокод 46
14:50:45 ядро: [0.778802] mce: [Аппаратная ошибка]: ЦП 0: Проверка машины: 0 Банк 19: ee2000000004017a
14:50:45 ядро: [0.778802] mce: [аппаратная ошибка]: TSC 0 ADDR 5f100000 MISC 54f00031e0000086
14:50:45 ядро: [0.778804] mce: [аппаратная ошибка]: ПРОЦЕССОР 0:306f2 ВРЕМЯ 1639083036 СОКЕТ 0 APIC 0 микрокод 46
К сожалению, эти сообщения являются тарабарщиной без расдамон
или же mcelog
интерпретировать их. Тоже, к сожалению, не похоже расдамон
запускается до тех пор, пока сообщение не будет зарегистрировано (ошибка не появляется в ras-mc-ctl --резюме
). Обратите внимание на временные метки:
14:50:50 rasdaemon[1023]: rasdaemon: событие ras:mc_event включено
14:50:50 rasdaemon[1023]: rasdaemon: Включено событие ras:mc_event
14:50:50 rasdaemon[1023]: rasdaemon: событие ras:aer_event включено
14:50:50 rasdaemon[1023]: rasdaemon: Включено событие ras:aer_event
14:50:50 rasdaemon[1023]: rasdaemon: Предупреждение: процессор 0 отключен? Imc_log не установлен
14:50:50 rasdaemon[1023]: rasdaemon: событие mce:mce_record включено
14:50:50 rasdaemon[1023]: rasdaemon: Включено событие mce:mce_record
14:50:50 rasdaemon[1023]: rasdaemon: событие ras:extlog_mem_event включено
14:50:50 rasdaemon[1023]: rasdaemon: Включено событие ras:extlog_mem_event
14:50:50 rasdaemon[1023]: rasdaemon: прослушивание событий для процессоров с 0 по 15
14:50:50 rasdaemon[1025]: rasdaemon: событие ras:mc_event включено
14:50:50 rasdaemon[1025]: rasdaemon: событие ras:aer_event включено
14:50:50 rasdaemon[1025]: rasdaemon: событие mce:mce_record включено
14:50:50 rasdaemon[1025]: rasdaemon: событие ras:extlog_mem_event включено
Есть ли лучший способ решить эту проблему? Поможет ли обновление до 20.04, как это предлагается в этот ответ?