Рейтинг:0

Инструменты для интерпретации ошибки MCE в Ubuntu 18.04

флаг cn

У меня нестабильная система (перезагружается наугад) и пытаюсь определить причину перезагрузок. Мой вопрос заключается в том, являются ли эти MCE серьезными ошибками, которые могут привести к перезагрузке. Если да, то должны ли они заставить меня заменить процессор или оперативную память?

После каждой перезагрузки (случайной или инициированной судо перезагрузка) производятся следующие МКЭ:

14:50:45 ядро: [0.778792] mce: [аппаратная ошибка]: регистрируются события проверки компьютера
14:50:45 ядро: [0.778793] mce: [Аппаратная ошибка]: ЦП 0: Проверка машины: 0 Банк 17: ee2000000004017a
14:50:45 ядро: [0.778795] mce: [аппаратная ошибка]: TSC 0 ADDR 5f000000 MISC 8cf00031e0000086
14:50:45 ядро: [0.778797] mce: [аппаратная ошибка]: ПРОЦЕССОР 0:306f2 ВРЕМЯ 1639083036 СОКЕТ 0 APIC 0 микрокод 46
14:50:45 ядро: [0.778798] mce: [аппаратная ошибка]: зарегистрированы события проверки компьютера
14:50:45 ядро: [0.778799] mce: [Аппаратная ошибка]: ЦП 0: Проверка машины: 0 Банк 18: ee2000000004017a
14:50:45 ядро: [0.778799] mce: [аппаратная ошибка]: TSC 0 ADDR 5f100040 MISC 1cf00031e0000086
14:50:45 ядро: [0.778801] mce: [аппаратная ошибка]: ПРОЦЕССОР 0:306f2 ВРЕМЯ 1639083036 СОКЕТ 0 APIC 0 микрокод 46
14:50:45 ядро: [0.778802] mce: [Аппаратная ошибка]: ЦП 0: Проверка машины: 0 Банк 19: ee2000000004017a
14:50:45 ядро: [0.778802] mce: [аппаратная ошибка]: TSC 0 ADDR 5f100000 MISC 54f00031e0000086
14:50:45 ядро: [0.778804] mce: [аппаратная ошибка]: ПРОЦЕССОР 0:306f2 ВРЕМЯ 1639083036 СОКЕТ 0 APIC 0 микрокод 46

К сожалению, эти сообщения являются тарабарщиной без расдамон или же mcelog интерпретировать их. Тоже, к сожалению, не похоже расдамон запускается до тех пор, пока сообщение не будет зарегистрировано (ошибка не появляется в ras-mc-ctl --резюме). Обратите внимание на временные метки:

14:50:50 rasdaemon[1023]: rasdaemon: событие ras:mc_event включено
14:50:50 rasdaemon[1023]: rasdaemon: Включено событие ras:mc_event
14:50:50 rasdaemon[1023]: rasdaemon: событие ras:aer_event включено
14:50:50 rasdaemon[1023]: rasdaemon: Включено событие ras:aer_event
14:50:50 rasdaemon[1023]: rasdaemon: Предупреждение: процессор 0 отключен? Imc_log не установлен
14:50:50 rasdaemon[1023]: rasdaemon: событие mce:mce_record включено
14:50:50 rasdaemon[1023]: rasdaemon: Включено событие mce:mce_record
14:50:50 rasdaemon[1023]: rasdaemon: событие ras:extlog_mem_event включено
14:50:50 rasdaemon[1023]: rasdaemon: Включено событие ras:extlog_mem_event
14:50:50 rasdaemon[1023]: rasdaemon: прослушивание событий для процессоров с 0 по 15
14:50:50 rasdaemon[1025]: rasdaemon: событие ras:mc_event включено
14:50:50 rasdaemon[1025]: rasdaemon: событие ras:aer_event включено
14:50:50 rasdaemon[1025]: rasdaemon: событие mce:mce_record включено
14:50:50 rasdaemon[1025]: rasdaemon: событие ras:extlog_mem_event включено

Есть ли лучший способ решить эту проблему? Поможет ли обновление до 20.04, как это предлагается в этот ответ?

heynnema avatar
флаг ru
Перейдите на https://www.memtest86.com/ и загрузите/запустите их бесплатный memtest, чтобы проверить свою память. Получите хотя бы один полный проход всех тестов 4/4, чтобы подтвердить хорошую память. Это может занять несколько часов.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.