Рейтинг:0

Fedora Server 34 случайным образом аварийно завершает работу каждые несколько минут на HP ProLiant DL380e G8

флаг ar

К сожалению, у меня возникла проблема с моим сервером HP ProLiant DL380e G8, работающим под управлением Fedora Server 34. Я подозреваю, что это ошибки памяти или неисправность модуля DIMM, однако я не уверен.

Обратная связь очень приветствуется!

я бежал журналctl -r, который возвращает следующий вывод в ссылке PasteBin (фрагмент того, что выглядит необычно): https://pastebin.com/KPUZHceD

Любая помощь и идеи приветствуются!

С уважением

Редактировать: В ответ на комментарий @Michael Hampton: Вывод размещен здесь:

<27>7 сентября 17:03:51 mcelog: Location: SOCKET:0 CHANNEL:3 DIMM:1 []
07 сентября, 17:03:51 turbo mcelog[1304]: Местоположение: SOCKET:0 CHANNEL:3 DIMM:1 []
07 сентября 17:03:51 turbo mcelog[1303]: <27>7 сентября 17:03:51 mcelog: исправлено количество ошибок памяти DIMM, превышено пороговое значение: 10 за 24 часа
07 сентября, 17:03:51 turbo mcelog[1303]: исправлено превышение порогового значения количества ошибок памяти DIMM: 10 за 24 часа.
07 сентября 17:03:51 turbo mcelog[1304]: <27>7 сентября 17:03:51 mcelog: Location: SOCKET:0 CHANNEL:3 DIMM:1 []
07 сентября, 17:03:51 turbo mcelog[1304]: Местоположение: SOCKET:0 CHANNEL:3 DIMM:1 []
07 сентября 17:03:51 turbo mcelog[1303]: <27>7 сентября 17:03:51 mcelog: исправлено количество ошибок памяти DIMM, превышено пороговое значение: 10 за 24 часа
07 сентября, 17:03:51 turbo mcelog[1303]: исправлено превышение порогового значения количества ошибок памяти DIMM: 10 за 24 часа.
07 сентября, 17:03:51 turbo mcelog[1067]: CPUID Vendor Intel Family 6 Model 45 Step 7
07 сен 17:03:51 turbo mcelog[1067]: МИКРОКОД 71a
07 сентября, 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 2 SOCKETID 0
07 сент., 17:03:51 turbo mcelog[1067]: СТАТУС c80000c400800093 MCGSTATUS 0
07 сент., 17:03:51 turbo mcelog[1067]: MemCtrl:
07 сентября 17:03:51 turbo mcelog [1067]: транзакция: ошибка чтения памяти
07 сентября, 17:03:51 turbo mcelog[1067]: MCA: КОНТРОЛЛЕР ПАМЯТИ RD_CHANNEL3_ERR
07 сент., 17:03:51 turbo mcelog[1067]: регистр MCi_MISC действителен
07 сент., 17:03:51 turbo mcelog[1067]: исправлена ​​ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: ошибка переполнения
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCi:
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCG:
07 сен 17:03:51 turbo mcelog[1067]: TIME 1631027031 Вт 7 сен 17:03:51 2021
07 сент., 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
07 сент., 17:03:51 turbo mcelog[1067]: CPU 1 BANK 11
07 сент., 17:03:51 turbo mcelog[1067]: MCE 7
07 сентября, 17:03:51 turbo mcelog[1067]: аппаратное событие. Это не программная ошибка.
07 сентября, 17:03:51 turbo mcelog[1067]: CPUID Vendor Intel Family 6 Model 45 Step 7
07 сен 17:03:51 turbo mcelog[1067]: МИКРОКОД 71a
07 сентября, 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 3 SOCKETID 0
07 сент., 17:03:51 turbo mcelog[1067]: СТАТУС c80000c400800093 MCGSTATUS 0
07 сент., 17:03:51 turbo mcelog[1067]: MemCtrl:
07 сентября 17:03:51 turbo mcelog [1067]: транзакция: ошибка чтения памяти
07 сентября, 17:03:51 turbo mcelog[1067]: MCA: КОНТРОЛЛЕР ПАМЯТИ RD_CHANNEL3_ERR
07 сент., 17:03:51 turbo mcelog[1067]: регистр MCi_MISC действителен
07 сент., 17:03:51 turbo mcelog[1067]: исправлена ​​ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: ошибка переполнения
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCi:
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCG:
07 сен 17:03:51 turbo mcelog[1067]: TIME 1631027031 Вт 7 сен 17:03:51 2021
07 сент., 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
07 сент., 17:03:51 turbo mcelog[1067]: CPU 13 BANK 11
07 сент., 17:03:51 turbo mcelog[1067]: MCE 6
07 сентября, 17:03:51 turbo mcelog[1067]: аппаратное событие. Это не программная ошибка.
07 сентября, 17:03:51 turbo mcelog[1067]: CPUID Vendor Intel Family 6 Model 45 Step 7
07 сен 17:03:51 turbo mcelog[1067]: МИКРОКОД 71a
07 сентября 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 0 SOCKETID 0
07 сент., 17:03:51 turbo mcelog[1067]: СТАТУС c80000c400800093 MCGSTATUS 0
07 сент., 17:03:51 turbo mcelog[1067]: MemCtrl:
07 сентября 17:03:51 turbo mcelog [1067]: транзакция: ошибка чтения памяти
07 сентября, 17:03:51 turbo mcelog[1067]: MCA: КОНТРОЛЛЕР ПАМЯТИ RD_CHANNEL3_ERR
07 сент., 17:03:51 turbo mcelog[1067]: регистр MCi_MISC действителен
07 сент., 17:03:51 turbo mcelog[1067]: исправлена ​​ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: ошибка переполнения
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCi:
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCG:
07 сен 17:03:51 turbo mcelog[1067]: TIME 1631027031 Вт 7 сен 17:03:51 2021
07 сент., 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
07 сент., 17:03:51 turbo mcelog[1067]: CPU 0 BANK 11
07 сент., 17:03:51 turbo mcelog[1067]: MCE 5
07 сентября, 17:03:51 turbo mcelog[1067]: аппаратное событие. Это не программная ошибка.
07 сентября, 17:03:51 turbo mcelog[1067]: запущенный триггер `dimm-error-trigger' (докладчик: memdb)
07 сентября, 17:03:51 turbo mcelog[1067]: CPUID Vendor Intel Family 6 Model 45 Step 7
07 сен 17:03:51 turbo mcelog[1067]: МИКРОКОД 71a
07 сентября, 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 6 SOCKETID 0
07 сент., 17:03:51 turbo mcelog[1067]: СТАТУС c80000c400800093 MCGSTATUS 0
07 сент., 17:03:51 turbo mcelog[1067]: MemCtrl:
07 сентября 17:03:51 turbo mcelog [1067]: транзакция: ошибка чтения памяти
07 сентября, 17:03:51 turbo mcelog[1067]: MCA: КОНТРОЛЛЕР ПАМЯТИ RD_CHANNEL3_ERR
07 сент., 17:03:51 turbo mcelog[1067]: регистр MCi_MISC действителен
07 сент., 17:03:51 turbo mcelog[1067]: исправлена ​​ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: ошибка переполнения
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCi:
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCG:
07 сен 17:03:51 turbo mcelog[1067]: TIME 1631027031 Вт 7 сен 17:03:51 2021
07 сент., 17:03:51 turbo mcelog[1067]: MISC d22131295c834800
07 сент., 17:03:51 turbo mcelog[1067]: CPU 3 BANK 11
07 сен 17:03:51 турбо mcelog[1067]: MCE 4
07 сентября, 17:03:51 turbo mcelog[1067]: аппаратное событие. Это не программная ошибка.
07 сентября, 17:03:51 turbo mcelog[1067]: CPUID Vendor Intel Family 6 Model 45 Step 7
07 сен 17:03:51 turbo mcelog[1067]: МИКРОКОД 71a
07 сентября, 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID и SOCKETID 0
07 сентября, 17:03:51 turbo mcelog[1067]: СТАТУС c801c00400800093 MCGSTATUS 0
07 сент., 17:03:51 turbo mcelog[1067]: MemCtrl:
07 сентября 17:03:51 turbo mcelog [1067]: транзакция: ошибка чтения памяти
07 сентября, 17:03:51 turbo mcelog[1067]: MCA: КОНТРОЛЛЕР ПАМЯТИ RD_CHANNEL3_ERR
07 сент., 17:03:51 turbo mcelog[1067]: регистр MCi_MISC действителен
07 сент., 17:03:51 turbo mcelog[1067]: исправлена ​​ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: ошибка переполнения
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCi:
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCG:
07 сен 17:03:51 turbo mcelog[1067]: TIME 1631027031 Вт 7 сен 17:03:51 2021
07 сент., 17:03:51 turbo mcelog[1067]: MISC d2213fa689118800
07 сент., 17:03:51 turbo mcelog[1067]: CPU 5 BANK 11
07 сен 17:03:51 турбо mcelog[1067]: MCE 3
07 сентября, 17:03:51 turbo mcelog[1067]: аппаратное событие. Это не программная ошибка.
07 сентября, 17:03:51 turbo mcelog[1067]: CPUID Vendor Intel Family 6 Model 45 Step 7
07 сен 17:03:51 turbo mcelog[1067]: МИКРОКОД 71a
07 сентября, 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 5 SOCKETID 0
07 сентября 17:03:51 turbo mcelog[1067]: СТАТУС c801bd8400800093 MCGSTATUS 0
07 сент., 17:03:51 turbo mcelog[1067]: MemCtrl:
07 сентября 17:03:51 turbo mcelog [1067]: транзакция: ошибка чтения памяти
07 сентября, 17:03:51 turbo mcelog[1067]: MCA: КОНТРОЛЛЕР ПАМЯТИ RD_CHANNEL3_ERR
07 сент., 17:03:51 turbo mcelog[1067]: регистр MCi_MISC действителен
07 сент., 17:03:51 turbo mcelog[1067]: исправлена ​​ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: ошибка переполнения
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCi:
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCG:
07 сен 17:03:51 turbo mcelog[1067]: TIME 1631027031 Вт 7 сен 17:03:51 2021
07 сент., 17:03:51 turbo mcelog[1067]: MISC d2213f0649118800
07 сент., 17:03:51 turbo mcelog[1067]: CPU 14 BANK 11
07 сент., 17:03:51 turbo mcelog[1067]: MCE 2
07 сентября, 17:03:51 turbo mcelog[1067]: аппаратное событие. Это не программная ошибка.
07 сентября, 17:03:51 turbo mcelog[1067]: CPUID Vendor Intel Family 6 Model 45 Step 7
07 сен 17:03:51 turbo mcelog[1067]: МИКРОКОД 71a
07 сентября, 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 1 SOCKETID 0
07 сентября 17:03:51 turbo mcelog[1067]: СТАТУС c801bec400800093 MCGSTATUS 0
07 сент., 17:03:51 turbo mcelog[1067]: MemCtrl:
07 сентября 17:03:51 turbo mcelog [1067]: транзакция: ошибка чтения памяти
07 сентября, 17:03:51 turbo mcelog[1067]: MCA: КОНТРОЛЛЕР ПАМЯТИ RD_CHANNEL3_ERR
07 сент., 17:03:51 turbo mcelog[1067]: регистр MCi_MISC действителен
07 сент., 17:03:51 turbo mcelog[1067]: исправлена ​​ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: ошибка переполнения
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCi:
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCG:
07 сен 17:03:51 turbo mcelog[1067]: TIME 1631027031 Вт 7 сен 17:03:51 2021
07 сент., 17:03:51 turbo mcelog[1067]: MISC d221196e09118800
07 сент., 17:03:51 turbo mcelog[1067]: CPU 12 BANK 11
07 сент., 17:03:51 turbo mcelog[1067]: MCE 1
07 сентября, 17:03:51 turbo mcelog[1067]: аппаратное событие. Это не программная ошибка.
07 сентября, 17:03:51 turbo mcelog[1067]: CPUID Vendor Intel Family 6 Model 45 Step 7
07 сен 17:03:51 turbo mcelog[1067]: МИКРОКОД 71a
07 сентября 17:03:51 turbo mcelog[1067]: MCGCAP 1000812 APICID 0 SOCKETID 0
07 сентября, 17:03:51 turbo mcelog[1067]: СТАТУС c0107b4000010093 MCGSTATUS 0
07 сентября 17:03:51 turbo mcelog [1067]: транзакция: ошибка чтения памяти
07 сентября, 17:03:51 turbo mcelog[1067]: MCA: КОНТРОЛЛЕР ПАМЯТИ RD_CHANNEL3_ERR
07 сент., 17:03:51 turbo mcelog[1067]: исправлена ​​ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: ошибка переполнения
07 сентября, 17:03:51 turbo mcelog[1067]: СТАТУС c0107b4000010093 MCGSTATUS 0
07 сентября 17:03:51 turbo mcelog [1067]: транзакция: ошибка чтения памяти
07 сентября, 17:03:51 turbo mcelog[1067]: MCA: КОНТРОЛЛЕР ПАМЯТИ RD_CHANNEL3_ERR
07 сент., 17:03:51 turbo mcelog[1067]: исправлена ​​ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: ошибка переполнения
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCi:
07 сент., 17:03:51 turbo mcelog[1067]: Статус MCG:
07 сен 17:03:51 turbo mcelog[1067]: TIME 1631027031 Вт 7 сен 17:03:51 2021
07 сент., 17:03:51 turbo mcelog[1067]: CPU 0 BANK 5
07 сен 17:03:51 турбо mcelog[1067]: MCE 0
07 сентября, 17:03:51 turbo mcelog[1067]: аппаратное событие. Это не программная ошибка.
07 сент., 17:03:51 turbo mcelog[1067]: mcelog: чтение mcelog: ошибка ввода/вывода
Сен 07 17:03:51 турбо ядро: ERST: [Предупреждение прошивки]: прошивка не отвечает вовремя.
07 сентября, 17:03:51 ядро ​​​​turbo: mce: [аппаратная ошибка]: зарегистрированы события проверки компьютера
07 сентября, 17:03:51 ядро ​​​​turbo: mce: [аппаратная ошибка]: зарегистрированы события проверки компьютера
07 сент., 17:03:51 турбоядро: mce_notify_irq: 6 обратных вызовов подавлены
Michael Hampton avatar
флаг cz
Я не вижу, что вы положили на pastebin. Может быть, их веб-сайт капризничает. В любом случае, неужели это слишком долго, чтобы размещать его здесь? Мы предпочитаем, чтобы все, что имеет отношение к вопросу, по возможности публиковалось в вопросе.
флаг br
Это не поддерживаемая конфигурация.
jonasclaes avatar
флаг ar
@Chopper3, можешь мне объяснить, почему?
Michael Hampton avatar
флаг cz
Я думаю, что первым делом я бы удалил неисправную память. Журнал четко определяет это.
djdomi avatar
флаг za
«Расположение: SOCKET: 0 CHANNEL: 3 DIMM: 1» удалите этот RAM, никогда не видел такого явного дефекта, а @chopper3, пожалуйста, объясните, я не вижу проблемы в этом вопросе, даже если сервер довольно старый
флаг br
@jonasclaes, потому что на всех серверах есть список поддерживаемых операционных систем и поддерживаемая версия, а у вас неподдерживаемая конфигурация (https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&cad Страница =rja&uact=8&ved=2ahUKEwiN8NmwrO3yAhUMgVwKHTRiDxoQFnoECasQAQ&url=https%3A%2F%2Fh20195.www2.hpe.com%2Fv2%2Fgetdocument.aspx%3Fdocname%3Dc04128166&usg=AOvVaw2CoUn_gDA8mueVHh8
jonasclaes avatar
флаг ar
@Chopper3 Понятно. Однако RHEL является корпоративным, а Fedora управляется сообществом. Но спасибо, что указали на это.
Рейтинг:0
флаг ar

Этот пост был исправлен путем удаления 2 неисправных планок оперативной памяти с сервера и переустановки ЦП, так как это также не обеспечивало хороший контакт.

Спасибо за помощь!

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.