Рейтинг:0

Повторяющаяся необходимость запуска fsck, потому что система не загружается

флаг cn

Время от времени моя система Linux не загружается и выдает ошибки файловой системы. Я могу «исправить» их, загрузившись с LiveCD и выполнив:

sudo fsck -y /dev/sda1

Команда говорит, что находит плохие блоки и исправляет их, после чего система снова загрузится. Означает ли тот факт, что они продолжают происходить, отказ оборудования или может быть что-то еще не так?

Я отмечаю, что когда я вместо этого запускаю:

sudo fsck -y /dev/sda

Я получаю эти ошибки:

fsck из util-linux 2.34 [/usr/sbin/fsck.ext2 (1) -- /dev/sda] fsck.ext2 /dev/sda e2fsck 1.45.5 (07 января 2020 г.) ext2fs_open2: неправильное магическое число в супер -block fsck.ext2: неверный суперблок, попытка резервного копирования блоков... fsck.ext2: неверное магическое число в суперблоке при попытке открыть /dev/sda

Суперблок не может быть прочитан или не описывает допустимую файловую систему ext2/ext3/ext4. Если устройство допустимо и оно действительно содержит файловую систему ext2/ext3/ext4 (а не swap, ufs или что-то еще), то суперблок поврежден, и вы можете попробовать запустить e2fsck с альтернативным суперблоком:
    e2fsck -b 8193 <устройство> или
    e2fsck -b 32768 <устройство>

Нашел таблицу разделов dos в /dev/sda

Это потому, что нельзя запускать fsck на всем диске, а не только на одном разделе, или на моем диске что-то повреждено? Я видел много мест в Интернете с инструкциями по запуску fsck на всем диске. Мой диск имеет только один раздел, Linux ext4.

Вот изображение окна Smart Data & Tests приложения «Диски». введите описание изображения здесь

Результат grep -i FPDMA /var/log/syslog*:

Адам>grep -i FPDMA /var/log/syslog*
/var/log/syslog: 21 сентября 13:40:19 ядро ​​​​adam-gregs-better-computer: [728.921941] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:40:19 ядро ​​​​adam-gregs-better-computer: [729.213899] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:40:20 ядро ​​​​adam-gregs-better-computer: [729.373884] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:42:40 ядро ​​​​adam-gregs-better-computer: [870.000879] ata3.00: не удалось выполнить команду: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:42:40 ядро ​​​​adam-gregs-better-computer: [870.000904] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:05 ядро ​​​​adam-gregs-better-computer: [895.312734] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:05 ядро ​​​​adam-gregs-better-computer: [895.312760] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:06 ядро ​​​​adam-gregs-better-computer: [895.476760] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:06 ядро ​​​​adam-gregs-better-computer: [895.640724] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:49 ядро ​​​​adam-gregs-better-computer: [938.924872] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:49 ядро ​​​​adam-gregs-better-computer: [938.924901] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:49 ядро ​​​​adam-gregs-better-computer: [938.924924] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:49 ядро ​​​​adam-gregs-better-computer: [938.924945] ata3.00: ошибка команды: WRITE FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:53 ядро ​​​​adam-gregs-better-computer: [942.878558] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog: 21 сентября, 13:43:53 ядро ​​​​adam-gregs-better-computer: [942.878583] ata3.00: ошибка команды: READ FPDMA QUEUED
/var/log/syslog.1: 18 сентября, 08:30:43 ядро ​​​​adam-gregs-better-computer: [33.579255] ata3.00: ошибка команды: READ FPDMA QUEUED
флаг ru
Я бы предположил, что, поскольку вашей системе постоянно требуется выполнять проверку файловой системы, ваш диск может дать сбой, особенно когда вы получаете уведомления о плохих блоках при каждом `fsck`. Я бы начал резервное копирование ваших данных на другой диск и готовился к скорой переустановке на новый диск, так как умирающий диск — это быстрый способ потерять важные данные.
heynnema avatar
флаг ru
Отредактируйте свой вопрос и покажите мне скриншоты окна данных приложения «Диски» **SMART Data & Tests**. Измените размер окна, чтобы захватить все данные для снимка экрана. Начинайте комментировать меня с @heynnema или я пропущу их.
флаг cn
@heynnema Я обновил вопрос скриншотом.
heynnema avatar
флаг ru
Это SSD или HDD? Сколько этому лет?
heynnema avatar
флаг ru
Отредактируйте свой вопрос и покажите мне `grep -i FPDMA /var/log/syslog*`.
флаг cn
@heynnema Готово.
флаг cn
@heynnema Это SSD. Я не совсем уверен, сколько ему лет — я одолжил его около 2 лет назад у кого-то, у кого есть лучший компьютер. Это 240 ГБ.
Рейтинг:3
флаг uz
Jos

Чтобы сначала ответить на ваш последний вопрос, fsck это проверка файловой системы, а не диска.Можно, конечно, проверить весь диск, но fsck будет проверять и, возможно, восстанавливать каждую файловую систему отдельно, возможно, параллельно.

Обнаружение плохих блоков при каждом запуске fsck указывает на аппаратный сбой. Содержимое плохого блока копируется в доступный хороший блок, а затем блок помечается как «плохой», что означает, что программное обеспечение файловой системы больше не будет его использовать. Таким образом, количество плохих блоков на вашем диске, кажется, увеличивается. Возможно, вы захотите убедиться, что у вас есть надлежащие резервные копии.

heynnema avatar
флаг ru
У ОП есть SSD. Возможно, для SSD требуется обновление прошивки или настройка GRUB. См. «Ошибки NCQ» в моем ответе.
Рейтинг:1
флаг ru

fsck

Let's repair your file system (again)...

  • boot to a Ubuntu Live DVD/USB in “Try Ubuntu” mode
  • open a terminal window by pressing Ctrl+Alt+T
  • type sudo fdisk -l
  • identify the /dev/sdXX device name for your "Linux Filesystem"
  • type sudo fsck -f /dev/sda1, replacing sdXX with the number you found earlier
  • repeat the fsck command if there were errors
  • type reboot

Bad blocks and SMART Data

The SMART Data indicates what would normally be a failing HDD. However, we have an SSD that's not too old. We'll look at solving NCQ errors first.

Note: Determine the manufacturer and model # of the SSD, and then visit their web site to check for updated firmware.

Note: Maintain good backups, just in case the SSD is failing.

NCQ errors

grep -i FPDMA /var/log/syslog*

/var/log/syslog:Sep 21 13:40:19 adam-gregs-better-computer kernel: [  728.921941] ata3.00: failed command: READ FPDMA QUEUED
/var/log/syslog:Sep 21 13:40:19 adam-gregs-better-computer kernel: [  729.213899] ata3.00: failed command: READ FPDMA QUEUED

Native Command Queuing (NCQ) is an extension of the Serial ATA protocol allowing hard disk drives to internally optimize the order in which received read and write commands are executed.

Edit sudo -H gedit /etc/default/grub and change the following line to include this extra parameter. Then do sudo update-grub to write the changes to disk. Reboot. Monitor hangs/etc., and watch grep -i FPDMA /var/log/syslog* or dmesg for continued error messages.

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash libata.force=noncq"
флаг cn
Привод ADATA SU635. На их сайте не нашел обновления прошивки. Кроме того, на странице Amazon говорится, что он был впервые доступен в январе 2020 года, так что, возможно, он на самом деле новее, чем я думал (должно быть, я начал использовать его где-то в 2020 году). В процессе открытия компьютера, чтобы проверить его модель, я также обнаружил, что он был наклонен из-за отсутствия некоторых винтов, удерживающих его в корпусе, что, должно быть, заставляло его двигаться, когда я наклонял компьютер в какой-то момент. Интересно, это было причиной проблемы? Я вкрутил его, и мы посмотрим, будут ли проблемы продолжаться.
heynnema avatar
флаг ru
@user2596667 user2596667 Давай, ответь мне, чтобы попытаться решить проблему.
флаг cn
Я лучше подожду, чтобы увидеть, исправит ли это ввинчивание привода. С тех пор ошибок NCQ не появлялось. Если некоторые это сделают или если это снова не удастся, я попробую предложенные вами шаги.
флаг cn
Не могли бы вы также уточнить, почему необходимо снова восстанавливать файловую систему с помощью fsck, поскольку я только что запустил ее и исправил ошибки? Это потому, что параметр -f важен, или потому, что его необходимо перезапускать до тех пор, пока не исчезнут ошибки? Кроме того, что именно на моем снимке экрана указывает на неисправный диск, и что отличается от SSD, что делает его потенциально исправимым, где механический диск не был бы?
heynnema avatar
флаг ru
@user2596667 user2596667 Вам нужно снова запустить `fsck`, потому что это было основное исправление, и потому что оно находит ошибки. Параметр -f просто вызывает проверку, даже если диск сообщает, что он чист. Если вы посмотрите на данные SMART, количество перемещенных секторов, количество зарегистрированных неисправимых ошибок, количество перемещений, частоту ошибок UDMA CRC и частоту повторных попыток чтения — все это ненулевые значения. Сбой SSD — это электронный сбой, сбой жесткого диска — обычно ошибка физического носителя.
флаг cn
Хорошо спасибо. Я до сих пор не уверен, что полностью понимаю, почему для твердотельных накопителей нормально иметь некоторые ошибки, но я нашел [это] (https://www.crucial.com/support/articles-faq-ssd/my-ssd-has- bad-sectors), в котором говорится, что важным моментом является не наличие плохих секторов, а их увеличение с течением времени. Поэтому я буду следить за появлением новых поврежденных секторов после того, как я физически защитил диск и запустил fsck -f.
флаг cn
Я действительно получил новую ошибку NCQ и снова проверил приложение «Диски» и заметил еще несколько поврежденных секторов (но никаких сбоев или проблем, поэтому я бы не заметил этого без мониторинга, спасибо!). Итак, теперь я реализовал ваше предложение по включению libata.force=noncq. Посмотрим, появятся ли еще плохие сектора, когда эта опция включена. Я снова запустил fsck, и он не обнаружил новых ошибок. Плохие сектора сейчас до 1880.
флаг cn
Я получил еще один сбой загрузки и больше плохих секторов (до 1952 года). Я также получил странное сообщение при попытке загрузки: `mount: монтирование/запуск в/root/run не удалось: плохое сообщение` `[!!!!!!] Не удалось смонтировать файловые системы API.` Я снова запустил fsck, чтобы снова загрузиться, но, поскольку у меня был libata.force=noncq и все еще были проблемы, я должен сделать вывод, что на самом деле это неисправный диск.
heynnema avatar
флаг ru
@ user2596667 Да, звучит как плохой диск ... если только это не настольный компьютер, и тогда блок питания тоже может быть подозрительным.
флаг cn
Это настольный компьютер, но у него есть еще один SSD-диск с 0 поврежденными секторами.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.