Как мне проверить работоспособность твердотельного накопителя?

Мы все знаем, что твердотельные накопители имеют ограниченный заранее определенный срок службы. Итак, вопрос для меня в том, как мне зарегистрироваться (Ubuntu) Linux каково текущее состояние работоспособности моего SSD-накопителя? И, может быть, оценка того, сколько времени это займет?

Графический инструмент предпочтительнее, но инструмент командной строки также подойдет.

Я использую Xubuntu 12.04 LTS

чтобы проверить работоспособность твердотельного накопителя

Для дистрибутивов на базе Ubuntu, Mint или Debian

# apt-get install smartmontools

Media_Wearout_Indicator - это то, что вы ищете. Значение 100 означает, что срок службы вашего твердотельного накопителя составляет 100%, меньшее число означает, что осталось меньше времени.

# smartctl -a /dev/sda | grep Media_Wearout_Indicator

Чтобы отобразить информацию о вашем sdd

# smartctl -a /dev/sda

Вы можете прочитать полную статью по адресу Блог Nam Huy Linux - Как проверить оставшийся срок службы SSD в Linux

Устанавливать Дисковая утилита Gnome и проверить ИНТЕЛЛЕКТУАЛЬНЫЕ данные и тесты для выравнивание износа-подсчет или что-то подобное. Чем выше это число (%, от 1 до 100), тем больше "израсходован" ваш твердотельный накопитель, а это значит, что у вас больше шансов столкнуться с проблемами. Но если у вас есть недавний SSD-накопитель, вам не нужно беспокоиться об этом.

Устанавливается через

 sudo apt-get install gnome-disk-utility

запустите его через

>>либо меню-Настройки-Дисковая утилита

или через командную строку

sudo gnome-disks

Если у вас нет твердотельного накопителя марки Intel: ПРОЧТИТЕ ЭТО.

Берегись!! -- Я был беспечно введен в заблуждение "smartmontools". У меня есть Samsung SSD и инструмент smartmonitor/'smartctl'. неверно сообщенный этот атрибут '233' (шестнадцатеричный 'E9') был 'Media_Wearout_Indicator'; на самом деле - нет, для Samsung (и других производителей) это совершенно другое. Это и другие сообщения на форумах, вопросы / ответы stack-exchange и блоги опытных пользователей, которые я обнаружил, кажутся "ориентированными на Intel", с лишь смутными намеками на то, что "это может отличаться". (В отличие от любого предположения, что вам нужно следить за неправильной и ошибочной маркировкой атрибута smartmontools).

Когда я готовился скопировать свой SSD-накопитель на новый жесткий диск, который я купил (из-за того, что мне сказали smartmontools), я загрузился в Windows (у меня система двойной загрузки), чтобы узнать кое-что о SSD из того, что инструмент Samsung только для Windows 'Samsung_Magician_v43.exe " должен был рассказать мне о моя поездка - она была шокирующе неинформативной.

После нескольких часов копания я, наконец, смог запустить инструменты только для Windows: hddgaurdian, а затем также CrystalDiskInfo: Сюрприз! оба инструмента независимо говорят мне, что мой SSD-накопитель Samsung "просто в порядке" (hdd guardian говорит "5 звезд", а Crystal Disk "98% OK"). В отличие от этого, инструмент smartctl явно пометил атрибут с помощью 'decimal- 233 / 'hex- E9' как "Индикатор износа носителя" - и сообщил мне, что его значение равно "1" или 1% - показатель (риска) ожидаемого сбоя. Чтобы быть как можно более уверенным, я копал и копал и, наконец, смог найти хоть что-то от официального Samsung: Технический Документ Samsung 07: Связь С Вашим Твердотельным Накопителем [archive.org ]

Документ действительно подразумевает, что атрибут 'hex E9' /'decimal '233' не используется Samsung таким же образом. (Samsung: Я очень разочарован, пожалуйста, либо исправьте свое официальное программное обеспечение, либо, по крайней мере, дайте понять, что вы не предоставляете информацию об индикации износа!)

Кроме того, если у вас нет ни твердотельного накопителя Intel, ни твердотельного накопителя Samsung, имейте в виду, что эта информация, похоже, отличается у разных производителей. ( например, смотрите диаграмму меток атрибутов на https://code.google.com/p/hddguardian/wiki/about_reliability для единственного полезного указания степени изменчивости, которое я нашел. )

Ну и что: Если у вас нет твердотельного накопителя Intel - сделайте нет быть введенным в заблуждение ложными метками имен атрибутов, предоставляемыми smartmonitor. Возможно, в будущем это улучшится, но версия, установленная по умолчанию для Ubuntu 12.04 LTS (апрель 2014 года), была полностью неудачной. Вместо того, чтобы сказать вам, что он "не знает", smartctl просто неправильно обозначил атрибут. Я не нашел другого инструмента для Linux, который делал бы "правильную" информацию прозрачной или понятной.

Для (по крайней мере, некоторых) дисков NVMe вы можете сделать

smartctl -a /dev/nvme0

Затем вы можете найти строку, подобную:

Percentage Used:                    5%

Здесь меньшие цифры лучше и 100% означает, что привод "изношен". Документация производителя предполагает, что можно получить цифры выше 100%, если вы продолжаете использовать накопитель после этой точки (пример из Seagate, см. стр. 12).

Обратите внимание, что если вы используете пространство имен или устройства разделов, например /dev/nvme0n1 или /dev/nvme0n1p1, это не сработает, и вместо этого вы получите сообщение типа Read NVMe SMART/Health Information failed: NVMe Status 0x4002.

Для дисков Kingston на компьютерах под управлением Debian

Похожий на этот ответ выполнять

# apt-get install smartmontools

Однако, когда я выполняю команду для отображения информации о диске, похоже, что SMART был отключен:

# smartctl -a /dev/sda smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-45-generic] (local build)[ ... ]SMART support is: Available - device has SMART capability.SMART support is: Disabled

Вам необходимо включить это, выполнив следующие действия от имени root:

# smartctl -s on -a /dev/sda

Затем вы можете выполнить самопроверку, выполнив либо короткий тест (который занял у меня около 1 минуты).:

# smartctl -t short -a /dev/sda

или более тщательный тест (который занял у меня около 1,5 часов):

# smartctl -t long -a /dev/sda

Обратите внимание, что в большинстве случаев вам не нужно отключать диск для выполнения этих тестов. Если вы это сделаете, посмотрите man smartctl.

Теперь, когда вы выполняете smartctl -a /dev/sda затем вы должны увидеть результат теста для самооценки. Вероятно, это все, о чем вам действительно нужно беспокоиться:

=== START OF READ SMART DATA SECTION ===SMART overall-health self-assessment test result: PASSED

Если вам нравятся подробности, вы также увидите таблицу, подобную этой:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE  1 Raw_Read_Error_Rate     0x0032   095   095   050    Old_age   Always       -       0/178007034  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0  9 Power_On_Hours_and_Msec 0x0032   092   092   000    Old_age   Always       -       7626h+46m+45.580s 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       8171 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       4177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1181 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0182 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0187 Reported_Uncorrect      0x0012   100   100   000    Old_age   Always       -       0189 Airflow_Temperature_Cel 0x0000   030   035   000    Old_age   Offline      -       30 (Min/Max 24/35)194 Temperature_Celsius     0x0022   030   035   000    Old_age   Always       -       30 (Min/Max 24/35)195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/178007034196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/178007034204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/178007034230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0233 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       3498234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       2885241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       2885242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       868

Если вы ищете, что означают все эти значения, см. документация Kingston.

Wear_Leveling_Count - это правильный атрибут для отслеживания. Однако, как и для других атрибутов, 100 - это НАИЛУЧШЕЕ значение, а 0 - НАИХУДШЕЕ. Думайте об этом как о "оставшемся проценте жизни".

Лучший способ проверить работоспособность твердотельного накопителя - следовать рекомендациям производителя для этого. Поскольку они варьируются от производителя к производителю и могут меняться с течением времени, рекомендуется проконсультироваться с производителем ваших дисков, если у вас есть проблемы. Основываясь на показателях наработки на отказ (стандарт JEDEC JESD218A определяет метод), предоставляемых большинством производителей, твердотельный накопитель должен работать более миллиона часов без проблем.

У меня есть несколько из них, охватывающих нескольких производителей. Я могу гарантировать, что интеллектуальные атрибуты различаются у разных производителей. Для сравнения приведем пример из OCZ и интеллектуальные данные с устройства Corsair F40 вместе с обсуждением относительно того, насколько ненадежны эти данные.

Пока ИНТЕЛЛЕКТУАЛЬНЫЕ данные, безусловно, могут иметь ценность, поскольку все устройства рано или поздно выходят из строя, важно регулярно создавать резервные копии своих данных. Это обеспечивает уверенность в том, что ваши данные находятся в безопасности, пока вы ждете (вероятно, в течение нескольких лет) выхода из строя вашего твердотельного накопителя. По мере снижения затрат и увеличения емкости более вероятно, что вы замените твердотельный накопитель из-за нехватки места, чем из-за отказа. (По моему опыту, в 10 раз более вероятно). Я бы просто регулярное резервное копирование и не беспокойся об этом.

Источники:

Опыт, http://www.hardcoreware.net/mtbf-ssd-what-does-it-mean-for-you/

Для моего твердотельного накопителя (hdparm печать Model Number: CT480BX500SSD1) имя параметра было Percent_Lifetime_Remain, то есть

$ sudo smartctl -a /dev/sda | grep Percent_Lifetime_Remain

показал:

202 Percent_Lifetime_Remain 0x0030   098   098   001    Old_age   Offline      -       2

Я использую эту систему в течение ~ 4 месяцев, довольно активно (разработка серверного программного обеспечения), и пока у меня есть 2% от срока службы. Может быть, мне стоит подумать о лучшем твердотельном накопителе.

Исходя из старых школьных вращающихся дисков, я использовал инструменты для тестирования HD, которые записывали и считывали весь диск несколько раз, что занимало несколько часов. Похоже, что ни один из упомянутых инструментов не использует такой подход? Разве такой подход не имеет смысла для SSD? Что ж, тогда, похоже, SSD регистрирует свой собственный опыт и затем может определить, болен ли он. Правильно ли я это понял?

Можете ли вы добавить вывод smartctl -i /dev /sda к вашему вопросу?

@dschinn1001 Не совсем, это относится только к последним твердотельным накопителям. Известно, что твердотельные накопители первого и второго поколения имеют ограниченный срок службы в зависимости от количества операций записи на диск.

@MadsSkjern Вполне возможно использовать такой инструмент, как badblocks, для проверки состояния SSD. Однако есть очень веские причины НЕ делать этого. SSD-накопитель в моем опыте обычно выходят из строя после превышения определенного порога записи, поэтому разрушительный тест на чтение и запись, который может быть выполнен с помощью “плохих блокировок”, может фактически сократить срок службы накопителя.