Что такое SMART и как его использовать для прогнозирования отказа жесткого диска или твердотельного накопителя

Многие из нас сталкивались с отказом жесткого диска или SSD. Некоторые из нас даже пытались узнать больше о надежности жестких дисков и их скрытой функции прогнозирования(hidden prediction function) , являющейся частью технологии под названием SMART . Можно возразить, что SMART не так надежен, поскольку не во всех случаях предсказывает отказ. Этот факт отчасти верен, но реальная внутренняя работа этой системы самоконтроля не так проста, поэтому давайте рассмотрим, как работает SMART . Мы также собираемся показать вам, как проверить статус SMART жесткого диска , а также статус (HDD SMART status)SMART(SMART status) твердотельного накопителя :

Что такое SMART (HDD и SSD)?

SMART — это система, которая отслеживает внутреннюю информацию вашего диска. (SMART is a system that monitors the internal information of your drive.)Его умное название(clever name) на самом деле является аббревиатурой от Self-Monitoring, Analysis, and Reporting Technology . SMART , также пишется как SMART , представляет собой технологию, используемую внутри жестких дисков и твердотельных накопителей(HDDs and SSDs) . Он не зависит от вашей операционной системы(operating system) , BIOS или другого программного обеспечения.

Что делает SMART для жестких дисков и твердотельных накопителей(HDDs and SSDs) ?

SMART был изобретен, потому что компьютерам нужно было что-то, что могло бы контролировать состояние(health state) их жестких дисков. Проще говоря, это означает, что SMART должен быть в состоянии сказать вам, если ваш жесткий диск или твердотельный накопитель вот-вот перестанет работать(SMART should supposedly be able to tell you if your hard drive or solid-state drive is about to stop working) !

Информация о состоянии диска предоставляется SMART.

Как СМАРТ(SMART) это делает? У вас может возникнуть соблазн подумать, что SMART может волшебным образом угадать, исправен ли ваш диск. 🙂 Но то, что он делает, это совсем другая история. SMART отслеживает ряд переменных(SMART keeps track of a series of variables) , количество и тип которых различаются от диска к диску, что является показателем его надежности(indicators of its reliability) . Если вы хотите получить подробное представление обо всех атрибутах SMART , поскольку их около 50 (грубая частота ошибок(error rate) чтения , время раскрутки, сообщения о неисправимых ошибках, время включения, количество циклов(cycle count) загрузки и т. , посетите эту веб-страницу(visit this webpage) .

Однако знайте, что, за исключением некоторых единичных попыток ( Google , Backblaze ), большинство SMART . данные недокументированы. Система предоставляет большое количество внутренних данных. Тем не менее, в статистике есть много несоответствий, потому что многие производители жестких дисков используют разные определения и измерения. Например, некоторые производители хранят данные о времени включения в часах, а другие измеряют их в минутах или секундах. Кроме того, они не объясняют, какие из различных атрибутов или переменных заслуживают нашего внимания, что заставляет нас тонуть в данных.

Прежде чем пытаться понять, какие атрибуты SMART имеют значение, мы сначала должны провести различие между основными типами сбоев SSD и HDD: предсказуемыми и непредсказуемыми(SSD and HDD failures: predictable and non-predictable) .

Подробности SMART для твердотельного накопителя

К предсказуемым отказам(Predictable failures) относятся возникающие во времени поломки, вызванные неисправной механикой диска или повреждениями поверхности диска в случае жестких дисков. Для твердотельных накопителей предсказуемые сбои могут включать естественный износ с течением времени или большое количество неудачных попыток стирания. Со временем проблемы(Problems) усугубляются, и в конечном итоге диск выходит из строя.

Непредсказуемые сбои(Non-predictable failures) вызываются внезапными событиями, к которым можно отнести, например, внезапные скачки напряжения или неожиданное повреждение схемы внутри жесткого диска или твердотельного накопителя. Важно понимать, что SMART может помочь вам обнаружить только предсказуемые сбои(S.M.A.R.T. can only help you detect predictable failures) .

Теперь, когда у вас есть общее представление о том, что такое SMART и что он делает, давайте посмотрим, как проверить статус SMART(SMART status) ваших дисков из Windows , а затем также как прочитать и интерпретировать данные SMART :

Как проверить состояние SSD и HDD SMART(SSD and HDD SMART status)

На компьютерах и устройствах Windows самый простой способ прочитать данные SMART с жесткого диска или твердотельного накопителя(SSD) — использовать специализированные приложения. Их довольно много, но многие из них либо плохо развиты, либо стоят денег(cost money) . Из всех приложений, которые могут считывать данные SMART , лучшим и тем, которое мы рекомендуем вам использовать, является CrystalDiskInfo . Это бесплатное приложение, способное считывать атрибуты SMART , а также одно из немногих таких приложений, которое может получать данные SMART как из IDE ( PATA ), SATA , так и из NVMe.дисков, а также с портативных дисков, использующих e SATA , USB или IEEE 1394 .

CrystalDiskInfo показывает подробную информацию о диске с помощью SMART

Еще один отличный способ проверить состояние SMART и сведения(SMART status and details) о жестком диске или твердотельном накопителе(HDD or SSD) — использовать приложения, предоставленные его производителем. Например, большинство твердотельных накопителей сопровождаются приложениями поддержки(support apps) , которые позволяют вам проверять информацию о них, проверять их работоспособность, запускать диагностику и т. д. Эти приложения обычно включают параметры для проверки статуса SMART(SMART status) .

Производители накопителей предлагают приложения, которые могут считывать информацию SMART.

Третий способ проверки состояния SMART(SMART status) вашего жесткого диска или SSD(disk drive or SSD) предлагается в Windows 10 . Он не показывает подробности, но может сообщить вам, в порядке ли состояние SMART(SMART status) ваших дисков или нет. Чтобы проверить SMART , откройте командную строку(Command Prompt) и выполните следующую команду: wmic diskdrive get model, status . Команда выводит список дисков, подключенных к вашему ПК, и показывает статус SMART(SMART status) для каждого из них.

Windows 10 позволяет вам проверять состояние SMART ваших дисков

Этот последний метод проверки состояния SMART(SMART status) , вероятно, является самым быстрым способом в Windows 10 проверить, не выходят ли из строя ваши диски.

Как запустить тест SSD или HDD SMART

Если вас не устраивает просто чтение SMART-статуса(SMART status) ваших дисков, вы также можете запустить SMART-тест SSD или HDD(SSD or HDD SMART test) . Это легче сказать, чем сделать, потому что для этой цели вам нужно специальное приложение. Соответственно, мы посчитали, что это тема, достойная отдельной статьи, доступ к которой вы можете получить по этой ссылке: Протестируйте свой HDD или SSD(HDD or SSD) и проверьте его состояние здоровья(health status) .

Как читать значения и атрибуты SMART

Состояние работоспособности(health status) жесткого диска постоянно проверяется и контролируется несколькими датчиками. Значения измеряются с использованием типичных алгоритмов, а затем в соответствии с результатами настраиваются соответствующие атрибуты.

В любой программе мониторинга(monitoring program) SMART вы должны увидеть атрибуты, содержащие хотя бы некоторые из этих полей:

  • Идентификатор:(Identifier:) определение атрибута. Обычно он имеет стандартное значение и обозначается числом от 1 до 250 (например, 9 — это Power-on Count ). Тем не менее, все инструменты мониторинга и тестирования дисков(disk monitoring and testing tools) предоставляют имя и текстовое описание атрибута.
  • Порог:(Threshold:) минимальное значение атрибута. Если это значение достигнуто, ваш диск вот-вот выйдет из строя.
  • Значение:(Value:) текущее значение атрибута. Алгоритм вычисляет это число на основе необработанных данных. Новый жесткий диск должен иметь высокий теоретический максимум (100, 200 или 253 в зависимости от производителя), который уменьшается в течение срока службы.
  • Худшее:(Worst:) наименьшее значение атрибута, когда-либо зарегистрированное.
  • Данные:(Data:) необработанные измеренные значения, предоставленные датчиком или счетчиком. Это данные, используемые алгоритмом, разработанным производителем жесткого диска или твердотельного накопителя(HDD or SSD) . Его содержимое зависит от атрибута и производителя накопителя. Обычные пользователи должны пропустить это.
  • Флаги:(Flags:) назначение атрибута. Обычно это устанавливается производителем и поэтому зависит(manufacturer and therefore varies) от привода. Каждый из атрибутов является либо критическим и может предсказывать скорый сбой (например, количество перераспределенных секторов ID 5 ), либо статистическим, не влияющим напрямую на состояние (например, количество неожиданных потерь питания (power loss count)ID 174 ).

Атрибуты SMART описываются такими данными, как их идентификатор, текущее значение, наихудшее значение и пороговое значение.

Пытаясь понять статус любого атрибута SMART, проверьте значения этих трех полей: значение, пороговое значение и флаги(to understand the status of any S.M.A.R.T. attribute, check the values of these three fields: value, threshold, and flags) . Кроме того, помните, что, как правило, меньшие значения указывают на снижение надежности(smaller values are an indication of a decrease in reliability) .

Как использовать SMART для прогнозирования отказа жесткого диска или твердотельного накопителя(HDD or SSD) (основные значения для проверки)

Не все СМАРТ(S.M.A.R.T) . атрибуты имеют решающее значение для прогнозирования отказов(failure prediction) . Два вышеупомянутых исследования частоты отказов жестких дисков(drive failure) и другие источники согласны с тем, что важной помощью в выявлении неисправных дисков являются:

  • Количество перераспределенных секторов(Reallocated sector counts) . Перераспределение происходит, когда логика диска переназначает поврежденный сектор в результате повторяющихся программных или жестких ошибок на новый физический сектор из его запасных. Этот атрибут отражает, сколько раз произошло переназначение. Если его значение увеличивается, это свидетельствует об износе жесткого диска или твердотельного накопителя.

  • Текущее число незавершенных секторов(Current Pending Sector Count) . При этом учитываются «нестабильные» сектора, то есть поврежденные с ошибками чтения, ожидающие переназначения, своего рода «испытательная» система. Алгоритмы SMART неоднозначно понимают этот конкретный атрибут, поскольку он иногда неубедителен. Тем не менее, он может обеспечить более раннее предупреждение о возможных проблемах.

  • Сообщается о неисправимых ошибках(Reported Uncorrectable Errors) . Это подсчет ошибок, которые невозможно исправить, и он полезен, потому что кажется, что он имеет одинаковое значение для всех производителей.

  • Стереть счетчик неудач(Erase Fail Count) . Это отличный показатель преждевременной смерти твердотельного накопителя. Он подсчитывает количество неудачных попыток удаления данных, и увеличение значения говорит о том, что срок службы флэш-памяти внутри SSD близок к концу.

  • Счетчик выравнивания износа(Wear Leveling Count) . Это также особенно полезно для SSD. Производители устанавливают ожидаемый срок службы SSD в своих данных SMART. Счетчик выравнивания износа(Wear Leveling Count) — это оценка состояния вашего диска. Он рассчитывается с использованием алгоритма, учитывающего предопределенный ожидаемый срок службы и количество циклов (запись, стирание и т. д.), которые может выполнить каждый блок флэш-памяти, прежде чем истечет срок его службы.

  • Температура диска(Disk temperature) — очень обсуждаемый параметр. Тем не менее считается, что значения выше 60°C могут сократить срок службы жесткого диска или твердотельного накопителя и увеличить вероятность их повреждения. Мы рекомендуем использовать вентилятор, чтобы снизить температуру дисков и продлить срок их службы.

Значения SMART, превышающие пороговое значение, могут указывать на возможные сбои диска в будущем.

Вышеупомянутый СМАРТ(S.M.A.R.T) . атрибуты относительно легко интерпретировать. Если вы заметили увеличение их значений, возможно, ваш диск вышел из строя, поэтому вам лучше начать резервное копирование. Однако, несмотря на то, что это полезные индикаторы надежности накопителя, не забывайте, что они не являются надежными.

Историческая справка о SMART

SMART разрабатывался с 1992(year 1992) года, хотя теперь вы знаете, что он включен во все современные твердотельные накопители и жесткие диски. Его история охватывает множество названий, таких как Predictive Failure Analysis или IntelliSafe(Predictive Failure Analysis or IntelliSafe) , и информацию от всех основных производителей жестких дисков: IBM , Seagate , Quantum , Western Digital . Наконец, его документация впервые была представлена ​​в 2004 году в рамках стандарта Parallel ATA и впоследствии регулярно пересматривалась. Последняя была выпущена в 2011 году.

Есть ли что-нибудь еще, что вы хотели бы знать о SSD и HDD SMART(SSD and HDD SMART) ?

Это было наше краткое исследование внутреннего устройства SMART и его возможностей отслеживать, тестировать и прогнозировать сбои жестких дисков. Основная точка зрения, которую вы должны помнить, заключается в том, что эта система самоконтроля может помочь вам проверить состояние здоровья(health status) вашего жесткого диска(HDD) . Если вы хотите использовать эти данные SMART,(S.M.A.R.T data) чтобы узнать, есть ли проблемы с вашим собственным диском, прочитайте статьи, которые мы рекомендовали в этом руководстве. Также для вопросов используйте форму комментариев ниже, и давайте обсудим.



About the author

Я инженер-программист с более чем 10-летним опытом работы в индустрии Xbox. Я специализируюсь на разработке игр и тестировании безопасности. Я также являюсь опытным обозревателем и работал над проектами для некоторых из самых известных игровых компаний, включая Ubisoft, Microsoft и Sony. В свободное время я люблю играть в видеоигры и смотреть сериалы.



Related posts