Вы здесь: Главная > Программы > Мониторинг Сети Pro > Документация > Мониторинг параметров жёсткого диска S.M.A.R.T.

Мониторинг параметров жёсткого диска S.M.A.R.T.

Функция доступна только в PRO-версии программы! Поддерживаются HDD, SSD, SATA и NVMe диски.

S.M.A.R.T. - технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя. Технология S.M.A.R.T. позволяет осуществлять мониторинг параметров состояния, включая температуру жёсткого диска, его надёжности и атрибутов, предсказывающих скорый выход устройства из строя. Следует заметить, что технология S.M.A.R.T. позволяет предсказывать выход устройства из строя в результате механических неисправностей, что составляет около 60% причин поломки жесткого диска.

Программа автоматически производит оценку заданных параметров надёжности, сравнивая их значения с пороговыми и сигнализируя об опасности сбоя. Кроме этого, программа может оценивать и общее состояние диска по совокупности параметров. Для работы этой проверки необходимо установить удалённый агент на компьютере. Подробнее об агентах читайте в разделе Установка и настройка удаленного агента.

Значения датчика можно вывести на виджет, который будет размещен на дашборде или на карте сети.

 

Устранение проблем с получением данных SMART

Если программа не получает данные S.M.A.R.T. одного из ваших дисков, либо его вообще нет в списке, попробуйте перевести агент в другой режим. В нём агент будет пытаться получать данные S.M.A.R.T. через утилиту smartmontools. Для включения этой возможности откройте любым текстовым редактором конфигурационный файл агента NMAgent.ini и добавьте в него строчку:

GetSMARTMode=1

Пример:

[AGENT]
TCPPort=45668
UsePasswd=0
Passwd=
UseIPFilter=0
IPList=
GetSMARTMode=1

Сохраните файл и перезапустите службу 10-Strike Network Monitor Agent Service.

Файл NMAgent.ini может находиться в папке:

  1. c:\Program Files (x86)\10-Strike Network Monitor Agent\, если агент устанавливался отдельно от основной программы.
  2. c:\Program Files (x86)\10-Страйк Мониторинг Сети Pro\, если агент установлен локально вместе с основной программой.

 

Мониторинг SMART SSD-дисков, подключаемых через NVMe

Набор параметров S.M.A.R.T. для NVMe SSD-дисков отличается от ATA-дисков. В большинстве случаев это набор готовых показателей, без указания пороговых и наихудших значений. Вот пример S.M.A.R.T. SSD M.2 накопителя WD Blue SN500:

critical_warning: 0
temperature: 39
available_spare: 100
available_spare_threshold: 10
percentage_used: 1
data_units_read: 13733602
data_units_written: 14396473
host_reads: 365745477
host_writes: 391133456
controller_busy_time: 836
power_cycles: 1419
power_on_hours: 4612
unsafe_shutdowns: 13
media_errors: 0
num_err_log_entries: 1
warning_temp_time: 0
critical_comp_time: 0

Среди этих параметров наиболее интересными являются:

critical_warning

Параметр, сигнализирующий о состоянии диска:

  • 0 — с диском всё хорошо,
  • 1 — Ресурс носителя ниже порогового значения
  • 2 — Температура превысила пороговое значение
  • 4 — Надежность снижается из-за внутренних ошибок
  • 8 — Носитель переведен в режим только для чтения
  • 16 — Ошибка системы резервного копирования энергозависимой памяти

temperature

Температура в Цельсиях (иногда может быть в Кельвинах — нужно обращать на это внимание). Постоянные перегревы SSD могут привести к быстрому выходу его из строя, поэтому необходимо отслеживать этот параметр.

percentage_used

Израсходованный ресурс SSD в процентах. Как только этот параметр  достигнет 100%, SSD перейдёт в режим для чтения (заблокируется). Это очень важный параметр, который нуждается в мониторинге. Задача администратора — заблаговременно отследить те диски, остаток ресурса которых приближается к максимальному значению, и заменить их.

media_errors

Количество случаев, когда контроллер обнаружил неустранимую ошибку целостности данных. Если значение этого параметра постоянно растёт, следует подумать о замене SSD на новый.

num_err_log_entries

Количество записей журнала с информацией об ошибках за весь срок службы контроллера. Как и в предыдущем случае, следует обращать внимание на рост этого параметра.

 

Мониторинг SMART старых SSD-дисков, подключаемых через SATA

Здоровье SSD-дисков, выпущенных до появления протокола обмена NVMe, также можно мониторить. Такие диски могут выдавать значения показателя типа «общее количество записанных секторов LBA» (Total LBA Written). Этот счетчик показывает сколько секторов по 512 байт было записано на диск за всю историю его работы. Возможны варианты:

241 - Total LBA Written (всего записано LBA) - общее количество секторов по 512 байт, записанных за весь срок службы устройства.

или

175 - Host_Writes_MiB - сколько всего было записано МБ на диск.

Пороговое значение по объему записи на диск за срок его службы (или endurance lifespan) вы можете найти в документации на SSD-диск на сайте производителя или в инструкции. Его обычно измеряют в терабайтах (ТБ) или в записанных терабайтах (по-английски это TB Written или TBW). Типовые значения для современных дисков составляют от 40 (для моделей возрастом от 5-10 лет) до нескольких сотен ТБ (для современных дисков). При настройке проверки нужно указать общий ресурс диска с сайта производителя. Программа будет считывать текущий показатель объема записи и сравнивать с макмимальным значением, вычисляя остаточный ресурс.

С помощью нашей программы вы можете настроить мониторинг этих параметров и задать критические значения объема записи для диска, после выхода за которые, программа вас оповестит. Вы также можете наблюдать текущие значения записанных объемов в процентах от дозволенного максимума на прямоугольных индикаторах.

Вы также можете проверять и другие аттрибуты, например, рост числа ошибок. Набор получаемых параметров с диска вы увидите в окне настройки SMART-проверки в программе.

 

Программа работает в среде Windows XP/Vista/7/8.1/10/11, Server 2003/2008/2012/2016/2019/2022. Вы можете скачать и попробовать 30-дневную пробную версию бесплатно.