Впечатления о Lanstate Pro v7.2

PriCOOLisT
Отправлено: 01.08.14 09:11

Хозяйство растёт, на сегодняшний день около 30 серверов самых разнообразных от обычных компов до серьёзных тачек типа HP Proliant, бесперебойниками, свичами, сетевыми хранилищами, и т.д, и с соответствующими задачами, цель которых одна: чтоб юзера 365 дней в году, 7 дней в неделю, 24 часа в сутки пахали не отрываясь от мониторов, и не напрягали нас админов.
С таким разнообразием необходимость системы мониторинга с оповещением встала сама собой. «Да поможет мне гугль» - я начал изучать какие существуют системы, скачивать, устанавливать, тестировать.
Одна из первых, попавшихся была Microsoft System Center 2012 R2 Ru Configuration Manager. Поковырявшись пару дней, мне стало тоскливо он обилия и сложности её настроек. Полез в гугль дальше.
Следующей системой по количеству отзывов и визгов от восторгов была Zabbix. Бесплатная, ресурсов не жрущая, на русском языке, с обилием примеров. Была развернута, несколько дней эксплуатировалась, и уже принималось решение об окончательном её утверждении, как попалась ещё одна система мониторинга LanState Pro.
Lanstate Pro на удивлении оказалось простой до невозможности, ресурсов не жрущая, на русском языке, с поддержкой всяких вариантов мониторинга от SNMP до скриптов и много приятных вкусностей, чем полностью удовлетворяло поставленным мною задачам. Окончательно была принята именно она.

Поставленные задачи. Есть в здании комната, то бишь серверная, набита сверху донизу стойками, серверами и т.д. Необходимо следить:
1. Сервер работает\не работает. Как показывает практика, если пингуется – значит пашет. Если нет, то оповещение не особо то и нужно, юзера затрахают звонками. Но пусть будет.
2. Физическое состояние жестких дисков в раидах и без раидов. Если вдруг винт отвалился – немедленно оповестить.
3. Температуру в серверной, на камнях, материнках. Хоть она и оборудована кондиционерами – всяко разное бывает.
4. Блоки питания на серверах работает\не работает.
5. Вентиляторы крутятся\не крутятся
6. Мониторинг бесперебойников работает\не работает, температуру, нагрузку, напряжение.
7. Мониторинг сетевых хранилищ и физическое состояние в них винтов. Ну и температура до кучи.
8. Сетевые коммутаторы работают\не работают, нагрузка, температура.
9. Интернет работает\не работает.
10. Сколько свободного места осталась на винтах.
11. Несколько служб и процессов, которые могут отвалится, зависнуть и т.д. когда угодно в любое время по неведомым причинам.
12. Архивация успешно завершена\не завершена
13. Принтер в приемной у «тупой секретарши» с оповещением кончается уровень катриджа\нет бумаги\зажевал бумагу…

Lansata Pro v7.2 установлена на одном из серверов Windows Server 2008 R2 SP1 Ent Ru, отожрала памяти 103084 Кб, и 17 Мб на диске. Пустяк. В качестве модема для отправки смсок в usb порт воткнул старенькую мобилу Nokia. Она сама прописалась в устройствах, села на порт COM3.
Запустил Мастер создания карты, понатыкал галочек исходя из соображений «Найти всё». Lanstate pro начала сканировать мои сети, минут надцать пыхтела, выдала мне туеву хучу компов, серверов и устройств всё что нашла, свалила в кучу – На! Разгребай! Я сначала ахринел от изобилия устройств в моей сети (думал поменьше будет), удалил их с карты. Лучше я сам вручную всё добавлю. (в итоге мониторится у меня 57 устройств).

Теперь по порядку.
1. Мониторинг коммутаторов.
У меня они одной серии HP V1910 как 24 так и 48 портовые. Сперва лезу в его настройки по вебу, обновляю прошивку до последней версии, далее в меню Device\SNMP ставлю галочки на пунктах «Enable», «SNMP Version v1, v2, v3» (хотя мне достаточно v1), потом в меню Community добавляю Community Name имя «public» с правами «Read only».

В Lanstate Pro добавляю новое устройство, тип указываю «Коммутатор» (значки красявошные и понятные), в поле имя или адрес хоста вбиваю его ip-адрес, жму на кнопку «Определить», вижу что он увиделся, перехожу на вкладку SNMP, ставлю галочку «Агент есть», выбираю «SNMP v1», в поле Community string пишу «public». Готово. Он на карте появился. Лезу в его свойства «Информация о системе\SNMP-информация». В правом нижнем углу жму на «Получить информацию». Если всё сделали правильно, то на экране появиться всяка-разная информация о коммутаторе. Далее перехожу на вкладку «Дамп», жму «Получить информацию», жду некоторое время. Lanstate Pro опрашивает коммутатор и выдает на экран много много строк с OIDдами, именем, типом, и значением. Погуглив я нашёл те OIDы которые меня интересуют:
1.3.6.1.4.1.25506.2.6.1.1.1.1.12.8 – температура
1.3.6.1.4.1.25506.2.6.1.1.1.1.6.8 – нагрузка процессора в %
1.3.6.1.4.1.25506.2.6.1.1.1.1.8.8 – использованной памяти в %
Вот на них я и настрою мониторинг с оповещением. Снова лезу в свойства коммутатора, «Настройка мониторинга\Добавить\SNMP и начинаю заполнять поля:
Community: public
Object ID (OID): 1.3.6.1.4.1.25506.2.6.1.1.1.1.12.8 (это температура)
Время ожидания (мс): 500
Попыток: 2
Тип значения: число (температура выдается числом в цельсиях)
Проверка прошла, если: значение «в диапазоне» от «10» до «70» (если меньше 10 градусов – значит коммутатор видимо мерзнет, если станет 71 градус, то скоро расплавится)
Если нажать кнопку «Получить», то можно посмотреть его текущую температуру.

«Далее» на шаге 2 можно указать «Зависимости проверки и другие параметры». Я лишь ставлю 5 попыток, с задержкой 30 сек. Типа если 5 раз подряд с интервалом 30 сек температура вышла за пределы диапазона, то значит надо оповестить.
«Далее» на шаге 3 указываем как хотим оповещаться. Тут настроек всяких много. Я лишь ставлю галочку «Выдать сообщение, если проверка не прошла», «Отправить SMS на мобильный телефон», вбиваю номера телефонов, «Текст сообщения для неуспешной проверки «Ахтунг! Всё пропало! Горит коммутатор ip-adress»», жму кнопку «Тест». Гдето через 30-40 сек смска приходит.
Когда впервые тестировал, до кучи указал номер телефона начальника своего. После отправки смски он с другого этажа моментально прибежал «Чо за н…х?» Продемонстрировав ему возможности оповещения он протащился, обрадовался, распорядился выделить вместо моей старенькой мобилы новый модем Cinterion MC52i, и корпоративной симкой. Подключается напрямую к COM – порту.
Затем также добавляю остальные OIDы с нагрузкой, и памятью. Для мониторинга коммутатора вполне хватает.

Обнаружил приятную фишку «Порт на коммутаторе». Если коммутаторы настроены выше указанным способом, то без проблем можно определить на каком порту подключено любое сетевое устройство. Мелочь, а приятно.

Комментарии

  • 2. Мониторинг состояния жестких дисков на серверах.
    Винты иногда выходят из строя. Причины бывают всякие, описывать не буду.
    Львиная доля моих серверов работает под Windows Server 2003 и выше. Недолго думая, я добавляю «Службу SNMP», в её настройках безопасности прописываю «public». Как её установить можно прочесть тут: http://www.naumen.ru/products/service_desk/network_manager/docs/index.htm?nm_snmp_enabling_windows.htm
    Через Lanstate Pro, SNMP, вкладка «Дамп» получаю все его оиды. Я расчитывал, что она сумеет опросить smart жестких дисков. Не тут то было. Оказывается, штатными средствами винды, и Lanstate Pro опросить smart жестких дисков не получиться. По SNMP тут только можно получить инфу о раиде, разделах, файловой системе, свободном месте и т.д.
    В Lanstate Pro есть такая замечательная штука как WMI. Погуглив я нашел несколько классов
    Win32_DiskDrive, Win32_DiskPartition, Win32_PhysicalMedia. Хорошая статья с их описанием тут: http://scriptcoding.ru/2013/12/03/win32_diskdrive-informacija-o-zestkom-diske/
    Создаёте монитор, выберите WMI, в поле «Текст WQL-запроса» введите например
    Select * from Win32_DiskDrive, нажмите на кнопку получить. Запрос обработается. Затем в поле «Проверка прошла, если значение поля» раскройте получившийся список, выбирайте необходимый параметр, и дальше настраивайте мониторинг. Достаточно много параметров можно опросить.
    Но опроса smart жестких дисков так и не получите.

    Почесав лысину, я вспомнил, что все мои сервера HP Proliant, имеют ILO v4, с там есть настройка, связанная с SNMP.
    Настроил ILO v4 на всех серверах. Через Lanstate Pro вышеуказанным способом получил все оиды. Погуглил их описание, и выудил то что мне необходимо:
    1.3.6.1.4.1.232.6.2.6.8.1.4.0.2 - CPU1 температура
    1.3.6.1.4.1.232.6.2.6.8.1.4.0.3 - CPU2 температура
    1.3.6.1.4.1.232.6.2.6.8.1.4.0.13 - Chipset температура
    1.3.6.1.4.1.232.6.2.6.8.1.4.0.25 - HD Controller температура
    1.3.6.1.4.1.232.6.2.9.3.1.6.0.1 - Напряжение на БП1
    1.3.6.1.4.1.232.6.2.9.3.1.6.0.2 - Напряжение на БП2
    1.3.6.1.4.1.232.3.2.5.1.1.6.0.x - Физическое состояние HDD.
    Результат x:
    1 - не признает винт
    2 - Ок
    3 - Не работает. Заменить
    4 - Скоро сломается. Заменить.
    Выше указанным способом настроил мониторинг на всех серверах с заданными диапазонами и оповещением. Если вдруг повысится температура в серверах, отвалится винт, напряжение на БП Lansate Pro немедленно меня оповестит смской.
    Но у меня ещё есть сервера Asus, там ILO нету, обычный биос, и простая ASMB KVM для удаленного управления. Пока что, средствами WMI прикрутил мониторить состояние раид массива, сколько места осталось на дисках, и прочую мелочь.
    Надеюсь в следующих версиях разработчики Lanstate Pro что нить да придумают, как smart hdd drive опросить удаленно.
    Здесь же хочу обмолвиться о мониторинге кулеров. На моих серверах HP Proliant их 6 штук стоит. В описании упоминается об их оидах. Я их искал… Не нашёл. Видимо плохо искал. Найду, но позже.
    Кулера можно мониторить и средствами WMI. Для этого есть класс win32_fan. Получите параметры через Select * from Win32_Fan и мониторте. Но не факт, что будет работать. В общем я так и не понял причину почему на некоторых компах Win32_Fan работает, а на других нет. Например, мой рабочий комп, мать Asus, винда 8.1 x64, установлены все фреймворки, обновления, драйверы через Driver Pack Solution 14.7 – опрос проходит. У коллеги тоже мать asus, винда 7, обновления наполовину и когда как установлены – опрос не проходит.

    3. Мониторинг бесперебойников питания APC.
    Ничем не отличается от настройки коммутаторов. Всё тоже самое.
    Температура встроенного датчика [C]: 1.3.6.1.4.1.318.1.1.1.2.2.2.0
    Текущая нагрузка [%]: 1.3.6.1.4.1.318.1.1.1.4.2.3.0
    Входное напряжение [Вольт]: 1.3.6.1.4.1.318.1.1.1.3.2.1.0
    Напряжение на выходе [Вольт]: 1.3.6.1.4.1.318.1.1.1.4.2.1.0
    Уровень зарядки батарей %: 1.3.6.1.4.1.318.1.1.1.2.2.1.0

    4. Мониторинг сетевых хранилищ.
    Опять-таки настраиваются точно также как коммутаторы и бесперебойники. Я использую фирмы QNAP, погуглив без проблем можно найти ихние описания оидов. Я у себя опрашиваю лишь состояния винтов.
    1.3.6.1.4.1.24681.1.2.11.1.7.x - состояние HDD (GOOD)
    X – номер винта. Если возвращает значение GOOD (тут уже не число, а строка), то значит всё в порядке. Настроил, надо же проверить!!! Подошёл к нему, 3ий винт выдернул. Через пару минут пришла смска «Отвалился HDD3 на QNAP №1». Работает!

    5. Мониторинг интернета.
    Ну тут просто, создал на карте компьютер с ip-адресом 8.8.8.8 (гугль), монитор пинга прикручивается по умолчанию. Если есть пинг – значит инет пашет, если нет, то придёт смска «Отвалился интернет».

    6. Мониторинг служб и процессов. Lansatae Pro здесь предлагает обширные возможности. Вдаваться в подробности не буду, легко разобраться. Выбираем службу и процесс который хотим мониторить, указываем дальнейшие действия в случае отказа. Всё отлично работает.

    7. Мониторинг архивации. Без неё никуда. У меня много чего архивируется, на сетевые хранилища, например акрониксом ночью, в заданное время, ежедневно делается образа серверов, хранится 3 дня. В Lanstate Pro есть пункты «Существование папки, Существование файла, Размер файла, Дата файла». Используя их можно настроить мониторинг проверки работы системы архивации, например появился файл с архивом в указанной папке, или нет.
    Но есть пожелание к разработчикам: добавьте в указании пути не только подстановочный знак «*», но и переменные %date% и %time%. Например у меня скрипт архивации создает файл в формате %date%.txt. В Lanastate Pro эта подстановка не прокатывает.

    8. Мониторинг принтера. Есть у нас сетевой принтер HP LJ M1530 MFP в приемной, печатает секретарша, и директор иногда. Погуглив нашел для него 3 оида:
    1.3.6.1.2.1.43.10.2.1.4.1.1 - количество распетанных листов у HP
    1.3.6.1.2.1.43.11.1.1.9.1.1 - Остаток картриджа (в численном эквиваленте):
    1.3.6.1.2.1.43.11.1.1.8.1.12- Емкость картриджа

    Вывод: Lanstate Pro приятственная и зачотная софтина за такие деньги. Немножко доработать и «будет всем счастье».
Войдите или Зарегистрируйтесь чтобы комментировать.