Мониторинг и оповещения состояния критичных приложений


мониторинг


Со временем все ИТ-специалисты понимают, что лучше предупреждать проблемы? чем потом «разгребать» их последствия. Основными инструментами, которые помогают в этом не легком деле, есть автоматизация и мониторинг. Поскольку в любой компании есть программные продукты, на которых все завязано, и простой которых несет за собой громадные убытки, необходимо постоянно следить за их состоянием и быстро реагировать на возникающие проблемы.
Самым лучшим показателем состояния «здоровья» любой программы служат ее логи, но постоянно заходить и смотреть их – не целесообразно: лучше, чтобы программа сама сообщала, когда ей «плохо». Ниже описан способ мониторинга ошибок в логах любой программы с помощью бесплатной системы мониторинга корпоративного класса Zabbix.
Для примера, возьмем мониторинг логов программного продукта Microsoft SQL Server, его экземпляра, который называется просто MSSQL.

Создаем нижеописанный элемент данных, который будет каждые 30 секунд вытягивать логи из  системного журнала Windows, группа «Приложения (Applications)», источника «MSSQL» и заносить их в базу Zabbix – это очень удобно, так как администратор может видеть логии всех серверов на одной консоли и не заходить на каждый из них.
Zabbix мониторинг


Далее создадим триггер, который будет срабатывать на наличие в логах указанной нами программы событий типа «Ошибка». В результате чего будет сгенерировано событие важности «Чрезвычайная», что соответственно приведет к действиям настроенным на это событие – обычно это оповещение ИТ-специалиста по e-mail или SMS.

настройка события zabbix

Таким образом, об ошибке приложения технический персонал гарантировано узнает первым и сумеет быстро среагировать, избежав катастрофических последствий.

Владислав Качинаускас
http://efsol.ru/solutions/data-protection.html

Комментариев нет:

Отправить комментарий