понедельник, 24 февраля 2014 г.

Комплексная система мониторинга ИТ - Часть 5

продолжаем - http://anrad13.blogspot.ru/2014/02/4.html

Часть 5 - Принятие решений или Подсистема корреляции и обобщения данных контроля

Надо сказать что смерть больших систем мониторинга наступает как раз часто из-за отсутствия инструментов аналитики для ИТ менеджмента и диспетчерских групп.  Если нет реального потребителя, то система не нужна. И то что должно давать информацию для CIO, так и остается инструментом сисадмина за шесть нулей американских денег.


В этой части я опишу свой взгляд на ядро комплексной системы мониторинга, собственно это и есть сама суть комплексного мониторинга, а все остальное нежно рассматривать всего лишь как некие "коннекторы", поставщики данных.




Как работает подсистема корреляции? Достаточно просто
Данные контроля из других систем мониторинга собираются в единую базу событий (события мониторинга) и единую базу показателей (суть численные параметры контроля)

Далее с использованием единой базы взаимосвязей и правил расчета метрик работоспособности, подсистема контроля состояния процессов и сервисов формирует «наглядную картинку» ЧТО и ГДЕ? Что не работает и где сломалось.

Дополнительно наличие единой базы событий позволяет проводит исторический анализ и прогнозировать возможные проблемы в будущем. Например на основе учащающихся кратковременных пиковых нагрузок на процессор, можно спрогнозировать проблемы с прохождением бизнес-процесса

Безусловно в этой подсистеме главным и самым трудоемким является обеспечение адекватной БД взаимосвязей. Ее поддержание представляет из себя достаточно сложную задачу.

Но прогресс не стоит на месте и то что приходилось делать раньше вручную, теперь делается автоматически на основе так называемых «типовых профилей работы»
Которые позволяют контролировать не отдельные события, а динамику их изменения или отклонения от «обычной» базовой линии, которая определяется автоматически

Это сердце этой системы.
А лицом системы являются обобщенные экраны мониторинга. Графические схемы которые позволяют «одним взглядом» держать всю картину ИТ


На чем это реализовывать?
А фиг его знает.
Я реально не знаю более менее успешных внедрений.
И не могу сказать что вот эта система все умеет. Из того что я видел, наиболее мне нравится Universal CMDB from HP. Но работа с ней требует вложений персонала и наличия такой редко встречаемой позиции как Главный архитектор ИТ предприятия.

Обзорные экраны - тоже проблема.
То что есть в любом ПО для АСУ ТП, точему-то нет в системах мониторинга ИТ. Хотя сейчас может и есть. По крайней мере произвольные мигающие схемы можно рисовать в IBM BSM.
В собственном проекте мы используем собственные наработки для экранов мониторинга для пунктов управления, которые позволяют получать произвольное количество графических схем-индикаторов в нужной нам конфигурации. 
А для расчета интегральных статусов мы используем собственный движок и XML файл правил в формате логических схем.

Комментариев нет:

Отправить комментарий