Проектирование и внедрение оперативного уровня мониторинга Интегрированной системы мониторинга ИТ-инфраструктуры (IBM Tivoli Monitoring)
Цели и задачи проекта:
- Основной целью проекта является обеспечение гарантированного качества функционирования ИТ-инфраструктуры за счет:
- снижения времени обнаружения неисправностей, возникающих в ИТ-инфраструктуре Заказчика;
- снижения количества отказов компонентов ИТ-инфраструктуры;
- увеличения длительности непрерывного функционирования компонентов ИТ-инфраструктуры;
- эффективного планирования развития ИТ-инфраструктуры.
- сокращениевремени простоя объектов ИТ-инфраструктуры, за счет своевременного обнаружения отказов;
- сокращение времени локализации неисправностей;
- сокращение времени на выявление и диагностику проблемных ситуаций;
- обеспечение проактивного отслеживания и вероятностного прогнозированиясобытий, происходящих в ИТ-инфраструктуре;
- оптимизация использования существующих аппаратных мощностей;
- обеспечение процессов управления ИТ (управление инцидентами, проблемами и т.п.) необходимой информацией.
В ходе проекта предлагается решить следующие задачи:
- проектирование оперативного уровня Системы с учетом ее развития и необходимости организации следующих уровней в будущем:
- уровень консолидации и обработки событийной информации;
- уровень мониторинга ИТ-услуг.
- создание оперативного уровня автоматизированной Системы, обеспечивающего достижения всех целей проекта.
Предпосылки :
Основные информационные сервисы банка централизованы и сопровождаются из центра. Предоставление доступа к ИТ – ресурсам также осуществляется централизованно.
Бурное развитие бизнеса компании выдвигало целый ряд требований, в числе которых:
- гибкость ИТ-инфраструктуры и возможность быстро адаптироваться для своевременной реализации бизнес-инициатив;
- обеспечение надлежащего уровня информационной безопасности;
- ограничение роста численности ИТ-персонала при непрерывном росте числа эксплуатируемых систем;
- снижение издержек на эксплуатацию и сопровождение без снижения качества предоставляемых сервисов.
В результате анализа этих требований было принято решение о создании Интегрированной системы мониторинга ИТ-инфраструктуры.
Генподрядчиком проекта была выбрана компания Corporate Business Systems.
Проект стартовал в 2010 году.
Решение:
Для построения решения была выбрана программная платформа IBM Tivoli, компоненты которой позволяют строить трёхуровневую структуру:
Согласно разработанной Банком концепции построения Интегрированной системы мониторинга в рамках первого проекта было запланировано построение оперативного уровня мониторинга.
В результате реализации проекта была спроектирована архитектура и развернуты программные модули предназначенные для автоматизации решения задач мониторинга состояния сетевых устройств, систем хранения данных, источников бесперебойного питания, серверов и приложений Заказчика.
В состав информационно-вычислительных ресурсов, охваченных системой было включено:
- 26 серверов;
- сетевое оборудование: 126 маршрутизаторов, коммутаторов, ИБП, СХД и проч.;
- операционные системы серверов: MS Windows Server, IBM AIX, Sun Solaris, RedHat Enterprise Linux;
- СУБД: Microsoft SQL Server, Oracle;
- прикладное программное обеспечение: Oracle Application Server;
- служба каталогов Microsoft Active Directory;
- веб-серверы Oracle HTTP Server и Microsoft Internet Information Services;
- средство коллективной работы Microsoft SharePoint Services;
- почтовые системы: Microsoft Exchange Server.
В результате реализации проекта администраторы получили автоматизированные рабочие места, которые позволяют в консолидированном видеть виде всю картину текущего состояния работы, как своей зоны ответственности, так и общего состояния ИТ-инфраструктуры. Основные компоненты рабочего места представлены на рисунке.
Модуль мониторинга ОС и приложений предназначен для отслеживания превышения пороговых значений важных параметров функционирования ОС серверов, СУБД и приложений, сбора, хранения и предоставления исторических данных мониторинга за различные отчетные периоды. Сбор и обработка сообщений о сбоях и ошибках из журнальных файлов систем, баз данных и приложений.
Модуль сетевого мониторинга предназначен для отслеживания доступности и производительности активного сетевого оборудования, построения карты сетевой топологии, сбора, хранения и предоставления исторических данных мониторинга за различные отчетные периоды.
Модуль построения отчетности предназначен для построения отчетов по историческим данным, собираемым модулями мониторинга ОС и приложений и сетевого мониторинга.
Архитектура решения была реализована в виртуальной среде.
Взаимодействие модулей и компонентов системы изображено с помощью линий различных цветов:
(Рис. 2. Архитектура оперативного уровня Системы.)
—сбор данных мониторинга серверов, СУБД и приложений в штатном режиме функционирования.
—сбор данных мониторинга серверов, СУБД и приложений при сбое основгоно сервера мониторинга ОС и приложений.
—синхронизация данных между основным и резервным серверами мониторинга ОС иприложений, а также между основным и резервным хранилищами исторической информации мониторинга.
—сбор данных мониторинга сетевого оборудования, источников бесперебойного питания, дисковых стоек, кондиционеров и систем климат-контроля.
—передача исторической информации с сервера сетевого мониторинга в основное хранилище исторической информации (штатный режим функционирования).
—передача исторической информации с сервера сетевого мониторинга в резервное хранилище исторической информации (при сбое основного хранилища исторической информации).
Результаты:
В мае 2011 года оперативный уровень системы мониторинга был переведен в стадию промышленной эксплуатации. К этому моменту были достигнуты следующие ключевые показатели:
- созданы инструменты и организован оперативный контроль работы ИТ-инфраструктуры;
- администраторы получили инструмент, позволяющий превентивно устранять ситуации, которые могут вылиться в критические сбои работы ИТ-инфраструктуры;
- обеспечено накопление статистики показателей работы ИТ-инфраструктуры, которое позволяет выявлять проблемное оборудование и программное обеспечение;