Современная система мониторинга и управления ИТ - инфраструктурой 2011 г.

Содержание

Слайд 2

О фирме Pronet Основана в 1997 году Более 170 специалистов в

О фирме Pronet

Основана в 1997 году
Более 170 специалистов в различных регионах
Законченные

проекты, отмеченные наградами
Высококвалифицированный персонал
Процессно-ориентированное управление проектами
Партнерские отношения с различными вендорами
Консалтинговые услуги
Слайд 3

Тренды сов. систем мониторинга Смена реактивного мониторинга на проактивный; Средства прогнозирования

Тренды сов. систем мониторинга

Смена реактивного мониторинга на проактивный;
Средства прогнозирования аварий и

самообучения;
Удобство и простота (установка, экспл., поддержка);
Выявление корневых причин (root case);
Использование CMDB, РСМ, продуктов авт. ITSM;
Готовые средства интеграции с различными ИС;
Динамические пороги, профилей поведения ОМ;
Гибкая корреляция событий, интеллектуальное подавление «шума», предсказание поведения ОМ;
Наличие готовых workflow для определенных ОМ, событий.

ОМ – объект мониторинга

ИС – Информационные Системы

Слайд 4

Требования к системам мониторинга Наглядное представление о качестве работы ИТ-инфраструктуры и

Требования к системам мониторинга

Наглядное представление о качестве работы ИТ-инфраструктуры и ключевых

БУ;
Сокращение времени восстановления работы БС;
Оценка качества предоставляемых услуг (SLA);
Работа со всеми типами ИТ-инфраструктуры;
Расчет не только KPI, но и Health Indicators (понятных для бизнес-пользователей);
Имитация проверок работы БУ со стороны конечного пользователя;
Приоритезация для критичных инцидентов;
Повышение эффективности работы персонала;
Способность работать в изменяющейся ИТ среде.

БУ – бизнес услуга

Слайд 5

ПО предлагаемое нами для мониторинга BMC ProactiveNet Performance Management (BPPM) BMC

ПО предлагаемое нами для мониторинга

BMC ProactiveNet Performance Management (BPPM)
BMC AppSight

Application Problem Resolution
BMC Transaction Management ART
BMC Performance Manager (Portal)
BMC Performance Manager (PATROL)
BMC BladeLogic Configuration for Servers
CA Spectrum Network Fault Manager Suite
CA UniCenter
Слайд 6

Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic,

Консоль управления

События и показатели производительности

Мониторинг

End User Experience
(Synthetic, Real)

Agent/KM & Agentless
(System, Application,

DB, Network, Storage, MF)

3rd Party
(HP, CA, IBM, VMware, MSFT, SAP, etc.)
Business KPI

Performance
Management
Database

Deep App Diagnostics

Функциональная схема системы (BPPM)

Слайд 7

Hardware Management IBM, HP, Dell, Sun, Fujitsu-Siemens, NEC, Adaptec HP Insight

Hardware Management
IBM, HP, Dell, Sun, Fujitsu-Siemens, NEC, Adaptec
HP Insight Manager
Dell

OpenManage
Storage devices (NetApp)
Power Monitoring
High Availability & Backup Tools
Server Management
IBM AIX, HP-UX, Sun Solaris
Red Hat Linux, SUSE Linux, Oracle Enterprise Linux
Microsoft Windows/XP/Vista/Active Directory
IBM iSeries, HP OpenVMS
Virtual Server Management
AIX LPAR/WPAR
Citrix XenServer (new in 8.x)
HP UX nPar/vPar/VM Host/VM Guest
Microsoft Hyper-V
Sun Solaris Zones/Containers and Logical Domains
VMWare (vCenter, ESX, ESXi)
Application Management
Citrix (Metaframe, Presentation Server, WTS)
Microsoft Exchange, Lotus Domino
SAP (NetWeaver, Enterprise Portal, R/3, CRM, SCM, BW, Web App)
Oracle Fusion, Oracle eBusiness, Siebel, PeopleSoft
Microsoft SharePoint
High Availability & Backup

Deep Application Diagnostics
Oracle (BEA) WebLogic
IBM WebSphere
Tomcat
Jboss
Web Servers
Apache, Tomcat & Generic J2EE Web Servers
IIS (Apache, Microsoft, Netscape, SendMail, Bind DNS)
App Servers
IBM WebSphere Application Server
Oracle/BEA WebLogic Server
Oracle Application Server
SunOne, ATG Dynamo, Jboss Web App Servers
Middleware
BEA Tuxedo
IBM WebSphere MQ (MSM)
Database Management
Oracle
Microsoft SQL Server
Sybase
DB2 Universal Database
Informix
MySQL
Network Management
VPN/Firewall-1, Checkpoint, NG
Network devices (SNMP-based)

Мониторинг инфраструктуры (out-of-box)

Слайд 8

Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic,

Консоль управления

События и показатели производительности

Мониторинг

End User Experience
(Synthetic, Real)

Agent/KM & Agentless
(System, Application,

DB, Network, Storage, MF)

3rd Party
(HP, CA, IBM, VMware, MSFT, SAP, etc.)
Business KPI

Performance
Management
Database

Deep App Diagnostics

Функциональная схема системы (BPPM)

Слайд 9

Синтетическая аналитика

Синтетическая аналитика

Слайд 10

Мониторинг транзакций

Мониторинг транзакций

Слайд 11

Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic,

Консоль управления

События и показатели производительности

Мониторинг

End User Experience
(Synthetic, Real)

Agent/KM & Agentless
(System, Application,

DB, Network, Storage, MF)

3rd Party
(HP, CA, IBM, VMware, MSFT, SAP, etc.)
Business KPI

Performance
Management
Database

Deep App Diagnostics

Функциональная схема системы (BPPM)

Слайд 12

Upper Baseline Lower Baseline Normal Behavior ? $ Динамические пороги

Upper
Baseline

Lower
Baseline

Normal Behavior

?

$

Динамические пороги

Слайд 13

Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic,

Консоль управления

События и показатели производительности

Мониторинг

End User Experience
(Synthetic, Real)

Agent/KM & Agentless
(System, Application,

DB, Network, Storage, MF)

3rd Party
(HP, CA, IBM, VMware, MSFT, SAP, etc.)
Business KPI

Performance
Management
Database

Deep App Diagnostics

Функциональная схема системы (BPPM)

Слайд 14

Механизмы определения Правила обработки Корреляция событий

Механизмы определения

Правила обработки

Корреляция событий

Слайд 15

Упреждающие события Фильтр по не типичному поведению, авариям и прогнозированным событиям

Упреждающие события

Фильтр по не типичному поведению, авариям и прогнозированным событиям

Слайд 16

Механизмы обработки событий События Мощные встроенные функции: Фильтрация, корреляция и обогащение

Механизмы обработки событий

События

Мощные встроенные функции:
Фильтрация, корреляция и обогащение событий;
Возможность интеграции с

внешними данными и приложениями;
Timer mechanism;
Автоматизация реакций на события и предупреждающие действия.
Прерывание обработки событий на любом этапе:
Упрощает обработку;
Улучшает производительность.
Настройка с использованием:
Dynamic Event Management policies для большинства ситуаций
Master Rule Language [MRL] для специфичных сценариев обработки.
Слайд 17

Сбор событий от систем: CA UniCenter® TNG HP-OpenView Network Node Manager

Сбор событий от систем:
CA UniCenter® TNG
HP-OpenView Network Node Manager
HP-OpenView Operations
IBM NetCool

Omnibus
Microsoft® MOM/SCOM
Tivoli® TEC
CA Spectrum
EMC SMARTS (Ionix)
HP NNMi
RSA enVision
Solarwinds Orion NPM
VMware (vCenter, ESX, ESXi)
Передача событий в системы:
CA UniCenter® TNG
Microsoft® MOM/SCOM
HP Service Manager
HP OpenView Network Node Manager
HP OpenView Operations
Tivoli® TEC
Databases

Средства интеграции событий:
SNMP
Log-files
TCP/UDP client/server
Telnet adapter
Windows Event Log
Command line
C API (iiSDK)*
Client and server API
Web Services API*
Client and server API

* Двунаправленная интеграция – продукты BMC могут отправлять и принимать события

Интеграция событий

Слайд 18

Определение корневой причины Сервер приложений работает медленно из-за выполнения ряда транзакций

Определение корневой причины

Сервер приложений работает медленно из-за выполнения ряда транзакций

Слайд 19

Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic,

Консоль управления

События и показатели производительности

Мониторинг

End User Experience
(Synthetic, Real)

Agent/KM & Agentless
(System, Application,

DB, Network, Storage, MF)

3rd Party
(HP, CA, IBM, VMware, MSFT, SAP, etc.)
Business KPI

Performance
Management
Database

Deep App Diagnostics

Функциональная схема системы (BPPM)

Слайд 20

Нарушенный KPI сервиса – время выполнения транзакции Графическое представление для KPI

Нарушенный KPI сервиса – время выполнения транзакции

Графическое представление для KPI –

выявленный тренд

Drill-down в корневую-причину для детального анализа выявленного тренда

Слайд 21

Приоритезация событий основанная на влиянии для бизнес-процессов Интеграция оценки влияния событий

Приоритезация событий основанная на влиянии для бизнес-процессов
Интеграция оценки влияния событий с

автоматизацией по их обработке
Отображение физических, виртуальных и облачных служб

Оценка влияния событий для бизнеса

Слайд 22

Приоритезация событий

Приоритезация событий

Слайд 23

Автоматизация корректирующих действий Сбор дополнительной диагностики и обогащение событий Стандартная архитектура

Автоматизация корректирующих действий

Сбор дополнительной диагностики и обогащение событий
Стандартная архитектура автоматизации инициации

инцидента и изменения управления процессом
Выполнение стандартизированной сортировки и восстановление задач
Слайд 24

Workflows Manual or Automatic execution Customizable Disk Full Free up disk

Workflows
Manual or Automatic execution
Customizable
Disk Full
Free up disk space when disk full

condition occurs
Create Incident if disk full (if deployed)
Initiate Change Request Workflow (if deployed)
Host Down
Verify host down (uses various methods like ping and traceroute) vs. network connectivity issue
ITIL 360 degree verification
Create Incident if host not available (if deployed)
ESX Host Down (Variation of Host Down)
Restart ESX services if verify ESX host down (vs physical host down vs. network connectivity issue)
Failed Tivoli Storage Manager Backup Job (coming in 3.0)
Restart failed TSM backup job
Create Incident if TSM backup job failed

Примеры готовых Workflows

Слайд 25

Динамические dashboards Консоль выполнения мониторинга в реальном времени и управленческая консоль

Динамические dashboards

Консоль выполнения мониторинга в реальном времени и управленческая консоль
End

to End Service Views – функции, процессы и инструменты
Сфокусированное управление KPI
Определение тенденций поддержки бизнес - услуг
Слайд 26

Мониторинг и Service Desk Intelligent Incident BMC Remedy Service Desk BMC

Мониторинг и Service Desk

Intelligent Incident

BMC Remedy Service Desk

BMC Proactive Operations Console

Взаимосвязь

операций и процессов в соответствии с ITIL
Отправка в BMC Remedy Service Desk:
Информ. о root-case непосредственно в BMC Remedy Service Desk
Отслеживание MTTR, обеспечение уровня обслуживания

Интеллектуального инцидента с детальной диагностикой и причиной
Оповещения с прогнозом для своевременного уведомления пользователя

Слайд 27

BMC Atrium CMDB

BMC Atrium CMDB

Слайд 28

Поддержка виртуальной среды (clouds) Автоматизация упреждающих и других типовых операций/действий Интеграция

Поддержка виртуальной среды (clouds)
Автоматизация упреждающих и других типовых операций/действий
Интеграция с CMDB

(out-of-box)
РСМ храниться в CMDB
Интеграция с решениями по автоматизации ITSM
Консолидированная отчетность (с ITSM)
Масштабируемость
Средства самообучения при работе с ОМ
Единый интерфейс пользователя

Другие отличительные черты

Слайд 29

Proactively detect capacity issues (excessive motions) Generate Accurate Root Cause &

Proactively detect capacity issues (excessive motions)
Generate Accurate Root Cause & Service

Impact
Populate Real-Time Enterprise Service Models with dynamic virtual & physical relationships
Retain baselines to match dynamic virtual & private cloud environments
Instantly correlate performance with motions (changes)

Virtual
Server

Dynamic Virtualization & Cloud Analytics Increase MTBF in Virtual Environments

Слайд 30

Регистрация и обработка в многопользовательском режиме информации о качестве работы ИС

Регистрация и обработка в многопользовательском режиме информации о качестве работы ИС

в централизованном хранилище;
Автоматизированный контроль ОМ;
Прогнозируемость работы ИТ и эффективные средства контроля и управления;
Возможность автоматического выполнения заданных действий для определенных инцидентов;
Повышение качества и доступности ресурсов;
Унификация технических средств мониторинга;
Интеграция системы мониторинга с другими ИС, в т.ч. и с средствами автоматизации процессов ITSM.

Результаты по внедрению проектов

ИС – Информационные Системы

Слайд 31

Анализ вероятных корневых причин нарушения KPI по сервису Оценка для обнаруженных

Анализ вероятных корневых причин нарушения KPI по сервису

Оценка для обнаруженных событий

Внешние

сетевые события

Application, Database, Web Server Intelligent Data Events

События по работе ИС

События по конфигурации КЕ

Слайд 32

Детальная диагностика – список процессов и использование CPU Детализация для выявленного

Детальная диагностика – список процессов и использование CPU

Детализация для выявленного события

по загрузке CPU, который обслуживает ORACLE
Слайд 33

Группировка объектов по устройствам Группировка всех КЕ в спец. дашборды

Группировка объектов по устройствам

Группировка всех КЕ в спец. дашборды

Слайд 34

Группировка объектов по устройствам

Группировка объектов по устройствам

Слайд 35

Нарушенный KPI сервиса – время выполнения транзакции Графическое представление для KPI

Нарушенный KPI сервиса – время выполнения транзакции

Графическое представление для KPI –

выявление трендов

Drill-down для проведения поиска причин при выявлении тренда для KPI

Слайд 36

Детальная информация о состоянии сервиса Значения метрик для искомого KPI Drill-down

Детальная информация о состоянии сервиса

Значения метрик для искомого KPI

Drill-down из предыдущего

слайда по поиску событий, которые привели к тренду для KPI
Слайд 37

Детальная информация о нарушенных KPI для сервиса Drill-down from the KPIs associated with the service

Детальная информация о нарушенных KPI для сервиса

Drill-down from the KPIs associated

with the service