Мониторинг инфраструктуры

Мониторинг инфраструктуры

Дистанционный контроль за состоянием и производительностью облачных, виртуальных и физических ресурсов с помощью Zabbix

Ключевые возможности

Полный контроль оборудования

Полный контроль оборудования

Сервис позволяет отслеживать работоспособность серверов, систем хранения и сети, а также инженерных подсистем таких как управляемые ИБП, PDU и системы кондиционирования.
Сквозная диагностика

Сквозная диагностика

Контроль состояния информационных систем начиная с уровня ОС и далее вниз до дисков на системе хранения.
Удобное оповещение

Удобное оповещение

Уведомление об обнаруженных неисправностях или нарушении порогов осуществляется посредством электронной почты, мессенджеров и регистрации событий в системе КРОК Jira.
Проактивный мониторинг

Проактивный мониторинг

Выявление критичного состояния компонентов позволяет предупреждать серьезные сбои в ИКТ-инфраструктуре еще до их наступления.
 Кастомизация решения

Кастомизация решения

Параметры мониторинга такие как набор отслеживаемых метрик и частота сбора данных могут настраиваться в соответствии с регламентами заказчика.
Наглядные дашборды

Наглядные дашборды

Информацию о событиях можно просматривать в реальном времени через веб-интерфейс. Помимо типовых дашбордов пользователи могут настраивать свои собственные.

Сценарии использования

Мониторинг облачных ресурсов

Критическая инфраструктура все чаще развертывается в облаке. Сервис позволяет отслеживать состояние облачных ресурсов как в Облаке КРОК, так и в облаках других провайдеров. Для этого на виртуальные машины необходимо установить агентов мониторинга Zabbix.

Мониторинг инфраструктуры HaaS

При использовании услуги аренды оборудования мы берем на себя всю ответственность за его мониторинг — пользователю ничего делать не нужно. По согласованию дополнительно может осуществляться контроль за операционными системами и виртуальной средой.

Мониторинг дата-центра

Если не хватает собственных ресурсов или компетенций для организации мониторинга, то мы поможем организовать мониторинг оборудования на любых площадках, будь то собственный центр обработки данных заказчика или арендуемое место в стороннем дата-центре.

Архитектура системы мониторинга

Сервис мониторинга реализован на базе программного обеспечения Zabbix с открытым исходным кодом. Ядро системы (сервер Zabbix) располагается в Облаке КРОК, а на площадке заказчика устанавливается прокси-сервер.
Часто задаваемые вопросы
Какие метрики отслеживаются?
В общем случае собираются данные о состоянии, производительности, емкости и инвентарном составе. Конкретный набор собираемых метрик определяется шаблоном мониторинга, который подключается к объекту мониторинга. В системе есть готовые шаблоны практически для всего популярного оборудования. При этом возможно использование пользовательских шаблонов. Кроме того, в готовых шаблонах широкого применяется параметризация пороговых значений, чтобы пользователи могли задать собственные пороги для группы устройств или отдельного устройства.
Какие компоненты инфраструктуры можно поставить на мониторинг?
Сервис позволяет организовать мониторинг основных компонентов инфраструктуры и инфраструктурного программного обеспечения — серверов, сетевого оборудования, систем хранения, включая различные библиотеки и устройства резервного копирования, операционных систем, гипервизоров и базы данных. К сервису может быть также подключено любое инженерное оборудование, такое как управляемые PDU, источники бесперебойного питания и системы кондиционирования, если они поддерживают протокол SNMP. Кроме того, в рамках сервиса «Термоскоп» может осуществлять контроль за температурой в помещениях.
Какие инструменты используются для мониторинга?
Сервис реализован на базе Zabbix актуальной версии LTS, ядро которого развернуто в Облаке КРОК. Для визуализации метрик используется ПО Grafana. Если помимо сбора метрик необходим анализ журналов, то для этого задействуется стек ELK (Elasticsearch, Logstash и Kibana).
Как часто собирается статистика?
Частота сбора данных может быть настроена в соответствии с требованиями пользования. Стандартно данные о состоянии записываются каждые 3 мин, о емкости и производительности — раз в 5 мин, инвентаризация производится каждый час.
Сколько времени хранятся собранные данные?
Собираемая статистика делится на два типа: сырые и агрегированные данные. Первые собираются непосредственно с оборудования, вторые получаются посредством вычисления минимального, среднего и максимального значений за часовой интервал. Для них определены следующие сроки хранения: 3 месяца для сырых данных и 3 года для агрегированных данных.
Как просмотреть данные мониторинга?
Zabbix и Grafana имеют каждая свой веб-интерфейс. Пользователь получает персональную учетную запись, используя которую он может просматривать события и дашборды. Кроме того, доступ к списку событий можно получить с помощью телеграм-бота.
Как осуществляется оповещение о событиях?
Уведомления об обнаруженных неисправностях или нарушении порогов могут рассылаться по электронной почте, публиковаться в телеграм-канале и регистрироваться в системе КРОК Jira. Кроме того, по согласованию они могут транслироваться в различные мессенджеры такие как Slack и Discord и направляться в пользовательскую систему технической поддержки и Jira.
01

Ускоряем вычисления в Облаке КРОК с помощью графических процессоров NVIDIA

Портфолио КРОК Облачные сервисы пополнилось графическими процессорами NVIDIA. Их применение позволяет многократно ускорить решение задач, требующих большого объема вычислений. Услуга GPU as a Service предоставляется на базе экземпляров виртуальных машин с графическими процессорами NVIDIA и предусматривает помесячную оплату за используемые вычислительные мощности. Пользователи получают всю необходимую техническую поддержку в режиме 24/7.
02

Автоматическое масштабирование с Auto Scaling Groups

Новый сервис позволяет автоматически реагировать на изменения нагрузки, добавляя или удаляя экземпляры за считанные минуты.
03

RACI-матрица: определяем зоны ответственности для максимальной результативности ИТ-проекта

Человеческий фактор в ИТ-проектах – одна из распространенных причин таких неприятных явлений, как низкая скорость реакции на инциденты, простои в работе, локальные сбои. Четкое определение зон ответственности помогает быстро устранять ошибки и недочеты в работе ИТ-систем.
04

Представляем шаблоны запуска и методы API для работы с ними

Шаблоны запуска позволяют упростить и ускорить создание однотипных экземпляров и минимизировать риск ошибок конфигурации при их развертывании.
05

Облака как возможность: аналитика КРОК Облачные сервисы

За первые две недели марта 2022 года количество запросов на услуги КРОК Облачные сервисы увеличилось на 960%, по сравнению с тем же периодом прошлого года. Компании на фоне приостановленных поставок ИТ-оборудования ищут доступные инструменты для поддержки бизнес-процессов и модернизации инфраструктуры.
06

Дата-центры – 2022

По прогнозам Gartner в нынешнем году глобальные расходы на системы ЦОДов вырастут до 226 млрд долл., что на 11,4% выше прошлого года. Главными причинами повышенного спроса на мощности ЦОДов аналитики называют развитие цифровой трансформации бизнеса и массовый переход на облачные услуги.
28
апреля
18:00
Онлайн-митап
27
апреля
11:00
27
апреля
11:00
Форум
Связь-2022
Форум
Остались вопросы?

КРОК Облачные сервисы

КРОК Облачные сервисы — это самостоятельное подразделение компании КРОК, предлагающее рынку облачные услуги и управляемые В2В-сервисы.
24/7
SLA 10 минут
12 лет
на рынке облачных услуг
750+
клиентов из разных отраслей
№1
по качеству облачных услуг (Cnews, 2020)
scrollup