Российский разработчик расширил возможности observability платформы GMonit, направленной на сокращение времени простоя бизнес-систем. Новый модуль консолидирует все ключевые телеметрические данные в одном интерфейсе, минимизирует необходимость работы с десятками дашбордов и ускоряет устранение инцидентов. Об этом CNews сообщили представители GMonit.
В распределенной архитектуре ошибка одного микросервиса вызывает цепочку отказов. Ручной анализ десятков логов и метрик нередко занимает часы, а время реакции напрямую влияет на стабильность систем и бизнес-показатели. В таких условиях критически важно быстро находить корневую причину сбоев, оперативно устранять ошибки и поддерживать устойчивость приложений.
ИТ-компания GMonit разработала «Карточку инцидента» – единое окно для обработки сбоев и мгновенной реакции. Инструмент собирает всю телеметрию в одном интерфейсе и формирует целостный контекст инцидента. В основе функционала работает алгоритм корреляционного анализа, который объединяет события, алерты и аномалии в связанный набор данных.
SRE-инженеры, дежурные службы и on-call-команды получают возможность сократить время реагирования (MTTR) и быстро ответить на ключевые вопросы: что сломалось, насколько критичен сбой, какие пользователи или бизнес-процессы затронуты, какова площадь поражения.
Отчеты по инцидентам полезны не только техническим специалистам, но и топ-менеджерам, показывая влияние ИТ на бизнес: количество затронутых пользователей, финансовые потери и потенциальные риски. Руководство может точнее корректировать ИТ-стратегию, быстрее принимать меры для предотвращения сбоев и значительно снижать риски потери доходов.
«GMonit стал еще удобнее для пользователей. Теперь клиенты могут получать сводное представление об инциденте в одном месте – всего за пару кликов можно отделить шум от значимых событий, определить приоритетные ошибки и фильтровать малозначимые отклонения. Такой подход снижает зависимость от множества экранов и сокращает время расследования сбоев», – сказал Игорь Пустоветов, генеральный директор GMonit.
В первой половине 2026 г. будет реализован алгоритм RCA (Root Cause Analysis), который находит закономерности в собранных данных и формирует предположения о вероятных источниках ошибок и их влиянии на ИТ-окружение компании. ML-модели будут постоянно дообучаться, что повысит точность диагностики и адаптирует observability платформу под особенности инфраструктуры каждого клиента.


