От зоопарка правил к управляемому контенту

16 июня 2026

#MDR
#SIEM

О чем материал

Разбираемся, как выстроить масштабируемый MDR-сервис за счет централизованного управления и повышения качества детектирующего контента в SIEM

Последний год слово «масштабируемость» чаще других звучало в операционном блоке PT X. Но это не очередной маркетинговый штамп, а необходимость, без которой невозможно построить тиражируемый MDR-сервис.

Одним из наших ключевых векторов была работа с контентом Knowledge Base в SIEM. Кратное увеличение числа заказчиков, подключение большого количества EDR-агентов и внедрение дополнительных источников повлекли за собой экспоненциальный рост корреляционных событий. Это неизбежно приводит к двум фундаментальным проблемам:

Перегрузка аналитиков SOC: растет утомляемость смен, увеличивается время верификации, снижается качество расследований и повышается риск упустить атаку на фоне шума.
Расхождение версий пакетов экспертизы между заказчиками: появляются локальные изменения и пользовательские правила, которые необходимо централизованно поддерживать и переиспользовать на других площадках.

В итоге детектирующий контент может превратиться в зоопарк точечных реактивных правил. Такой подход несовместим с масштабируемой моделью MDR: снижается управляемость, а вместе с ней — и качество сервиса.

В ответ на эти вызовы мы сформулировали конкретные цели:

Снизить долю ложноположительных и легитимных подозрений на инциденты без потери чувствительности детектирования.
Унифицировать контент SIEM, который мы поставляем в инфраструктуры на этапе подготовки к мониторингу.
Обеспечить централизованное управление контентом из единого источника с прозрачным контролем версий и изменений.

Реализация

Люди

В классической модели SOC экспертность распределена по всей линии аналитиков: каждый знает определенные правила, исключения и нюансы инфраструктуры. При росте числа заказчиков модель разрушается: знания фрагментируются, возникают расхождения в интерпретации срабатываний, а контент деградирует. Поддерживать все это через статическую Knowledge Base неэффективно.

Соответственно, первым делом мы сформировали отдельную группу аналитиков, ответственных именно за экспертизу и развитие детектирующего контента. Это организационное решение закрыло одну из системных проблем масштабируемого MDR — фрагментацию экспертных знаний.

Также мы выделили команду специалистов, которая отвечает за жизненный цикл MDR-контента. По сути, это переход от эксплуатационной парадигмы к продуктовой: в ней детектирующий контент рассматривается как управляемый актив.

Процессы

Следующей задачей стало проектирование регламентированного и воспроизводимого процесса снижения False Positive — как на этапе подготовки заказчика к мониторингу, так и в рамках регулярного анализа за отчетные периоды. Здесь важно понимать, что FP не всегда ошибка детектирующей логики, в большинстве случаев это:

нетипичные, но легитимные бизнес-процессы;
высокая вариативность поведения пользователей и сервисных аккаунтов;
абсолютно легитимные действия с точки зрения архитектуры заказчика.

Для нас принципиально важно было вывести работу с ложными срабатываниями из разряда реактивных действий (например, «перекрыть спам») в формализованный процесс с четкими этапами, критериями и зонами ответственности. Ведь задача аналитиков — верификация, расследование и реагирование на подтвержденные инциденты. Если тратить их ресурс на обработку потока легитимных событий, которые ошибочно классифицируются как инциденты, неизбежно увеличится время на верификацию и реагирование. В худшем случае это приведет к пропуску реальной атаки…

Отметим, что обработку сгенерированных подозрений на инциденты нельзя начинать с ходу. Любая подключенная к мониторингу инфраструктура требует фильтрации и тюнинга детектирующих механизмов. Поэтому работа с FP начинается еще на этапе онбординга — задолго до первой смены SOC.

Онбординг в рамках Knowledge Base — это этап формирования базовой модели нормального поведения инфраструктуры, на которую затем накладывается экспертиза продукта. Он включает:

изучение архитектуры (AD, сегментация, периметр, бизнес-системы, состав и тип сервисов);
выявление привилегированных и технических учетных записей;
анализ типовых административных операций и особенностей инфраструктуры.

Цель онбординга в рамках работы с контентом — настроить экспертизу так, чтобы подозрительное поведение действительно отличалось от нормы, а не от абстрактной эталонной модели.

Ключевые инструменты:

Профилирование контента. Настройка параметров, чувствительности, исключений и контекстных атрибутов без форка основной логики правила корреляции (на основе табличных списков).
Создание белых списков (Whitelisting). Исключение из анализа событий, связанных с известными легитимными процессами. Это самый распространенный метод снижения FP и повышения производительности SIEM. Применяется строго контролируемо и в нескольких форматах: по точному значению, регулярным выражениям, подсетям и системе меток (инструкция).
Корректировка порогов модуля BAD (Behavioral Anomaly Detection). С помощью ML модуль анализирует поведение пользователей, сетевой трафик, использование ресурсов и процессы в инфраструктуре. BAD формирует эталонные поведенческие шаблоны, при нарушении которых проводится оценка риска (на высоких значениях модуль сигнализирует о подозрительной активности). Корректировка пороговых значений осуществляется в табличном списке BAD_Risk_Score_Thresholds.
Изменение логики правил с учетом инфраструктурных особенностей. В ряде случаев FP нельзя исключить доступными параметрами, а значит, требуется корректировка самой логики правила:
- добавление дополнительных условий, уточнение контекста;
- изменение последовательности событий или периода сбора событий в корреляцию;
- корректировка ключевых полей для агрегации корреляционных событий.
Понижение типа корреляционного события. Некоторые корреляционные правила предназначены для обнаружения конкретных действий (запуски программ, сетевое взаимодействие и т. д.). В процессе внедрения EDR-агентов заказчики часто отмечают подобную активность как легитимную. Аналитик SOC действительно не должен видеть такие сработки в потоке подозрений на инцидент, но при необходимости должен иметь возможность обратиться к ним в процессе расследования, чтобы получить полный контекст происходящего в инфраструктуре. Здесь на помощь приходит табличный список correlation_type_overriding, который осуществляет контроль типа правила на последнем этапе формирования корреляционного события. Так, тип «event» — это событие, которое не требует внимания в данный момент, но может пригодиться при ретроспективном анализе и расследовании атаки.
Осознанное отключение правил. В отдельных случаях анализ показывает, что правило не достигает приемлемого уровня точности, неприменимо к архитектуре заказчика или же не несет практической ценности. Тогда оно попросту отключается, и это не дурной тон, а, наоборот, показатель зрелости процесса. Детектирующий контент должен быть эффективным, а не просто «включенным по умолчанию из коробки».

Но на онбординге работа с FP не заканчивается, а переходит в режим непрерывного цикла улучшений и расширения набора инструментов.

Технологии

PT CMC (Positive Technologies Central Management Console)

Для централизованного управления контентом мы использовали PT CMC — систему управления тенантами MaxPatrol SIEM, развернутых в рамках одной или нескольких организаций. Она позволяет:

Управлять тенантами, просматривать приложения и роли пользователей.
Создавать пакеты экспертизы из установочных наборов Knowledge Base.
Доставлять пакеты экспертизы на выбранные тенанты и отслеживать статус доставки.
Контролировать актуальность объектов, которые входят в пакеты экспертизы, и создавать новые версии пакетов с учетом изменений.

Соответственно, использование PT CMC помогло нам решить обозначенные ранее проблемы:

Расхождение версий пакетов экспертизы между заказчиками.
Централизованная поддержка и переиспользование пользовательских правил.
Доставка и установка унифицированного контента на всех этапах мониторинга.

Content Inquisitor

Далее мы занялись автоматизацией контроля качества контента. При росте числа заказчиков ручной анализ в рамках отчетных периодов перестал быть масштабируемым: данные разрознены, динамика неочевидна, а реакция на деградацию запаздывает. Для решения проблемы мы разработали Content Inquisitor — сервис операционного мониторинга качества детектирующего контента, реализованный на базе нашего решения Anthill IRP. Задача Content Inquisitor — не просто считывать количество сработок, а выявлять деградацию точности правил во времени и инициировать корректирующие действия без участия человека на этапе первичного анализа.

Наш сервис реализует простой, но эффективный принцип: качество обнаружения нужно контролировать постоянно, а не решать разом гору накопившихся проблем. Content Inquisitor проводит сравнительный анализ двух последовательных отчетных периодов и выявляет правила, демонстрирующие рост FP. Алгоритм его работы выглядит так:

Сбор данных

Система автоматически выгружает обработанные инциденты за 14 дней и разбивает их на два равных периода. При этом используются только верифицированные аналитиками инциденты с финальным вердиктом.

Агрегация

Далее выполняется агрегация по нескольким атрибутам:

название правила корреляции;
площадка (тенант);
тип вердикта (подтвержден/ложный/легитимный);
общее количество алертов.

Таким образом формируется многомерная матрица качества детектирования.

Сравнение периодов

Система вычисляет абсолютный прирост сработок по типам вердикта и изменение доли FP между периодами. Отметим, что анализируется не только рост количества FP, но и ухудшение процента точности правила. Рост инфраструктуры может сам по себе увеличить количество корреляционных событий, и это нормально. Проблема возникает, когда растет процент ложных срабатываний.

Расчет ключевых метрик

Для каждого правила и площадки рассчитываются:

True Positive Rate (TPR) = True Positive / общее число алертов;
динамика TPR относительно предыдущего периода.

Эти метрики позволяют отличать шумные правила от часто срабатывающих, но с приемлемым TPR.

Сортировка и приоритизация

Правила сортируются по общему количеству сработок и уровню деградации точности обнаружения (TPR). Предусмотрены механизм исключений, управляемый уровень TPR и возможность изменять количество передаваемых на доработку правил за отчетный период (по умолчанию TPR равен 40% — это критичный уровень, при котором правило начинает создавать непропорциональную нагрузку на SOC).

Автоматическая генерация задач

Content Inquisitor интегрирован с корпоративным планировщиком задач. После формирования перечня правил на доработку:

автоматически создаются задачи на ответственных;
прикладываются агрегированные метрики и динамика;
фиксируются площадка, правило корреляции и временной период.

Таким образом, процесс перестает быть реактивным («аналитики пожаловались») и становится проактивным, а также метрико-ориентированным. В результате управление качеством детектирующего контента строится на основе объективных показателей, а не на субъективной обратной связи. При этом сохраняется механизм оперативной эскалации проблем детектирующей логики: аналитик может в моменте зафиксировать некорректность или деградацию правила. Такие обращения регистрируются в корпоративном планировщике наравне с задачами, которые автоматически создаются по результатам работы Content Inquisitor. Это обеспечивает единую базу для учета, приоритизации и контроля исполнения тикетов.

Практические результаты использования Content Inquisitor:

автоматизированная подготовка отчетов;
раннее выявление деградации правил;
быстрое исправление проблем;
принятие решений на основе данных, а не догадкок.

Кодовое слово «Анжела»

Чтобы еще больше снизить нагрузку на SOC, мы реализовали механизм автоматизированной обработки однотипных сработок. Он применяется в случаях, когда предварительная настройка пакетов экспертизы и исключений завершена, дальнейшее использование этих инструментов нецелесообразно, а уровень FP остается высоким. Кроме того, эта функциональность частично нивелирует эффект шумящих правил.

Для решения задачи мы разработали ML-агент «Анжела», который интегрирован в Anthill IRP и обрабатывает инциденты вместе с аналитиками SOC. Агент использует ML-модели, обученные на исторических данных об инцидентах, и выполняет автоматическую верификацию типовых кейсов по принципу поведенческого и контекстного сходства. «Анжела» принимает в обработку инциденты низкой и средней критичности. Результаты ее работы, включая классификацию и принятые решения, в обязательном порядке проходят последующий контроль и ревью со стороны аналитиков. Таким образом мы обеспечиваем управляемый уровень автоматизации без потери качества расследования.

Рисунок 2. Итоговый процесс работы с контентом

Результаты

Вместо тысячи слов покажем цифры ;)

KPI	Базовый уровень (II–III кв. 2025)	Текущий уровень (IV кв. 2025 – I кв. 2026)	Δ от базового уровня
True Positive Rate (среднее по всем клиентам PT X)	6,63%	16,10%	↑ 142,78%
Время доставки и установки нового контента	16 ч	30 мин	↓ 97 %
Время онбординга (в рамках контента)	7 дней	3 дня	↓ 57 %
Скорость обнаружения деградации правила	14 дней	7 дней	↓ 50 %

За полгода нам удалось перевести процесс работы с контентом SIEM из фрагментированной, реактивной модели в управляемую и автоматизированную. Осталось автоматизировать CI/CD, разработать механизм доставки отдельных строк табличных списков SIEM и продолжать совершенствовать разработанные инструменты автоматизации и ML. Это позволит нам подготовить MDR сервис к существенному росту клиентской базы без деградации качества.

Олег Обвинцев

Руководитель по системному анализу и оптимизации процессов операционного блока PT X, Positive Technologies

Алексей Яковлев

Руководитель экспертного отдела операционного блока PT X, Positive Technologies

Статьи по теме

От зоопарка правил к управляемому контенту

Реализация

Технологии

Результаты

Статьи по теме

«В одиночку — почти без шансов»: Дмитрий Скляров и Алексей Усанов о реверс-инжиниринге

Исследуем разрыв между бизнесом и ИБ

Язык и Зопа: когда цензура убивает реальную безопасность