Как оценить риски в кибербезопасности. Лучшие инструменты и практики - Ричард Сирсен
Шрифт:
Интервал:
Закладка:
• Среднее значение: = ((ВП + НП)/2).
Логнормальное распределениеРис. А.4. Логнормальное распределение
Параметры:
• ВП (верхний предел);
• НП (нижний предел).
Обратите внимание, что НП и ВП в приведенной ниже формуле Excel представляют собой 90 %-ный ДИ. Существует вероятность 5 %, что значение окажется выше ВП, и вероятность 5 %, что значение окажется ниже НП.
Если выборка может принимать только положительные значения, логнормальное распределение часто оказывается предпочтительнее нормального. Возьмем для примера ожидаемую стоимость акций в будущем. В уравнении S1 = S0 × e(r), S1 – будущая цена акций, S0 – текущая цена акций, а r – это ожидаемая норма рентабельности. Ожидаемая норма рентабельности соответствует нормальному распределению и вполне может принять отрицательное значение. А вот будущая цена акции ограничена нулем. Взяв экспоненту нормально распределенной ожидаемой нормы прибыли, мы получим логнормальное распределение, при котором отрицательная норма прибыли может оказать негативное влияние на будущую цену акций, но цена акций никогда не опустится ниже нуля. Распределение также допускает возможность экстремальных значений верхнего предела и, следовательно, подходит для некоторых явлений лучше, чем нормальное распределение.
• Ситуация применения: моделирование положительных значений, которые в основном находятся в диапазоне умеренных значений, но потенциально могут в редких случаях показывать экстремальные величины.
• Примеры: убытки, понесенные в результате кибератаки, стоимость проекта.
• Формула Excel: = ЛОГНОРМОБР(СЛЧИС();(ln(ВП) + ln(НП))/2; (ln(ВП)-ln(НП))/3,29).
• Среднее значение: = ((ln(ВП)+ln(НП))/2).
Бета-распределениеРис. А.5. Бета-распределение
Параметры:
• альфа (1 + количество попаданий);
• бета (1 + количество промахов).
Бета-распределения чрезвычайно разнообразны. Их можно применять для генерации значений между 0 и 1 в случаях, когда одни значения более вероятны, чем другие. А полученные результаты можно использовать в других формулах для создания любого понравившегося диапазона значений. Бета-распределения очень полезны при моделировании частоты возникновения события, особенно когда частота оценивается на основе случайной выборки из совокупности или полученных ранее данных. В отличие от других распределений, здесь не так просто определить параметры, опираясь только на верхний и нижний пределы. Единственным решением является последовательный перебор различных значений альфа (α) и бета (β), до тех пор пока не получится желаемый 90 %-ный ДИ. Если α и β больше 1 и равны друг другу, то распределение будет симметричным. При этом значения вблизи 0,5 наиболее вероятны, а менее вероятные значения находятся дальше от 0,5. Чем больше значения α и β, тем ýже распределение. Если сделать α больше β, распределение окажется перекошенным влево, а если сделать β больше, оно перекосится вправо.
Чтобы проверить параметры α и β, уточните ВП и НП заявленного 90 %-ного ДИ, вычислив пятый и 95-й процентили: БЕТА.ОБР(0,05; альфа; бета) и БЕТА ОБР(0,95; альфа; бета). Проверить, соответствуют ли среднее значение и мода вашим ожиданиям, можно, вычислив: среднее = α / (α + β), мода (наиболее вероятное значение) = (α – 1) / (α + β – 2). Или можно просто воспользоваться электронной таблицей на сайте www.howtomeasureanything.com/cybersecurity, чтобы проверить все перечисленное и получить значения, близкие к тем, что получатся в результате вычислений.
• Ситуация применения: любая ситуация, которую можно охарактеризовать как набор «попаданий» и «промахов». Каждое попадание увеличивает α на 1, каждый промах увеличивает β на 1.
• Примеры: частота события (например, утечки данных), когда частота менее 1 в единицу времени (например, в год), доля сотрудников, соблюдающих меры безопасности.
• Формула Excel: = БЕТА.ОБР(СЛЧИС();альфа; бета).
• Среднее значение: = (альфа / (альфа + бета)).
Степенное распределениеРис. A.6. Степенное распределение
Параметры:
• альфа (параметр формы);
• тета (параметр местоположения).
Степенное распределение удобно использовать для описания явлений с экстремальными, катастрофическими возможными значениями. Даже удобнее, чем логнормальное. Скажем, в подавляющем большинстве случаев площадь лесных пожаров ограничена менее чем одним гектаром. В редких случаях, однако, лесной пожар может распространиться на десятки гектаров. Толстый хвост степенного распределения позволяет делать выводы об обычных незначительных событиях, но при этом учитывать и возможные экстремальные варианты.
• Ситуация применения: когда нужно убедиться, что катастрофическим событиям, несмотря на то что они редко случаются, будет присвоена ненулевая вероятность.
• Примеры: такие явления, как землетрясения, отключения электроэнергии, эпидемии и другие типы каскадных отказов.
• Формула Excel: = (тета/x)^альфа.
• Среднее значение: = (альфа*тета/(альфа-1)).
Усеченное степенное распределениеРис. A.7. Усеченное степенное распределение
Параметры:
• альфа (параметр формы);
• тета (параметр местоположения);
• T (усеченный предел).
Усеченное степенное распределение повторяет степенное распределение, но имеет верхний предел, накладываемый пользователем. Тяжелый хвост степенного распределения позволяет нам учитывать редкие катастрофические события, но для величины такого события может существовать теоретический предел. Если не учитывать в модели верхний предел, можно получить вводящий в заблуждение и неоправданно мрачный прогноз.
• Ситуация применения: степенное распределение должно быть усеченным, если известна верхняя граница серьезности события.
• Пример: потерю записей можно отразить с помощью степенного распределения, но вы знаете, что можете потерять лишь конечное количество записей.
• Формула Excel: = (альфа*тета^альфа/(x^(альфа+1)))/(1-(тета/T)^альфа).
• Среднее значение: = (альфа*тета/(альфа-1)).
Приложение Б. Приглашенные авторы
Вы не одиноки! Количество людей, применяющих статистику для решения задач, связанных с обеспечением безопасности, растет. Все больше специалистов используют данные, которые можно было бы назвать скудными, и делают на их основе выводы о крупных рисках. Это не означает, что не стоит обращаться к большим данным и науке о данных, просто все более важным для обоснования стратегии и даже определения приоритетов в