Видео: Take the Lead Jenn Tejada & Stacey Cunningham (Ноябрь 2024)
PagerDuty - это служба реагирования на инциденты и оповещения, которая работает практически с любой службой мониторинга. Сервис может быть настроен на доставку предупреждений по телефону, электронной почте, тексту или через приложения для iOS и Android, с подтверждением доставки и автоматической перенаправлением. Панель инструментов показывает вам инциденты и состояние оповещения по всем вашим инструментам мониторинга. Сложные конфигурации планирования и оповещения об эскалации держат всю вашу команду в курсе. Продвинутая аналитика PagerDuty помогает идентифицировать горячие точки и тенденции производительности команды.
Я работаю над решениями по реагированию на инциденты более 20 лет и могу с уверенностью сказать, что PagerDuty обеспечивает отличный баланс между простотой использования и мощностью. Я признаю это, я влюблен в PagerDuty.
Монтаж
Зарегистрироваться было очень легко и просто потребовал мой адрес электронной почты и пароль. Затем мне предложили отправить тестовое оповещение по SMS, телефону и электронной почте. В течение 10 секунд я получил все три предупреждения. В SMS-сообщении PagerDuty я попросил меня загрузить мобильное приложение, а во время телефонного звонка было сказано: «Привет, это тестовое оповещение PagerDuty. Добавьте этот номер в свой телефон, чтобы всегда получать уведомления». Это было обнадеживающим, что система оповещения работала.
Следующим шагом было подключение моего инструмента мониторинга. Это можно сделать, просто выбрав мой предпочтительный инструмент в раскрывающемся списке поддерживаемых программ, включая HP SiteScope, New Relic APM, CopperEgg или любой из 50 или более из перечисленных. Я выбрал CopperEgg, потому что я уже создал учетную запись для проверки сервиса. Я также мог бы отправить электронное письмо в PagerDuty для запуска оповещений или подключиться напрямую к REST API PagerDuty. Когда я щелкнул, чтобы добавить CopperEgg, меня перенаправили на веб-страницу с дополнительной информацией об интеграции. Затем мне нужно было сгенерировать и добавить ключ API PagerDuty для CopperEgg. Затем я настроил эскалацию инцидента так, чтобы, если я не отвечал с первого предупреждения в течение 10 минут, и вторичный ответчик получал по электронной почте.
Работа с PagerDuty
Заходя в PagerDuty, я был поражен тем, насколько простым выглядит интерфейс. Интерфейс PagerDuty предоставляет все параметры навигации в верхней части страницы: панель инструментов, инциденты, конфигурация, аналитика и помощь. Панель инструментов открывается по умолчанию и содержит список моих открытых инцидентов и открытых инцидентов в масштабах компании, а также все действия, связанные с инцидентами за последние семь дней. Экран происшествий очень похож на панель инструментов, но содержит больше опций для работы с происшествиями.
Настоящий элемент PagerDuty находится в меню конфигурации, которое включает в себя параметры расписаний, служб, политик эскалации, пользователей и групп. Первым шагом в работе с PagerDuty является создание пользователей, которые будут предупреждены о происшествиях. Пользователям назначается одна из четырех ролей, начиная от ограниченной: пользователь, который может только инициировать, подтверждать и разрешать инциденты, до владельца учетной записи, который может управлять всем в системе PagerDuty. Каждый пользователь получает назначенные правила уведомления; они могут получать уведомления о новых или измененных инцидентах, а также о том, когда начинается период их вызова по электронной почте, по телефону или по SMS. Весьма вероятно, что крупные организации захотят назначать пользователей в группы, чтобы было проще управлять расписаниями, уведомлениями и политиками эскалации. Например, в организации может быть группа, получающая уведомления об инцидентах на сервере, и другая группа, получающая уведомления об инцидентах безопасности.
В PagerDuty, как и в любой системе реагирования на инциденты, дьявол кроется в деталях. Общая концепция заключается в том, чтобы уведомить тех, кто должен знать в нужное время, а затем создать резервные копии, чтобы ничто не провалилось в трещины. Для этого необходимо уделить особое внимание графикам и политикам уведомлений, в частности политикам эскалации. PagerDuty делает фантастическую работу по упрощению настройки и управления деталями, в первую очередь благодаря мощному, но простому для понимания графическому интерфейсу. Настройка расписания по вызову потребовала чуть больше, чем выбор пользователей, выбор типа ротации (ежедневный, еженедельный или пользовательский) и выбор времени и даты начала. Расписания по вызову могут быть наложены друг на друга, чтобы вы могли видеть, где они перекрываются, и на странице управления расписанием появляется календарь, в котором четко отображаются расписания по вызову и перекрытия. Политика эскалации также очень проста в настройке и управлении благодаря простому графическому интерфейсу.
Мой первый тест PagerDuty включал ручное открытие инцидента, что, кстати, является отличной возможностью для проверки того, как настроены уведомления и политики эскалации. В течение пяти секунд я получал уведомления об инцидентах по телефону, SMS и электронной почте. Телефонный звонок прочитал мне вслух службу, которая вызвала предупреждение, и некоторую основную информацию о предупреждении, а также дал мне варианты ответа, такие как «нажмите 4 для подтверждения, 6 для подтверждения или нажмите 8 для эскалации». Я нажал 4, чтобы подтвердить, и, следуя моей политике уведомления, через полчаса я был повторно уведомлен о том, что условие предупреждения все еще существует (единственные способы остановить уведомления - это разрешить или расширить их). Уведомления, которые я получил по электронной почте и через SMS, были схожими, с предупреждением по электронной почте, также содержащим ссылку на сайт PagerDuty, чтобы я мог видеть больше информации. PagerDuty превосходно работал во время моего тестирования, своевременно уведомляя меня об инцидентах своевременно, следуя моей политике эскалации, и повторно уведомляя меня, когда я забыл пометить проблему как решенную.
Помощь PagerDuty отличная. Каждая страница портала содержит как минимум одну ссылку на контекстную справку. Существует также углубленный раздел с начала работы, который охватывает все: от базовых тем, таких как настройка и реагирование на уведомления, до более сложных тем, таких как создание расписания по вызову и создание политик эскалации. Онлайновая справка также включает подробную информацию об интеграции PagerDuty с другими инструментами мониторинга, ресурсы для разработчиков и форму для отправки запроса в службу технической поддержки.
Отчеты PagerDuty очень просты и понятны. Отчеты могут отображаться в масштабе всей системы или фильтроваться по службе, команде или политике эскалации. Предоставляются также сводные показатели, которые показывают среднее время подтверждения, среднее время разрешения, количество обостренных инцидентов и многое другое. Эта информация очень полезна в оперативном плане, но менеджеры, вероятно, захотят большей глубины для целей планирования и анализа, и в этом случае они захотят получить эти данные из PagerDuty. Если вы подписаны на корпоративный план, то вы можете экспортировать отчеты. PagerDuty рекомендует запрашивать инциденты через их API, а не экспортировать отчеты.