Рейтинг:0

Какие инструменты вы используете для измерения MTTR в качестве оперативной группы?

флаг cn

а ты меряешь вообще?

Моя проблема заключается в том, что когда появляется предупреждение о сбое, кажется пустой тратой времени сначала создать тикет JIRA, поэтому я сразу начинаю решать эту проблему. Кроме того, некоторые сбои сначала решаются с помощью обходных путей, а затем пересматриваются, чтобы решить их должным образом.

Рейтинг:1
флаг us
Rob

«Моя проблема в том, что когда поступает предупреждение о сбое, кажется пустой тратой времени сначала создать тикет JIRA»

Это, конечно, легко решается, большинство систем оповещения могут выдавать несколько оповещений одновременно, и одним из этих оповещений может быть автоматическое создание заявки Jira.

Затем частью закрытия этого тикета Jira может быть административная задача записи (любым способом/системой, подходящей для вас) того, что вы согласовали в качестве времени ремонта.

(Уже подразумевалось, но позвольте мне заявить это явно: время разрешения заявки, отслеживаемое вашей системой продажи билетов, не совпадает со временем ремонта.)

Когда важны время разрешения заявки и сама метрика производительности, вы можете захотеть закрыть автоматически сгенерированную заявку на сбой сразу после устранения сбоя.
Когда вы начинаете анализ основных причин (RCA), используйте связанную, но новую заявку на исследование проблемы #XYZ (которая имеет другие критерии производительности и сообщается иначе, чем заявки, касающиеся сбоев).

В зависимости от результатов RCA вы можете начать работу над постоянным исправлением / мерами по смягчению последствий, которые вы снова отслеживаете другим способом, в зависимости от того, что необходимо сделать.

флаг cn
Теоретически я мог бы создать билеты JIRA, но я получаю довольно много ложных срабатываний, и поэтому мне нужно будет все время заходить в JIRA и помечать их как WontFix. Кроме того, вы действительно используете JIRA для своего отчета MTTR? Я согласен, что мог бы сделать это теоретически, но я не уверен, насколько хорошо это будет работать на практике.
флаг us
Rob
Ложные срабатывания в вашем оповещении — это отдельная проблема, но мы генерируем инциденты для каждого оповещения (в системе тикетов, отличной от Jira). Время на ремонт означает разные вещи для разных людей и компаний, устранение сбоя часто выполняется путем перезапуска, переключения на резервную систему и т. д. Для некоторых это ремонт, но для других фактический ремонт включает в себя выполнение RCA, отслеживание устранить ошибку, исправив ее в коде, весь цикл контроля качества, пока, наконец, релиз не будет запущен в производство.
флаг us
Rob
Мы автоматически сообщаем о времени разрешения заявок, а также о доступности и продолжительности простоев, но не о MTTR. Многие вещи легко исправить, но другие просто требуют много времени (и не имеют большого значения).

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.