domingo, 16 de novembro de 2014

ITIL 2011 - Incidente vs Problema vs Erro Conhecido

Muitas questões sobre ITIL focam na diferença entre incidente, problema e erro conhecido. No mundo real, podemos até tratá-los como sinônimos, mas para as várias versões da ITIL, inclusive a edição 2011, são conceitos distintos.

Um incidente é um evento que não é parte da operação padrão de um serviço e que pode interromper o serviço ou reduzir sua qualidade. Normalmente um usuário irá entrar em contato com o service desk reclamando de um incidente. Pode ser definido como a manifestação observável de um problema.

Já o problema é a causa de um ou mais incidentes e que precisa ser investigado. Ou seja, se existe um incidente, algo o está causado e esse é o problema. Supondo que o incidente seja o sítio estar indisponível para acesso. O problema poderia ser um consumo excessivo de memória de uma aplicação que derruba o servidor. Assim, esse problema irá gerar diversos incidentes.

O erro conhecido é um problema para o qual existe uma solução definitiva ou de contorno, chamada em inglês de workaround. Então, no exemplo citado, descobriu-se que o problema é o consumo de memória de uma aplicação. Notou-se que o muitos objetos estão sendo armazenados na sessão do usuário e quando muitos acessam, a memória do servidor se esgota. Então, como solução de contorno, pode ser configurado um cluster de alta disponibilidade para entrar no ar enquanto o servidor principal está sem memória e é reiniciado. A solução definitiva poderia ser melhorar o código fonte da aplicação. Quando se conhece o problema e há pelo menos uma solução paleativa para resolvê-lo, aí está o erro conhecido.