Las 5 recomendaciones para mejorar la gestión de eventos(NOC)

Implementa estas recomendacion y optimiza tu NOC
A continuación te hablaremos de 5 practicas o consejos que como empresa dedicada a la prestación de servicios tecnológicos y con amplia experiencia en Monitoreo de infraestructura tecnológica hemos implementado y comprobado que funcionan.

Conceptos Importantes

Gestión de eventos

Practica de ITIL4 cuyo propósito es gestionar los eventos en su ciclo de vida, coordinado todas las actividades para detectarlos y hacer que tengan sentido logrando así ejecutar una respuesta apropiada para cada evento.

Evento

Alerta

Cualquier cambio de estado que tenga importancia para la gestión de un elemento (CI) o servicio.Advertencia sobre una violación de umbral, algo cambio o una falla ha ocurrido.

Recomendaciones

1. Detección temprana de eventos.

Un evento es en general cualquier cambio de estado en la infraestructura, en esta fase es de vital importancia conocer el funcionamiento normal en el que operan sus dispositivos y servicios.

Ese conocimiento te permitirá crear una línea base, donde podrás detectar eventos significantes que pueden estar relacionados con fallas o incidentes.

Su plataforma de monitoreo debe ser capaz de recopilar los eventos y clasificarlos según su tipo, para que pueda observarlos y tomar decisiones importantes.

2. Capture oportunamente las alertas a través de una correcta configuración de umbrales.

Las alertas son generadas a partir de una violación de umbral o falla total, es aquí donde toma importancia que conozca profundamente el funcionamiento normal de sus servicios y equipos, porque debe configurar umbrales de criticidad que delimiten esa línea base que usted ya conoce.

Los umbrales correctamente configurados le permitirán generar alertas certeras que le permitan detectar rápidamente incidentes potenciales o fallas.

Evite configurar umbrales genéricos, de lo contrario solo llenara su plataforma de monitoreo con alertas no significantes que no llegaran a generarle valor y cuando realmente tenga una alerta importante será difícil detectarla entre tantos falsos positivos.

3. Implemente y mejore sus procesos

Los procesos brindan claridad y orden en la ejecución de cualquier tarea, si aun no ha definido sus procesos de NOC, es momento de empezar, y si ya tiene procesos revíselos y mejórelos constantemente.

Su equipo de trabajo será doblemente productivo cuando los procesos estén definidos y optimizados.

Documente cada proceso y guarde evidencia de la ejecución de los mismos, esto le permitirá implementar procesos de mejora y optar por certificaciones de industria.

Estos son procesos vitales:

  • Gestión de alertas
  • Gestión de incidentes
  • Gestión de problemas.

4. Uso correcto de la mesa de ayuda.

La mesa de ayuda nos proporciona un medio importante de registro y categorización de nuestras alertas significantes e incidentes, además a través de esta podemos automatizar tareas de comunicación con stakeholders que en momentos de recuperación de incidentes son vitales.

El uso correcto de la mesa de ayuda nos brindara analítica importante para tomar decisiones, métricas de rendimiento y un medio para relacionar información valiosa.

Registre oportunamente, diseñe plantillas y mensajes de notificación, cierre a tiempo tus casos y documente.

5. Implemente RCA Teams para resolver problemas.

Los incidentes recurrentes sobre la misma categoría y CIs se convierten en problemas, naturalmente en el afán de resolver rápidamente los incidentes suelen surgir un workaround en lugar de una resolución final, pero con el tiempo se presenta reincidencia y esto consume recursos importantes en su equipo de trabajo.

RCA Team(equipo de análisis de causa raíz) Son equipos especializados de personas que buscan la causa raíz de los problemas de IT con el objetivo de dar resolución final a cada uno.

El RCA team, necesitará toda la información que se tenga de los incidentes recurrentes, esta es otra de las razones por la cual es importante la documentación, ya que esta puede brindar valiosas pautas que conlleven al alcance del objetivo.

Conforme este equipo según cada necesidad, aproveche los talentos dentro de su equipo de trabajo, todos en algún momento pueden forman parte del RCA team, dependiendo el problema que se necesite resolver.

Este Blog es parte del contenido mostrado en nuestro entrenamiento online puede encontrar este  y otros videos relacionados en nuestro canal de youtube Aquí.

Autor

Otros articulos