Tecnología

Cómo afrontar una crisis de TI de forma eficiente y exitosa

crisis reputacional mal gestionada

La verdadera acción en los departamentos TI se vive cuando se produce algún incidente, ya sea una caída del servicio, un error humano, un pico de procesos o cargas no esperado o, cada vez más, a causa de ciberamenazas.

Imagínense un departamento de TI al uso, seguro que lo conocen por dentro. En caso contrario, un par de capítulos de ‘The IT Crowd’ podrán acercarle las impresiones que los equipos más estereotipados de tecnología ofrecen al resto de los mortales de una corporación: un grupo de ‘geeks’ sin habilidades sociales y con poca carga de trabajo… salvo cuando algo falla.

Y es que, salvando las distancias entre la ficción y la realidad, la verdadera acción en los departamentos TI se vive cuando se produce algún incidente, ya sea una caída del servicio, un error humano, un pico de procesos o cargas no esperado o, cada vez más, a causa de ciberamenazas.

Un incidente técnico tumba la Bolsa de Londres en su peor fallo en ocho años

En estos momentos, se activan todos los resortes de estos profesionales y comienza una carrera contrarreloj por devolver la normalidad a la actividad de la empresa. Un momento de estrés y mucha presión que puede gestionarse de forma efectiva si se siguen algunas pautas básicas, como estas cinco recopiladas a partir de experiencias reales de directores de Información:

1. Definir la importancia de un incidente

Este estudio muestra las grandes preocupaciones de los autónomos españoles

Cuando un problema causa un gran impacto comercial en varios usuarios, podemos categorizarlo como un incidente importante. Se trataría única y exclusivamente de uno que obliga a una organización a desviarse de los procesos de gestión de incidentes existentes.  Y es que, por lo general, los incidentes de alta prioridad se perciben erróneamente como incidentes importantes, aunque su impacto en negocio no sea demasiado alto. Esto probablemente se deba a la ausencia de directrices clarase en ese sentido, sin valorar de forma precisa los factores de urgencia, impacto y gravedad.

2. Flujos de trabajo exclusivos

trabajo en equipo

La implementación de un flujo de trabajo claro nos ayuda a restaurar rápidamente un servicio que se ha visto interrumpido de algún modo. Para ello, tener flujos de trabajo separados para los incidentes más importantes nos permite automatizar y simplificar todo lo cotidiano para dejarnos tiempo, espacio y recursos para resolver el problema. Una resolución que se sustenta en una cadena de procesos que ha de seguirse a rajatabla:

  • Identificar el incidente principal
  • Comunicar a las partes interesadas/impactadas
  • Asignar a las personas adecuadas
  • Seguir el incidente principal a lo largo de su ciclo de vida
  • Intensificar el incumplimiento de los SLA (acuerdos de nivel de servicio)
  • Afrontar la resolución y cierre
  • Generar y analizar los informes finales

Algunas organizaciones cuentan con un equipo de incidentes dedicado exclusivamente a los fenómenos de mayor calado, liderado por un administrador de incidentes, mientras que otras cuentan con un equipo dinámico y ad hoc que cuenta con expertos de varios departamentos.

3. Configurar SLA estrictos y escalas jerárquicas

Seguridad de acceso desde dispositivos móviles

Por supuesto, hemos de asegurarnos de tener SLA estrictos para los incidentes importantes, acuerdos de nivel de servicio en los que se especifiquen los puntos de escalamiento claros para cualquier violación del proceso. Además, tenemos que seguir un proceso de escalamiento manual si el técnico asignado carece de la experiencia para resolver el incidente, todo con un técnico de respaldo siempre preparado en cualquier circunstancia.

4. Información ante todo

Cerca de la mitad de smartphones de segunda mano contienen información personal

A lo largo del ciclo de vida de los principales incidentes, hemos de mantener la información a los distintos estamentos de la organización en todo momento: envío de comunicados oficiales, notificaciones y actualizaciones de estado a los interesados y afectados. Igualmente, los avisos en la intranet o red social corporativa evitarán el caos y la alarma social, así como que se generen tickets de asistencia por duplicado. También es una buena idea contar con una línea de teléfono dedicada a ofrecer apoyo a los distintos usuarios afectados.

5. Simplificar y documentar

Los libros de negocios imprescindibles para ser mejor líder

Hemos de simplificar al máximo los procesos de trabajo ante un incidente importante en el departamento TI. Para ello, podemos articular plantillas simples que capturen detalles críticos, como el tipo de incidente principal al que se refiere el problema, casos similares, recursos necesarios y los distintos pasos llevados a cabo para su resolución. En ese sentido, hemos de documentar y analizar todos los incidentes importantes para que podamos identificar áreas de mejora en el futuro.

Además, podremos generar los siguientes informes para ayudar en la toma de decisiones eficientes:

  • Número de incidentes importantes planteados y cerrados cada mes
  • Tiempo de resolución promedio para incidentes mayores
  • Porcentaje de tiempo de inactividad causado por incidentes importantes
  • Problemas y cambios relacionados con incidentes importantes
  • Los incidentes importantes son inevitables y cada uno es una experiencia de aprendizaje para su equipo.
  • Adherirse a estas prácticas podría ser su primer paso para dominar el arte de manejar incidentes importantes.

Sobre el autor de este artículo

Alberto Iglesias Fraga

Periodista especializado en tecnología e innovación que ha dejado su impronta en medios como TICbeat, La Razón, El Mundo, ComputerWorld, CIO España, Business Insider, Kelisto, Todrone, Movilonia, iPhonizate o el blog Think Big, entre otros. También ha sido consultor de comunicación en Indie PR. Ganador del XVI Premio Accenture de Periodismo, ganador del Premio Día de Internet 2018 a mejor marca personal en RRSS y finalista en los European Digital Mindset Awards 2016, 2017 y 2018.