Volver a la página principal

Jefe de continuidad Operacional Senior - Hunting

Descripción

Propósito del cargo

Garantizar la disponibilidad, resiliencia y continuidad de los servicios tecnológicos críticos de la compañía, liderando la gestión de incidentes y problemas, la administración de contratos operativos, los procesos de DRP y BCP, y la estrategia de observabilidad y monitoreo, asegurando el cumplimiento normativo, la eficiencia operativa y la mejora continua de la experiencia de servicio.

Responsabilidades principales

1. Gestión de continuidad operacional

Diseñar, mantener y probar periódicamente los planes de Recuperación ante Desastres (DRP) y Continuidad del Negocio (BCP), garantizando la restauración oportuna de los servicios críticos.

Coordinar simulacros y pruebas de contingencia con las áreas técnicas y de negocio, asegurando trazabilidad, cumplimiento normativo (Ley 21.663, NCG 454, ISO 22301) y mejora continua.

Supervisar políticas de respaldo, replicación y contingencia tecnológica, asegurando su correcta ejecución.

2. Gestión de incidentes y problemas

Liderar la gestión integral de incidentes, asegurando su clasificación, priorización y resolución dentro de los tiempos comprometidos (SLA/OLA).

Establecer procesos de escalamiento eficientes y coordinar la comunicación con las áreas afectadas durante incidentes críticos o de seguridad.

Analizar las causas raíz de incidentes recurrentes, gestionando el ciclo de vida de problemas para prevenir su reaparición.

Elaborar informes post-incidente con lecciones aprendidas y acciones correctivas, integrándolos al plan de mejora continua.

Participar en comités de incidentes críticos y auditorías regulatorias, asegurando evidencia y trazabilidad de los casos.

3. Gestión de operaciones y soporte

Supervisar equipos de soporte Nivel 1 (N1) y de pasos a producción, garantizando atención oportuna, cumplimiento de SLA y operación estable de los entornos.

Establecer prioridades semanales, riesgos operativos y necesidades de apoyo, manteniendo visibilidad ejecutiva del avance.

Promover la automatización de tareas repetitivas y la optimización de procesos operativos a través de herramientas ITSM o scripts.

4. Observabilidad y monitoreo

Diseñar y mantener la estrategia de observabilidad (APM, Infra, Logs, Synthetics) para visibilidad extremo a extremo de los servicios TI con la herramienta New Relic.

Generar reportes ejecutivos de salud de plataformas (uptime, MTTR, error rate, SLOs), identificando tendencias y áreas de mejora.

Impulsar la adopción de prácticas SRE (Site Reliability Engineering) orientadas a resiliencia y performance operacional.

5. Gestión de contratos y proveedores

Administrar contratos de soporte, operación y monitoreo TI, asegurando cumplimiento de SLA, KPIs y calidad de servicio.

Evaluar y negociar nuevas soluciones o servicios tercerizados orientados a optimizar la operación.

6. Liderazgo y desarrollo del equipo

Coordinar y desarrollar al equipo de continuidad y soporte, fomentando la colaboración, autonomía y orientación a resultados.

Impulsar planes de formación en ITIL v4, ISO 22301, gestión de incidentes, crisis y observabilidad.

Promover una cultura de mejora continua y gestión proactiva de riesgos.

Formación y experiencia

Formación requerida:

Ingeniería en Informática, Sistemas, Industrial o carrera afín.

Requisitos mínimos

Mínimo 5 años de experiencia en Operaciones TI o Continuidad Operacional.

Experiencia liderando equipos técnicos, contratos de soporte TI y procesos de gestión de incidentes y problemas.

Conocimientos en DRP, BCP, observabilidad y monitoreo de infraestructura híbrida (on-premise y cloud).

Conocimiento Seguros