
Jefe de continuidad Operacional Senior - Hunting
Descripción
Propósito del cargo
Garantizar la disponibilidad, resiliencia y continuidad de los servicios tecnológicos críticos de la compañía, liderando la gestión de incidentes y problemas, la administración de contratos operativos, los procesos de DRP y BCP, y la estrategia de observabilidad y monitoreo, asegurando el cumplimiento normativo, la eficiencia operativa y la mejora continua de la experiencia de servicio.
Responsabilidades principales
1. Gestión de continuidad operacional
Diseñar, mantener y probar periódicamente los planes de Recuperación ante Desastres (DRP) y Continuidad del Negocio (BCP), garantizando la restauración oportuna de los servicios críticos.
Coordinar simulacros y pruebas de contingencia con las áreas técnicas y de negocio, asegurando trazabilidad, cumplimiento normativo (Ley 21.663, NCG 454, ISO 22301) y mejora continua.
Supervisar políticas de respaldo, replicación y contingencia tecnológica, asegurando su correcta ejecución.
2. Gestión de incidentes y problemas
Liderar la gestión integral de incidentes, asegurando su clasificación, priorización y resolución dentro de los tiempos comprometidos (SLA/OLA).
Establecer procesos de escalamiento eficientes y coordinar la comunicación con las áreas afectadas durante incidentes críticos o de seguridad.
Analizar las causas raíz de incidentes recurrentes, gestionando el ciclo de vida de problemas para prevenir su reaparición.
Elaborar informes post-incidente con lecciones aprendidas y acciones correctivas, integrándolos al plan de mejora continua.
Participar en comités de incidentes críticos y auditorías regulatorias, asegurando evidencia y trazabilidad de los casos.
3. Gestión de operaciones y soporte
Supervisar equipos de soporte Nivel 1 (N1) y de pasos a producción, garantizando atención oportuna, cumplimiento de SLA y operación estable de los entornos.
Establecer prioridades semanales, riesgos operativos y necesidades de apoyo, manteniendo visibilidad ejecutiva del avance.
Promover la automatización de tareas repetitivas y la optimización de procesos operativos a través de herramientas ITSM o scripts.
4. Observabilidad y monitoreo
Diseñar y mantener la estrategia de observabilidad (APM, Infra, Logs, Synthetics) para visibilidad extremo a extremo de los servicios TI con la herramienta New Relic.
Generar reportes ejecutivos de salud de plataformas (uptime, MTTR, error rate, SLOs), identificando tendencias y áreas de mejora.
Impulsar la adopción de prácticas SRE (Site Reliability Engineering) orientadas a resiliencia y performance operacional.
5. Gestión de contratos y proveedores
Administrar contratos de soporte, operación y monitoreo TI, asegurando cumplimiento de SLA, KPIs y calidad de servicio.
Evaluar y negociar nuevas soluciones o servicios tercerizados orientados a optimizar la operación.
6. Liderazgo y desarrollo del equipo
Coordinar y desarrollar al equipo de continuidad y soporte, fomentando la colaboración, autonomía y orientación a resultados.
Impulsar planes de formación en ITIL v4, ISO 22301, gestión de incidentes, crisis y observabilidad.
Promover una cultura de mejora continua y gestión proactiva de riesgos.
Formación y experiencia
Formación requerida:
Ingeniería en Informática, Sistemas, Industrial o carrera afín.
Requisitos mínimos
Mínimo 5 años de experiencia en Operaciones TI o Continuidad Operacional.
Experiencia liderando equipos técnicos, contratos de soporte TI y procesos de gestión de incidentes y problemas.
Conocimientos en DRP, BCP, observabilidad y monitoreo de infraestructura híbrida (on-premise y cloud).
Conocimiento Seguros