• Partner Resources
  • Members E-Learning
  • Log Out
En
  • French
Skip to content
Pride At Work Canada
  • About
    • Who we are
      • Staff
      • Board
      • Careers
      • Annual Report
    • Network
      • Proud Partners
      • Community Partners
    • Get Involved
      • Become a Proud Partner
      • Become a Community Partner
    • Contact
    • Media
  • Programs
    • Consulting
      • Consulting Services
      • Workplace Pride Audit
    • Leadership
      • CHANGEMAKERS
      • FLOURISH
      • THRIVE
    • Learning
      • e-Learning
      • Reports, Guides & Toolkits
      • Training Sessions
      • Webinar Content Library
    • Membership
    • Networking
      • Ambassador Program
      • Matrices
  • Events
    • Calendar
    • List of Events
  • News
    • News & Features
    • Newsletter Archive
  • Projects
    • Empowering 2SLGBTQIA+ Workers in Energy
    • Stronger Together
  • Resources
    • Podcast
    • Reports, Guides & Toolkits
    • Webinar Content Library
  • Job Board
  • Partner Resources
  • Members E-Learning
  • Log Out
Pride At Work Canada
En
  • French

Ssr Site Reliability Engineer

Home / Ssr Site Reliability Engineer

Return to List


City : Toronto

Category : Credit Analyst

Industry : Financial Services/Banking

Employer : Scotiabank

 

 

 

ID de la solicitud: 257231

Programa de Referido de Empleados – Probable Pago: $0.00 

Estamos comprometidos en continuar invirtiendo en nuestros empleados y ayudarte a continuar desarrollando tu línea de carrera en Scotiabank.

 

 

Propósito

El Ingeniero de Site Reliability (SRE) tiene como propósito garantizar la disponibilidad, confiabilidad, escalabilidad y eficiencia operativa de los sistemas y servicios críticos de la organización, combinando prácticas de ingeniería de software con operaciones.

 

El SRE trabaja en estrecha colaboración con los equipos de desarrollo, operaciones y producto para implementar y fortalecer prácticas de observabilidad, gestión de incidentes, respuesta ante fallos, automatización y mejora continua, asegurando que los servicios cumplan con los acuerdos de nivel de servicio (SLA/SLO) establecidos y mantengan una experiencia de usuario óptima.

 

Asimismo, se encarga de detectar fallas en tiempo real, liderar la respuesta técnica inicial, automatizar tareas repetitivas, reducir el MTTR y proporcionar análisis basados en datos para prevenir incidentes futuros y mejorar continuamente la confiabilidad del entorno productivo.

 

Responsabilidades:

Disponibilidad y confiabilidad de servicios

 

  • Diseñar, implementar y mantener sistemas resilientes que cumplan con SLO/SLA.
  • Asegurar la operación 7x24 y la continuidad del servicio respetando error budgets.

Observabilidad y análisis (end‑to‑end)

 

  • Implementar y mantener observabilidad (métricas, logs, trazas) y alertas accionables.
  • Administrar dashboards y reglas de alerta en la plataforma de monitoreo utilizada.
  • Definir, medir y monitorear SLI/SLO por servicio.
  • Analizar tendencias y degradaciones con datos (queries de métricas, logs y trazas).

Gestión de incidentes y postmortems

 

  • Actuar como primer nivel técnico especializado: detección y diagnóstico inicial.

Coordinar la escalación y apoyar la resolución durante incidentes P1/P2.

 

  • Documentar y dar seguimiento a postmortems/RCA y planes de acción.
  • Reducir MTTR y prevenir reincidentes.

Confiabilidad, automatización y mejora continua

 

  • Aplicar prácticas SRE (toil reduction, automatización, release readiness, error budgets).

Automatizar tareas operativas (scripts, pipelines CI/CD, remedios).

  • Identificar y ejecutar optimización de arquitectura, rendimiento y costos.

 Gestión de capacidad y escalabilidad

 

  • Analizar tendencias de uso y crecimiento para anticipar necesidades de infraestructura.
  • Planificar y validar escalabilidad y performance de los servicios.

Colaboración transversal

  • Colaborar con Desarrollo, QA, Seguridad, Infraestructura y Producto desde el diseño.
  • Asegurar que los nuevos servicios cumplan estándares de observabilidad, mantenibilidad y confiabilidad antes del go‑live.

Seguridad y cumplimiento

 

  • Asegurar cumplimiento de políticas de seguridad, privacidad y normativas aplicables.
  • Colaborar en controles, evidencias y auditorías conforme a marcos internos.

Documentación técnica y cultura SRE

  • Mantener documentación clara y actualizada (arquitectura, procesos, runbooks, SLI/SLO, RCA).
  • Promover principios SRE y buenas prácticas dentro de los equipos relacionados.

 

Relaciones jerárquicas (solo nombres de puestos)Gerente principal:

(incluir al gerente secundario si es pertinente)

  • Sub Director Service Reliability Engineering (SRE)

Subordinados directos:

n/a

Subordinados compartidos (línea continua o punteada, según sea el caso):

  • n/a

 

 

 

  • Gestión de sistemas de alto volumen transaccional en operación 7x24.
  • Responsabilidad sobre la salud y disponibilidad del ecosistema productivo.
  • Generación de reportes ejecutivos de disponibilidad y desempeño.
  • Colaboración con equipos de TI locales y globales.
  • Mejora del proceso on-call.
  • Comprende la cultura de riesgo del Banco y cómo debe considerarse el apetito de riesgo en las actividades y decisiones diarias.
  • Garantiza el cumplimiento de los controles operativos y regulatorios aplicables.
  • Contribuye a la reducción del riesgo operativo, regulatorio, de lavado de dinero, financiamiento al terrorismo y riesgo de conducta.

 

Educación / Experiencia / Otra información (incluya solo aquellos que son específicos a la función)

  • Título universitario en Ingeniería en Sistemas, Computación, Telecomunicaciones o afín.
  • Nivel de inglés intermedio‑alto (oral y escrito).
  • 5+ años de experiencia en entornos productivos de alta disponibilidad y alto volumen transaccional (operación 7x24).
  • 3+ años en soporte a producción o roles relacionados con confiabilidad, operación o monitoreo.
  • 4+ años de experiencia en ingeniería de nube (AWS, GCP, Azure) o funciones equivalentes.
  • Experiencia en diseño, implementación y mantenimiento de SLI/SLO y prácticas SRE.
  • Experiencia con microservicios, cargas de trabajo basadas en contenedores y funciones.
  • Experiencia en diseño de arquitecturas resilientes, escalables y seguras.
  • Participación en gestión de incidentes complejos, diagnósticos detallados y análisis de causa raíz.
  • Capacidad probada para identificar proactivamente problemas, cuellos de botella y oportunidades de mejora.

 

En Scotiabank, valoramos las habilidades y experiencias únicas que cada persona aporta al banco y nos comprometemos a crear y mantener un entorno inclusivo y accesible para todos. Todos/as los/las empleados deben cumplir con las políticas, normas, códigos y directrices del banco relacionadas con la no discriminación y las adaptaciones en el lugar de trabajo.Si necesitas algún tipo de adaptación en temas de accesibilidad durante el proceso, indícalo a nuestro equipo de Atracción de Talento**Scotiabank es una empresa incluyente, que respeta la diversidad y no hace ningún tipo de discriminación****Bajo ninguna circunstancia solicita pruebas de embarazo, ni de VIH**Agradecemos tu interés. Sin embargo, únicamente las personas seleccionadas para entrevista serán contactadas

 

Ubicación(s):  México : Ciudad de México : Cuauhtémoc

Scotiabank es un banco líder en las Américas. Inspirándonos en nuestro propósito corporativo, “por nuestro futuro”, ayudamos a nuestros clientes, sus familias y sus comunidades a lograr el éxito a través de una completa gama de asesoría, productos y servicios en los sectores de banca personal y comercial, gestión patrimonial, banca privada, corporativa y de inversión, y mercados de capital.

En Scotiabank, valoramos las habilidades y experiencias únicas que cada persona aporta al Banco y nos hemos comprometido a crear y mantener un entorno inclusivo y accesible para todos. Si necesitas algún tipo de adaptación (como, por ejemplo, un lugar accesible para la entrevista, documentos en formato alternativo, un intérprete en lengua de señas o tecnología de asistencia, entre otras cosas) durante el proceso de reclutamiento y selección, indícalo a nuestro equipo de Reclutamiento. Si necesitas apoyo técnico, haz clic aquí. Los candidatos deben postularse directamente en línea si desean ser tomados en cuenta para este puesto. Agradecemos a todos los candidatos por su interés en esta oportunidad profesional en Scotiabank, pero solo nos comunicaremos con aquellos que hayan sido seleccionados para una entrevista.

Return to List

Subscribe to our newsletter:

Privacy Policy

PRIDE AT WORK CANADA/FIERTÉ AU TRAVAIL CANADA

© Pride at Work Canada 2022