Apply

Ready to go for it?

AI Apply speeds things up—apply directly if you prefer.

FREE ACCESS
5,000–10,000 jobs/day
JobTailor Logo

See all jobs on JobTailor

Search thousands of fresh jobs every day.

Discover
  • Fresh listings
  • Fast filters
  • No subscription required
Create a free account and start exploring right away.
Stefanini LATAM

Site Reliability Engineer

Stefanini LATAM

Senior Data & Site Reliability Engineer at Stefanini ensuring the reliability and operation of data platforms and analytical services.

Posted 4/13/2026full-timeBogotá, D.C. • 🇨🇴 ColombiaJuniorMid-LevelWebsite

Tech Stack

Tools & technologies
AirflowAmazon RedshiftApacheAWSGrafanaITSMPrometheus

About the role

Key responsibilities & impact
  • El Data & Site Reliability Engineer Senior es responsable de garantizar la confiabilidad, estabilidad y operación continua de las plataformas de datos y servicios analíticos de la organización.
  • Este rol combina las mejores prácticas de Site Reliability Engineering (SRE) y Data Reliability Engineering (DRE), enfocándose en la prevención de incidentes, automatización de procesos, reducción del tiempo de recuperación ante fallos (MTTR) y mejora de la experiencia operativa de extremo a extremo.
  • Lidera la definición y gobierno de indicadores de servicio (SLIs/SLOs) como frescura, completitud, latencia, confiabilidad y disponibilidad, impulsando la evolución hacia modelos operativos IOps y NoOps.

Requirements

What you’ll need
  • Mínimo 2 años o más de experiencia en roles de SRE, DRE, DevOps o ingeniería de plataformas de datos en ambientes productivos.
  • Experiencia comprobable liderando incidentes críticos y proyectos de automatización en entornos de datos.
  • 2+ años de experiencia en roles SRE, DRE, DataOps o Platform Engineering
  • Dominio de Apache Airflow: gestión de DAGs, depuración, optimización de pipelines
  • Experiencia con dbt (data build tool): modelos, pruebas, linaje de datos
  • Conocimiento de Amazon Redshift: administración, optimización de consultas, WLM
  • Manejo de Grafana + Prometheus: dashboards, alertas, PromQL
  • Experiencia con OpsGenie o herramienta equivalente de gestión de alertas
  • Conocimiento de AWS Glue, Lambda, CloudWatch
  • Familiaridad con metodologías SRE: error budgets, SLOs, SLIs, SLAs
  • Experiencia con Jira Service Management o herramienta ITSM equivalente.

Benefits

Comp & perks
  • No se especifican beneficios en el anuncio.

ATS Keywords

✓ Tailor your resume
Applicant Tracking System Keywords

Tip: use these terms in your resume and cover letter to boost ATS matches.

Hard Skills & Tools
Site Reliability EngineeringData Reliability EngineeringDevOpsDataOpsPlatform EngineeringApache AirflowdbtAmazon RedshiftGrafanaPrometheus
Soft Skills
leadershipincident managementautomationoperational improvement