Apply

Ready to go for it?

AI Apply speeds things up—apply directly if you prefer.

FREE ACCESS
5,000–10,000 jobs/day
JobTailor Logo

See all jobs on JobTailor

Search thousands of fresh jobs every day.

Discover
  • Fresh listings
  • Fast filters
  • No subscription required
Create a free account and start exploring right away.
Stefanini LATAM

Site Reliability Engineer

Stefanini LATAM

Site Reliability Engineer ensuring continuous operation of data platforms at Stefanini. Leading SRE and DRE practices for incident prevention and operational excellence.

Posted 5/4/2026full-timeBogotá • 🇨🇴 ColombiaJuniorMid-LevelWebsite

Tech Stack

Tools & technologies
AirflowAmazon RedshiftApacheAWSGrafanaITSMPrometheus

About the role

Key responsibilities & impact
  • El Data & Site Reliability Engineer Senior es responsable de garantizar la confiabilidad, estabilidad y operación continua de las plataformas de datos y servicios analíticos de la organización.
  • Este rol combina las mejores prácticas de Site Reliability Engineering (SRE) y Data Reliability Engineering (DRE), enfocándose en la prevención de incidentes, automatización de procesos, reducción del tiempo de recuperación ante fallos (MTTR) y mejora de la experiencia operativa de extremo a extremo.
  • Lidera la definición y gobierno de indicadores de servicio (SLIs/SLOs) como frescura, completitud, latencia, confiabilidad y disponibilidad, impulsando la evolución hacia modelos operativos IOps y NoOps.

Requirements

What you’ll need
  • Mínimo 2 años o más de experiencia en roles de SRE, DRE, DevOps o ingeniería de plataformas de datos en ambientes productivos.
  • Experiencia comprobable liderando incidentes críticos y proyectos de automatización en entornos de datos.
  • 2+ años de experiencia en roles SRE, DRE, DataOps o Platform Engineering
  • Dominio de Apache Airflow: gestión de DAGs, depuración, optimización de pipelines
  • Experiencia con dbt (data build tool): modelos, pruebas, linaje de datos
  • Conocimiento de Amazon Redshift: administración, optimización de consultas, WLM
  • Manejo de Grafana + Prometheus: dashboards, alertas, PromQL
  • Experiencia con OpsGenie o herramienta equivalente de gestión de alertas
  • Conocimiento de AWS Glue, Lambda, CloudWatch
  • Familiaridad con metodologías SRE: error budgets, SLOs, SLIs, SLAs
  • Experiencia con Jira Service Management o herramienta ITSM equivalente.

Benefits

Comp & perks
  • No especificados 📊 Check your resume score for this job Improve your chances of getting an interview by checking your resume score before you apply. Check Resume Score

ATS Keywords

✓ Tailor your resume
Applicant Tracking System Keywords

Tip: use these terms in your resume and cover letter to boost ATS matches.

Hard Skills & Tools
Site Reliability EngineeringData Reliability EngineeringDevOpsApache AirflowdbtAmazon RedshiftGrafanaPrometheusAWS GlueAWS Lambda
Soft Skills
leadershipincident managementautomationproblem-solvingcommunication