Site Reliability Engineer

Stefanini LATAM

Site Reliability Engineer ensuring continuous operation of data platforms at Stefanini. Leading SRE and DRE practices for incident prevention and operational excellence.

Posted 5/4/2026full-timeBogotá • 🇨🇴 ColombiaJuniorMid-LevelWebsite

Tech Stack

Tools & technologies

AirflowAmazon RedshiftApacheAWSGrafanaITSMPrometheus

About the role

Key responsibilities & impact

El Data & Site Reliability Engineer Senior es responsable de garantizar la confiabilidad, estabilidad y operación continua de las plataformas de datos y servicios analíticos de la organización.
Este rol combina las mejores prácticas de Site Reliability Engineering (SRE) y Data Reliability Engineering (DRE), enfocándose en la prevención de incidentes, automatización de procesos, reducción del tiempo de recuperación ante fallos (MTTR) y mejora de la experiencia operativa de extremo a extremo.
Lidera la definición y gobierno de indicadores de servicio (SLIs/SLOs) como frescura, completitud, latencia, confiabilidad y disponibilidad, impulsando la evolución hacia modelos operativos IOps y NoOps.

Requirements

What you’ll need

Mínimo 2 años o más de experiencia en roles de SRE, DRE, DevOps o ingeniería de plataformas de datos en ambientes productivos.
Experiencia comprobable liderando incidentes críticos y proyectos de automatización en entornos de datos.
2+ años de experiencia en roles SRE, DRE, DataOps o Platform Engineering
Dominio de Apache Airflow: gestión de DAGs, depuración, optimización de pipelines
Experiencia con dbt (data build tool): modelos, pruebas, linaje de datos
Conocimiento de Amazon Redshift: administración, optimización de consultas, WLM
Manejo de Grafana + Prometheus: dashboards, alertas, PromQL
Experiencia con OpsGenie o herramienta equivalente de gestión de alertas
Conocimiento de AWS Glue, Lambda, CloudWatch
Familiaridad con metodologías SRE: error budgets, SLOs, SLIs, SLAs
Experiencia con Jira Service Management o herramienta ITSM equivalente.

Benefits

Comp & perks

No especificados 📊 Check your resume score for this job Improve your chances of getting an interview by checking your resume score before you apply. Check Resume Score

ATS Keywords

✓ Tailor your resume

Applicant Tracking System Keywords

Tip: use these terms in your resume and cover letter to boost ATS matches.

Hard Skills & Tools

Site Reliability EngineeringData Reliability EngineeringDevOpsApache AirflowdbtAmazon RedshiftGrafanaPrometheusAWS GlueAWS Lambda

Soft Skills

leadershipincident managementautomationproblem-solvingcommunication