FREE ACCESS
5,000–10,000 jobs/day

See all jobs on JobTailor
Search thousands of fresh jobs every day.
Discover
- Fresh listings
- Fast filters
- No subscription required
Create a free account and start exploring right away.

Site Reliability Engineer
Stefanini LATAMSite Reliability Engineer ensuring continuous operation of data platforms at Stefanini. Leading SRE and DRE practices for incident prevention and operational excellence.
Tech Stack
Tools & technologiesAirflowAmazon RedshiftApacheAWSGrafanaITSMPrometheus
About the role
Key responsibilities & impact- El Data & Site Reliability Engineer Senior es responsable de garantizar la confiabilidad, estabilidad y operación continua de las plataformas de datos y servicios analíticos de la organización.
- Este rol combina las mejores prácticas de Site Reliability Engineering (SRE) y Data Reliability Engineering (DRE), enfocándose en la prevención de incidentes, automatización de procesos, reducción del tiempo de recuperación ante fallos (MTTR) y mejora de la experiencia operativa de extremo a extremo.
- Lidera la definición y gobierno de indicadores de servicio (SLIs/SLOs) como frescura, completitud, latencia, confiabilidad y disponibilidad, impulsando la evolución hacia modelos operativos IOps y NoOps.
Requirements
What you’ll need- Mínimo 2 años o más de experiencia en roles de SRE, DRE, DevOps o ingeniería de plataformas de datos en ambientes productivos.
- Experiencia comprobable liderando incidentes críticos y proyectos de automatización en entornos de datos.
- 2+ años de experiencia en roles SRE, DRE, DataOps o Platform Engineering
- Dominio de Apache Airflow: gestión de DAGs, depuración, optimización de pipelines
- Experiencia con dbt (data build tool): modelos, pruebas, linaje de datos
- Conocimiento de Amazon Redshift: administración, optimización de consultas, WLM
- Manejo de Grafana + Prometheus: dashboards, alertas, PromQL
- Experiencia con OpsGenie o herramienta equivalente de gestión de alertas
- Conocimiento de AWS Glue, Lambda, CloudWatch
- Familiaridad con metodologías SRE: error budgets, SLOs, SLIs, SLAs
- Experiencia con Jira Service Management o herramienta ITSM equivalente.
Benefits
Comp & perks- No especificados 📊 Check your resume score for this job Improve your chances of getting an interview by checking your resume score before you apply. Check Resume Score
ATS Keywords
✓ Tailor your resumeApplicant Tracking System Keywords
Tip: use these terms in your resume and cover letter to boost ATS matches.
Hard Skills & Tools
Site Reliability EngineeringData Reliability EngineeringDevOpsApache AirflowdbtAmazon RedshiftGrafanaPrometheusAWS GlueAWS Lambda
Soft Skills
leadershipincident managementautomationproblem-solvingcommunication