
DevOps Engineer – SRE, Observability
Coderio
full-time
Posted on:
Location Type: Remote
Location: Argentina
Visit company websiteExplore more
About the role
- Garantizar la salud proactiva de los sistemas
- Enfocarse en la observabilidad end-to-end
- Responder eficientemente ante incidentes
- Asegurar que la experiencia del usuario final no se vea afectada
Requirements
- - **1. Stack de Observabilidad**
- - Experiencia avanzada en monitoreo y métricas con Prometheus, Grafana, Datadog o New Relic
- - Gestión de logs centralizados con ELK Stack (Elasticsearch, Logstash, Kibana), Splunk o Graylog
- - Implementación de trazabilidad distribuida con OpenTelemetry, Jaeger o Honeycomb para identificar cuellos de botella en microservicios
- **- **2. Ingeniería de Confiabilidad (SRE Core)**
- - Capacidad para definir y configurar SLIs y SLOs alineados a las expectativas del negocio
- - Conocimiento en gestión de Error Budgets para decidir cuándo priorizar estabilidad sobre nuevas funcionalidades
- - Experiencia liderando procesos de Postmortem sin culpables y análisis de causa raíz (RCA)
- **- **3. Automatización y Plataforma**
- - Dominio de Infrastructure as Code con Terraform o CloudFormation para despliegues automatizados de agentes de monitoreo
- - Conocimiento sólido en Kubernetes/OpenShift con recolección de métricas a nivel de clúster (Kube-state-metrics, Node Exporter)
- - Capacidad de automatizar respuestas a alertas y runbooks mediante Python, Go o Bash
- **- **4. Gestión de Alertas y Respuesta a Incidentes**
- - Configuración de alertas inteligentes que reduzcan ruido y fatiga operacional con PagerDuty, Opsgenie o VictorOps
- - Dominio de técnicas de diagnóstico rápido en entornos productivos bajo presión, con foco en la reducción de MTTR
Benefits
- - 100% remoto
- - Compromiso a largo plazo, con autonomía e impacto
- - Rol estratégico y de alta visibilidad en una cultura de ingeniería moderna
- - Equipo internacional colaborativo y liderazgo técnico sólido
- - Plan de carrera y crecimiento dentro de Coderio
Applicant Tracking System Keywords
Tip: use these terms in your resume and cover letter to boost ATS matches.
Hard Skills & Tools
monitoreométricasprometheusgrafanadatadognew relicELK StackopenTelemetryKubernetesPython
Soft Skills
gestión de incidentesanálisis de causa raízliderazgotrabajo bajo presióncomunicación efectiva