Tech Stack
AWSCloudKubernetesTerraform
About the role
- Implementar una tercera zona de disponibilidad en la nube de AWS, logrando equilibrio entre fiabilidad y estabilidad de los servicios
- Analizar el servicio y los componentes de infraestructura para mejorar disponibilidad, desempeño, mantenibilidad y resiliencia
- Crear y diseñar sistemas robustos, predecir posibles fallos y configurar automatizaciones para resiliencia y redundancia
- Mantener y mejorar la infraestructura de TI y sus componentes, incluyendo automatización de tareas mediante herramientas y codificación
- Estandarizar, documentar y divulgar políticas, prácticas y herramientas de observabilidad que apoyen la implementación de SRE
- Implementar métricas clave de SRE para medir efectividad y promover mejora continua
- Optimizar costos en todas las cuentas de nube para mantener buen desempeño sin plataformas ociosas
- Implementar y mantener mejores prácticas para continuidad de negocio y pruebas DRP
- Automatizar tareas operativas y repetitivas que contribuyan a eficiencia y estabilidad de la infraestructura en la nube
- Contribuir a resiliencia a partir de la predicción de escenarios de falla, hojas de ruta y planes de mejora
- Proponer planes de acción y apoyar implementación para solución de causa raíz de incidentes productivos
- Desarrollar herramientas de automatización para supervisar sistemas, gestionar incidentes y realizar tareas operativas de TI
- Apoyar diseño y ejecución de pruebas de recuperación ante desastres y registrar resultados
- Implementar cambios y actualizaciones de software para su lanzamiento en producción
- Gestionar la entrega/implementación continua mediante herramientas de automatización
- Construir y operar capacidades de integración continua (CI) empleando control de versiones y artefactos
- Controlar cambios de configuración y mantener integridad, coherencia y trazabilidad
- Garantizar que los requisitos de seguridad y privacidad sean parte esencial de la construcción e integración de sistemas
Requirements
- Formación Requerida: Ingeniería de Sistemas, Ingeniería de Software, Ingeniería Informática u otras ingenierías afines
- Formación Complementaria (Preferible): AWS Certified Cloud Practitioner
- Cursos en Ingeniería de Fiabilidad del Sitio (SRE, site reliability engineering)
- 2 años en DevOps o en Ingeniería de Fiabilidad del Sitio (SRE)
- Inglés Técnico
- Conocimiento en Ingeniería de Fiabilidad del Sitio (SRE)
- Conocimiento avanzado en herramientas de observabilidad
- Conocimiento de métricas de observabilidad, disponibilidad y SLAs
- Conocimientos medio-altos en herramientas para automatización
- Conocimientos avanzado en infraestructura en la nube de AWS
- Conocimientos en prácticas de resiliencia y recuperación ante desastres
- Conocimientos en herramientas ofimáticas
- Conocimientos de Kubernetes
- Conocimientos de Terraform
- Conocimientos de GitLab
- Conocimientos de NewRelic
- Conocimiento básico de gestión del servicio ITIL
- Esquema Hibrido 3 días en oficina
- Equipo de la compañía
- Esquema Freelance
- Bono de Puntualidad
- Vales de Despensa
- Vales de Restaurante
- Prestaciones de Ley + PTU
- Plataformas de Aprendizaje y Mentoring
- Descuentos en Escuelas de Idiomas
Applicant Tracking System Keywords
Tip: use these terms in your resume and cover letter to boost ATS matches.
Hard skills
AWSautomatizacióninfraestructura en la nubemétricas de SRErecuperación ante desastresKubernetesTerraformGitLabNewRelicobservabilidad
Soft skills
análisismejora continuapredicción de fallosgestión de incidentesdocumentacióncomunicacióntrabajo en equiporesilienciaorganizaciónsolución de problemas
Certifications
AWS Certified Cloud Practitioner