Apply

Ready to go for it?

AI Apply speeds things up—apply directly if you prefer.

FREE ACCESS
5,000–10,000 jobs/day
JobTailor Logo

See all jobs on JobTailor

Search thousands of fresh jobs every day.

Discover
  • Fresh listings
  • Fast filters
  • No subscription required
Create a free account and start exploring right away.
knowmad mood

Senior SRE Engineer – Site Reliability Engineering

knowmad mood

Senior SRE Engineer ensuring service reliability at knowmad mood. Responsible for monitoring, observability, and maintaining production services using SRE practices.

Posted 4/22/2026full-timeRemote • 🇪🇸 SpainSeniorWebsite

Tech Stack

Tools & technologies
DockerGrafanaJavaKubernetesPrometheus

About the role

Key responsibilities & impact
  • Garantizar la fiabilidad y disponibilidad de los servicios en producción aplicando prácticas SRE.
  • Diseñar e implementar monitorización y observabilidad con Prometheus, Grafana y ELK.
  • Gestionar arquitecturas de microservicios, aplicando patrones de resiliencia (circuit breaker, bulkheading, service discovery).
  • Desarrollar y mantener automatizaciones y servicios en Java (8/11) con buenas prácticas de testing.
  • Administrar y optimizar contenedores y despliegues en Docker y Kubernetes.
  • Realizar performance testing, análisis de capacidad y mejora continua del rendimiento.
  • Participar en guardias rotativas y resolución de incidencias críticas, incluyendo post-mortems.
  • Aplicar Chaos Engineering para validar la resiliencia del sistema.
  • Implementar prácticas de AIOps para mejorar la detección y respuesta automatizada de incidentes.
  • Colaborar dentro de un squad multidisciplinar, aportando visión técnica y coordinándose con desarrollo, QA y producto.

Requirements

What you’ll need
  • Compromiso, trabajo en equipo y capacidad para comunicar ideas técnicas complejas.
  • Experiencia sólida en monitorización y observabilidad (Prometheus, Grafana, ELK).
  • Conocimiento avanzado en arquitecturas de microservicios y patrones de resiliencia.
  • Dominio de Java 8/11 y prácticas de testing.
  • Experiencia con Docker y Kubernetes.
  • Experiencia en performance testing, resolución de incidencias y guardias on-call.
  • Conocimientos en SRE, Chaos Engineering y AIOps.
  • Perfil claramente senior y acostumbrado a trabajar en squads multidisciplinares.
  • Nivel alto de inglés.

Benefits

Comp & perks
  • Contrato Indefinido
  • 100% remoto y flexibilidad horaria
  • Formación interna y acceso a certificaciones
  • Plan de retribución flexible (seguro médico, transporte, tickets guardería, tickets restaurante)
  • Embajador de nuestra marca, a través de nuestro plan amigo ¡Recomienda a tus amigos y llévate un extra!
  • ¡Eventos, meetups, techdays, charlas...y mucho más!

ATS Keywords

✓ Tailor your resume
Applicant Tracking System Keywords

Tip: use these terms in your resume and cover letter to boost ATS matches.

Hard Skills & Tools
Java 8Java 11performance testingmonitorizaciónobservabilidadmicroserviciospatrones de resilienciaChaos EngineeringAIOpsautomatización
Soft Skills
trabajo en equipocomunicación técnicacompromisoresolución de incidenciascoordinación