Tech Stack
AirflowApacheCloudScalaSparkSQL
About the role
- Desarrollar y mantener procesos de ingesta, transformación y explotación de datos en entornos Big Data
- Implementar y optimizar pipelines de datos en Databricks, Apache Airflow y Cloudera
- Diseñar consultas y modelos de datos eficientes utilizando SQL, Impala y Starburst
- Integrar y gestionar datos en entornos cloud (Amazon S3)
- Participar en proyectos de reporting y visualización con QlikView
- Colaborar con equipos técnicos en la mejora continua de la arquitectura de datos y en la optimización de costes y rendimiento
Requirements
- 4 - 5 años de experiencia en entornos Big Data
- Experiencia sólida en Scala y Spark
- Conocimientos avanzados de SQL
- Experiencia práctica con Impala y Starburst
- Experiencia en Apache Airflow
- Experiencia en Databricks
- Experiencia en proyectos con Cloudera
- Experiencia con almacenamiento en Amazon S3
- Conocimientos en QlikView para reporting y análisis