Tech Stack
BigQueryCloudGoogle Cloud PlatformPythonSQL
About the role
- Concevoir et maintenir des pipelines de données sur Google Cloud Platform (batch & streaming)
- Ingestion et traitement de données issues de systèmes cliniques, data labs, fichiers omiques
- Modélisation et exposition dans BigQuery (datawarehouse et datamarts analytiques)
- Intégration avec des outils de data science / machine learning pour les équipes IA & biomarqueurs
- Implémentation des bonnes pratiques de sécurité, anonymisation, audit et gestion des droits d’accès
- Documentation, CI/CD, automatisation et participation à la gouvernance data
- Contribution à un programme stratégique de modernisation des plateformes Data & IA
Requirements
- Titulaire d’un Bac +5 (école d’ingénieur, université ou équivalent)
- Minimum 3 ans d’expérience en data engineering, dont au moins 1 an sur Google Cloud Platform (GCP)
- Expérience dans un environnement réglementé (santé, pharmaceutique, essais cliniques ou biotechnologies)
- Maîtrise avancée des langages Python et SQL
- Application rigoureuse des bonnes pratiques de sécurité des données, traçabilité, gestion de versions et anonymisation
- Maîtrise professionnelle de l'Anglais (écrit et oral)
- Excellentes capacités relationnelles et aptitude à collaborer avec équipes Data Science, experts métiers, sécurité et qualité