• Data Engineer (MLOPS) - Plateforme Do... - Paris

  • POSTULER

Partager sur :

Data Engineer (MLOPS) - Plateforme Données Massives AP-HP F/H

CDI, Temps plein

Paris, Paris (75)

Entre 45000 € et 70000 € (bruts/an)

CENTRE DE LA FORMATION ET DU DÉVELOPPEMENT DES COMPÉTENCES
Offre n°3517056 — publiée le 24/01/2025

Les missions qui vous attendent

Nous recherchons un.e ingénieur de la donnée (Data Engineer) passionné.e, avec une spécialisation en MLOps (Machine Learning Operations), pour rejoindre notre équipe dédiée à la conception, l'intégration et au déploiement des données massives au sein de l'Environnement de Données de Santé (EDS) de l'AP-HP. Votre rôle sera crucial pour garantir que les données sont mises à disposition de manière sécurisée et optimisée pour divers projets de recherche, de pilotage stratégique et d'aide à la décision au niveau du siège de l'AP-HP.

En tant qu'expert.e en MLOps, vous assurerez également la robustesse, la reproductibilité et l'évolutivité des modèles de machine learning, en étroite collaboration avec l'équipe Data Science.

Vous interviendrez sur l'ensemble du cycle de vie des données, de leur ingestion à leur exploitation, tout en participant à l'industrialisation des processus sur notre infrastructure Kubernetes.

Votre quotidien sera rythmé par des missions variées, parmi lesquelles :

- Conception et développement de solutions de traitement de données
- Intégration d'algorithmes ML/Deep Learning
- Optimisation de la performance dans un contexte Big Data
- Sécurisation et conformité
- Maintenance opérationnelle
- Documentation technique et utilisateur
- Contribution à la communauté Open Source
- Conception d'outils d'annotation de données médicales
- Veille technologique et transfert de compétences

Entre 45000 € et 70000 € (bruts/an)

Quel est le profil idéal ?

Diplôme : École d'ingénieur, informatique, data science, ou domaine connexe. (Bac +5)
Niveau d'expérience : Minimum 5 ans d'expérience en tant que Data Engineer, avec une spécialisation en MLOps et une expérience significative dans des environnements Big Data.

Compétences requises :
- Développement logiciel : Très bonne maitrise des langages de programmation Python et Scala. Également des langages de "scripting" comme Bash.
- Gestion des pipelines de données : Capacité à concevoir, développer et optimiser des pipelines de traitement de données à grande échelle, en utilisant des technologies comme Apache Spark, Polars, ou équivalent.
- Infrastructure et DevOps : Expérience avec des environnements on-premise (et optionnellement Cloud) et des outils DevOps (Docker, Kubernetes, Terraform) pour le déploiement et la gestion des infrastructures.
- Gestion et exploitation des bases de données/des systèmes de stockage : Maîtrise des solutions de stockage et gestion des bases de données (Hive, Hbase, Solr, Kafka, PostgreSQL, S3, etc.), adaptées à des données structurées et non structurées. Très bonne maitrise également des langages associés comme SQL, Lucene, etc.
- Backend/API : Connaissance des architectures backends/API et des solutions associées comme Spring Boot, Fast API, etc.
- Intégration et déploiement de modèles ML/AI
- Sécurisation des données et conformité
- Gestion de projet en méthodologie Agile
- Documentation technique et fonctionnelle
- Veille technologique

Confirmé (5 ans et plus)

La Direction des Services Numériques (DSN) de l'AP-HP fournit les services numériques de l'institution aux utilisateurs, qu'ils soient patients ou professionnels. Avec plusieurs centaines de services numériques, comme le dossier patient informatisé, les systèmes de biologie et d'imagerie, l'espace patient, elle gère ses infrastructures et plus de 500 professionnels qui oeuvrent au quotidien pour la transformation numérique de l'institution.

Le pôle Innovation & données de la DSN, composé d'environ 120 personnes, propose une offre de services structurée autour de l'innovation numérique, l'entrepôt de données de santé de l'AP-HP, la bio-informatique et des maladies rares.

Zoom sur les données et l'EDS !

Les données collectées via le dossier patient informatisé permettent de constituer des bases de données pseudonymisées de grande envergure, ouvrant des perspectives pour la recherche en santé, l'innovation et le pilotage hospitalier.

L'AP-HP a été parmis les pionniers en créant en 2017 le premier entrepôt de données de santé (EDS) hospitalier autorisé par la CNIL, aujourd'hui le plus grand en Europe.

Pour renforcer son rôle et accélérer la recherche en santé grâce à son EDS, l'AP-HP a lancé le programme ACCES AP-HP, s'inscrivant dans la Stratégie d'accélération « Santé Numérique » du plan France 2030. Lauréate de l'appel à projet « Accompagnement et soutien à la constitution d'entrepôts de données de santé hospitaliers », l'AP-HP forme son équipe ACCES AP-HP !

POSTULER

Postuler

Pour postuler à cette offre, rendez-vous directement sur le site du recruteur.

En cliquant sur "Postuler", vous acceptez nos CGU et déclarez avoir pris connaissance de notre politique de protection des données.