Data Science Lead - AI/ML Solutions

Job expired!

Sanofi est une entreprise mondiale de santé de premier plan dédiée aux miracles de la science pour améliorer le bien-être individuel dans le monde entier. Présente dans plus de 100 pays, nous nous engageons à transformer la médecine, à rendre l'impossible possible. Notre mission inclut la fourniture d'options de traitement qui changent la vie et de vaccins qui sauvent des vies, tout en donnant la priorité à la durabilité et à la responsabilité sociale.

Sanofi est actuellement en pleine transformation numérique, se concentrant sur l'accélération de la transformation des données grâce à des solutions d'intelligence artificielle (IA) et d'apprentissage automatique (ML). Cette démarche stratégique vise à accélérer la R&D, améliorer la fabrication, élever la performance commerciale et fournir plus rapidement des médicaments et des vaccins de qualité supérieure, améliorant ainsi la santé mondiale et sauvant des vies.

En tant que leader passionné en sciences des données, vous défiez le statu quo et conduisez le développement et l'impact des solutions d'IA de Sanofi pour les futurs patients. Votre leadership et votre expérience pratique dans le déploiement de solutions IA/ML et GenAI, ainsi que votre parcours avéré en gestion du cycle de vie technique, font de vous un atout essentiel pour notre équipe.

Ce rôle nécessite un leader dynamique et collaboratif avec une solide formation technique pour diriger le développement et le déploiement de solutions avancées d'apprentissage automatique, en mettant l'accent sur les modèles GenAI. Les points forts incluent :

  • Diriger la conception et le développement de composants personnalisés d'apprentissage automatique (ML), de traitement du langage naturel (NLP) et de grands modèles de langage (LLM) pour des pipelines IA/ML.
  • Superviser l'ingestion, le prétraitement, la recherche et la récupération de données, la génération augmentée par récupération (RAG) et le fin-tuning pour garantir l'alignement avec les exigences techniques et commerciales.
  • Collaborer avec les ingénieurs en données, ML Ops, les ingénieurs logiciels et autres membres de l'équipe technique pour développer et mettre en œuvre des solutions ML dans un environnement transversal.
  • Travailler avec les membres de l'équipe de science des données pour développer, valider et maintenir des solutions d'évaluation robustes pour évaluer la performance, la précision, la consistance et la fiabilité du modèle.
  • Mettre en œuvre des optimisations de modèle pour améliorer l'efficacité du système.
  • Collaborer avec l'équipe MLOps pour déployer des modèles ML, NLP, LLM et Gen AI en production, en garantissant la fiabilité, la scalabilité et une intégration transparente.
  • Contribuer au développement de stratégies de déploiement pour les modèles NLP, LLM et Gen AI.
  • Travailler en étroite collaboration avec les équipes produit, les parties prenantes commerciales et les membres de l'équipe de science des données pour intégrer les modèles d'apprentissage automatique dans les systèmes de production.
  • Favoriser la communication et la coopération entre les équipes pour des résultats de projet réussis.
  • Résoudre des problèmes complexes liés au développement de modèles d'apprentissage automatique et aux pipelines de données.
  • Développer de manière innovante des solutions pour surmonter les défis et améliorer les performances des modèles et l'efficacité du système.

Éducation et Expérience :

  • Doctorat ou Master dans une discipline quantitative connexe avec de solides compétences en codage.
  • Expérience dans le développement de modèles NLP, y compris les architectures de transformateurs.
  • Expérience professionnelle dans la recherche et la récupération d'informations à grande échelle et en tant qu'ingénieur Backend et/ou logiciel.

Compétences techniques :

  • Expérience pratique avec les LLM (GPT, Claude) et les plateformes courantes.
  • Connaissance des bases de données vectorielles et du développement d'applications RAG.
  • Développement discipliné en IA/ML, y compris CI/CD et orchestration.

Communication et Collaboration :