Senior/Principal Data Scientist - NLP (Remote)

Job expired!

Rejoignez Veeva Systems, un pionnier des solutions cloud pour l'industrie, axé sur l'accélération de la délivrance thérapeutique pour les sciences de la vie. En tant que l'une des entreprises SaaS à la croissance la plus rapide, nous avons atteint plus de 2 milliards de dollars de revenus au cours du dernier exercice fiscal, avec des opportunités de croissance infinies à venir.

Chez Veeva, nos valeurs sont primordiales : Faire les choses bien, Succès client, Succès des employés et Vitesse. En 2021, nous sommes devenus une société à but bénéfique public (PBC), légalement engagée à équilibrer les intérêts des clients, des employés, de la société et des investisseurs.

Profitez de la liberté de travailler de n'importe où—que ce soit de chez vous ou du bureau—pour exceller dans votre environnement idéal. Rejoignez-nous pour transformer l'industrie des sciences de la vie, et avoir un impact positif sur nos clients, nos employés et nos communautés.

Veeva a pour mission de rationaliser l'entrée sur le marché des produits dans les sciences de la vie et les industries réglementées. Ancrées dans nos valeurs fondamentales—Faire les choses bien, Succès client, Succès des employés et Vitesse—nos équipes créent des logiciels cloud transformateurs, des services, des conseils et des solutions de données pour améliorer l'efficacité et l'efficience de nos clients.

En tant que société à but bénéfique public, vous ferez partie d'une entreprise engagée à avoir un impact positif sur ses clients, ses employés et ses communautés. Le produit Link de Veeva est essentiel dans notre écosystème, reliant les sciences de la vie avec des individus clés pour promouvoir la recherche et les soins de santé.

Votre rôle consistera à développer des agents basés sur des modèles de langage (LLM) pour extraire des informations détaillées sur les leaders d'opinion clés (KOL) dans le secteur de la santé, en utilisant l'infrastructure cloud pour le développement de modèles, et à collaborer avec une équipe dédiée pour affiner et déployer ces modèles.

Nous cherchons à révolutionner les normes de l'industrie grâce à des modèles d'apprentissage automatique avancés, aidés par plus de 2000 curateurs, garantissant qualité et évolutivité à travers les régions, les langues et les spécialités médicales.

Lieu : Télétravail aux Pays-Bas, au Royaume-Uni ou en Espagne. Les candidats doivent résider et être légalement autorisés à travailler dans l'un de ces pays sans soutien en matière de visa ou de relocalisation de la part de Veeva.

  • Adopter les dernières technologies et tendances NLP pour votre plateforme.
  • Développer des agents basés sur des modèles de langage pour améliorer l'interaction et la récupération de données.
  • Exploiter des méthodes de renforcement (RLHF) comme l'optimisation directe des préférences (DPO) et l'optimisation polaire proximale (PPO).
  • Concevoir une pipeline de bout en bout pour l'extraction d'informations à partir de données non structurées à grande échelle.
  • Créer une fonctionnalité de recherche sémantique robuste pour répondre efficacement aux requêtes des utilisateurs.
  • Utiliser la reconnaissance des entités nommées, le lien entre les entités, le remplissage des champs, l'apprentissage par quelques exemples et d'autres techniques pour l'extraction d'informations.
  • Analyser et interpréter les modèles de données en fonction de la source et de la région.
  • Collaborer avec les équipes de qualité des données pour l'évaluation qualitative et quantitative des modèles.
  • Utiliser l'infrastructure cloud dans le développement de modèles, en assurant un déploiement efficace avec les développeurs de logiciels et les ingénieurs DevOps.
  • 4+ ans en tant que Data Scientist (ou 2+ ans avec un doctorat).
  • Master ou doctorat en informatique, IA, linguistique computationnelle ou domaine lié.
  • Solides connaissances théoriques en NLP, ML et Deep Learning.
  • Expérience avérée avec les modèles de langage (LLM) et les architectures de transformateurs (par ex., GPT, BERT).
  • Compétent en Python et bibliothèques NLP (par ex., NLTK, SpaCy