Chercheur en Intelligence Artificielle chez GenAI, Équipe d'Évaluation des Modèles et de Sécurité

  • Full Time
Job expired!

Description de l'entreprise

Fondée fin 2020 par un petit groupe de chercheurs en apprentissage automatique, MosaicML permet aux entreprises de créer des modèles d'IA de pointe à partir de zéro sur leurs propres données. D'un point de vue commercial, MosaicML est convaincu que les modèles d'IA d'une entreprise sont aussi précieux que tout autre propriété intellectuelle clé, et que des modèles d'IA de haute qualité devraient être accessibles à tous. D'un point de vue scientifique, MosaicML s'engage à réduire le coût de formation des modèles de pointe - et à partager nos connaissances sur comment le faire avec le monde - pour permettre à chacun d'innover et de créer ses propres modèles.

Maintenant partie de Databricks depuis juillet 2023 en tant que l'équipe GenAI, nous sommes passionnés par l'habilitation de nos clients à résoudre les problèmes les plus difficiles du monde en construisant et en exploitant la meilleure plateforme de données et d'IA au monde. Nous saisissons toutes les occasions de résoudre des défis techniques, en cherchant à doter nos clients des meilleures capacités de données et d'IA.

Description du poste

En tant que chercheur scientifique au sein de l'équipe GenAI chez Databricks, vous serez responsable de rester à jour avec les derniers développements en matière d'apprentissage en profondeur et de faire progresser la frontière scientifique en créant de nouvelles techniques qui vont au-delà de l'état de l'art. Vous travaillerez ensemble au sein d'une équipe collaborative de chercheurs issus de divers horizons et formations techniques. Et surtout, vous aimerez nos clients : notre objectif est de rendre nos clients efficaces lorsqu'ils forment de grands modèles, et nous intégrons notre expertise scientifique dans nos produits pour rendre cela possible.

En ce qui concerne l'évaluation des modèles, vous travaillerez sur la conception de suites d'évaluation motivées scientifiquement à haute performance pour permettre à nos chercheurs et à nos clients de prendre des décisions critiques lors de la formation et du déploiement de modèles génératifs de pointe pour le texte, les images et autres domaines. Vous aurez la possibilité de repousser les limites de l'art en matière d'évaluation de l'utilisation des outils, de génération de code, de RAG, d'évaluation de la sécurité et de la toxicité, et d'évaluation basée sur des modèles. Vous aiderez également à construire et à concevoir des systèmes pour permettre à nos clients de construire la prochaine génération d'évaluations pour leurs modèles génératifs spécifiques à leur domaine.

Vous pourriez être un bon candidat si vous…

  • Êtes à l'aise avec les LLM à grande échelle dans les dizaines à des centaines de milliards de paramètres.
  • Avez des compétences solides en ingénierie de traitement de texte/données et en recherche scientifique en ML.
  • Avez déployé des systèmes LLM pour résoudre des problèmes du monde réel et avez conçu des moyens astucieux d'évaluer les performances du système.
  • Avez travaillé sur la sécurité, le jailbreaking, ou le red-teaming de LLMs.
  • Êtes passionné par la mise de votre travail entre les mains de vrais utilisateurs et - de manière plus générale - par la démocratisation de l'accès à la technologie moderne de l'IA.
  • Êtes motivé par le travail de recherche sur les LLM qui - contrairement à la tendance générale dans le domaine - sera divulgué au public.
  • Avez de solides compétences en communication et le désir de travailler sur des problèmes ouverts sur lesquels vous aurez un grand degré d'autonomie.

Un doctorat N'EST PAS requis pour ce poste. Nous sommes ouverts à l'embauche de candidats ayant des diplômes de licence et de master et de nouveaux diplômés. Nous sommes prêts à embaucher des candidats qui occupent actuellement des postes d'"ingénieur de recherche" dans d'autres entreprises.

Vos responsabilités

  • Se tenir à jour avec la littérature de recherche et penser au-delà de l'état de l'art pour répondre aux besoins de nos utilisateurs.
  • Développer et mettre en œuvre de nouvelles méthodes pour évaluer les capacités des modèles génératifs pour le texte, les images et autres domaines.
  • Tester rigoureusement ces méthodes, communiquer les résultats de vos découvertes et mettre en production celles qui sont utiles.

Transparence de la fourchette de rémunération

Databricks s'engage à adopter des pratiques de rémunération équitables. La ou les fourchettes de rémunération pour ce poste sont indiquées ci-dessous et représentent la fourchette de salaire de base pour des rôles non commissionnés ou des gains cibles pour des rôles commissionnés. Les packages de rémunération réels sont basés sur plusieurs facteurs uniques à chaque candidat, notamment, mais sans s'y limiter, les compétences liées au travail, la profondeur de l'expérience, les certifications et formations pertinentes et l'emplacement de travail spécifique. En se basant sur les facteurs ci-dessus, Databricks utilise toute la largeur de la fourchette. Le package de rémunération totale pour ce poste peut également inclure l'éligibilité à un bonus de performance annuel, des parts d'actions et les avantages listés ci-dessus. Pour plus d'informations sur la fourchette dans laquelle se situe votre emplacement, visitez notre page ici.