Principal Engineer, AI Data Sourcing, Generation and Value

Job expired!

Vous êtes un leader expérimenté en ingénierie logicielle à la recherche d'un rôle stimulant à la pointe de l'IA et du ML? Nous vous invitons à explorer notre opportunité de carrière en tant qu'Ingénieur Principal spécialisé dans l'Acquisition, la Génération et la Valeur des Données d'IA. Chez Google, vous assurerez une leadership stratégique et technique dans l'acquisition de données de haute qualité pour l'entraînement des modèles GenAI.

  • Diplôme de licence en Informatique, Mathématiques, autre domaine pertinent de l'Ingénierie, ou expérience pratique équivalente.
  • 15 ans d'expérience en tant que leader en ingénierie logicielle dans le domaine de l'infrastructure ML, ML ou IA pour des produits, ou des domaines connexes.
  • Expérience avec les systèmes de machine learning à grande échelle.

  • Expérience dans la gestion des parties prenantes, en traduisant les besoins en exigences techniques.
  • Historique prouvé dans le développement et l'innovation de technologie à grande échelle, avec une passion pour le code partagé multiplateforme.
  • Compréhension approfondie du développement de modèles GenAI, de la pré-entraînement au fine-tuning produit, et définition de données de haute qualité pour des cas d'utilisation spécifiques.
  • Forte compréhension des systèmes et infrastructures ML pour la production, avec le savoir-faire technique pour communiquer efficacement avec les clients et les ingénieurs.
  • Capacité à offrir des conseils techniques détaillés tout en conservant une stratégie globale, favorisant une livraison de produit efficace, et une gestion des données simplifiée.

L'intelligence artificielle transforme rapidement le paysage, et la qualité des données d'entraînement et d'évaluation est essentielle pour rester en tête de la concurrence. L'immense dépôt de données de Google est un atout unique, offrant un avantage significatif. Le potentiel de l'IA générative repose sur la qualité des données utilisées pour l'entraînement, le tuning et l'évaluation, ainsi que sur notre capacité à itérer rapidement pour une réactivité améliorée au marché et une vitesse d'innovation.

Dans ce rôle critique, vous assurerez une leadership stratégique et technique dans l'acquisition de données de haute qualité pour l'entraînement des modèles GenAI. Vous vous concentrerez sur la conception et le développement de systèmes pour les différentes étapes des données GenAI – de la pré-entraînement, SFT/RLHF, à l'optimisation de la production en boucle. La collaboration avec Google DeepMind, Research et d'autres équipes d'infrastructure, ainsi qu'avec des équipes produits transversales, est essentielle.

Google Cloud permet aux organisations de se transformer numériquement dans toutes les industries, en tirant parti de notre technologie de pointe. Des clients dans plus de 200 pays comptent sur Google Cloud pour stimuler la croissance et résoudre leurs défis commerciaux les plus critiques.

La fourchette de salaire de base aux États-Unis pour ce poste à temps plein est de 278 000 $ à 399 000 $, plus bonus, actions et avantages sociaux. Nos fourchettes de salaire sont basées sur le rôle, le niveau et l'emplacement, et reflètent les salaires cibles minimum et maximum pour tous les emplacements aux États-Unis. Votre salaire spécifique dans cette fourchette sera discuté avec votre recruteur, en tenant compte de vos compétences, de votre expérience et de votre formation. Veuillez noter que les détails de la rémunération indiqués sont uniquement le salaire de base et excluent les bonus, les actions ou les avantages sociaux. En savoir plus sur les avantages chez Google.

  • Diriger des initiatives techniques pour la recherche et la génération de données aux différentes étapes de développement des modèles, créant une boucle de données de modèles de base aux produits.
  • Collaborer avec les partenaires de Google DeepMind, Google Research, des domaines de produits comme Ads, Search, YouTube, Cloud, et autres équipes d'infrastructure pour développer des feuilles de route conjointes et obtenir des résultats.
  • Définir des attributs de qualité/valeur pour les actifs de données en travaillant avec des équipes transversales comprenant la Science des Données, les Opérations de Données, et la Gestion de Produit.
  • Encadrer et former d