Tech Lead Manager (TLM) - Supercomputing Scheduling

Job expired!

À propos de l'équipe : Le pilier de planification de supercalcul d'OpenAI se concentre sur la fiabilité, la scalabilité, et la convivialité dans la gestion du cycle de vie des travaux. Nous sommes fiers de fournir une planification de travaux efficace et flexible, une gestion de quotas, et des flux de travail d'exécution de travaux rationalisés. Notre objectif est d'améliorer la productivité des chercheurs en assurant un bon débit élevé, un emballage efficace, et un flux de travail d'entraînement ergonomique et constant, en montant en puissance vers des superordinateurs plus grands tout en minimisant la charge opérationnelle.

À propos du rôle : En tant que responsable technologique et manager (TLM) / Manager d'ingénierie au sein de notre pilier de planification, vous dirigerez une équipe dynamique qui conçoit, déploie, et gère des systèmes de gestion de cycle de vie des travaux pour l'entraînement de modèles sur certains des plus grands superordinateurs mondiaux. Ce rôle offre une échelle immense, des délais serrés, et la chance d'impacter significativement la mission d'OpenAI. Une compréhension technique approfondie est essentielle, bien que non spécifiquement en IA/DA.

Ce poste est basé à San Francisco, CA, et suit un modèle de travail hybride avec trois jours en bureau par semaine. Une aide à la réinstallation est disponible pour les candidats qualifiés.

  • Gestion directe des contributeurs individuels (ICs) développant notre technologie de planification de supercalcul.
  • Construire et diriger des équipes performantes pour livrer notre technologie de manière sûre et fiable aux utilisateurs du monde entier.
  • Concevoir, mettre en œuvre, et gérer les composants cruciaux de nos systèmes de planification de travaux, gestion de quotas et de file d'attente.
  • Collaborer étroitement avec les chercheurs pour aligner les ressources de supercalcul sur les demandes des projets.
  • Intégrer les fonctionnalités du cycle de vie des travaux avec l'infrastructure des clusters, les solutions de stockage et les protocoles de santé matérielle.

Vous pourriez être un candidat idéal si vous :

  • Avez une expérience étendue avec les systèmes de planification à très grande échelle.
  • Possédez des compétences de programmation robustes et un solide parcours dans les environnements cloud publics, en particulier Azure.
  • Êtes motivé, avec un accent aigu sur l'exécution et les besoins des utilisateurs.
  • Pouvez diriger des équipes techniques efficacement, en favorisant une culture de lieu de travail diversifiée, équitable et inclusive.
  • Êtes proactif dans la résolution de problèmes et désireux d'acquérir de nouvelles connaissances selon les besoins.
  • Excelliez dans la communication, avec un talent pour l'expression claire et une écoute attentive.

L'expérience avec les charges de travail IA/ML est un atout mais pas requise.

OpenAI s'engage à faire progresser la technologie de l'intelligence artificielle qui peut bénéficier profondément à toute l'humanité. Notre mission principale est de s'assurer que le développement de l'intelligence artificielle se fait avec la sécurité et le bien-être public à l'esprit. Nous accueillons les perspectives diverses et sommes fiers d'être un employeur offrant l'égalité des chances.

Si vous êtes prêt à façonner l'avenir de la technologie, postulez aujourd'hui pour rejoindre notre équipe chez OpenAI !

Pour plus d'informations sur nos politiques de confidentialité et les règlements d'emploi, veuillez