Tech Lead Manager (TLM) - Supercomputing Scalability

Job expired!

Rejoignez notre équipe pionnière en supercalcul chez OpenAI

À propos de l'équipe

Les superordinateurs sont la force motrice permettant des avancées majeures dans la technologie, et chez OpenAI, nous repoussons les limites de ce que ces géants peuvent faire. Notre Pilier de Scalabilité du Supercalcul est dédié à redéfinir l'infrastructure des superordinateurs à l'échelle des clusters. Nous nous concentrons sur l'amélioration de la scalabilité au-delà des nombres de nœuds existants, le déploiement rapide des mises à jour à l'échelle du cluster, l'intégration d'une télémétrie complète, et l'incorporation de matériel de pointe pour soutenir des efforts de scalabilité de classe mondiale.

À propos du rôle

En tant que Chef d'équipe technique (TLM) au sein du Pilier de Scalabilité chez OpenAI basé dans la dynamique ville de San Francisco, CA, vous dirigerez les efforts pour rationaliser et étendre les capacités des superordinateurs à l'échelle des DC. Avec votre leadership, notre équipe utilisera et dépassera les limites des outils largement disponibles, relèvera de nouveaux défis matériels, et gérera les clusters de superordinateurs et les bases d'utilisateurs en croissance. Il s'agit d'un rôle hybride nécessitant trois jours de collaboration sur site par semaine, avec une assistance à la relocation disponible pour les candidats retenus.

Responsabilités clés

  • Direction directe des contributeurs individuels (ICs) qui établissent les fondations de notre scalabilité en supercalcul.
  • Favoriser un environnement d'équipe agile et performant pour faire avancer notre technologie de supercalcul à l'échelle mondiale tout en priorisant la sécurité et la fiabilité.
  • Améliorer les cadres d'orchestration et de surveillance pour une performance de supercalcul de premier ordre.
  • Prôner l'automatisation pour commander un contrôle sans précédent sur notre pile technologique.
  • Approfondir notre compréhension de la santé et de l'utilité du supercalcul pour des recherches révolutionnaires et l'entraînement des modèles.

Qui prospère dans ce rôle?

Vous êtes idéal pour ce poste si vous :

  • Possédez une solide compréhension de Kubernetes (k8s) et des systèmes d'orchestration de clusters.
  • Brillez dans le développement logiciel et avez une histoire de travail avec les nuages publics, en particulier Azure.
  • Êtes non seulement compétent en leadership technique, mais êtes également passionné par le mentorat et la conduite des équipes vers l'excellence.
  • Valorisez et favorisez un lieu de travail diversifié et inclusif qui promeut le dialogue ouvert et remet en question la pensée conventionnelle.
  • Faites preuve d'initiative, de volonté d'apprendre de nouvelles compétences, et d'un engagement envers le succès de l'équipe.
  • Avez des compétences de communication exceptionnelles avec une capacité à dialoguer de manière transparente et efficace.
  • Comprendre les charges de travail IA/ML est un plus !

À propos de OpenAI

Chez OpenAI, nous nous engageons à faire avancer la technologie de l'intelligence artificielle qui peut avoir un impact profond sur le monde de manière positive. Notre travail se concentre sur le développement de l'IA qui englobe des perspectives mondiales et répond aux besoins humains. Nous assurons que le développement de l'IA est sûr et que ses avantages sont universels.

OpenAI est un employeur offrant l'égalité des chances. Nous célébrons la diversité et nous engageons à créer un environnement inclusif pour tous les employés. Nous encourageons les candidats de différents milieux, cultures, genres, expériences, capacités et perspectives à postuler.