HPC Engineer, Machine Learning Infrastructure - EMEA Remote

Job expired!

Bienvenue chez Hugging Face ! Nous avons pour mission de faire progresser l'apprentissage automatique et de le rendre accessible à tous. Notre parcours implique de contribuer à la croissance de la technologie pour un avenir meilleur.

Nous avons créé la bibliothèque open-source de modèles pré-entraînés à la croissance la plus rapide au monde. Avec plus d'un million de modèles et plus de 320K étoiles sur GitHub, la technologie Hugging Face est utilisée en production par plus de 15 000 entreprises, y compris des organisations leaders en IA comme Google, Elastic, Salesforce, Grammarly et la NASA.

Nous recherchons un ingénieur HPC expérimenté pour développer et faire évoluer notre cluster distribué de grande taille. Le candidat idéal aura une solide expérience dans la mise en place de grands clusters de calcul pour les flux de travail d'IA et guidera les équipes pour créer les meilleures pratiques en termes de fiabilité et d'évolutivité.

  • Concevoir, développer, déployer et maintenir une infrastructure fiable et évolutive pour des charges de travail d'entraînement efficaces.
  • Gérer de grands clusters de calcul pour l'entraînement et le développement de l'IA.
  • Créer des outils et des infrastructures pour abstraire le calcul et le stockage dans les flux de travail ML.
  • Mesurer et optimiser les performances du système.
  • Surveiller et résoudre les problèmes d'infrastructure pour assurer une haute disponibilité et des performances optimales des charges de travail d'IA.
  • Se tenir au courant des dernières technologies d'infrastructure d'IA et recommander des améliorations.
  • Collaborer avec les équipes d'ingénierie logicielle IA pour s'assurer que l'infrastructure répond aux exigences du système.
  • Fournir un support opérationnel et une ingénierie principale à travers plusieurs équipes.
  • Plus de 7 ans d'expérience en tant qu'ingénieur DevOps ou d'infrastructure, avec un accent sur l'infrastructure d'apprentissage automatique et de grands clusters GPU.
  • Expertise avec des fournisseurs de services cloud tels que AWS, GCP, des cadres d'infrastructure-as-code et des outils d'observabilité.
  • Maîtrise de la pile scientifique Python et de Pytorch.
  • Expérience avec les structures de données, la modélisation de données et la gestion de bases de données, y compris les systèmes de stockage d'objets et de fichiers.
  • Excellentes compétences en communication, collaboration et documentation.
  • Familiarité avec Linux, Git, les conteneurs, le réseautage et les outils en ligne de commande.
  • Solides compétences en programmation en Python, Golang et/ou Rust.

Si vous êtes un ingénieur HPC passionné avec un profond intérêt pour l'IA et que vous prospérez dans un environnement stimulant et innovant, nous voulons entendre parler de vous. Rejoignez notre équipe pour aider à faire progresser les technologies IA tout en travaillant aux côtés de professionnels talentueux dans un cadre collaboratif et stimulant.

Nous nous engageons à construire un lieu de travail diversifié et inclusif. Hugging Face est un employeur qui respecte l'égalité des chances et célèbre la diversité. Nous ne discriminons pas en fonction de la race, de la religion, de la couleur, de l'origine nationale, du sexe, de l'orientation sexuelle, de l'âge, du statut matrimonial, du statut de vétéran ou du handicap.

Chez Hugging Face, vous collaborerez avec certains des esprits les plus brillants de l'industrie. Nous encourageons une culture de croissance continue et offrons des remboursements pour les conférences, formations et éducations pertinentes.

Nous nous soucions de votre bien-être. Nos avantages incluent des horaires de travail flexibles, des options de travail à distance, une assurance santé, dentaire et visuelle pour les employés et leurs ayants droit, 12 semaines de congé parental (20 semaines pour les mères accouchantes) et des congés payés illimités.

Bien que nous ayons des bureaux à NYC et à Paris, nous sommes une équipe distribuée. Les employés à distance sont les bienvenus à visiter nos bureaux, et nous nous assurerons que votre poste de travail est équipé pour réussir, où que vous soyez.

Nous croyons au partage de notre succès. Tous les employés reçoivent des actions de