Senior AI and ML Infra Engineer, Research Clusters

Job expired!

Êtes-vous passionné par l'IA et l'apprentissage automatique ? NVIDIA à Santa Clara, CA, USA recherche un Ingénieur Infrastructure IA/ML compétent pour améliorer nos solutions technologiques de pointe. C'est une opportunité sans pareil de contribuer à une équipe qui est à l'avant-garde de la technologie IA/ML, pilotant des innovations qui impactent le monde.

En tant que Ingénieur Infrastructure Senior IA et ML, votre tâche principale sera de booster la productivité de nos équipes de recherche en identifiant et en comblant les lacunes infrastructurelles. Cela inclut la conception et la mise en œuvre de solutions pour améliorer la scalabilité, la fiabilité et l'efficacité de nos vastes clusters GPU et autres systèmes critiques.

  • Comprendre les besoins en infrastructure des équipes de recherche IA/ML et les traduire en améliorations efficaces.
  • Concevoir des solutions pour la gestion du stockage, l'attribution des erreurs et les problèmes de fiabilité au sein de nos clusters GPU.
  • Optimiser les performances et l'utilisation des ressources de l'infrastructure IA/ML grâce à une surveillance et une mise à niveau continues.
  • Développer des outils d'automatisation et des stratégies opérationnelles pour minimiser les tâches manuelles et simplifier la gestion de l'infrastructure.
  • Collaborer avec les équipes interfonctionnelles pour assurer un écosystème d'infrastructure IA/ML homogène et robuste.
  • Rester à jour avec les dernières avancées dans les technologies IA/ML et les intégrer dans les stratégies de NVIDIA.

Nous recherchons quelqu'un avec un BS ou équivalent (MS préféré) en Informatique ou dans des domaines connexes, soutenu par au moins 12 ans d'expérience pertinente. Vous devriez avoir un solide historique en génie logiciel avec une compréhension approfondie des systèmes distribués à grande échelle, de préférence dans les infrastructures IA/ML.

  • Compétence dans les langages de programmation tels que Python, Go ou C++.
  • Familiarité avec les plateformes cloud telles que AWS, GCP ou Azure.
  • Expérience avec Docker, Kubernetes, Ansible, Terraform, Prometheus, Grafana et d'autres outils similaires.
  • Une compréhension approfondie des workflows IA/ML depuis le traitement des données jusqu'à l'entraînement et l'inférence des modèles.
  • De solides compétences en résolution de problèmes et la capacité de développer des solutions évolutives pour des systèmes complexes.
  • Excellentes compétences en communication et en collaboration d'équipe.

Chez NVIDIA, nous offrons un package de compensation compétitif incluant un salaire de base attractif allant de 220 000 $ à 419 750 $, reflétant votre expérience et votre rôle au sein de l'entreprise. De plus, vous serez éligible à des participations et à un package d'avantages complets qui soutient la santé, le bien-être et la sécurité financière.

Notre équipe comprend certains des professionnels les plus talentueux au monde, et nous connaissons une croissance sans précédent. Si vous êtes un ingénieur créatif et autonome avec une véritable passion pour la technologie, NVIDIA est votre tremplin pour briller.

NVIDIA s'engage à favoriser un environnement de travail diversifié et inclusif. Nous sommes fiers d'être un employeur offrant l'égalité des chances et valorisons la diversité sous toutes ses formes. Nous ne discriminons sur la base d'aucune caractéristique protégée légalement.

Prêt à contribuer à notre équipe extraordinaire chez NVIDIA ? Nous acceptons les candidatures de manière continue. Mettez à profit vos compétences dans un rôle où vous pouvez vraiment faire la différence. Postule