Senior Applied Machine Learning Engineer, NEMO Microservices

Job expired!

Depuis plus de 25 ans, NVIDIA est à l'avant-garde des graphiques informatiques, du jeu sur PC et de l'innovation en calcul accéléré. Nos avancées technologiques, portées par des équipes incroyables, repoussent désormais les limites de l'IA pour définir le futur du calcul. Nos GPUs sont le cerveau derrière des ordinateurs, des robots et des voitures autonomes qui comprennent le monde comme jamais auparavant.

Chez NVIDIA, vous vous immergerez dans un environnement diversifié et soutenant où l'innovation prospère. Notre mission est de transformer des idées visionnaires en produits révolutionnaires. Rejoindre notre équipe signifie travailler aux côtés des meilleurs talents de l'industrie pour avoir un impact durable sur le monde.

Nous recherchons un Ingénieur Machine Learning Appliqué Senior pour faire partie de l'équipe qui construit la plateforme de la suite de microservices NeMo. Notre objectif est de créer des services et interfaces IA de nouvelle génération qui améliorent et déploient l'IA à grande échelle. Notre attention se porte sur le développement des technologies de pointe dans les domaines de la parole, de la vision et du TAL pour résoudre des problèmes réels. Nous participons activement à toutes les phases du cycle de vie du machine learning, de la conception initiale à la recherche appliquée, en passant par l'inférence optimisée et le déploiement.

  • Développer une nouvelle génération de plateformes de systèmes IA composés avec des capacités de raisonnement à travers plusieurs modalités telles que les images, vidéos, audio et texte.
  • Créer des applications cloud distribuées, des microservices et des plateformes MLOps qui s'adaptent à des modèles de très grande taille.
  • Construire des microservices pour des services cloud IA spécifiques à des tâches.
  • Implémenter l'infrastructure principale pour l'entraînement et l'inférence IA natifs du cloud.
  • Chercher la performance optimale dans des conditions de forte charge.
  • BS, Master ou expérience équivalente en informatique, architecture informatique ou dans un domaine connexe.
  • Plus de 5 ans d'expérience dans le domaine.
  • Compétences exceptionnelles en codage visant à la création de logiciels de haute qualité.
  • Capacité à travailler indépendamment, définir les objectifs et le périmètre du projet, interagir avec la communauté open source et gérer les efforts de développement.
  • Expérience avec l'implémentation de microservices et d'applications natives du cloud utilisant des technologies telles que HTTP REST, gRPC, protobuf et JSON.
  • Compétence dans le déploiement d'applications sur des plateformes Kubernetes et familiarité avec les helm charts, kustomize et k8s operator.
  • Compréhension approfondie de la performance, de la sécurité et de la fiabilité dans des infrastructures distribuées complexes.
  • Excellent programmation et compétences en conception logicielle en Python ou Golang, y compris débogage, performance, analyse de santé du service et conception de tests.
  • Expérience dans le déploiement de modèles d'apprentissage machine ou statistiques dans des environnements de production en utilisant des cadres comme PyTorch, TensorFlow, ONNX Runtime et TensorRT.
  • Connaissance des cadres d'apprentissage profond tels que Megatron Core, NeMo, HuggingFace Accelerate, HuggingFace Transformers, DeepSpeed, et similaires.
  • Expérience avec les plateformes d'orchestration MLOps telles que Seldon Core, Kserve, BentoML, et similaires.
  • Expertise avec des moteurs d'inférence comme VLLM, TensorRT-LLM, et similaires.
  • Expérience dans le développement de systèmes N