Staff AI Infrastructure Engineer

Job expired!
Offre d'emploi : Ingénieur Infrastructure IA/ML chez XPeng Motors

XPeng Motors est une entreprise leader dans le domaine des véhicules électriques (VE) intelligents en Chine. Nous concevons, développons et fabriquons des VE intelligents, intégrant parfaitement les technologies avancées d'Internet, d'IA et de conduite autonome. Engagés dans la R&D interne et la fabrication intelligente, nous visons à révolutionner la mobilité pour nos clients grâce à la technologie et aux données.

Nous recherchons un Ingénieur Infrastructure IA/ML talentueux pour améliorer notre productivité. Dans ce rôle, vous identifierez et résoudrez les lacunes de l'infrastructure pour garantir des solutions fiables, efficaces et évolutives, ayant un impact sur nos opérations de recherche et développement.

Responsabilités principales :

  • Identifier et résoudre les lacunes de l'infrastructure pour des solutions fiables et évolutives.
  • Développer l'infrastructure IA/ML pour améliorer l'efficacité de nos équipes ML.
  • Concevoir des solutions pour des domaines critiques tels que le stockage distribué, les systèmes de planification, la haute disponibilité et la fiabilité de base pour les clusters GPU à grande échelle.
  • Surveiller et optimiser les performances de l'infrastructure IA/ML, en garantissant une haute disponibilité et une utilisation efficace des ressources.
  • Développer et déployer des outils d'automatisation, des solutions de surveillance et des stratégies opérationnelles pour simplifier la gestion de l'infrastructure.
  • Collaborer avec les développeurs ML, les ingénieurs de données et les professionnels DevOps pour créer un écosystème d'infrastructure IA/ML cohérent.

Exigences minimales en matière de compétences :

  • Diplôme de baccalauréat en informatique, en ingénierie ou dans un domaine technique connexe.
  • 5-8 ans d'expérience en ingénierie logicielle avec une forte expertise dans les systèmes distribués à grande échelle, de préférence dans le domaine de l'IA/ML.
  • Maîtrise des langages de programmation tels que Python, Go ou C++, et connaissance des plateformes cloud comme AWS ou Azure.
  • Fortes capacités de communication et de collaboration pour travailler avec des équipes diversifiées.

Exigences préférées en matière de compétences :

  • Compréhension approfondie des workflows IA/ML, y compris la formation de modèles, le traitement des données et les pipelines d'inférence.
  • Expérience avec les technologies de conteneurisation (Docker, Kubernetes), les outils d'automatisation (Ansible, Terraform) et les solutions de surveillance (Prometheus, Grafana).
  • Compétences exceptionnelles en résolution de problèmes pour analyser des systèmes complexes et mettre en œuvre des solutions évolutives.
  • Passion pour l'apprentissage continu et le maintien à jour des nouvelles technologies et des meilleures pratiques en infrastructure IA/ML.

Ce que nous offrons :

  • Un environnement de travail amusant, solidaire et engageant.
  • L'opportunité d'avoir un impact significatif sur la conduite autonome et la révolution des transports.
  • La chance de travailler avec des technologies de pointe et des talents de premier plan dans le domaine.
  • Un package de rémunération compétitif.
  • Des collations, des déjeuners et des activités amusantes.

La fourchette de salaire de base pour ce poste à temps plein est de 180 000 $ à 300 000 $, en plus des bonus, des actions et des avantages sociaux. Les fourchettes salariales sont déterminées en fonction du rôle, du niveau et de l'emplacement. Au sein de cette fourchette, la rémunération individuelle est déterminée par le lieu de travail et d'autres facteurs tels que les compétences, l'expérience et la formation ou l'éducation pertinente.