Distributed ML Systems Engineer (Accelerated AI)

Job expired!

Êtes-vous passionné par la conception de systèmes d'apprentissage automatique évolutifs ? Together AI est à la recherche d'un ingénieur talentueux en systèmes ML distribués pour développer et optimiser des systèmes distribués à grande échelle et tolérants aux pannes. Faites partie d'une équipe révolutionnaire qui façonne l'avenir de l'IA. Travaillez en étroite collaboration avec nos chercheurs talentueux et nos équipes d'infrastructure pour garantir des systèmes robustes et efficaces.

  • Concevoir et construire des systèmes d'apprentissage automatique distribués à grande échelle, tolérants aux pannes et haute performance.
  • Développer et optimiser des cadres de traitement distribués et des systèmes de stockage.
  • Collaborer avec les chercheurs, les ingénieurs et les responsables de produit pour intégrer les systèmes ML dans notre infrastructure.
  • Effectuer des examens d'architecture et de conception pour assurer les meilleures pratiques en matière de conception de systèmes.
  • Mettre en œuvre des systèmes de surveillance et de journalisation robustes pour assurer la santé et les performances de nos systèmes ML.
  • Plus de 3 ans d'expérience dans la construction de systèmes distribués à grande échelle, tolérants aux pannes et haute performance.
  • Compétences solides en programmation dans un ou plusieurs des langages suivants : Python, Go, Rust ou C/C++.
  • Excellente compréhension des concepts des systèmes d'exploitation de bas niveau, y compris la multithreading, la gestion de la mémoire, les réseaux et le stockage, la performance et l'échelle.
  • Expérience des plateformes de cloud computing (AWS, GCP, Azure, etc.) et de l'infrastructure à grande échelle.
  • Forte capacité de résolution de problèmes et aptitude à travailler dans un environnement dynamique.
  • Préféré : Expérience avec Kubernetes.
  • Préféré : Expérience avec Pytorch.

Together AI est une entreprise d'intelligence artificielle axée sur la recherche dédiée à la création de systèmes d'IA ouverts et transparents. Nous avons pour mission de réduire significativement le coût des systèmes d'IA modernes en co-concevant des logiciels, du matériel, des algorithmes et des modèles. Notre équipe a contribué à des avancées dans des technologies telles que FlashAttention, Hyena, FlexGen et RedPajama. Rejoignez notre groupe passionné de chercheurs et d'ingénieurs pour construire l'infrastructure IA de prochaine génération.

Nous offrons une rémunération compétitive, des parts d'entreprise, une assurance santé et d'autres avantages. Le salaire de base aux États-Unis pour ce poste à temps plein est de $160,000 - $220,000 plus des parts et des avantages. Nos barèmes de salaire sont déterminés en fonction du lieu, du niveau et du rôle. La rémunération individuelle sera basée sur l'expérience, les compétences et les connaissances liées à l'emploi.

Together AI est fier d'être un employeur garantissant l'égalité des chances offrant des opportunités d'emploi égales à tous, sans distinction de race, couleur, ascendance, religion, sexe, origine nationale, orientation sexuelle, âge, citoyenneté, statut matrimonial, handicap, identité de genre, statut de vétéran, etc.

Nom de l'entreprise : Together AI
Intitulé du poste : Ingénieur en Systèmes ML Distribués (IA Accélérée)