Ingénieur IV en apprentissage automatique - Optimisation des performances GenAI

Job expired!

Fondée fin 2020 par un petit groupe d'ingénieurs et de chercheurs en apprentissage automatique, MosaicML permet aux entreprises de peaufiner, former et déployer en toute sécurité des modèles d'IA personnalisés sur leurs propres données, pour une sécurité et un contrôle maximum. Compatible avec tous les principaux fournisseurs de cloud, la plateforme MosaicML offre une flexibilité maximale pour le développement de l'IA. Introduits en 2023, les modèles de transformateurs pré-entraînés de MosaicML ont établi une nouvelle norme pour les LLM ouverts et commercialement utilisables, et ont été téléchargés plus de 3 millions de fois. MosaicML s'engage dans la conviction qu'un modèle d'IA d'entreprise est tout aussi précieux que tout autre IP principal, et que des modèles d'IA de haute qualité doivent être accessibles à tous.

Maintenant partie intégrante de Databricks depuis juillet 2023, nous sommes passionnés par permettre à nos clients de résoudre les problèmes les plus difficiles du monde - de rendre possible le prochain mode de transport à accélérer le développement de découvertes médicales. Nous faisons cela en construisant et en gérant la meilleure plateforme de données et d'IA du monde afin que nos clients puissent utiliser des insights approfondis pour améliorer leur entreprise. Nous saisissons chaque occasion pour relever des défis techniques, cherchant à doter nos clients des meilleures capacités de données et d'IA.

Vous allez :

  • Explorer et analyser les goulets d'étranglement des performances dans la formation et l'inférence ML
  • Concevoir, mettre en œuvre et faire un benchmark des bibliothèques et des méthodes pour surmonter les goulets d'étranglement mentionnés ci-dessus
  • Créer des outils pour le profilage des performances, l'analyse et l'estimation pour la formation et l'inférence en machine learning
  • Équilibrer le compromis entre les performances et la facilité d'utilisation pour nos clients
  • Faciliter notre communauté par le biais de documentation, de discours, de tutoriels et de collaborations
  • Collaborer avec des chercheurs externes et des entreprises d'IA de premier plan sur diverses méthodes d'efficacité

Nous recherchons :

  • Expérience pratique des fonctionnalités internes des frameworks d'apprentissage profond (par exemple, PyTorch, TensorFlow) et des modèles d'apprentissage profond
  • Expérience avec des bibliothèques d'algèbre linéaire hautes performances telles que cuDNN, CUTLASS, Eigen, MKL, etc.
  • Expérience générale de la formation et du déploiement de modèles ML
  • Expérience avec les technologies de compilateurs pertinentes pour l'apprentissage automatique
  • Expérience avec le développement de systèmes distribués ou de charges de travail ML distribuées
  • Expérience pratique de l'écriture de code CUDA et connaissance des fonctionnalités internes du GPU (préféré)
  • Publications dans les principales conférences ML ou système telles que MLSys, ICML, ICLR, KDD, NeurIPS (préféré)

Nous apprécions les candidats qui sont curieux de toutes les parties du succès de l'entreprise et qui sont disposés à apprendre de nouvelles technologies en cours de route.

Transparence de la fourchette salariale

Databricks s'engage à des pratiques de rémunération équitables. La fourchette de salaire pour ce poste est indiquée ci-dessous et représente la plage de salaire de base pour les postes non commissionnés ou les gains cibles pour les postes commissionnés. Les packages de rémunération réels sont basés sur plusieurs facteurs propres à chaque candidat, y compris mais non limité aux compétences professionnelles, à l'expérience, aux certifications et formations pertinentes, et au lieu de travail spécifique. En fonction des facteurs ci-dessus, Databricks utilise toute la largeur de la gamme. Le package de rémunération total pour ce poste peut également inclure l'éligibilité à une prime de performance annuelle, à des actions, et aux avantages énumérés ci-dessus. Pour plus d'informations sur la plage de votre lieu se trouve, visitez notre page ici.

Plage de salaire local
$150,000$190,000 USD

À propos de Databricks

Databricks est la société de données et d'IA. Plus de 9 000 organisations dans le monde - dont Comcast, Condé Nast et plus de 50 % des Fortune 500 - s'appuient sur la Databricks Lakehouse Platform pour unifier leurs données, leurs analyses et l'IA. Databricks a son siège à San Francisco et des bureaux partout dans le monde. Fondée par les créateurs originaux de Apache Spark™, Delta Lake et MLflow, Databricks a pour mission d'aider les équipes de données à résoudre les problèmes les plus complexes du monde. Pour en savoir plus, suivez Databricks sur Twitter, LinkedIn et Facebook.

Notre engagement envers la diversité et l'inclusion

Chez Databricks, nous nous engageons à favoriser une culture diversifiée et inclusive où chacun peut exceller. Nous veillons à ce que nos pratiques de recrutement soient inclusives et répondent aux normes d'égalité des chances d'emploi. Les individus à la recherche d'un emploi chez Databricks sont considérés sans égard à l'âge, la couleur, le handicap, l'origine ethnique, la situation de famille ou le statut marital, l'identité de genre ou l'expression, la langue, l'origine nationale, les capacités physiques et mentales, l'affiliation politique, la race, la religion, l'orientation sexuelle, le statut socio-économique, le statut de vétéran, et d'autres caractéristiques protégées.

Conformité

Si l'accès à la technologie contrôlée à l'exportation ou au code source est nécessaire pour l'exécution des fonctions du poste, il est à la discrétion de l'employeur de demander une licence gouvernementale américaine pour ces postes, et l'employeur peut décider de ne pas poursuivre un candidat sur cette seule base.