Site Reliability Engineer - EMEA Remote

Job expired!

Chez Hugging Face, nous avons pour mission de faire progresser l'état de l'apprentissage automatique et de le rendre plus accessible à tous. Dans le cadre de notre aventure, nous contribuons au développement de technologies de pointe pour le bien de tous.

Nous sommes fiers d'héberger la bibliothèque open-source de modèles pré-entraînés à la croissance la plus rapide au monde. Avec plus d'un million de modèles et plus de 320K étoiles sur GitHub, la technologie Hugging Face est utilisée par plus de 15 000 entreprises, y compris les principales organisations en intelligence artificielle telles que Google, Elastic, Salesforce, Grammarly et la NASA.

Nous recherchons un Site Reliability Engineer pour aider à maintenir et à faire évoluer notre infrastructure produit. Le candidat idéal aura une expérience substantielle dans la gestion d'une infrastructure à grande échelle pour les flux de travail en IA et un solide bagage dans le soutien des équipes pour mettre en œuvre les meilleures pratiques en matière de fiabilité et de scalabilité.

  • Concevoir, développer, déployer et maintenir une infrastructure fiable et évolutive
  • Gérer de grands clusters Kubernetes
  • Mesurer et optimiser la performance du système
  • Corriger les vulnérabilités de l'infrastructure
  • Assurer que les systèmes critiques en termes de revenus restent opérationnels malgré les pannes et les erreurs de configuration
  • Fournir un support opérationnel principal et une expertise en ingénierie à plusieurs équipes
  • 7+ années d'expérience en tant que Site Reliability Engineer ou Infrastructure Engineer
  • Forte connaissance des fournisseurs de cloud tels qu'AWS et GCP, ainsi que des cadres infratiques avec code et des outils d'observabilité
  • Excellentes compétences en communication, collaboration et documentation
  • Maîtrise de Linux, Git, des conteneurs, des réseaux et des outils en ligne de commande
  • Expérience dans la collaboration et la communication asynchrones

Si vous êtes un Site Reliability Engineer passionné avec un fort intérêt pour l'IA et que vous vous épanouissez dans des environnements dynamiques et innovants, nous serions ravis de vous entendre. Rejoignez notre équipe pour contribuer à l'avancement des technologies de l'IA tout en collaborant avec des professionnels talentueux dans un environnement stimulant.

Nous favorisons la diversité, l'équité et l'inclusion : Nous nous engageons à créer un lieu de travail où chacun se sent respecté et soutenu, quelle que soit son origine. Nous croyons que c'est essentiel pour bâtir une grande entreprise et une grande communauté. Hugging Face est un employeur offrant l'égalité des chances et nous ne discriminons pas en fonction de la race, de la religion, de la couleur, de l'origine nationale, du sexe, de l'orientation sexuelle, de l'âge, de l'état matrimonial, du statut de vétéran ou du statut de handicapé.

Nous valorisons le développement professionnel : Vous travaillerez avec certaines des plus brillantes personnes de l'industrie. Nous donnons la priorité à l'impact et nous nous mettons constamment au défi de grandir. Nous remboursons les conférences, formations et formations pertinentes.

Nous nous soucions de votre bien-être : Nous offrons des horaires de travail flexibles et des options de travail à distance, ainsi que des avantages en matière de santé, de dentaire et de vision pour les employés et leurs personnes à charge. De plus, nous offrons un congé parental et des congés payés flexibles.

Nous soutenons nos employés quel que soit leur emplacement : Bien que nous ayons des bureaux à NYC et à Paris, nous sommes largement distribués. Les employés à distance ont la possibilité de visiter nos bureaux, et nous équiperons votre poste de travail pour assurer votre succès.

Nous voulons que nos coéquipiers soient actionnaires : Tous les employés reçoivent des actions de l'entreprise dans le cadre de leur package de rémunération. Si nous réussissons à devenir une plateforme définissant une catégorie dans l'apprentissage automatique et l'IA, tout le monde partagera ce succès.

Nous soutenons la communauté : Nous croyons que les grandes avancées scientifiques viennent de la collaboration