Site Reliability Engineer

Job expired!

Bienvenue chez Phaidra, où nous révolutionnons le monde de l'automatisation industrielle.

Les infrastructures industrielles actuelles, telles que les usines et les centrales électriques, dépendent de systèmes de contrôle obsolètes qui ne peuvent s'adapter aux nouvelles conditions. Chez Phaidra, nous créons des systèmes de contrôle alimentés par l'IA qui permettent à ces infrastructures d'apprendre et de s'améliorer automatiquement au fil du temps.

  • Algorithmes d'Apprentissage par Renforcement : Transforme les données brutes des capteurs en décisions à haute valeur ajoutée.
  • Applications Industrielles : Idéal pour les environnements sensorisés avec des indicateurs de performance mesurables.
  • Configuration Sans Code : Les experts du domaine peuvent configurer les systèmes de contrôle IA sans coder.

Notre équipe dévouée a un bilan prouvé, allant de la réalisation de performances surhumaines avec AlphaGo de DeepMind à la réduction de la consommation d'énergie dans les centres de données de Google.

Nous sommes une entreprise 100% à distance avec une équipe répartie aux États-Unis, au Canada, au Royaume-Uni, en Norvège, en Italie, en Espagne, au Portugal et en Inde. Nous recrutons à l'échelle mondiale avec l'aide de notre partenaire, OysterHR.

Phaidra recherche un Ingénieur Fiabilité de Site passionné et innovant pour rejoindre notre équipe d'ingénierie. Vous travaillerez sur la création et la maintenance d'une infrastructure de classe mondiale, en garantissant le bon fonctionnement et l'amélioration continue de nos systèmes.

Lieu : Amérique du Nord/Inde

En tant qu'Ingénieur Fiabilité de Site, vos principales responsabilités incluront :

  • Gérer l'infrastructure cloud sur AWS, GCP ou Azure
  • Mettre en place des systèmes d'ingestion et de traitement de données à grande échelle
  • Construire des plateformes d'entraînement et d'évaluation de modèles distribués
  • Automatiser les pipelines CI/CD et les améliorations système
  • Assurer les déploiements multi-cloud
  • Utiliser des technologies Cloud Native comme Kubernetes, Prometheus et gRPC
  • Appliquer les principes SRE pour l'observabilité, l'automatisation et la gestion des changements

Qualifications principales :

  • 5 années d'expérience ou plus
  • Bachelor ou Master en Informatique ou équivalent
  • Expérience avec AWS, GCP ou Azure
  • Maîtrise de Linux, Docker et Kubernetes
  • Familiarité avec Terraform et les piles de surveillance comme Prometheus
  • Compétences en programmation en Python, Go ou Bash
  • Compréhension des principes DevOps, SRE

Compétences et expériences préférées :

  • Expertise en environnement multi-cloud
  • Expérience en ingénierie logicielle
  • Expérience avec des systèmes évolutifs et multi-tenant

Notre pile technologique :

Langages : Python, Go, JavaScript/TypeScript, React ; C# .NET

  • PyTorch
  • Docker, Kubernetes, Terraform, Kapitan
  • Gitlab CI, ArgoCD, Atlantis, Vercel
  • GCP (GKE, PubSub, CloudSQL, etc.)
  • Ray.io, micro-services REST et gRPC
  • Poetry, Pantsbuild

Votre parcours d'intégration

Premiers 30 jours :

  • Introduction à Phaidra et à notre produit
  • Interaction avec l'équipe d'ingénierie
  • Configuration de l'environnement de développement

À 60 jours :