Senior Site Reliability Engineer - On-Premise

Job expired!

Second Spectrum, une société de données et de technologie lauréate d'un Sports Emmy, est à la pointe de la transformation de l'industrie du sport. Nous nous spécialisons dans la capture et la production de données de haute qualité et de contenu innovant pour certaines des plus grandes ligues et partenaires médiatiques du monde, notamment la NFL, la NBA, la Premier League anglaise, ESPN, Amazon et CBS Sports.

Notre mission est de repousser les limites de la technologie de pointe, y compris l'apprentissage automatique, la vision par ordinateur, le big data, la réalité augmentée et la réalité virtuelle. Nous combinons notre passion pour le design de pointe et notre vaste expérience dans les sports universitaires et professionnels pour créer des produits uniques et innovants. Ces produits ont aidé nos partenaires à remporter plusieurs championnats NBA, à remporter des victoires sur les terrains de football du monde entier et à divertir des millions de fans à la télévision et sur les plateformes numériques.

En 2021, Second Spectrum a été acquis par Genius Sports, libérant de nouvelles capacités technologiques, opérationnelles et commerciales. Nous ne faisons que commencer à transformer notre vision commune de technologies sportives révolutionnaires en réalité. Si vous êtes passionné par la technologie de pointe dans le sport, vous trouverez ici un environnement passionnant et dynamique qui met l'accent sur les opportunités pour les personnes motivées de grandir et d'avoir un impact.

Nous recherchons un Ingénieur Fiabilité de Site Senior pour rejoindre notre équipe On-Premise au sein du groupe d'Ingénierie Infrastructure. Alors que nous étendons nos services de suivi en temps réel des joueurs, d'analyse sportive et d'augmentation de la diffusion, nous visons à passer de centaines d'arènes sportives à des milliers dans le monde entier.

Responsabilités :

  • Concevoir et coder des processus de bout en bout pour que le personnel non formé puisse préparer, installer et surveiller de manière autonome les serveurs Linux et les appareils réseau dans plus de 100 lieux sportifs.
  • Permettre aux développeurs de déployer et de surveiller de manière indépendante nos applications de suivi et d'augmentation des joueurs.
  • Assumer la responsabilité des projets techniques à long terme et communiquer efficacement les choix de conception à des publics techniques et non techniques.
  • Collaborer avec les coéquipiers pour résoudre des problèmes, partager des connaissances et fournir des retours exploitables.
  • Participer à une rotation d'astreinte visant à éliminer les escalades répétitives.
  • Visiter le bureau de Lausanne deux fois par semaine.

Qualifications minimales :

  • Citoyenneté UE/ALE ou permis de séjour en Suisse (B ou C).
  • 5+ ans d'expérience en SRE avec Linux.
  • Solide compréhension de la pile complète des serveurs Linux, y compris le boot et l'installation de l'OS, systemd, le réseau, le déploiement de conteneurs, la journalisation, les métriques, la surveillance et la gestion hors bande.
  • Expérience dans la conception de processus d'automatisation robustes pour un grand inventaire de serveurs sur site.
  • Expérience dans la contribution à une grande base de code d'automatisation en utilisant Ansible ou une plateforme similaire.
  • Maîtrise de la programmation en Bash et Python.
  • Excellentes compétences en communication adaptées à différents niveaux d'audience.

Qualifications préférées :

  • Expérience dans la gestion d'une flotte distante sans accès physique facile.
  • Expérience dans la conception de processus d'automatisation à grande échelle pour les routeurs et commutateurs réseau.
  • Compréhension complète des couches réseau OSI 2 et 3, capable de diagnostiquer les conditions réseau sur les sites des clients.
  • Expérience avec AWS EC2, S3, VPC, IAM.
  • Expérience avec l'installation et la surveillance des pilotes Nvidia GPU.

Notre Stack :

  • Langages et frameworks : Ansible, Bash, Python.
  • Serveurs : Ubuntu Linux, Nvidia GPUs.
  • Cloud : Ansible AWX, Tailscale, Docker, Kubernetes, Prometheus