Site Reliability Engineer

Job expired!

Witamy w Phaidra, gdzie rewolucjonizujemy świat automatyki przemysłowej.

Obecne infrastruktury przemysłowe, takie jak fabryki i elektrownie, polegają na przestarzałych systemach sterowania, które nie mogą dostosowywać się do nowych warunków. W Phaidra tworzymy systemy sterowania napędzane przez sztuczną inteligencję, które pozwalają tym infrastrukturom na automatyczne uczenie się i poprawę w czasie.

  • Algorytmy uczenia przez wzmocnienie: Przekształcają surowe dane z czujników w decyzje o wysokiej wartości.
  • Zastosowania przemysłowe: Idealne do środowisk sensorystycznych z mierzalnymi kluczowymi wskaźnikami efektywności (KPI).
  • Konfiguracja bez kodu: Eksperci domen mogą konfigurować systemy sterowania AI bez programowania.

Nasz oddany zespół ma sprawdzoną historię sukcesów, od osiągnięcia superludzkiej wydajności dzięki AlphaGo DeepMind po redukcję zużycia energii w centrach danych Google.

Jesteśmy firmą całkowicie zdalną z zespołem rozproszonym po USA, Kanadzie, Wielkiej Brytanii, Norwegii, Włoszech, Hiszpanii, Portugalii i Indiach. Zatrudniamy globalnie za pomocą naszego partnera, OysterHR.

Phaidra poszukuje pasjonującego i innowacyjnego Inżyniera niezawodności witryny, który dołączy do naszego zespołu inżynieryjnego. Będziesz pracować nad budową i utrzymaniem infrastruktury na światowym poziomie, zapewniając płynne działanie i ciągłe doskonalenie naszych systemów.

Lokalizacja: Ameryka Północna/Indie

Jako Inżynier niezawodności witryny twoje główne obowiązki będą obejmować:

  • Zarządzanie infrastrukturą chmurową na AWS, GCP lub Azure
  • Konfiguracja systemów do dużych zbiorów danych i ich przetwarzania
  • Budowa dystrybuowanych platform do trenowania i oceny modeli
  • Automatyzacja pipeline'ów CI/CD i ulepszeń systemów
  • Zapewnienie wdrożeń w wielu chmurach
  • Wykorzystywanie technologii natywnych dla chmury, takich jak Kubernetes, Prometheus i gRPC
  • Stosowanie zasad SRE dotyczących widoczności systemów, automatyzacji i zarządzania zmianami

5+ lat doświadczenia

Licencjat lub magisterium z informatyki lub równoważne

Doświadczenie z AWS, GCP lub Azure

Biegłość w systemach Linux, Docker i Kubernetes

Znajomość Terraform i stosów monitorujących, takich jak Prometheus

Umiejętności programowania w Python, Go lub Bash

Zrozumienie zasad DevOps i SRE

Ekspertyza w środowisku wielochmurowym

Doświadczenie w inżynierii oprogramowania

Doświadczenie z systemami skalowalnymi i wielodostępnymi

Języki: Python, Go, JavaScript/TypeScript, React; C# .NET

  • PyTorch
  • Docker, Kubernetes, Terraform, Kapitan
  • Gitlab CI, ArgoCD, Atlantis, Vercel
  • GCP (GKE, PubSub, CloudSQL, itp.)
  • Ray.io, micro-services REST i gRPC
  • Poetry, Pantsbuild