Site Reliability Engineer

Job expired!

Добро пожаловать в Phaidra, где мы революционизируем мир промышленной автоматизации.

Текущие промышленные инфраструктуры, такие как заводы и электростанции, полагаются на устаревшие системы управления, которые не могут адаптироваться к новым условиям. В Phaidra мы создаем управляющие системы на основе ИИ, которые позволяют этим инфраструктурам автоматически обучаться и совершенствоваться со временем.

  • Алгоритмы обучения с подкреплением: Превращение сырых данных с датчиков в ценные решения.
  • Промышленные приложения: Идеально подходят для сред с датчиками и измеримыми показателями эффективности (KPI).
  • Конфигурация без кода: Эксперты домена могут настраивать системы ИИ без программирования.

Наша преданная команда имеет подтвержденную репутацию, от достижения суперчеловеческих результатов с помощью AlphaGo от DeepMind до снижения энергопотребления в дата-центрах Google.

Мы - 100% удаленная компания с командой, разбросанной по США, Канаде, Великобритании, Норвегии, Италии, Испании, Португалии и Индии. Мы нанимаем сотрудников по всему миру с помощью нашего партнера, OysterHR.

Phaidra ищет увлеченного и инновационного инженера по надежности сайта, чтобы присоединиться к нашей инженерной команде. Вы будете работать над созданием и поддержанием инфраструктуры мирового класса, обеспечивая бесперебойную работу и непрерывное улучшение наших систем.

Местоположение: Северная Америка/Индия

В качестве инженера по надежности сайта ваши основные обязанности будут включать:

  • Управление облачной инфраструктурой на AWS, GCP или Azure
  • Настройка систем сбора и обработки больших данных
  • Создание платформ для распределенного обучения и оценки моделей
  • Автоматизация CI/CD конвейеров и улучшений системы
  • Обеспечение многоклаудовых развертываний
  • Использование облачных технологий, таких как Kubernetes, Prometheus и gRPC
  • Применение принципов SRE для наблюдаемости, автоматизации и управления изменениями

Ключевые квалификации:

  • Более 5 лет опыта
  • Степень бакалавра или магистра в области компьютерных наук или эквивалентная
  • Опыт работы с AWS, GCP или Azure
  • Знание Linux, Docker и Kubernetes
  • Знакомство с Terraform и стеком мониторинга, таким как Prometheus
  • Навыки программирования на Python, Go или Bash
  • Понимание принципов DevOps и SRE

Предпочтительные навыки и опыт:

  • Экспертиза в многоклаудовой среде
  • Опыт в области разработки программного обеспечения
  • Опыт работы с масштабируемыми системами с множеством пользователей

Наш технологический стек:

Языки: Python, Go, JavaScript/TypeScript, React; C# .NET

  • PyTorch
  • Docker, Kubernetes, Terraform, Kapitan
  • Gitlab CI, ArgoCD, Atlantis, Vercel
  • GCP (GKE, PubSub, CloudSQL и т.д.)
  • Ray.io, REST и gRPC микро-сервисы
  • Poetry, Pantsbuild

Ваш путь в процессе адаптации:

  • Введение в Phaidra и наш продукт
  • Взаимодействие с инженерной командой