Service Reliability Engineering(SRE), Data Infra

Job expired!

Краткое описание:
Дата размещения вакансии: 30 апреля 2024 года
Номер роли: 200526864

Инженерный отдел сервисов Apple находится на переднем крае слияния технологий с художественным выражением, обеспечивая работу всемирно известных платформ, таких как App Store, Apple TV, Apple Music, Apple Podcasts и Apple Books. Работая более чем в 150 странах и предоставляя контент на более чем 35 языках, наша команда разрабатывает безопасные решения от начала и до конца, которые ориентированы на огромные масштабы.

Ключевые квалификации:

  • Более 5 лет работы в крупномасштабных *nix средах
  • Знание принципов SRE и обязанностей дежурства
  • Опыт проектирования и развертывания кода на различных языках программирования (предпочтение отдаётся Go, Python, Ruby или Java)
  • Экспертиза в использовании Docker, Kubernetes, AWS, Ansible, Hadoop, Spark, Cassandra
  • Навыки масштабирования, планирования емкости и восстановления после сбоев
  • Доказанные аналитические, решение проблем и межличностные навыки
  • Опыт поддержки приложений на Java
  • Знание инструментов мониторинга, таких как Prometheus, Grafana, Splunk и т. д.
  • Знакомство с DNS, HTTP и RPC фреймворками

Описание работы:
Работая инженером по надёжности сервисов в инженерном отделе сервисов Apple, вы будете заниматься стратегическим проектированием и непосредственной технической работой для обеспечения оптимальной производительности и надёжности наших многоуровневых систем. Эта роль включает в себя настройку, оптимизацию и устранение неполадок систем и интерфейсов, тесное сотрудничество с разнообразными командами для улучшения жизненного цикла сервиса от первоначального проекта до окончательного развёртывания.

  • Вести управление нашими данными через конвейеры, включая Kafka, Hadoop и Cassandra
  • Обеспечивать соблюдение Соглашений об Уровне Сервиса (SLA)
  • Разрабатывать и пересматривать код и документацию для решения самых сложных проблем в крупных и сложных системах
  • Профессионально программировать на Python, Golang и Java
  • Точно устанавливать приоритеты и эффективно работать в динамичной среде
  • Постоянно оптимизировать производительность системы
  • Взаимодействовать и координировать работу с глобально распределенными командами

<