Мы ищем людей, которые не боятся риска, умеют работать в команде, вдохновляют и могут стать источником вдохновения. Мы хотим видеть у себя людей, достаточно смелых, чтобы работать на передовой и создавать решения, которые обогатят и улучшат жизнь людей по всему миру. Если вы хотите удивить мир, давайте поговорим.
Наши разговоры начинаются тут. Если эта позиция соответствует вашим амбициям и набору навыков, начните с подачи заявки. Не стесняйтесь изучить и другие свободные вакансии. Наши многочисленные возможности могут привести к бесконечным возможностям.
Название вакансии: Инженер данных
Детали проекта: Этот проект включает в себя разработку и создание системы доставки данных для хранилища данных Sony Music Publishing на платформе AWS.
Технология и подтехнология: AWS
Базовое расположение: Бенгалуру
Тип: Гибридный
Квалификация: Бакалавр/специалист в области компьютерных наук и 4+ года опыта работы.
Обзор работы: Инженер данных ответственен за проектирование и разработку системы доставки данных для нашего хранилища данных на платформе AWS. Эти данные будут использоваться в визуальных панелях/отчетах, которые команды Sony Music Publishing используют для лучшего понимания трендов и получения важных сведений для улучшения позиций на рынке/сделок с авторами песен.
Основные навыки:
- Опыт работы в области архитектуры данных, включая моделирование данных, майнинг данных и загрузку данных.
- Опыт работы с технологиями AWS (S3 buckets, Glue, Data Pipeline, DMS, RDS, Redshift, Aurora, Lambda).
- Знание создания ETL-скриптов на таких языках, как Python, Node.js, SQL.
- Опыт работы с хранилищами данных и большими данными.
- Опыт работы с реляционными базами данных (SQL Server).
- Опыт работы в командах Agile/Scrum.
Компетенции AWS Services/Skills:
- Python: средний уровень
- PySpark: средний уровень
- EMR/Glue: продвинутый уровень
- CICD: средний уровень
- Serverless Framework: средний уровень
- Cloud Formation Templates: средний уровень
- Redshift: продвинутый уровень
- Lambdas: продвинутый уровень
- Step Functions: продвинутый уровень
- Cloud Watch: средний уровень
- ElasticSearch/Open Search: продвинутый уровень
- Kibana: продвинутый уровень
- Kinesis: продвинутый уровень
- Redshift Spectrum: продвинутый уровень
- DMS: продвинутый уровень
Желательные навыки:
- PySpark
- CICD
- Cloud Formation Templates
Обязанности и обязательства:
- Сотрудничество с владельцами продукта, разработчиками и командой AWS Infrastructure для проектирования и разработки ETL-процессов.
- Способность автоматизировать и оптимизировать процессы максимально.
- Способность работать в команде Agile/Scrum.
- Способность анализировать проблемы и предлагать решения.
- Использование установленных стандартов аналитики/процессов в ETL-процессах.
- Способность общаться с техническими и бизнес-командами.
- Способность быстро осваивать новые технологии.
Ключевые слова: Python, PySpark, EMR/Glue, CICD, Serverless Framework, Cloud Formation Templates, Redshift, Lambdas, Step Functions, Cloud Watch, ElasticSearch/Open Search, Kibana, Kinesis, Redshift Spectrum, DMS.