Инженер по данным

  • Full Time
Job expired!
Мы ищем людей, которые не боятся риска, умеют работать в команде, вдохновляют и могут стать источником вдохновения. Мы хотим видеть у себя людей, достаточно смелых, чтобы работать на передовой и создавать решения, которые обогатят и улучшат жизнь людей по всему миру. Если вы хотите удивить мир, давайте поговорим. Наши разговоры начинаются тут. Если эта позиция соответствует вашим амбициям и набору навыков, начните с подачи заявки. Не стесняйтесь изучить и другие свободные вакансии. Наши многочисленные возможности могут привести к бесконечным возможностям. Название вакансии: Инженер данных Детали проекта: Этот проект включает в себя разработку и создание системы доставки данных для хранилища данных Sony Music Publishing на платформе AWS. Технология и подтехнология: AWS Базовое расположение: Бенгалуру Тип: Гибридный Квалификация: Бакалавр/специалист в области компьютерных наук и 4+ года опыта работы. Обзор работы: Инженер данных ответственен за проектирование и разработку системы доставки данных для нашего хранилища данных на платформе AWS. Эти данные будут использоваться в визуальных панелях/отчетах, которые команды Sony Music Publishing используют для лучшего понимания трендов и получения важных сведений для улучшения позиций на рынке/сделок с авторами песен. Основные навыки: - Опыт работы в области архитектуры данных, включая моделирование данных, майнинг данных и загрузку данных. - Опыт работы с технологиями AWS (S3 buckets, Glue, Data Pipeline, DMS, RDS, Redshift, Aurora, Lambda). - Знание создания ETL-скриптов на таких языках, как Python, Node.js, SQL. - Опыт работы с хранилищами данных и большими данными. - Опыт работы с реляционными базами данных (SQL Server). - Опыт работы в командах Agile/Scrum. Компетенции AWS Services/Skills: - Python: средний уровень - PySpark: средний уровень - EMR/Glue: продвинутый уровень - CICD: средний уровень - Serverless Framework: средний уровень - Cloud Formation Templates: средний уровень - Redshift: продвинутый уровень - Lambdas: продвинутый уровень - Step Functions: продвинутый уровень - Cloud Watch: средний уровень - ElasticSearch/Open Search: продвинутый уровень - Kibana: продвинутый уровень - Kinesis: продвинутый уровень - Redshift Spectrum: продвинутый уровень - DMS: продвинутый уровень Желательные навыки: - PySpark - CICD - Cloud Formation Templates Обязанности и обязательства: - Сотрудничество с владельцами продукта, разработчиками и командой AWS Infrastructure для проектирования и разработки ETL-процессов. - Способность автоматизировать и оптимизировать процессы максимально. - Способность работать в команде Agile/Scrum. - Способность анализировать проблемы и предлагать решения. - Использование установленных стандартов аналитики/процессов в ETL-процессах. - Способность общаться с техническими и бизнес-командами. - Способность быстро осваивать новые технологии. Ключевые слова: Python, PySpark, EMR/Glue, CICD, Serverless Framework, Cloud Formation Templates, Redshift, Lambdas, Step Functions, Cloud Watch, ElasticSearch/Open Search, Kibana, Kinesis, Redshift Spectrum, DMS.