Inżynier danych

  • Full Time
Job expired!
Szukamy ryzykantów, współpracowników, osób zainspirowanych i inspirujących. Chcemy ludzi, którzy mają odwagę pracować na krawędzi i tworzyć rozwiązania, które wzbogacą i poprawią życie ludzi na całym świecie. Jeśli chcesz zdumiewać świat, porozmawiajmy. Rozmowa zaczyna się tutaj. Jeśli ta rola pasuje do Twoich ambicji i umiejętności, zacznijmy od Twojego zgłoszenia. Zachęcamy również do zapoznania się z naszymi innymi otwartymi pozycjami. Nasze liczne możliwości mogą prowadzić do nieskończonych możliwości. Stanowisko: Inżynier Danych Szczegóły projektu: Projekt dotyczy projektowania i tworzenia dostępu do danych na magazynie danych Sony Music Publishing na platformie AWS. Technologia i podtechnologia: AWS Lokalizacja: Bengaluru Rodzaj: hybrydowy Kwalifikacje: BE/B.Tech z zakresu informatyki i ponad 4 lata doświadczenia. Opis stanowiska: Inżynier Danych jest odpowiedzialny za projektowanie i tworzenie dostępu do danych na naszym magazynie danych na platformie AWS. Dane te będą wykorzystywane w wizualnych panelach/raportach, które zespoły Sony Music Publishing wykorzystują do lepszego zrozumienia trendów i wglądów w celu poprawy udziału w rynku/umów z twórcami piosenek. Podstawowe umiejętności: - Doświadczenie w architekturze danych, w tym modelowaniu danych, eksploracji danych oraz przepływie danych. - Doświadczenie z technologiami związanymi z AWS (S3 buckets, Glue, Data Pipeline, DMS, RDS, Redshift, Aurora, Lambda). - Znajomość tworzenia skryptów ETL przy użyciu języków takich jak Python, Node.js, SQL. - Doświadczenie w magazynowaniu danych i Big Data. - Doświadczenie z relacyjnymi bazami danych (SQL Server). - Doświadczenie w pracy w zespołach Agile/Scrum. Kompetencje w usługach/skillach AWS: - Python: średniozaawansowany - PySpark: średniozaawansowany - EMR/Glue: zaawansowany - CICD: średniozaawansowany - Serverless Framework: średniozaawansowany - Cloud Formation Templates: średniozaawansowany - Redshift: zaawansowany - Lambdas: zaawansowany - Step Functions: zaawansowany - Cloud Watch: średniozaawansowany - ElasticSearch/Open Search: zaawansowany - Kibana: zaawansowany - Kinesis: zaawansowany - Redshift Spectrum: zaawansowany - DMS: zaawansowany Umiejętności mile widziane: - PySpark - CICD - Cloud Formation Templates Obowiązki i zadania: - Współpraca z właścicielami produktów, deweloperami i zespołem infrastruktury AWS w celu projektowania i tworzenia procesów ETL. - Zdolność do automatyzacji i optymalizacji procesów w jak największym stopniu. - Zdolność do pracy w zespole Agile/Scrum. - Zdolność do rozwiązywania problemów i proponowania rozwiązań. - Korzystanie z ustanowionych standardów/procesów analitycznych w procesach ETL. - Zdolność do komunikacji z zespołami technicznymi i biznesowymi. - Zdolność do szybkiego uczenia się nowych technologii. Słowa kluczowe: Python, PySpark, EMR/Glue, CICD, Serverless Framework, Cloud Formation Templates, Redshift, Lambdas, Step Functions, Cloud Watch, ElasticSearch/Open Search, Kibana, Kinesis, Redshift Spectrum, DMS.