Inżynier Danych - Hub Nauki o Danych

  • Full Time
Job expired!

Opis pracy

Zakres wynagrodzeń dla tego stanowiska (średnie) wynosi od 12 300 do 17 600 PLN brutto (umowa o pracę).

Hybrydowy model pracy, który łączy w sobie rozwiązania stworzone przez lidera i zespół.

Data Science Hub (DSH) to miejsce, w którym rozwiązujemy różne problemy biznesowe za pomocą technik analitycznych oraz uczenia maszynowego. Codziennie przetwarzamy terabajty danych, na podstawie których dostarczamy wglądy i podejmujemy decyzje. Nasz zespół to doskonałe miejsce dla osób szukających ciągłych możliwości rozwoju i wyjątkowej szansy na zdobycie interdyscyplinarnej wiedzy na temat funkcjonowania platform e-commerce. Różnorodność wpływanych obszarów biznesowych najlepiej opisuje zróżnicowane portfolio projektów, w tym:

  • logistyka - prognozowanie czasu dostawy, optymalizacja sieci logistycznej
  • marketing - rekomendacja kategorii, prognozowanie kolejnego zakupu
  • ustalanie cen - optymalizacja cen
  • finanse - prognozy sprzedaży
  • i wiele innych...

Data Science Hub składa się z 5 zespołów:

  • 3 zespoły Data Science
  • Zespół Data Analytics
  • Zespół Data Engineering

Szukamy osób do zespołu Data Engineering, gdzie koncentrujemy się na przetwarzaniu i przygotowywaniu danych, wdrażaniu i utrzymaniu naszych projektów, a także dzieleniu się naszymi umiejętnościami z resztą zespołu.

Dołącz do naszego zespołu, aby rozwinąć swoje umiejętności związane z wdrażaniem zaawansowanych technik przetwarzania danych i podejściami do uczenia maszynowego MLOps.

Szukamy osób, które:

  • Swobodnie posługują się SQL na tradycyjnych silnikach (np. MySQL, PostgreSQL) lub silnikach chmurowych (np. BigQuery, Snowflake). Praca z SQL będzie Twoim codziennym zadaniem.
  • Mają doświadczenie w programowaniu w Pythonie i są zaznajomione z najlepszymi praktykami inżynierii oprogramowania (PEP8, czysta architektura, code review, CI/CD, itp.)
  • Mają pozytywne nastawienie i zdolność pracy w zespole.
  • Chcą ciągle rozwijać i poszerzać swoją wiedzę.

Dodatkowo, mile widziane będzie, jeśli posiadasz:

  • Doświadczenie z ekosystemem Big Data (Spark, Airflow)
  • Znajomość narzędzi BigData w Google Cloud Platform lub innych publicznych chmurach (np. AWS, Azure)
  • Doświadczenie komercyjne w praktykach DevOps i CI/CD (np. GitHub Actions) w obszarze ML/AI
  • Doświadczenie z architekturą aplikacji chmurowych

Nasz tech stack:

  • Python
  • Google Cloud Platform (AirFlow, BigQuery, Composer)
  • GitHub (przechowywanie kodu, CI/CD, hosting naszej własnej biblioteki Python dla Data Science)

Co oferujemy:

  • Hybrydowy model pracy, który uzgodnisz z liderem i zespołem. Posiadamy dobrze zlokalizowane biura (z w pełni wyposażonymi kuchniami i parkingami rowerowymi) oraz doskonałe narzędzia pracy (biurka regulowane na wysokość, interaktywne sale konferencyjne).
  • Roczny bonus do 10% rocznej pensji brutto (w zależności od Twojej rocznej oceny i wyników firmy).
  • Szeroki wybór świadczeń dodatkowych w planie kafeteryjnym - Ty decydujesz, co Ci odpowiada (np. pakiety medyczne, sportowe czy obiadowe, ubezpieczenie, vouchery zakupowe).
  • Płatne lekcje języka angielskiego związane z konkretnym charakterem Twojej pracy.
  • Praca w zespole, na który zawsze możesz liczyć - mamy na pokładzie specjalistów z najwyższej półki.
  • Wielki stopień autonomii w organizacji pracy swojego zespołu; zachęcamy do ciągłego rozwoju i próbowania nowych rzeczy.
  • Hackathony, wyjścia zespołowe, budżet szkoleniowy oraz wewnętrzna platforma edukacyjna, MindUp (obejmująca kursy zorganizacji pracy, środków komunikacji, motywacji do pracy oraz różnych technologii i zagadnień tematycznych).

Twoje obowiązki obejmą:

  • Aktywne tworzenie narzędzi do przetwarzania danych dla modelowania i analizy - we ścisłej współpracy z oboma zespołami Data Science.
  • Pomoc obu zespołom Data Science w tworzeniu źródeł danych dla analiz ad-hoc i projektów związanych z uczeniem maszynowym.
  • Przetwarzanie terabajtów danych za pomocą BigQuery, Composer, Dataflow i PySpark Google Cloud Platform, optymalizując procesy pod kątem ich wydajności i kosztów przetwarzania chmurowego GCP.
  • Zbieranie wymagań procesowych od grup projektowych, a następnie automatyzowanie zadań związanych z przetwarzaniem wstępnym i monitorowaniem jakości danych, serwowanie przewidywań, a także monitorowanie i ponowne szkolenie modeli Machine Learning.
  • Utrzymywanie jakości inżynieryjnej dla każdego projektu i współpraca z kolegami w zakresie doskonałości inżynieryjnej.

Dlaczego warto z nami pracować?

  • Mieć znaczący wpływ na jedną z największych platform e-commerce na świecie poprzez dostarczane dane i procesy.
  • Z uwagi na szeroki zakres projektów, w których uczestniczymy, nigdy nie zabraknie Ci interesujących wyzwań.
  • Będziesz mieć dostęp do ogromnych zbiorów danych (mierzonych w petabajtach).
  • Zdobędziesz pracę w zespole doświadczonych inżynierów i specjalistów BigData, którzy są chętni do dzielenia się swoją wiedzą (także publicznie, jako część allegro.tech).
  • Twój rozwój zawodowy będzie szedł w parze z najnowszymi trendami technologicznymi open-source.
  • Mieć rzeczywisty wpływ na kierunki rozwoju produktu i wybór technologii - korzystamy z najnowszych i najlepszych rozwiązań technologicznych, ponieważ są one najbardziej zgodne z naszymi potrzebami.
  • Jesteśmy dostawcą full-stack - projektujemy, kodujemy, testujemy, wdrażamy i utrzymujemy nasze rozwiązania.

Zgłoś się do Allegro i zobacz, dlaczego #dobrzebyćtutaj