Inżynier Danych - Hub Nauki o Danych

Data Engineer
Other places
$122 K - $190 K

Full Time

Job expired!

Opis pracy

Zakres wynagrodzeń dla tego stanowiska (średnie) wynosi od 12 300 do 17 600 PLN brutto (umowa o pracę).

Hybrydowy model pracy, który łączy w sobie rozwiązania stworzone przez lidera i zespół.

Data Science Hub (DSH) to miejsce, w którym rozwiązujemy różne problemy biznesowe za pomocą technik analitycznych oraz uczenia maszynowego. Codziennie przetwarzamy terabajty danych, na podstawie których dostarczamy wglądy i podejmujemy decyzje. Nasz zespół to doskonałe miejsce dla osób szukających ciągłych możliwości rozwoju i wyjątkowej szansy na zdobycie interdyscyplinarnej wiedzy na temat funkcjonowania platform e-commerce. Różnorodność wpływanych obszarów biznesowych najlepiej opisuje zróżnicowane portfolio projektów, w tym:

logistyka - prognozowanie czasu dostawy, optymalizacja sieci logistycznej
marketing - rekomendacja kategorii, prognozowanie kolejnego zakupu
ustalanie cen - optymalizacja cen
finanse - prognozy sprzedaży
i wiele innych...

Data Science Hub składa się z 5 zespołów:

3 zespoły Data Science
Zespół Data Analytics
Zespół Data Engineering

Szukamy osób do zespołu Data Engineering, gdzie koncentrujemy się na przetwarzaniu i przygotowywaniu danych, wdrażaniu i utrzymaniu naszych projektów, a także dzieleniu się naszymi umiejętnościami z resztą zespołu.

Dołącz do naszego zespołu, aby rozwinąć swoje umiejętności związane z wdrażaniem zaawansowanych technik przetwarzania danych i podejściami do uczenia maszynowego MLOps.

Szukamy osób, które:

Swobodnie posługują się SQL na tradycyjnych silnikach (np. MySQL, PostgreSQL) lub silnikach chmurowych (np. BigQuery, Snowflake). Praca z SQL będzie Twoim codziennym zadaniem.
Mają doświadczenie w programowaniu w Pythonie i są zaznajomione z najlepszymi praktykami inżynierii oprogramowania (PEP8, czysta architektura, code review, CI/CD, itp.)
Mają pozytywne nastawienie i zdolność pracy w zespole.
Chcą ciągle rozwijać i poszerzać swoją wiedzę.

Dodatkowo, mile widziane będzie, jeśli posiadasz:

Doświadczenie z ekosystemem Big Data (Spark, Airflow)
Znajomość narzędzi BigData w Google Cloud Platform lub innych publicznych chmurach (np. AWS, Azure)
Doświadczenie komercyjne w praktykach DevOps i CI/CD (np. GitHub Actions) w obszarze ML/AI
Doświadczenie z architekturą aplikacji chmurowych

Nasz tech stack:

Python
Google Cloud Platform (AirFlow, BigQuery, Composer)
GitHub (przechowywanie kodu, CI/CD, hosting naszej własnej biblioteki Python dla Data Science)

Co oferujemy:

Hybrydowy model pracy, który uzgodnisz z liderem i zespołem. Posiadamy dobrze zlokalizowane biura (z w pełni wyposażonymi kuchniami i parkingami rowerowymi) oraz doskonałe narzędzia pracy (biurka regulowane na wysokość, interaktywne sale konferencyjne).
Roczny bonus do 10% rocznej pensji brutto (w zależności od Twojej rocznej oceny i wyników firmy).
Szeroki wybór świadczeń dodatkowych w planie kafeteryjnym - Ty decydujesz, co Ci odpowiada (np. pakiety medyczne, sportowe czy obiadowe, ubezpieczenie, vouchery zakupowe).
Płatne lekcje języka angielskiego związane z konkretnym charakterem Twojej pracy.
Praca w zespole, na który zawsze możesz liczyć - mamy na pokładzie specjalistów z najwyższej półki.
Wielki stopień autonomii w organizacji pracy swojego zespołu; zachęcamy do ciągłego rozwoju i próbowania nowych rzeczy.
Hackathony, wyjścia zespołowe, budżet szkoleniowy oraz wewnętrzna platforma edukacyjna, MindUp (obejmująca kursy zorganizacji pracy, środków komunikacji, motywacji do pracy oraz różnych technologii i zagadnień tematycznych).

Twoje obowiązki obejmą:

Aktywne tworzenie narzędzi do przetwarzania danych dla modelowania i analizy - we ścisłej współpracy z oboma zespołami Data Science.
Pomoc obu zespołom Data Science w tworzeniu źródeł danych dla analiz ad-hoc i projektów związanych z uczeniem maszynowym.
Przetwarzanie terabajtów danych za pomocą BigQuery, Composer, Dataflow i PySpark Google Cloud Platform, optymalizując procesy pod kątem ich wydajności i kosztów przetwarzania chmurowego GCP.
Zbieranie wymagań procesowych od grup projektowych, a następnie automatyzowanie zadań związanych z przetwarzaniem wstępnym i monitorowaniem jakości danych, serwowanie przewidywań, a także monitorowanie i ponowne szkolenie modeli Machine Learning.
Utrzymywanie jakości inżynieryjnej dla każdego projektu i współpraca z kolegami w zakresie doskonałości inżynieryjnej.

Dlaczego warto z nami pracować?

Mieć znaczący wpływ na jedną z największych platform e-commerce na świecie poprzez dostarczane dane i procesy.
Z uwagi na szeroki zakres projektów, w których uczestniczymy, nigdy nie zabraknie Ci interesujących wyzwań.
Będziesz mieć dostęp do ogromnych zbiorów danych (mierzonych w petabajtach).
Zdobędziesz pracę w zespole doświadczonych inżynierów i specjalistów BigData, którzy są chętni do dzielenia się swoją wiedzą (także publicznie, jako część allegro.tech).
Twój rozwój zawodowy będzie szedł w parze z najnowszymi trendami technologicznymi open-source.
Mieć rzeczywisty wpływ na kierunki rozwoju produktu i wybór technologii - korzystamy z najnowszych i najlepszych rozwiązań technologicznych, ponieważ są one najbardziej zgodne z naszymi potrzebami.
Jesteśmy dostawcą full-stack - projektujemy, kodujemy, testujemy, wdrażamy i utrzymujemy nasze rozwiązania.

Zgłoś się do Allegro i zobacz, dlaczego #dobrzebyćtutaj