Opis pracy
Zakres wynagrodzeń dla tego stanowiska (średnie) wynosi od 12 300 do 17 600 PLN brutto (umowa o pracę).
Hybrydowy model pracy, który łączy w sobie rozwiązania stworzone przez lidera i zespół.
Data Science Hub (DSH) to miejsce, w którym rozwiązujemy różne problemy biznesowe za pomocą technik analitycznych oraz uczenia maszynowego. Codziennie przetwarzamy terabajty danych, na podstawie których dostarczamy wglądy i podejmujemy decyzje. Nasz zespół to doskonałe miejsce dla osób szukających ciągłych możliwości rozwoju i wyjątkowej szansy na zdobycie interdyscyplinarnej wiedzy na temat funkcjonowania platform e-commerce. Różnorodność wpływanych obszarów biznesowych najlepiej opisuje zróżnicowane portfolio projektów, w tym:
- logistyka - prognozowanie czasu dostawy, optymalizacja sieci logistycznej
- marketing - rekomendacja kategorii, prognozowanie kolejnego zakupu
- ustalanie cen - optymalizacja cen
- finanse - prognozy sprzedaży
- i wiele innych...
Data Science Hub składa się z 5 zespołów:
- 3 zespoły Data Science
- Zespół Data Analytics
- Zespół Data Engineering
Szukamy osób do zespołu Data Engineering, gdzie koncentrujemy się na przetwarzaniu i przygotowywaniu danych, wdrażaniu i utrzymaniu naszych projektów, a także dzieleniu się naszymi umiejętnościami z resztą zespołu.
Dołącz do naszego zespołu, aby rozwinąć swoje umiejętności związane z wdrażaniem zaawansowanych technik przetwarzania danych i podejściami do uczenia maszynowego MLOps.
Szukamy osób, które:
- Swobodnie posługują się SQL na tradycyjnych silnikach (np. MySQL, PostgreSQL) lub silnikach chmurowych (np. BigQuery, Snowflake). Praca z SQL będzie Twoim codziennym zadaniem.
- Mają doświadczenie w programowaniu w Pythonie i są zaznajomione z najlepszymi praktykami inżynierii oprogramowania (PEP8, czysta architektura, code review, CI/CD, itp.)
- Mają pozytywne nastawienie i zdolność pracy w zespole.
- Chcą ciągle rozwijać i poszerzać swoją wiedzę.
Dodatkowo, mile widziane będzie, jeśli posiadasz:
- Doświadczenie z ekosystemem Big Data (Spark, Airflow)
- Znajomość narzędzi BigData w Google Cloud Platform lub innych publicznych chmurach (np. AWS, Azure)
- Doświadczenie komercyjne w praktykach DevOps i CI/CD (np. GitHub Actions) w obszarze ML/AI
- Doświadczenie z architekturą aplikacji chmurowych
Nasz tech stack:
- Python
- Google Cloud Platform (AirFlow, BigQuery, Composer)
- GitHub (przechowywanie kodu, CI/CD, hosting naszej własnej biblioteki Python dla Data Science)
Co oferujemy:
- Hybrydowy model pracy, który uzgodnisz z liderem i zespołem. Posiadamy dobrze zlokalizowane biura (z w pełni wyposażonymi kuchniami i parkingami rowerowymi) oraz doskonałe narzędzia pracy (biurka regulowane na wysokość, interaktywne sale konferencyjne).
- Roczny bonus do 10% rocznej pensji brutto (w zależności od Twojej rocznej oceny i wyników firmy).
- Szeroki wybór świadczeń dodatkowych w planie kafeteryjnym - Ty decydujesz, co Ci odpowiada (np. pakiety medyczne, sportowe czy obiadowe, ubezpieczenie, vouchery zakupowe).
- Płatne lekcje języka angielskiego związane z konkretnym charakterem Twojej pracy.
- Praca w zespole, na który zawsze możesz liczyć - mamy na pokładzie specjalistów z najwyższej półki.
- Wielki stopień autonomii w organizacji pracy swojego zespołu; zachęcamy do ciągłego rozwoju i próbowania nowych rzeczy.
- Hackathony, wyjścia zespołowe, budżet szkoleniowy oraz wewnętrzna platforma edukacyjna, MindUp (obejmująca kursy zorganizacji pracy, środków komunikacji, motywacji do pracy oraz różnych technologii i zagadnień tematycznych).
Twoje obowiązki obejmą:
- Aktywne tworzenie narzędzi do przetwarzania danych dla modelowania i analizy - we ścisłej współpracy z oboma zespołami Data Science.
- Pomoc obu zespołom Data Science w tworzeniu źródeł danych dla analiz ad-hoc i projektów związanych z uczeniem maszynowym.
- Przetwarzanie terabajtów danych za pomocą BigQuery, Composer, Dataflow i PySpark Google Cloud Platform, optymalizując procesy pod kątem ich wydajności i kosztów przetwarzania chmurowego GCP.
- Zbieranie wymagań procesowych od grup projektowych, a następnie automatyzowanie zadań związanych z przetwarzaniem wstępnym i monitorowaniem jakości danych, serwowanie przewidywań, a także monitorowanie i ponowne szkolenie modeli Machine Learning.
- Utrzymywanie jakości inżynieryjnej dla każdego projektu i współpraca z kolegami w zakresie doskonałości inżynieryjnej.
Dlaczego warto z nami pracować?
- Mieć znaczący wpływ na jedną z największych platform e-commerce na świecie poprzez dostarczane dane i procesy.
- Z uwagi na szeroki zakres projektów, w których uczestniczymy, nigdy nie zabraknie Ci interesujących wyzwań.
- Będziesz mieć dostęp do ogromnych zbiorów danych (mierzonych w petabajtach).
- Zdobędziesz pracę w zespole doświadczonych inżynierów i specjalistów BigData, którzy są chętni do dzielenia się swoją wiedzą (także publicznie, jako część allegro.tech).
- Twój rozwój zawodowy będzie szedł w parze z najnowszymi trendami technologicznymi open-source.
- Mieć rzeczywisty wpływ na kierunki rozwoju produktu i wybór technologii - korzystamy z najnowszych i najlepszych rozwiązań technologicznych, ponieważ są one najbardziej zgodne z naszymi potrzebami.
- Jesteśmy dostawcą full-stack - projektujemy, kodujemy, testujemy, wdrażamy i utrzymujemy nasze rozwiązania.
Zgłoś się do Allegro i zobacz, dlaczego #dobrzebyćtutaj