Software Development Engineer III - ETL Engineer

Job expired!

Firma: Groupon

Groupon jest wiodącym rynkiem łączącym ludzi z najlepszymi ofertami w ich mieście lub w miejscu podróży. Dzięki mobilnemu handlowi w czasie rzeczywistym w lokalnych firmach, na żywo wydarzeniach i w miejscach podróży, Groupon pomaga odkrywać doświadczenia, które sprawiają, że życie jest pełne, zabawne i satysfakcjonujące. Poprzez wspieranie lokalnych firm, wspieramy silne relacje z klientami oraz żywe społeczności. Mimo że mamy tysiące pracowników na całym świecie, nasza kultura inspiruje innowacje, nagradza podejmowanie ryzyk i świętuje sukcesy.

W Groupon rozumiemy, że wielcy ludzie tworzą wielkie firmy. Łączymy najlepsze z obu światów, łącząc zasoby i skalę dużej firmy z autonomią i potencjałem wpływu mniejszej organizacji. Jesteśmy ciekawi, zabawni, trochę intensywni i głęboko zaangażowani w pomaganie lokalnym firmom w rozkwicie.

Zespół ds. Ingestii Danych w Groupon jest kluczowy dla wszystkich spraw związanych z danymi. Definiujemy i budujemy nowoczesne, oparte na chmurze rozwiązania do ingestii i kurateli petabajtów danych w naszym jeziorze danych i hurtowni danych. Naszą misją jest umożliwienie analitykom danych i naukowcom danych we wszystkich jednostkach biznesowych podejmowanie świadomych decyzji biznesowych. W tej roli będziesz miał okazję połączyć swoje umiejętności w dziedzinie informatyki, systemów rozproszonych oraz skalowalnych, wysokowydajnych systemów produkcyjnych.

Twoje obowiązki

  • Projektowanie i rozwój dużych batch/streamingowych pipeline'ów do ingestii danych i frameworków na platformach danych AWS i GCP.
  • Tworzenie, kodowanie i uruchamianie nowoczesnych platform do ingestii i kurateli danych.
  • Uczestnictwo w definiowaniu wymagań, dyskusjach architektonicznych systemu i danych.
  • Techniczne prowadzenie i mentorstwo młodszych inżynierów w zakresie najlepszych praktyk rozwoju oprogramowania i inżynierii danych.
  • Współpraca z zespołami cross-funkcyjnymi, w tym inżynierami oprogramowania, inżynierami danych, ekspertami ML i analitykami danych.

Czego szukamy

Cieszy nas, jeśli masz:

  • BS/MS z Informatyki z 5+ lat doświadczenia w systemach rozproszonych, inżynierii danych lub inżynierii oprogramowania.
  • Mocne umiejętności kodowania w językach takich jak Python i Java.
  • Doświadczenie z bazami danych SQL i NoSQL (Teradata, MySQL, Postgres, Cassandra, Elasticsearch, HBase, itp.).
  • Znajomość linii poleceń UNIX.
  • Doświadczenie w technologiach big data, takich jak Apache Spark, Hadoop, Hive, itp.
  • Dogłębne doświadczenie z ETL, pochodzeniem danych i problemami z jakością danych.
  • Doświadczenie w batch i streamingowych pipeline'ach danych.
  • Doświadczenie z technologiami chmurowymi AWS lub GCP, zwłaszcza w zakresie przetwarzania danych na dużą skalę.
  • Mocne zrozumienie usług produkcyjnych z rygorystycznymi SLA i praktykami CI/CD.
  • Doskonale rozwinięte umiejętności komunikacji pisemnej i werbalnej.
  • Pasję do budowania platform danych i chęć innowacji.

Mile widziane

  • Doświadczenie z Airflow i Apache Kafka.
  • Znajomo