Senior Data Engineer, GenAI

Job expired!

Dołącz do MongoDB jako starszy inżynier danych, GenAI i rozwijaj swoją karierę

MongoDB, pionier w oprogramowaniu do zarządzania bazami danych, przeżywa ekscytujący okres wzrostu. W momencie, gdy rynek oprogramowania bazodanowego ma wzrosnąć z 82 miliardów dolarów w 2023 roku do około 137 miliardów dolarów w 2027 roku, MongoDB nadal prowadzi i innowuje. Jako pierwszy dostawca baz danych, który poszedł na giełdę od ponad dwóch dekad, oferujemy wyjątkową okazję dla talentów do dołączenia do firmy, która kształtuje przyszłość technologii.

O roli

Nasz zespół inżynierów Data Pipelines jest sercem operacji MongoDB, zwiększając efektywność firmy za pomocą solidnych platform ETL. Te systemy wspierają naszą Wewnętrzną Platformę Danych, napędzając potężną analitykę i przyczyniając się do naszych zaawansowanych ram Generative AI. Ta rola jest kluczowa, pomagając MongoDB wykorzystać AI do transformacji ogromnych zbiorów danych w dostępną, użyteczną informację.

Co będziesz robić

W swojej roli jako starszy inżynier danych, GenAI, będziesz:

  • Budować i zarządzać platformami ETL, korzystając z Pythona i Sparka.
  • Projektować i implementować te platformy w różnych architekturach, takich jak systemy oparte na plikach i strumieniach danych.
  • Strategizować na temat optymalizacji narzędzi AI, skupiając się na metodach kawałkowania danych i odzyskiwania danych dla aplikacji bazujących na RAG.
  • Ciągle aktualizować i integrować najnowsze trendy i narzędzia AI w platformach MongoDB.
  • Podejmować kluczowe decyzje architektoniczne dotyczące przechowywania ogromnych zbiorów danych w formatach takich jak Parquet i JSON oraz korzystanie z różnych typów tabel, takich jak Iceberg i Hive.
  • Współpracować z zespołami międzyfunkcyjnymi, aby zapewnić bezpieczeństwo danych, zgodność i skalowalność.

Szukamy kogoś, kto ma

  • Ponad 5 lat doświadczenia w budowaniu platform ETL dla Data Lakes lub magazynów danych.
  • Co najmniej 1 rok doświadczenia w rozwijaniu aplikacji opartych na AI i RAG.
  • Zaawansowaną znajomość Pythona i Sparka.
  • Głębokie zrozumienie technologii takich jak Hive, Iceberg i Glue.
  • Znajomość dużych typów plików danych, w tym Parquet, Avro i JSON.

Miary sukcesu

W ciągu 3 miesięcy w pełni zrozumiesz ekosystem Data Lake i AI MongoDB. Do 6. miesiąca poprowadzisz główny projekt od początku do zakończenia. Po 12 miesiącach będziesz miał rozwinięte nowe funkcje, staniesz na czele wysiłków rozwojowych i staniesz się ekspertem, na którym można polegać w naszych systemach.

Dlaczego MongoDB?

MongoDB wychodzi poza samą techniczną pomysłowość. Jesteśmy zaanga