Senior Data Engineer

Job expired!

O nas

Założona w 2018 roku, Causaly rewolucjonizuje sposób, w jaki ludzie zdobywają wiedzę i opracowują wgląd w biomedycynę. Nasza nowoczesna platforma generująca AI poprawia wgląd w badania i automatyzację wiedzy, umożliwiając tysiącom naukowców odkrywanie istotnych dowodów z milionów publikacji akademickich, badań klinicznych, dokumentów regulacyjnych, patentów i innych źródeł danych w zaledwie kilka minut.

Jesteśmy dumni ze współpracy z niektórymi z największych firm biofarmaceutycznych i instytucji na świecie, koncentrując się na przypadkach użycia takich jak Odkrywanie Leków, Bezpieczeństwo oraz Inteligencja Konkurencyjna. Przeczytaj więcej o naszej drodze i dowiedz się, jak przyspieszamy zdobywanie wiedzy i poprawiamy podejmowanie decyzji na naszym blogu.

Wspierani przez czołowe firmy venture capital, takie jak ICONIQ, Index Ventures, Pentech i Marathon, Causaly ma misję wywarcia znaczącego wpływu na przemysł biomedyczny.

O roli: Starszy Inżynier Danych

Szukamy doświadczonego Starszego Inżyniera Danych, który dołączy do naszego zespołu ds. Danych i Technologii Semantycznych i pomoże nam rozwijać się. Ten zespół jest kluczowy w projektowaniu i budowaniu skalowalnego i elastycznego zaplecza danych, które jest niezbędne do realizacji naszej wizji w Causaly.

Rola obejmuje pracę nad stopniowymi potokami danych zarówno dla aktualizacji wsadowych, jak i dedykowanych, utrzymywanie ogromnych grafów wiedzy i ontologii oraz zasilanie naszego ciągle rosnącego magazynu danych. Będziesz ściśle współpracować z zespołami Applied AI i Application, aby tworzyć realną wartość biznesową z danych.

Twoje obowiązki:

  • Zbieranie i zrozumienie danych na podstawie wymagań biznesowych.
  • Importowanie dużych zbiorów danych (miliony rekordów) z formatów takich jak CSV, XML, SQL, JSON do BigQuery.
  • Przetwarzanie i łączenie danych w BigQuery z zewnętrznymi źródłami danych.
  • Implementacja i utrzymanie wysokowydajnych potoków danych zgodnie z najlepszymi praktykami branżowymi dotyczącymi skalowalności, odporności na błędy i niezawodności.
  • Rozwijanie narzędzi do monitorowania, audytu, eksportu i wyciągania wniosków z potoków danych.
  • Współpraca z interesariuszami technicznymi, produktowymi i biznesowymi w celu dostarczania rozwiązań zaplecza danych.
  • Zarządzanie procesami związanymi z dostarczaniem, kuratystyką i operacjami uczenia maszynowego.
  • Budowa silnej funkcji inżynierii danych, mentoring innych inżynierów, kształtowanie naszej strategii technologicznej i innowacji w infrastrukturze danych.

Wymagania, aby odnieść sukces:

Minimalne wymagania:

  • Tytuł magistra w dziedzinie Informatyki, Matematyki lub pokrewnego pola technicznego.
  • 5+ lat doświadczenia w przetwarzaniu danych backendu i potokach danych.
  • Biegłość w Pythonie i pokrewnych bibliotekach (np. pandas, Airflow).
  • Mocne umiejętności z SQL i baz danych.
  • Solidne zrozumienie współczesnych praktyk rozwoju oprogramowania (testowanie, kontrola wersji, dokumentacja