Data Engineer

Data Engineer
Other places
06/14/2024
-

Job expired!

O firmie Cypris:

W Cypris tworzymy najlepszy ekosystem dla globalnych danych innowacyjnych. Cypris to narzędzie badawcze zasilane sztuczną inteligencją, które integruje różne źródła danych, takie jak publikacje naukowe, globalne patenty, wiadomości rynkowe i dane firmowe, na jednej platformie. Dzięki dostępowi do ponad 500M globalnych punktów danych, Cypris dostarcza użytkownikom bezcennych wglądów w ich rynek, konkurencję, kluczowe technologie i więcej, wspierając rozwój nowych produktów, strategii komercyjnych i przyspieszając globalne innowacje.

Łączymy zespoły R&D z globalnym krajobrazem innowacji, podobnie jak Bloomberg Terminal zrewolucjonizował finanse lub Pitchbook udoskonalił venture capital. Nasi obecni użytkownicy to wiodące zespoły R&D i innowacji w średnich i dużych firmach z listy Fortune 100 w rynkach wschodzących, takich jak lotnictwo, genomika, badania nad rakiem, pojazdy autonomiczne i wiele innych.

O roli:

Jako Inżynier Danych w Cypris, będziesz odpowiedzialny za projektowanie, budowanie i utrzymywanie skalowalnych potoków danych i systemów wspierających naszą platformę opartą na danych. Ściśle współpracując z naszym zespołem inżynierskim, będziesz dbać o dostępność i jakość danych niezbędnych do dostarczania analiz i wglądów w innowacje. Ta rola oferuje ekscytującą możliwość wkładu w naszą infrastrukturę danych i wpływu na ewolucję naszych możliwości danych.

W tej roli będziesz:

Projektować, rozwijać i optymalizować solidne potoki danych do przetwarzania i transformacji dużych zbiorów danych z różnych źródeł.
Poprawiać wydajność przechowywania danych, koncentrując się na indeksowaniu i czasach odpowiedzi zapytań.
Implementować i utrzymywać procesy ETL, aby zapewnić dokładność i integralność danych.
Współpracować z zespołami międzyfunkcyjnymi, aby zrozumieć wymagania dotyczące danych i dostarczać skuteczne rozwiązania danych.
Rozwijać i utrzymywać hurtownie danych i data lakes, aby wspierać analizy biznesowe i wizualizacje danych.
Monitorować i rozwiązywać problemy z wydajnością i niezawodnością potoków danych, wdrażając usprawnienia w miarę potrzeb.
Zapewniać bezpieczeństwo danych i zgodność z odpowiednimi regulacjami i standardami.
Być na bieżąco z najnowszymi technologiami i najlepszymi praktykami inżynierii danych i wdrażać je w naszych procesach.

Wymagania - Kluczowy kandydat będzie miał:

Tytuł licencjata lub magistra nauk komputerowych, inżynierii lub pokrewnej dziedziny.
Udokumentowane doświadczenie jako inżynier danych lub na podobnym stanowisku.
Biegłość w językach programowania takich jak Python, Java lub Scala.
Doświadczenie z platformami chmurowymi, takimi jak GCP (preferowane), AWS, Google Cloud lub Azure.
Praktyczne doświadczenie z technologiami big data, takimi jak Hadoop, Spark lub podobne frameworki.
Znajomość koncepcji hurtowni danych i doświadczenie z narzędziami, takimi jak Redshift, BigQuery lub Snowflake.
Znajomość narzędzi i procesów ETL.
Silne umiejętności rozwiązywania problemów i dbałość o szczegóły.