Senior Data Engineer

Job expired!

W CVS Health, wkładamy nasze serca w każdy aspekt Twojego dobrostanu. Nasza zjednoczona misja jest jasna: przynosić serce do każdego momentu Twojego zdrowia. Ta filozofia napędza nasze zaangażowanie w dostarczanie bardziej zaawansowanej, zorientowanej na człowieka opieki zdrowotnej w szybko zmieniającym się świecie. Z sercem w centrum naszej marki podkreślamy, że sposób, w jaki dostarczamy nasze usługi, jest równie ważny jak to, co dostarczamy. Nasze zachowania Heart At Work™ odzwierciedlają ten cel. Szukamy osób, które czują się upoważnione w swoich rolach do transformacji naszej kultury i przyspieszania naszych innowacji, czyniąc opiekę zdrowotną bardziej osobistą, wygodną i przystępną cenowo.

Jako Starszy Inżynier Danych, będziesz:

  • Wspierać tworzenie i działanie rozwiązań AI/machine learning opartych na dużych zbiorach danych, wykorzystując skomplikowane dane związane ze zdrowiem do uzyskania praktycznych wniosków.
  • Prowadzić i uczestniczyć w projektowaniu, budowaniu, zarządzaniu dużymi strukturami danych i pipeline'ami, w tym wydajnymi przepływami pracy ETL.
  • Wykorzystywać silne umiejętności analizy danych do profilowania i weryfikacji źródłowych zestawów danych, rekomendując skuteczne rozwiązania.
  • Współpracować z zespołem nauki danych w celu definiowania i budowania zestawów danych do szkolenia modeli analitycznych.
  • Korzystać z twoich eksperckich umiejętności zarządzania danymi do projektowania dużych struktur danych, które wspierają efektywne wykorzystanie wyników analitycznych.
  • Wykorzystywać silne umiejętności programowania w Pythonie, Javie lub innych głównych językach do rozwoju wydajnych procesów ETL dla zbierania danych, standaryzacji i generowania wniosków.
  • Tworzyć oprogramowanie do dostarczania analityk zarówno wsadowych, jak i w czasie rzeczywistym.

Wymagane kwalifikacje:

  • 3+ lata odpowiedniego doświadczenia zawodowego w inżynierii danych/rozwoju ETL
  • 3+ lata doświadczenia w SQL z dużymi zestawami danych
  • 3+ lata doświadczenia z Spark, Python lub Java do budowania solidnych pipeline'ów danych
  • 2+ lata wykorzystywania technologii chmurowych (preferowany GCP, ale AWS lub Azure brane pod uwagę) dla ETL i analizy danych
  • 3+ lata progresywnie bardziej złożonego doświadczenia w pokrewnych dziedzinach

Preferowane kwalifikacje:

  • Silne doświadczenie w SQL i analizie danych, w tym eksploracji danych, profilowaniu i walidacji
  • Doskonałe umiejętności współpracy i komunikacji zarówno w ramach zespołu, jak i między zespołami
  • Znajomość architektury Hadoop i doświadczenie z komendami HDFS, projektowaniem i optymalizacją zapytań do budowania pipeline'ów danych
  • Doświadczenie w pracy z danymi związanymi ze zdrowiem lub ubezpieczeniami zdrowotnymi
  • Rozumienie metodologii nauki danych i statystyki
  • Doświadczenie z narzędziami Google Cloud Platform (GCP) jak BigQuery, Cloud Composer, Dataproc i Dataflow; doświadczenie z AWS lub Azure także brane pod uwagę
  • Doświadczenie w budowaniu API w Pythonie i znajomość narzędzi orkiestracyjnych takich jak Apache Airflow
  • Umiejętność rozumienia złożonych system