Senior Data Engineer

Data Engineer
Other places
06/15/2024
-

Job expired!

W CVS Health, wkładamy nasze serca w każdy aspekt Twojego dobrostanu. Nasza zjednoczona misja jest jasna: przynosić serce do każdego momentu Twojego zdrowia. Ta filozofia napędza nasze zaangażowanie w dostarczanie bardziej zaawansowanej, zorientowanej na człowieka opieki zdrowotnej w szybko zmieniającym się świecie. Z sercem w centrum naszej marki podkreślamy, że sposób, w jaki dostarczamy nasze usługi, jest równie ważny jak to, co dostarczamy. Nasze zachowania Heart At Work™ odzwierciedlają ten cel. Szukamy osób, które czują się upoważnione w swoich rolach do transformacji naszej kultury i przyspieszania naszych innowacji, czyniąc opiekę zdrowotną bardziej osobistą, wygodną i przystępną cenowo.

Jako Starszy Inżynier Danych, będziesz:

Wspierać tworzenie i działanie rozwiązań AI/machine learning opartych na dużych zbiorach danych, wykorzystując skomplikowane dane związane ze zdrowiem do uzyskania praktycznych wniosków.
Prowadzić i uczestniczyć w projektowaniu, budowaniu, zarządzaniu dużymi strukturami danych i pipeline'ami, w tym wydajnymi przepływami pracy ETL.
Wykorzystywać silne umiejętności analizy danych do profilowania i weryfikacji źródłowych zestawów danych, rekomendując skuteczne rozwiązania.
Współpracować z zespołem nauki danych w celu definiowania i budowania zestawów danych do szkolenia modeli analitycznych.
Korzystać z twoich eksperckich umiejętności zarządzania danymi do projektowania dużych struktur danych, które wspierają efektywne wykorzystanie wyników analitycznych.
Wykorzystywać silne umiejętności programowania w Pythonie, Javie lub innych głównych językach do rozwoju wydajnych procesów ETL dla zbierania danych, standaryzacji i generowania wniosków.
Tworzyć oprogramowanie do dostarczania analityk zarówno wsadowych, jak i w czasie rzeczywistym.

Wymagane kwalifikacje:

3+ lata odpowiedniego doświadczenia zawodowego w inżynierii danych/rozwoju ETL
3+ lata doświadczenia w SQL z dużymi zestawami danych
3+ lata doświadczenia z Spark, Python lub Java do budowania solidnych pipeline'ów danych
2+ lata wykorzystywania technologii chmurowych (preferowany GCP, ale AWS lub Azure brane pod uwagę) dla ETL i analizy danych
3+ lata progresywnie bardziej złożonego doświadczenia w pokrewnych dziedzinach

Preferowane kwalifikacje:

Silne doświadczenie w SQL i analizie danych, w tym eksploracji danych, profilowaniu i walidacji
Doskonałe umiejętności współpracy i komunikacji zarówno w ramach zespołu, jak i między zespołami
Znajomość architektury Hadoop i doświadczenie z komendami HDFS, projektowaniem i optymalizacją zapytań do budowania pipeline'ów danych
Doświadczenie w pracy z danymi związanymi ze zdrowiem lub ubezpieczeniami zdrowotnymi
Rozumienie metodologii nauki danych i statystyki
Doświadczenie z narzędziami Google Cloud Platform (GCP) jak BigQuery, Cloud Composer, Dataproc i Dataflow; doświadczenie z AWS lub Azure także brane pod uwagę
Doświadczenie w budowaniu API w Pythonie i znajomość narzędzi orkiestracyjnych takich jak Apache Airflow
Umiejętność rozumienia złożonych system