Cel pracy
Inżynier analizy danych na poziomie średnio zaawansowanym to rozwijający się specjalista od danych, który rozpoczyna swoją karierę w ramach zespołu inżynierów analizy danych, tworząc solidne, powiązane i skuteczne produkty danych, które dostarczają najwyższej klasy, prowadzone przez przypadki użycia analizy na całą organizację. Rola ta wymaga współpracy z seniorami lub wiodącymi inżynierami analizy danych w celu konstruowania produktów i przepływów danych dla projektów o dużym wpływie, które oferują skalowalność i automatyzację oraz poprawiają dostępność i jakość danych. Inżynier analizy danych na poziomie średnio zaawansowanym ma zapal do doskonalenia swoich kompetencji w dziedzinie inżynierii danych, chmur i oprogramowania, aby dostarczyć przypadki analizy, które generują wartość biznesową i stawiają dane jako przewagę konkurencyjną.
Opis roli
- Kształtowanie i utrzymanie przepływów danych za pomocą SQL i Pythona w celu wytworzenia niezawodnych, skalowalnych i dostosowanych do celu produktów danych w środowisku chmurowym.
- Przekształcanie wymagań technicznych w niezawodne, skalowalne produkty danych lub przepływy, które spełniają wymagania organizacji.
- Współpraca z naukowcami i analitykami danych w celu zrozumienia potrzeb danych i dostarczenia produktów danych dla przypadków analizy.
- Realizacja monitoringu, testowania oraz praktyk automatyzacji dla produktów danych.
- Zaangażowanie w przeglądy kodów, zapewniając przestrzeganie standardów kodowania i najlepszych praktyk.
- Współpraca z członkami zespołu w celu identyfikacji i rozwiązywania problemów związanych z danymi oraz proponowania rozwiązań.
- Zapewnienie podstawowego wsparcia dla przepływów danych.
- Przyczynianie się do tworzenia i utrzymania dokumentacji dla zbiorów danych i procesów analitycznych, zapewniając zastosowanie spójnej terminologii i definicji, co ułatwia współpracę w zespole.
- Przyczynianie się do tworzenia biblioteki wielokrotnego użytku artefaktów inżynierii oprogramowania, mających na celu przyspieszenie tworzenia produktów danych.
- Zachowanie dokumentacji technicznej związanej z produktami danych i przepływami.
- Usprawnianie i wdrażanie komponentów w ramach produktu danych.
- Wsparcie inicjatyw DataOps w zespole.
- Współpraca z zespołem w celu przeprowadzenia standardowych procedur testowania i regularnego monitoringu zbiorów danych, z naciskiem na dokładność i jakość danych jako istotny czynnik wpływający na nasze schematy analityczne.
- Udział w wdrażaniu i stosowaniu najlepszych praktyk inżynierii oprogramowania w zespole danych, przyczyniając się do egzekwowania standardów kodowania, kontroli wersji i współpracujących schematów pracy.
Doświadczenie i umiejętności
- Dyplom lub tytuł w dziedzinie informatyki, programowania, inżynierii lub pokrewnych dziedzin.
- Minimum 1 rok praktycznego doświadczenia w zespole zajmującym się danymi, pełniąc funkcję inżyniera danych lub inżyniera oprogramowania skoncentrowanego na danych.
- Znajomość nowoczesnych narzędzi i technologii przetwarzania danych, przyczyniających się do rozwoju, doskonalenia i produkcji produktów danych.
- Specjalistyczna wiedza z zakresu Pythona i SQL, pozwalająca na prowadzenie prac programistycznych.
- Znajomość podstawowych koncepcji korzystania z Apache Spark do obliczeń rozproszonych, zdobytej podczas studiów lub początkowych projektów.
- Znajomość platform chmurowych takich jak AWS, Azure, Google Cloud, zdobytej podczas studiów lub podstawowych projektów, z podstawowym zrozumieniem chmurowych koncepcji związanych z obliczeniami i przechowywaniem.
- Podstawy infrastruktury jako kodu oraz jej znaczenia w procesach inżynierii danych.
- Doświadczenie w obsłudze dużych zestawów danych i zrozumienie modeli biznesowych.
- Podstawowe zrozumienie najlepszych praktyk związanych z tworzeniem oprogramowania i systemów kontroli wersji (np. Git).
- Zaangażowanie w standardy kodowania, obejmujące czytelność kodu, skuteczne komentowanie i spójne konwencje nazewnictwa.
- Zrozumienie podstawowych metod testowania, mających na celu zapewnienie jakości kodu.
- Gotowość do nauki i stosowania ustalonych wzorców kodowania i najlepszych praktyk w ramach zespołu.
- Doświadczenie w pracy zespołowej i współpracy między zespołami wielofunkcyjnymi.
- Doświadczenie w pracy w środowisku Agile.