Praktyczne doświadczenie z inżynierią cech (w tym walidacja cech, transformacja cech, przepływ cech, baza danych służąca do szkoleń, metadane cech i zbieranie artefaktów), a także cykl życia modelu uczenia maszynowego.
Praktyczne doświadczenie z pełnym stosie rozwoju w JAVA, Python, biegłość w TensorFlow, ReactJS i ADO.
Doświadczenie w implementacji Danych jako Usługi.
Silna wiedza statystyczna, jak również zdolności analityczne i do rozwiązywania problemów, są pożądane.
Znajomość cache DB i vector DB.
Przenikliwe zrozumienie odpowiedzialnych przepływów pracy AI i zarządzania modelami byłoby wielkim atutem.
Faktyczne doświadczenie z technologiami Big Data (w tym Hortonworks HDP, Apache Hadoop, HDFS, Hive, Sqoop, Flume, Zookeeper i HBase, Oozie, Spark, Ni-Fi, Kafka, Snap Logic, AWS, Redshift).
Doświadczenie z narzędziami monitorującymi.
Zdolności programistyczne w językach Python, Spark, i R.
Znakomite umiejętności zarządzania i analityczne.
Silne umiejętności pisemne i oralnej komunikacji.
Zrozumienie metodyk projektów (np. SDLC, Agile) oraz doświadczenie z nimi.
Doświadczenie w projektowaniu i implementacji przepływów ETL przy użyciu Apache Spark, Hive, Snowflake Structured Streaming oraz Pythona do przetwarzania danych strumieniowych.
Doświadczenie w dostosowywaniu wydajności Apache Spark oraz Hadoop YARN.
Doświadczenie z programowaniem w języku Java.
Zdolność do nadzoru i kierowania zespołami Hadoop oraz Development.
Znajomość Camunda, Angular.
Zdolność do debugowania i modyfikowania skryptów Shell/Python.
Solidne zrozumienie ekosystemu Big Data.
Kandydat powinien również posiadać solidne zrozumienie wzorców architektonicznych Big Data, wzorców projektowych, technik szacunkowych, dostosowywania wydajności i rozwiązywania problemów.
Dyspozycyjność do pracy w systemie dyżurów przez weekendy.
Zdolność do współpracy z wieloma zespołami aplikacji i koordynacji rozwiązywania problemów.
Silne umiejętności analityczne i interpersonalne.
Stałe monitorowanie i zarządzanie klastrem Hadoop.