Starsi Specjaliści od Danych

  • Full Time
Job expired!
Informacje o prywatności kandydatów do pracy w TransUnion Dane osobowe, które zbieramy Twoje wybory dotyczące prywatności Chcielibyśmy zobaczyć: Opis pracy Starsi naukowcy zajmujący się danymi do różnych i niezapowiedzianych miejsc pracy na terenie USA (siedziba główna: Chicago, IL). Tworzenie procesów modelowania statystycznego i opracowywanie bardzo dokładnych, objaśnialnych i powtarzalnych rozwiązań modelowania statystycznego. Wykorzystywanie technik statystycznych i uczenia maszynowego do tworzenia wysokowydajnych modeli statystycznych, które są zgodne z wymogami regulacyjnymi i ochrony prywatności. Testowanie nowych metod analizy statystycznej, oprogramowania i źródeł danych dla ciągłego ulepszania rozwiązań ilościowych. Przetwarzanie, czyszczenie i weryfikacja integralności danych używanych do analizy statystycznej. Budowanie metodologii statystycznych w celu tworzenia grup kontrolnych dla pomiarów kampanii. Środowisko techniczne: Modelowanie statystyczne, analiza kohort, wykorzystanie modelu predykcyjnego, Uczenie maszynowe z wykorzystaniem algorytmów XGBoost, Budowa end-to-end pipeline uczącej się maszyny od pobrania danych do inżynierii cech do wdrożenia treningu modelu, AWS EMR Studio, Walidacja modelu i wizualizacja za pomocą metryk statystycznych, Spark SQL, MapReduce, SQL, Python (Pandas, Pytorch, Tensorflow, NLP, MT, ASR, Scikit-learn), R (dplyr, tidyr, ggplot), SAS, AWS, Linux, Hadoop, Hive, Spark, Tableau, RStudio, MySQL. Wymagane umiejętności: Magisterium z zakresu statystyki lub pokrewnego pola wraz z 3-letnim doświadczeniem na oferowanym stanowisku lub jako statystyk, lub z modelowaniem statystycznym. Wymagane umiejętności: Modelowanie statystyczne, analiza kohort, wykorzystanie modelu predykcyjnego, Uczenie maszynowe z wykorzystaniem algorytmów XGBoost, Budowa end-to-end pipeline uczącej się maszyny od pobrania danych do inżynierii cech do wdrożenia treningu modelu, AWS EMR Studio, Walidacja modelu i wizualizacja za pomocą metryk statystycznych, Spark SQL, MapReduce, SQL, Python (Pandas, Pytorch, Tensorflow, NLP, MT, ASR, Scikit-learn), R (dplyr, tidyr, ggplot), SAS, AWS, Linux, Hadoop, Hive, Spark, Tableau, RStudio, MySQL. Dozwolony telepraca. #LI-DNP