Informacje o prywatności kandydatów do pracy w TransUnion
Dane osobowe, które zbieramy
Twoje wybory dotyczące prywatności
Chcielibyśmy zobaczyć:
Opis pracy
Starsi naukowcy zajmujący się danymi do różnych i niezapowiedzianych miejsc pracy na terenie USA (siedziba główna: Chicago, IL). Tworzenie procesów modelowania statystycznego i opracowywanie bardzo dokładnych, objaśnialnych i powtarzalnych rozwiązań modelowania statystycznego. Wykorzystywanie technik statystycznych i uczenia maszynowego do tworzenia wysokowydajnych modeli statystycznych, które są zgodne z wymogami regulacyjnymi i ochrony prywatności. Testowanie nowych metod analizy statystycznej, oprogramowania i źródeł danych dla ciągłego ulepszania rozwiązań ilościowych. Przetwarzanie, czyszczenie i weryfikacja integralności danych używanych do analizy statystycznej. Budowanie metodologii statystycznych w celu tworzenia grup kontrolnych dla pomiarów kampanii. Środowisko techniczne: Modelowanie statystyczne, analiza kohort, wykorzystanie modelu predykcyjnego, Uczenie maszynowe z wykorzystaniem algorytmów XGBoost, Budowa end-to-end pipeline uczącej się maszyny od pobrania danych do inżynierii cech do wdrożenia treningu modelu, AWS EMR Studio, Walidacja modelu i wizualizacja za pomocą metryk statystycznych, Spark SQL, MapReduce, SQL, Python (Pandas, Pytorch, Tensorflow, NLP, MT, ASR, Scikit-learn), R (dplyr, tidyr, ggplot), SAS, AWS, Linux, Hadoop, Hive, Spark, Tableau, RStudio, MySQL.
Wymagane umiejętności:
Magisterium z zakresu statystyki lub pokrewnego pola wraz z 3-letnim doświadczeniem na oferowanym stanowisku lub jako statystyk, lub z modelowaniem statystycznym. Wymagane umiejętności: Modelowanie statystyczne, analiza kohort, wykorzystanie modelu predykcyjnego, Uczenie maszynowe z wykorzystaniem algorytmów XGBoost, Budowa end-to-end pipeline uczącej się maszyny od pobrania danych do inżynierii cech do wdrożenia treningu modelu, AWS EMR Studio, Walidacja modelu i wizualizacja za pomocą metryk statystycznych, Spark SQL, MapReduce, SQL, Python (Pandas, Pytorch, Tensorflow, NLP, MT, ASR, Scikit-learn), R (dplyr, tidyr, ggplot), SAS, AWS, Linux, Hadoop, Hive, Spark, Tableau, RStudio, MySQL. Dozwolony telepraca.
#LI-DNP