Старші дата-науковці

  • Full Time
Job expired!
Повідомлення про конфіденційність даних кандидатів на роботу від TransUnion Особисті дані, які ми збираємо Ваші права щодо конфіденційності Ми радо бачили б: Опис роботи Старші науковці з даних для різних та непередбачуваних робочих місць по всіх США (головний офіс: Чикаго, ІЛ). Створюйте процеси статистичного моделювання та розробляйте високоточні, зрозумілі та повторювані рішення статистичного моделювання. Використовуйте статистичні та машинні методи навчання для створення високопродуктивних статистичних моделей, які відповідають вимогам регулювання та конфіденційності. Тестуємо нові методи статистичного аналізу, програмне забезпечення та джерела даних для постійного вдосконалення кількісних рішень. Обробляємо, очищаємо та перевіряємо достовірність даних, що використовуються для статистичного аналізу. Побудова статистичних методологій для створення контрольних груп для вимірювання кампаній. Технічне середовище: Статистичне моделювання, аналіз когорт, використання прогнозних моделей, машинне навчання з використанням алгоритмів XGBoost, побудова кінцевого машинного навчання від завантаження даних до інженерії особливостей до розгортання тренування моделі, AWS EMR Studio, перевірка та візуалізація моделі за допомогою статистичних метрик, Spark SQL, MapReduce, SQL, Python (Pandas, Pytorch, Tensorflow, NLP, MT, ASR, Scikit-learn), R (dplyr, tidyr, ggplot), SAS, AWS, Linux, Hadoop, Hive, Spark, Tableau, RStudio, MySQL. Потрібні навички: Магістратура зі статистики або суміжної галузі плюс 3 роки досвіду в пропонованій роботі або як статистик або з статистичним моделюванням. Потрібні навички: статистичне моделювання, аналіз когорт, використання прогнозних моделей, машинне навчання з використанням алгоритмів XGBoost, побудова кінцевого машинного навчання від завантаження даних до інженерії особливостей до розгортання тренування моделі, AWS EMR Studio, перевірка та візуалізація моделі за допомогою статистичних метрик, Spark SQL, MapReduce, SQL, Python (Pandas, Pytorch, Tensorflow, NLP, MT, ASR, Scikit-learn), R (dplyr, tidyr, ggplot), SAS, AWS, Linux, Hadoop, Hive, Spark, Tableau, RStudio, MySQL. Дозволяється віддалена робота. #LI-DNP