Scientifiques de Données Senior

  • Full Time
Job expired!

Avis de confidentialité pour les candidats à l'emploi de TransUnion

Informations personnelles que nous recueillons

Vos choix en matière de confidentialité

Nous aimerions voir:

Description du poste

Senior Data Scientists pour divers lieux de travail imprévus à travers les États-Unis (Siège : Chicago, IL). Créer des processus de modélisation statistique et développer des solutions de modélisation statistique extrêmement précises, explicables et reproductibles. Utiliser des techniques statistiques et d'apprentissage automatique pour créer des modèles statistiques haute performance qui respectent les exigences réglementaires et de confidentialité. Tester de nouvelles méthodes d'analyse statistique, logiciels et sources de données pour l'amélioration continue des solutions quantitatives. Traiter, nettoyer et vérifier l'intégrité des données utilisées pour l'analyse statistique. Construire des méthodologies statistiques pour créer des groupes de contrôle pour les mesures de campagne. Environnement technique: Modélisation statistique, Analyse de cohortes, Exploitation de modèles prédictifs, Apprentissage automatique en utilisant des algorithmes XGBoost, Construction d'un pipeline d'apprentissage automatique de bout en bout, de l'ingestion des données au génie des caractéristiques jusqu'au déploiement de l'entraînement du modèle, Studio EMR AWS, Validation du modèle et visualisation avec des métriques statistiques, Spark SQL, MapReduce, SQL, Python (Pandas, Pytorch, Tensorflow, NLP, MT, ASR, Scikit-learn), R (dplyr, tidyr, ggplot), SAS, AWS, Linux, Hadoop, Hive, Spark, Tableau, RStudio, MySQL.

Compétences requises:
Master en statistiques ou dans un domaine connexe, plus 3 ans d'expérience dans le poste proposé ou en tant que statisticien ou avec la modélisation statistique requise. Compétences requises: Modélisation statistique, Analyse de cohortes, Exploitation de modèles prédictifs, Apprentissage automatique en utilisant des algorithmes XGBoost, Construction d'un pipeline d'apprentissage automatique de bout en bout, Studio EMR AWS, Validation du modèle et visualisation avec des métriques statistiques, Spark SQL, MapReduce, SQL, Python (Pandas, Pytorch, Tensorflow, NLP, MT, ASR, Scikit-learn), R (dplyr, tidyr, ggplot), SAS, AWS, Linux, Hadoop, Hive, Spark, Tableau, RStudio, MySQL. Le télétravail est autorisé.
#LI-DNP