Data Scientist - New College Graduate

Job expired!

Description de l'entreprise

Chez Western Digital, notre vision est de stimuler l'innovation mondiale et de redéfinir les limites de la technologie pour atteindre l'extraordinaire. Nous sommes une entreprise de résolveurs de problèmes, propulsant des réalisations monumentales depuis des décennies, y compris la technologie qui a aidé à poser un homme sur la lune. En partenariat avec certaines des plus grandes et des plus rapides organisations au monde, nous alimentons l'innovation dans les plateformes de jeux compétitifs, les villes plus sûres, les voitures intelligentes et les vastes centres de données des grandes entreprises et des clouds publics.

Que vous regardiez des séries en boucle, parcouriez les réseaux sociaux ou fassiez vos achats en ligne, Western Digital joue un rôle crucial dans l'infrastructure de stockage de ces plateformes. Nos cartes mémoire flash préservent vos moments précieux, et notre vaste portefeuille de technologies, dispositifs de stockage et solutions, y compris les marques Western Digital®, G-Technology™, SanDisk® et WD®, répondent aux besoins des entreprises et des consommateurs.

Les défis d'aujourd'hui exigent vos compétences uniques. Ensemble, avec Western Digital, nous sommes en passe de devenir la prochaine grande innovation dans les données.

Description de l'emploi

  • Collecter et extraire de grands ensembles de données structurées et non structurées provenant des bases de données, des API et des sources de web scraping.
  • Développer des modèles prédictifs à l'aide d'algorithmes d'apprentissage automatique pour prévoir les tendances et les résultats.
  • Intégrer des agents IA pour automatiser la collecte de données, le pré-traitement et l'analyse pour améliorer l'efficacité et l'évolutivité.
  • Utiliser des modèles d'IA générative pour créer des données synthétiques, augmenter les ensembles de données et générer des insights.
  • Déployer, surveiller et maintenir les modèles, systèmes et agents IA développés pour assurer leur efficacité.
  • Documenter les processus et les méthodologies pour la reproductibilité et l'auditabilité.
  • Collaborer avec des équipes interfonctionnelles telles que les chefs de produit, les ingénieurs logiciels et les analystes commerciaux pour identifier les problèmes commerciaux et développer des solutions.
  • Expliquer des concepts techniques complexes aux parties prenantes non techniques de manière claire et concise.

Qualifications

  • Master en Data Science, Informatique, Statistiques, Mathématiques, Physique ou Ingénierie.
  • Connaissances en gestion du cycle de vie des IA/ML et des outils, y compris EDA, modélisation, intégration/déploiement, détection de dérive des données/modèles, et réentraîne des modèles.
  • Familiarité avec les techniques statistiques et d'apprentissage automatique, telles que la régression régularisée, l'analyse des séries temporelles, les arbres de décision, les algorithmes de boosting, les réseaux neuronaux, le clustering et le filtrage collaboratif.
  • Expérience avec des sources de données structurées, semi-structurées et non structurées.
  • Compétence en web crawling, traitement du langage naturel et visualisation de données.
  • Expérience avec des solutions collaboratives, la gestion de version des modèles et du code (Github), le packaging des solutions (Docker), et le déploiement des modèles (Dataiku).
  • Maîtrise des langages de programmation tels que Python, R et SQL; familiarité avec des outils comme Tableau, PowerBI ou Spotfire, NumPy, Pandas, et Matplotlib.
  • Expérience dans le développement et le déploiement de modèles d'IA générative et de grands modèles de langue (LLM).
  • Compétences en automatisation des processus robotiques (RPA) et développement de logiciels d'automatisation.
  • Connaissance des principes de conception UI et UX pour améliorer l'interaction et l'expérience utilisateur dans les applications basées sur les données.
  • Capacité à définir des problèmes, générer des hypothèses, développer et tester des solutions, et communiquer efficacement des concepts techniques complexes aux parties prenantes non techniques.
  • Attention aux détails et excellentes compétences en collaboration pour atteindre les objectifs des