Senior ML Engineer - Machine Learning Platform

Job expired!

Description de l'emploi

Êtes-vous prêt à utiliser vos compétences technologiques pour transformer la manière dont les communautés, les hôpitaux, les maisons, les stades sportifs et les écoles sont construits à travers le monde ? Rejoignez Procore Technologies et participez à la révolution de l'une des industries les moins numérisées et les plus dangereuses : la construction.

Nous recherchons un ingénieur en apprentissage automatique senior talentueux pour rejoindre notre équipe de la plateforme ML. Dans ce rôle, basé au Caire, vous aiderez à faire évoluer notre plateforme de Machine Learning pour prendre en charge des centaines de modèles. Vous mettrez en œuvre des services pour libérer des modèles d'IA et de science des données capables de gérer des téraoctets de données. Votre travail impliquera la formation automatique, le déploiement et la surveillance de modèles, ainsi que la gestion des référentiels de modèles, des magasins de fonctionnalités et des couches d'accès aux données.

Nous cherchons quelqu'un pour nous rejoindre immédiatement. Ce poste rapportera au Directeur de l'ingénierie, plateforme ML.

  • Vérifiez les pipelines de déploiement des modèles de ML.
  • Examinez les modifications de code et les demandes de tirage de l'équipe de science des données.
  • Déclenchez les pipelines CI/CD après les approbations de code.
  • Surveillez les pipelines et assurez-vous que les tests réussissent et que les artefacts de modèle sont générés et stockés correctement.
  • Déployez les modèles mis à jour en production après la fin du pipeline.
  • Collaborez avec les équipes d'ingénierie logicielle et DevOps pour une intégration fluide.
  • Conteneurisez les modèles en utilisant Docker et déployez sur des plateformes cloud (AWS/GCP/Azure).
  • Configurez des outils de surveillance pour suivre des métriques comme le temps de réponse, les taux d'erreur et l'utilisation des ressources.
  • Établissez des alertes et des notifications pour détecter rapidement les anomalies.
  • Collaborez avec l'équipe de science des données pour mettre à jour les pipelines et analyser les données de surveillance, les journaux et les métriques.
  • Documentez et résolvez les changements et les stratégies d'optimisation.
  • Travaillez avec les équipes de Produit, UX et Ingénierie de prototype pour influencer la feuille de route du produit.
  • Maîtrise des langages de programmation tels que Python, Java et C++.
  • Expérience avec des cadres d'apprentissage automatique comme TensorFlow et PyTorch.
  • Expérience pratique dans le cycle de vie de l'apprentissage automatique : prétraitement des données, extraction de fonctionnalités, formation de modèles, évaluation, déploiement et surveillance.
  • Familiarité avec l'écosystème open-source, y compris TensorFlow, PyTorch, MLflow, Ray, Kubeflow et TFX est un plus.
  • Expérience dans le développement de systèmes de traitement de données à grande échelle, distribués, tolérants aux pannes et évolutifs utilisant le traitement par lots avec Spark ou le streaming avec Flink ou Kafka Streams.
  • Capacité à travailler et à communiquer efficacement avec les data scientists et à traduire les problèmes de science des données en besoins exploitables en matière de données, d'infrastructure ou de flux de travail.
  • Compréhension solide des pipelines CI/CD utilisant Jenkins et des outils IaC comme Terraform et CloudFormation.
  • Connaissance des concepts de sécurité tels que les pare-feu, le cryptage, les VPN et le transfert sécurisé des données.
  • Familiarité avec les services d'infrastructure cloud et les systèmes de conteneurs comme Docker ou Kubernetes.
  • Maîtrise des bibliothèques Python ML (PySpark, outils de configuration, pytest, pytest-mock) et des outils de qualité du code (mypy, pylint, SonarQube), ainsi qu'une expérience dans au moins un langage de haute concurrence (Java, Elixir, Python, Golang).

Chez Procore, nous investissons dans nos employés. Profitez d'une gamme complète d