Senior ML Engineer - Machine Learning Platform

Job expired!

Descripción del Trabajo

¿Estás listo para usar tus habilidades tecnológicas para transformar cómo se construyen comunidades, hospitales, hogares, estadios deportivos y escuelas en todo el mundo? Únete a Procore Technologies y sé parte de la revolución de una de las industrias menos digitalizadas y más peligrosas: la construcción.

Estamos buscando un talentoso Ingeniero Senior de ML para unirse a nuestro equipo de Plataforma de ML. En este rol, con base en El Cairo, ayudarás a evolucionar nuestra plataforma de Aprendizaje Automático para soportar cientos de modelos. Implementarás servicios para lanzar modelos de IA y ciencia de datos capaces de manejar terabytes de datos. Tu trabajo implicará entrenamientos automáticos de modelos, implementaciones y monitoreos automáticos, así como la gestión de repositorios de modelos, tiendas de características y capas de acceso a datos.

Estamos buscando a alguien que se una a nosotros de inmediato. Esta posición reportará al Gerente de Ingeniería, Plataforma de ML.

Qué Harás

  • Revisar los pipelines de despliegue para modelos de ML.
  • Revisar cambios de código y pull requests del equipo de ciencia de datos.
  • Accionar pipelines de CI/CD tras la aprobación del código.
  • Monitorear pipelines y asegurar que las pruebas pasen y que los artefactos del modelo se generen y almacenen correctamente.
  • Desplegar modelos actualizados a producción tras la finalización del pipeline.
  • Colaborar con los equipos de ingeniería de software y DevOps para una integración fluida.
  • Contenerizar modelos usando Docker y desplegar en plataformas en la nube (AWS/GCP/Azure).
  • Configurar herramientas de monitoreo para rastrear métricas como tiempo de respuesta, tasas de error y utilización de recursos.
  • Establecer alertas y notificaciones para detectar anomalías rápidamente.
  • Colaborar con el equipo de ciencia de datos para actualizar pipelines y analizar datos de monitoreo, registros y métricas.
  • Documentar y solucionar cambios y estrategias de optimización.
  • Trabajar con los equipos de Producto, UX e Ingeniería de Prototipos para influir en la hoja de ruta del producto.

Qué Buscamos

  • Dominio de lenguajes de programación como Python, Java y C++.
  • Experiencia con frameworks de aprendizaje automático como TensorFlow y PyTorch.
  • Experiencia práctica en el ciclo de vida del aprendizaje automático: preprocesamiento de datos, extracción de características, entrenamiento de modelos, evaluación, implementación y monitoreo.
  • Familiaridad con el ecosistema de código abierto, incluyendo TensorFlow, PyTorch, MLflow, Ray, Kubeflow y TFX es una ventaja.
  • Experiencia desarrollando sistemas de procesamiento de datos a gran escala, distribuidos, tolerantes a fallos y escalables utilizando procesamiento por lotes con Spark o flujos con Flink o Kafka Streams.
  • Capacidad para trabajar y comunicarse eficazmente con científicos de datos y traducir problemas de ciencia de datos en necesidades de datos, infraestructura o flujo de trabajo accionables.
  • Sólido entendimiento de pipelines de CI/CD usando Jenkins y herramientas de IaC como Terraform y CloudFormation.
  • Conocimiento de conceptos de seguridad como firewalls, encriptación, VPNs y transferencia de datos segura.
  • Familiaridad con servicios de infraestructura en la nube y sistemas de contenedores como Docker o Kubernetes.
  • Dominio de bibliotecas de ML en Python (PySpark, herramientas de configuración, pytest, pytest-mock) y herramientas de calidad de código (mypy, pylint, SonarQube), junto con experiencia en al menos un lenguaje de alta concurrencia (Java, Elixir, Python, Golang).

Beneficios y Ventajas

En Procore, invertimos en nuestros empleados. Disfruta de una gama completa de beneficios y ventajas diseñadas para ayudarte a crecer y prosperar, incluyendo generosos tiempos libres pagados, cobertura de salud y programas de desarrollo y enriquecimiento profesional. Aprende más sobre cómo te empoderamos para ser tu mejor versión.