Senior Applied Machine Learning Engineer, NEMO Microservices

Job expired!

Durante más de 25 años, NVIDIA ha estado a la vanguardia de los gráficos por computadora, los juegos para PC y la innovación en computación acelerada. Nuestros avances tecnológicos, impulsados por equipos increíbles, ahora están empujando los límites de la IA para definir el futuro de la computación. Nuestras GPU son el cerebro detrás de computadoras, robots y coches autónomos que entienden el mundo como nunca antes.

En NVIDIA, te sumergirás en un ambiente diverso y de apoyo donde la innovación prospera. Nuestra misión es convertir ideas visionarias en productos innovadores. Unirte a nuestro equipo significa trabajar al lado del mejor talento de la industria para tener un impacto duradero en el mundo.

Estamos buscando un Ingeniero Senior de Machine Learning Aplicado para ser parte del equipo que construye la Plataforma NeMo Microservices Suite. Nuestro objetivo es crear servicios e interfaces de IA de próxima generación que mejoren y desplieguen la IA a gran escala. Nuestro enfoque incluye desarrollar tecnologías de última generación en habla, visión y PNL para resolver problemas del mundo real. Participamos activamente en todas las fases del ciclo de vida del aprendizaje automático, desde la concepción inicial hasta la investigación aplicada, y la inferencia y despliegue optimizados.

  • Desarrollar una nueva generación de plataformas de Sistemas de IA Compuestos con capacidades de razonamiento en múltiples modalidades como imágenes, videos, audio y texto.
  • Crear aplicaciones distribuidas en la nube, microservicios y plataformas MLOps que escalen a modelos enorme.
  • Construir microservicios para servicios en la nube de IA específicos de tareas.
  • Implementar infraestructura central para entrenamiento y inferencia de IA nativa de la nube.
  • Buscar un rendimiento óptimo bajo condiciones de alta carga.
  • BS, Maestría o experiencia equivalente en ciencias de la computación, arquitectura informática o un campo relacionado.
  • 5+ años de experiencia en el campo.
  • Destrezas excepcionales de codificación dirigidas a la creación de software de alta calidad.
  • Capacidad para trabajar de manera independiente, definir metas y alcance del proyecto, interactuar con la comunidad de código abierto y gestionar los esfuerzos de desarrollo.
  • Experiencia con la implementación de microservicios y aplicaciones nativas de la nube usando tecnologías como HTTP REST, gRPC, protobuf y JSON.
  • Dominio en la implementación de aplicaciones en plataformas Kubernetes y familiaridad con los charts de helm, kustomize y operador de k8s.
  • Comprensión profunda del rendimiento, seguridad y fiabilidad en infraestructura distribuida compleja.
  • Excelentes habilidades de programación y diseño de software en Python o Golang, incluyendo depuración, rendimiento, análisis de salud del servicio y diseño de pruebas.
  • Experiencia desplegando modelos de aprendizaje automático o estadísticos en entornos de producción utilizando marcos como PyTorch, Tensorflow, ONNX Runtime y TensorRT.
  • Conocimiento de marcos de aprendizaje profundo como Megatron Core, NeMo, HuggingFace Accelerate, HuggingFace Transformers, DeepSpeed y similares.
  • Experiencia con plataformas de orquestación MLOps como Seldon Core, Kserve, BentoML y similares.
  • Experiencia con motores de inferencia como VLLM, TensorRT-LLM y similares.
  • Experiencia en el desarrollo de sistemas NLP de producción y manejo de entornos de alta disponibilidad.

El rango salarial base para este rol es de 148,000 USD - 276,000 USD, dependiendo de tu ubicación, experiencia y los salarios comparables dentro