Senior AI and ML Infra Engineer, Research Clusters

Other
Other places
06/12/2024
-

Job expired!

¿Te apasiona la inteligencia artificial y el aprendizaje automático? NVIDIA en Santa Clara, CA, EE. UU. está buscando un Ingeniero de Infraestructura de IA/ML competente para mejorar nuestras soluciones tecnológicas de vanguardia. Esta es una oportunidad sin igual de contribuir en un equipo que está a la vanguardia de la tecnología de IA/ML, impulsando innovaciones que impactan al mundo.

Como Ingeniero Senior de Infraestructura de IA y ML, tu tarea principal será potenciar la productividad de nuestros equipos de investigación identificando y abordando lagunas en la infraestructura. Esto incluye diseñar e implementar soluciones para mejorar la escalabilidad, fiabilidad y eficiencia de nuestros clusters de GPU a gran escala y otros sistemas críticos.

Comprender las necesidades de infraestructura de los equipos de investigación de IA/ML y traducirlas en mejoras poderosas.
Diseñar soluciones para la gestión del almacenamiento, atribución de errores y problemas de fiabilidad dentro de nuestros clusters de GPU.
Optimizar el rendimiento de la infraestructura de IA/ML y la utilización de recursos a través de monitoreo continuo y actualizaciones.
Desarrollar herramientas de automatización y estrategias operativas para minimizar tareas manuales y simplificar la gestión de infraestructura.
Colaborar con equipos multifuncionales para garantizar un ecosistema de infraestructura de IA/ML sin fisuras y robusto.
Mantenerse actualizado con los últimos avances en tecnologías de IA/ML e incorporar estos en las estrategias de NVIDIA.

Estamos buscando a alguien con un BS o equivalente (se prefiere MS) en Ciencias de la Computación o campos relacionados, respaldado por al menos 12 años de experiencia relevante. Debes tener un sólido trasfondo en ingeniería de software con un profundo entendimiento de sistemas distribuidos a gran escala, preferiblemente dentro de infraestructuras de IA/ML.

Dominio en lenguajes de programación como Python, Go o C++.
Familiaridad con plataformas en la nube como AWS, GCP o Azure.
Experiencia con Docker, Kubernetes, Ansible, Terraform, Prometheus, Grafana y otras herramientas similares.
Un profundo entendimiento de los flujos de trabajo de IA/ML desde el procesamiento de datos hasta el entrenamiento de modelos e inferencia.
Habilidades sólidas de solución de problemas y la capacidad de desarrollar soluciones escalables para sistemas complejos.
Excelentes habilidades de comunicación y colaboración en equipo.

En NVIDIA, ofrecemos un paquete de compensación competitivo que incluye un salario base atractivo que varía de $220,000 a $419,750, reflejando tu experiencia y rol dentro de la empresa. Además, serás elegible para equidad y un paquete de beneficios integral que apoya la salud, bienestar y seguridad financiera.

Nuestro equipo está compuesto por algunos de los profesionales más talentosos del mundo, y estamos experimentando un crecimiento sin precedentes. Si eres un ingeniero creativo y autónomo con una pasión genuina por la tecnología, NVIDIA es tu escenario para brillar.

NVIDIA está comprometida en fomentar un ambiente de trabajo diverso e inclusivo. Estamos orgullosos de ser un empleador que ofrece igualdad de oportunidades y valoramos la diversidad en todas sus formas. No discriminamos en base a ninguna característica legalmente protegida.

Listo para contribuir a nuestro extraordinario equipo en NVIDIA? Aceptamos aplicaciones de manera continua. Aprovecha tus habilidades en un rol donde realmente puedes hacer la diferencia. ¡Aplica hoy!

Título del Puesto: Ingeniero Senior de Infraestructura de IA y ML, Clusters de Investigación
Empresa: NVIDIA
Ubicación: Santa Clara, CA, EE. UU.