Machine Learning Engineer - Inference (Accelerated AI)

Job expired!

Together AI está buscando activamente un talentoso Ingeniero de Aprendizaje Automático para unirse a nuestro dinámico equipo de Motor de Inferencia. Este rol crítico se enfoca en optimizar y mejorar el rendimiento de nuestros sistemas de inferencia de IA, aprovechando modelos de lenguaje de última generación para garantizar eficiencia y escalabilidad.

Si te apasiona la inferencia de IA, eres competente en PyTorch y estás capacitado en el desarrollo de sistemas de alto rendimiento, queremos conocerte. Esta posición ofrece una oportunidad excepcional para colaborar con investigadores y ingenieros líderes en IA en la creación de soluciones de IA de vanguardia. ¡Ven a dar forma al futuro de la IA con Together AI!

  • Diseñar y desarrollar sistemas de producción avanzados que impulsen el motor de inferencia de Together AI, asegurando fiabilidad y rendimiento a gran escala.
  • Optimizar los servicios de inferencia en tiempo de ejecución para aplicaciones extensas de IA.
  • Colaborar con investigadores, ingenieros, gestores de producto y diseñadores para introducir nuevas funciones y capacidades de investigación.
  • Realizar revisiones exhaustivas de diseño y código para mantener los más altos estándares de calidad.
  • Crear servicios, herramientas y documentación completa para desarrolladores que respalden el motor de inferencia.
  • Implementar sistemas robustos y tolerantes a fallos para la ingesta y procesamiento de datos.
  • Un mínimo de 3 años de experiencia escribiendo código de alta calidad, bien probado y de producción.
  • Competencia en Python y PyTorch.
  • Experiencia demostrada en la construcción de bibliotecas y herramientas de alto rendimiento.
  • Comprensión excepcional de conceptos de sistemas operativos de bajo nivel, incluyendo multiprocesamiento, gestión de memoria, redes, almacenamiento, rendimiento y escalabilidad.
  • Conocimiento de sistemas de inferencia de IA existentes como TGI, vLLM, TensorRT-LLM, Optimum.
  • Familiaridad con técnicas de inferencia de IA, como la decodificación especulativa.
  • Experiencia con programación CUDA/Triton.
  • Agradable tener: Familiaridad con Rust, Cython, y compiladores.

Together AI es una empresa pionera en inteligencia artificial impulsada por la investigación. Estamos comprometidos con sistemas de IA abiertos y transparentes que impulsen la innovación y generen los mejores resultados para la sociedad. Nuestra misión es reducir significativamente el costo de los sistemas de IA modernos a través del diseño conjunto de software, hardware, algoritmos y modelos.

Hemos contribuido a la investigación, modelos y conjuntos de datos de código abierto líderes para avanzar en la frontera de la IA. Nuestro equipo ha sido instrumental en avances tecnológicos como FlashAttention, Hyena, FlexGen, y RedPajama. Únete a nuestro apasionado grupo de investigadores e ingenieros en nuestro viaje para construir la infraestructura de IA de próxima generación.

Ofrecemos un paquete de compensación competitivo, que incluye acciones en la empresa, seguro médico y otros beneficios impresionantes. El rango salarial base en los EE. UU. para esta posición a tiempo completo es de $160,000 - $220,000, más acciones y beneficios. Nuestros rangos salariales se determinan según la ubicación, el nivel y el rol, con una compensación individual basada en la experiencia, habilidades y conocimientos relacionados con el trabajo.

Together AI se enorgullece de ser un Empleador de Igualdad de Oportunidades, ofreciendo oportunidades de empleo iguales a todos, independientemente de raza, color, ascendencia, religión, sexo, origen nacional, orientación sexual, edad, ciudadanía, estado civil, discapacidad, identidad de género, estado de veterano, y más.