Prácticas: Aprendizaje por Refuerzo Jerárquico para Manipulación Robótica

  • Internship
Job expired!

MERL está buscando a una persona altamente motivada para trabajar en la planificación a largo plazo y la toma de decisiones para la manipulación robótica utilizando grandes modelos de lenguaje (LLM) y RL Jerárquico. La investigación desarrollará algoritmos novedosos para la planificación de tareas a largo plazo y la ejecución utilizando aprendizaje por refuerzo jerárquico y LLM. El candidato ideal debería tener experiencia en uno o varios de los siguientes temas: Aprendizaje por refuerzo (profundo), RL Jerárquico, LLM, optimización de políticas y Procesos de Decisión de Markov (MDP). Se anima a los estudiantes de doctorado senior en aprendizaje automático e ingeniería con un enfoque en el aprendizaje por refuerzo y la robótica a aplicar. Se requiere experiencia previa trabajando con motores de física como Mujoco, Isaac Gym, etc. También se requiere experiencia previa trabajando con Python y ROS. Una pasantía exitosa resultará en la presentación de los resultados a conferencias y revistas revisadas por pares. Se requieren buenas habilidades de codificación en Python y entornos de RL de vanguardia (por ejemplo, RL Bench). La duración esperada de la pasantía es de 3-4 meses con fechas de inicio flexibles. Se prefiere que esta pasantía sea presencial en MERL.

Áreas de investigación: Inteligencia Artificial, Aprendizaje Automático, Robótica

Contacto: Devesh Jha

Mitsubishi Electric Research Labs, Inc. "MERL" ofrece oportunidades de empleo equitativas (EEO) a todos los empleados y solicitantes de empleo sin distinciones de raza, color, religión, sexo, origen nacional, edad, discapacidad o genética. Además de los requisitos de la ley federal, MERL cumple con las leyes estatales y locales aplicables que prohíben la discriminación en el empleo en cada ubicación en la que la empresa tiene instalaciones. Esta política se aplica a todos los términos y condiciones de empleo, incluyendo la contratación, colocación, promoción, terminación, cesantía, reincorporación, transferencia, permisos de ausencia, compensación y formación.

MERL prohíbe expresamente cualquier forma de acoso laboral basada en raza, color, religión, género, orientación sexual, identidad o expresión de género, origen nacional, edad, información genética, discapacidad o condición de veterano. La interferencia indebida con la capacidad de los empleados de MERL para realizar sus tareas laborales puede resultar en una disciplina hasta e incluyendo la terminación.

Trabajar en MERL requiere una autorización completa para trabajar en los EE.UU y acceso a tecnología, software y otra información que está sujeta a restricciones de control de acceso gubernamentales, debido a los controles de exportación. El empleo está condicionado a la continua autorización completa para trabajar en los EE.UU y la disponibilidad de autorización gubernamental para la liberación de estos elementos, que podría incluir, sin limitación, obtener una licencia de exportación u otra documentación. MERL puede retrasar el inicio del empleo, rescindir una oferta de empleo, terminar el empleo y/o modificar las responsabilidades laborales, compensación, beneficios y/o acceso a las instalaciones y sistemas de información de MERL, según lo considere apropiado, para asegurar el cumplimiento práctico con las leyes de empleo aplicable y las restricciones de control de acceso del gobierno.