Stage : Apprentissage par renforcement hiérarchique pour la manipulation robotique

  • Internship
Job expired!

MERL recherche un individu hautement motivé pour travailler sur la planification à long terme et la prise de décision pour la manipulation robotique en utilisant de grands modèles langagiers (LLM) et le RL hiérarchique. La recherche développera des algorithmes innovants pour la planification et l'exécution de tâches à long terme en utilisant l'apprentissage par renforcement hiérarchique et les LLM. Le candidat idéal devrait avoir de l'expérience dans l'un ou plusieurs des sujets suivants : l'apprentissage par renforcement (en profondeur), le RL hiérarchique, les LLM, l'optimisation des politiques et les processus de décision de Markov (MDP). Les étudiants en doctorat senior en apprentissage automatique et en génie avec une spécialisation en apprentissage par renforcement et en robotique sont encouragés à postuler. Une expérience préalable de travail avec des moteurs physiques comme Mujoco, Isaac Gym, etc. est nécessaire. Une expérience préalable de travail avec Python et ROS est nécessaire. Un stage réussi se traduira par la soumission des résultats à des conférences et des revues évaluées par des pairs. De bonnes compétences en programmation Python et dans des environnements RL de pointe (par exemple, RL Bench) sont nécessaires. La durée prévue du stage est de 3 à 4 mois avec des dates de début flexibles. Ce stage est préférablement à réaliser sur place chez MERL.

Domaines de recherche : Intelligence Artificielle, Apprentissage Automatique, Robotique

Contact : Devesh Jha

Mitsubishi Electric Research Labs, Inc. "MERL" offre des opportunités d'emploi égales (EEO) à tous les employés et candidats à l'emploi sans distinction de race, de couleur, de religion, de sexe, d'origine nationale, d'âge, de handicap ou de génétique. En plus des exigences légales fédérales, MERL se conforme aux lois locales et de l'État applicables régissant la non-discrimination en matière d'emploi dans chaque emplacement où l'entreprise a des installations. Cette politique s'applique à tous les termes et conditions de l'emploi, y compris le recrutement, l'embauche, le placement, la promotion, la résiliation, la mise à pied, le rappel, le transfert, les absences, la rémunération et la formation.

MERL interdit expressément toute forme de harcèlement au travail basé sur la race, la couleur, la religion, le sexe, l'orientation sexuelle, l'identité ou l'expression de genre, l'origine nationale, l'âge, l'information génétique, le handicap, ou le statut de vétéran. Une interférence inappropriée avec la capacité des employés de MERL à accomplir leur travail peut entraîner une discipline allant jusqu'à leur licenciement.

Travailler à MERL nécessite une autorisation complète de travail aux États-Unis et l'accès à la technologie, aux logiciels et à d'autres informations sujets à des restrictions d'accès gouvernementales, en raison des contrôles à l'exportation. L'emploi est conditionné à une autorisation continue de travail aux États-Unis et à la disponibilité d'une autorisation gouvernementale pour la libération de ces éléments, qui pourrait inclure sans limitation, l'obtention d'une licence d'exportation ou d'autres documentations. MERL peut retarder le début du travail, révoquer une offre de travail, mettre fin à l'emploi, et/ou modifier les responsabilités du poste, la rémunération, les bénéfices, et/ou l'accès aux installations et systèmes d'information de MERL, comme MERL l'estime approprié, pour assurer le respect pratique des lois d'emploi en vigueur et des restrictions d'accès du gouvernement.