Стажировка: Иерархическое обучение с подкреплением для роботизированной манипуляции

  • Internship
Job expired!
MERL ищет высокомотивированного человека для работы над долгосрочным планированием и принятием решений для робототехнической манипуляции, используя большие языковые модели (LLM) и иерархическое обучение с подкреплением. Исследование будет включать разработку инновационных алгоритмов для долгосрочного планирования и выполнения задач с использованием иерархического обучения с подкреплением и LLM. Идеальный кандидат должен иметь опыт в одной или нескольких из следующих областей: (Глубокое) обучение с подкреплением, иерархическое RL, LLM, оптимизация политики, Марковские процессы принятия решений (MPD). Приглашены претенденты из числа старших аспирантов, специализирующихся на машинном обучении и инженерии с акцентом на обучение с подкреплением и робототехнику. Необходим предыдущий опыт работы с физическими движками вроде Mujoco, Isaac Gym и т.д. Требуется опыт работы с Python и ROS. Успешная стажировка приведет к подаче результатов на рецензируемые конференции и журналы. Необходимы хорошие навыки программирования на Python и опыт работы в высококлассных средах RL (например, RL Bench). Ожидается, что стажировка продлится 3-4 месяца с гибкими датами начала. Предпочтительно стажировка проходит на месте в MERL. Области исследований: Искусственный интеллект, Машинное обучение, Робототехника Контакт: Девеш Джа Mitsubishi Electric Research Labs, Inc. "MERL" является работодателем, предоставляющим равные возможности. Все сотрудники и заявители на работу рассматриваются без учета расы, цвета кожи, религии, пола, национального происхождения, возраста, инвалидности или генетики. Помимо соответствия требованиям федерального законодательства, MERL также соблюдает применимые законы штата и местного самоуправления, регулирующие нетерпимость в трудовых отношениях. Эта политика охватывает все условия труда, включая найм, трудоустройство, повышение в должности, увольнение, сокращение штата, перевод, отпуска, заработную плату и обучение. Более того, любая форма домогательства на рабочем месте запрещена в MERL на основании расы, цвета кожи, религии, пола, сексуальной ориентации, гендерной идентичности или выражения, национального происхождения, возраста, генетической информации, инвалидности или статуса ветерана. Любые неуместные затруднения MERL в исполнении обязанностей его сотрудниками могут привести к дисциплинарной ответственности, вплоть до увольнения. Работа в MERL требует полного допуска к работе в США и доступа к технологиям, программному обеспечению и другой информации, подлежащей государственным ограничениям доступа, из-за требований по контролю экспорта. Работа обусловлена продолжением полного допуска к работе в США и возможностью получения государственного разрешения на выдачу этих предметов, что может потребовать получения лицензии на экспорт или другой документации. MERL может отложить начало работы, отказать в предложении работы, прекратить работу и/или изменить обязанности на работе, заработную плату, льготы и/или доступ к учреждениям и информационным системам MERL, по своему усмотрению, чтобы обеспечить практичное соблюдение трудового законодательства и ограничений государственного доступа.