Research Scientist, GenAI - Multimodal Audio (Speech, Sound and Music)

Job expired!

В Meta наша организация GenAI является пионером в разработке передовых крупных языковых моделей (LLM) и мультимодальных моделей генерации. Наша миссия - постоянно поднимать планку для открытых фундаментальных моделей, давая толчок широкому спектру продуктов Meta и устанавливая стандарты индустрии. В настоящее время мы ищем динамичного научного сотрудника для работы над мультимодальным аудио в нашей команде GenAI, улучшая платформы за счет инноваций в области речи, звука и музыки.

В качестве научного сотрудника вы будете активно участвовать в полном жизненном цикле исследований мультимодальных моделей генерации с акцентом на аудио. Ваши задачи будут включать в себя:

  • Концептуализацию и инициацию идей и доведение их до завершения.
  • Проектирование, реализацию и улучшение моделей и алгоритмов.
  • Управление сбором и отбором обучающих данных, а также обучением/настройкой/масштабированием моделей.
  • Оценку производительности, вклад в усилия по официальной публикации исходного кода и публикацию результатов.
  • Бесперебойное взаимодействие с командами исследований языка и зрения для повышения общих целей и результатов.
  • Степень бакалавра в области компьютерных наук, компьютерной инженерии или в тесно связанной технической области.
  • Доказанный опыт исследований в таких областях, как аудио или видение, подтвержденный публикациями или значительным промышленным опытом.
  • Предпочтение отдается кандидатам со степенью доктора философии с более чем 3 годами опыта или бакалавру с не менее чем 5 годами промышленного исследовательского опыта в соответствующих областях.
  • Экспертные знания в области нейронных сетей, владение фреймворками машинного обучения, такими как Pytorch, Tensorflow, или JAX.
  • Высокие навыки программирования на Python и сильные коммуникативные способности.
  • Значительное количество публикаций в связанных сферах аудио и визуальных технологий.
  • Опыт курации аудиодатасетов, масштабирования моделей и оценки моделей генерации аудио.
  • Способность работать с большими объемами данных и решать сложные проблемы, требующие межфункци