Russian
- English
- Spanish
- French
- Ukrainian
- Polish
- Japanese
- Egyptian

Research Scientist, GenAI - Multimodal Audio (Speech, Sound and Music)

Other
New York
06/12/2024
-

Job expired!

В Meta наша организация GenAI является пионером в разработке передовых крупных языковых моделей (LLM) и мультимодальных моделей генерации. Наша миссия - постоянно поднимать планку для открытых фундаментальных моделей, давая толчок широкому спектру продуктов Meta и устанавливая стандарты индустрии. В настоящее время мы ищем динамичного научного сотрудника для работы над мультимодальным аудио в нашей команде GenAI, улучшая платформы за счет инноваций в области речи, звука и музыки.

В качестве научного сотрудника вы будете активно участвовать в полном жизненном цикле исследований мультимодальных моделей генерации с акцентом на аудио. Ваши задачи будут включать в себя:

Концептуализацию и инициацию идей и доведение их до завершения.
Проектирование, реализацию и улучшение моделей и алгоритмов.
Управление сбором и отбором обучающих данных, а также обучением/настройкой/масштабированием моделей.
Оценку производительности, вклад в усилия по официальной публикации исходного кода и публикацию результатов.
Бесперебойное взаимодействие с командами исследований языка и зрения для повышения общих целей и результатов.

Степень бакалавра в области компьютерных наук, компьютерной инженерии или в тесно связанной технической области.
Доказанный опыт исследований в таких областях, как аудио или видение, подтвержденный публикациями или значительным промышленным опытом.
Предпочтение отдается кандидатам со степенью доктора философии с более чем 3 годами опыта или бакалавру с не менее чем 5 годами промышленного исследовательского опыта в соответствующих областях.
Экспертные знания в области нейронных сетей, владение фреймворками машинного обучения, такими как Pytorch, Tensorflow, или JAX.
Высокие навыки программирования на Python и сильные коммуникативные способности.

Значительное количество публикаций в связанных сферах аудио и визуальных технологий.
Опыт курации аудиодатасетов, масштабирования моделей и оценки моделей генерации аудио.
Способность работать с большими объемами данных и решать сложные проблемы, требующие межфункци