Research Scientist, GenAI - Multimodal Audio (Speech, Sound and Music)

Job expired!

У Meta, наша організація GenAI піонер у розробці передових великих мовних моделей (LLM) та багатомодальних генеративних базових моделей. Наша місія - постійно підвищувати планку для моделей відкритого джерела, що живлять широкий спектр продуктів Meta та встановлюють стандарти індустрії. Ми зараз шукаємо динамічного наукового співробітника для зосередження на багатомодальному аудіо в нашій команді GenAI, підвищуючи платформи інноваціями в мові, звуку та музиці.

Як науковий співробітник, ви будете глибоко залучені в повний життєвий цикл досліджень навколо багатомодальних генеративних базових моделей, орієнтованих на аудіо модальність. Ваша роль буде включати:

  • Концептуалізацію та ініціацію ідей та виведення їх до завершення.
  • Проектування, реалізація та вдосконалення моделей та алгоритмів.
  • Управління збором та вибором тренувальних даних та тренування/налаштування/масштабування моделей.
  • Оцінка продуктивності, внесок в зусилля з відкритим кодом і публікація результатів.
  • Безперебійна співпраця з командами досліджень мови та зору для покращення спільних цілей та результатів.
  • Диплом бакалавра в галузі комп'ютерних наук, комп'ютерної інженерії або тісно пов'язаної технічної спеціальності.
  • Перевірений досвід досліджень у таких сферах, як аудіо або зір, що підтверджується публікаціями або значним промисловим досвідом.
  • Вищі ступені вітаються, такі як PhD з досвідом роботи 3+ років або бакалавр з щонайменше 5 роками досвіду промислових досліджень у відповідних областях.
  • Експертиза в нейронних мережах з вмінням роботи в ML фреймворках, таких як Pytorch, Tensorflow, або JAX.
  • Сильні навички програмування в Python і