Applied Scientist Intern - Audio Processing & Generative Audio

Job expired!

Flawless AI, відома як "Найбільш обговорювана AI компанія в Голлівуді", революціонує традиційне кіновиробництво за допомогою передових інструментів редагування фільмів на основі генетичної AI. Наша місія полягає в тому, щоб забезпечити кінематографістів найновішими технологіями, які підсилюють креативність, розширюють можливості розповіді історій та забезпечують неперевершений візуальний та емоційний досвід.

Ми шукаємо Інтерна на посаду Прикладного Науковця для приєднання до нашої динамічної команди Аудіо та Графіки. Як інтерн у Flawless AI, ви будете співпрацювати з відданою групою дослідників і науковців світового рівня для вирішення деяких з найскладніших проблем у глибинному навчанні, включаючи:

  • Покращення мовлення
  • Автоматичне розпізнавання мовлення (ASR)
  • Виявлення голосової активності (VAD)
  • Синтез Тексту в Мовлення (TTS)
  • Перетворення голосу (VC)
  • Багатомовне моделювання

Наша робота в області візуального дубляжу - це лише початок. Ми постійно розвиваємо захоплюючі сучасні продукти на базі наших фундаментальних досліджень. Ця стажування є неймовірною можливістю бути на передньому краю революції генеративного AI.

Ключові обов'язки:

  • Допомога дослідникам з передобробкою аудіосигналів
  • Побудова дата-пайплайнів (наприклад, видобування специфічних характеристик)
  • Допомога дослідникам у впровадженні їх роботи у виробництво

Щоб бути розглянутими на цю роль, ви повинні мати наступне:

Вимоги:

  • Навчання на ступінь MS/PhD в галузі аудіодосліджень або суміжних областях
  • Знання лінійної алгебри, обробки сигналів та числової оптимізації
  • Експертиза в глибинних методах навчання для аудіосфери, включаючи ASR, VAD, TTS або SST (переклад усного мовлення)
  • Досвід роботи з техніками обробки аудіосигналів
  • Володіння Python, PyTorch, TensorFlow та Bash скриптами
  • Досвід роботи з обчислювальними платформами, такими як GCP або AWS

Буде перевагою:

  • Навчання на ступінь PhD у галузі технік аудіосинтезу, візуальної обробки або суміжних областях
  • Досвід вирішення аудіопроблем, включаючи застосування глибинного навчання для шумозаглушення, розпізнавання мовлення та виявлення голосової активності
  • Публікації у провідних аудіожурналах (наприклад, Trans. SP, Trans. ASLP) або на конференціях (наприклад, NeurIPS, ICASSP, INTERSPEECH)
  • Досвід впровадження широкомасштабних AI-рішень та SaaS продуктів у промисловості
  • Сильні навички кодування та архітектури програмного забезпечення з Python (або C++) <