Applied Scientist Intern - Audio Processing & Generative Audio

Other
London
06/14/2024
-

Job expired!

Flawless AI, znana jako „Najbardziej komentowana firma AI w Hollywood”, rewolucjonizuje tradycyjne filmowanie dzięki swoim nowatorskim narzędziom do edycji filmów Gen AI. Naszą misją jest wyposażenie twórców filmowych w najnowszą technologię, która zwiększa kreatywność, poszerza możliwości opowiadania historii i dostarcza niezrównanych wrażeń wizualnych i emocjonalnych.

Szukamy Młodszego Naukowca Aplikacyjnego, który dołączy do naszego dynamicznego zespołu Audio i Grafika. Jako stażysta w Flawless AI, będziesz współpracować z oddaną grupą światowej klasy badaczy i naukowców, aby rozwiązywać jedne z najbardziej wymagających problemów w głębokim uczeniu, w tym:

Polepszanie mowy
Automatyczne rozpoznawanie mowy (ASR)
Detekcja aktywności głosu (VAD)
Synteza mowy (TTS)
Konwersja głosu (VC)
Modelowanie wielojęzyczne

Nasza praca nad dubbingiem wizualnym to dopiero początek. Stale rozwijamy ekscytujące, nowatorskie produkty na bazie naszych podstawowych badań. Ten staż to wyjątkowa okazja, aby być na czele rewolucji generatywnej AI.

Główne obowiązki:

Wsparcie Naukowców Badawczych w przetwarzaniu wstępnym sygnałów audio
Budowa pipelines danych (np. wyodrębnianie konkretnych cech)
Wsparcie Naukowców Badawczych w produkcji ich pracy

Kwalifikacje:

Jeśli chcesz kandydować na to stanowisko, powinieneś posiadać następujące umiejętności:

Wymagania:

Trwający MS/PhD w dziedzinie badań audio lub pokrewnych
Biegłość w algebrze liniowej, przetwarzaniu sygnałów i optymalizacji numerycznej
Ekspertyza w technikach głębokiego uczenia dla dziedziny audio, w tym ASR, VAD, TTS lub SST (Speech-to-Speech Translation)
Doświadczenie z technikami przetwarzania sygnałów audio
Biegłość w Pythonie, PyTorch, TensorFlow i skryptach Bash
Doświadczenie z platformami obliczeniowymi, takimi jak GCP lub AWS

Mile widziane:

Trwający PhD w dziedzinie technik syntezy audio, obliczeń wizualnych lub pokrewnych
Doświadczenie w rozwiązywaniu problemów audio, w tym zastosowanie głębokiego uczenia do odszumiania, rozpoznawania mowy i detekcji aktywności głosu
Publikacje w czołowych czasopismach audio (np. Trans. SP, Trans. ASLP) lub na konferencjach (np. NeurIPS, ICASSP, INTERSPEECH)
Udział w realizacji przemysłowej AI na dużą skalę i produktów SaaS
Silne umiejętności kodowania i architektury oprogramowania z Pythonem (lub C++)
Doskonałe umiejętności komunikacyjne do wyrażania skomplikowanych pomysłów i zrozumienia wymagań

Co oferujemy:

W Flawless AI tworzymy środowisko oparte na zaufaniu, autonomii i współpracy. Oto, czego możesz się spodz