Flawless AI, znana jako „Najbardziej komentowana firma AI w Hollywood”, rewolucjonizuje tradycyjne filmowanie dzięki swoim nowatorskim narzędziom do edycji filmów Gen AI. Naszą misją jest wyposażenie twórców filmowych w najnowszą technologię, która zwiększa kreatywność, poszerza możliwości opowiadania historii i dostarcza niezrównanych wrażeń wizualnych i emocjonalnych.
Szukamy Młodszego Naukowca Aplikacyjnego, który dołączy do naszego dynamicznego zespołu Audio i Grafika. Jako stażysta w Flawless AI, będziesz współpracować z oddaną grupą światowej klasy badaczy i naukowców, aby rozwiązywać jedne z najbardziej wymagających problemów w głębokim uczeniu, w tym:
- Polepszanie mowy
- Automatyczne rozpoznawanie mowy (ASR)
- Detekcja aktywności głosu (VAD)
- Synteza mowy (TTS)
- Konwersja głosu (VC)
- Modelowanie wielojęzyczne
Nasza praca nad dubbingiem wizualnym to dopiero początek. Stale rozwijamy ekscytujące, nowatorskie produkty na bazie naszych podstawowych badań. Ten staż to wyjątkowa okazja, aby być na czele rewolucji generatywnej AI.
Główne obowiązki:
- Wsparcie Naukowców Badawczych w przetwarzaniu wstępnym sygnałów audio
- Budowa pipelines danych (np. wyodrębnianie konkretnych cech)
- Wsparcie Naukowców Badawczych w produkcji ich pracy
Kwalifikacje:
Jeśli chcesz kandydować na to stanowisko, powinieneś posiadać następujące umiejętności:
Wymagania:
- Trwający MS/PhD w dziedzinie badań audio lub pokrewnych
- Biegłość w algebrze liniowej, przetwarzaniu sygnałów i optymalizacji numerycznej
- Ekspertyza w technikach głębokiego uczenia dla dziedziny audio, w tym ASR, VAD, TTS lub SST (Speech-to-Speech Translation)
- Doświadczenie z technikami przetwarzania sygnałów audio
- Biegłość w Pythonie, PyTorch, TensorFlow i skryptach Bash
- Doświadczenie z platformami obliczeniowymi, takimi jak GCP lub AWS
Mile widziane:
- Trwający PhD w dziedzinie technik syntezy audio, obliczeń wizualnych lub pokrewnych
- Doświadczenie w rozwiązywaniu problemów audio, w tym zastosowanie głębokiego uczenia do odszumiania, rozpoznawania mowy i detekcji aktywności głosu
- Publikacje w czołowych czasopismach audio (np. Trans. SP, Trans. ASLP) lub na konferencjach (np. NeurIPS, ICASSP, INTERSPEECH)
- Udział w realizacji przemysłowej AI na dużą skalę i produktów SaaS
- Silne umiejętności kodowania i architektury oprogramowania z Pythonem (lub C++)
- Doskonałe umiejętności komunikacyjne do wyrażania skomplikowanych pomysłów i zrozumienia wymagań
Co oferujemy:
W Flawless AI tworzymy środowisko oparte na zaufaniu, autonomii i współpracy. Oto, czego możesz się spodz