PhD Multimodal AI Intern

Other
San Francisco
06/29/2024
-

Job expired!

Wejdź w przyszłość innowacji rozrywkowych z transformacyjnym programem stażowym Dolby U. Dolby Laboratories oferuje unikalną okazję do pracy nad wpływowymi, projektowymi zadaniami w kolaboracyjnych i twórczym środowisku, w którym będziesz współpracować z liderami branży. Przyjmij swoją ciekawość i wnies swój wkład w narzędzia realnego świata, które rewolucjonizują globalną komunikację oraz tworzenie, dostarczanie i cieszenie się rozrywką.

W Dolby stażyści korzystają z koleżeńskiej kultury, wymagających projektów oraz doskonałego wynagrodzenia i świadczeń. Ciesz się naszym podejściem Flex Work, zapewniającym prawdziwą elastyczność w tym, gdzie, kiedy i jak wykonujesz swoją najlepszą pracę. Witamy studentów chętnych zdobywać bezcenną wiedzę poprzez znaczący, osobisty wkład, który pomoże projektować przyszłość na przecięciu technologii i rozrywki.

Advanced Technology Group (ATG) to dział badawczy Dolby, skoncentrowany na tworzeniu przełomowych wglądów i innowacyjnych rozwiązań technologicznych napędzających nasz rozwój. Eksperci ATG działają w różnych dziedzinach, w tym AI/ML, algorytmach, cyfrowym przetwarzaniu sygnałów, inżynierii dźwięku, przetwarzaniu obrazu, wizji komputerowej, nauce i analizie danych, systemach rozproszonych, chmurze, edge i mobilnym przetwarzaniu, sieciach komputerowych i IoT.

Jako członek Zespołu Przetwarzania Multimodalnego, będziesz rozwijać nowatorskie algorytmy AI wykorzystując dźwięk, wideo, tekst i inne modalności wejściowe. Twoja praca wzmocni doświadczenia audiowizualne oraz inteligentnie analizować lub przetwarzać treści, rewolucjonizując technologię rozrywki.

Bezpośredni kontakt z najnowszą technologią Dolby
Zróżnicowana, otwarta i przychylna kultura
Praktyczne doświadczenie na rzeczywistych projektach
Praca mająca wpływ na miliony osób każdego dnia
Możliwość publikowania i/lub patentowania swoich innowacji

Szukamy kandydatów z solidnymi umiejętnościami technicznymi, zdolnościami rozwiązywania problemów i analizy, silnymi umiejętnościami komunikacyjnymi i współpracy oraz pasją do technologii dźwięku, wideo, filmów, muzyki lub gier.

Uczenie maszynowe i głębokie uczenie multimodalne
Uczenie maszynowe przeciwstawne
Multimodalne LLMs
Analityka i poprawa treści audiowizualnych
Uczenie reprezentacji multimodalnych
Generatywna AI dla dźwięku i wideo

Aktualnie studiujący na studiach magisterskich lub doktoranckich w dziedzinie sztucznej inteligencji, inżynierii elektrycznej, informatyki lub pokrewnej
Doświadczenie w rozwijaniu i szkoleniu architektur głębokiego uczenia
Doświadczenie w stosowaniu architektur głębokiego uczenia dla aplikacji audio i/lub wideo
Ekspertyza w problemach uczenia reprezentacji
Znajomość uczenia maszynowego przeciwstawnego (a plus)
Publikacje jako pierwszy autor na recenzowanych konferencjach AI (CVPR, ICCV, ECCV, NeurIPS, ICML, InterSpeech, ICASSP itp.)
Biegłość w Pythonie i frameworkach takich jak PyTorch lub TensorFlow