PhD Multimodal AI Intern (Fall 24)

Other
San Francisco
06/21/2024
-

Job expired!

Jesteś gotowy kształtować przyszłość technologii rozrywkowej? Dołącz do Dolby Laboratories jako doktorancki stażysta AI multimodalnej i bądź częścią naszej pionierskiej innowacji w dziedzinie rozrywki. Nasz program stażowy Dolby U oferuje nieporównywalne prace projektowe w współpracującym i kreatywnym środowisku, pracując z liderami branży.

Program stażowy Dolby U został zaprojektowany, aby wzmocnić Twoją nieugaszoną ciekawość poprzez wdrażanie rzeczywistych rozwiązań, które rewolucjonizują sposób komunikowania się i cieszenia się rozrywką. W Dolby pielęgnujemy koleżeńską kulturę z trudnymi projektami, doskonałym wynagrodzeniem i benefitami, w tym elastycznym podejściem do pracy, aby wspierać miejsce, czas i sposób, w jaki wykonujesz swoją najlepszą pracę.

Bezpośrednia styczność z przełomową technologią Dolby.
Zróżnicowana, otwarta i przyjazna kultura.
Praktyczne doświadczenie w pracy nad rzeczywistymi projektami.
Możliwości do wprowadzenia znaczących zmian: Twoja praca będzie używana przez miliony ludzi codziennie.
Potencjał do publikowania i/lub opatentowania swoich innowacji.

Advanced Technology Group (ATG) to dział badawczy Dolby, którego zadaniem jest dostarczanie wglądów i rozwiązań technologicznych napędzających wzrost Dolby. Nasz zespół badaczy specjalizuje się w różnych dziedzinach, w tym AI/ML, algorytmach, przetwarzaniu sygnałów cyfrowych, inżynierii dźwięku, przetwarzaniu obrazu, komputerowej wizji, data science & analizie, systemach rozproszonych, chmurze, edge & komputerach mobilnych, sieciach komputerowych oraz IoT.

Jako członek zespołu multi-modalnego przetwarzania, Twoją rolą będzie tworzenie nowatorskich algorytmów AI, które wykorzystują dźwięk, wideo, tekst lub inne modalności wejściowe. Te algorytmy mają na celu poprawę doświadczeń audiowizualnych i inteligentne analizowanie lub przetwarzanie treści, budowanie innowacyjnych technologii rewolucjonizujących rozrywkę.

Czego szukamy:

Solidnych umiejętności technicznych i pasji do rozwiązywania problemów.
Silnych zdolności analitycznych, dobrych umiejętności komunikacyjnych i współpracy.
Ciekawości o to, jak działają rzeczy i entuzjazmu do technologii audio, wideo, filmów, muzyki lub gier.

Obszary zainteresowań:

Multimodalne uczenie maszynowe i głębokie uczenie.
Adversarialne uczenie maszynowe.
Multimodalne duże modele językowe (LLM).
Analiza i poprawa treści audiowizualnych.
Uczenie reprezentacji multimodalnych.
Generatywna AI dla dźwięku i wideo.

Praca nad uzyskaniem tytułu magistra lub doktoratu w dziedzinie sztucznej inteligencji, inżynierii elektrycznej, informatyki lub pokrewnej.
Doświadczenie w rozwijaniu i trenowaniu architektur głębokiego uczenia, szczególnie dla aplikacji audio i/lub wideo.
Doświadczenie z problemami uczenia reprezentacji i adwersarialnego uczenia maszynowego jest dodatkowym atutem.
Publikacje jako pierwszy autor w recenzowanych konferencjach AI (np.