PhD Multimodal AI Intern (Fall 24)

Job expired!

Jesteś gotowy kształtować przyszłość technologii rozrywkowej? Dołącz do Dolby Laboratories jako doktorancki stażysta AI multimodalnej i bądź częścią naszej pionierskiej innowacji w dziedzinie rozrywki. Nasz program stażowy Dolby U oferuje nieporównywalne prace projektowe w współpracującym i kreatywnym środowisku, pracując z liderami branży.

Program stażowy Dolby U został zaprojektowany, aby wzmocnić Twoją nieugaszoną ciekawość poprzez wdrażanie rzeczywistych rozwiązań, które rewolucjonizują sposób komunikowania się i cieszenia się rozrywką. W Dolby pielęgnujemy koleżeńską kulturę z trudnymi projektami, doskonałym wynagrodzeniem i benefitami, w tym elastycznym podejściem do pracy, aby wspierać miejsce, czas i sposób, w jaki wykonujesz swoją najlepszą pracę.

  • Bezpośrednia styczność z przełomową technologią Dolby.
  • Zróżnicowana, otwarta i przyjazna kultura.
  • Praktyczne doświadczenie w pracy nad rzeczywistymi projektami.
  • Możliwości do wprowadzenia znaczących zmian: Twoja praca będzie używana przez miliony ludzi codziennie.
  • Potencjał do publikowania i/lub opatentowania swoich innowacji.

Advanced Technology Group (ATG) to dział badawczy Dolby, którego zadaniem jest dostarczanie wglądów i rozwiązań technologicznych napędzających wzrost Dolby. Nasz zespół badaczy specjalizuje się w różnych dziedzinach, w tym AI/ML, algorytmach, przetwarzaniu sygnałów cyfrowych, inżynierii dźwięku, przetwarzaniu obrazu, komputerowej wizji, data science & analizie, systemach rozproszonych, chmurze, edge & komputerach mobilnych, sieciach komputerowych oraz IoT.

Jako członek zespołu multi-modalnego przetwarzania, Twoją rolą będzie tworzenie nowatorskich algorytmów AI, które wykorzystują dźwięk, wideo, tekst lub inne modalności wejściowe. Te algorytmy mają na celu poprawę doświadczeń audiowizualnych i inteligentne analizowanie lub przetwarzanie treści, budowanie innowacyjnych technologii rewolucjonizujących rozrywkę.

Czego szukamy:

  • Solidnych umiejętności technicznych i pasji do rozwiązywania problemów.
  • Silnych zdolności analitycznych, dobrych umiejętności komunikacyjnych i współpracy.
  • Ciekawości o to, jak działają rzeczy i entuzjazmu do technologii audio, wideo, filmów, muzyki lub gier.

Obszary zainteresowań:

  • Multimodalne uczenie maszynowe i głębokie uczenie.
  • Adversarialne uczenie maszynowe.
  • Multimodalne duże modele językowe (LLM).
  • Analiza i poprawa treści audiowizualnych.
  • Uczenie reprezentacji multimodalnych.
  • Generatywna AI dla dźwięku i wideo.
  • Praca nad uzyskaniem tytułu magistra lub doktoratu w dziedzinie sztucznej inteligencji, inżynierii elektrycznej, informatyki lub pokrewnej.
  • Doświadczenie w rozwijaniu i trenowaniu architektur głębokiego uczenia, szczególnie dla aplikacji audio i/lub wideo.
  • Doświadczenie z problemami uczenia reprezentacji i adwersarialnego uczenia maszynowego jest dodatkowym atutem.
  • Publikacje jako pierwszy autor w recenzowanych konferencjach AI (np.