PhD Multimodal AI Intern

Job expired!

Wejdź w przyszłość innowacji rozrywkowych z transformacyjnym programem stażowym Dolby U. Dolby Laboratories oferuje unikalną okazję do pracy nad wpływowymi, projektowymi zadaniami w kolaboracyjnych i twórczym środowisku, w którym będziesz współpracować z liderami branży. Przyjmij swoją ciekawość i wnies swój wkład w narzędzia realnego świata, które rewolucjonizują globalną komunikację oraz tworzenie, dostarczanie i cieszenie się rozrywką.

W Dolby stażyści korzystają z koleżeńskiej kultury, wymagających projektów oraz doskonałego wynagrodzenia i świadczeń. Ciesz się naszym podejściem Flex Work, zapewniającym prawdziwą elastyczność w tym, gdzie, kiedy i jak wykonujesz swoją najlepszą pracę. Witamy studentów chętnych zdobywać bezcenną wiedzę poprzez znaczący, osobisty wkład, który pomoże projektować przyszłość na przecięciu technologii i rozrywki.

Advanced Technology Group (ATG) to dział badawczy Dolby, skoncentrowany na tworzeniu przełomowych wglądów i innowacyjnych rozwiązań technologicznych napędzających nasz rozwój. Eksperci ATG działają w różnych dziedzinach, w tym AI/ML, algorytmach, cyfrowym przetwarzaniu sygnałów, inżynierii dźwięku, przetwarzaniu obrazu, wizji komputerowej, nauce i analizie danych, systemach rozproszonych, chmurze, edge i mobilnym przetwarzaniu, sieciach komputerowych i IoT.

Jako członek Zespołu Przetwarzania Multimodalnego, będziesz rozwijać nowatorskie algorytmy AI wykorzystując dźwięk, wideo, tekst i inne modalności wejściowe. Twoja praca wzmocni doświadczenia audiowizualne oraz inteligentnie analizować lub przetwarzać treści, rewolucjonizując technologię rozrywki.

  • Bezpośredni kontakt z najnowszą technologią Dolby
  • Zróżnicowana, otwarta i przychylna kultura
  • Praktyczne doświadczenie na rzeczywistych projektach
  • Praca mająca wpływ na miliony osób każdego dnia
  • Możliwość publikowania i/lub patentowania swoich innowacji

Szukamy kandydatów z solidnymi umiejętnościami technicznymi, zdolnościami rozwiązywania problemów i analizy, silnymi umiejętnościami komunikacyjnymi i współpracy oraz pasją do technologii dźwięku, wideo, filmów, muzyki lub gier.

  • Uczenie maszynowe i głębokie uczenie multimodalne
  • Uczenie maszynowe przeciwstawne
  • Multimodalne LLMs
  • Analityka i poprawa treści audiowizualnych
  • Uczenie reprezentacji multimodalnych
  • Generatywna AI dla dźwięku i wideo
  • Aktualnie studiujący na studiach magisterskich lub doktoranckich w dziedzinie sztucznej inteligencji, inżynierii elektrycznej, informatyki lub pokrewnej
  • Doświadczenie w rozwijaniu i szkoleniu architektur głębokiego uczenia
  • Doświadczenie w stosowaniu architektur głębokiego uczenia dla aplikacji audio i/lub wideo
  • Ekspertyza w problemach uczenia reprezentacji
  • Znajomość uczenia maszynowego przeciwstawnego (a plus)
  • Publikacje jako pierwszy autor na recenzowanych konferencjach AI (CVPR, ICCV, ECCV, NeurIPS, ICML, InterSpeech, ICASSP itp.)
  • Biegłość w Pythonie i frameworkach takich jak PyTorch lub TensorFlow