PhD Multimodal AI Intern (Fall 24)

Other
San Francisco
06/21/2024
-

Job expired!

Êtes-vous prêt à façonner l'avenir de la technologie du divertissement ? Rejoignez Dolby Laboratories en tant que Stagiaire en IA Multimodale (PhD) et faites partie de notre innovation pionnière dans le divertissement. Notre programme de stage Dolby U offre un travail inédit basé sur des projets dans un environnement collaboratif et créatif, aux côtés de leaders de l'industrie.

Le programme de stage Dolby U est conçu pour amplifier votre curiosité insatiable en mettant en œuvre des solutions réelles qui révolutionnent la communication et le divertissement. Chez Dolby, nous favorisons une culture collégiale avec des projets stimulants, une excellente rémunération et des avantages, y compris une approche de travail flexible pour soutenir quand, où et comment vous donnez le meilleur de vous-même.

Exposition directe à la technologie Dolby révolutionnaire.
Une culture diversifiée, ouverte et accueillante.
Une expérience pratique sur des projets réels.
Des opportunités d’impact : votre travail sera utilisé par des millions de personnes chaque jour.
La possibilité de publier et/ou breveter vos innovations.

Le Groupe de Technologie Avancée (ATG) est la division de recherche de Dolby, chargée de propulser la croissance de Dolby grâce à des insights et des solutions technologiques. Notre équipe de chercheurs se spécialise dans divers domaines, y compris l'IA/ML, les algorithmes, le traitement numérique du signal, l'ingénierie audio, le traitement d'image, la vision par ordinateur, la science des données et l'analyse, les systèmes distribués, l'informatique en nuage, en périphérie et mobile, les réseaux informatiques et l'IoT.

En tant que membre de l'équipe de traitement multimodal, votre rôle consistera à créer de nouveaux algorithmes d'IA utilisant l'audio, la vidéo, le texte ou d'autres modalités d'entrée. Ces algorithmes visent à améliorer les expériences audiovisuelles et à analyser ou traiter intelligemment le contenu, en construisant des technologies innovantes qui révolutionnent le divertissement.

Compétences techniques solides et passion pour la résolution de problèmes.
Forte capacité d'analyse, bonnes compétences en communication et collaboration.
Curiosité pour la manière dont les choses fonctionnent et enthousiasme pour l'audio, la vidéo, les films, la musique ou la technologie des jeux.

Apprentissage automatique multimodal et apprentissage profond.
Apprentissage automatique adversarial.
Modèles de Langage Large Multimodal (LLMs).
Analyse et amélioration du contenu audiovisuel.
Apprentissage de représentations multimodales.
IA générative pour l'audio et la vidéo.

En cours de préparation d'une maîtrise ou d'un doctorat en Intelligence Artificielle, Ingénierie Électrique, Informatique ou dans un domaine connexe.
Expérience dans le développement et la formation d'architectures d'apprentissage profond, en particulier pour les applications audio et/ou vidéo.
Expérience avec les problèmes d'apprentissage de représentations et l'apprentissage automatique adversarial est un plus.
Publications en tant que premier auteur dans des conférences d'IA examinées par des pairs (par ex. CVPR, ICCV, ECCV, NeurIPS, ICML, InterSpeech, ICASSP).
Expérience en programmation Python et utilisation de frameworks tels que PyTorch ou TensorFlow.
Capacité à prototyper rapidement et compétences en pensée critique.
Excellentes compétences en communication et éthique de travail orientée vers l'équipe.

Les candidats doivent actuellement préparer un doctorat en Informatique, en Ingénierie Électrique ou dans un domaine connexe, ou être des diplômés récents dans les six mois suivant l'obtention du diplôme. Le stage est à temps plein, du lundi au vendredi, pendant 3 mois (septembre 2024 – décembre 2024).

Date de début : lundi 23 septembre 2024 (Non