PhD Multimodal AI Intern (Fall 24)

Job expired!

¿Estás listo para moldear el futuro de la tecnología del entretenimiento? Únete a Dolby Laboratories como Pasante de IA Multimodal para PhD y sé parte de nuestra innovación pionera en entretenimiento. Nuestro programa de pasantías Dolby U ofrece un trabajo basado en proyectos incomparables en un ambiente colaborativo y creativo, trabajando junto a líderes de la industria.

El programa de pasantías Dolby U está diseñado para amplificar tu insaciable curiosidad implementando soluciones del mundo real que revolucionan cómo las personas se comunican y disfrutan del entretenimiento. En Dolby, fomentamos una cultura colegiada con proyectos desafiantes, excelente compensación, y beneficios, incluyendo un enfoque de trabajo flexible para apoyar dónde, cuándo y cómo haces tu mejor trabajo.

  • Exposición de primera mano a la tecnología Dolby innovadora.
  • Una cultura diversa, abierta y acogedora.
  • Experiencia práctica trabajando en proyectos del mundo real.
  • Oportunidades para tener un impacto: tu trabajo será utilizado por millones de personas diariamente.
  • El potencial para publicar y/o patentar tus innovaciones.

El Grupo de Tecnología Avanzada (ATG) es la división de investigación de Dolby, encargada de impulsar ideas y soluciones tecnológicas para propulsar el crecimiento de Dolby. Nuestro equipo de investigadores se especializa en diversos campos incluyendo IA/ML, algoritmos, procesamiento de señales digitales, ingeniería de audio, procesamiento de imágenes, visión por computadora, ciencia de datos y análisis, sistemas distribuidos, computación en la nube, computación en el borde y móvil, redes informáticas e IoT.

Como miembro del Equipo de Procesamiento Multimodal, tu rol implicará crear algoritmos novedosos de IA que utilicen audio, video, texto u otras modalidades de entrada. Estos algoritmos están destinados a mejorar las experiencias audiovisuales y analizar o procesar contenido de manera inteligente, construyendo tecnologías innovadoras que revolucionan el entretenimiento.

Lo Que Buscamos:

  • Sólidas habilidades técnicas y una pasión por resolver problemas.
  • Fuertes habilidades analíticas, buena comunicación y habilidades de colaboración.
  • Curiosidad sobre cómo funcionan las cosas y entusiasmo por la tecnología de audio, video, películas, música o juegos.

Áreas de Enfoque:

  • Aprendizaje automático multimodal y aprendizaje profundo.
  • Aprendizaje automático adversarial.
  • Modelos de Lenguaje Grande Multimodal (LLM).
  • Análisis y mejora de contenido audiovisual.
  • Aprendizaje de representación multimodal.
  • IA generativa para audio y video.
  • Trabajando hacia un título de Máster o Ph.D. en Inteligencia Artificial, Ingeniería Eléctrica, Ciencias de la Computación, o un campo relacionado.
  • Experiencia desarrollando y entrenando arquitecturas de aprendizaje profundo, particularmente para aplicaciones de audio y/o video.
  • Experiencia con problemas de aprendizaje de representación y aprendizaje automático adversarial es una ventaja.
  • Publicaciones como primer autor en conferencias de IA revisadas por pares (ej. CVPR, ICCV, ECCV, NeurIPS, ICML, InterSpeech, ICASSP).
  • Experiencia en programación en Python y trabajando con frameworks como PyTorch o TensorFlow.
  • Capacidad para prototipar rápidamente y sólidas habilidades de pensamiento crítico.
  • Excelentes habilidades de comunicación y una ética de trabajo orientada al equipo.

Los solicitantes deben estar actualmente trabajando hacia un título de Ph.D. en Ciencias de la Computación, Ingeniería Eléctrica, o un campo relacionado, o ser graduados recientes dentro de los seis meses posteriores a la graduación. La pasantía es a tiempo completo, de lunes a viernes, durante 3 meses (septiembre 2024 – diciembre 2024).

Fecha de inicio: lunes, 23 de septiembre de 2024 (No flexible)

El rango de salario base por hora en el área de San Francisco/Bay para esta posición de pasantía es de $44-