Research Scientist/Research Engineer II (Speech Recognition)

Job expired!

Nombre del puesto: Científico de Investigación/Ingeniero de Investigación II (Reconocimiento de Voz)

Ubicación: Universidad Tecnológica de Nanyang (NTU), Un Laboratorio Corporativo

Únete a nuestro equipo innovador en Un Laboratorio Corporativo dentro de la NTU como Científico de Investigación o Ingeniero de Investigación II. Este rol se centra en el desarrollo pionero de algoritmos para el Reconocimiento Automático del Habla (ASR) utilizando modelos de lenguaje amplios. El candidato exitoso contribuirá a investigaciones revolucionarias que conducen a publicaciones y patentes, impulsadas por la misión de avanzar los límites en tecnologías de habla y lenguaje para aplicaciones de IA.

  • Investigar y desarrollar tecnologías avanzadas de reconocimiento del habla integrando modelos de lenguaje amplios.
  • Liderar los procesos de entrenamiento y evaluación de modelos para tareas de ASR, asegurando consistencia e innovación en cada paso.
  • Comunicar efectivamente los resultados a los supervisores del equipo y los interesados del proyecto, y proponer soluciones innovadoras para mejorar los resultados del proyecto.
  • Organizar y gestionar la preparación de datos de habla y texto para el entrenamiento en marcos de trabajo de vanguardia como Huggingface y Whisper.
  • Documentar hallazgos y transferir modelos avanzados al equipo de ingeniería para su posterior desarrollo y aplicación.
  • Publicar hallazgos de investigación en conferencias y revistas de alto impacto dentro del campo.
  • Colaborar con el equipo de ingeniería para desarrollar sistemas de demostración que muestren las aplicaciones prácticas de su investigación.
  • Gestionar recursos computacionales para apoyar experimentos de investigación extensivos.
  • Doctorado o Maestría en Ciencias de la Computación/Ingeniería o un campo relacionado.
  • Experiencia comprobada con modelos de lenguaje amplios, procesamiento de datos de habla y texto, y entrenamiento de modelos de aprendizaje profundo.
  • Competencia en lenguajes de programación como Python, Pytorch, C/C++, y Linux Bash/Shell.
  • Experiencia con marcos de procesamiento de habla conocidos como ESPnet, Wenet, Whisper, y Kaldi.
  • Comprensión profunda de aprendizaje profundo, transformadores y tecnologías ASR de extremo a extremo.
  • La experiencia en el manejo de sistemas ASR diseñados para inglés con acento y/o el habla de niños es altamente deseable.
  • Publicaciones previas en conferencias de procesamiento de habla prestigiosas como Interspeech, ICASSP se considerarán una ventaja.

Lamentamos que solo los candidatos preseleccionados serán notificados.

La Universidad Tecnológica de Nanyang está a la vanguardia de la excelencia educativa e investigación interdisciplinaria en IA, fomentando un entorno que impulsa las fronteras de la innovación. Al unirte a nuestro equipo, serás parte de una comunidad que prospera en la creatividad y el impacto.

¿Listo para contribuir a la investigación de vanguardia en reconocimiento del habla en IA? ¡Aplica hoy para formar parte de nuestro dinámico equipo en NTU!