Research Scientist/Research Engineer II (Speech Recognition)

Other
Other places
06/12/2024
-

Job expired!

Nombre del puesto: Científico de Investigación/Ingeniero de Investigación II (Reconocimiento de Voz)

Ubicación: Universidad Tecnológica de Nanyang (NTU), Un Laboratorio Corporativo

Únete a nuestro equipo innovador en Un Laboratorio Corporativo dentro de la NTU como Científico de Investigación o Ingeniero de Investigación II. Este rol se centra en el desarrollo pionero de algoritmos para el Reconocimiento Automático del Habla (ASR) utilizando modelos de lenguaje amplios. El candidato exitoso contribuirá a investigaciones revolucionarias que conducen a publicaciones y patentes, impulsadas por la misión de avanzar los límites en tecnologías de habla y lenguaje para aplicaciones de IA.

Investigar y desarrollar tecnologías avanzadas de reconocimiento del habla integrando modelos de lenguaje amplios.
Liderar los procesos de entrenamiento y evaluación de modelos para tareas de ASR, asegurando consistencia e innovación en cada paso.
Comunicar efectivamente los resultados a los supervisores del equipo y los interesados del proyecto, y proponer soluciones innovadoras para mejorar los resultados del proyecto.
Organizar y gestionar la preparación de datos de habla y texto para el entrenamiento en marcos de trabajo de vanguardia como Huggingface y Whisper.
Documentar hallazgos y transferir modelos avanzados al equipo de ingeniería para su posterior desarrollo y aplicación.
Publicar hallazgos de investigación en conferencias y revistas de alto impacto dentro del campo.
Colaborar con el equipo de ingeniería para desarrollar sistemas de demostración que muestren las aplicaciones prácticas de su investigación.
Gestionar recursos computacionales para apoyar experimentos de investigación extensivos.

Doctorado o Maestría en Ciencias de la Computación/Ingeniería o un campo relacionado.
Experiencia comprobada con modelos de lenguaje amplios, procesamiento de datos de habla y texto, y entrenamiento de modelos de aprendizaje profundo.
Competencia en lenguajes de programación como Python, Pytorch, C/C++, y Linux Bash/Shell.
Experiencia con marcos de procesamiento de habla conocidos como ESPnet, Wenet, Whisper, y Kaldi.
Comprensión profunda de aprendizaje profundo, transformadores y tecnologías ASR de extremo a extremo.
La experiencia en el manejo de sistemas ASR diseñados para inglés con acento y/o el habla de niños es altamente deseable.
Publicaciones previas en conferencias de procesamiento de habla prestigiosas como Interspeech, ICASSP se considerarán una ventaja.

Lamentamos que solo los candidatos preseleccionados serán notificados.

La Universidad Tecnológica de Nanyang está a la vanguardia de la excelencia educativa e investigación interdisciplinaria en IA, fomentando un entorno que impulsa las fronteras de la innovación. Al unirte a nuestro equipo, serás parte de una comunidad que prospera en la creatividad y el impacto.

¿Listo para contribuir a la investigación de vanguardia en reconocimiento del habla en IA? ¡Aplica hoy para formar parte de nuestro dinámico equipo en NTU!