Nombre del puesto: Científico de Investigación/Ingeniero de Investigación II (Reconocimiento de Voz)
Ubicación: Universidad Tecnológica de Nanyang (NTU), Un Laboratorio Corporativo
Únete a nuestro equipo innovador en Un Laboratorio Corporativo dentro de la NTU como Científico de Investigación o Ingeniero de Investigación II. Este rol se centra en el desarrollo pionero de algoritmos para el Reconocimiento Automático del Habla (ASR) utilizando modelos de lenguaje amplios. El candidato exitoso contribuirá a investigaciones revolucionarias que conducen a publicaciones y patentes, impulsadas por la misión de avanzar los límites en tecnologías de habla y lenguaje para aplicaciones de IA.
- Investigar y desarrollar tecnologías avanzadas de reconocimiento del habla integrando modelos de lenguaje amplios.
- Liderar los procesos de entrenamiento y evaluación de modelos para tareas de ASR, asegurando consistencia e innovación en cada paso.
- Comunicar efectivamente los resultados a los supervisores del equipo y los interesados del proyecto, y proponer soluciones innovadoras para mejorar los resultados del proyecto.
- Organizar y gestionar la preparación de datos de habla y texto para el entrenamiento en marcos de trabajo de vanguardia como Huggingface y Whisper.
- Documentar hallazgos y transferir modelos avanzados al equipo de ingeniería para su posterior desarrollo y aplicación.
- Publicar hallazgos de investigación en conferencias y revistas de alto impacto dentro del campo.
- Colaborar con el equipo de ingeniería para desarrollar sistemas de demostración que muestren las aplicaciones prácticas de su investigación.
- Gestionar recursos computacionales para apoyar experimentos de investigación extensivos.
- Doctorado o Maestría en Ciencias de la Computación/Ingeniería o un campo relacionado.
- Experiencia comprobada con modelos de lenguaje amplios, procesamiento de datos de habla y texto, y entrenamiento de modelos de aprendizaje profundo.
- Competencia en lenguajes de programación como Python, Pytorch, C/C++, y Linux Bash/Shell.
- Experiencia con marcos de procesamiento de habla conocidos como ESPnet, Wenet, Whisper, y Kaldi.
- Comprensión profunda de aprendizaje profundo, transformadores y tecnologías ASR de extremo a extremo.
- La experiencia en el manejo de sistemas ASR diseñados para inglés con acento y/o el habla de niños es altamente deseable.
- Publicaciones previas en conferencias de procesamiento de habla prestigiosas como Interspeech, ICASSP se considerarán una ventaja.
Lamentamos que solo los candidatos preseleccionados serán notificados.
La Universidad Tecnológica de Nanyang está a la vanguardia de la excelencia educativa e investigación interdisciplinaria en IA, fomentando un entorno que impulsa las fronteras de la innovación. Al unirte a nuestro equipo, serás parte de una comunidad que prospera en la creatividad y el impacto.
¿Listo para contribuir a la investigación de vanguardia en reconocimiento del habla en IA? ¡Aplica hoy para formar parte de nuestro dinámico equipo en NTU!