Research Scientist/Research Engineer II (Speech Recognition)

Other
Other places
06/12/2024
-

Job expired!

Intitulé du poste : Chercheur Scientifique / Ingénieur de Recherche II (Reconnaissance Vocale)

Lieu : Université Technologique de Nanyang (NTU), A Corp Lab

Rejoignez notre équipe innovante chez A Corp Lab au sein de la NTU en tant que Chercheur Scientifique ou Ingénieur de Recherche II. Ce rôle se concentre sur le développement pionnier d'algorithmes pour la Reconnaissance Automatique de la Parole (RAP) utilisant de grands modèles de langage. Le candidat retenu contribuera à des recherches révolutionnaires menant à des publications et des brevets, guidé par une mission de repousser les limites dans les technologies de la parole et du langage pour les applications de l'IA.

Rechercher et développer des technologies avancées de reconnaissance vocale intégrant de grands modèles de langage.
Diriger les processus de formation et d'évaluation des modèles pour les tâches de RAP, en veillant à la cohérence et à l'innovation à chaque étape.
Communiquer efficacement les résultats aux superviseurs de l'équipe et aux parties prenantes du projet, et proposer des solutions innovantes pour améliorer les résultats des projets.
Organiser et gérer la préparation des données de parole et de texte pour l'entraînement dans des cadres de pointe comme Huggingface et Whisper.
Documenter les découvertes et transférer les modèles avancés à l'équipe d'ingénierie pour un développement et une application plus poussés.
Publier les résultats de recherche dans des conférences et des journaux à fort impact dans le domaine.
Collaborer avec l'équipe d'ingénierie pour développer des systèmes de démonstration mettant en avant les applications pratiques de votre recherche.
Gérer les ressources informatiques pour soutenir des expériences de recherche étendues.

Doctorat ou Master en Informatique/Ingénierie ou domaine connexe.
Expérience avérée avec de grands modèles de langage, le traitement de données de parole et de texte, et l'entraînement de modèles d'apprentissage profond.
Maîtrise des langages de programmation tels que Python, Pytorch, C/C++ et Linux Bash/Shell.
Expérience avec des cadres de traitement de la parole bien connus comme ESPnet, Wenet, Whisper et Kaldi.
Compréhension approfondie de l'apprentissage profond, des transformateurs et des technologies ASR de bout en bout.
L'expérience dans la gestion des systèmes ASR conçus pour l'anglais accentué et/ou la parole des enfants est très souhaitable.
Les publications antérieures dans des conférences prestigieuses de traitement de la parole telles que Interspeech, ICASSP seront considérées comme un avantage.

Nous regrettons que seuls les candidats présélectionnés seront notifiés.

L'Université Technologique de Nanyang est à l'avant-garde de l'excellence éducative et de la recherche interdisciplinaire en IA, favorisant un environnement qui repousse les frontières de l'innovation. En rejoignant notre équipe, vous ferez partie d'une communauté qui valorise la créativité et l'impact.

Prêt à contribuer à la recherche de pointe en IA pour la reconnaissance vocale ? Postulez dès aujourd'hui pour faire partie de notre équipe dynamique à la NTU !