Scientifique des Données Senior en Apprentissage Profond, Discours
- Data Scientist
- Other places
- $136 K - $205 K
- Full Time
Considérée comme l'un des employeurs les plus attractifs du monde de la technologie, NVIDIA est un leader de l'industrie avec des développements révolutionnaires en matière de calcul haute performance, d'intelligence artificielle et de visualisation. Le GPU, notre invention, sert de cortex visuel aux ordinateurs modernes et est au cœur de nos produits et services. L'apprentissage profond du GPU a allumé l'IA moderne - la prochaine ère de l'informatique - avec le GPU agissant comme le cerveau des ordinateurs, des robots, des voitures autonomes et de l'IA conversationnelle qui peuvent percevoir et comprendre le monde. Aujourd'hui, nous sommes de plus en plus connus comme "l'entreprise de calcul IA". Nous cherchons à développer notre entreprise et à renforcer nos équipes avec les personnes les plus intelligentes au monde. Rejoignez-nous à la pointe de l'avancement technologique.
NVIDIA recherche des scientifiques de données vocales pour développer le produit de l'IA vocale "Riva" à fort impact et à forte visibilité et améliorer l'expérience de millions de clients. Si vous êtes créatif et passionné par la résolution de réels problèmes d'IA conversationnelle, rejoignez notre équipe d'ingénierie de produits Riva. Pour plus de détails sur Riva, consultez https://developer.nvidia.com/riva
Ce que vous ferez :
Entraînez les modèles acoustiques, linguistiques, de ponctuation de la reconnaissance vocale.
Mesurez et établissez des références de performance des modèles.
Maintenez le système d'évaluation du modèle ASR.
Analysez l'exactitude et le biais du modèle et recommandez la prochaine action à entreprendre et les améliorations.
Améliorez les processus de traitement des données vocales, d'augmentation, de filtrage et de préparation des ensembles de formation ASR.
Rassembler le savoir-faire sur les ensembles de données vocales pour la formation et l'évaluation.
Caractérisez les performances et les métriques de qualité sur différentes plateformes pour divers composants d'IA vocale.
Collaborez avec diverses équipes pour de nouvelles fonctionnalités de produit et des améliorations de produits existants.
Participez à l'élaboration et à la révision du code, des documents de conception, des revues de cas d'utilisation et des revues de plans de test.
Aidez à innover, identifiez les problèmes, recommandez des solutions et effectuez un triage dans un environnement d'équipe collaboratif.
Ce que nous devons voir :
Baccalauréat ou Master (ou expérience équivalente) ou Doctorat en Informatique, Génie électrique, Intelligence artificielle, ou Mathématiques appliquées.
Fluence native ou quasi native dans une langue autre que l'anglais - Espagnol / Chinois / Allemand / Japonais / Russe / Français / Anglais UK / Arabe / Hindi / Coréen / Italien / Portugais
Excellentes compétences en programmation Python ainsi que de solides connaissances fondamentales en programmation, optimisations et conception de logiciels.
Solide connaissance des techniques, algorithmes et outils ML/DL avec une exposition à CNN, RNN (LSTM), Transformers.
Solide connaissance des décodeurs RNNT et CTC.
Savoir faire des applications d'apprentissage en profondeur à la parole et au TAL.
Expérience pratique des technologies de la parole telles que la reconnaissance automatique de la parole, la détection des commandes vocales, la synthèse vocale, la reconnaissance et l'identification des orateurs, la diarisation des orateurs, les techniques de robustesse au bruit, la détection de l'activité vocale, la détection de fin d'énoncé, etc.
Expérience en formation de modèles acoustiques.
Expérience avec KenLM, OpenLM et d'autres outils pour créer des modèles linguistiques.
Expérience avec les cadres d'apprentissage en profondeur "PyTorch".
Exposition aux techniques de base de traitement du signal numérique de la parole et d'extraction des caractéristiques comme la FFT, MFCC, Mel Spectrogram, etc.
Connaissance générale des outils de contrôle de version et de revue de code tels que Git, Gerrit, Gitlab.
Comment se démarquer de la foule :
Fortes compétences en programmation C++.
Familiarité avec les technologies basées sur GPU telles que CUDA, CuDNN et TensorRT
Connaissance des dockers et de Kubernetes
Expérience du déploiement de modèles d'apprentissage automatique sur des centres de données, des systèmes en nuage et embarqués
NVIDIA s'engage à promouvoir un environnement de travail diversifié et est fière d'être un employeur offrant l'égalité des chances. Nous accordons beaucoup de valeur à la diversité parmi nos employés actuels et futurs, et nous ne pratiquons aucune discrimination (y compris dans nos pratiques d'embauche et de promotion) en fonction de la race, de la religion, de la couleur, de l'origine nationale, du sexe, de l'expression du genre, de l'orientation sexuelle, de l'âge, du statut civil, de la condition d'ancien combattant, du statut de handicap ou de toute autre caractéristique protégée par la loi.