Nous recherchons activement un Ingénieur Senior en Apprentissage Automatique - NLP dynamique pour rejoindre notre équipe ML en pleine expansion chez BenchSci. Dans ce rôle, vous relèverez des défis complexes en NLP qui impactent significativement plus de 41 000 scientifiques dans le monde entier qui dépendent de BenchSci pour leurs recherches. Relevant du Responsable Ingénierie, ML, nous recherchons un expert en Python, en ingénierie des données et en NLP, en particulier avec les LLMs (comme GPT-4, Gemini, Claude) et les SLMs (comme Mistral, Llama v2, et autres modèles <7B paramètres). Une expérience dans le domaine biomédical est considérée comme un plus.
Vos principales responsabilités incluront :
- Concevoir, construire, évaluer et déployer des modèles ML avancés, avec un accent particulier sur le NLP et spécifiquement les LLMs et les SLMs pour améliorer la rapidité et la qualité des résultats de recherche.
- Diriger l'intégration et l'affinage des LLMs (comme GPT, Gemini, Claude) et des SLMs (comme Mistral, Llama, Gemma) en utilisant des techniques telles que HyDE, RAG, PEFT, qLORA, et LORA pour extraire et générer des insights à partir de jeux de données complexes.
- Collaborer avec les équipes d'ingénierie des données pour développer des pipelines de données robustes et les ingénieurs d'infrastructure pour déployer des systèmes NLP évolutifs et efficaces dans des environnements de production.
- Rester à l'avant-garde du domaine en recherchant et en mettant en œuvre des techniques de pointe en NLP et en optimisant les flux de travail ML en utilisant les avancées des outils tels que PyTorch et DVC.
- Conduire des discussions techniques, appliquer les meilleures pratiques en ML et NLP, et diriger la résolution de problèmes pour garantir des solutions de haute qualité.
- Prendre en charge des stratégies techniques à long terme qui favorisent l'innovation et font avancer la mission de l'entreprise.
- S'engager avec des équipes multifonctionnelles, y compris des scientifiques de la R&D et le Directeur Scientifique, pour comprendre et modéliser les complexités biologiques, contribuant au partage interdisciplinaires des connaissances.
- Diriger et contribuer aux pratiques agiles telles que la planification de sprint, l'estimation, la conception et les revues de code pour maintenir un processus de développement robuste.
- Encadrer les ingénieurs juniors, promouvoir une culture d'apprentissage et d'excellence, et établir des meilleures pratiques de l'industrie dans le développement de systèmes ML et NLP.
Le candidat idéal aura :
- Plus de 5 ans d'expérience dans l'application de techniques avancées de ML et de NLP, avec un historique prouvé dans le déploiement de systèmes prêts pour la production.
- Une maîtrise experte de Python et des concepts de programmation de base, avec une vaste expérience dans les technologies et cadres de NLP comme PyTorch.
- Une familiarité démontrée avec les LLMs (GPT, Gemini, Claude) et les SLMs (Mistral, Llama, Gemma) dans des travaux ou projets récents.
- Des compétences solides en ingénierie des données, y compris la manipulation et le traitement avec SQL, pandas, ou des technologies similaires, et une expérience des techniques d'affinage telles que HyDE, RAG, PEFT, qLORA, et LORA.
- Un esprit de croissance continue, cherchant toujours à améliorer ses compétences et ses connaissances dans le domaine en évolution du ML et du NLP.
- Excellentes capacités de communication et de collaboration, avec une expérience de travail en équipe interfonctionnelles techniques et non techniques pour promouvoir des solutions innovantes.
- Bonus : des recherches publiées ou des articles dans le domaine de l'apprentissage automatique ou du traitement du langage naturel sont un plus mais ne sont pas requis.
Chez BenchSci, nous offrons :
- Une culture engageante et principalement à distance
- Un package de rémunération compétitif incluant des options d'actions BenchSci
- Une politique de vacances robuste plus un jour de cong