Machine Learning Research Engineer

Job expired!

À propos de Neural Magic

Situé à Somerville, Massachusetts, Neural Magic est une startup de série A soutenue par des investisseurs de premier plan, dont Andreessen Horowitz, NEA, Pillar, VMware, Verizon Ventures, Comcast Ventures et Amdocs. Chez Neural Magic, nous sommes passionnés par la rendue de l'IA ouverte et accessible. Notre mission est de doter les entreprises du monde entier de LLM et de VLLM open-source, d’accélérer l’adoption de l’IA et de simplifier les déploiements de GenAI. En tant que contributeur clé du projet vLLM et pionniers dans la quantification et la raréfaction des modèles, Neural Magic offre une plateforme robuste permettant aux entreprises de construire, optimiser et faire évoluer leurs implémentations LLM.

Notre Mission

Nous avons pour mission de démocratiser la puissance des LLM et VLLM open-source, en les mettant à la disposition de toutes les entreprises à travers le monde.

Votre Rôle

En tant qu'ingénieur de recherche en apprentissage automatique chez Neural Magic, vous ferez avancer l'innovation en collaborant avec notre équipe pour résoudre les défis les plus critiques en matière de performance et d'efficacité des modèles. Votre travail influencera considérablement l'avancement de notre plateforme logicielle de pointe, façonnant l'avenir du déploiement et de l'utilisation de l'IA.

Participez à notre voyage passionnant pour transformer le paysage de l'IA !

Recherche et Innovation : Diriger le développement de projets de recherche révolutionnaires visant à améliorer la performance, l’efficacité et la scalabilité des LLM.
Prototyper et Expérimenter : Concevoir et implémenter des prototypes pour tester de nouveaux algorithmes et techniques, repoussant continuellement les limites de l'optimisation des modèles et du service d'inférence.
Analyser et Évaluer : Mener des expériences et analyses globales, documenter les résultats et partager les insights avec l'équipe.
Collaborer et Communiquer : Travailler étroitement avec les équipes produit et ingénierie pour convertir des prototypes de recherche en fonctionnalités prêtes pour la production, en assurant une intégration transparente avec notre plateforme.
Contribuer et Partager : Rester à jour avec les dernières avancées du domaine, contribuer à des projets open-source et diffuser vos découvertes à travers des publications et des présentations.

Expertise en Recherche : Expérience démontrée dans la conduite de recherches indépendantes ou la contribution à des projets de recherche, en particulier en LLM ou en IA générative.
Compétence Technique : Maîtrise de la programmation Python avec une compréhension approfondie de PyTorch ou de frameworks de deep learning similaires.
Expérience en Optimisation : Connaissance des techniques d’optimisation de modèles telles que l’élagage, la quantification, la distillation ou d’autres méthodes d’amélioration de performances.
Compétences en Résolution de Problèmes : Forte capacité à identifier et résoudre des défis techniques complexes, en appliquant les connaissances théoriques à des applications pratiques.
Compétences en Communication : Excellentes compétences en communication écrite et verbale pour transmettre efficacement les résultats de recherche et collaborer avec des équipes multifonctionnelles.