Le Rôle
Rejoignez Output Biosciences pour révolutionner notre compréhension de la biologie grâce à une IA générative de pointe. En tant qu'Ingénieur en Apprentissage Automatique, vous collaborerez avec les fondateurs et les membres de l'équipe pour développer des systèmes d'IA avancés, permettant un raisonnement biologique complexe des molécules aux organismes.
Responsabilités Clés
- Concevoir et mettre en œuvre des algorithmes d'apprentissage automatique avancés pour améliorer la performance des modèles et la compréhension biologique.
- Développer et affiner des modèles génératifs pour des applications biologiques, en explorant des architectures innovantes pour capturer des systèmes biologiques multi-échelles.
- Travailler sur des systèmes d'entraînement distribués pour faire évoluer les modèles à des milliards de paramètres, en optimisant la performance et l'efficacité sur des configurations multi-GPU et multi-nœuds.
- Concevoir des pipelines de données efficaces pour gérer et traiter des ensembles de données biologiques massifs, en relevant les défis liés au chargement, à la division et à l'optimisation de la mémoire.
- Développer et mettre en œuvre des cadres d'évaluation robustes pour des modèles biologiques complexes, en assurant l'intégrité des données et en évitant les fuites entre les divisions de jeux de données.
Ce Que Nous Recherchons
- Diplôme de licence en informatique, apprentissage automatique ou un domaine technique connexe.
- 3+ années d'expérience dans le développement et la mise en œuvre de modèles d'apprentissage automatique.
- Maîtrise de Python et expertise dans les cadres d'apprentissage profond tels que PyTorch, TensorFlow ou JAX.
- Expérience avec les architectures d'apprentissage profond et génératif, y compris les transformateurs, les modèles de diffusion et les autoencodeurs.
- Compétence dans le travail avec des ensembles de données à grande échelle et des environnements de calcul distribués.
- Expérience avec AWS pour l'entraînement, l'inférence et le déploiement.
- Forte compréhension des fondamentaux de l'apprentissage automatique, des architectures de modèles, des techniques d'optimisation et des métriques d'évaluation.
- Expérience dans la conception et la mise en œuvre de pipelines de données efficaces pour le traitement de grands ensembles de données.
- Expérience dans le développement de cadres d'évaluation robustes pour assurer l'intégrité des données.
- Compétence dans l'organisation du code, le contrôle de version et les pratiques de développement logiciel collaboratif.
- Excellentes compétences en résolution de problèmes et capacité à s'adapter rapidement aux nouveaux défis.
- Démarche proactive pour résoudre les problèmes, en prenant la responsabilité des défis avec une approche mature dans les situations ambiguës.
- Excellentes compétences de communication pour articuler clairement des concepts techniques complexes.
- Motivation à avoir un impact réel avec détermination et créativité.
Points Bonus
- Expérience dans l'application de l'apprentissage automatique à la biologie ou à la chimie.
- Contributions à des projets open-source d'apprentissage automatique ou publication de papiers de recherche dans l'IA/ML.
- Expérience en optimisation de modèles d'apprentissage automatique pour des environnements de calcul haute performance.
- Familiarité avec les pratiques et outils ML-Ops pour la gestion des expériences et des déploiements ML.
Nos Valeurs
❤️ Cœur : Nous favorisons une culture de responsabilisation, encourageant la passion et la fierté dans nos contributions.
🏆 Excellence : Nous nous engageons à respecter les plus hauts standards d'excellence et nous nous remettons continuellement en question pour nous améliorer.
🚀 Praticité : Nous valorisons la réflexion orientée vers les résultats, visant à avoir un impact tangible sur nos patients et la communauté.
📣 Honnêt