Machine Learning - Research Internship

Job expired!

À propos d'Aqemia

Aqemia est une société pharmatech pionnière révolutionnant le paysage de la découverte de médicaments avec l'un des pipelines à la croissance la plus rapide au monde. Notre mission est de concevoir rapidement des candidats-médicaments innovants pour de nombreuses maladies critiques. Ce qui nous distingue, c'est notre mélange unique d'algorithmes de mécanique quantique et statistique, exploité par une intelligence artificielle générative pour concevoir de nouveaux candidats-médicaments. Notre plateforme technologique de pointe offre une vitesse et une précision inégalées, nous permettant de mettre à l'échelle des projets de découverte de médicaments à l'instar des entreprises technologiques. Nos efforts sont soutenus par des partenaires éminents issus de grandes entreprises pharmaceutiques, de l'écosystème FrenchTech et de fonds d'investissement prestigieux.

À propos de l'équipe

En tant que stagiaire en recherche en apprentissage automatique, vous ferez partie d'une équipe d'élite d'ingénieurs et de chercheurs développant des algorithmes pour améliorer et accélérer notre pipeline interne de découverte de médicaments. Plus précisément, vous serez intégré à l'équipe d'expansions en série, composée de 3 ingénieurs en apprentissage automatique, et collaborerez étroitement avec Victor Saillant.

Votre Rôle

Votre objectif sera de plonger profondément dans la génération moléculaire, impliquant une revue de la littérature, la mise en œuvre et la formation/l'évaluation de modèles sur des données publiques et propriétaires. La durée du stage est flexible, allant de 4 à 6 mois, avec des dates de début potentielles dès 2024.

L'objet du stage vise à relever le défi de la génération de molécules conditionnées sur une protéine, possiblement dans un espace chimique contraint et avec des propriétés physico-chimiques supplémentaires. L'approche implique l'utilisation de modèles de diffusion sur des graphes (voir références [1][2]). Vous pouvez également explorer des méthodes alternatives, telles que les modèles auto-régressifs, dans une phase ultérieure (voir références [3][4]).

Compétences requises

  • Étudiant en Master ou doctorant en informatique, mathématiques appliquées, bioinformatique ou dans un domaine connexe.
  • Fort intérêt pour l'apprentissage automatique, avec un penchant pour rester à jour sur les avancées actuelles.
  • Solide compréhension des mathématiques et des statistiques pour évaluer de manière critique les articles de recherche.
  • Expérience en programmation Python et expertise pratique avec des frameworks d'apprentissage profond comme PyTorch/Jax/TensorFlow.
  • Curiosité et enthousiasme pour apprendre de nouveaux sujets auprès d'experts divers, avec la conviction du rôle crucial de l'apprentissage automatique dans la découverte de médicaments.

Compétences appréciées

  • Expérience en apprentissage de représentations et en modélisation générative.
  • Intérêt pour travailler avec des données structurées complexes telles que des graphes, des nuages de points et du texte.
  • Connaissances en biologie, chimie ou chimioinformatique sont un atout significatif.

Références

  • Huang, L., Xu, T., Yu, Y. et al. “A dual diffusion model enables 3D molecule generation and lead optimization based on target pockets”. Nat Commun 15, 2657 (2024). https://doi.org/10.1038/s41467-024-46569-1
  • Schneuing, Arne, Yuanqi Du, Charles Harris, et al. "Structure-based drug design with equivariant diffusion models." arXiv preprint arXiv:2210.13695 (2022).
  • Zhung, W., Kim, H. & Kim, W.Y. 3D molecular generative framework for interaction-guided drug design. Nat Commun 15, 2688 (2024). https://doi.org/10.1038/s41467-024-47011-2