Machine Learning - Research Internship

Job expired!

О компании Aqemia

Aqemia – инновационная фармотехническая компания, революционизирующая процесс разработки лекарств с одной из самых быстрорастущих исследовательских программ в мире. Наша миссия – быстро создавать инновационные кандидаты на лекарства для множества критических заболеваний. Наша уникальная комбинация алгоритмов квантовой и статистической механики, используемых генеративным искусственным интеллектом для разработки новых кандидатов на лекарства, выделяет нас. Наша передовая технологическая платформа обеспечивает беспрецедентную скорость и точность, что позволяет нам масштабировать проекты по разработке лекарств, подобно технологическим предприятиям. Наши усилия поддерживают выдающиеся партнеры из ведущих фармацевтических компаний, экосистемы FrenchTech и престижных инвестиционных фондов.

О команде

В качестве стажера по исследованию машинного обучения, вы будете частью элитной команды инженеров и исследователей, разрабатывающих алгоритмы для улучшения и ускорения нашего внутреннего процесса разработки лекарств. В частности, вы будете интегрированы в команду по расширению серий, состоящую из 3 инженеров по машинному обучению, и будете тесно сотрудничать с Виктором Сайантом.

Ваша роль

Ваша работа будет сосредоточена на глубоком изучении генерации молекул, включая обзор литературы, реализацию и обучение/оценку моделей на публичных и собственных данных. Длительность стажировки гибкая, от 4 до 6 месяцев, с возможными датами начала уже с 2024 года.

Цель стажировки

Стажировка направлена на решение задачи генерации молекул, обусловленных белком, возможно в ограниченном химическом пространстве и с дополнительными физико-химическими свойствами. Подход включает использование моделей диффузии на графах (см. ссылки [1][2]). Вы также можете исследовать альтернативные методы, такие как авторегрессионные модели, на последующем этапе (см. ссылки [3][4]).

Необходимые навыки

  • Магистрант или докторант в области информатики, прикладной математики, биоинформатики или смежных областях.
  • Сильный интерес к машинному обучению и стремление быть в курсе текущих достижений.
  • Твердые знания в области математики и статистики для критической оценки научных статей.
  • Опыт программирования на Python и практические навыки работы с фреймворками глубокого обучения, такими как PyTorch/Jax/TensorFlow.
  • Любознательность и стремление учиться новым темам у различных экспертов, вера в ключевую роль машинного обучения в разработке лекарств.

Приветствуется

  • Опыт в области обучения представлений и генеративного моделирования.
  • Интерес к работе с сложными структурированными данными, такими как графы, облака точек и текст.
  • Знания в биологии, химии или хемоинформатике являются значительным преимуществом.

Рекомендации

  • Huang, L., Xu, T., Yu, Y. и др. “Модель двойной диффузии позволяет создавать 3D molécules и оптимизировать лиды на основе карманов цели.” Nat Commun 15, 2657 (2024). https://doi.org/10.1038/s41467-024-46569-1
  • Schneuing, Arne, Yuanqi Du, Charles Harris, и др. "Проектирование лекарств на основе структуры с эквивариантными диффузионными моделями." arXiv preprint arXiv:2210.13695 (2022).
  • Zhung, W., Kim, H. & Kim, W.Y. 3D молекулярная генеративная структура для проектирования лекарств с учетом взаимодействий. Nat Commun 15, 268