Machine Learning - Research Internship

Job expired!

O Aqemia

Aqemia to pionierska firma farmaceutyczna, która rewolucjonizuje krajobraz odkrywania leków za pomocą jednej z najszybciej rozwijających się linii projektów na świecie. Naszą misją jest szybkie projektowanie innowacyjnych kandydatów na leki dla wielu krytycznych chorób. Naszym atutem jest unikalne połączenie algorytmów mechaniki kwantowej i statystycznej, wspieranych przez generatywną sztuczną inteligencję do projektowania nowatorskich kandydatów na leki. Nasza zaawansowana platforma technologiczna zapewnia niezrównaną szybkość i precyzję, umożliwiając nam skalowanie projektów odkrywania leków podobnie jak przedsięwzięcia technologiczne. Nasze wysiłki wspierają znakomici partnerzy z czołowych firm farmaceutycznych, ekosystemu FrenchTech i prestiżowych funduszy inwestycyjnych.

O Zespole

Jako Stażysta ds. Badań nad Uczeniem Maszynowym będziesz częścią elitarnego zespołu inżynierów i badaczy rozwijających algorytmy w celu ulepszenia i przyspieszenia naszej wewnętrznej linii projektów odkrywania leków. W szczególności będziesz zintegrowany z zespołem rozwijającym modele szeregów, składającym się z 3 inżynierów ML, i będziesz ściśle współpracować z Victorem Saillantem.

Twoja Rola

Twoim głównym zadaniem będzie zagłębianie się w generowanie molekuł, obejmujące przegląd literatury, wdrażanie i trenowanie/ocenę modeli na danych publicznych i własnościowych. Czas trwania stażu jest elastyczny, od 4 do 6 miesięcy, z możliwością rozpoczęcia już w 2024 roku.

Staże mają na celu rozwiązanie problemu generowania molekuł uzależnionych od białka, być może w ograniczonej przestrzeni chemicznej i z dodatkowymi właściwościami fizyko-chemicznymi. Podejście obejmuje wykorzystanie modeli dyfuzji na grafach (zobacz odniesienia [1][2]). Możesz również zgłębiać alternatywne metody, takie jak modele auto-regresywne, w późniejszej fazie (zobacz odniesienia [3][4]).

Wymagane Umiejętności

  • Student magisterskie lub doktoranckie w dziedzinie Informatyki, Matematyki Stosowanej, Bioinformatyki lub pokrewnych.
  • Silne zainteresowanie uczeniem maszynowym, z chęcią śledzenia aktualnych osiągnięć.
  • Solidne zrozumienie matematyki i statystyki do krytycznej oceny prac badawczych.
  • Doświadczenie w programowaniu w Pythonie i praktyczne umiejętności z frameworkami do głębokiego uczenia, takimi jak PyTorch/Jax/TensorFlow.
  • Ciekawość i entuzjazm do nauki nowych tematów od różnych ekspertów, przekonanie o kluczowej roli uczenia maszynowego w odkrywaniu leków.

Mile Widziane

  • Doświadczenie w nauce reprezentacji i modelowaniu generatywnym.
  • Zainteresowanie pracą ze złożonymi danymi strukturalnymi, takimi jak grafy, chmury punktów i tekst.
  • Wiedza z zakresu biologii, chemii lub chemoinformatyki jest znaczącym atutem.

Bibliografia

  • Huang, L., Xu, T., Yu, Y. et al. “A dual diffusion model enables 3D molecule generation and lead optimization based on target pockets”. Nat Commun 15, 2657 (2024).