Senior Machine Learning Engineer, NLP - (Remote)

Job expired!

Мы активно ищем динамичного Старшего инженера по машинному обучению - NLP, чтобы присоединиться к нашей расширяющейся команде ML в BenchSci. В этой роли вы будете решать сложные задачи NLP, которые существенно влияют на более чем 41 000 учёных по всему миру, зависящих от BenchSci в своих исследованиях. Подчиняясь управляющему инженером ML, мы ищем эксперта в Python, инженерии данных и NLP, особенно с LLMs (например, GPT-4, Gemini, Claude) и SLMs (например, Mistral, Llama v2 и другие модели с параметрами <7B). Опыт в биомедицинской области рассматривается как плюс.

Ваши ключевые обязанности будут включать:

  • Проектирование, создание, оценка и развертывание передовых моделей ML с особым акцентом на NLP, особенно LLMs и SLMs, для улучшения скорости и качества результатов исследований.
  • Ведение интеграции и настройки LLMs (таких как GPT, Gemini, Claude) и SLMs (таких как Mistral, Llama, Gemma) с использованием техник, таких как HyDE, RAG, PEFT, qLORA и LORA для извлечения и создания инсайтов из сложных наборов данных.
  • Сотрудничество с командами инженеров данных для разработки надежных конвейеров данных и инженерами инфраструктуры для развертывания масштабируемых и эффективных NLP систем в производственных средах.
  • Опережение в своей области, исследование и внедрение передовых методов в NLP и оптимизация рабочих процессов ML с использованием достижений в инструментах, таких как PyTorch и DVC.
  • Ведение технических обсуждений, применение лучших практик в ML и NLP, ведение решения проблем для обеспечения высококачественных решений.
  • Взятие на себя ответственности за долгосрочные технические стратегии, которые способствуют инновациям и продвигают миссию компании вперёд.
  • Участие во взаимодействии с межфункциональными командами, включая научно-исследовательских учёных и главного научного сотрудника, для понимания и моделирования биологических сложностей, способствование междисциплинарному обмену знаниями.
  • Ведение и участие в agile-практиках, таких как планирование спринтов, оценка, дизайн и код-ревью, для поддержания надёжного процесса разработки.
  • Наставничество младших инженеров, продвижение культуры обучения и совершенства, установление лучших практик отрасли в разработке систем ML и NLP.

Идеальный кандидат должен обладать:

  • Более 5 лет опыта в применении передовых техник ML и NLP с подтвержденным опытом развертывания готовых к производству систем.
  • Экспертные навыки в Python и основные программные концепции с обширным опытом работы с NLP технологиями и фреймворками, такими как PyTorch.
  • Подтвержденное знакомство с LLMs (GPT, Gemini, Claude) и SLMs (Mistral, Llama, Gemma) в недавних работах или проектах.
  • Сильные навыки в инженерии данных, включая манипуляции и обработку с помощью SQL, pandas или подобных технологий, и опыт в техниках настройки, таких как HyDE, RAG, PEFT, qLORA и LORA.
  • Подход, ориентированный на непрерывное обучение и желание развивать навыки и знания в быстро развивающейся области ML и NLP.
  • Отличные коммуникативные и сотрудничественные способности, опыт работы в межфункциональных командах как технического, так и нетехнического характера для поиска инновационных решений.
  • Бонус: Опубликованные исследования или литература в области машинного обучения или обработки естественного языка будут преимуществом, но не обязательны.

В BenchSci, мы предлагаем:

  • Увлекательную культуру удаленной работы
  • Конкурентоспособный компенсационный пакет, включающий опци