Мы активно ищем динамичного Старшего инженера по машинному обучению - NLP, чтобы присоединиться к нашей расширяющейся команде ML в BenchSci. В этой роли вы будете решать сложные задачи NLP, которые существенно влияют на более чем 41 000 учёных по всему миру, зависящих от BenchSci в своих исследованиях. Подчиняясь управляющему инженером ML, мы ищем эксперта в Python, инженерии данных и NLP, особенно с LLMs (например, GPT-4, Gemini, Claude) и SLMs (например, Mistral, Llama v2 и другие модели с параметрами <7B). Опыт в биомедицинской области рассматривается как плюс.
Ваши ключевые обязанности будут включать:
- Проектирование, создание, оценка и развертывание передовых моделей ML с особым акцентом на NLP, особенно LLMs и SLMs, для улучшения скорости и качества результатов исследований.
- Ведение интеграции и настройки LLMs (таких как GPT, Gemini, Claude) и SLMs (таких как Mistral, Llama, Gemma) с использованием техник, таких как HyDE, RAG, PEFT, qLORA и LORA для извлечения и создания инсайтов из сложных наборов данных.
- Сотрудничество с командами инженеров данных для разработки надежных конвейеров данных и инженерами инфраструктуры для развертывания масштабируемых и эффективных NLP систем в производственных средах.
- Опережение в своей области, исследование и внедрение передовых методов в NLP и оптимизация рабочих процессов ML с использованием достижений в инструментах, таких как PyTorch и DVC.
- Ведение технических обсуждений, применение лучших практик в ML и NLP, ведение решения проблем для обеспечения высококачественных решений.
- Взятие на себя ответственности за долгосрочные технические стратегии, которые способствуют инновациям и продвигают миссию компании вперёд.
- Участие во взаимодействии с межфункциональными командами, включая научно-исследовательских учёных и главного научного сотрудника, для понимания и моделирования биологических сложностей, способствование междисциплинарному обмену знаниями.
- Ведение и участие в agile-практиках, таких как планирование спринтов, оценка, дизайн и код-ревью, для поддержания надёжного процесса разработки.
- Наставничество младших инженеров, продвижение культуры обучения и совершенства, установление лучших практик отрасли в разработке систем ML и NLP.
Идеальный кандидат должен обладать:
- Более 5 лет опыта в применении передовых техник ML и NLP с подтвержденным опытом развертывания готовых к производству систем.
- Экспертные навыки в Python и основные программные концепции с обширным опытом работы с NLP технологиями и фреймворками, такими как PyTorch.
- Подтвержденное знакомство с LLMs (GPT, Gemini, Claude) и SLMs (Mistral, Llama, Gemma) в недавних работах или проектах.
- Сильные навыки в инженерии данных, включая манипуляции и обработку с помощью SQL, pandas или подобных технологий, и опыт в техниках настройки, таких как HyDE, RAG, PEFT, qLORA и LORA.
- Подход, ориентированный на непрерывное обучение и желание развивать навыки и знания в быстро развивающейся области ML и NLP.
- Отличные коммуникативные и сотрудничественные способности, опыт работы в межфункциональных командах как технического, так и нетехнического характера для поиска инновационных решений.
- Бонус: Опубликованные исследования или литература в области машинного обучения или обработки естественного языка будут преимуществом, но не обязательны.
В BenchSci, мы предлагаем:
- Увлекательную культуру удаленной работы
- Конкурентоспособный компенсационный пакет, включающий опци