Ми активно шукаємо динамічного Старшого інженера з машинного навчання - NLP, щоб приєднатися до нашої розширюваної команди ML у BenchSci. У цій ролі ви будете вирішувати складні завдання NLP, що значно впливають на понад 41 000 науковців у всьому світі, які залежать від BenchSci у своїх дослідженнях. Звітуючи менеджеру з інженерії ML, ми шукаємо експерта з Python, інженерії даних та NLP, зокрема з LLM (як-от GPT-4, Gemini, Claude) та SLM (як-от Mistral, Llama v2 та інші моделі з <7B параметрів). Досвід у біомедичній сфері вважається плюсом.
Вашими ключовими обов'язками будуть:
- Проектування, побудова, оцінка та впровадження передових моделей ML, з особливим акцентом на NLP та саме LLM і SLM для підвищення швидкості та якості дослідницьких результатів.
- Ведення інтеграції та тонкої настройки LLM (як-от GPT, Gemini, Claude) та SLM (як-от Mistral, Llama, Gemma) з використанням таких технік, як HyDE, RAG, PEFT, qLORA та LORA для отримання та генерації висновків з складних наборів даних.
- Співпраця з командами інженерії даних для розробки надійних конвеєрів даних та інженерами інфраструктури для впровадження масштабованих та ефективних систем NLP у виробничих середовищах.
- Залишатися на передовій у галузі досліджуючи та впроваджуючи передові техніки у NLP та оптимізуючи робочі процеси ML, використовуючи прогресивні інструменти як-от PyTorch та DVC.
- Займатися технічними дискусіями, застосовувати найкращі практики у ML та NLP, і вести вирішення проблем для забезпечення високоякісних рішень.
- Брати на себе відповідальність за довгострокові технічні стратегії, що сприяють інноваціям та рухають місію компанії вперед.
- Залучати до співпраці міждисциплінарні команди, включаючи дослідників R&D та головного наукового офіцера, щоб зрозуміти та моделювати біологічні складнощі, сприяючи обміну знаннями між дисциплінами.
- Очолювати та брати участь у агільних практиках, таких як планування спринтів, оцінка, проектування та огляд коду для підтримки надійного процесу розробки.
- Менторство молодших інженерів, просування культури навчання і досконалості, та встановлення найкращих галузевих практик в розробці систем ML і NLP.
Ідеальний кандидат буде мати:
- 5+ років досвіду застосування передових технік ML та NLP, з доведеним досвідом впровадження виробничих систем.
- Експертний рівень володіння Python і основними програмними концепціями, з великим досвідом у технологіях і фреймворках NLP, таких як PyTorch.
- Демонстроване знайомство з LLM (GPT, Gemini, Claude) та SLM (Mistral, Llama, Gemma) у недавніх роботах або проектах.
- Сильні навички інженерії даних, включаючи маніпулювання та обробку з використанням SQL, pandas або подібних технологій, та досвід у техніках тонкої настройки, таких як HyDE, RAG, PEFT, qLORA