Machine Learning Research Engineer

Job expired!

Про Neural Magic

Neural Magic розташована в Somerville, Массачусетс, і є стартапом серії A, підтримуваним провідними інвесторами, включаючи Andreessen Horowitz, NEA, Pillar, VMware, Verizon Ventures, Comcast Ventures та Amdocs. У Neural Magic ми захоплені тим, щоб зробити штучний інтелект відкритим і доступним. Наша місія полягає у підтримці підприємств по всьому світу за допомогою open-source LLMs та VLLM, прискорюючи впровадження штучного інтелекту та спрощуючи розгортання GenAI. Як ключовий учасник проекту vLLM та піонери в області квантізації та розрідження моделей, Neural Magic пропонує міцну платформу для підприємств для побудови, оптимізації та масштабування своїх реалізацій LLM.

Наша місія

Наша місія - демократизувати силу відкритих LLMs та vLLM, надаючи їх кожному підприємству у всьому світі.

Ваша роль

Як Research Engineer у сфері машинного навчання в Neural Magic, ви будете стимулювати інновації, співпрацюючи з нашою командою для вирішення найважливіших завдань у продуктивності та ефективності моделей. Ваша робота суттєво вплине на розвиток нашої сучасної програмної платформи, формуючи майбутнє розгортання та використання штучного інтелекту.

Приєднуйтесь до нашої захоплюючої подорожі у трансформації ландшафту штучного інтелекту!

Дослідження та інновації: Керування розробкою новаторських дослідницьких проектів, спрямованих на покращення продуктивності, ефективності та масштабованості LLM.
Прототипування та експерименти: Розробка та впровадження прототипів для тестування нових алгоритмів та технік, постійно розширюючи межі оптимізації моделей та обслуговування під час інференції.
Аналіз та оцінка: Проведення комплексних експериментів та аналізів, документування результатів та обмін інсайтами з командою.
Співпраця та комунікація: Тісна співпраця з продуктово-інженерними командами для перетворення дослідницьких прототипів у готові до виробництва функції, забезпечуючи безшовну інтеграцію з нашою платформою.
Внесок та обмін знаннями: Постійне оновлення знань про останні досягнення у галузі, участь у open-source проектах та поширення своїх результатів через публікації та презентації.

Дослідницька експертиза: Доведений досвід проведення незалежних досліджень або участі у дослідницьких проектах, особливо у сфері LLM або generative AI.
Технічна компетентність: Володіння програмуванням на Python з глибоким розумінням PyTorch або подібних фреймворків глибокого навчання.
Досвід оптимізації: Знання в області технік оптимізації моделей, таких як обрізка, квантізація, дистиляція або інші методи підвищення продуктивності.
Навички вирішення проблем: Сильна здатність виявляти та вирішувати складні технічні виклики, застосовуючи теоретичні знання до практичних застосувань.
Навички комунікації: Відмінні навички письмової та усної ком