Machine Learning Engineer - Inference (Accelerated AI)

Job expired!

Together AI активно ищет талантливого инженера по машинному обучению, чтобы присоединиться к нашей динамичной команде движка вывода. Эта ключевая роль сосредоточена на оптимизации и улучшении производительности наших систем вывода ИИ, используя новейшие большие языковые модели для обеспечения эффективности и масштабируемости.

Если вы увлечены выводом ИИ, хорошо владеете PyTorch и имеете навыки разработки высокопроизводительных систем, мы хотим услышать от вас. Эта позиция предоставляет исключительную возможность сотрудничать с ведущими исследователями и инженерами ИИ в создании передовых решений ИИ. Присоединяйтесь к Together AI и формируйте будущее ИИ!

  • Проектирование и разработка передовых производственных систем, которые поддерживают движок вывода Together AI, обеспечивая надежность и производительность в крупных масштабах.
  • Оптимизация сервисов времени выполнения вывода для обширных приложений ИИ.
  • Сотрудничество с исследователями, инженерами, менеджерами по продуктам и дизайнерами для внедрения новых функций и исследовательских возможностей.
  • Проведение тщательных обзоров дизайна и кода для поддержания самых высоких стандартов качества.
  • Создание сервисов, инструментов и подробной документации для разработчиков, поддерживающих движок вывода.
  • Реализация надежных и отказоустойчивых систем для приема и обработки данных.
  • Минимум 3 года опыта написания высокопроизводительного, протестированного и качественного кода для производства.
  • Знание Python и PyTorch.
  • Продемонстрированный опыт в создании высокопроизводительных библиотек и инструментов.
  • Исключительное понимание низкоуровневых концепций операционных систем, включая многопоточность, управление памятью, сети, хранение данных, производительность и масштабируемость.

Предпочтительные квалификации

  • Знание существующих систем вывода ИИ, таких как TGI, vLLM, TensorRT-LLM, Optimum.
  • Знакомство с техниками вывода ИИ, такими как спекулятивное декодирование.
  • Опыт программирования на CUDA/Triton.
  • Желательно: знание Rust, Cython и компиляторов.

Together AI — это ведущая компания в области искусственного интеллекта, движимая исследованиями. Мы привержены открытым и прозрачным системам ИИ, которые способствуют инновациям и обеспечивают наилучшие результаты для общества. Наша миссия состоит в значительном снижении стоимости современных систем ИИ через совместное проектирование программного обеспечения, аппаратных средств, алгоритмов и моделей.

Мы внесли вклад в ведущие исследовательские проекты с открытым исходным кодом, модели и наборы данных для продвижения рубежей ИИ. Наша команда сыграла ключевую роль в технологических прорывах, таких как FlashAttention, Hyena, FlexGen и RedPajama. Присоединяйтесь к нашей страстной группе исследователей и инженеров в нашем пути к созданию инфраструктуры ИИ следующего поколения.

Мы предлагаем конкурентоспособный пакет компенсаций, включая акции стартапа, медицинскую страховку и другие впечатляющие льготы. Диапазон базовой зарплаты в США для этой полной позиции составляет $160,000 - $220,000, плюс акции и льготы. Наши диапазоны зарплат определяются местоположением, уровнем и ролью, с индивидуальной компенсацией на основе опыта, навыков и знаний, связанных с работой.

Together AI гордится тем, что является работодателем, предоставляющим равные возможности, предлагая равные возможности трудоустройства всем, независимо от расы, цвета кожи, происхождения, религии, пола, национальности, сексуальной ориентации, возраста, гражданства, семейного положения, инвалидности, гендерной идентичности, статуса ветерана и др.