Distributed ML Systems Engineer (Accelerated AI)

Job expired!

Вы увлекаетесь разработкой масштабируемых систем машинного обучения? Together AI ищет талантливого инженера по распределенным системам машинного обучения для разработки и оптимизации крупномасштабных, отказоустойчивых распределенных систем. Станьте частью революционной команды, которая формирует будущее ИИ. Работайте в тесном сотрудничестве с нашими талантливыми исследователями и командами инфраструктуры, чтобы обеспечить надежные и эффективные системы.

  • Проектировать и строить крупномасштабные распределенные системы машинного обучения, которые являются отказоустойчивыми и высокоэффективными.
  • Разрабатывать и оптимизировать фреймворки распределенной обработки и системы хранения.
  • Сотрудничать с исследователями, инженерами и менеджерами по продукту для интеграции систем машинного обучения в нашу инфраструктуру.
  • Проводить архитектурные и проектные обзоры для обеспечения лучших практик в проектировании систем.
  • Реализовать надежные системы мониторинга и логирования для обеспечения здоровья и производительности наших систем машинного обучения.
  • 3+ года опыта в построении крупномасштабных, отказоустойчивых и высокопроизводительных распределенных систем.
  • Сильные навыки программирования на одном или нескольких языках: Python, Go, Rust, или C/C++.
  • Отличное понимание низкоуровневых концепций операционных систем, включая многопоточность, управление памятью, сетевые взаимодействия и масштабирование производительности.
  • Опыт работы с облачными платформами (AWS, GCP, Azure и т.д.) и крупномасштабной инфраструктурой.
  • Сильные навыки решения проблем и способность работать в быстро меняющейся среде.
  • Предпочтительно: Опыт работы с Kubernetes.
  • Предпочтительно: Опыт работы с PyTorch.

Together AI — это ориентированная на исследования компания в области искусственного интеллекта, посвященная созданию открытых и прозрачных систем ИИ. Наша миссия — значительно снизить стоимость современных ИИ-систем, разрабатывая совместно программное обеспечение, оборудование, алгоритмы и модели. Наша команда продвинула технологии, такие как FlashAttention, Hyena, FlexGen и RedPajama. Присоединяйтесь к нашей увлеченной группе исследователей и инженеров, разрабатывающих инфраструктуру ИИ следующего поколения.

Мы предлагаем конкурентоспособное вознаграждение, акции стартапа, медицинское страхование и другие преимущества. Базовый оклад в США для этой полной ставки составляет от $160,000 до $220,000 плюс акции и льготы. Наши диапазоны зарплат определяются местоположением, уровнем и ролью. Индивидуальная компенсация будет основываться на опыте, навыках и связанных с работой знаниях.

Together AI гордится быть работодателем, предоставляющим равные возможности независимо от расы, цвета кожи, происхождения, религии, пола, национальности, сексуальной ориентации, возраста, гражданства, семейного положения, инвалидности, гендерной идентичности, статуса ветерана и других факторов.

Название компании: Together AI
Название должности: Инженер по распределенным системам машинного обучения (Ускоренный ИИ)