Software Engineer, Data.

Job expired!

Местоположение: Гибридный - гибкие рабочие места (Лондон, Сан-Франциско, Торонто, удаленно)

Как инженер-программист по данным в Autodesk Research, вы будете сотрудничать с исследователями и инженерами мирового уровня для разработки инновационных функций продуктов, основанных на машинном обучении. Наша цель – создать масштабируемые конвейеры данных для агрегации, подготовки и обработки данных для приложений машинного обучения. Вы должны иметь страсть к решению проблем и созданию решений, которые помогают нашим клиентам представить, спроектировать и создать лучший мир.

Эта роль включает работу на пересечении исследований и разработки продуктов, где у вас будет возможность разрабатывать функции генеративного ИИ в продуктах Autodesk. Вы будете подчиняться старшему менеджеру по генеративному ИИ в Autodesk Research и работать в гибридном режиме с гибким графиком.

  • Сотрудничество с разнообразной, глобальной командой исследователей и инженеров по инженерным проектам.
  • Разработка масштабируемых распределенных систем для обработки, фильтрации и развертывания наборов данных для машинного обучения.
  • Обработка больших, неструктурированных мульти-модальных источников данных (текст, изображения, 3D модели, фрагменты кода, метаданные) для пригодности машинного обучения.
  • Проведение и анализ экспериментов с данными для получения полезных выводов.
  • Создание визуализаций данных и сводок для передачи характеристик данных исследователям и руководству.
  • Сотрудничество с юридическими и доверительными командами для обеспечения этичного и соответствующего использования данных.
  • Разработка защищенных конвейеров данных, соблюдая лучшие практики в области безопасности.
  • Написание хорошо документированного, тестируемого и легко понимаемого кода.
  • Диагностика и предоставление решений для возникающих проблем.
  • Степень бакалавра или магистра в области компьютерных наук или эквивалентный опыт работы в отрасли.
  • 3+ лет опыта работы с контролем версий программного обеспечения, модульным тестированием и конвейерами развертывания.
  • Опыт моделирования данных, архитектуры и обработки для различных представлений данных, включая 2D и 3D геометрию.
  • Знание облачных сервисов и архитектур (например, AWS, Azure).
  • Умение документировать код, архитектуры и эксперименты.
  • Опыт работы с реляционными (например, MySQL, PostgreSQL) и NoSQL базами данных (например, MongoDB, Cassandra).
  • Знание таких фреймворков, как Ray data, Metaflow, Hadoop, Spark или Hive.
  • Опыт работы с хранилищами векторных данных.
  • Рабочие навыки в системах Linux и терминалах bash.
  • Знания облачных архитектур и сетевых концепций.
  • Опыт работы с вычислительной геометрией, такой как обработка данных представления сеток или границ.
  • Опыт поиска и извлечения CAD-моделей в PLM-системах или других поисковых базах данных CAD.
  • Хорошие знания статистики и инструментов анализа данных, таких как Pandas, Matplotlib, Seaborn, Plotly, R и т.д.
  • Знакомство с отраслями проектирования, производства, AEC или медиа и развлечений.
  • Опыт использования продуктов Autodesk или аналогичных (CAD, CAE, CAM).
  • Проактивность в предоставлении решений и желание учиться и развивать новые технологии.
  • Умение создавать прототипы с нуля и писать поддерживаемый код в существующих кодовых базах.
  • Удовольствие от обучения и сотрудничества по