Data and Machine Learning Engineering Lead

Job expired!

Номер ссылки: R2749545

Название должности: Руководитель по разработке данных и машинного обучения

Отдел: Разработка данных

Местоположение: Центр Торонто, Онтарио

В Sanofi мы стремимся предоставлять современные решения в области здравоохранения, чтобы удовлетворять потребности пациентов и клиентов. Используя данные и инновационные технологии ИИ, мы стремимся решать проблемы здравоохранения более эффективно, чем когда-либо. Присоединяйтесь к нашей цифровой команде в качестве Руководителя по разработке данных и машинного обучения и внесите вклад в новаторские достижения в области здравоохранения.

Как динамичный Руководитель по разработке данных и машинного обучения, вы будете влиятельным лидером с практическим опытом развертывания масштабируемых систем данных и машинного обучения. Вы будете применять передовые методы разработки данных и машинного обучения, обеспечивая технически надежное управление жизненным циклом. Вы также будете превосходно справляться с наставничеством и управлением инженерами данных и машинного обучения, способствуя их профессиональному росту и обеспечивая успех проектов.

  • Предлагать и устанавливать технические решения для удовлетворения бизнес и технических требований.
  • Разрабатывать и поддерживать решения по разработке данных и машинного обучения на основе требований и проектных спецификаций, используя соответствующие инструменты и технологии.
  • Создавать и оптимизировать конвейеры данных/ETL для повышения производительности.
  • Внедрять практики MLOps для упрощения развертывания, мониторинга и управления моделями машинного обучения.
  • Наставлять и управлять младшими инженерами по данным и машинному обучению, предоставляя руководство, наставничество и поддержку.
  • Работать с бизнес и продуктовыми командами для понимания требований и их преобразования в технические потребности.
  • Использовать существующие или создавать новые стандартные конвейеры данных внутри Sanofi для увеличения ценности через внедрение бизнес-кейсов.
  • Разрабатывать автоматизированные тесты для CI/CD конвейеров.
  • Собирать и организовывать большие и сложные наборы данных, а также выполнять соответствующий анализ.
  • Проводить одноранговые обзоры для обеспечения качества, консистентности и строгости решений на уровне производства.

Квалификации:

  • Степень бакалавра или эквивалент в области компьютерных наук, инженерии или смежных областях.
  • Более 6 лет опыта в сфере обработки данных, интеграции, создания хранилищ данных, бизнес-аналитики или аналогичной роли.
  • Опыт работы с такими технологиями и инструментами, как Spark/Scala, Informatica/IICS/dbt.
  • Сильное понимание структуры данных и алгоритмов.
  • Знание скриптовых языков (Python, Shell Scripting).
  • Опыт работы с облачными платформами данных (Snowflake будет плюсом).
  • Опыт работы с инструментами планирования и оркестровки задач (Airflow будет плюсом).
  • Способность работать с кросс-функциональными командами для решения сложных проблем архитектуры и разработки данных.
  • Профессийные навыки работы с SQL и реляционными базами данных/концепциями.
  • Опыт работы с моделями данных и оптимизацией запросов.
  • Знание практик DataOps и MLOps для развертывания, мониторинга и управления моделями машинного обучения в производственной среде.

Будет плюсом:

  • Опыт работы в сфере наук о жизни/фармацевтической промышленности.
  • Знание сред загрузки данных (пакетная, почти реального времени, потоковая).
  • Понимание концепций и архитектур хранилищ данных (Data Mesh будет