R&D Data Engineer in AI and Computer Vision

Job expired!

Eviden, часть группы Atos, является мировым лидером в области основанной на данных, надежной и устойчивой цифровой трансформации с ежегодным доходом примерно €5 миллиардов. Как цифровой бизнес следующего поколения, мы занимаем ведущие позиции в мире в области цифровых технологий, облаков, данных, высокопроизводительных вычислений и безопасности. Наша глубокая экспертиза охватывает более 47 стран, объединяя уникальные высококлассные технологии с 47 000 талантов мирового класса, расширяя возможности данных и технологий для будущих поколений.

Мы разрабатываем Платформу компьютерного зрения Eviden, передовое решение для анализа видео в реальном времени, применимое в различных отраслях. Используя технологии искусственного интеллекта и компоненты программного обеспечения Big Data, мы разрабатываем и улучшаем наш продукт для управления комплексными операциями с данными.

Мы ищем квалифицированного и мотивированного инженера по данным, чтобы присоединиться к нашей команде. Эта роль включает в себя реализацию конвейера данных от начала до конца и управление озером данных для поддержки наших инновационных проектов.

  • Создание и поддержка надежных конвейеров данных для загрузки, преобразования и загрузки данных из различных источников, обеспечивая качество, согласованность и надежность данных.
  • Реализация логики преобразования данных для преобразования сырых данных в структурированные форматы, подходящие для анализа и отчетности, используя процессы ETL/ELT.
  • Управление инфраструктурой платформы данных, оптимизация использования хранилища и обеспечение доступа к данным.
  • Реализация и обеспечение мер безопасности данных, контроль доступа и соблюдение стандартов для поддержания целостности и конфиденциальности данных.
  • Разработка эффективных механизмов поиска и извлечения данных, учитывая релевантность, производительность запросов и опыт пользователей.
  • Мониторинг и оптимизация производительности конвейеров данных и систем хранения для эффективной обработки и извлечения данных.
  • Поддержка полной документации по проектированию конвейеров данных, процессам и конфигурациям.
  • Автоматизация сборки, тестирования и развертывания компонентов озера данных, следуя DevOps-практикам.
  • Реализация модульных и интеграционных тестов, передача знаний среди команды.
  • Безопасное управление активами ИИ, такими как наборы данных и модели.
  • Интеграция компонентов извлечения метаданных с использованием моделей ИИ и сторонних инструментов.
  • Эффективное сотрудничество с межфункциональными командами, включая data scientists, data engineers, frontend и backend разработчиков и product owners.

Бакалавр, магистр или кандидат наук в области компьютерных наук, электротехники или смежных областей.

  • Подтвержденный опыт (3+ лет) в проектировании, создании и поддержке масштабных конвейеров данных и инфраструктуры озера данных.
  • Высокая степень владения языками программирования, такими как Python.
  • Практический опыт разработки REST API.
  • Опыт работы с Elasticsearch, включая загрузку данных, их индексирование и возможности поиска.
  • Знание моделирования данных, проектирования схем и процессов ETL/ELT.
  • Опыт работы с Docker и Kubernetes для развертывания программных приложений.
  • Опыт использования Git и GitHub Actions.
  • Практика гибкой методологии.
  • Уверенное владение Linux средами (bash или shell).
  • Уровень английского языка B2.

  • Опыт работы с инструментами MLOps, такими как MLFlow или Kubeflow.
  • Опыт работы с платформой Google Cloud (GCP).
  • Знание программирования CPU vs GPU.
  • Общие знания о кластерах.