R&D Data Engineer in AI and Computer Vision

Computer Vision
Madrid
07/01/2024
-

Job expired!

Eviden, часть группы Atos, является мировым лидером в области основанной на данных, надежной и устойчивой цифровой трансформации с ежегодным доходом примерно €5 миллиардов. Как цифровой бизнес следующего поколения, мы занимаем ведущие позиции в мире в области цифровых технологий, облаков, данных, высокопроизводительных вычислений и безопасности. Наша глубокая экспертиза охватывает более 47 стран, объединяя уникальные высококлассные технологии с 47 000 талантов мирового класса, расширяя возможности данных и технологий для будущих поколений.

Мы разрабатываем Платформу компьютерного зрения Eviden, передовое решение для анализа видео в реальном времени, применимое в различных отраслях. Используя технологии искусственного интеллекта и компоненты программного обеспечения Big Data, мы разрабатываем и улучшаем наш продукт для управления комплексными операциями с данными.

Мы ищем квалифицированного и мотивированного инженера по данным, чтобы присоединиться к нашей команде. Эта роль включает в себя реализацию конвейера данных от начала до конца и управление озером данных для поддержки наших инновационных проектов.

Создание и поддержка надежных конвейеров данных для загрузки, преобразования и загрузки данных из различных источников, обеспечивая качество, согласованность и надежность данных.
Реализация логики преобразования данных для преобразования сырых данных в структурированные форматы, подходящие для анализа и отчетности, используя процессы ETL/ELT.
Управление инфраструктурой платформы данных, оптимизация использования хранилища и обеспечение доступа к данным.
Реализация и обеспечение мер безопасности данных, контроль доступа и соблюдение стандартов для поддержания целостности и конфиденциальности данных.
Разработка эффективных механизмов поиска и извлечения данных, учитывая релевантность, производительность запросов и опыт пользователей.
Мониторинг и оптимизация производительности конвейеров данных и систем хранения для эффективной обработки и извлечения данных.
Поддержка полной документации по проектированию конвейеров данных, процессам и конфигурациям.
Автоматизация сборки, тестирования и развертывания компонентов озера данных, следуя DevOps-практикам.
Реализация модульных и интеграционных тестов, передача знаний среди команды.
Безопасное управление активами ИИ, такими как наборы данных и модели.
Интеграция компонентов извлечения метаданных с использованием моделей ИИ и сторонних инструментов.
Эффективное сотрудничество с межфункциональными командами, включая data scientists, data engineers, frontend и backend разработчиков и product owners.

Бакалавр, магистр или кандидат наук в области компьютерных наук, электротехники или смежных областей.

Подтвержденный опыт (3+ лет) в проектировании, создании и поддержке масштабных конвейеров данных и инфраструктуры озера данных.
Высокая степень владения языками программирования, такими как Python.
Практический опыт разработки REST API.
Опыт работы с Elasticsearch, включая загрузку данных, их индексирование и возможности поиска.
Знание моделирования данных, проектирования схем и процессов ETL/ELT.
Опыт работы с Docker и Kubernetes для развертывания программных приложений.
Опыт использования Git и GitHub Actions.
Практика гибкой методологии.
Уверенное владение Linux средами (bash или shell).
Уровень английского языка B2.