Eviden, часть группы Atos, является мировым лидером в области основанной на данных, надежной и устойчивой цифровой трансформации с ежегодным доходом примерно €5 миллиардов. Как цифровой бизнес следующего поколения, мы занимаем ведущие позиции в мире в области цифровых технологий, облаков, данных, высокопроизводительных вычислений и безопасности. Наша глубокая экспертиза охватывает более 47 стран, объединяя уникальные высококлассные технологии с 47 000 талантов мирового класса, расширяя возможности данных и технологий для будущих поколений.
Мы разрабатываем Платформу компьютерного зрения Eviden, передовое решение для анализа видео в реальном времени, применимое в различных отраслях. Используя технологии искусственного интеллекта и компоненты программного обеспечения Big Data, мы разрабатываем и улучшаем наш продукт для управления комплексными операциями с данными.
Мы ищем квалифицированного и мотивированного инженера по данным, чтобы присоединиться к нашей команде. Эта роль включает в себя реализацию конвейера данных от начала до конца и управление озером данных для поддержки наших инновационных проектов.
- Создание и поддержка надежных конвейеров данных для загрузки, преобразования и загрузки данных из различных источников, обеспечивая качество, согласованность и надежность данных.
- Реализация логики преобразования данных для преобразования сырых данных в структурированные форматы, подходящие для анализа и отчетности, используя процессы ETL/ELT.
- Управление инфраструктурой платформы данных, оптимизация использования хранилища и обеспечение доступа к данным.
- Реализация и обеспечение мер безопасности данных, контроль доступа и соблюдение стандартов для поддержания целостности и конфиденциальности данных.
- Разработка эффективных механизмов поиска и извлечения данных, учитывая релевантность, производительность запросов и опыт пользователей.
- Мониторинг и оптимизация производительности конвейеров данных и систем хранения для эффективной обработки и извлечения данных.
- Поддержка полной документации по проектированию конвейеров данных, процессам и конфигурациям.
- Автоматизация сборки, тестирования и развертывания компонентов озера данных, следуя DevOps-практикам.
- Реализация модульных и интеграционных тестов, передача знаний среди команды.
- Безопасное управление активами ИИ, такими как наборы данных и модели.
- Интеграция компонентов извлечения метаданных с использованием моделей ИИ и сторонних инструментов.
- Эффективное сотрудничество с межфункциональными командами, включая data scientists, data engineers, frontend и backend разработчиков и product owners.
Бакалавр, магистр или кандидат наук в области компьютерных наук, электротехники или смежных областей.
- Подтвержденный опыт (3+ лет) в проектировании, создании и поддержке масштабных конвейеров данных и инфраструктуры озера данных.
- Высокая степень владения языками программирования, такими как Python.
- Практический опыт разработки REST API.
- Опыт работы с Elasticsearch, включая загрузку данных, их индексирование и возможности поиска.
- Знание моделирования данных, проектирования схем и процессов ETL/ELT.
- Опыт работы с Docker и Kubernetes для развертывания программных приложений.
- Опыт использования Git и GitHub Actions.
- Практика гибкой методологии.
- Уверенное владение Linux средами (bash или shell).
- Уровень английского языка B2.
- Опыт работы с инструментами MLOps, такими как MLFlow или Kubeflow.
- Опыт работы с платформой Google Cloud (GCP).
- Знание программирования CPU vs GPU.
- Общие знания о кластерах.