Вы будете участвовать в захватывающих проектах, которые охватывают весь жизненный цикл данных - от интеграции сырых данных с основными и сторонними системами, до сложного моделирования данных, состояния искусства визуализации данных и разработки инновационных продуктов на основе данных.
У вас будет возможность научиться строить и работать с пакетными и в реальном времени обрабатывающими данные конвейерами. Вы будете работать в современной облачной среде хранения данных вместе с командой разнообразных, интенсивных и интересных коллег. Вы будете сотрудничать с другими отделами - такими как продуктовый и технический, основные бизнес-вертикали, доверие и безопасность, финансы и другие - чтобы предоставить им возможность преуспеть.
Ваши обязанности
- Проектирование, реализация и поддержка хранилищ данных;
- Интеграция сырых данных с основными и сторонними системами
- Моделирование хранилища данных для операционных и прикладных слоев данных
- Разработка в кластере Amazon Redshift
- Разработка SQL в рамках гибкого рабочего процесса команды
- Проектирование и реализация ETL в Matillion ETL
- Реальные конвейеры обработки данных и приложения с использованием безсерверных и управляемых AWS-сервисов, таких как Lambda, Kinesis, API Gateway и т.д.
- Проектирование и реализация продуктов данных, обеспечивающих функции или бизнес-решения на основе данных
- Создание информационных панелей данных и продвинутых визуализаций в Sisense для команд облачного хранения данных (ранее известного как Periscope Data) с акцентом на UX, простоте и удобстве использования
- Сотрудничество с другими отделами по продуктам данных - такими как продукт и технология, маркетинг и рост, финансы, основной бизнес, реклама и другие
- Участие и вклад в сильную корпоративную культуру и стремление оставаться на грани больших данных
- Оценка и улучшение качества данных путем реализации тестовых случаев, оповещений и гарантий качества данных
- Соблюдение ценностей команды: Быстрее. Лучше. Проще.
- Сильное желание учиться
Необходимый минимальный опыт (обязателен)
- 1-2 года опыта работы с обработкой, анализом данных и решением проблем с большими объемами данных;
- Хорошие навыки SQL на разных технологиях реляционного хранения данных, особенно в облачном хранении данных (например, Amazon Redshift, Google BigQuery, Snowflake, Vertica и т. д.)
- По меньшей мере 1 год опыта использования одного или нескольких языков программирования, предпочтительно Python
- Способность передавать полученные знания и выводы неспециализированной аудитории
- Письменное и устное владение английским языком
- Предпринимательское мышление и творческая способность к мышлению; высокая мотивация и самоорганизация; сильное любопытство и постоянное стремление к обучению
- Диплом ведущего университета по технической специальности, такой как информатика, инженерия, математика, физика и т.д.
Дополнительный опыт (большой плюс)
- Опыт работы с ориентированными на клиента данными в больших объемах, предпочтительно в онлайн / электронной коммерции
- Опыт работы с современными инструментами ETL для больших данных (например, Matillion)
- Опыт работы с экосистемой данных AWS (или других облачных провайдеров)
- Подтвержденный опыт работы в области бизнес-интеллекта, развития и масштабирования хранилищ данных, моделирования данных
- Тегирование, отслеживание и отчетность с использованием Google Analytics 360
- Знание современных конвейеров обработки данных в реальном времени (например, бессерверный каркас, лямбда, кинезис и т. д.)
- Опыт работы с современными платформами визуализации данных, такими как Periscope, Looker, Tableau, Google Data Studio, etc.
- Знание Linux, bash scripting, Javascript, HTML, XML
- Опыт работы с Docker Containers и Kubernetes
#LI-TM1