Russian
- English
- Spanish
- French
- Ukrainian
- Polish
- Japanese
- Egyptian

Инженер по данным - Хаб Дата Саенс

Data Engineer
Other places
$122 K - $190 K

Full Time

Job expired!

Описание работы

Диапазон зарплаты для данной вакансии (средняя) - 12,300 - 17,600 польских злотых брутто (трудовой договор)

Гибридная модель работы, сочетающая решения, разработанные лидером и командой

Хаб Дата-сайенс (DSH) - это место, где мы решаем различные бизнес-проблемы, используя аналитические методы и машинное обучение. Мы делаем выводы и принимаем решения на основе терабайтов данных, обрабатываемых ежедневно. Наша команда - отличное место для людей, которые ищут возможности для постоянного развития, и уникальный шанс получить междисциплинарные знания о том, как работают торговые площадки электронной коммерции. Вариативность затрагиваемых бизнес-доменов лучше всего описывается разнообразным портфолио проектов, включая:

логистику - прогнозирование времени доставки, оптимизация логистической сети
маркетинг - рекомендация категорий, прогнозирование следующих покупок
ценообразование - оптимизация цен
финансы - прогнозирование продаж
и многое другое...

Хаб Дата-сайенс состоит из 5 команд:

3 команды данных
Команда аналитиков данных
Команда инженеров данных

Мы нанимаем в команду инженеров данных, где мы сосредотачиваемся на обработке и подготовке данных, развертывании и обслуживании наших проектов, и передаче наших навыков остальным членам команды.

Присоединяйтесь к нашей команде, чтобы углубить свои навыки, связанные с применением передовых методов обработки данных и подходов машинного обучения в MLOps.

Мы ищем людей, которые:

Владеют SQL на хорошем уровне и способны работать с традиционными движками (например, MySQL, PostgreSQL) или облачными движками (например, BigQuery, Snowflake). Вы будете работать с SQL ежедневно.
Имеют опыт программирования на Python и знакомы с передовыми методами разработки программного обеспечения (PEP8, чистая архитектура, ревью кода, CI/CD и т.д.)
Имеют позитивное отношение и умеют работать в команде
Стремятся постоянно развиваться и расширять свои знания

Кроме того, будет преимуществом, если вы имеете:

Опыт работы с экосистемой Big Data (Spark, Airflow)
Знания инструментов BigData в Google Cloud Platform или других облачных сервисах (например, AWS, Azure)
Коммерческий опыт в DevOps и практике CI/CD (например, GitHub Actions) в области ML/AI
Опыт работы с архитектурой облачных приложений

Наш технологический стек:

Python
Google Cloud Platform (AirFlow, BigQuery, Composer)
GitHub (хранение кода, CI/CD, хостинг нашей собственной библиотеки Python для Data Science)

Что мы предлагаем:

Гибридную модель работы, которую вы согласуете с вашим руководителем и командой. У нас есть удобно расположенные офисы (с полностью оборудованными кухнями и стоянками для велосипедов) и отличные рабочие инструменты (регулируемые по высоте столы, интерактивные переговорные).
Годовой бонус до 10% от годовой брутто-зарплаты (в зависимости от вашей годовой оценки и результатов компании).
Большой выбор дополнительных льгот в плане кафетерия - вы выбираете то, что вам нравится (например, медицинские, спортивные или обеденные пакеты, страхование, покупка ваучеров).
Оплачиваемые уроки английского языка, связанные с конкретной спецификой вашей работы.
Работу в команде, на которую вы всегда можете положиться - у нас работают специалисты и эксперты высшего класса.
Высокую степень автономии в организации работы вашей команды; мы поощряем постоянное развитие и пробуем новые вещи.
Хакатоны, корпоративы, бюджет на обучение и внутреннюю образовательную платформу, MindUp (включая обучение по организации работы, средствам связи, мотивации к работе, а также различным технологиям и предметам).

Ваши обязанности будут включать:

Активное создание инструментов обработки данных для моделирования и анализа - в тесном сотрудничестве с командами Data Science.
Помощь командам Data Science в разработке источников данных для ад-хок анализов и проектов машинного обучения.
Обработка терабайтов данных с использованием Google Cloud Platform BigQuery, Composer, Dataflow, и PySpark, при этом оптимизируя процессы с точки зрения их производительности и стоимости обработки данных в облаке GCP.
Сбор требований к процессам от проектных групп и автоматизация задач, связанных с предварительной обработкой и контролем качества данных, обслуживанием прогнозов, а также мониторингом машинных моделей обучения и их повторным обучением.
Поддержание инженерного качества каждого проекта и сотрудничество с коллегами по вопросам инженерного совершенства.

Почему стоит работать с нами?

У вас будет значительное влияние на одну из крупнейших площадок электронной коммерции в мире посредством предоставляемых вами данных и процессов.
Учитывая широкий спектр проектов, в которых мы участвуем, вам никогда не будет скучно.
У вас будет доступ к огромным наборам данных (измеряемых в петабайтах).
Вы будете работать с командой опытных инженеров и специалистов по BigData, которые готовы делиться своими знаниями (включая общественность, в рамках allegro.tech).
Ваш профессиональный рост будет идти в ногу с самыми свежими открытого доступа технологическими трендами.
У вас будет реальное влияние на направление развития продукта и выбор технологии - мы используем самые новые и лучшие технологические решения, потому что они тесно соответствуют нашим потребностям.
Мы - полноценный поставщик - мы проектируем, кодируем, тестируем, разворачиваем и поддерживаем наши решения.

Подайте заявку в Allegro и узнайте, почему здесь хорошо!