Инженер по данным - Хаб Дата Саенс

  • Full Time
Job expired!

Описание работы

Диапазон зарплаты для данной вакансии (средняя) - 12,300 - 17,600 польских злотых брутто (трудовой договор)

Гибридная модель работы, сочетающая решения, разработанные лидером и командой

Хаб Дата-сайенс (DSH) - это место, где мы решаем различные бизнес-проблемы, используя аналитические методы и машинное обучение. Мы делаем выводы и принимаем решения на основе терабайтов данных, обрабатываемых ежедневно. Наша команда - отличное место для людей, которые ищут возможности для постоянного развития, и уникальный шанс получить междисциплинарные знания о том, как работают торговые площадки электронной коммерции. Вариативность затрагиваемых бизнес-доменов лучше всего описывается разнообразным портфолио проектов, включая:

  • логистику - прогнозирование времени доставки, оптимизация логистической сети
  • маркетинг - рекомендация категорий, прогнозирование следующих покупок
  • ценообразование - оптимизация цен
  • финансы - прогнозирование продаж
  • и многое другое...

Хаб Дата-сайенс состоит из 5 команд:

  • 3 команды данных
  • Команда аналитиков данных
  • Команда инженеров данных

Мы нанимаем в команду инженеров данных, где мы сосредотачиваемся на обработке и подготовке данных, развертывании и обслуживании наших проектов, и передаче наших навыков остальным членам команды.

Присоединяйтесь к нашей команде, чтобы углубить свои навыки, связанные с применением передовых методов обработки данных и подходов машинного обучения в MLOps.

Мы ищем людей, которые:

  • Владеют SQL на хорошем уровне и способны работать с традиционными движками (например, MySQL, PostgreSQL) или облачными движками (например, BigQuery, Snowflake). Вы будете работать с SQL ежедневно.
  • Имеют опыт программирования на Python и знакомы с передовыми методами разработки программного обеспечения (PEP8, чистая архитектура, ревью кода, CI/CD и т.д.)
  • Имеют позитивное отношение и умеют работать в команде
  • Стремятся постоянно развиваться и расширять свои знания

Кроме того, будет преимуществом, если вы имеете:

  • Опыт работы с экосистемой Big Data (Spark, Airflow)
  • Знания инструментов BigData в Google Cloud Platform или других облачных сервисах (например, AWS, Azure)
  • Коммерческий опыт в DevOps и практике CI/CD (например, GitHub Actions) в области ML/AI
  • Опыт работы с архитектурой облачных приложений

Наш технологический стек:

  • Python
  • Google Cloud Platform (AirFlow, BigQuery, Composer)
  • GitHub (хранение кода, CI/CD, хостинг нашей собственной библиотеки Python для Data Science)

Что мы предлагаем:

  • Гибридную модель работы, которую вы согласуете с вашим руководителем и командой. У нас есть удобно расположенные офисы (с полностью оборудованными кухнями и стоянками для велосипедов) и отличные рабочие инструменты (регулируемые по высоте столы, интерактивные переговорные).
  • Годовой бонус до 10% от годовой брутто-зарплаты (в зависимости от вашей годовой оценки и результатов компании).
  • Большой выбор дополнительных льгот в плане кафетерия - вы выбираете то, что вам нравится (например, медицинские, спортивные или обеденные пакеты, страхование, покупка ваучеров).
  • Оплачиваемые уроки английского языка, связанные с конкретной спецификой вашей работы.
  • Работу в команде, на которую вы всегда можете положиться - у нас работают специалисты и эксперты высшего класса.
  • Высокую степень автономии в организации работы вашей команды; мы поощряем постоянное развитие и пробуем новые вещи.
  • Хакатоны, корпоративы, бюджет на обучение и внутреннюю образовательную платформу, MindUp (включая обучение по организации работы, средствам связи, мотивации к работе, а также различным технологиям и предметам).

Ваши обязанности будут включать:

  • Активное создание инструментов обработки данных для моделирования и анализа - в тесном сотрудничестве с командами Data Science.
  • Помощь командам Data Science в разработке источников данных для ад-хок анализов и проектов машинного обучения.
  • Обработка терабайтов данных с использованием Google Cloud Platform BigQuery, Composer, Dataflow, и PySpark, при этом оптимизируя процессы с точки зрения их производительности и стоимости обработки данных в облаке GCP.
  • Сбор требований к процессам от проектных групп и автоматизация задач, связанных с предварительной обработкой и контролем качества данных, обслуживанием прогнозов, а также мониторингом машинных моделей обучения и их повторным обучением.
  • Поддержание инженерного качества каждого проекта и сотрудничество с коллегами по вопросам инженерного совершенства.

Почему стоит работать с нами?

  • У вас будет значительное влияние на одну из крупнейших площадок электронной коммерции в мире посредством предоставляемых вами данных и процессов.
  • Учитывая широкий спектр проектов, в которых мы участвуем, вам никогда не будет скучно.
  • У вас будет доступ к огромным наборам данных (измеряемых в петабайтах).
  • Вы будете работать с командой опытных инженеров и специалистов по BigData, которые готовы делиться своими знаниями (включая общественность, в рамках allegro.tech).
  • Ваш профессиональный рост будет идти в ногу с самыми свежими открытого доступа технологическими трендами.
  • У вас будет реальное влияние на направление развития продукта и выбор технологии - мы используем самые новые и лучшие технологические решения, потому что они тесно соответствуют нашим потребностям.
  • Мы - полноценный поставщик - мы проектируем, кодируем, тестируем, разворачиваем и поддерживаем наши решения.

Подайте заявку в Allegro и узнайте, почему здесь хорошо!