Описание работы
Диапазон зарплаты для данной вакансии (средняя) - 12,300 - 17,600 польских злотых брутто (трудовой договор)
Гибридная модель работы, сочетающая решения, разработанные лидером и командой
Хаб Дата-сайенс (DSH) - это место, где мы решаем различные бизнес-проблемы, используя аналитические методы и машинное обучение. Мы делаем выводы и принимаем решения на основе терабайтов данных, обрабатываемых ежедневно. Наша команда - отличное место для людей, которые ищут возможности для постоянного развития, и уникальный шанс получить междисциплинарные знания о том, как работают торговые площадки электронной коммерции. Вариативность затрагиваемых бизнес-доменов лучше всего описывается разнообразным портфолио проектов, включая:
- логистику - прогнозирование времени доставки, оптимизация логистической сети
- маркетинг - рекомендация категорий, прогнозирование следующих покупок
- ценообразование - оптимизация цен
- финансы - прогнозирование продаж
- и многое другое...
Хаб Дата-сайенс состоит из 5 команд:
- 3 команды данных
- Команда аналитиков данных
- Команда инженеров данных
Мы нанимаем в команду инженеров данных, где мы сосредотачиваемся на обработке и подготовке данных, развертывании и обслуживании наших проектов, и передаче наших навыков остальным членам команды.
Присоединяйтесь к нашей команде, чтобы углубить свои навыки, связанные с применением передовых методов обработки данных и подходов машинного обучения в MLOps.
Мы ищем людей, которые:
- Владеют SQL на хорошем уровне и способны работать с традиционными движками (например, MySQL, PostgreSQL) или облачными движками (например, BigQuery, Snowflake). Вы будете работать с SQL ежедневно.
- Имеют опыт программирования на Python и знакомы с передовыми методами разработки программного обеспечения (PEP8, чистая архитектура, ревью кода, CI/CD и т.д.)
- Имеют позитивное отношение и умеют работать в команде
- Стремятся постоянно развиваться и расширять свои знания
Кроме того, будет преимуществом, если вы имеете:
- Опыт работы с экосистемой Big Data (Spark, Airflow)
- Знания инструментов BigData в Google Cloud Platform или других облачных сервисах (например, AWS, Azure)
- Коммерческий опыт в DevOps и практике CI/CD (например, GitHub Actions) в области ML/AI
- Опыт работы с архитектурой облачных приложений
Наш технологический стек:
- Python
- Google Cloud Platform (AirFlow, BigQuery, Composer)
- GitHub (хранение кода, CI/CD, хостинг нашей собственной библиотеки Python для Data Science)
Что мы предлагаем:
- Гибридную модель работы, которую вы согласуете с вашим руководителем и командой. У нас есть удобно расположенные офисы (с полностью оборудованными кухнями и стоянками для велосипедов) и отличные рабочие инструменты (регулируемые по высоте столы, интерактивные переговорные).
- Годовой бонус до 10% от годовой брутто-зарплаты (в зависимости от вашей годовой оценки и результатов компании).
- Большой выбор дополнительных льгот в плане кафетерия - вы выбираете то, что вам нравится (например, медицинские, спортивные или обеденные пакеты, страхование, покупка ваучеров).
- Оплачиваемые уроки английского языка, связанные с конкретной спецификой вашей работы.
- Работу в команде, на которую вы всегда можете положиться - у нас работают специалисты и эксперты высшего класса.
- Высокую степень автономии в организации работы вашей команды; мы поощряем постоянное развитие и пробуем новые вещи.
- Хакатоны, корпоративы, бюджет на обучение и внутреннюю образовательную платформу, MindUp (включая обучение по организации работы, средствам связи, мотивации к работе, а также различным технологиям и предметам).
Ваши обязанности будут включать:
- Активное создание инструментов обработки данных для моделирования и анализа - в тесном сотрудничестве с командами Data Science.
- Помощь командам Data Science в разработке источников данных для ад-хок анализов и проектов машинного обучения.
- Обработка терабайтов данных с использованием Google Cloud Platform BigQuery, Composer, Dataflow, и PySpark, при этом оптимизируя процессы с точки зрения их производительности и стоимости обработки данных в облаке GCP.
- Сбор требований к процессам от проектных групп и автоматизация задач, связанных с предварительной обработкой и контролем качества данных, обслуживанием прогнозов, а также мониторингом машинных моделей обучения и их повторным обучением.
- Поддержание инженерного качества каждого проекта и сотрудничество с коллегами по вопросам инженерного совершенства.
Почему стоит работать с нами?
- У вас будет значительное влияние на одну из крупнейших площадок электронной коммерции в мире посредством предоставляемых вами данных и процессов.
- Учитывая широкий спектр проектов, в которых мы участвуем, вам никогда не будет скучно.
- У вас будет доступ к огромным наборам данных (измеряемых в петабайтах).
- Вы будете работать с командой опытных инженеров и специалистов по BigData, которые готовы делиться своими знаниями (включая общественность, в рамках allegro.tech).
- Ваш профессиональный рост будет идти в ногу с самыми свежими открытого доступа технологическими трендами.
- У вас будет реальное влияние на направление развития продукта и выбор технологии - мы используем самые новые и лучшие технологические решения, потому что они тесно соответствуют нашим потребностям.
- Мы - полноценный поставщик - мы проектируем, кодируем, тестируем, разворачиваем и поддерживаем наши решения.
Подайте заявку в Allegro и узнайте, почему здесь хорошо!