Senior Data Engineer

Job expired!

В NocNoc мы ищем опытного старшего инженера по данным, чтобы усилить нашу динамичную команду. Эта ключевая роль включает в себя поддержание и развитие нашей мощной, масштабируемой платформы для данных, которая является жизненно важной для нашей стратегии работы с данными. Если вы самомотивированный человек, который успешно работает в поддержку разнообразных команд, систем и продуктов, мы хотели бы с вами познакомиться.

В качестве старшего инженера по данным вы будете:

  • Проектировать, создавать и оптимизировать конвейеры данных для ингестирования, очистки, преобразования и агрегации данных из множества источников.
  • Создавать и поддерживать дименсионные модели данных в нашем хранилище данных и дата-марте.
  • Повышать производительность конвейера данных, чтобы обеспечить скорость, надежность и масштабируемость.
  • Разрабатывать и совершенствовать наш внутренний ETL-фреймворк и вносить вклад в инструменты платформы данных для контроля качества, наблюдения и управления.
  • Обновлять и поддерживать существующие функции и инфраструктуру платформы данных на основе запросов продукта.
  • Оставаться на переднем крае прогресса, исследуя и интегрируя новые данные технологий в наши корпоративные практики.
  • Сотрудничать с мультифункциональными командами, включая аналитиков данных, ученых, менеджеров по продукту и инженеров-программистов, для оптимизации использования данных и поддержки архитектурных проектов.

Идеальный кандидат на должность старшего инженера по данным будет иметь:

  • Минимум четыре года опыта работы инженером по данным или на аналогичной должности.
  • Продвинутые навыки программирования на Python и SQL, знакомство с фреймворками вроде Poetry, pytest и типами подсказок.
  • Сильный опыт в программной разработке, включая Docker, Kubernetes, ООП, принципы SOLID, TDD и процедуры CI/CD.
  • Опыт работы с AWS, в том числе с развертыванием инфраструктуры, настройкой сети и конфигурации безопасности.
  • Знание инструментов оркестрации данных, таких как Airflow, и систем распределенных вычислений, например Spark или Trino.
  • Твердое понимание как реляционных баз данных, так и технологий NoSQL, включая MySQL, Postgres, MongoDB и Elasticsearch.
  • Знание инфраструктуры как кода с использованием Terraform и знакомство с архитектурой data lakehouse и открытыми табличными форматами (например, Iceberg, Hudi, Delta