Software Development Engineer III - ETL Engineer

Job expired!

Компанія: Groupon

Groupon є провідним ринком, який з'єднує людей з найкращими пропозиціями їхнього міста чи місця призначення. Завдяки мобільній комерції в реальному часі в межах локальних бізнесів, живих подій та туристичних напрямів, Groupon допомагає людям відкривати досвід, який робить життя повним, веселим та винагороджуваним. Підтримуючи місцеві бізнеси, ми сприяємо розвитку сильних відносин з клієнтами та створенню яскравих спільнот. Незважаючи на тисячі співробітників по всьому світу, наша культура надихає на інновації, нагороджує ризик і святкує успіх.

У Groupon ми розуміємо, що чудові люди роблять чудові компанії. Ми поєднуємо найкращі ресурси та масштаб великої компанії з автономією та потенціалом впливу меншої організації. Ми цікаві, веселі, трохи інтенсивні та глибоко віддані допомозі місцевим бізнесам розквітати.

Команда Ingestion Data у Groupon є центральною ланкою для всього, що стосується даних. Ми визначаємо та будуємо рішення наступного покоління на основі хмарних технологій для прийому та обробки петабайт даних у нашому озері даних та дата-складі. Наша місія - надати можливість аналітикам даних та науковцям з даних у всіх бізнес-одиницях приймати обґрунтовані бізнес-рішення. У цій ролі у вас буде можливість поєднувати свої навички в галузі комп'ютерних наук, розподілених систем та масштабованих високопродуктивних систем.

  • Проектування та розробка високотоварних партійних/стрімінгових каналів прийому даних та фреймворків на платформах даних AWS та GCP.
  • Концептуалізація, програмування та запуск платформ наступного покоління для прийому та обробки даних.
  • Участь у визначенні вимог, обговореннях архітектури систем та даних.
  • Технічне ведення та наставництво молодших інженерів у кращих практиках розробки програмного забезпечення та інженерії даних.
  • Співробітництво з міжфункціональними командами Agile, включаючи програмних інженерів, інженерів даних, експертів з ML та аналітиків даних.

Ми будемо раді вам, якщо ви маєте:

  • BS/MS у галузі комп'ютерних наук з 5+ роками досвіду в розподілених системах, інженерії даних або розробці програмного забезпечення.
  • Сильні навички програмування на таких мовах, як Python та Java.
  • Досвід роботи з SQL та NoSQL базами даних (Teradata, MySQL, Postgres, Cassandra, Elasticsearch, HBase тощо).
  • Знайомство з командною строкою UNIX.
  • Досвід роботи з технологіями великого обсягу даних, такими як Apache Spark, Hadoop, Hive тощо.
  • Глибокий досвід роботи з ETL, питаннями походження даних та якості даних.
  • Досвід роботи з партійними та стрімінговими каналами даних.
  • Досвід роботи з хмарними технологіями AWS або GCP, особливо щодо обробки даних у великому масштабі.
  • Сильне розуміння виробничих сервісів із жорсткими SLA та практики CI/CD.
  • Відмінні письмові та усні комунікативні навички.
  • Пристрасть до створення платформ