Data Engineer PySpark

Job expired!

Приєднуйтесь до нашої команди: інженер з даних - PySpark у Sopra Steria

Опис компанії

Про Sopra Steria: провідна технологічна сутність в Європі, відома своєю професійністю в консалтингу, цифрових послугах та розробці програмного забезпечення. Sopra Steria допомагає клієнтам орієнтуватися в їхній цифровій трансформації, пропонуючи персоналізовані, сталі рішення, які поєднують широкі знання в галузі і передові технології. Віддані інноваціям та досконалості, Sopra Steria вірить в підхід, орієнтований на клієнта, і в більш світле цифрове майбутнє через командну роботу. З добротними кадрами в 50,000 осіб майже в 30 країнах, ми досягли вражаючої доходи у €5.1 мільярда у 2022 році.

Опис вакансії

Наразі ми шукаємо висококваліфікованого та пристрасного інженера з даних, щоб підсилити нашу динамічну команду. Ця роль включає тісну співпрацю з науковцями-даними для розробки ефективних моделей машинного навчання шляхом побудови та оптимізації потоків даних. Ваша експертиза в певних галузях буде вирішальною для підтримки та вдосконалення наших даних.

Основні обов’язки:

  • Співпрацювати з науковцями-даними для створення, вдосконалення та впровадження потоків машинного навчання.
  • Використовувати PySpark для потужної обробки даних, їх трансформації та підготовки для навчання моделей.
  • Використовувати AWS EMR та S3 для забезпечення масштабованих та ефективних рішень для обробки та зберігання даних.
  • Створювати та керувати робочими процесами ETL, використовуючи Stream sets для ефективного введення та трансформації даних.
  • Проектувати та підтримувати потоки для доставки навчальних та інференційних наборів даних високої я