Data Engineer

Job expired!

О компании Cypris:

В Cypris мы создаем уникальную экосистему для глобальных данных об инновациях. Cypris - это исследовательский инструмент, работающий на основе ИИ, который объединяет различные источники данных, такие как научные статьи, мировые патенты, новости рынка и данные о компаниях на одной платформе. Имея доступ к более чем 500 миллионам глобальных данных, Cypris предоставляет пользователям бесценную информацию о их рынке, конкурентах, основных технологиях и многом другом, способствуя разработке новых продуктов, коммерческой стратегии и ускоряя глобальные инновации.

Мы соединяем команды R&D с глобальным инновационным ландшафтом, подобно тому, как Bloomberg Terminal изменил финансы или Pitchbook улучшил венчурный капитал. Наши текущие пользователи включают ведущие R&D и инновационные команды от компаний среднего размера до Fortune 100 в таких развивающихся рынках, как аэрокосмическая отрасль, геномика, исследования рака, автономные транспортные средства и другие.

О роли:

В качестве инженера данных в Cypris вы будете отвечать за проектирование, создание и поддержание масштабируемых конвейеров данных и систем для поддержки нашей платформы, основанной на данных. Тесно сотрудничая с нашей инженерной командой, вы будете обеспечивать доступность и качество данных, необходимых для предоставления аналитики и инсайтов по инновациям. Эта роль предлагает увлекательную возможность внести вклад в нашу инфраструктуру данных и повлиять на развитие наших возможностей обработки данных.

В этой роли вы будете:

  • Проектировать, разрабатывать и оптимизировать надежные каналы данных для обработки и преобразования больших наборов данных из различных источников.
  • Повышать производительность хранилищ данных, сосредотачиваясь на индексах и времени отклика запросов.
  • Внедрять и поддерживать процессы ETL для обеспечения точности и целостности данных.
  • Сотрудничать с кросс-функциональными командами для понимания требований к данным и предоставления эффективных решений.
  • Разрабатывать и поддерживать хранилища данных и озёра данных для поддержки бизнес-аналитики и аналитики.
  • Мониторить и устранять проблемы с производительностью и надежностью каналов данных, вносить улучшения по мере необходимости.
  • Обеспечивать безопасность данных и соответствие требованиям и стандартам.
  • Быть в курсе последних технологий и лучших практик в области инженерии данных и внедрять их в наши процессы.

Требования - ключевой кандидат должен иметь:

  • Стипло или магистерскую степень в области компьютерных наук, инженерии или смежной области.
  • Доказанный опыт работы в качестве инженера данных или на аналогичной должности.
  • Владение языками программирования, такими как Python, Java или Scala.
  • Опыт работы с облачными платформами, такими как GCP (предпочтительно), AWS, Google Cloud или Azure.
  • Практический опыт работы с технологиями больших данных, такими как Hadoop, Spark или аналогичными фреймворками.
  • Знание концепций хранилища данных и опыт работы с инструментами, такими как Redshift, BigQuery или Snowflake.
  • Знакомство с инструментами и процессами ETL.
  • Сильные навыки решения проблем и внимание к деталям.
  • Желание внести вклад и расти в стартапе на ранней стадии.

Технологии, которые мы используем:

  • Python
  • GCP
  • Apache Beam

Преимущества:

В этой роли вы получите:

  • Высокую базовую зарплату и бонусную систему.
  • Среду, в которой ваше мнение и голос будут услышаны.
  • Соответствующее обучение, чтобы обеспечить вас знаниями, необходимыми для успеха на нашем рынке