Data Engineer

Data Engineer
Other places
06/14/2024
-

Job expired!

О компании Cypris:

В Cypris мы создаем уникальную экосистему для глобальных данных об инновациях. Cypris - это исследовательский инструмент, работающий на основе ИИ, который объединяет различные источники данных, такие как научные статьи, мировые патенты, новости рынка и данные о компаниях на одной платформе. Имея доступ к более чем 500 миллионам глобальных данных, Cypris предоставляет пользователям бесценную информацию о их рынке, конкурентах, основных технологиях и многом другом, способствуя разработке новых продуктов, коммерческой стратегии и ускоряя глобальные инновации.

Мы соединяем команды R&D с глобальным инновационным ландшафтом, подобно тому, как Bloomberg Terminal изменил финансы или Pitchbook улучшил венчурный капитал. Наши текущие пользователи включают ведущие R&D и инновационные команды от компаний среднего размера до Fortune 100 в таких развивающихся рынках, как аэрокосмическая отрасль, геномика, исследования рака, автономные транспортные средства и другие.

О роли:

В качестве инженера данных в Cypris вы будете отвечать за проектирование, создание и поддержание масштабируемых конвейеров данных и систем для поддержки нашей платформы, основанной на данных. Тесно сотрудничая с нашей инженерной командой, вы будете обеспечивать доступность и качество данных, необходимых для предоставления аналитики и инсайтов по инновациям. Эта роль предлагает увлекательную возможность внести вклад в нашу инфраструктуру данных и повлиять на развитие наших возможностей обработки данных.

В этой роли вы будете:

Проектировать, разрабатывать и оптимизировать надежные каналы данных для обработки и преобразования больших наборов данных из различных источников.
Повышать производительность хранилищ данных, сосредотачиваясь на индексах и времени отклика запросов.
Внедрять и поддерживать процессы ETL для обеспечения точности и целостности данных.
Сотрудничать с кросс-функциональными командами для понимания требований к данным и предоставления эффективных решений.
Разрабатывать и поддерживать хранилища данных и озёра данных для поддержки бизнес-аналитики и аналитики.
Мониторить и устранять проблемы с производительностью и надежностью каналов данных, вносить улучшения по мере необходимости.
Обеспечивать безопасность данных и соответствие требованиям и стандартам.
Быть в курсе последних технологий и лучших практик в области инженерии данных и внедрять их в наши процессы.

Требования - ключевой кандидат должен иметь:

Стипло или магистерскую степень в области компьютерных наук, инженерии или смежной области.
Доказанный опыт работы в качестве инженера данных или на аналогичной должности.
Владение языками программирования, такими как Python, Java или Scala.
Опыт работы с облачными платформами, такими как GCP (предпочтительно), AWS, Google Cloud или Azure.
Практический опыт работы с технологиями больших данных, такими как Hadoop, Spark или аналогичными фреймворками.
Знание концепций хранилища данных и опыт работы с инструментами, такими как Redshift, BigQuery или Snowflake.
Знакомство с инструментами и процессами ETL.
Сильные навыки решения проблем и внимание к деталям.
Желание внести вклад и расти в стартапе на ранней стадии.

Технологии, которые мы используем:

Python
GCP
Apache Beam

Преимущества:

В этой роли вы получите:

Высокую базовую зарплату и бонусную систему.
Среду, в которой ваше мнение и голос будут услышаны.
Соответствующее обучение, чтобы обеспечить вас знаниями, необходимыми для успеха на нашем рынке