О компании Cypris:
В Cypris мы создаем уникальную экосистему для глобальных данных об инновациях. Cypris - это исследовательский инструмент, работающий на основе ИИ, который объединяет различные источники данных, такие как научные статьи, мировые патенты, новости рынка и данные о компаниях на одной платформе. Имея доступ к более чем 500 миллионам глобальных данных, Cypris предоставляет пользователям бесценную информацию о их рынке, конкурентах, основных технологиях и многом другом, способствуя разработке новых продуктов, коммерческой стратегии и ускоряя глобальные инновации.
Мы соединяем команды R&D с глобальным инновационным ландшафтом, подобно тому, как Bloomberg Terminal изменил финансы или Pitchbook улучшил венчурный капитал. Наши текущие пользователи включают ведущие R&D и инновационные команды от компаний среднего размера до Fortune 100 в таких развивающихся рынках, как аэрокосмическая отрасль, геномика, исследования рака, автономные транспортные средства и другие.
О роли:
В качестве инженера данных в Cypris вы будете отвечать за проектирование, создание и поддержание масштабируемых конвейеров данных и систем для поддержки нашей платформы, основанной на данных. Тесно сотрудничая с нашей инженерной командой, вы будете обеспечивать доступность и качество данных, необходимых для предоставления аналитики и инсайтов по инновациям. Эта роль предлагает увлекательную возможность внести вклад в нашу инфраструктуру данных и повлиять на развитие наших возможностей обработки данных.
В этой роли вы будете:
- Проектировать, разрабатывать и оптимизировать надежные каналы данных для обработки и преобразования больших наборов данных из различных источников.
- Повышать производительность хранилищ данных, сосредотачиваясь на индексах и времени отклика запросов.
- Внедрять и поддерживать процессы ETL для обеспечения точности и целостности данных.
- Сотрудничать с кросс-функциональными командами для понимания требований к данным и предоставления эффективных решений.
- Разрабатывать и поддерживать хранилища данных и озёра данных для поддержки бизнес-аналитики и аналитики.
- Мониторить и устранять проблемы с производительностью и надежностью каналов данных, вносить улучшения по мере необходимости.
- Обеспечивать безопасность данных и соответствие требованиям и стандартам.
- Быть в курсе последних технологий и лучших практик в области инженерии данных и внедрять их в наши процессы.
Требования - ключевой кандидат должен иметь:
- Стипло или магистерскую степень в области компьютерных наук, инженерии или смежной области.
- Доказанный опыт работы в качестве инженера данных или на аналогичной должности.
- Владение языками программирования, такими как Python, Java или Scala.
- Опыт работы с облачными платформами, такими как GCP (предпочтительно), AWS, Google Cloud или Azure.
- Практический опыт работы с технологиями больших данных, такими как Hadoop, Spark или аналогичными фреймворками.
- Знание концепций хранилища данных и опыт работы с инструментами, такими как Redshift, BigQuery или Snowflake.
- Знакомство с инструментами и процессами ETL.
- Сильные навыки решения проблем и внимание к деталям.
- Желание внести вклад и расти в стартапе на ранней стадии.
Технологии, которые мы используем:
Преимущества:
В этой роли вы получите:
- Высокую базовую зарплату и бонусную систему.
- Среду, в которой ваше мнение и голос будут услышаны.
- Соответствующее обучение, чтобы обеспечить вас знаниями, необходимыми для успеха на нашем рынке