Data Engineer

Job expired!

À propos de Cypris :

Chez Cypris, nous créons l'écosystème ultime pour les données d'innovation mondiale. Cypris est un outil de recherche alimenté par l'IA qui consolide diverses sources de données telles que les articles scientifiques, les brevets mondiaux, les nouvelles du marché et les données des entreprises en une seule plateforme. Avec un accès à plus de 500 millions de points de données mondiaux, Cypris fournit aux utilisateurs des informations précieuses sur leur marché, leurs concurrents, les technologies de base et bien plus encore, favorisant le développement de nouveaux produits, la stratégie commerciale et accélérant l'innovation mondiale.

Nous connectons les équipes de R&D au paysage mondial de l'innovation, de la même manière que la Bloomberg Terminal a transformé la finance ou que Pitchbook a amélioré le capital-risque. Nos utilisateurs actuels incluent des équipes de R&D et d'innovation de premier plan dans des entreprises de taille moyenne à Fortune 100 dans des marchés émergents tels que l'aérospatiale, la génomique, la recherche sur le cancer, les véhicules autonomes, et au-delà.

En tant qu'ingénieur des données chez Cypris, vous serez responsable de la conception, de la construction et de la maintenance de pipelines de données et de systèmes évolutifs pour soutenir notre plateforme axée sur les données. En collaborant étroitement avec notre équipe d'ingénierie, vous garantirez la disponibilité et la qualité des données nécessaires pour fournir des analyses et des informations sur l'innovation. Ce rôle offre une opportunité passionnante de contribuer à notre infrastructure de données et d'influencer l'évolution de nos capacités en matière de données.

Dans ce rôle, vous serez amené à :

  • Concevoir, développer et optimiser des pipelines de données robustes pour traiter et transformer de grands ensembles de données provenant de diverses sources.
  • Améliorer les performances des magasins de données, en se concentrant sur les temps d'index et de réponse des requêtes.
  • Mettre en œuvre et maintenir des processus ETL pour assurer l'exactitude et l'intégrité des données.
  • Collaborer avec des équipes interfonctionnelles pour comprendre les besoins en données et fournir des solutions de données efficaces.
  • Développer et maintenir des entrepôts de données et des lacs de données pour soutenir l'intelligence d'affaires et les analyses.
  • Surveiller et résoudre les problèmes de performance et de fiabilité des pipelines de données, en mettant en œuvre des améliorations si nécessaire.
  • Garantir la sécurité des données et la conformité avec les réglementations et normes pertinentes.
  • Rester à jour avec les dernières technologies et les meilleures pratiques en ingénierie des données et les incorporer à nos processus.

Exigences - Un candidat idéal aura :

  • Un diplôme de Bachelor ou de Master en informatique, en ingénierie ou dans un domaine connexe.
  • Une expérience avérée en tant qu'ingénieur des données ou dans un rôle similaire.
  • Maîtrise des langages de programmation comme Python, Java ou Scala.
  • Expérience avec des plateformes cloud telles que GCP (préféré), AWS, Google Cloud ou Azure.
  • Expérience pratique avec les technologies big data telles que Hadoop, Spark ou des cadres similaires.
  • Connaissance des concepts d'entrepôt de données et expérience avec des outils comme Redshift, BigQuery ou Snowflake.
  • Familiarité avec les outils et processus ETL.
  • Une forte capacité de résolution de problèmes et une attention aux détails.
  • Le désir de contribuer et de croître dans une startup en début de croissance.

Technologies que nous utilisons :

  • Python
  • GCP
  • Apache Beam

Avantages :

À travers ce rôle, vous recevrez :

  • Un salaire de base solide et une structure de bonus.
  • Un environnement où votre voix et votre opinion sont écoutées.
  • Une formation appropriée pour vous fournir