Senior Data Engineer, Data Solutions

Job expired!

Invitae est une entreprise leader en génétique médicale, de confiance pour des millions de patients et de prestataires de soins de santé. Nous tirons parti de la technologie numérique pour fournir des informations génétiques précises et opportunes qui renforcent la prise de décision médicale pour les individus et les familles. Nos experts en génétique appliquent des approches rigoureuses de données et de recherche pour intégrer des informations génétiques complètes dans la médecine courante, améliorant ainsi les soins de santé pour des milliards de personnes.

Rejoindre Invitae signifie travailler aux côtés de certains des plus grands experts mondiaux en génétique et en soins de santé à la pointe de la médecine génétique. Notre culture permet aux équipes et aux individus de maximiser leur impact et d'explorer leurs intérêts et capacités. Nous valorisons la liberté avec responsabilité et offrons une flexibilité significative, d'excellents avantages et une rémunération compétitive dans une organisation en pleine croissance.

Nous recherchons un ingénieur de données senior fiable et motivé pour rejoindre notre équipe de solutions de données. Dans ce rôle, vous développerez des pipelines d'ingestion de données et une architecture de plateforme de données qui soutient les besoins analytiques et de reporting des scientifiques des données, de notre équipe de bioinformatique, des clients et des parties prenantes internes.

  • Collaborer avec plusieurs équipes pour recueillir des exigences, concevoir des logiciels et mettre en œuvre des fonctionnalités qui soutiennent les équipes de science des données, de bioinformatique et de finance.
  • Concevoir et mettre en œuvre des frameworks de données fiables, évolutifs et efficaces, des produits axés sur les données et des solutions logicielles pour les clients externes et internes.
  • Créer une plateforme de données de santé de classe mondiale sécurisée, flexible et puissante pour la recherche et le traitement médical.
  • Améliorer les systèmes existants pour automatiser et utiliser les dernières technologies et outils.
  • Devenir l'expert en la matière (SME) en données, travaillant avec les utilisateurs sur les bases de données, les tables, les schémas et les métadonnées.
  • Suivre et contribuer aux meilleures pratiques agiles au sein de l'organisation pour rationaliser, automatiser et réduire la redondance et les coûts.
  • Soutenir et répondre aux questions des coéquipiers et des utilisateurs dans un environnement collaboratif et rapide en temps opportun.

Exigences minimales :

  • Minimum de 8 ans d'expérience connexe avec un baccalauréat ou 2 ans et une maîtrise ou plus.
  • Maîtrise des langages de haut niveau (Scala préféré et/ou Python). Volonté d'apprendre de nouveaux langages et technologies.
  • Maîtrise des plateformes cloud (AWS préféré; AWS, Azure ou Google Cloud Platform).
  • Expérience avec des bases de données relationnelles et en colonnes.
  • Expérience avec les outils de conteneurisation (Docker et Kubernetes).
  • Expérience avec les systèmes de messagerie/de file d'attente ou de traitement de flux (Kafka fortement préféré).
  • Intérêt et capacité à contribuer à la maintenance de l'infrastructure DevOps/Cloud.

Compétences préférées :

  • Expérience pratique en résolution de problèmes, débogage, collecte de journaux et systèmes d'alerte.
  • Expérience pratique avec Snowflake.
  • Expérience pratique avec de grands ensembles de données, des pipelines ETL et des technologies de stockage modernes.
  • Expérience en programmation fonctionnelle en Scala ou autres langages.
  • Programmation parallèle sur Spark ou autres plateformes.
  • Expérience dans la maintenance et l'administration de clusters Kubernetes.
  • Expérience avec l'automatisation de build et les pipelines CI/CD (par exemple, GitHub Actions).
  • Expérience avec les outils de visualisation de données (Looker préféré).
  • Expérience avec la modélisation de données / modélisation dimensionnelle.
  • Expérience avec l'optimisation des performances des bases de données.
  • Familiarité avec la traçabilité des données / la