Data Engineer - Bioinformatics

Job expired!

Rejoignez Our Future Health, le plus grand programme de recherche sur la santé au Royaume-Uni, dans un rôle excitant et impactant en tant que Ingénieur des données spécialisé en Bioinformatique. Ce poste prestigieux offre non seulement jusqu'à 60 000 £ par an mais se trouve également au coeur d'une initiative pionnière soutenue par le gouvernement du Royaume-Uni, s'associant à des œuvres de bienfaisance et à l'industrie, et travaillant étroitement avec le NHS et les autorités publiques à travers le pays.

En tant qu'Ingénieur des données, vous serez une partie essentielle d'une équipe multidisciplinaire chargée de créer et de posséder des pipelines de données innovants pour un programme à portée mondiale. Les responsabilités clés incluent :

  • Construire et maintenir des pipelines de données depuis divers fournisseurs jusque dans notre stockage de données principal et environnements de recherche fiables.
  • Développer une logique de transformation en tant que code pour produire des données organisées, accessibles et de haute qualité pour analyse.
  • Prototyper des pipelines pour des transformations de données complexes, s'inspirant de flux de travail existants dans l'industrie et le milieu universitaire.
  • Se maintenir informé des meilleures pratiques à travers les domaines de l'ingénierie des données au sein de l'industie, la recherche et le gouvernement, facilitant l'adoption de normes.
  • Fournir une contribution technique aux aspects amont des pipelines de données, de la spécification au transfert de données.
  • Engager dans la curation ad-hoc de données et développer des scripts de nettoyage ETL sur mesure, principalement en Python.
  • Collaborer avec les chercheurs pour comprendre leurs besoins en données et aider à la livraison des données essentielles pour les projets.

Pour prospérer dans ce rôle pivot, vous aurez besoin d'un solide background en bioinformatique, particulièrement avec les outils et méthodologies liés aux données génomiques. Le candidat idéal démontrera :

  • Expérience dans un environnement de développement Agile, avec un focus sur la révision de code et le pairing.
  • Connaissance des systèmes de contrôle de version, en particulier Git/GitHub.
  • Compétence dans la conception, construction et test de pipelines à travers diverses technologies avec un focus sur la répétabilité et la réutilisabilité.
  • Capacités solides dans la gestion de stockage de données génomiques à grande échelle, recherche et filtrage.
  • Une solide compréhension des environnements cloud (idéalement Azure), du calcul distribué et de l'escalade des flux de travail.
  • Expérience avec Python et les outils de gestion de flux de travail comme Nextflow, WDL/Cromwell, Airflow, Prefect et Dagster.
  • Connaissance des formats communs de transformation et de stockage des données, tels que Apache Parquet, et des technologies de data lakes comme Spark et Databricks.
  • Compréhension des technologies de conteneurisation, par ex., Docker, et des normes de données comme GA4GH et FAIR.
  • Compréhension des stratégies de gouvernance de l'information et de sécurité des données pertinentes aux données de santé sensibles.

Our Future Health offre un package de rémunération et d'avantages généreux, incluant :

  • Jusqu'à 60 000 £ de salaire annuel de base.
  • Un package de pension robuste avec des contributions de l'employeur jusqu'à 12%.
  • 30 jours de congés annuels en plus des jours fériés.
  • Des opportunités continues pour le développement de carrière, avec des évaluations régulières.
  • Bureau moderne à Holborn, Centre de Londres, avec des options de travail flexibles et à distance.

Nous sommes en mission pour prévenir les maladies