Data Engineer - Bioinformatics

Job expired!

Únete a Our Future Health, el programa de investigación de salud más grande del Reino Unido, en un rol emocionante e impactante como Ingeniero de Datos especializado en Bioinformática. Esta posición prestigiosa no solo ofrece hasta £60,000 por año, sino que también está en el corazón de una iniciativa pionera respaldada por el Gobierno del Reino Unido, en asociación con caridades e industria, y trabajando íntimamente con el NHS y autoridades públicas a lo largo del país.

Como Ingeniero de Datos, serás una parte vital de un equipo multidisciplinario encargado de crear y poseer innovadoras tuberías de datos para un programa con alcance global. Las responsabilidades clave incluyen:

  • Construir y mantener tuberías de datos desde varios proveedores hacia nuestro almacenamiento de datos principal y entornos de investigación confiables.
  • Desarrollar la lógica de transformación como código para producir datos curados, accesibles y de alta calidad para el análisis.
  • Prototipar tuberías para transformaciones de datos complejas, aprovechando flujos de trabajo existentes en la industria y la academia.
  • Mantenerse al día con las mejores prácticas en los campos de ingeniería de datos dentro de la industria, la investigación y el gobierno, facilitando la adopción de estándares.
  • Proporcionar entrada técnica a los aspectos aguas arriba de las tuberías de datos, desde la especificación hasta la transferencia de datos.
  • Participar en la curación de datos ad-hoc y desarrollar guiones de limpieza ETL a medida, predominantemente en Python.
  • Colaborar con investigadores para entender sus necesidades de datos y asistir en la entrega de datos esenciales para proyectos.

Para prosperar en este rol pivotal, necesitarás un sólido trasfondo en bioinformática, particularmente con herramientas y metodologías vinculadas a datos genómicos. El candidato ideal demostrará:

  • Experiencia en un ambiente de desarrollo Agile, con un enfoque en la revisión de código y el emparejamiento.
  • Familiaridad con el control de versiones, especialmente Git/GitHub.
  • Proficiencia en diseñar, construir y probar tuberías a través de diversas tecnologías con un enfoque en la repetibilidad y reutilización.
  • Capacidades fuertes en manejar almacenamiento de datos genómicos a gran escala, búsqueda y filtración.
  • Un sólido entendimiento de entornos en la nube (idealmente Azure), computación distribuida y escalado de flujos de trabajo.
  • Experiencia con Python y herramientas de gestión de flujos de trabajo como Nextflow, WDL/Cromwell, Airflow, Prefect y Dagster.
  • Conocimiento de formatos comunes de transformación y almacenamiento de datos, como Apache Parquet, y tecnologías de lagos de datos como Spark y Databricks.
  • Entendimiento de tecnologías de contenedorización, por ejemplo, Docker, y estándares de datos como GA4GH y FAIR.
  • Comprensión de estrategias de gobernanza de información y seguridad de datos pertinentes a datos de salud sensibles.

Our Future Health ofrece un paquete de compensación y beneficios generosos, incluyendo:

  • Hasta £60,000 de salario básico anual.
  • Paquete de pensión robusto con contribuciones del empleador de hasta el 12%.
  • 30 días de vacaciones anuales además de los días festivos bancarios.
  • Oportunidades continuas para el desarrollo de carrera, con evaluaciones regulares.
  • Oficina moderna en Holborn, Central London, con opciones de trabajo flexible y remoto.

Estamos en una misión para prevenir enfermedades y mejorar la salud para las generaciones futuras. Al contribuir con información vital, nuestro objetivo de involucrar a 5 millones de voluntarios del Reino Unido apoyará a los investigadores en hacer