Únete a Our Future Health, el programa de investigación de salud más grande del Reino Unido, en un rol emocionante e impactante como Ingeniero de Datos especializado en Bioinformática. Esta posición prestigiosa no solo ofrece hasta £60,000 por año, sino que también está en el corazón de una iniciativa pionera respaldada por el Gobierno del Reino Unido, en asociación con caridades e industria, y trabajando íntimamente con el NHS y autoridades públicas a lo largo del país.
Como Ingeniero de Datos, serás una parte vital de un equipo multidisciplinario encargado de crear y poseer innovadoras tuberías de datos para un programa con alcance global. Las responsabilidades clave incluyen:
- Construir y mantener tuberías de datos desde varios proveedores hacia nuestro almacenamiento de datos principal y entornos de investigación confiables.
- Desarrollar la lógica de transformación como código para producir datos curados, accesibles y de alta calidad para el análisis.
- Prototipar tuberías para transformaciones de datos complejas, aprovechando flujos de trabajo existentes en la industria y la academia.
- Mantenerse al día con las mejores prácticas en los campos de ingeniería de datos dentro de la industria, la investigación y el gobierno, facilitando la adopción de estándares.
- Proporcionar entrada técnica a los aspectos aguas arriba de las tuberías de datos, desde la especificación hasta la transferencia de datos.
- Participar en la curación de datos ad-hoc y desarrollar guiones de limpieza ETL a medida, predominantemente en Python.
- Colaborar con investigadores para entender sus necesidades de datos y asistir en la entrega de datos esenciales para proyectos.
Para prosperar en este rol pivotal, necesitarás un sólido trasfondo en bioinformática, particularmente con herramientas y metodologías vinculadas a datos genómicos. El candidato ideal demostrará:
- Experiencia en un ambiente de desarrollo Agile, con un enfoque en la revisión de código y el emparejamiento.
- Familiaridad con el control de versiones, especialmente Git/GitHub.
- Proficiencia en diseñar, construir y probar tuberías a través de diversas tecnologías con un enfoque en la repetibilidad y reutilización.
- Capacidades fuertes en manejar almacenamiento de datos genómicos a gran escala, búsqueda y filtración.
- Un sólido entendimiento de entornos en la nube (idealmente Azure), computación distribuida y escalado de flujos de trabajo.
- Experiencia con Python y herramientas de gestión de flujos de trabajo como Nextflow, WDL/Cromwell, Airflow, Prefect y Dagster.
- Conocimiento de formatos comunes de transformación y almacenamiento de datos, como Apache Parquet, y tecnologías de lagos de datos como Spark y Databricks.
- Entendimiento de tecnologías de contenedorización, por ejemplo, Docker, y estándares de datos como GA4GH y FAIR.
- Comprensión de estrategias de gobernanza de información y seguridad de datos pertinentes a datos de salud sensibles.
Our Future Health ofrece un paquete de compensación y beneficios generosos, incluyendo:
- Hasta £60,000 de salario básico anual.
- Paquete de pensión robusto con contribuciones del empleador de hasta el 12%.
- 30 días de vacaciones anuales además de los días festivos bancarios.
- Oportunidades continuas para el desarrollo de carrera, con evaluaciones regulares.
- Oficina moderna en Holborn, Central London, con opciones de trabajo flexible y remoto.
Estamos en una misión para prevenir enfermedades y mejorar la salud para las generaciones futuras. Al contribuir con información vital, nuestro objetivo de involucrar a 5 millones de voluntarios del Reino Unido apoyará a los investigadores en hacer