Data Engineer - Great Lakes

Job expired!

La CDC Foundation se asocia con los Centros para el Control y la Prevención de Enfermedades (CDC) para mejorar la salud pública a través de colaboraciones innovadoras con filántropos, corporaciones, organizaciones e individuos. Como la organización sin fines de lucro autorizada para movilizar recursos del sector privado, nuestro objetivo es proteger la salud, seguridad y seguridad de América y del mundo. Desde 1995, hemos recaudado más de $1.9 mil millones y lanzado más de 1,300 programas que abordan una gran variedad de amenazas a la salud, desde enfermedades crónicas como enfermedades cardiovasculares y cáncer hasta enfermedades infecciosas incluyendo rotavirus, VIH, COVID-19 y Ébola. Obtenga más información sobre nuestro impactante trabajo en www.cdcfoundation.org.

  • Ubicación: Remoto (debe residir en los Estados Unidos)
  • Rango Salarial: $115,000-$165,000, más beneficios
  • Tipo de Posición: Oportunidad limitada y financiada por subvención
  • Fecha de Finalización del Puesto: 30 de junio de 2025

Buscamos un Ingeniero de Datos capacitado para desempeñar un papel fundamental en el avance de la misión de la CDC Foundation al mejorar nuestra infraestructura de datos dentro del Centro de Epidemiología Intertribal de los Grandes Lagos. Este rol implica diseñar, construir y mantener sistemas de datos robustos para apoyar iniciativas de salud pública. Trabajará en estrecha colaboración con una variedad de expertos, incluidos analistas de datos, científicos, profesionales de TI, arquitectos de almacenes y más, para ofrecer soluciones de datos escalables y eficientes.

  • Crear y gestionar sistemas de datos eficientes y flujos de datos para la ingesta, el procesamiento y el almacenamiento de datos.
  • Transformar y limpiar los datos recopilados de varias fuentes para garantizar la precisión y consistencia.
  • Cargar datos en sistemas de almacenamiento o almacenes de datos y optimizar flujos de datos para el rendimiento y la escalabilidad.
  • Monitorear los sistemas de datos para detectar problemas de rendimiento, errores y anomalías, e implementar las soluciones necesarias.
  • Implementar medidas de seguridad para proteger la información sanitaria pública sensible de acuerdo con regulaciones como HIPAA.
  • Colaborar con científicos de datos, analistas y socios para cumplir con las necesidades de infraestructura de datos y los objetivos organizacionales.
  • Diseñar soluciones escalables para satisfacer las necesidades empresariales y mantener procesos ETL para garantizar la precisión de los datos.
  • Gestionar sistemas de almacenamiento de datos, incluidos bases de datos relacionales y NoSQL, y mantenerse actualizado en las tendencias de la industria.
  • Proveer orientación técnica al personal y a las Tribus cuando se solicite, asegurando una comunicación efectiva en todos los niveles.
  • Título de Licenciatura en Ciencias de la Computación, Tecnología de la Información, Ciencia de Datos o un campo relacionado.
  • Competencia en lenguajes de programación como Python, Java, Scala o SQL.
  • Experiencia con tecnologías y marcos de datos masivos como Hadoop, Spark, Kafka y Flink.
  • Sólido entendimiento de bases de datos relacionales (p. ej., MySQL, PostgreSQL) y bases de datos NoSQL (p. ej., MongoDB, Cassandra).
  • Experiencia con control de versiones, pruebas automatizadas, integración continua y prácticas de implementación.
  • Conocimiento de conceptos de almacenamiento de datos y soluciones basadas en la nube como AWS S3 y Azure.
  • Experiencia en modelado de datos, procesos ETL y técnicas de integración de datos.
  • Familiaridad con metodologías de desarrollo ágil y patrones de diseño de software.
  • Excelentes habilidades analíticas, de resolución de problemas y de comunicación.
  • Experiencia en entornos de trabajo remoto y con principios y herramientas de DevOps.
  • Conocimiento de las mejores prácticas de seguridad de datos específicas para datos de salud (p. ej., cumplimiento con HIPAA).

Este