Data Engineer - Great Lakes

Job expired!

La CDC Foundation s'associe aux Centers for Disease Control and Prevention (CDC) pour améliorer la santé publique grâce à des collaborations innovantes avec des philanthropes, des entreprises, des organisations et des particuliers. En tant qu'organisation à but non lucratif autorisée à mobiliser les ressources du secteur privé, notre objectif est de protéger la santé, la sécurité et la sûreté de l'Amérique et du monde. Depuis 1995, nous avons levé plus de 1,9 milliard de dollars et lancé plus de 1 300 programmes traitant d'une multitude de menaces pour la santé, des maladies chroniques telles que les maladies cardiovasculaires et le cancer aux maladies infectieuses comme le rotavirus, le VIH, le COVID-19 et l'Ebola. Pour en savoir plus sur notre travail impactant, visitez www.cdcfoundation.org.

  • Lieu : Télétravail (doit être basé aux États-Unis)
  • Rage de salaire : 115 000 $ - 165 000 $, plus avantages
  • Type de poste : Opportunité à durée déterminée financée par une subvention
  • Date de fin du poste : 30 juin 2025

Nous recherchons un Ingénieur en Données qualifié pour jouer un rôle clé dans l'avancement de la mission de la CDC Foundation en améliorant notre infrastructure de données au sein du Great Lakes Inter-Tribal Epidemiology Center. Ce rôle consiste à concevoir, construire et maintenir des systèmes de données robustes pour soutenir les initiatives de santé publique. Vous travaillerez en étroite collaboration avec divers experts, notamment des analystes de données, des scientifiques, des professionnels de l'informatique, des architectes de entrepôts de données, et plus encore, pour fournir des solutions de données évolutives et efficaces.

  • Créer et gérer des systèmes de données et des pipelines efficaces pour l'ingestion, le traitement et le stockage des données.
  • Transformer et nettoyer les données collectées à partir de diverses sources pour garantir leur exactitude et leur cohérence.
  • Charger les données dans des systèmes de stockage ou des entrepôts de données et optimiser les pipelines de données pour la performance et l'évolutivité.
  • Surveiller les systèmes de données pour détecter les problèmes de performance, les erreurs et les anomalies, et mettre en œuvre les solutions nécessaires.
  • Mettre en œuvre des mesures de sécurité pour protéger les informations sensibles de santé publique en conformité avec des réglementations telles que la HIPAA.
  • Collaborer avec des scientifiques de données, des analystes et des partenaires pour répondre aux besoins en infrastructure de données et atteindre les objectifs organisationnels.
  • Concevoir des solutions évolutives pour répondre aux besoins de l'entreprise et maintenir les processus ETL afin d'assurer l'exactitude des données.
  • Gérer les systèmes de stockage de données, y compris les bases de données relationnelles et NoSQL, et se tenir à jour sur les tendances de l'industrie.
  • Fournir des conseils techniques au personnel et aux Tribus sur demande, en garantissant une communication efficace à tous les niveaux.
  • Diplôme de licence en informatique, technologies de l'information, sciences des données ou dans un domaine similaire.
  • Maîtrise des langages de programmation tels que Python, Java, Scala ou SQL.
  • Expérience avec les technologies et cadres de traitement de gros volumes de données comme Hadoop, Spark, Kafka et Flink.
  • Solide compréhension des bases de données relationnelles (par ex., MySQL, PostgreSQL) et des bases de données NoSQL (par ex., MongoDB, Cassandra).
  • Expérience avec le contrôle de version, les tests automatisés, les pratiques d'intégration et de déploiement continu.
  • Connaissance des concepts d'entreposage de données et des solutions basées sur le cloud comme AWS S3 et Azure.
  • Expertise en modélisation de données, processus ETL et techniques d'intégration de données.
  • Familiarité avec les méthodologies de développement agile et les modèles de conception logicielle.
  • Excellentes capacités