Data Engineer - Alaska

Job expired!

Points forts du poste :

  • Localisation : Télétravail, doit être basé aux États-Unis
  • Échelle salariale : $115,000-$165,000, plus avantages
  • Type de poste : Financé par subvention, opportunité à durée limitée
  • Date de fin du poste : 30 juin 2025

La CDC Foundation recherche un Ingénieur de données qualifié pour soutenir la Section de l'infirmerie publique de la Division de la santé publique de l'Alaska. Ce rôle est crucial pour concevoir, construire et maintenir une infrastructure de données dans la transition vers un nouveau système de dossier de santé électronique (EHR). Ce poste se concentre sur la transformation et le chargement des données, créant une base de données unifiée et centrée sur le patient pour remplacer le système actuel basé sur la localisation. Les responsabilités clés incluent des tâches ETL complexes, le mappage, la transformation, le nettoyage et la préparation des données pour une importation efficace avec un minimum de temps d'arrêt. La collaboration avec des experts en données, le personnel informatique et le personnel organisationnel est essentielle pour garantir que le nouveau système réponde aux besoins de la Division. Le rôle est entièrement à distance aux États-Unis.

  • Établir des relations entre des bases de données disparates pour garantir une consolidation des données précise et efficace.
  • Créer et gérer des systèmes et des pipelines pour un flux de données efficace, y compris l'ingestion, le traitement et le stockage.
  • Collecter, transformer et nettoyer les données pour garantir leur exactitude et leur cohérence, et charger les données dans des systèmes de stockage ou des entrepôts de données.
  • Optimiser les pipelines de données, l'infrastructure et les flux de travail pour la performance et la scalabilité.
  • Surveiller les pipelines de données pour détecter les problèmes de performance, les erreurs et les anomalies, et mettre en œuvre des solutions.
  • Mettre en œuvre des mesures de sécurité pour protéger les informations sensibles et assurer la conformité aux réglementations, en particulier HIPAA.
  • Collaborer avec des scientifiques des données, des analystes et d'autres partenaires pour comprendre leurs besoins en données et garantir que l'infrastructure de données réponde aux objectifs de l'organisation.
  • Mettre en place et maintenir des processus ETL pour garantir l'exactitude, l'exhaustivité et la cohérence des données.
  • Concevoir et gérer des systèmes de stockage de données, y compris des bases de données relationnelles, des bases de données NoSQL et des entrepôts de données.
  • Créer des diagrammes d'architecture de système, des documentations et des lignes directrices pour communiquer les décisions de conception et les meilleures pratiques.
  • Rester à jour sur les tendances de l'industrie, les meilleures pratiques et les technologies émergentes en ingénierie des données, et les intégrer dans l'infrastructure de données de l'organisation.
  • Fournir des conseils techniques aux autres membres du personnel.
  • Communiquer efficacement avec les partenaires pour recueillir les exigences, fournir des mises à jour et présenter des résultats.
  • Licence en informatique, technologie de l'information, science des données ou un domaine connexe.
  • Solide expérience en SQL, Python, C#, Java, entrepôt de données et création de pipelines ETL évolutifs.
  • Maîtrise des meilleures pratiques en ingénierie telles que le contrôle de version, les tests automatisés, l'intégration continue et le déploiement, et la révision par les pairs.
  • Familiarité avec les systèmes de transformation des données (DTS) pour déplacer les données vers des systèmes SQL Server.
  • Connaissance des techniques de déduplication des données et de la maintenance de la qualité des données.
  • Expérience en modélisation des données et en passage de modèles de bases de données basées sur la localisation à des modèles centrés sur la personne, de préférence dans le domaine de la santé.
  • Compétences préférées incluent l'expérience avec l'extraction de données MUMPS DB/VA Fileman et les systèmes de bases