Rejoignez GE HealthCare en tant que Spécialiste en ingénierie des données pour travailler sur des solutions innovantes de Big Data. Vous conçurez, développerez, testerez et mettrez en œuvre des processus d'ingénierie des données afin de créer des solutions analytiques et de reporting. Collaborez étroitement avec les architectes pour implémenter divers produits de données pour GEHC. Gérez et maintenez les structures de métadonnées, telles que les catalogues de données, et fournissez le soutien nécessaire aux activités post-déploiement lorsque cela est nécessaire. Livrez des résultats en utilisant des méthodologies agiles rapidement.
GE HealthCare est un leader mondial en technologie médicale et solutions numériques, dédié à créer un monde où les soins de santé ne connaissent aucune limite. Rejoignez-nous pour transformer des idées en réalités changeant le monde, faisant une différence dans un environnement collaboratif et inclusif qui valorise chaque voix.
Dans ce rôle, vous devrez :
- Concevoir et mettre en œuvre des pipelines de données robustes et évolutifs pour les systèmes Big Data, participer aux conceptions techniques et présenter des idées techniques.
- Construire des systèmes de qualité de production pour l'ETL, le traitement des données, la surveillance des données et l'évaluation de la qualité des données en utilisant divers outils et technologies.
- Capturer les exigences du système analytique à travers des séances de brainstorming avec les Architectes et les Managers de Produit.
- Développer des pipelines de données pour les systèmes BI, IA et ML basés sur le cloud en explorant les compromis.
- Aider aux initiatives de BI, IA et ML en interprétant les résultats des modèles quantitatifs, en identifiant les tendances et en développant des alternatives pour soutenir les objectifs commerciaux.
Exigé :
- Licence ou Master en Informatique.
- 1+ an d'expérience dans les technologies Big Data, l'écosystème d'ingénierie des données Azure, ou le cloud AWS, incluant Databricks/Apache Spark, bases de données NoSQL et relationnelles.
- 1+ an d'expérience avec les services AWS tels que EC2, Databricks, S3, SQS, SNS, et CloudWatch.
- Connaissance pratique des formats de fichiers columnaires (ORC, Parquet, tables Delta).
- Expérience de gestion de jeux de données structurés, semi-structurés, et non structurés (formats XML, JSON).
- 1+ an d'expérience pratique en développement dans Java, Python, SQL, R ou Scala, y compris l'écriture et l'optimisation de requêtes SQL.
- 1+ an de construction de pipelines Databricks utilisant Python/Scala, y compris l'écriture de cas de tests unitaires, la surveillance et la validation des données.
Préféré :
- Compréhension du cadre BDD, CI/CD, Terraform, Docker, et des concepts IA/ML.
- Connaissance des concepts d'architecture des entrepôts de données, du Big Data, de l'informatique distribuée et des principes modernes d'architecture de données comme Data Mesh et Data Lakehouse.
- Exposition aux outils de qualité des données tels que Great Expectations/Spark Deequ et aux normes de soins de santé comme HL7, FHIR.
- Certification AWS Cloud Practitioner ou supérieure.
GE Healthcare s'engage à l'inclusivité et à la diversité, prenant des décisions d'emploi sans prendre en compte la race, la couleur, la religion, l'origine nationale ou ethnique, le sexe, l'orientation sexuelle, l'identité ou expression de genre, l'âge, le handicap, le statut de vétéran protégé, ou d'autres caractéristiques protégées par la loi.
Nous attendons de tous les employés qu'ils incarnent nos valeurs d'humilité, de transparence, de concentration et d'intégrité, en favorisant une culture de confiance, de collaboration et de soutien.
Notre système de récompenses complet est conçu pour libérer votre ambition, offrant flexibilité, salaires compétitifs et avantages. Vous serez entouré d'opportunités de carrière dans une culture de soutien.
#L1-Hybrid