Rémunération : 156 000 $ à 180 000 $ par an. Vous êtes éligible à un Plan d'incitation à court terme avec un objectif de 15 % de vos revenus annuels, les conditions générales s'appliquent.
Le Principal Data Architect chez Ambry Genetics fournira un leadership stratégique et une direction technique dans la conception, la mise en œuvre et la maintenance de notre architecture de données d'entreprise et de nos solutions de gestion de données. Ce rôle supervisera le développement de notre infrastructure de données, y compris les entrepôts de données, les lacs de données, les plateformes de streaming et les cadres de gouvernance des données. Vous dirigerez une équipe d'ingénieurs en données, d'administrateurs de bases de données et d'analystes de données, en favorisant les meilleures pratiques et l'innovation au sein de l'organisation.
- Développer et maintenir la stratégie globale d'architecture des données, la feuille de route et les plans de mise en œuvre pour soutenir nos initiatives axées sur les données et nos objectifs commerciaux.
- Concevoir et mettre en œuvre des architectures de données évolutives, sécurisées et performantes, y compris des entrepôts de données, des lacs de données et des pipelines de données, en utilisant des technologies sur site et cloud.
- Établir des politiques de gouvernance des données, des normes et des meilleures pratiques pour la gestion des données, la qualité des données, la sécurité et la confidentialité des données.
- Diriger le développement et la mise en œuvre de solutions de streaming de données en temps réel utilisant des technologies telles qu'Apache Kafka, Apache Flink et AWS Managed Streaming pour Kafka (MSK).
- Superviser la création et la maintenance de plateformes d'intelligence d'affaires (BI), d'outils de visualisation de données et de capacités d'analytique en libre-service.
- Collaborer avec les ingénieurs logiciels, les scientifiques des données et les parties prenantes de l'entreprise pour comprendre les besoins en données et fournir des conseils techniques et des mentorats.
- Diriger et gérer une équipe d'ingénieurs en données, d'administrateurs de bases de données et d'analystes de données, en favorisant la croissance professionnelle et en promouvant les meilleures pratiques.
- Se tenir au courant des technologies émergentes, des tendances de l'industrie et des meilleures pratiques en matière d'architecture, d'ingénierie et de gestion des données.
- Assurer la conformité avec les réglementations telles que HIPAA et les normes de l'industrie pour la gestion et la confidentialité des données.
- Participer à la révision et à l'approbation des conceptions d'architecture de données, des spécifications techniques et des plans de projet pour assurer l'alignement avec les objectifs organisationnels.
- Effectuer d'autres tâches connexes.
- Licence ou master en informatique, systèmes d'information ou un domaine connexe, ou une expérience professionnelle équivalente.
- Minimum de 8-10 ans en architecture, ingénierie et gestion des données, avec une expérience en conception et mise en œuvre de solutions de données à l'échelle de l'entreprise.
- Expérience avérée dans la direction et la gestion d'équipes de professionnels des données.
- Connaissance approfondie des architectures d'entrepôts de données, de lacs de données, de modélisation de données et de techniques d'intégration de données, y compris les processus et outils ETL/ELT.
- Solide maîtrise des technologies de streaming de données telles qu'Apache Kafka, Apache Flink et AWS Managed Streaming pour Kafka (MSK).
- Expérience avec les plateformes et services cloud, y compris AWS, Azure ou GCP.
- Familiarité avec les principes de gouvernance des données, la gestion de la qualité des données et les meilleures pratiques en matière de sécurité des données.
- Excellentes compétences en résolution de problèmes, en analyse et en communication.
- Expérience dans un environnement de développement Agile ou Scrum est préférée.
- Connaissance en génomique, données de santé ou bio-informatique est un atout.
- Expérience avec les techniques et outils de Change Data Capture (CDC) pour la réplication