Lead Data Engineer

Job expired!

phData est à la pointe de la révolution de la manière dont nos clients exploitent les données et l'intelligence artificielle. En tant que principal fournisseur de services spécialisés dans les applications de données et les services de plateformes de données, nous collaborons avec des entreprises technologiques de premier plan dans le domaine des technologies de données modernes pour fournir des solutions à la pointe de la technologie. Nous sommes des évangélistes technologiques, nous concentrant sur des outils essentiels de l'écosystème comme Snowflake, AWS, Azure, dbt, Sigma, Tableau et Power BI. Notre passion réside dans l'aide aux entreprises mondiales pour surmonter leurs obstacles les plus difficiles en développant des solutions d'IA et des applications de données et en guidant ces solutions vers une production efficace.

phData est une entreprise mondiale en mode remote-first avec des employés basés aux États-Unis, en Amérique latine et en Inde. Nous célébrons la culture de chacun de nos membres d'équipe et cultivons une communauté de curiosité technologique, de responsabilité et de confiance. Malgré notre croissance rapide, nous maintenons un environnement de travail décontracté et stimulant. Nous sommes fiers d'embaucher des performeurs de haut niveau et de leur accorder l'autonomie nécessaire pour obtenir des résultats.

  • 5 fois Snowflake Partner de l'année (2020, 2021, 2022, 2023, 2024)
  • Partenaire de l'année de Fivetran, dbt, Alation, Matillion
  • Partenaire n°1 en certifications avancées Snowflake
  • 600+ certifications cloud de niveau expert (Sigma, AWS, Azure, Dataiku, etc.)
  • Reconnu comme un lieu de travail primé aux États-Unis, en Inde et en LATAM
  • Inc 5000 des entreprises américaines à la croissance la plus rapide (2020-2023)
  • 8+ ans en tant qu'ingénieur de données pratique, concevant et mettant en œuvre des solutions de données
  • Chef d'équipe et/ou mentorat d'autres ingénieurs
  • Capacité à développer des solutions techniques de bout en bout en production, en assurant performance, sécurité, évolutivité et intégration robuste des données
  • Expertise en programmation en Java, Python et/ou Scala
  • Expérience avec les principales plateformes de données cloud, y compris Snowflake, AWS, Azure, Databricks et GCP
  • Maîtrise du SQL et capacité à écrire, déboguer et optimiser des requêtes SQL
  • Compétences en communication écrite et verbale orientées client et expérience correspondante
  • Expérience dans la création et la livraison de présentations détaillées
  • Expertise en documentation de solutions détaillées (par exemple, POCs et feuilles de route, diagrammes de séquence, hiérarchies de classes, vues logiques du système, etc.)
  • Licence en informatique ou dans un domaine connexe
  • Expérience en production sur les principales plateformes de données : Snowflake, AWS, Azure, GCP, Hadoop, Databricks
  • Stockage de données cloud et distribué : S3, ADLS, HDFS, GCS, Kudu, ElasticSearch/Solr, Cassandra ou autres systèmes de stockage NoSQL
  • Technologies d'intégration des données : Spark, Kafka, événement/streaming, Streamsets, Matillion, Fivetran, NiFi, AWS Data Migration Services, Azure DataFactory, Informatica IICS, Google DataProc ou autres technologies d'intégration de données
  • Expérience de travail avec plusieurs sources de données (par exemple, files d'attente, bases de données relationnelles, fichiers, recherche, API)
  • Expérience complète du cycle de vie du développement logiciel, y compris la conception, la documentation, la mise en œuvre, les tests et le déploiement
  • Transformation et curation automatisées des données : dbt, Spark, streaming Spark, pipelines automatisés
  • Gestion et orchestration des workflows : Airflow, AWS Managed Airflow, Luigi, NiFi

phData offre une gamme d'avantages pour soutenir le bien-être et la croissance professionnelle