LiveEO est à la pointe de l'exploitation des images satellites et de l'intelligence artificielle pour fournir des informations révolutionnaires à divers secteurs. Nos solutions de pointe, telles que la détection de la hauteur des arbres pour protéger les réseaux électriques et l'identification des constructions dangereuses autour des infrastructures critiques, sont essentielles pour les processus de prise de décision de nos clients.
Nous recherchons un Ingénieur Data hautement qualifié pour rejoindre notre équipe IA. Vous jouerez un rôle central dans le développement de modèles d'IA géospatiale de pointe en créant des pipelines de données robustes, automatisés et efficaces. Ces pipelines transformeront des téraoctets de données satellitaires en formats prêts pour l'apprentissage automatique, facilitant l'entraînement des modèles à grande échelle.
- Concevoir, implémenter et maintenir des pipelines de données pour des données raster géospatiales à grande échelle.
- Automatiser les flux de travail des données en utilisant des moteurs d'orchestration tels que Prefect.
- Gérer et optimiser les bases de données relationnelles, en assurant l'intégrité et les performances des données (expérience avec PostgreSQL et Snowflake préférée).
- Améliorer continuellement les cadres de traitement des données, en relevant les défis des pipelines d'apprentissage automatique et de traitement des images satellites à grande échelle.
- Assurer la sélection, l'observabilité et le versioning des données et des modèles, ainsi que l'automatisation de la QA des données.
- Expérience avérée dans la conception, la construction et la maintenance de pipelines de données à haut débit, en particulier pour les données raster.
- Expertise solide dans la création et la gestion de pipelines ETL.
- Maîtrise de Python, avec un focus sur l'écriture de code propre, efficace et maintenable.
- Connaissance de l'informatique parallèle, de la programmation concurrente et de l'optimisation des performances pour le traitement de données à grand volume.
- Résolution proactive des problèmes avec une volonté de s'attaquer à des sujets techniques larges et complexes, en stimulant l'innovation pour améliorer la qualité des données et l'efficacité des processus.
- Compréhension des techniques de traitement des données géospatiales et de télédétection est un plus significatif.
- Expérience avec les outils et pratiques des opérations d'apprentissage automatique (MLOps) à grande échelle est souhaitable.
- Compétence dans la gestion des bases de données relationnelles, telles que PostgreSQL et Snowflake, avec une bonne compréhension de la conception et de l'optimisation des requêtes de base de données.
- Volonté de déménager à Berlin ou résidence actuelle à Berlin.
- Programmation : Python (incluant Rasterio, Numpy, PDAL, OSGEO, Geopandas, SQLAlchemy)
- Orchestration : Prefect, Anyscale/Ray
- Bases de données : PostgreSQL, PostGIS
- Infrastructure : Docker, AWS
- GIS : QGIS, GDAL
- Opportunité de créer des produits qui améliorent les processus commerciaux et la vie à l'échelle mondiale.
- Horaires de travail flexibles et modèle de travail hybride pour soutenir un bon équilibre vie professionnelle/vie personnelle.
- Encouragement à développer votre carrière, prendre des initiatives et être créatif.
- Une culture qui respecte l'équilibre travail-vie personnelle, avec un minimum d'heures supplémentaires et du temps compensatoire.
- Activités de team building engageantes, y compris des groupes de jogging, sports d'équipe, escalade et pique-niques.
- Un environnement d'apprentissage collaboratif avec des ateliers, des sessions de partage de connaissances, des clubs de lecture et des hackathons.
- Bureau situé au cœur de Berlin Kreuzberg avec fruits, noix et boissons gratuits.
- Possibilité de participer au programme de stock options pour les employés.
- Abonnement Urban Sports et subvention BVG, ainsi qu'un programme de retraite d'entreprise.
- Une équipe