LiveEO está a la vanguardia en el aprovechamiento de imágenes satelitales e inteligencia artificial para proporcionar conocimientos innovadores a diversas industrias. Nuestras soluciones de vanguardia, como la detección de alturas de árboles para proteger las redes eléctricas e identificar construcciones peligrosas alrededor de infraestructuras críticas, son vitales para los procesos de toma de decisiones de nuestros clientes.
Estamos buscando un Ingeniero de Datos altamente calificado para unirse a nuestro equipo de IA. Desempeñarás un papel fundamental en el desarrollo de modelos de IA geoespacial de última generación, creando pipelines de datos robustos, automatizados y eficientes. Estos pipelines transformarán terabytes de datos satelitales en formatos listos para aprendizaje automático, facilitando el entrenamiento de modelos a gran escala.
- Diseñar, implementar y mantener pipelines de datos para datos ráster geoespaciales a gran escala.
- Automatizar flujos de trabajo de datos utilizando motores de orquestación como Prefect.
- Gestionar y optimizar bases de datos relacionales, asegurando la integridad y el rendimiento de los datos (se prefiere experiencia con PostgreSQL y Snowflake).
- Mejorar continuamente los marcos de procesamiento de datos, abordando desafíos en pipelines de aprendizaje automático y procesamiento de imágenes satelitales a gran escala.
- Asegurar la selección de datos, la observabilidad y la versionado tanto de datos como de modelos, junto con la calidad de los datos automatizada (QA).
- Experiencia demostrada en el diseño, construcción y mantenimiento de pipelines de datos de alto rendimiento, especialmente para datos ráster.
- Experiencia sólida en la creación y gestión de pipelines ETL.
- Competencia en Python, con un enfoque en escribir código limpio, eficiente y mantenible.
- Conocimiento de computación paralela, programación concurrente y optimización del rendimiento para el procesamiento de datos de alto volumen.
- Un solucionador de problemas proactivo con disposición para abordar temas técnicos desafiantes y amplios, impulsando la innovación para mejorar la calidad de los datos y la eficiencia de los procesos.
- Comprensión de técnicas de procesamiento de datos geoespaciales y de teledetección es una ventaja significativa.
- Experiencia con herramientas y prácticas de Operaciones de Aprendizaje Automático (MLOps) a gran escala es deseable.
- Habilidad en la gestión de bases de datos relacionales, como PostgreSQL y Snowflake, con un sólido entendimiento del diseño de bases de datos y la optimización de consultas.
- Disposición para mudarse a Berlín o residencia actual en Berlín.
- Programación: Python (incluyendo Rasterio, Numpy, PDAL, OSGEO, Geopandas, SQLAlchemy)
- Orquestación: Prefect, Anyscale/Ray
- Bases de datos: PostgreSQL, PostGIS
- Infraestructura: Docker, AWS
- SIG: QGIS, GDAL
- Oportunidad de crear productos que mejoran los procesos comerciales y las vidas a nivel global.
- Horarios de trabajo flexibles y modelo de trabajo híbrido para apoyar un equilibrio saludable entre el trabajo y la vida personal.
- Capacidad para impulsar el desarrollo profesional, tomar la iniciativa y ser creativo.
- Una cultura que respeta el equilibrio entre el trabajo y la vida, con mínimo tiempo extra y compensación por horas extras.
- Actividades de formación de equipos, incluyendo grupos de jogging, deportes de equipo, escalada y picnics.
- Un ambiente colaborativo de aprendizaje con talleres, sesiones de intercambio de conocimientos, clubes de revistas y hackathons.
- Oficina ubicada en el corazón de Berlín Kreuzberg con frutas, nueces y bebidas gratuitas.
- Elegibilidad para participar en el programa de opciones sobre acciones para empleados.
- Membresía en Urban Sports y subsidio BVG, junto con un programa de pensiones corporativas.
- Un equipo internacional diverso y vibrante, con más de 30 nacionalidades.
Si estás listo para enfrentar nuevos desafíos técnicos