LiveEO jest na czele wykorzystania obrazów satelitarnych i sztucznej inteligencji do dostarczania przełomowych analiz dla różnych branż. Nasze nowoczesne rozwiązania, takie jak wykrywanie wysokości drzew w celu ochrony sieci energetycznych i identyfikacja niebezpiecznych budowli wokół krytycznych infrastruktur, są kluczowe dla procesów decyzyjnych naszych klientów.
Szukamy wykwalifikowanego Inżyniera Danych, który dołączy do naszego zespołu AI. Będziesz odgrywać kluczową rolę w tworzeniu najnowocześniejszych modeli AI geospatial, poprzez tworzenie solidnych, zautomatyzowanych i wydajnych potoków danych. Te potoki będą przekształcać terabajty danych satelitarnych w formaty gotowe do uczenia maszynowego, ułatwiając trenowanie modeli na dużą skalę.
- Projektowanie, wdrażanie i utrzymywanie potoków danych dla dużych ilości danych rastrowych geospatial.
- Automatyzacja przepływów danych przy użyciu silników orkiestracyjnych takich jak Prefect.
- Zarządzanie i optymalizacja baz danych relacyjnych, zapewniając integralność i wydajność danych (preferowane doświadczenie z PostgreSQL i Snowflake).
- Ciągłe doskonalenie ram przetwarzania danych, adresowanie wyzwań w dużych potokach uczenia maszynowego i przetwarzaniu obrazów satelitarnych.
- Zapewnienie selekcji danych, ich obserwowalności i wersjonowania zarówno dla danych, jak i modeli, wraz z automatycznym zapewnianiem jakości danych.
- Potwierdzone doświadczenie w projektowaniu, budowaniu i utrzymywaniu wysokowydajnych potoków danych, szczególnie dla danych rastrowych.
- Duża wiedza w tworzeniu i zarządzaniu potokami ETL.
- Biegłość w Pythonie, z naciskiem na pisanie czystego, wydajnego i łatwego w utrzymaniu kodu.
- Znajomość obliczeń równoległych, programowania współbieżnego i optymalizacji wydajności dla przetwarzania dużych ilości danych.
- Proaktywne podejście do rozwiązywania problemów z gotowością do radzenia sobie z trudnymi i szerokimi zagadnieniami technicznymi, wspieranie innowacji w celu poprawy jakości danych i efektywności procesów.
- Zrozumienie technik przetwarzania danych geospatial i teledetekcyjnych jest znaczącym atutem.
- Doświadczenie z narzędziami i praktykami Machine Learning Operations (MLOps) na dużą skalę jest pożądane.
- Umiejętność zarządzania bazami danych relacyjnych, takimi jak PostgreSQL i Snowflake, z solidnym zrozumieniem projektowania baz danych i optymalizacji zapytań.
- Gotowość do relokacji do Berlina lub obecne zamieszkanie w Berlinie.
- Programowanie: Python (w tym Rasterio, Numpy, PDAL, OSGEO, Geopandas, SQLAlchemy)
- Orkiestracja: Prefect, Anyscale/Ray
- Bazy danych: PostgreSQL, PostGIS
- Infrastruktura: Docker, AWS
- GIS: QGIS, GDAL
- Możliwość tworzenia produktów, które ulepszają procesy biznesowe i życie na całym świecie.
- Elastyczne godziny pracy i hybrydowy model pracy wspierający zdrowy balans między pracą a życiem prywatnym.
- Upoważnienie do rozwijania kariery, podejmowania inicjatyw i bycia kreatywnym.
- Kultura szanująca balans między pracą a życiem prywatnym, minimalne nadgodziny i