Data Engineer (f/m/x) in the field of AI & Satellite Data

Job expired!

LiveEO jest na czele wykorzystania obrazów satelitarnych i sztucznej inteligencji do dostarczania przełomowych analiz dla różnych branż. Nasze nowoczesne rozwiązania, takie jak wykrywanie wysokości drzew w celu ochrony sieci energetycznych i identyfikacja niebezpiecznych budowli wokół krytycznych infrastruktur, są kluczowe dla procesów decyzyjnych naszych klientów.

Szukamy wykwalifikowanego Inżyniera Danych, który dołączy do naszego zespołu AI. Będziesz odgrywać kluczową rolę w tworzeniu najnowocześniejszych modeli AI geospatial, poprzez tworzenie solidnych, zautomatyzowanych i wydajnych potoków danych. Te potoki będą przekształcać terabajty danych satelitarnych w formaty gotowe do uczenia maszynowego, ułatwiając trenowanie modeli na dużą skalę.

  • Projektowanie, wdrażanie i utrzymywanie potoków danych dla dużych ilości danych rastrowych geospatial.
  • Automatyzacja przepływów danych przy użyciu silników orkiestracyjnych takich jak Prefect.
  • Zarządzanie i optymalizacja baz danych relacyjnych, zapewniając integralność i wydajność danych (preferowane doświadczenie z PostgreSQL i Snowflake).
  • Ciągłe doskonalenie ram przetwarzania danych, adresowanie wyzwań w dużych potokach uczenia maszynowego i przetwarzaniu obrazów satelitarnych.
  • Zapewnienie selekcji danych, ich obserwowalności i wersjonowania zarówno dla danych, jak i modeli, wraz z automatycznym zapewnianiem jakości danych.
  • Potwierdzone doświadczenie w projektowaniu, budowaniu i utrzymywaniu wysokowydajnych potoków danych, szczególnie dla danych rastrowych.
  • Duża wiedza w tworzeniu i zarządzaniu potokami ETL.
  • Biegłość w Pythonie, z naciskiem na pisanie czystego, wydajnego i łatwego w utrzymaniu kodu.
  • Znajomość obliczeń równoległych, programowania współbieżnego i optymalizacji wydajności dla przetwarzania dużych ilości danych.
  • Proaktywne podejście do rozwiązywania problemów z gotowością do radzenia sobie z trudnymi i szerokimi zagadnieniami technicznymi, wspieranie innowacji w celu poprawy jakości danych i efektywności procesów.
  • Zrozumienie technik przetwarzania danych geospatial i teledetekcyjnych jest znaczącym atutem.
  • Doświadczenie z narzędziami i praktykami Machine Learning Operations (MLOps) na dużą skalę jest pożądane.
  • Umiejętność zarządzania bazami danych relacyjnych, takimi jak PostgreSQL i Snowflake, z solidnym zrozumieniem projektowania baz danych i optymalizacji zapytań.
  • Gotowość do relokacji do Berlina lub obecne zamieszkanie w Berlinie.
  • Programowanie: Python (w tym Rasterio, Numpy, PDAL, OSGEO, Geopandas, SQLAlchemy)
  • Orkiestracja: Prefect, Anyscale/Ray
  • Bazy danych: PostgreSQL, PostGIS
  • Infrastruktura: Docker, AWS
  • GIS: QGIS, GDAL
  • Możliwość tworzenia produktów, które ulepszają procesy biznesowe i życie na całym świecie.
  • Elastyczne godziny pracy i hybrydowy model pracy wspierający zdrowy balans między pracą a życiem prywatnym.
  • Upoważnienie do rozwijania kariery, podejmowania inicjatyw i bycia kreatywnym.
  • Kultura szanująca balans między pracą a życiem prywatnym, minimalne nadgodziny i