LiveEO знаходиться на передовій використання супутникових зображень та штучного інтелекту для надання революційних інсайтів для різних галузей. Наші передові рішення, такі як виявлення висоти дерев для захисту електричних мереж та ідентифікація небезпечного будівництва довкола критичної інфраструктури, є життєво важливими для процесів прийняття рішень наших клієнтів.
Ми шукаємо висококваліфікованого Data Engineer, щоб приєднатися до нашої AI команди. Ви зіграєте ключову роль у розробці найсучасніших геопросторових моделей штучного інтелекту, створюючи надійні, автоматизовані та ефективні дані конвеєри. Ці конвеєри будуть перетворювати терабайти супутникових даних у формати, готові до машинного навчання, полегшуючи тренування моделей великого масштабу.
- Проєктування, впровадження та підтримка даних конвеєрів для геопросторових растрових даних великого масштабу.
- Автоматизація робочих потоків даних за допомогою систем оркестрації, таких як Prefect.
- Управління та оптимізація реляційних баз даних, забезпечення цілісності та продуктивності даних (досвід з PostgreSQL і Snowflake є перевагою).
- Постійне вдосконалення рамок обробки даних, вирішення проблем у великих масштабах машинного навчання та обробки супутникових зображень.
- Забезпечення вибору даних, спостережуваності та версіонування як для даних, так і для моделей, а також автоматизованого контролю якості даних.
- Доведений досвід у проєктуванні, побудові та підтримці високо-пропускних даних конвеєрів, особливо для растрових даних.
- Глибокі знання у створенні та управлінні ETL-конвеєрами.
- Професіоналізм у Python, з акцентом на написання чистого, ефективного та підтримуваного коду.
- Знання паралельних обчислень, одночасного програмування та оптимізації продуктивності для обробки великих обсягів даних.
- Активний вирішувач проблем з готовністю братися за широкі та складні технічні теми, просуваючи інновації для покращення якості даних та ефективності процесу.
- Розуміння технік обробки геопросторових та дистанційних даних є значним плюсом.
- Досвід з інструментами та практиками Machine Learning Operations (MLOps) у великому масштабі є бажаним.
- Вміння керувати реляційними базами даних, такими як PostgreSQL і Snowflake, з глибоким розумінням проєктування баз даних та оптимізації запитів.
- Готовність до переїзду або проживання в Берліні.
- Програмування: Python (включаючи Rasterio, Numpy, PDAL, OSGEO, Geopandas, SQLAlchemy)
- Оркестрація: Prefect, Anyscale/Ray
- Бази даних: PostgreSQL, PostGIS
- Інфраструктура: Docker, AWS
- ГІС: QGIS, GDAL
- Можливість створювати продукти, що покращують бізнес-процеси та життя у всьому світі.
- Гнучкий робочій графік та гібридна модель роботи для підтримки здорового бал