Senior ML Engineer - Machine Learning Platform

Job expired!

Опис роботи

Ви готові застосувати свої технічні навички для зміни того, як будуються спільноти, лікарні, будинки, спортивні стадіони та школи в усьому світі? Приєднуйтесь до Procore Technologies і станьте частиною революції в одному з найменш оцифрованих і найбільш небезпечних галузей: будівництві.

Ми шукаємо талановитого Старшого інженера з машинного навчання, щоб приєднатися до нашої команди ML Platform. У цій ролі, яка базується в Каїрі, ви допоможете розвивати нашу платформу машинного навчання для підтримки сотень моделей. Ви будете впроваджувати сервіси для випуску моделей AI та науки про дані, здатних обробляти терабайти даних. Ваша робота включатиме одноразове та постійне автоматичне навчання моделей, розгортання та моніторинг, а також управління репозиторіями моделей, сховищами ознак та шарів доступу до даних.

Ми шукаємо людину, яка зможе приєднатися до нас негайно. Це позиція буде підпорядковуватися Менеджеру з інженерії, платформа ML.

Перевірка каналів розгортання для моделей ML.
Огляд змін коду та запитів на злиття від команди науки про дані.
Ініціювання CI/CD після затвердження коду.
Моніторинг каналів і забезпечення проходження тестів і коректного збереження артефактів моделей.
Розгортання оновлених моделей у продакшені після завершення каналів.
Співпраця з командами розробки ПЗ та DevOps для плавної інтеграції.
Контейнеризація моделей за допомогою Docker і розгортання на хмарних платформах (AWS/GCP/Azure).
Налаштування інструментів моніторингу для відстежування метрик, таких як час відгуку, рівень помилок і використання ресурсів.
Встановлення оповіщень і повідомлень для швидкого виявлення аномалій.
Співпраця з командою науки про дані для оновлення каналів і аналізу даних моніторингу, журналів і метрик.
Документування та усунення несправностей змін і стратегій оптимізації.
Співпраця з командами продуктів, UX та прототипної інженерії для впливу на дорожню карту продукту.

Володіння програмними мовами такими як Python, Java та C++.
Досвід роботи з фреймворками машинного навчання, такими як TensorFlow і PyTorch.
Практичний досвід у життєвому циклі машинного навчання: попередня обробка даних, витяг ознак, навчання моделей, оцінка, розгортання і моніторинг.
Знання екосистеми з відкритим кодом, включаючи TensorFlow, PyTorch, MLflow, Ray, Kubeflow і TFX, буде плюсом.
Досвід розробки великих, розподілених, відмовостійких і масштабованих систем обробки даних з використанням пакетної обробки зі Spark або потокової обробки з Flink або Kafka Streams.
Вміння ефективно працювати з науковцями з даних і перетворювати проблеми науки про дані в реальні потреби інфраструктури або робочого процесу.
Чітке розуміння каналів CI/CD з використанням Jenkins і інструментів IaC, таких